news 2026/7/4 8:00:32

面经-CPU、内存、GPU的性能优化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
面经-CPU、内存、GPU的性能优化

一、如何定位问题

Profiler/Frame Debugger 之类工具确认瓶颈。

  • CPU bound:Profiler 里 Main Thread/Render Thread 很高,GPU 还很空;或降低分辨率没提升 FPS

  • GPU bound:GPU time 高;降低分辨率/关闭后处理 FPS 明显提升

  • 内存/GC bound:卡顿呈“尖刺”,GC.Alloc 很多,周期性 GC spike,或内存持续增长导致加载/换场抖动

二、 CPU 优化(主线程、脚本、物理、动画、渲染提交)

A. 脚本 Update/逻辑过多

  • 把“每帧轮询”改成事件驱动(状态变化才更新 UI/逻辑)

  • 降频:InvokeRepeating/自定义 tick(比如 10Hz/5Hz)替代每帧计算

  • 缓存引用:避免每帧GetComponent/Find(只在初始化取一次)

  • 避免 LINQ/闭包/foreach 装箱等隐式分配(也会牵扯 GC)

B. 物理开销(Physics)

  • 减少Physics.Raycast数量(合批检测、分层检测、降频)

  • 合理 Layer 碰撞矩阵,减少无意义碰撞对

  • Rigidbody 数量/碰撞体复杂度控制;尽量用简单 Collider

  • FixedUpdate 频率不要过高(默认 50Hz,必要时调低并保持稳定)

C. 动画/IK

  • Animator 层数、BlendTree 复杂度、IK/约束数量控制

  • 远处角色降低动画更新频率 / 关闭 IK

  • 共享 AnimatorController、减少 Animator 组件数量

D. 渲染提交(CPU 侧)

  • DrawCall 太多:SRP Batcher、GPU Instancing、合批、静态批处理

  • UI Canvas:避免整个 Canvas 每帧重建,拆分静态/动态 Canvas,少改 Layout

  • 大量 SetPass/材质切换:合材质、合贴图(图集)、减少 shader variant

三、 内存优化(峰值、常驻、加载、GC)

内存优化在 Unity 常见两类:减少分配 + 控制资源常驻/峰值

A. 减少 GC(卡顿尖刺的主要来源)

  • 避免每帧分配:字符串拼接、new、LINQ、频繁Instantiate临时对象

  • 对象池:子弹、特效、UI item、怪物等(并配合预热)

  • 复用容器:List/Dictionary 清理用Clear(),避免反复 new

  • UI 文本更新:减少频繁 SetText/字符串格式化(尤其移动端)

B. 控制资源内存(贴图/网格/音频)

  • 贴图压缩格式正确(ASTC/ETC2/BCn 视平台),mipmap、分辨率分级

  • Mesh/SkinnedMesh:骨骼数量、网格面数、Blendshape 控制

  • 音频:长音频用 streaming,短音效压缩/内存加载策略区分

C. 资源加载与峰值(Addressables/AssetBundle)

  • 异步加载,避免主线程阻塞(尤其切场景)

  • 资源分组、依赖分析,避免“一加载加载一堆”

  • 正确释放:Addressables.Release、卸载不用的 bundle、场景切换后清理

  • 关注“峰值内存”:加载新场景时旧场景资源未释放会导致瞬时爆内存

四、GPU 优化(像素、顶点、带宽、过度绘制)

GPU 优化核心是:少画、画得更便宜、减少带宽/状态切换

A. 像素成本(Fillrate)与过度绘制

  • 降低分辨率/动态分辨率(最直接验证 GPU bound)

  • 减少全屏后处理(Bloom、SSAO、DoF、TAA 等)

  • UI/透明物体过多会 Overdraw:减少透明层级、能用不透明就不用透明

  • 合理裁剪:UI Mask/ScrollRect 也会增加开销

B. Shader & 材质

  • Shader 复杂度:减少计算、纹理采样数、分支

  • 减少 shader variant:剔除不用关键字,避免爆炸式编译与运行时切换

  • 使用 SRP Batcher(URP/HDRP),减少 CPU+GPU 的状态成本

C. 几何(顶点)与阴影

  • LOD、Impostor、合并远景

  • 阴影:降低 shadow distance、分辨率、cascade 数,减少投射/接收对象

  • 粒子:控制数量、启用 GPU Instancing(支持时)

D. 带宽(移动端尤其重要)

  • 贴图压缩、减少 RT 数量/分辨率(后处理链路)

  • 避免频繁读写大 RenderTexture

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/2 6:09:27

Z-Image-Turbo日志审计功能:生成记录追溯与合规性检查

Z-Image-Turbo日志审计功能:生成记录追溯与合规性检查 在AI图像生成系统日益广泛应用于内容创作、广告设计和数字媒体的背景下,可追溯性与合规性成为企业级部署不可忽视的核心需求。阿里通义Z-Image-Turbo WebUI作为基于DiffSynth Studio框架二次开发的…

作者头像 李华
网站建设 2026/6/29 8:52:08

离线环境适用:内网部署AI翻译,彻底杜绝数据外泄

离线环境适用:内网部署AI翻译,彻底杜绝数据外泄 🌐 AI 智能中英翻译服务 (WebUI API) 在企业级应用场景中,数据安全始终是首要考量。尤其涉及敏感文档、技术资料或商业合同的翻译需求时,将文本上传至公有云API存在严…

作者头像 李华
网站建设 2026/6/26 11:20:13

Thinkphp的在线招聘求职系统设计与实现

目录摘要项目开发技术介绍PHP核心代码部分展示系统结论源码获取/同行可拿货,招校园代理摘要 随着互联网技术的快速发展,在线招聘求职系统已成为企业与求职者高效对接的重要平台。该系统基于ThinkPHP框架开发,采用B/S架构,结合MySQL数据库&am…

作者头像 李华
网站建设 2026/7/1 20:18:13

深度学习毕设选题推荐:基于python-CNN深度学习的食物识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/30 3:49:37

模组无尘系列(Clean Room Series)全解析

TOYO(东佑达)无尘系列模组专为Class 10(ISO 14644-1 标准) 洁净室环境设计,通过密封结构优化、真空抽气系统、低发尘材料与润滑三大核心技术,实现运行时发尘量≤10 particles/ft,广泛应用于半导…

作者头像 李华