文章摘要
Unity标准Shader(PBR)源码级分析揭示了其ShaderLab结构和HLSL核心实现,采用Cook-Torrance BRDF等物理模型计算光照。性能方面需注意变体数量控制(2^N增长)、PBR计算复杂度及材质实例优化技巧。实际案例展示了如何使用MaterialPropertyBlock实现高效批量渲染以及如何扩展PBR Shader添加溶解特效,并分析其性能影响。理解PBR原理、合理优化变体管理、掌握材质系统使用方法是高效开发的关键。
一、源码级剖析:Unity Standard Shader(PBR)
1.1 ShaderLab结构
Unity的Standard Shader源码可以在官方GitHub找到。
核心结构如下:
Shader "Standard"
{
Properties
{
_Color ("Color", Color) = (1,1,1,1)
_MainTex ("Albedo", 2D) = "white" {}
_Metallic ("Metallic", Range(0,1)) = 0.0
_Glossiness ("Smoothness", Range(0,1)) = 0.5
// ... 其他PBR参数
}
SubShader
{
Tags { "RenderType"="Opaque" }
LOD 200
CGPROGRAM
// 关键词控制变体
#pragma multi_compile _ _METALLICGLOSSMAP
#pragma multi_compile _ _NORMALMAP
// ...
#include "UnityStandardCore.cginc"
ENDCG
}
// ...
}
1.2 HLSL核心片段
在UnityStandardCore.cginc中,核心PBR计算如下(伪代码简化版):
// 采样参数
float3 albedo = tex2D(_MainTex, uv).rgb * _Color.rgb;
float metallic = _Metallic;
float smoothness = _Glossiness;
// 计算法线
float3 normal = UnpackNormal(tex2D(_BumpMap, uv));
// 计算视角、光照方向
float3 viewDir = normalize(_WorldSpaceCameraPos - worldPos);
float3 lightDir = normalize(_WorldSpaceLightPos0.xyz);
// Cook-Torrance BRDF
float3 F0 = lerp(0.04, albedo, metallic);
float3 F = FresnelSchlick(F0, dot(viewDir, halfDir));
float D = DistributionGGX(normal, halfDir, roughness);
float G = GeometrySmith(normal, viewDir, lightDir, roughness);
float3 numerator = D * F * G;
float denominator = 4 * max(dot(normal, viewDir), 0) * max(dot(normal, lightDir), 0) + 0.001;
float3 specular = numerator / denominator;
// 最终颜色
float3 kD = (1 - F) * (1 - metallic);
float3 diffuse = kD * albedo / PI;
float3 color = (diffuse + specular) * lightColor * NdotL;
说明:
- 这段代码实现了PBR的核心:能量守恒、金属/非金属分离、基于物理的高光和漫反射。
- 其中Fresnel、GGX分布、几何遮蔽等都是PBR的标准模块。
二、性能分析
2.1 变体数量
- Standard Shader支持多种贴图(法线、金属、遮蔽、自发光等),每种贴图的有无都会生成一个变体。
- 变体数量 = 2^N(N为可选特性数),过多会导致Shader编译、加载、内存压力大。
优化建议:
- 只在需要时启用相关特性(如不需要法线贴图就不要勾选)。
- 使用Shader Variant Collection和Stripping,减少未用变体。
2.2 性能瓶颈
- PBR计算比传统Blinn-Phong复杂,主要消耗在BRDF、环境反射采样、贴图采样次数上。
- 移动端建议关闭实时反射、减少贴图数量、降低分辨率。
2.3 批处理与材质实例
- 如果同一材质参数完全一致,Unity可以合批(Draw Call合并)。
- 如果频繁修改材质参数(如每个物体不同颜色),建议用MaterialPropertyBlock而不是新建材质实例,避免打破批处理。
三、实际案例
3.1 场景:批量渲染不同颜色的金属球
错误做法:
每个球新建一个材质实例,设置不同颜色。
后果:
Draw Call暴增,性能下降。
正确做法:
所有球共用一个材质,渲染时用MaterialPropertyBlock临时设置颜色。
代码示例:
// 假设有一个球体MeshRenderer
var renderer = GetComponent<MeshRenderer>();
var block = new MaterialPropertyBlock();
block.SetColor("_Color", Random.ColorHSV());
renderer.SetPropertyBlock(block);
效果:
- 只用一个材质实例,Draw Call可合批,性能大幅提升。
- 每个球颜色不同,视觉效果不变。
3.2 场景:自定义PBR Shader实现溶解效果
需求:
在PBR基础上加一个溶解特效(如角色死亡时渐渐消失)。
实现思路:
- 在ShaderLab的Properties中加一个溶解贴图和阈值参数。
- 在片元着色器中采样溶解贴图,判断当前像素是否需要丢弃(clip)。
- 保留PBR核心计算,溶解部分透明。
核心代码片段:
float dissolve = tex2D(_DissolveTex, uv).r;
if (dissolve < _DissolveThreshold)
clip(-1); // 丢弃像素
// 继续PBR计算
性能分析:
- 溶解判断只增加一次采样和一次clip,性能影响较小。
- clip会导致Early-Z失效,可能增加Overdraw,需注意在大面积溶解时的性能。
四、结论
- 源码级剖析让你理解PBR Shader的每一步计算。
- 性能分析帮助你在实际项目中做出合理取舍。
- 实际案例展示了如何用Unity的材质系统高效实现批量渲染和自定义特效。

709

被折叠的 条评论
为什么被折叠?



