Sony PlayStation 5 游戏主机标准版和 Pro 版本的首席架构师 Mark Cerny 最近详细介绍了 PS5 Pro 支持的 PSSR 超解像度技术。
这项技术由三个主要环节构成:预处理阶段、轻量级CNN(卷积神经网络)以及后处理阶段。 在对比NPU(神经网络处理器)和AI GPU方案后,索尼发现后者在处理前后阶段更为出色,因此决定采用后者。
为了实现超解像度,索尼对RDNA架构的着色器核心和缓存系统进行了特别优化,即所谓的「定制RDNA」。 PS5 Pro 的目标是达到 300TOPs(8bit)的 AI 性能,但这一性能要求意味着其 GDDR6 的带宽不足以支持将 CNN 处理的中间结果全部导出到外部缓存。
对此,索尼着力在处理器内部缓存中存储尽可能多的中间步骤数据,以减少对外部GDDR缓存的访问需求。 然而,300TOPs 的性能目标对应的是数百 TB/s 的带宽需求,这远远超出了数 TB/s 的 L2 缓存能力。 最后,PS5 Pro 的开发团队最终将重点放在了 WGP(Wavefront Processing Unit)矢量寄存器上,并通过图像分块技术减少了对处理器内部缓存容量的需求。 PS5 Pro 处理器的 WGP 矢量寄存器总容量达到了15MB,能够提供 200TB/s 的带宽,有效地承担了存储 CNN 中间数据的任务。
PS5 也对RDNA GPU的架构和指令集进行了修改,新增了44条与CNN计算和WGP矢量寄存器操作有关的着色器指令。
此外 PSSR 和其它超解像度的主要区别之一是在 PC 游戏中超解像度一般而言是固定原生解像度和超解像度比例,动态调整最终帧率; 而 PSSR 技术的最终帧率一般处于固定状态,超解像度比例随可达到的原生解像度而变动。