自去年 Arm 推出全新旗舰产品 Immortalis GPU 以来,收获诸多好评。在面向搭载高端和旗舰片上系统 (SoC) 的全新高性能智能手机设备的各种基准测试中,Immortalis-G715[1] 凭借优异的性能和高效能脱颖而出。在光线追踪方面,与配备同类 GPU 的 SoC 相比,基于 Immortalis-G715 的 SoC 实现了 67% 和 52% 的性能提升¹。同时,在可变速率着色 (VRS) 基准测试中,该旗舰 GPU 的性能比同类 SoC 竞品高出 5% 到 52%²。
全新旗舰级 Arm Immortalis-G720 GPU[2] 以及全新 Arm Mali-G720[3] 和 Mali-G620 GPU[4] 的推出进一步巩固了我们的强劲势头,并完善了我们面向广泛消费电子设备的高水平 GPU 产品组合。在基于第四代 Valhall 架构构建了前四代 GPU 之后,全新 Arm GPU 采用了新的第五代 GPU[5] 架构,充分彰显了 Arm 旨在面向各类消费电子设备带来下一代视觉计算性能的长期承诺。
全新 GPU 持续带来了更先进的性能和效率表现,将为移动设备提供更逼真、出色的沉浸式游戏体验,更低的耗电量确保更长的游戏畅游时间。第五代架构提高了所有 GPU 的系统级图形性能,意味着我们不仅大幅提高了 GPU 性能,还优化了全新 Arm 2023 全面计算解决方案[6] 中的外部内存、新的 CPU 集群和系统级缓存 (SLC) 之间的交互过程,从而提升了整体的性能表现。
迄今为止,Arm GPU 出货量已逾 90 亿颗,为众多开发者的应用提供了规模空前的目标群体。今年的出货量更是比去年增加 10 亿,相当于地球上平均每个人都拥有超过一个 GPU。此外,Arm 提供的业内先进的图形功能、优化和开发工具,可助力开发者打造更出色的应用体验。
推出第五代 GPU 架构
随着全球快步迈入全新视觉计算时代,第五代 GPU 架构将成为 Arm 未来 GPU 的坚实基石,带来颠覆性的全新图形功能。第五代架构计划将在第一年聚焦三个关键处理趋势:场景复杂性、更出色的图形性能和内存系统能耗功率。
1 场景复杂性
随着开发者纷纷设法实现更优质的视觉效果,移动设备上的场景复杂性也呈爆炸式增长。现在面临的挑战在于,更高的场景复杂性会让几何相关的内存访问占据过多的可用带宽,并最终影响性能。第五代架构致力于提升图形管道,让用户能够以更高的每秒帧数 (FPS) 畅玩其喜爱的游戏。与此同时,在移动设备上实现下一代高级别几何学渲染游戏和实时 3D 应用也成为了可能。
为了处理这些更复杂的场景,图形管道首先引入了延迟顶点着色 (DVS) 以重新定义 Arm GPU 中的图形数据流。DVS 有助于将性能扩展到更大数量的内核中,使 Arm 的合作伙伴能够在未来达到更高的性能水平。DVS 还有助于在高度复杂的游戏场景中保持稳定帧率,同时为未来下一代的几何内容提供支持。
一系列热门游戏已借助 DVS 实现了场景中的性能提升,这些提升包括在《原神》中的带宽占用减少了 33%,在《堡垒之夜》中减少了 26%,以及在 Elven Ruins 上使用的带宽减少了 41%,Elven Ruins 是著名游戏制作团队 Epic Games 在虚幻引擎中为游戏开发者和创作者提供的游戏场景示意图。此创新架构还为移动设备带来了更流畅、更身临其境且近似个人电脑和游戏主机的游戏体验。除了游戏应用以外,DVS 还将 CAD 应用的带宽减少了 37%。可帮助建筑师通过实时 3D 视图将其建筑 CAD 平面图转变成数字现实。
2 更出色的图形性能
开发者不断在其应用中创建更多令人惊叹的视觉效果,推动着高动态范围 (HDR) 渲染的使用需求持续增加。Arm 也积极支持这项开发者正在拥抱的技术趋势——HDR 渲染,因此我们提升了相关性能以帮助呈现更出色的视觉效果。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度纹理的性能影响。DVS 的引入意味着超复杂几何形状的场景可被渲染,并可节省处理能力。在 2023 游戏开发者大会 (GDC)[7] 中,Arm 工程团队为大家带来了技术演示,与基于 Valhall 架构的 Immortalis-G715 相比,基于第五代架构的 Immortalis-G720 的写入带宽提高了 31%,FPS 估计提高了 20%。借此释放了图形管道的空间,用以增加媲美电脑端的质量效果,例如实时动态光照、高光溢出效果和景深。
3 内存系统能耗功率
我们越来越倾向于认为内存系统能耗功率是导致处理器散热达到极限的主要因素。回顾去年的 Arm 全面计算解决方案 (TCS22)[8],我们发现 DRAM、互连和内存均大量导致了内存系统能耗功率。在第五代架构中,我们希望为 GPU 分配更多的内存系统效能以达到更好的视觉效果,同时也希望可以进一步节约能耗功率,以延长电池续航时间。
Arm GPU 的性能和效率将再创新高
除了引入第五代架构外,Immortalis 和 Mali GPU 的整体设计在性能和效率方面也实现了大幅提升。Immortalis-G720 支持十核或更多核心,并可选用优化的物理 IP 来加速 SoC 设计。Mali-G720 和 Mali-G620 的超强可扩展性有助于为广泛的消费电子设备带来优质的图形功能,例如智能手机、笔记本电脑、数字电视、机顶盒 (STB) 和可穿戴设备。Mali-G720 可支持六到九个核心,而 Mali-G620 可支持至多五个核心,可助力 Arm 授权许可合作伙伴在更多市场中实现设计工作的快速复用。
我们对各方面进行了广泛的提升以降低 GPU 功耗,从而为终端用户带来更持久的设备使用时间,确保其随时随地可以开展工作和享受娱乐时间。每个 Immortalis 和 Mali GPU 都实现了更高水平的能效表现,其平均能效比上一代产品提升了 15%。意味着新产品的每瓦性能更高,持久性能更出色。此外,系统级效率也有了显著提高,内存带宽使用减少了多达 40%,且 CPU 负载有所降低。这要归功于全新添加的 GPU 指令和驱动程序的优化。
全新 GPU 在性能方面更上一层楼,其峰值性能平均提高了 15%。我们还将 64bpp 纹理的架构吞吐量提高了一倍,以设法提升高动态范围纹理表现。
在所有 GPU 中,我们为可变速率着色 (VRS) 提供了更高性能的着色率。VRS 是我们在去年的 Arm GPU[9] 中引入的图形处理技术。对于开发者而言[5],这意味着 4x2 和 4x4 着色率的性能有所提高。VRS 技术有助于降低因复杂着色而增加的着色成本,确保在重要的地方提供高质量的图形。
除了提升 VRS 相关产品外,我们还通过优化 2x 多重采样抗锯齿 (MSAA) 功能为开发者带来了灵活性更高的体验。对于希望在其应用中使用 2x MSAA 的开发者来说,这让他们无需升级到 4x MSAA。对于需要 2x MSAA 的应用,我们测得相关性能与使用 4x MSAA 时相比提升了 7%。全新 GPU 还提升了对 Vulkan 动态缓冲区的支持。
对机器学习的持续承诺
Arm 将继续致力于为面向机器学习 (ML) 的新应用进行 GPU 开发和测试。3D 场景重建是一个关键的机器学习应用场景,可以在移动 GPU 上渲染真实场景的新颖视图。通过探索这个特定的应用场景,我们发现,与 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了 25%,占用的内存带宽减少了 22%。
我们还在不断平衡 CPU 和 GPU 之间的功率,以提供一致的用户体验。开发者可利用 Unity ML-Agents[10] 插件在游戏和模拟中训练智能代理。在 GDC 2023 上,我们展示了在移动 SoC 上处理 100 个类似代理和复杂图形的超强表现。
广泛的生态系统支持
我们通过广泛的 GPU 工具和资源保持对游戏开发者的生态系统支持。可免费下载的 Arm Mobile Studio[11] 提供了多种解析、性能分析和调试工具,以帮助开发者优化其应用的性能和效率。
我们很快将推出 Arm Frame Advisor,这是一款基于帧的分析器,适用于支持 OpenGL ES 3.2 和 Vulkan 1.1 的游戏。Frame Advisor 使用构建于驱动程序之上的软件层捕获帧中的所有 API 调用情况,并通过分析引擎为开发者提供情景反馈。这种反馈可以帮助开发者发现提升应用性能的机会,具体包括以下方面:
- 渲染图和帧数据流的可视化;
- 违反最佳实践的相关信息;
- (算力预算)上限超标的相关信息,例如超过 GPU 周期数或 GPU 功率预算。
我们已计划与选定的游戏工作室合作完成 Frame Advisor 的早期发布测试,该工具将于 2023 年底公开发布。
我们也在与我们的生态系统合作,携手合作伙伴一同开发新技术。例如 Arm 曾与 Google 和 Unity 一同合作开发 Adaptive Performance[12],此功能在固定的功率和热限制条件下优化了 GPU 利用率。
光线追踪继续作为一项广受欢迎的图形功能。我们的一些合作伙伴在芯片和设备上采用了光线追踪技术[13],并将其用于游戏应用,我们始终与他们保持密切合作。例如,我们正在与腾讯游戏和 MediaTek 合作,通过 SmartGI 技术以进一步提高行业采用率,并开发最佳实践文档,为游戏开发者提供有力支持。
最后,我们正在与 Epic Games 合作,计划在安卓上启用其 Unreal Engine 5 桌面渲染器。这将确保借助 Immortalis GPU 也能提供桌面级质量的渲染和图形。我们创建了 Steel Arms 演示来测试开发者使用我们 GPU 产品的体验,并演示该渲染器如何实现高质量的图形,包括丰富的高光溢出效果、基于物理的优质着色、生动的模糊效果和细致的实时反射效果。
更高效率、更优性能、更丰富的开发者资源
我们的目标是每年都能在 GPU 领域提供行业出众的性能和效率,同时为开发者提供丰富的工具和资源,助其打造美轮美奂的视觉盛宴。今年也不例外,Immortalis-G720 和 Mali GPU 系列显著提高了效率和性能,并最终使开发者深受裨益。第五代架构为我们奠定了下一代视觉计算的基础,并将为移动设备带来具有突破性的全新图形功能。总而言之,Arm 将继续为用户带来更惊艳的视觉体验。
附注:
¹ 光线追踪使用“Basemark® GPUScore: In Vitro”进行基准测试。截至 2023 年 4 月 12 日,Arm 在旗舰级 Android 手机上测得的数据。
² VRS 使用“Basemark® GPUScore:The Expedition VRS”进行基准测试。截至 2023 年 4 月 12 日,Arm 在旗舰级 Android 手机上测得的数据。
本文作者:Arm 终端事业部 GPU 产品管理总监 Dan Wilson
(文章来源公众号:Arm社区)
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
关于美狮贵宾会电子
上海美狮贵宾会电子技术有限公司是国内资深的研发工具软件提供商,公司成立于2009年,面向中国广大的制造业客户提供研发、设计、管理过程中使用的各种软件开发工具,致力于帮助客户提高研发管理效率、缩短产品设计周期,提升产品可靠性。
十多年来,先后与ARM、Altium、Ansys、QT、Green Hills、Minitab、EPLAN、QA Systems、OpenText、Visu-IT、HighTec、PLS、Ashling、MSC Software、Autodesk、Source Insight、IncrediBuild、Lauterbach、Adobe、Testplant、TeamEDA等多家全球知名公司建立战略合作伙伴关系,并作为他们在中国区的主要分销合作伙伴服务了数千家中国本土客户,为客户提供从芯片级开发工具、EDA设计工具、软件编译以及测试工具、结构设计工具、仿真工具、电气设计工具、以及嵌入式GUI工具等等。美狮贵宾会电子凭借多年的经验积累,真正的帮助客户实现了让研发更简单、更可靠、更高效的目标。
欢迎关注“美狮贵宾会电子”公众号
了解更多研发工具软件知识