映维网|Arm分享:从科幻到现实,移动端全息显示计算的发展进步( 三 )
4. Arm的全面计算和ViviQ将如何塑造全息术的未来?
本文插图
图6:未来的全面计算解决方案的不同要素
为了满足在计算能力和功耗方面不断增长的需求 , Arm正在通过全面计算来实现战略转变:从优化单个IP到采用整个SoC设计的系统级解决方案视图(图6) 。 这意味着整个系统应该无缝协作 , 为低功耗SoC封装的计算密集型工作负载提供最大性能 。 这种新方法将分析如何在不同的IP块和计算域之间最好地部署互连的数据和计算 。 它不仅包括主要的计算域(CPU、GPU和NPU) , 而且会纳入软件框架和计算库来提高它们的性能 。 同时 , 诸如Performance Advisor这样的新工具可以识别瓶颈并帮助实现整个系统的最佳性能 。
这种方法特别适用于高性能计算 , 如CGH的核心要素FFT 。 最新的Mali Premium GPU(Mali-G78和Mali-G77) , 以及主流的Mali-G57都利用了Arm Compute Library(ACL) 。 这是一个高度优化的底层函数集合 , 包括一个通过OpenCL加速的高效FFT计算实现 。 FFT在复杂域中运行 , 而我们可以使用FP32和FP16浮点精度 。 硬件后端性能的每一次改进都直接转化为每秒乘法累加运算(MAC/s)的增加 , 从而转化为FFT计算性能的提高 。 这一点尤其重要 , 因为即使考虑到预处理和后处理操作 , FFT计算都占全息显示所需总计算量的60%-90% 。
在2019光场和全息显示峰会(2019 Light Field and Holographic Display Summit) , VividQ首席执行官达伦·米尔恩(Darran Milne)分享了在2048×1536显示器为指定数量目标层生成单帧全息图像的浮点运算要求要求(表1) 。
本文插图
表1:使用ViviQ实时算法生成单个2048×1536帧的浮点运算要求 。
即使是1280×720显示器 , 对于传统的基点计算而言 , 每帧的计算需求大约为7000 GFLOP 。 对于计算需求减少了1000倍 , 这说明了利用FFT和相关Arm库的ViVidQ方法更加高效 。 重要的是 , VividQ的解决方案不仅优化了计算要求 , 而且提高了图像质量 。 VividQ SDK所提供的算法针对不同的显示类型、大小和位深、以及各种图像特性(如高对比度)进行了优化 。 由于用户或调用程序可以请求特定数量的输出层 , 所以对于给定的光学系统和输入场景 , 你只能使用所需的计算量 。 但值得注意的是 , 简单场景可能只包含几个位深的数据 。 这一巨大的灵活性允许运行VividQ软件的Arm-Mali GPU实时交付各种应用的全息图 。
下面我们来详细谈谈Arm Mali-G76 GPU的计算能力 。 一个Mali-G76内核中包含3个执行引擎 , 各自具有8个线程 , 并且每个时钟周期(3x8x3=72个浮点/周期/核心)能够传送大约3个FP32指令(MUL+ADD) 。 这意味着三星Galaxy S10中以720 MHz运行的10核G76显卡将提供720x106x72x10浮点或大约518 GFLOP/s 。 对于FP16精度 , 这一数字将翻倍至1.04 TFLOP/s 。 这是理论上的最大值 。 在实践中 , 实际数字会受到带宽限制的影响 , 并最终受限于功耗 。 对于诸如FFT这样的高负载算法而言 , 我们依然有望获得理论最大值的相当一部分 。 即使我们只计算每线程每周期单个FLOP , 利用率为60% , 我们都可以达到100 GFLOP/s 。
正如我们所见 , 原则上带宽不应该是个问题 , 但实际上它可能会成为一个问题 。 使用GPU时 , 如果不进入热节流和出现快速电池消耗 , 我们就不可能维持高分辨率和复杂用例所需的处理强度 。 但我们有一些简单的应用程序 , 例如增强现实设备中的文本和图标投影 , 我们可以限制层的数量 , 并依然能够为当今的AR显示提供显著的优势 。 根据Arm支持团队的评估 , 三星Galaxy S10的一个切片计算需要8ms , 分辨率为720×1280 。 这意味着一个全彩色的单层需要24毫秒 , 而且系统理论上将以40帧/秒的速度运行 。 这是移动GPU实时运行CGH的首次演示 。 VividQ最近展示了他们的全息操作系统概念(图7) 。 所述操作系统具有图标、文本和社交媒体等我们熟悉的应用程序 , 而它们通常只需要2个深度层 。
推荐阅读
- 经济|分享通信蒋志祥:数字经济,万物数智化
- 3DM游戏网|PLAYSTATION 5设计师分享对主机方向的看法
- 柏铭007|苹果M1将有望实现ARM阵营在PC市场击败Intel的梦想
- 新生活視角|分享成为社交电商新沃土 纷享生活app促个人创业者事业升级
- 小财鱼|二手平台狂欢到来,小财鱼分享此时闲置店铺如何运作
- 李楠|李楠:MacBook X86版本和ARM版本面对的需求是两代人
- 映维网|Oculus Quest v23软件更新正式推出,开始支持90Hz
- 青年|外设分享 篇十四:最强段落轴TTC月白轴简单分享
- 趣头条|【凯酷使用日常分享】凯酷快速入门,我又来扮演老师了
- HarmonyOS|HarmonyOS首批生态产品双十一起上市,赋能智能家居构筑全场景智慧生态
