图:阿里云弹性计算产品专家-张新涛
5 月 11 日,在“2022 阿里云视觉计算私享会”上,阿里云弹性计算产品专家张新涛为大家带来了题为《阿里云弹性计算在视觉计算上的应用实践》的主题分享。以下内容根据他的演讲整理而成。
元宇宙、数字孪生和虚拟现实,意味着我们正从单向的交互方式向全要素的交互演进。这种演进是通过沉浸感迭代实时交互来实现真实感,而真实感带来的是人类认知效率的提升。
这样的判断源于上个世纪一位教育学家提出了著名的人类学习认知的金字塔模型,模型中认为人类最高效的学习方式是费曼学习法,但它不适合所有人。对于普通人来说,通过模拟实践的方式更有利于提升学习效率和认知效率,模拟实践中最高效的方式即全要素的实时交互。就比如:飞行员要在真正驾机上天之前,会在飞行模拟舱里进行长时间的艰苦训练,这样的做法与在真实驾机飞行的学习效率十分接近且更加安全和经济。
认知方式的提升本质上就是生产力的提升。生产力作为人类社会的重要概念,使得我们有必要认真了解元宇宙产业,它究竟带来了哪些机会和挑战?
这个 Metaverse 七层模型是目前比较完整地描述元宇宙产业的模型,从用户的体验层到创作者经济,最后到基础设施层,它将所有相关概念、表现层以及技术都归纳在其中,涉及诸多产业。
将这些概念和技术映射到云计算常见的领域,最终它会在计算、应用、通信、人机接口以及商业生态 5 个方面对云计算产生非常大的影响,这对于云计算也是前所未有的挑战,甚至是飞跃性的挑战。
以智能手机为例,现在的智能手机相比于 20 年前的 PC ,在各方面都有了巨大的飞跃。而这得益于智能手机的交互方式的升级,出现了支持多点触控的操作系统,最终在这个平台上生长出了出丰富的应用生态,而丰富的应用生态又反向推动了计算性能的不断提升,也推动了通信性能的不断提升。当下,手机的性能和功能甚至超越了笔记本电脑,手机提供了各种笔记本电脑所没有的传感器以及交互方式。
元宇宙面临的交互方式可能是实时 3D、手势交互、语音交互等,这些交互方式最终带来的挑战更多的是实时计算和交互通信,比如之前只有触屏,而现在多了识别手势、识别场景、识别空间的传感器,这些都需要实时计算,而对通信的要求也更苛刻,需要更大带宽、更低延时。
同时,元宇宙面临的商业生态会比以往任意 IT 系统都更加复杂,因此还需要面临的另外一个问题是如何将这一整套商业系统运作起来。
因此,总结来说,云计算适配元宇宙业务需要面临的三个主要问题即计算、通信和生态,它需要 10 倍+的计算性能和计算规模,需要 10 倍+的通信和低延时,需要 10 倍+的生态效率和开放程度。
在计算性能和规模方面,需要有 10 倍+的图形计算来渲染更高保真的 3D 模型,要实现更多场景的光线实时追踪,以便实现对真实世界的真实描述;在 AI 方面,需要更强的计算能力去训练和运行 AI 模型,需要更强的计算能力来做流媒体的处理;在带宽和延时方面,需要更大的带宽和更低的延时来负责将渲染好的高保真图像推送到客户端,也需要低延时的带宽来解决大规模 AI 模型的训练和推理,还需要通过高性能带宽来解决人类和虚拟人之间通过细微表情的交流。
除此之外,而更大的挑战来自于生态。元宇宙的技术生态十分复杂,此前 case by case 的产业协作方式无法使产业规模扩张到 10 倍甚至 100 倍。因此,我们需要新的生态协作方式,让协作更高效,也让协作系统更加开放。
针对上述三个方面的问题,在过去十年里,阿里云在技术的性能指标以及计算的规模上做了很多工作。比如在去年云栖大会上发布了第四代神龙架构,通过硬件加速的方式实现了 eRDMA 的大规模组网,延时低至 5 微秒,处于业内领先水平,具备了在云上实现了人类细微表情的识别的能力。
阿里云针对 AI 和元宇宙的 GPU 计算实例也有巨大进步,过去几年中 GPU 实例的性能得到了百倍的提升。去年发布了 7 代 GPU 实例,在图像计算和 AI 计算上也有了大幅提升。更加值得一提的是,阿里云实现了非常大计算规模的积累,通过商业化运作,实现了亚洲最大的 GPU 集群,总算力超过 1700P,且还在保持高速增长。
除了技术方面,商业生态问题也是我们面临的巨大挑战。要繁荣产业,必须提升产业的生产力,理顺产业的生产关系。我们与合作伙伴、客户一起通过生态运作的方式,构建了阿里云的视觉产品体系,并在产品上实现了非常多的积累。
众所周知,异构计算是个非常难用的计算系统,我们的产研团队也在这里做出了巨大努力。通过软件的方式,解决了异构计算在各行业使用中的共性难题,最终实现了更高效、更高性能以及更具经济性和易用性的异构计算产品。
更重要的是我们与各行各业最领先的合作伙伴一起构建了视觉计算软件服务,并且已经落地了很多产品在阿里云上。
我们将软件服务分为三层来解决产业生态的问题。
通用层:其中两个比较重要的产品是云 XR 平台和云实时 3D 编辑器平台,主要解决 3D 内容和应用托管运行环境的问题和 3D 内容和应用研发生产的问题。
行业层:希望可以与各行各业的编辑器伙伴一起构建巨大的行业编辑器矩阵,以解决各行业自有编辑器的问题。编辑器有助于更高效地落地元宇宙企业级应用,让所有人参与进来,提升整个行业的生产力和创造力。
生态层:生态层主要解决内容生产和内容交易的问题。它负责为前面两层提供素材,因此也需要着重去建设。
在不久的将来,这些产品将在阿里云上线,它们会配合行业编辑器以及通用的编辑器来解决各行各业的问题。
当前元宇宙最常见的应用场景如上图所示,将场景需求归一化之后,它们最终集中在 5 个层面,这 5 个层面的需求与前面的产品体系可以实现一一对应。
举个例子,自动驾驶在路测之前的重要环节是做 3D 环境的实时仿真,一般可以通过行业编辑器来完成。有了行业编辑器后,无须再利用通用的 3D 编辑器来构建房屋、道路等,而是使用仿真平台快速地在一张白图上完成环境构建,效率大大提升,甚至能够提供不同的天气、风速、光照条件、雨雪环境来模拟真实驾驶环境来检测自动驾驶程序的运行情况。
但不是所有行业都拥有这样的编辑器,因此,我们提供了两个比较通用的产品,来解决各行业的类似问题。
首先是云 XR 平台。它是在阿里云上构建的基于 CloudXR 套件的 3D 实时渲染平台,解决 3D 应用的安装、发布和托管类的问题。客户可以将自己开发完成的元宇宙应用、3D 应用在平台上并进行安装,然后发布到特定人群。用户能够通过各种终端接入进来使用这些 3D 应用,目前能够支持大部分常见的 3D 引擎以及 VR/AR 终端设备。
我们也在各行业做了适配和落地,目的是提升各行业的创造力和生产力。除了 XR 运行平台,我们也需要更多的内容。而这些 3D 应用的内容如何产生的?
可以依靠云实时 3D 编辑器平台这个产品。
云实时 3D 编辑器是阿里云与国际顶级 3D 引擎合作伙伴一起,在云上首次实现了云原生的 3D 编辑器。相比于之前在 PC 工作站上的开发,云实时 3D 编辑器更加灵活也更加强大。
它的灵活性在于它可以通过任意设备接入进来,之前往往只能用工作站或游戏本;但现在,任意终端比如 Pad 、手机都可以接入来做 3D App 的设计以及游戏的设计。
它的强大在于,此前开发工作站仅限于已有的计算资源,比如 CPU 的资源、内存资源以及 GPU 资源。但在云上编辑器,它可以使用云上无限的计算能力,来解决非常耗时的计算问题,大幅提高研发效率。比如此前需要十几个小时才能完成的烘焙环节,在云上只需十几分钟。
除此之外,这些应用开发完成之后,还可以在云上做适配。因为阿里云上有各种体系的 GPU 实例 ,有 x86、ARM 等等 ,可以模拟各种终端环境来做产品适配,相比于以往的适配器更加高效。我们的平台也即将上线,欢迎大家来测试试用。
今天我的分享就到这里,谢谢大家。
点击这里,观看本次视觉计算私享会精彩视频。