如今,在元宇宙为代表的新一轮技术浪潮下,市场对各类ai服务的技术需求量激增。在nvidia 3月21-24日举办的gtc大会期间,nvidia创始人兼首席执行官黄仁勋分享了一个时代愿景,即以工业规模创造智能,并将其融入真实和虚拟世界。借助omniverse搭建通往虚拟世界的桥梁,nvidia向数以千计开发人员讲述了从生命科学到地球保护各个领域的ai创新故事。
图 nvidia创始人兼首席执行官黄仁勋进行主题演讲
漫游虚拟世界,omniverse曾经的愿景正逐一实现
近年来,中国在数字经济领域的发展令人振奋。显然,技术的迭代在数字经济领域中的作用,要比在其他传统行业扮演着更加重要的角色。为了让世界各地的创作者和开发者跨工具、跨应用的进行协同设计,nvidia在2019的gtc大会上发布了测试版omniverse开放式3d设计协作平台。在持续更新和不断完善下,如今的omniverse已成长为超过10万用户的成熟平台。
在nvidia的战略规划中,将omniverse命名为“全能宇宙”。一直以来,nvidia致力于将“图形、计算、ai”打通,释放平台价值。在黄仁勋看来,在扩展到巨大的规模后,数字孪生就能成为一个与物理世界相连的虚拟世界。这代表着互联网的新一轮进化,通过形成真实世界和数字世界的闭环,nvidia延伸了数字孪生的边界,例如用户可以通过omniverse可以将数字世界的数据可以反向指导真实世界的研发设计和实际运行,从而帮助真实世界更好进行研发设计和智能决策。
图 omniverse打开通往世界的大门
拓展数字孪生边界,nvidia modulus跑出虚拟世界“加速度”
例如产品设计师和工程师可以借助数字孪生,在多个现实场景中测试设计迭代,这有助于降低成本、降低物理性和财务风险,并加快测试和学习流程;在工厂生产过程中,工程师可以通过数字孪生来识别并减少流程漏洞;在企业管理如员工培训中,可以使用数字孪生帮助新员工快速理解所面临的实际工作场景,应对困难、关键或危险流程。
为了加速数字孪生机器学习模型,nvidia发布了科学数字孪生平台nvidia modulus。基于物理信息的ai和 omniverse相结合,该平台可加速物理学机器学习模型,以超高性能解决实际复杂场景的仿真与计算问题。nvidia modulus 将数据和物理学考虑在内,以训练一个神经网络,为数字孪生创建 ai 代理模型。该代理模型可以实时推理新的系统行为,实现动态、迭代的工作流程,并且在与 omniverse 集成后可以实现可视化和实时交互式探索。
经过实际数据测试,该平台可以实时创建基于物理信息的交互式 ai 模拟以精确反映真实世界,使计算流体动力学等模拟的速度比传统工程模拟和设计优化工作流程方法加快 1 万倍。与以前的 ai 模型相比,研究者能够以更高的速度和精度对复杂的系统进行建模,例如极端天气事件等。
在本次gtc大会上,nvidia展示了基于nvidia modulus的两个应用示例,分别为:
1. nvidia fourcastnet 物理学机器学习模型能够模拟全球天气模式,预测飓风等极端天气事件,不但具有更高的置信度,而且比传统的数值预测模型快 45000 倍。
2. 西门子歌美飒可再生能源公司(siemens gamesa renewable energy)正在使用 ai 优化风力发电机的设计。
图 nvidia modulus加速数字孪生应用
为复杂场景而生,nvidia ovx打破大规模数字孪生运算壁垒
在构建数字孪生的过程中,其开发难点在于它是一个融合多技术、多学科的复杂工程,需要对力学、化学、电磁学、控制学、热学、流体学等多学科的知识进行数字化,需要大量的计算能力。对此,nvidia在本次gtc大会上推出了nvidia ovx平台,其结合了高性能 gpu 加速计算、图形处理和 ai 并配备了高速存储访问、低延迟网络、精确计时,具备创建逼真数字孪生所需的性能。
图 nvidia 发布用于工业数字孪生的数据中心规模 omniverse 计算系统
ovx 服务器由 8 个 nvidia a40 gpu、3 个 nvidia connectx®-6 dx 200gbps 网卡、1tb 系统内存和 16tb nvme 存储组成。ovx 计算系统可以从由 8 台 ovx 服务器组成的单集群扩展到通过 nvidia spectrum-3 交换架构连接的一个或多个 ovx superpod(由 32 台 ovx 服务器组成),来加速大规模数字孪生模拟,用于模拟复杂的数字孪生,以构建建筑、工厂、城市乃至整个世界的模型。
通过 ovx,设计师、工程师和规划人员将能构建物理级准确的建筑数字孪生或创建大规模的逼真模拟环境,并在真实世界和虚拟世界中实现精确的时间同步。企业可以在同一时空中评估和测试复杂的系统以及多个自主系统的交互流程,从而优化、扩大或创建更高效的工厂和仓库,或者在机器人和自动驾驶汽车部署到真实世界之前对其训练。
此外,nvidia ovx也进一步降低了原型设计、测试和其他研发的成本。根据“德国数字铁路”(digitale schiene deutschland)计划,db netze 正在 omniverse 中构建德国国家铁路网的数字孪生,该数字孪生将被用于训练列车自动运行系统,并对铁路运输中的意外情况进行 ai 增强的预测分析。
db netze 铁路数字化主管 annika hundertmark 表示:“使用逼真的数字孪生来训练和测试 ai 列车将帮助我们开发出更加精确的感知系统,从而以最佳方式检测和应对事故。nvidia ovx 将在我们目前的项目中提供所需的规模、性能和算力,使我们能够生成用于密集型机器学习开发的数据,并操作这些高度复杂的模拟和场景。”
创新无界,nvidia发布omniverse cloud让协作随心所欲
纵观元宇宙的应用开发现状,在产业井喷的背后,发展过程中的痛点也不容忽视。随着越来越多的设计师和技术人员参与建设这个虚拟世界,不同数字工具互操作性弱的弊端开始显现。在通向元宇宙的虚拟数字世界中,只有为不同个体的数据流通提供一个高效的交互平台,才能释放出其巨大的能量。
在本次gtc大会上,nvidia发布 omniverse cloud,这套云服务能够让艺术家、创作者、设计师和开发者即时访问omniverse平台,允许来自数十亿台设备的用户进行 3d 设计协作和模拟。
图 nvidia 发布 omniverse cloud助力设计师和创作者远程协作
例如在gtc大会主题演讲中,黄仁勋就展示了一个关于未来设计的演示,演示中有三名人类设计师和一名专业 omniverse avatar ai 设计师在 omniverse cloud 中开展虚拟协作,一同修改一个建筑项目的设计。该团队使用标准网络会议工具进行对话,同时连接到 nucleus cloud 中的一个场景中。一位人类设计师在 rtx 驱动的工作站上运行 omniverse view 应用,而另外两位则通过 geforce now 将 omniverse view 传输到他们的笔记本电脑和平板电脑。
nvidia 创始人兼首席执行官黄仁勋表示:“远程工作的设计师可以像在同一个工作室中一样开展协作;工厂规划人员可以在真实工厂的数字孪生中设计新的生产流程;软件工程师在将自动驾驶汽车的新软件发布到车队之前先基于数字孪生模型进行测试。新一波只能在虚拟世界中完成的工作即将来到。omniverse cloud 将连接数千万设计师和创作者,以及数十亿未来 ai 和机器人系统。”
通过 omniverse cloud,创作者可以在任意地点对存储在 nucleus cloud 中的模型进行迭代、共享和协作,并通过发送链接即时邀请其他合作者加入会话。没有高端 geforce 或 nvidia rtx 系统或者不愿建立 it 基础架构的用户或团队只需订阅 omniverse cloud 计划,就可以使用 omniverse create 和 view 的全部功能:
nucleus cloud:这个简单的“一键协作式”共享工具使艺术家能够从任意地点访问和编辑大型 3d 场景,并且无需传输大量数据集;
omniverse create:该应用使技术设计师、艺术家和创作者能够一同实时构建 3d 世界;
view:借助云端 nvidia rtx gpu 驱动的 nvidia geforce now 平台来流式传输完整的模拟和渲染功能,该应用可以让非技术用户查看 omniverse 场景。
释放ai潜能,nvidia发布hopper架构和h100 gpu
如今,各种规模的企业似乎都将继续部署人工智能作为其业务战略的一部分。通过很多企业采用综合的战略方法,来实施智能自动化等人工智能增强技术,企业可以获得大量的商业利益,其中包括但不限于改善客户服务、提高竞争力、提高生产力和更满意的劳动力。
根据调研机构gartner公司的预测,到2022年,全球人工智能软件市场规模将达到620亿美元,增幅超过20%。对于各行业领域的企业来说,这种数字化正在改变游戏规则,因为它支持企业更智能、更精简和更具成本效益的业务运营,并在当今颠覆性的环境中推动更敏捷的运营。
借助人工智能驱动的技术来改进流程和转型,企业可以使用数字优先的思维方式重新考虑他们的运营方式。反过来,数字机器人的背后也需要强大的计算性能作为驱动力。为了加速人工智能的应用和部署,nvidia推出了“全球 ai 基础架构的新引擎”,即基于 hopper 架构的 nvidia h100。
图 nvidia推出基于 hopper 架构的 nvidia h100
在黄仁勋看来,如今语音、对话、客服和推荐系统等 ai 应用正在推动数据中心设计领域的巨大变革。“ai 数据中心需要处理海量且持续的数据,以训练和完善 ai 模型,原始数据进来,经过提炼,然后智能输出——企业正在制造智能并运营大型 ai 工厂。”黄仁勋解释说,这些工厂全天候密集运行,即便是质量上的小幅改进也能大幅增加客户参与和企业利润。
本次发布的h100 将帮助这些工厂更快发展。这个“庞大”的 800 亿晶体管芯片采用了台积电的 4 纳米工艺制造而成。hopper实现了许多技术突破,包括一个新的 transformer engine,可以在不损失准确性的前提下将这些网络的速度提高6倍。借助于h100,可以使大规模训练性能和大型语言模型推理吞吐量大幅度提升,相较于a100分别提高了9倍和30倍。
基于hopper架构,nvidia将推出全新 ai 超级计算机 — dgx h100、h100 dgx pod 和 dgx superpod。值得一提的是, nvlink 高速互连技术也将被应用于所有未来的 nvidia 芯片,包括 cpu、gpu、dpu和系统级芯片。
这种量变最终也引发了质的改变。黄仁勋介绍ai 已“从根本上改变了”软件,包括用于自然语言理解、物理、创意设计、角色动画甚至是 nvcell 芯片布局的全新深度学习模型。如今,ai 正在各个领域‘全面开花’,包括新的架构、新的学习策略、规模更大、性能更强的模型、新的科学领域、新的应用、新的行业等,而且所有这些领域都在发展。对于nvidia而言,将全力投入于加速 ai 领域的新突破以及 ai 和机器学习在每个行业的应用。