哈尔滨视窗,打造哈尔滨资讯第一网!

帮助中心 广告联系

哈尔滨视窗_哈尔滨新闻门户网

热门关键词: 
热门TAG标签:

英伟达“三相之力”,加速构建AI帝国

来源: 作者: 发布时间:2021-05-22

显卡无疑已经是当下IT圈子最热门的话题,但对于NVIDIA而言,关于图形、视觉乃至大规模并行运算的征程,已经开启了新的起点。NVIDIA在不久前举行的GTC大会上连发三款基于Arm IP打造的处理器,包括全球首款专为TB级加速计算而设计的CPU NVIDIA Grace、全新BlueField-3 DPU,以及业界首款1000TOPS算力的自动驾驶汽车SoC等。

“三类芯片,逐年飞跃,一个架构。”NVIDIA数据中心路线图中包括CPU、GPU和DPU这三类芯片,集齐“未来计算的三大支柱”,这也标志着NVIDIA异构计算布局趋于完善,成为全栈计算平台。

专用AI计算CPU:NVIDIA GRACE

NVIDIA发布的首款中央处理器Grace成为本次GTC的焦点,其面向超大型AI模型的和高性能计算。基于Grace的系统与NVIDIA GPU紧密结合,性能将比目前最先进的NVIDIA DGX系统(在x86 CPU上运行)高出10倍。

GRACE的重大创新包括:内置下一代Arm Neoverse内核,单CPU在SPECrate2017_int_base基准测试超300分;采用第四代NVIDIA NVLink,从CPU到GPU连接速度超过900GB/s,达到相当于目前服务器14倍的带宽,从CPU到CPU的速度超过600GB/s;拥有最高的内存带宽,采用的新内存LPDDR5x技术,带宽是LPDDR4的两倍,能提供更多算力。

数据中心处理器DPU:NVIDIA BlueField-3

为了获得更好的数据中心软件定义网络、存储、网络安全加速,NVIDIA还推出了首款为AI加速度BlueField-3 DPU。DPU针对多用户、云原生环境优化,提供数据中心软件定义和硬件加速的网络、存储、安全、管理内容。

NVIDIA BlueField-3 DPU包含220亿个晶体管,采用16个Arm A78 CPU核心、18M IOPs弹性块存储,加密速度是上一代的4倍,并完全向下兼容BlueField-2。该产品预计将于2022年第一季度发布样品。

BlueField-3 DPU的重大创新包括:是首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU;BlueField-3能够卸载相当于300个CPU核的工作负载,以400Gbps的速率对网络流量进行保护、卸载和加速;通过全新发布的NVIDIA DOCA(集数据中心于芯片的架构)软件开发包为开发者提供一个完整、开放的软件平台,开发在BlueField DPU上开发软件定义和硬件加速的网络、存储、安全和管理等应用。

GPU赋能推动ARM生态

NVIDIA Ampere架构GPUA100于2020 GTC发布,今年大会则主要发布基于新架构GPU的产品,并致力于借助GPU赋能推动ARM生态。

NVIDIA升级并打造了“便携式AI数据中心”——NVIDIA DGX Station,以及NVIDIA专为密集型AI研发打造的AI数据中心产品——NVIDIA DGX SuperPOD。NVIDIA DGX Station 320G连接4个NVIDIA A100 GPU并达8TB/s的带宽,性价比获得很大提升;NVIDIA DGX SuperPOD目前是世界上首台原生超级计算机,使用全新80GB NVIDIA A100,将其HBM2e 内存提升至90TB,实现2.2EB/s的总带宽。

NVIDIA发布了用于训练Transformers的超大语言模型的NVIDIA Megatron Triton推理服务器。Transformers已帮助开发者在自然语言处理领域取得了突破性进展,能够生成文档摘要、将电子邮件中的短语补充完整、甚至让AI根据用户的期望自己编写代码。通过分布式计算,原本双CPU服务器1分钟只能响应1项查询,使用Megatron Triton的DGX能在1秒内实现16项查询。

NVIDIA还发布了新一代AI自动驾驶汽车处理器DRIVE Atlan,算力将达到1000TOPS,约是上一代Orin处理器的4倍,超过了大多数L5无人驾驶出租车的总计算能力。采用下一代GPU的体系结构、新型Arm CPU内核、新深度学习和计算机视觉加速器,内置为先进的网络、存储和安全服务的BlueField DPU,网络速度可达400Gbps。

此外,NVIDIA还与亚马逊云科学(AWS)、Marvell、联发科、富士通等加强了合作,推动云服务、科学及AI应用开发、打造GPU驱动的新型PC,共同致力于扩展Arm生态系统。

目标构建AI帝国

NVIDIA基于GPU、CPU、DPU“三项之力”的硬件基础,还在持续打造介于硬件和软件之间的底层技术、计算机工具乃至实用的应用框架。

针对专业领域的云原生平台NVIDIA Omniverse平台能够在虚拟世界中汇聚全球各地的工程师、科学家,在多个GPU的共同协助下实现高物理精度,并充分运用RTX实时光线追踪、DLSS技术,利用NVIDIA MDL模拟材料、NVIDIA PhysX模拟物理,NVIDIA AI完成人工智能推算的线上平台。拥有了更强的普适性,已适用于建筑、娱乐、游戏、广告等行业。

先进的对话式AI平台NVIDIA Jarvis可达到90%的识别精度,并支持5种语言:英语、日语、西班牙语、德语、法语和俄语,未来将会有更多语言加入其中,这使得国际会议将会变得更轻松;可纠正目光接触的会议软件NVIDIA Maxine会自动纠正视频会议中与会人的注视位置;NVIDIA自动驾驶汽车计算系统级芯片NVIDIA DRIVE Orin将与2022年投产,可处理集群、信息娱乐、乘客交互AI及非常重要的信息视图或感知世界模型,将实际感知构建成一个3D环绕模型。

NVIDIA已经创建了Tensor Core GPU、NVLINK、DGX、cuDNN、RAPIDS、NCCL、GPU Dirext、DOCA等众多技术,所有的这些底层技术,统称为NVIDIA AI。NVIDIA AI已集成到所有业内流行的工具和工作流程中,并且可在搭载NVIDIA GPU的任何系统上运行,包括PC、笔记本电脑、工作站、超级计算机、云平台等。现在缺少的是5G技术的连接,日常所使用的消费级5G技术只是锦上添花,而未来专用5G技术将为AI技术带来革命性的变化。

注:作者为赛迪顾问集成电路产业研究中心高级分析师