【极果播报】5月14日晚间,英伟达发布了其下一代安培 GPU架构。第一个使用安培的GPU将是专为科学计算,云图形以及数据分析打造的英伟达(Nvidia)A100。尽管围绕英伟达(Nvidia)安培计划推出的 GeForce“ RTX 3080”有很多传言,但A100将主要用于数据中心。


7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU 

英伟达(Nvidia)在推出最新数据中心之际,正值全球大流行以及对云计算需求的巨大增长之时。英伟达(Nvidia)首席执行官黄仁勋(Jensen Huang)在新闻发布会上称新冠疫情“非常悲惨”,并指出“云服务的使用量将会激增” 。“这些变化对于我们的数据中心业务非常有利。我预计安培的表现会非常出色。这是我们有史以来最好的数据中心GPU,它利用了近十年的数据中心经验。”

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


A100拥有超过540亿个晶体管,是世界上最大的7nm处理器。黄解释道:“这基本上是当今半导体制造所能达到的理论极限,也是世界制造的最大的以及世界最大的计算引擎晶体管。”

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


Nvidia正在增强其Tensor内核,使其更易于开发人员使用。A100还包括19.5 万亿次浮点运算,6912个CUDA内核,40 GB内存以及1.6 TB / s的内存带宽。不过,所有这些性能并不能支持《刺客信条》的最新版本。

 

英伟达(Nvidia)将这些GPU组合到一个叠加的AI系统中,该系统将为全球数据中心的超级计算机提供动力。就像英伟达(Nvidia)使用其之前的Volta架构来制造Tesla V100和DGX系统一样,新的DGX A100 AI系统将8个A100 GPU合并为一个巨型GPU。

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


DGX A100系统中的这8台A100保证了5千万亿次的浮点运算性能,并将它们与Nvidia的第三代NVLink系统结合使用。将这8个GPU结合在一起,意味着拥有320GB的GPU内存以及12.4TB / s的内存带宽。Nvidia还包括15TB的第4代NVMe内存,用于支持AI培训任务。使用DGX A100系统的研究人员和科学家甚至可以将工作负载划分为多达56个实例,在功能强大的GPU上分散更小的任务。

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


Nvidia最近斥资69亿美元收购服务器网络供应商Mellanox的举措也正在发挥作用,因为DGX A100包括9个200Gb / s的网络接口,每秒双向带宽总计3.6Tb / s。随着现代数据中心适应日益多样化的工作负载,Mellanox的技术将对Nvidia越来越重要。黄仁勋(Jensen Huang)将Mellanox描述为下一代数据中心中最重要的“连接组织”。

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


 “如果您观察一下现代数据中心的架构方式,你会发现它们所要完成的工作负载将比以往任何时候都更加多样化。”黄解释道,“我们未来的方法不只是专注于服务器本身,而是将整个数据中心视为一个计算单元。未来,我相信世界将把数据中心视为一个计算单元,我们将考虑数据中心规模的计算。不再只是个人计算机或服务器,我们将在数据中心的规模上运行。”

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


Nvidia的DGX A100系统已经开始发售,其中包括在美国阿贡国家实验室(Argonne National Laboratory)进行的对COVID-19研究等首批应用。


7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU

 

“我们正在使用美国最强大的超级计算机来对抗COVID-19,使用最新可用技术(如Nvidia DGX A100)运行AI模型和仿真,” Argonne计算、环境和生命科学实验室副主任里克·史蒂文斯(Rick Stevens)说, “即将抵达阿贡的新型DGX A100系统的计算能力将帮助研究人员探索治疗方法和疫苗并研究病毒的传播,使科学家能够在数月或数日内完成数年的AI加速工作。”

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


英伟达表示,微软,亚马逊,谷歌,戴尔,阿里巴巴和许多其他大型云服务提供商也计划将单个A100 GPU整合到自己的产品中。黄说:“全世界所有超大型计算机制造商和计算机制造商对安培(Ampere)的采用和热情都是前所未有的。” “这是我们有史以来推出的最快的新数据中心架构发布,也是可以理解的。”

 

与较大的DGX A100集群系统一样,Nvidia还允许将每个单独的A100 GPU被分割成最多7个独立的实例,以执行较小的计算任务。但是,这些系统并不便宜。英伟达(Nvidia)的DGX A100具有出色的性能承诺,但像其中8种A100芯片的组合系统起价为19.9万美元。

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


目前尚不清楚英伟达(Nvidia)如何将安培直接发展到消费级GPU。英伟达(Nvidia)推出了专用人工智能处理器(张量内核)的Volta架构,其方式与安培揭幕非常相似。但Volta并没有继续为英伟达(Nvidia)的GeForce消费产品系列提供动力。相反,英伟达(Nvidia)推出了一款由Volta驱动的售价在2,999美元的Titan V(它被称为“有史以来最强大的PC GPU”),专注于AI和科学仿真处理,而不是游戏或创意任务。

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


尽管有传言称Volta将为未来的GeForce卡供电,但英伟达(Nvidia)于2018年推出了图灵架构,该架构将其专用的张量内核与新的光线追踪功能结合了起来。图灵继续使用RTX 2080这样的功率卡而不是Volta 。Nvidia甚至剥夺了GTX 1660 Ti等图灵机驱动卡的RT和张量内核。


7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU 

新的“ RTX 3080”卡可能还需要几个月的时间,但是我们仍然不确定它们是否会使用这种新的安培架构。黄暗示:“毫无疑问,架构上存在很大的重叠。” “芯片上不同元素的配置和大小都非常不同。”

 

英伟达(Nvidia)将HBM内存用于其数据中心GPU,而非个人电脑游戏GPU。数据中心GPU更侧重于AI任务和计算,而不是图形。

 7nm工艺+20倍AI算力提升!英伟达发布RTX3080同款架构GPU


最近,有关英伟达(Nvidia)的安培计划的猜测越来越多,随着PlayStation 5和Xbox Series X将于今年晚些时候推出采用AMD驱动的GPU解决方案,英伟达(Nvidia)肯定需要在今年晚些时候为PC游戏玩家提供一些新产品了。

    文章评分
    相关文章
    点评 (0)
      加载更多
      • 赞一下
      • 收藏

      文章评分

      购买商品

      大家都在看

      折扣 体验 新品
      查看全部

      扫码下载极果App

      关注我们