首页 > 科技  > 正文
约合人民币141万元,这几个技术的创新,性能很变态
  • 2020-05-18
  • 来源:互联网
  • 编辑:小优
  • 阅读人数:146

在我们的认知中,7纳米处理器体积都是很小的。

像麒麟990这种,只有指甲盖大小;PC端使用的,最多也就半个公交卡那么大。

但是,昨晚英伟达发布了一款全球最大、最重的7纳米处理器。8块集成在一起,需要一名成年男性用尽全力,才能端得起来。

约合人民币141万元,这几个技术的创新,性能很变态(图1)

这,就是首款基于全新安培(Ampere)架构的GPU—Tesla A100。

可能是听过网友们调侃2080Ti长得像煤气灶的梗,英伟达CEO黄仁勋,是从烤炉里端出的这个“巨无霸”

约合人民币141万元,这几个技术的创新,性能很变态(图2)

受疫情影响,昨晚的NVIDIA GTC 2020大会,也是在这个烤炉前进行。

尽管场地简陋,但产品却给了无数人惊喜,老黄表示:这是英伟达8代GPU史上最大的一次性能飞跃。

约合人民币141万元,这几个技术的创新,性能很变态(图3)

从体积和老黄的描述,就可以知道Tesla A100的不凡之处。

相比三年前推出的,拥有210亿个晶体管的Tesla V100;拥有540亿个晶体管的Tesla A100,AI算力是它的20倍。

约合人民币141万元,这几个技术的创新,性能很变态(图4)

和前代的参数对比

在摩尔定律将要失效的今天,三年时间算力翻20倍,你说猛不猛?

为什么可以这么?英伟达自己总结了Tesla A100的五大技术创新:

安培架构—540亿个晶体管,面积为826平方毫米,是世界上最大的7纳米处理器。

采用第三代Tensor Core AI核心—支持全新的TF32运算(新数学格式)无任何代码更改,可将单精度浮点计算峰值提升至上一代的20倍。

多实例GPU(MIG)—可以将一个A100 GPU分割成多达7个独立的GPU实例,从而为不同大小的任务提供不同程度的计算,提高利用率和投资回报。

第三代英伟达NVLink—使GPU之间的高速连接加倍,从而在上提供高效的性能扩展。

结构稀疏性—新的效率技术利用了AI数学固有的稀疏性,优化之后性能提升了一倍。

约合人民币141万元,这几个技术的创新,性能很变态(图5)

基于以上五大技术特性,Tesla A100成为了全新的地表最强计算卡,或者说是地表最强AI芯片。

这几个技术的创新,也使得Tesla A100成为AI训练和推理以及科学模拟、对话式AI、基因组学、高性能数据分析、建模和金融预测等各种高要求工作负载的理想选择。

约合人民币141万元,这几个技术的创新,性能很变态(图6)

目前,这块计算卡已全面投产,并向全球客户发货。

它的第一批客户便是微软,后者将利用A100来训练图灵自然语言生成(NLG)

对了,A100并非游戏显卡,别想着拿它来玩3A大作。

约合人民币141万元,这几个技术的创新,性能很变态(图7)

除了Tesla A100,英伟达还推出了全新超大型数据中心加速器HGX A100,第三代AIDGX A100,以及以太网智能网卡等众多To B产品。

其中,DGX A100就是开头老黄端出来的那个“巨无霸”—集成了八块Tesla A100,能够达到5千万亿次/s的浮点计算性能。

约合人民币141万元,这几个技术的创新,性能很变态(图8)

重50磅左右(约合22.7千克)

性能很价格也很“恐怖”19.9万美元(约合141万元)的售价,堪称史上最贵的“烤炉”

买不起没关系,老黄“贴心”地为DGX A100推出了分解组件,让你可以找人众筹购买。

最多可以将任务拆分成多达56个实例,把众多小规模任务分散在强大的GPU上。

目前,DGX A100已经开售,首批订单采购方为美国能源部阿贡国家实验室,该实验室将用其来对抗新冠疫情。

包括微软、谷歌、阿里巴巴、等多家全球大公司、服务提供商和政府机构,也已为DGX A100下了初始订单。

约合人民币141万元,这几个技术的创新,性能很变态(图9)

此外,发布会上英伟达还着重介绍了,与宝马、法拉第、小鹏汽车、小马智行等车企的合作。

这些厂商在研发的汽车或自动驾驶产品,会使用DRIVEAGX计算平台。

约合人民币141万元,这几个技术的创新,性能很变态(图10)

此前,在大家的印象中,英伟达主要就是卖游戏和挖矿用的GPU处理器。

然而现在,它逐渐在众多AI应用程序方面,显现巨大的增长潜力。

新推出的AI领域处理器,可以帮助提高 AI 语意理解能力,优化搜索引擎建议,甚至赋能公共云以及物流,零售和仓储等垂直行业。

约合人民币141万元,这几个技术的创新,性能很变态(图11)

至于玩家们心心念念的3080Ti,尽管没有出现在发布会上,但相信距问世也不远了。

此前有传言称,用上7纳米工艺的3080Ti,性能将比2080Ti提升40%。

如果是真的,老黄算是把牙膏管给踩爆了。

想入手2080Ti的不妨再等一等,反正等等党永远不输。

部分资料

量子

极客公园

机器之心

本文相关词条概念解析:

性能

性能作为中药学术语应用时,泛指药物的四气、五味、归经、升降沉浮、补泻等特性和功能(在此,亦可作“效果”)。产品性能是指产品具有适合用户要求的物理、化学或技术性能,如强度、化学成份、纯度、功率、转速等。通常所说的计算机运算速度(平均运算速度),是指每秒钟所能执行的指令条数,一般用“百万条指令/秒”(mips,MillionInstructionPerSecond)来描述。有的笔记本电脑的BIOS中有“DMAChannel”和“VGAFrameBufferSize”两个选项,第一项用于打开IDE设备的DMA传输模式,打开后磁盘性能可以提高很多,而第二个则用来设置显卡的显存大小。

相关阅读
猜你喜欢