AMD发布世界首款7nm数据中心GPU——开创人工智能、云计算和高性能计算(HPC)新纪元

2018年11月7日 17 : 06


2018年11月6日, AMD公司NASDAQ: AMD)发布AMD Radeon Instinct MI60MI50加速器,作为世界首款7nm数据中心GPU,它旨在提供下一代深度学习、HPC、云计算和渲染应用程序所需的计算性能。研究人员、科学家和开发者利用 AMD Radeon Instinct™加速器解决困难问题和趣味性的挑战,比如大规模模拟、气候变化、计算生物学、疾病预防等。

 

AMD Radeon 技术事业部研发高级副总裁王启尚(David Wang表示:传统的GPU架构限制了IT管理者处理不断变化需求和分析现代云数据中心工作负载数据集的效率,将顶级的性能和灵活的架构与强大的软件平台和业界领先的ROCm开放式软件生态系统相结合,全新的 AMD Radeon Instinct™加速器不管在今天还是未来,都成为解决云端计算挑战的重要组件。

 

 AMD Radeon Instinct™ MI60  MI50加速器具有灵活的混合精度能力,搭载高性能计算单元,能够处理多种类型的工作负载,包括一系列的HPC和深度学习应用程序。全新的 AMD Radeon Instinct™ MI60  MI50加速器,旨在高效地处理工作流,比如快速训练复杂的神经网络,为数据中心和部门部署提供更高级别的浮点性能,功能和高效性。

 

 AMD Radeon Instinct™ MI60  MI50加速器提供高速的浮点性能,并拥有HBM2(第二代高带宽显存),显存带宽速度高达1TB/s。同时,它们也是第一个能够支持下一代PCIe® 4.02互联的GPU,比较其他的 x86 CPUGPU互联技术32倍,另外它们还支持 AMD Infinity Fabric™ Link GPU互联技术,允许 GPUGPU 之间通信,比传统的PCIe® Gen 3互联速度快6倍。

 

AMD另外还发布了用于加速计算的全新ROCm开放式软件平台,该平台支持新加速器的架构特性,包括具有优化性的深度学习操作(DLOPS)和 AMD Infinity Fabric™ Link GPU互联技术。ROCm 为规模化而设计,允许客户在开放式的环境中部署高性能、高能效的异构计算系统。

 

谷歌TensorFlow项目的工程总监, Rajat Monga表示:谷歌相信开源对每个人都有利,我们已经看到开源机器学习技术是多么有帮助,我们很高兴看到AMD接受它。通过ROCm开放式软件平台, TensorFlow用户将在GPU加速和强大的开源机器学习生态系统中受益。

 

 AMD Radeon Instinct™ MI60 MI50加速器,包括以下主要功能:


优化深度学习操作:支持灵活的混合精度FP16FP32性能和INT4/INT8,来满足动态和不断变化的工作负载需求,包括训练复杂的神经网络到对训练过的网络进行推理。


超高速的双精度 PCIe®2 加速器5AMD Radeon Instinct™ MI60 加速器是世界上最快的双精度PCIe® 加速器,拥有高达7.4 TFLOPS 峰值 FP64性能,使科学家和研究人员高效地处理各种工业化的HPC应用程序,包括生命科学、能源、金融、汽车、航空航天、学术、政府、国防等。AMD Radeon Instinct™ MI50,拥有6.7 TFLOPS FP64 的峰值性能,能够在各种深度学习工作负载下,提供高效的解决方案,同时在虚拟桌面基础架构(VDI)、桌面即服务(DaaS)和云环境下高度重用。


高达6倍速数据传输:通过两个Infinity Fabric™ Link之间互联,每个GPU的对等带宽速度到达200GB/s,比单独的 PCIe 3.0 6倍,同时在hive配置里支持4GPU连接(8GPU的服务器装载2hive


高速的HBM2显存 AMD Radeon Instinct™ MI60HBM2纠错码(ECC)显存容量达到32 GB,而 Radeon Instinct™ MI50HBM2 ECC显存容量达到16 GB。两款显卡都支持全芯片ECC可靠性、可用性、可维修性(RAS)技术,这对于大规模的HPC部署和计算结果的准确性非常重要。


安全虚拟化工作负载支持  AMD MxGPU技术,业界唯一基于硬件的GPU虚拟化解决方案,基于行业标准的SR-IOV(单根I/O虚拟化)技术,使黑客难以入侵到硬件级别,更有助于为虚拟化云端部署提供更好的安全性。

 

全新的ROCm开放式软件平台


AMD今天还发布了全新版本的ROCm开放式软件平台,旨在加速高性能和高效的异构计算系统的发展。另外还支持全新的Radeon Instinct™加速器,ROCm软件版本2.0为新的DLOPS更新了数学库;支持64Linux操作系统,包括 CentOSRHELUbuntu;优化了现有的组件;支持最新版本的深度学习框架,包括 TensorFlow 1.11PyTorch (Caffe2)和其他。

  • ......

分享到:

评论区(0条)

  • 您还没有登录,无法评论,请先登录登录