菜单

【亚博体彩平台】7nmVega20香归香,但AMD需要的除了新制程,更重要的是新架构

2021年6月7日 - 互联网

本文摘要:INT8和INT4是机器学习推理小说特别简单低精度的数据类型,INT8的性能是FP16的两倍,58.9Tops,INT4的性能是FP16的四倍,超过118Tops。

亚博体彩平台

INT8和INT4是机器学习推理小说特别简单低精度的数据类型,INT8的性能是FP16的两倍,58.9Tops,INT4的性能是FP16的四倍,超过118Tops。但是这些新数据类型的灵活性和可以使用的指令,从AMD的演示来看还是不清楚的,对于解释新GPU的所有功能是非常重要的。

AMD还加强了Vega20的RAM系统,为GPU减少了另外一对HBM2RAM控制器,RAM位宽完全恢复到了斐济时代的4096位,而RAM频率也提高到了2Gbps,使得GPU的RAM比特率超过了1TB/s,甚至达到了NVIDIA的旗舰产品GV100 GPU,给AMD带来了优势。同时,因为是企业专用的GPU,所以获得了端到端的ECC检查能力和可靠性、可访问性和可维护性(RAS)技术,这对于大规模HPC计算结果的准确性非常重要,也标志着AMD GPU近年来第一次获得了原来的ECC对立。

此外,Vega20还反对AMD MxGPU技术,这是业界唯一基于硬件的GPU虚拟化解决方案。基于行业标准SR-IOV(单根I/O虚拟化)技术,黑客无法发起硬件级的反击,这有助于获得虚拟化云部署的安全性。关于PCI-E通道,AMD已经透露Vega20反对最近的PCI-E 4.0标准,汉密尔顿PCI-E 3.0的比特率用x16翻倍到32GB/s以上。

亚博体彩网站平台首页

当今和未来最困难的云计算挑战。”AMD发布了全新的加快计算速度的ROCm 2.0开放软件平台,专门为大规模集群设计,允许用户在开放环境下部署高性能、低能效的异构计算系统。除了反对新的Radeon本能加速器和AMD Infinity Fabric Link GPU点对点技术外,还获得了新DLOPS的修正数学库;反对CentOS、RHEL、Ubuntu等64位Linux操作系统;反对最近版本的最流行的深度自学框架如TensorFlow 1.11和PyTorch(Caffe2)。

谷歌TensorFlow的工程总监Rajat Monga说:“谷歌坚信开源对每个人都有好处。我们已经看到它对开源机器学习技术的帮助有多大,很高兴看到AMD拒绝它。

通过ROCm的开放软件平台,TensorFlow用户将受益于GPU加速和更强大的开源机器学习生态系统。”回顾之前的Vega10,在与上一代斐济架构相同的4096流处理器下,RAM从4096位减少到2048位,晶体管数量从89亿减少到125亿。

亚博体彩网站平台首页

而其对应的游戏显示卡Vega 64仅用72亿个晶体管也打不过GP104内核(GTX1080),同通道性能甚至比不上斐核的Fury X
指出AMD发布的Vega20仍然保持着4096流处理器的规模,但XIII包含了HPC加速卡所需的半速双精度、INT8、INT4、ECC等关键元素,使得Vega20第一次展现出了它的真实形态。但AMD还是要清醒地认识到,NVIDIA的领先地位,让它在架构和指令集上有优势,就像它在CPU领域与Intel的竞争一样。

这两年AMD还是照顾不到性能,功耗,面积。多年来,AMD一直处于放弃田忌反复赛马的境地。Vega20取得的成就几乎没有吃掉7nm工艺的红利。

从目前展示的数据来看,Vega20的性能比Vega10高20%左右,大概还是不如NVIDIA上一代16nm 120亿晶体管的GP102内核(1080Ti)。300瓦的TDP低得多,唯一显著的优势就是新工艺带来的面积减少。另一方面,英伟达,2014年半导体制造工艺卡在28nm节点的时候,AMD的GPU停了,英伟达拿走了全新的麦克斯韦架构,可谓白技术。

随着晶体管数量从71亿减少到52亿,流处理器数量从2880增加到2048,TDP从250瓦减少到165瓦,GM204内核的GTX980性能依然不如上一代Kelper架构GK110内核的GTX780Ti。再次强调,两者都在28纳米。面对英伟达糟糕的架构设计,AMD对进程红利的依赖不仅是长久之计,也无异于饮鸩止渴。如果AMD坚持修补旧的GCN架构,而不是开发低能效的新架构,一旦NVIDIA也用于7纳米工艺,几乎可以像英特尔一样让AMD回到解放前。

允许禁止发表的原创文章。以下是发布通知。

本文关键词:亚博体彩平台,亚博体彩网站,亚博体彩网站平台首页

本文来源:亚博体彩平台-www.vacs4less.com

相关文章

网站地图xml地图