联手刷新AI推理纪录)
智通财经APP获悉,微软宣布,其Azure ND GB300v6虚拟机在Meta的Llama270B模型上实现了每秒推理速度达110万token的行业新纪录。据悉,Azure ND GB300虚拟机采用英伟达(NVDA.US)的Blackwell Ultra GPU,具体为NVIDIA GB300NVL72系统,配置72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU,采用单机架构设计。这款虚拟机专为推理工作负载优化,具有50%的GPU内存提升和16%的热设计功率(TDP)提高。
微软首席执行官萨提亚?纳德拉在社交媒体上表示:“这一成就是我们与英伟达长期合作和在生产规模运行人工智能方面专业知识的结晶。”
资料显示,为了验证性能提升,微软在一个NVIDIA GB300NVL72域下的18台ND GB300v6虚拟机上运行了Llama270B模型,使用NVIDIA TensorRT-LLM作为推理引擎。微软表示:“一个NVL72机架的Azure ND GB300v6实现了总计110万个token/秒的推理速度。” 这一新记录超越了微软之前在NVIDIA GB200NVL72机架上实现的86.5万个token/秒的成绩。
对此,Signal65的实验室副总裁拉斯?费洛斯指出:“这一里程碑不仅突破了每秒百万token的障碍,还在一个能够满足现代企业动态使用和数据治理需求的平台上实现。” 他补充称,Azure ND GB300相较于上一代NVIDIA GB200在推理性能上提升了27%,而仅增加了17%的功率规格。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
宾利两款限量版车型官图发布 买车送礼服
近日,宾利添越以及欧陆GTC的两款定制限量版车型官图发布,该车是...
配备四缸发动机 AMG SL 43海外正式上市
日前,车质网从海外媒体获悉,AMGSL43正式于海外上市。新车改...
武大版ChatGPT大模型CheeseChat问
感谢IT之家网友雨雪载途、肖战割割的线索投递!,武汉大学宣布,武...
不改变工艺让芯片面积减少30%,三星组建团队开发
,根据韩媒TheElec报道,三星组建了一支专业的团队,负责开发...
华硕推出27寸电竞显示器VG27AQML1A:2
,华硕推出新款27英寸电竞显示器,新款显示器型号为VG27AQM...
Win11学院:在Windows11Build2
,微软日前面向Dev频道的WindowsInsider项目成员,...