芯片解密|单片机解密|IC解密|PCB抄板|软件开发|样机制作|13315190088

芯片解密

IC解密NVIDIA最强GPU全面投产,超 50 款服务器型号面世

英伟达3月份发布的计算卡H100终于开始出货,也是10月份开始上市。由此看来,NVIDIA在GTC 2022上宣布 NVIDIA H100 Tensor Core GPU全面投产,也算是其对台积电下了“超级急件”订单传闻的表态了。

9月22日消息,IC解密在昨晚的GTC 2022大会(上下半年各一次),NVIDIA不仅发布了RTX4080/4090系列显卡,还宣布了一件事,那就是3月份发布的计算卡H100终于开始出货,也是10月份开始上市。

换言之,英伟达NVIDIA H100 Tensor Core GPU全面投产,NVIDIA全球技术合作伙伴计划于10月推出首批基于开创性NVIDIA Hopper架构的产品和服务。

实际上,IC解密H100加速卡今年3月份的GTC大会上发布,距今刚好半年了,采用Hopper架构,GH100大核心,台积电4nm制造工艺、CoWoS 2.5D封装技术,集成800亿个晶体管,核心面积814平方毫米。

据悉,它拥有18432个CUDA核心、576个Tensor核心、60MB二级缓存,支持6144-bit位宽的六颗HBM3/HBM2e,支持PCIe 5.0,支持第四代NVLink总线。

另外,H100计算卡有SXM、PCIe 5.0两种样式,其中SXM版本15872个CUDA核心、528个Tensor核心,PCIe 5.0版本14952个CUDA核心、456个Tensor核心,功耗最高达700W。

编者也了解到,IC解密关键的是,H100使企业能够削减AI的部署成本,相较于上一代,在提供相同AI性能的情况下,可将能效提高3.5倍,总体拥有成本减少至1/3,所使用的服务器节点数也减少至1/5。

可喜的是,NVIDIA DGX H100系统现在也已开始接受客户预定。该系统包含8个H100 GPU,FP8精度的峰值性能达到32PFlops。每个DGX系统都包含NVIDIA Base Command和NVIDIA AI Enterprise软件,可实现从单一节点到NVIDIA DGX SuperPOD的集群部署,为大型语言模型和其他大规模工作负载的高级AI开发工作提供支持。

对于需求方最关心的问题,H100的价格没有官方消息,不过之前日本市场有过预售,PCIe版本的都要475多万日元,人民币要24万元以上了,SXM版价格应该会更贵。

但IC解密也有最新消息显示,H100加速卡10月份上市,其中亚马逊、谷歌及微软三大云服务供应商会率先采用,还有就是科研机构及高校,洛斯阿拉莫斯国家实验室和瑞士国家超级计算中心、日本筑波大学也会采购。

另一方面,IC解密全球领先的计算机制造商所提供的搭载H100的系统预计将在未来几周内发货,到今年年底将有超过50款服务器型号面市,2023年上半年还将有数十款型号面市。已在构建系统的合作伙伴包括源讯(Atos)、思科、戴尔科技、富士通、技嘉科技、慧与、联想和超微。

回顾数日前(9月19日),IC解密据中国台湾省《经济日报》报道,全球GPU龙头英伟达近期对台积电下了“超级急件(super hot runs)”订单,以提前生产原计划明年出货的部分产品。传闻称,这批“超级急件”涉及5000片晶圆产能,相关产品的交期将大幅缩短,从原本预估的5-6个月,压缩至2-3个月,台积电最快将在10月底至11月初向英伟达开始交货。


飞芯科技

联系方式

地址:石家庄新华区民族路77号华强广场D座2009
电话:0311-88816616/87087811
手机:13315190088
传真:0311-67901001
联系人:张工
网址:www.feixindz.com
邮箱:feixindz@163.com
微信:xinpianjiemi
QQ:527263666/568069805

在线客服
热线电话

企业微信