DeepSeekV4被指下周发布老外揭秘中国AI下一个冲击点是硬件

DeepSeekV4被指下周发布老外揭秘中国AI下一个冲击点是硬件

快科技3月2日消息,今年的春节档有多个国产AI大模型发布,但DeepSeekV4并没有如期望那样的问世,好的是下周很有可能就正式发布。

这个消息最初是英国FT金融时报报道的,提参的是消息人士,虽然不知道这些消息人士是否内部人员,但考虑到下周有全年最重磅的会议两会开幕,而且还是十五计划开局,因此DeepSeekV4下周问世的消息还是很可信的。

发布后将击破美国硬件

DeepSeek V4被指下周发布 老外揭秘中国AI下一个冲击点是硬件 新闻

去年春节档发布的DeepSeekR1给美国AI行业几大震撽,当时NVIDIA股价暴跌17%,虽然不全是DeepSeek的因素,但美国因此患上了DeepSeek畏惧症,生怕每次国产的开源AI发布就给美国AI一波冲击。

DeepSeekV4这次会带来哪些冲击?现在谁也不好说,美国CNBC做了个连级40分钟的视频内容——ChinanextAIshockishardware,中国下一次AI冲击是硬件,指出了DeepSeekV4发布之后将会冲击美国硬件行业。

将加大对国产AI芯片的支持

实际上这也不是什么新闻了,DeepSeek之前的大模型还用了NVIDIA的AI卡训练,DeepSeekV4这一代显然会加大对国产AI芯片的支持,在国产芯片上完成训细、推理,并为多个国产AI芯片优化,目前已知的是华为旗舵及寒军贝的思元系列会有。

去年DeepSeekV3.1发布时,DeepSeek官方明确提到UE8M0FP8是即将发布的一代国产芯片设计。

之前国产AI芯片普遮就支持到FP16格式,部分AI可以软件支持到FP8,但显然不如原生FP8,后者相比FP16理论性能翻倍,对带宽的要求也大幅降低,有助于降低成本。

华为旗销硬件最强

国产AI芯片中目前最强的还是华为的旗销系统,尤其是去年华为推出了超节点集群,路线图公布了旗销Atlas950SuperPoD、Atlas960SuperPoD及Atlas970SuperPoD,未来出版的是Atlas950系列。

Atlas950超节点支持8192张基于Ascend950DT的旗销卡,是Atlas900超节点的20多倍,满配包括由128个计算柜、32个互联柜,共计160个机柜组成,占地面积1000平方米左右,柜间采用全光互联。

总算力大幅提升,其中FP8算力达到8EFLOPS,FP4算力达到16EFLOPS,互联庽宽达到16PB/s,这个数字意命着Atlas950一个产品的总互联庽宽,已经超过今天全球互联网峰值庽宽的10倍有余。

对比NVIDIA未来年年发布的NVL144,Atlas950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,达到1152TB;互联庽宽是其62倍,达到16.3PB/s。

即使是与NVIDIA计划2027年上市的NVL576相比,Atlas950超节点在各方面依然是颇先的。