华为昇腾官宣支持V4大模型,在同一天,英伟达也官宣支持V4大模型,这使得原本平静的AI圈突然间就像炸开了锅一样。国产算力首次进行实战部署,这是其一,另一边呢,英伟达急忙晒出数据,两家处于同一条赛道上,正面对决,火药味儿极为浓烈。
同天官宣背后的较量
在4月29日这一天,V4正式发布,就在发布当天,华为昇腾CANN官方于直播里宣告,V4于昇腾平台实现了首发,这表明国产模型与国产芯片头一回切实走到一处,从实验室迈进了实际部署阶段,同一时间,英伟达官方技术博客赶忙发文,宣称V4在其平台也完成了适配,还给出了实测数据,英伟达的数据表明,在GB200 NVL72上,每用户每秒推理速度超过150。英伟达所运用的措辞具备专业性,所呈现的数据较为齐全,然而其发布的节点显得太过急迫,那种焦虑几乎清晰地写在了脸上。

黄仁勋十天前的预言
一档播客中,英伟达CEO黄仁勋,在10天前说过一句狠话,他直言,若顶尖AI模型优先针对华为芯片而非英伟达平台进行优化,对他们来讲将是灾难性的,这话如今听起来仿若预言,而V4在昇腾平台的首发,恰好印证了他的担忧,英伟达并非没有技术底牌,V目前只有英伟达的高端芯片原生支持,可问题是,这张底牌能否保住他们的市场地位,现在已变得不确定了。
国产方案绕过精度壁垒
那些仅凭借FP4精度才能够实现跑V4的壁垒、在发布当日就被国产方案给绕过去了。智源研究院在同日宣告,他们达成了FP4到BF16的精度路径转换。这项技术将V4-Flash适配到了海光、沐曦、华为昇腾、摩尔线程、昆仑芯、平头哥真武、天数等8款以上国产芯片之上。原本所需的数周适配周期,如今被压缩到了几天。这意味着国产芯片阵营快速形成了合力,不再受到单一精度格式的限制。
华为昇腾卡的具体优势
华为昇腾Atlas 350加速卡乃是当下国内唯一支持FP4低精度的推理产品,单卡算力达成了英伟达H20的2.87倍这一颇为具体的数据,华为官方于定价说明里也有所透露,预估下半年昇腾950超节点批量上市后,Pro版价格会大幅下调,这表明华为不但在算力方面进行追赶,还在价格上做好了进攻的准备,对于国内AI企业以及开发者而言,这意味着他们多了一个切实可行的选择,而非只能被动接受英伟达的定价。
英伟达仍在但不再唯一
当下,英伟达的NIM微服务已然在V4上线,并且与vLLM一同给出部署方案,首日所呈现的表现而言,英伟达在技术方面的积累以及生态方面的优势仍然显著,其部署方案成熟且稳定,实测得出的数据也极具说服力,然而问题的关键之处在于,即便英伟达依旧身为主要角色,却并非是独一无二的主要角色了,国产芯片阵营已然拥有了实战的能力,从昇腾到海光,从摩尔线程到昆仑芯,8款以上的国产芯片同时对V4予以支持,这种生态联动的速度是之前从未有过的。
实战部署才是真正考验
首次同日进行较量这一情况本身,已然表明国产算力度过了从无到有的时期,国产芯片跟国产模型的搭配迈向实战部署阶段,这听闻起来令人心潮澎湃,然而真正的检验才刚刚起始,实际业务场景里的稳定性、吞吐量、能耗比以及运维成本,这些全都得在真实环境当中加以验证,英伟达在过去几年所积攒的软件生态以及开发者社区,并非短时间内能够被超越的,接下来从一到十的进程,需要更多真实用户的反馈以及持续不断的迭代。
当下,V4已然上线,你会不会于自身业务里试着运用国产芯片去部署呢?欢迎在评论区域分享你的见解,点赞并转发,以使更多人瞧见这场算力竞赛的最新进展情况。



