打脸英伟达! 国内工厂将大批RTX 5090改装成鼓风式, 充作AI算力卡

  • 2025-06-17 15:55:29
  • 679

即便美国实施禁令,一直以来,仍有不少英伟达RTX 5090显卡在中国市场流通。在前阵子的国际电脑展(COMPUTEX 2025)活动中,英伟达CEO黄仁勋对此作出回应,表示没有任何证据显示有“超标”的英伟达AI芯片转运到中国。

令人意想不到的是,没过几天,他的这番言论疑似被“打脸”。近日,有用户在社群平台爆料大量被中国工厂改装的RTX 5090显卡照片,这些显卡被改成鼓风式设计,并且准备在国内AI市场销售。

一位名为Olrak20_的用户在X平台分享了疑似来自中国工厂的照片。图片中展示的RTX 5090采用鼓风式设计,而英伟达官方并未推出过该型号,由此可以推断这些显卡是经过自行改装的(目前只有英伟达RTX PRO 6000 Blackwell服务器版才有鼓风式设计)。

鼓风式散热显卡的特点在于,仅使用单一风扇进气,并将热空气从机壳背面排出。相较于开放式风冷显卡会将热空气排到机壳内部、导致机箱整体温度上升,因此不适合在家用的塔式机箱内使用。鼓风式散热可更有效地降低显卡内部环境温度,因此这种设计适合大批量部署在空间有限的系统,如服务器、工作站等。

不过,考虑到RTX 5090的功耗高达575W,改成鼓风式散热后,几乎难以在不降频的情况下应对如此高的热输出,所以推测这些改装后的显卡是专为AI运算设计。

显卡背面还贴着“RTX 5090 32G D7 Turbo”的型号标识,但其显卡本身和外盒上都没有贴上任何品牌,因此改装前的RTX 5090很可能是通过非正式渠道流出。对于工厂来说,改装也算是合理操作,毕竟他们不可能买来就直接出售,通过改装将更难追溯到显卡的来源。

这也间接解释了为何之前有人买到的RTX 5090内部GPU芯片消失,很可能是这些工厂将显存颗粒和芯片从原始主板上移除,再安装到新的PCB板上。英伟达并未对这些图片发表评论,也没有说明是否有此类SKU正在开发中,这些鼓风式RTX 5090的来源与合法性仍不明确。

此前,英伟达为中国市场推出的特供版A800、H800的AI算力卡,曾一度可以在国内销售。但随着美国出口管制政策的进一步加强,A800从2023年11月起被禁售,H800也一同被列入禁售名单。英伟达被迫针对中国市场推出了进一步阉割算力的H20。

通过对比可以看出算力差距:

A800基于Ampere架构,拥有6912个CUD核心和80GB HBM2e显存,虽不支持F8运算,但FP16峰值计算能力高达312Tflops。在深度学习训练任务中,A800凭借强大的并行计算能力,能够快速处理神经网络中的海量数据,加速模型的收敛速度。

H20基于Hopper架构,拥有4096个CUDA核心和96GB HBM3显存,其FP8性能为296Tflops,FP16峰值计算能力为148Tflops。在集群规模较小时(如512xH20),H20训练吞吐可以达到A800训练吞吐的62%;当集群规模较大时(如4096xH20),H20训练吞吐可以达到A800训练吞吐的70%。

值得注意的是,今年4月9日,英伟达H20再次被美国列入了出口管制名单,向中国出口H20算力卡及相关集成电路需要许可证,实际操作中基本等同于禁售。国内AI企业只能另辟蹊径,把目光瞄准了AI算力勉强够用的消费级显卡RTX 5090。

RTX 5090拥有21760个CUDA核心、680个Tensor核心,FP16性能可达104.8Tflops。另外,英伟达针对中国市场推出的RTX 5090 D版本,其AI性能相当于原版的71%。同时,近日市场上RTX 5080、RTX 5090高端显卡的供应量似乎有慢慢增加的趋势,难怪国内企业要采购RTX 5090进行改装,充作AI算力卡使用了。

其实早在两年前,国内一些小型人工智能公司,因无法承担专业算力卡的高昂成本,就选择使用多块RTX 4090显卡搭建计算平台来训练小型神经网络模型。按照美国的出口管制标准,RTX 4090由于总算力达到2642,性能密度为4.34,落在了受管制条件第二条规定的范围,迫使英伟达为国内市场开发了特供RTX 4090D,犹如今年的RTX 5090D。

只不过作为消费类电子产品,想严格落实管制是几乎不可能的事,百折不挠的中国企业正在用实际行动从困境中突围,也彰显出强大的创新活力与不屈的奋斗精神。