EntAI 雷达摘要
- 适合人群:数据中心规划人员、从事 AI 和 HPC 的科研人员、企业级 IT 架构师
- 影响领域:数据中心/云计算、科学研究、人工智能
- 机会判断:机会判断:端到端液冷蓝图的标准化交付,可能大幅降低科研机构构建万卡级算力集群的技术门槛和时间成本。
- 风险提醒:风险提醒:‘最快4小时响应’与‘10万GPU集群经验’属厂商单方面陈述,实际交付能力与服务质量有待落地项目检验。
- 推荐标签:NVIDIA、Supermicro、AI 基础设施、液冷、高性能计算
- 推送优先级:3/5
Supermicro 在 ISC 2026 上甩出了一套为科研和 AI 量身打造的超算基础架构蓝图。 🚀 这套新方案围绕英伟达 Vera Rubin NVL4 平台搭建,瞄准的是高性能计算和 AI 融合场景。 📍 它的核心是一个被称为“可扩展单元”的液冷机架集群。一个标准单元内,塞进了 8 个定制化的 52U 高、750 毫米宽的液冷机柜。每个机柜里装着 36 个英伟达 Vera Rubin NVL4 节点,满配时总共能提供最多 1,152 个英伟达 Rubin GPU 和 576 个英伟达 Vera CPU。 这个 3.2MW 的单元就像乐高积木,可以不断复制堆叠,从最基础的规模一路搭建到 1GW 的超大规模计算集群。 🔋 为了让这头算力怪兽冷静下来,Supermicro 搬出了自家的 DLC-2 直接液体冷却技术。每个可扩展单元部署了 3 台行内冷却液分配单元,配合冷板、歧管网络,以及专门调配的 SMC PG25-A 高电阻抗冷却液,以支持单机架 362 kW 的热密度。 ⚡【对科研打工人有什么用】
这套蓝图最特别的地方,是它真的在尝试解决从“买机器”到“用起来”之间的痛苦鸿沟。Supermicro 承诺提供端到端的全流程服务,覆盖项目规划和现场勘测。 他们会派人来实地看,评估你的装卸货通道够不够宽、大厅的层高和承重行不行,以及现有的电力和冷却设备能不能撑住。接着,机柜的上架、堆叠、布线,甚至系统级和集群级的测试,都在自家工厂里完成。最后交付时,还有上门服务负责机柜就位、水电连接、网络布线、调试和现场验证。 对于需要 7×24 小时不间断运行的关键任务,Supermicro 甚至提供最快 4 小时现场响应服务。这意味着科研团队不需要自己头疼复杂的基建工程,可以把更多精力放回实验和模型本身。 Supermicro 总裁兼首席执行官 Charles Liang 认为,科学发现一直由研究者可用的工具驱动,而 AI 已经成为研究流程中不可或缺的一部分。这家公司显然希望用自己的液冷经验,来扮演这个“工具提供者”的角色。他们提到,已经在全球部署了超过 10 万个 GPU 的液冷集群。 此前在 Computex 上,Supermicro 已经发布了基于英伟达 Vera Rubin NVL72 和 HGX Rubin NVL8 的类似蓝图,这次的 NVL4 方案进一步补全了产品线。
EntAI观察
Supermicro 这次发布的蓝图,透露出超大规模计算部署正在走向高度预制化和全链条服务的趋势。将复杂的液冷系统拆解为标准化的 3.2MW 可扩展单元,意味着大型科研项目的算力上线时间可能从“以年为单位”缩短到“以月为单位”。直接液冷配合定制化冷却液成为标配,也反映出风冷在超高密度 GPU 集群面前已基本走到了尽头。值得关注的是,这种端到端的交钥匙模式,可能会让更多不具备卓越数据中心运维能力的科研机构,也能够接触到万卡级别的算力。
觉得有用?点个赞