EntAI 雷达摘要

  • 适合人群:AI 行业观察者、科技公司决策者、AI 与半导体领域从业者
  • 影响领域:AI 基础设施、云计算、半导体
  • 机会判断:机会判断:AI 推理需求爆发为专用推理芯片和极低延迟服务打开了新的市场窗口,传统云架构面临重构机遇。
  • 风险提醒:风险提醒:Cerebras 对单一超大规模客户的依赖度可能急剧升高,若 OpenAI 自研进度超预期或战略转向,会带来收入波动风险。
  • 推荐标签:AI芯片、大模型推理、云计算、OpenAI、Cerebras
  • 推送优先级:3/5

芯片公司 Cerebras 拿出了相当硬核的成绩单。 6 月 23 日,Cerebras Systems 公布了 2026 财年领先季度的业绩。GAAP 准则下,季度营收达到 1.934 亿美元。 更值得关注的是核心营收数据。这部分创下了 1.913 亿美元的纪录,相比去年同期猛增了 92%。 🚀 两份超级订单,锁定下一代 AI 推理 业绩爆发背后,是两笔关键的合作。 与 OpenAI 达成的多年期协议堪称重磅炸弹。OpenAI 将在未来几年内,部署高达 750 兆瓦的 Cerebras 高速推理算力。这笔订单的总价值超过了 200 亿美元。 另一大云巨头 AWS 也加入了合作。Cerebras 与亚马逊启动了多年期合作,将自家的快速推理能力引入 AWS 平台。具体路线图上,双方会采用一种分解推理策略:由 AWS 的 Trainium 3 芯片负责预填充环节,再由 Cerebras 的 CS-3 系统执行解码端的高速推理。 ⚡ 极速推理正在改变 AI 的使用方式 速度是 Cerebras 本季度强调的关键词。 Cerebras 与合作伙伴共同推出的 Codex-Spark 模型,专门针对低延迟的交互式编码场景进行了优化。它跑起来的速度能超过每秒 1000 个 token。这意味着程序员在敲下一行代码时,AI 几乎能做到实时补全,几乎没有等待感。 面向企业客户,Cerebras 还启动了 Kimi K2.6 和 Gemma 4 的试用。其中,Kimi K2.6 是新型在 Cerebras 上部署的万亿参数模型。根据独立机构 Artificial Analysis 的测算,它的推理性能接近每秒 1000 个 token。对于如此庞大的模型而言,这种响应速度意味着处理复杂逻辑推理或长文本分析时,用户不必再长时间等待。 资金层面,Cerebras 在上一季度完成了 64 亿美元的融资,成为有史以来规模最大的半导体公司 IPO。

EntAI观察

Cerebras 的这一系列动作,反映出 AI 产业的算力需求正在发生明显分化。训练大模型的热度之外,推理环节的竞争已然白热化。 OpenAI 愿意签订超过 200 亿美元的推理算力长约,或许说明头部 AI 公司正在以锁定产能的方式,为 AI 大规模应用做储备。而 Cerebras 与 AWS 推出的分解式推理策略,也意味着云服务商不再执着于单打独斗——将不同类型的芯片组合起来,用更低的延迟和更高的效率服务用户,正成为新的解决方案。 今天这几件事指向一个趋势:AI 竞赛的下半场,不仅是模型能力的比拼,更是推理成本和响应速度的工程化较量。

觉得有用?点个赞

作者 entai_admin

发表回复

© 2026 EntAI恩钛智能  |  上海市黄浦区人民路879号人民大楼一楼(后) | EntAI@EntAIAI.com
🔑 登录 ✨ 免费注册
友情链接: IAICA 国际智能照护协会 IAICA.NGO® OECD AI UNESCO AI Partnership on AI Stanford HAI MIT CSAIL Berkeley BAIR 清华AIR 北京智源BAAI Hugging Face Papers With Code Google DeepMind Anthropic