美国OpenAI与半导体巨头博通(Broadcom)联合完成定制AI芯片“Jalapeño”的设计,目标提升AI推理工作负载效率并大幅降低成本。该芯片设计历时约九个月,于2026年6月24日完成,已交付早期样品进行测试 [1, 2, 3, 4, 5, 6, 7]。
Jalapeño专门针对AI模型推理任务设计,支持运行ChatGPT和Codex等大型语言模型,而非用于训练。OpenAI硬件负责人Richard Ho称,“Jalapeño能以接近硬件理论极限的效率执行最关键的工作负载” [3]。相比传统GPU,芯片可降低约50%的成本,但性能和功耗表现大幅优于当前顶级AI芯片,初步测试显示效率接近理论上限 [1, 3, 8, 4, 9, 6, 7]。
芯片晶圆面积约840平方毫米,接近极紫外光刻(EUV)胶片尺寸极限,尺寸超过大多数推理加速器,接近训练芯片大小 [4]。由台积电负责先进工艺制造,确保芯片性能和良率 [5, 6, 7]。
Broadcom首席执行官Hock Tan表示,“我们将从2026年开始,帮助微软和其他合作伙伴部署千兆瓦级数据中心。”他强调双方合作是长期的多年代际项目,目标将芯片全球部署电力消耗扩展至10吉瓦水平 [1, 8, 4, 9, 5, 7]。
OpenAI在训练和部分推理环节依然依赖英伟达、AMD及Cerebras,但Jalapeño作为首代产品,旨在减少对供应链的依赖并提升议价能力 [1, 3, 8, 4, 9, 6, 7]。OpenAI联合创始人Greg Brockman称,“Jalapeño是公司全栈基础设施战略的一部分,用以高效交付先进AI服务” [7]。
此外,加拿大系统集成商Celestica将负责Jalapeño芯片在OpenAI数据中心服务器的集成工作 [5, 7]。
Jalapeño芯片计划于2026年底在微软及其他合作伙伴数据中心初步部署,2027年进行大规模原型测试,目标2028年上半年实现全面量产和部署 [1, 3, 4, 5, 6, 7]。