OpenAI首次在Cerebras芯片上部署AI模型
创始人
2026-02-13 20:44:37
0

OpenAI于周四发布了gpt-5.3-Codex-Spark,这是其首个运行在Cerebras Systems餐盘大小AI加速器上的模型。该加速器搭载了世界上最快的片上内存技术。

这款轻量级模型旨在通过Cerebras的SRAM封装CS3加速器为OpenAI的Codex代码助手用户提供更具交互性的体验,生成响应速度超过每秒1000个Token。

上个月,OpenAI与Cerebras签署了100亿美元的合同,部署多达750兆瓦的定制AI芯片来服务Altman团队的最新一代GPT模型。

Cerebras的晶圆级架构采用了一种名为SRAM的超快片上内存,其速度比英伟达今年CES上发布的即将推出的Rubin GPU中的HBM4内存快约1000倍。

结合推理和应用管道的优化,OpenAI的最新模型能够在眨眼间生成答案。

由于Spark是专有模型,我们无法获得参数数量等详细信息,不像OpenAI去年8月在HuggingFace上发布gpt-oss时那样。我们知道的是,与那个模型一样,它是一个纯文本模型,拥有128,000个Token的上下文窗口。

模型的上下文窗口是指它能同时跟踪的Token(词汇、标点符号、数字等)数量,通常被称为模型的短期记忆。

虽然128K个Token听起来很多,但由于模型必须跟踪现有代码和新生成的代码,像Codex这样的代码助手可能很快就会用完。即使从空白开始,以每秒1000个Token的速度,大约两分钟就会超出上下文限制。

这可能是OpenAI表示Spark默认采用"轻量级"风格的原因,只进行最小的针对性编辑,除非特别要求,否则不会运行调试测试。

快速的模型如果不能编写有效代码就没有太大价值。据OpenAI称,Spark模型在Terminal-Bench 2.0测试中比GPT-5.1-Codex-Mini提供更高的准确性,同时比更智能的GPT-5.3-Codex模型快得多。

OpenAI可能正在寻求GPU之外的选择,但短期内肯定不会放弃GPU

OpenAI写道:"GPU在我们的训练和推理管道中仍然是基础,为广泛使用提供最具成本效益的Token。Cerebras通过在需要极低延迟的工作流程中表现出色来补充这一基础。"

这不仅仅是表面文章。尽管Cerebras的CS3加速器速度很快,但在内存容量方面无法与现代GPU匹敌。SRAM虽然快速,但空间效率不高。整个餐盘大小的芯片仅包含44GB内存。相比之下,英伟达的Rubin将配备288GB的HBM4,而AMD的MI455X将搭载432GB。

这使得GPU在运行大型模型时更经济,特别是在速度不是优先考虑因素的情况下。话虽如此,OpenAI建议随着Cerebras提供更多计算资源,它将把更大的模型引入该计算平台,这大概是为那些愿意为高速推理付费的用户准备的。

GPT-5.3-Codex-Spark目前向Codex Pro用户提供预览版,并通过API向特定的OpenAI合作伙伴开放。

Q&A

Q1:GPT-5.3-Codex-Spark有什么特别之处?

A:GPT-5.3-Codex-Spark是OpenAI首个运行在Cerebras Systems AI加速器上的模型,该加速器采用SRAM片上内存技术,速度比英伟达GPU中的HBM4内存快约1000倍。该模型专为代码助手设计,能以每秒超过1000个Token的速度生成响应,为用户提供更具交互性的编程体验。

Q2:为什么OpenAI选择与Cerebras合作而不是继续只用GPU?

A:OpenAI与Cerebras签署了100亿美元合同,主要是为了获得极低延迟的推理能力。虽然GPU在训练和推理管道中仍然是基础且更具成本效益,但Cerebras的SRAM技术在需要极速响应的工作流程中表现出色,两者形成互补关系而非替代关系。

Q3:GPT-5.3-Codex-Spark的上下文窗口有什么限制?

A:该模型拥有128,000个Token的上下文窗口,虽然看似很大,但由于需要跟踪现有代码和新生成的代码,在每秒1000个Token的生成速度下,大约两分钟就会达到上下文限制。因此模型默认采用"轻量级"风格,只进行最小的针对性编辑。

相关内容

企业申请嵌入板ECE认证信...
企业申请嵌入板ECE认证信息全解。汽车行业正面临着前所未有的机遇与...
2026-06-03 10:24:20
美胜陶瓷取得自粘胶层嵌入式...
国家知识产权局信息显示,晋江市美胜陶瓷实业有限公司取得一项名为“一...
2026-06-03 10:24:01
研祥申请电源组件及工控整机...
国家知识产权局信息显示,研祥智慧物联科技有限公司申请一项名为“电源...
2026-06-03 10:23:20
兰剑智能获得外观设计专利授...
证券之星消息,根据天眼查APP数据显示兰剑智能(688557)新获...
2026-06-03 10:23:04
复洁科技获得实用新型专利授...
证券之星消息,根据天眼查APP数据显示复洁科技(688335)新获...
2026-06-03 10:22:46
龙腾特钢取得空分制氧可切换...
国家知识产权局信息显示,常熟市龙腾特种钢有限公司取得一项名为“一种...
2026-06-03 10:22:26
双向 PFC+LLC 架构...
2026-06-03 10:22:06
埋地管道电位检测用极化试片
埋地管道电位检测用极化试片 河南铧云-杨素素 埋地钢质管道普遍采用...
2026-06-03 10:21:49
联想申请天线模组和电子设备...
国家知识产权局信息显示,联想(北京)有限公司申请一项名为“天线模组...
2026-06-03 10:21:35

热门资讯

研祥申请电源组件及工控整机专利... 国家知识产权局信息显示,研祥智慧物联科技有限公司申请一项名为“电源组件及工控整机”的专利,公开号CN...
江苏富乐德取得半导体环粘蜡工艺... 国家知识产权局信息显示,江苏富乐德石英科技有限公司取得一项名为“一种半导体环粘蜡工艺及其装置”的专利...
首款消费级Arm架构PC芯片6... 北京时间5月30日凌晨,微软、英伟达、Arm三方联动发布“PC的新时代”预告,并附上中国台北国际电脑...
别再频繁开关了 专家:重启空调... 眼下已进入夏季,多地气温接连突破35℃,6月1日至2日,我国南北多地高温天气还将逐渐增多。大热天里,...
广东中兴电器开关申请静触头快速... 国家知识产权局信息显示,广东中兴电器开关股份有限公司申请一项名为“一种静触头快速调节的双层开关移开式...
英科迪微电子申请波特率信号检测... 国家知识产权局信息显示,合肥英科迪微电子科技有限公司申请一项名为“波特率信号检测电路和CDR环路结构...
2026年中国集成电路市场规模... 中商情报网讯:中国集成电路产业快速发展,市场规模持续扩大。中商产业研究院发布的《2026-2031年...