OpenAI首次在Cerebras芯片上部署AI模型
创始人
2026-02-13 20:44:37
0

OpenAI于周四发布了gpt-5.3-Codex-Spark,这是其首个运行在Cerebras Systems餐盘大小AI加速器上的模型。该加速器搭载了世界上最快的片上内存技术。

这款轻量级模型旨在通过Cerebras的SRAM封装CS3加速器为OpenAI的Codex代码助手用户提供更具交互性的体验,生成响应速度超过每秒1000个Token。

上个月,OpenAI与Cerebras签署了100亿美元的合同,部署多达750兆瓦的定制AI芯片来服务Altman团队的最新一代GPT模型。

Cerebras的晶圆级架构采用了一种名为SRAM的超快片上内存,其速度比英伟达今年CES上发布的即将推出的Rubin GPU中的HBM4内存快约1000倍。

结合推理和应用管道的优化,OpenAI的最新模型能够在眨眼间生成答案。

由于Spark是专有模型,我们无法获得参数数量等详细信息,不像OpenAI去年8月在HuggingFace上发布gpt-oss时那样。我们知道的是,与那个模型一样,它是一个纯文本模型,拥有128,000个Token的上下文窗口。

模型的上下文窗口是指它能同时跟踪的Token(词汇、标点符号、数字等)数量,通常被称为模型的短期记忆。

虽然128K个Token听起来很多,但由于模型必须跟踪现有代码和新生成的代码,像Codex这样的代码助手可能很快就会用完。即使从空白开始,以每秒1000个Token的速度,大约两分钟就会超出上下文限制。

这可能是OpenAI表示Spark默认采用"轻量级"风格的原因,只进行最小的针对性编辑,除非特别要求,否则不会运行调试测试。

快速的模型如果不能编写有效代码就没有太大价值。据OpenAI称,Spark模型在Terminal-Bench 2.0测试中比GPT-5.1-Codex-Mini提供更高的准确性,同时比更智能的GPT-5.3-Codex模型快得多。

OpenAI可能正在寻求GPU之外的选择,但短期内肯定不会放弃GPU

OpenAI写道:"GPU在我们的训练和推理管道中仍然是基础,为广泛使用提供最具成本效益的Token。Cerebras通过在需要极低延迟的工作流程中表现出色来补充这一基础。"

这不仅仅是表面文章。尽管Cerebras的CS3加速器速度很快,但在内存容量方面无法与现代GPU匹敌。SRAM虽然快速,但空间效率不高。整个餐盘大小的芯片仅包含44GB内存。相比之下,英伟达的Rubin将配备288GB的HBM4,而AMD的MI455X将搭载432GB。

这使得GPU在运行大型模型时更经济,特别是在速度不是优先考虑因素的情况下。话虽如此,OpenAI建议随着Cerebras提供更多计算资源,它将把更大的模型引入该计算平台,这大概是为那些愿意为高速推理付费的用户准备的。

GPT-5.3-Codex-Spark目前向Codex Pro用户提供预览版,并通过API向特定的OpenAI合作伙伴开放。

Q&A

Q1:GPT-5.3-Codex-Spark有什么特别之处?

A:GPT-5.3-Codex-Spark是OpenAI首个运行在Cerebras Systems AI加速器上的模型,该加速器采用SRAM片上内存技术,速度比英伟达GPU中的HBM4内存快约1000倍。该模型专为代码助手设计,能以每秒超过1000个Token的速度生成响应,为用户提供更具交互性的编程体验。

Q2:为什么OpenAI选择与Cerebras合作而不是继续只用GPU?

A:OpenAI与Cerebras签署了100亿美元合同,主要是为了获得极低延迟的推理能力。虽然GPU在训练和推理管道中仍然是基础且更具成本效益,但Cerebras的SRAM技术在需要极速响应的工作流程中表现出色,两者形成互补关系而非替代关系。

Q3:GPT-5.3-Codex-Spark的上下文窗口有什么限制?

A:该模型拥有128,000个Token的上下文窗口,虽然看似很大,但由于需要跟踪现有代码和新生成的代码,在每秒1000个Token的生成速度下,大约两分钟就会达到上下文限制。因此模型默认采用"轻量级"风格,只进行最小的针对性编辑。

相关内容

北京集成电路装备创新中心申...
国家知识产权局信息显示,北京集成电路装备创新中心有限公司申请一项名...
2026-03-03 17:44:18
武汉华星光电申请显示装置专...
国家知识产权局信息显示,武汉华星光电技术有限公司申请一项名为“显示...
2026-03-03 17:44:16
武汉万集光电取得目标检测方...
国家知识产权局信息显示,武汉万集光电技术有限公司取得一项名为“一种...
2026-03-03 17:44:14
光电共封装CPO板块3月3...
证券之星消息,3月3日光电共封装CPO板块较上一交易日下跌2.09...
2026-03-03 17:44:00
中国石油申请用于三轴磁传感...
国家知识产权局信息显示,中国石油天然气集团有限公司;中国石油集团西...
2026-03-03 17:43:57
壁仞科技取得访问方法、装置...
国家知识产权局信息显示,上海壁仞科技股份有限公司取得一项名为“访问...
2026-03-03 17:43:55
恒力检测取得回路电阻试验夹...
国家知识产权局信息显示,广州市恒力检测股份有限公司取得一项名为“一...
2026-03-03 17:43:40
2030年光谷传感器产业规...
手机自动调亮度、倒车雷达提醒你距离障碍物还有多远、人形机器人稳稳拿...
2026-03-03 17:14:13
顺久电子取得显示设备背光调...
国家知识产权局信息显示,上海顺久电子科技有限公司取得一项名为“一种...
2026-03-03 17:14:10

热门资讯

中国石油申请用于三轴磁传感器的... 国家知识产权局信息显示,中国石油天然气集团有限公司;中国石油集团西部钻探工程有限公司申请一项名为“用...
壁仞科技取得访问方法、装置、芯... 国家知识产权局信息显示,上海壁仞科技股份有限公司取得一项名为“访问方法、装置、芯片、电子设备和存储介...
尚阳通申请沟槽栅超结器件及其制... 国家知识产权局信息显示,深圳尚阳通科技股份有限公司申请一项名为“沟槽栅超结器件及其制造方法”的专利,...
我国科学家靳常青获国际超导材料... △中国科学院物理研究所研究员 靳常青 记者今天(3月3日)从中国科学院获悉,近日,国际超导材料探索领...
国泰基金的半导体设备ETF(1... 3月3日,半导体设备ETF(159516)报收1.767元,收跌5.46%,成交金额19.51亿元。...
ETF盘中资讯|7连阳后首根阴... 此前7连阳的电子ETF(515260)今日(3月3日)随市回调,场内价格现跌4.02%,看好电子板块...
亚世光电(002952)3月3... 证券之星消息,截至2026年3月3日收盘,亚世光电(002952)报收于24.43元,上涨10.0%...
资金涌向周期板块,半导体遭抛弃... 3月3日,半导体产业链午后跌势扩大,存储、算力芯片方向领跌,国科微(300672.SZ)、恒烁股份(...
浙江龙吟光伏取得光伏停车棚电流... 国家知识产权局信息显示,浙江龙吟光伏股份有限公司取得一项名为“基于物联网的光伏停车棚电流故障检测方法...
汕头华电取得分力式带式输送机拉... 国家知识产权局信息显示,汕头华电发电有限公司取得一项名为“一种分力式带式输送机拉绳开关组件”的专利,...