AI算力新蓝海?基于OCS的TPU芯片是什么?
创始人
2025-12-02 16:36:12
0

2023年以来,大模型训练引爆了算力需求的快速增长。随着算力资本开始攀升,市场对于算力是否过剩、AI是否泡沫化的讨论热度逐渐增加。在此背景下,后来居上的Gemini 3模型及其背后的TPU芯片引发了广泛关注和讨论。

TPU芯片集群基于全光交换(OCS)技术,走出了一条独特的规模化路径——不苛求单芯片性能的巅峰,而是通过高效的光互联,将成千上万个计算单元融合为一个“虚拟超级计算机”。

一、OCS:重新定义芯片互联的智能光路调度

算力中心的构成不仅只有芯片,还包括交换机、高速互联、光模块、机柜系统、散热与能耗管理等完整的技术体系。随着算力规模持续膨胀,算力中心的建设也正从“堆叠更多芯片”转向“打造整体算力系统”。

在交换机方面,传统的 OEO(光-电-光)主要实现光信号与电信号的相互转换,但其速度、耗电发热等方面均有较多局限。随着数据量爆炸式增长,传统光电交换OEO的性能瓶颈愈发明显。而OCS(全光交换)则是让信号在光路中直接“直通”,不再反复转换,因此通常速率快、带宽升级灵活,同时OCS还能较好地利用光纤带宽、显著降低能耗,且容易扩展到成千上万的端口。

而TPU Ironwood超级集群,区别于GPU数据中心的关键就是靠OCS把9216颗TPU直接互联成一个统一的大算力系统,相当于把几千颗“芯片小岛”连成了一块“算力大陆”。整个系统能提供42.5 EFLOPS(FP8)的算力和1.77 PB的 HBM 内存,像一台巨型超级计算机一样协同工作。

得益于OCS的全光架构,该网络性能出现了质变:吞吐提升30%,功耗下降40%,流量完成时间缩短10%,故障时间减少到原来的1/50,资本开支降低30%。

总的看来,TPU借助OCS可以把多个模块随时组合成大网络,让数千颗芯片共享带宽和内存,实现真正的大规模协同训练。这也让超大模型可以更高效地调度和扩展。

图1. Ironwood超级集群

下图展示了在 TPU 集群中TPU芯片、OCS交换机与光模块之间的信号传输路径,说明数据是如何在超大规模系统内进行高速互联的。

图2. TPU集群信号传输

二、OCS主流技术方案

OCS最早用于传统电信,如今在AI数据中心因超大带宽和低时延需求而加速普及。当前OCS主要有多种技术路线,各方案在端口规模、插损和切换速度等方面各有特点。

表1. OCS技术路线对比

资料来源:中泰证券

其中,MEMS OCS是最主流的技术,产业链完善,已在海外龙头企业TPU集群中大规模部署,是当前商业化最成熟的方案。

按成本拆分数据,单台MEMS OCS的BOM成本约2-2.5万美元,售价约6万美元,成本主要来自MEMS阵列、光纤阵列、透镜阵列、环形器与光电模组,其中阵列部分占比最高,是决定性能与成本的核心。

三、市场前景与产业机遇

随着OCS在AI大规模集群中的快速落地,产业链正迎来高速增长期。根据QYResearch,全球OCS市场规模已从2020年的7200万美元增长至2024年的3.6亿美元,CAGR高达49.8%;Cignal AI预计,在海外龙头MEMS OCS的带动下,2025年市场规模约4亿美元,并将在2029年突破16亿美元,2025–2029年 CAGR约41%。目前A股相关企业毛利率约34%,行业盈利能力持续提升。

在应用端,以TPU v4p为例,一个包含 4096 颗TPU的集群需配置48台OCS、总端口超过6500个,单一集群的光交换需求即具备可观价值。随着算力建设加速,2026年TPU 出货量有望达到400万颗,为OCS需求提供持续动能。LightCounting预计,2029年全球OCS出货量将突破5万台,全光交换将成为AI数据中心的关键底座。

以TPU集群为代表的新型算力体系正成为当前算力需求的“第二解法”。

回到市场当下的疑虑:算力是否已经过剩?从 TPU 集群的演进中,我们看到的不是需求的停滞,而是行业对算力极限、对算力体系革新的持续探索与不懈追求。

随着算力结构从单一路径向多元化演进,光模块、OCS等底层互连环节的需求呈现同步放量趋势,也带来了更大的产业延展空间。相应领域的布局工具如云计算ETF汇添富(159273)可作为关注方向。

与此同时,算力芯片生态也在从通用GPU向ASIC专用芯片加速分化。随着大模型场景进一步精细化,专用芯片所代表的“第二路径”正在打开更广阔的创新和产业化空间。围绕专用芯片产业链的工具,如科创芯片50ETF(588750)、芯片50ETF(516920),同样值得跟踪。

风险提示:基金有风险,投资需谨慎。投资人应当阅读《基金合同》《招募说明书》《产品资料概要》等法律文件,了解基金的风险收益特征,特别是特有风险,并根据自身投资目的、投资经验、资产状况等判断是否和自身风险承受能力相适应。基金管理人承诺以诚实信用、谨慎尽责的原则管理和运用基金资产,但不保证基金一定盈利或本金不受损失。科创芯片50ETF属于较高风险等级(R4)产品,适合经客户风险承受等级测评后结果为进取型(C4)及以上的投资者。其余基金属于中等风险等级(R3)产品,适合经客户风险承受等级测评后结果为平衡型(C3)及以上的投资者。请投资者关注指数化投资的风险以及集中投资于SHS云计算指数、科创芯片指数、芯片产业指数成分股的持有风险,请关注部分指数成分股权重较大、集中度较高的风险,请关注指数化投资的风险、ETF运作风险、投资特定品种的特有风险等。云计算ETF汇添富投资范围包括港股,会面临因投资环境、投资标的、市场制度以及交易规则等差异带来的特有风险。文中提及个股仅为指数成份股客观展示列举,本文出现信息只作为参考,投资人须对任何自主决定的投资行为负责。本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议

以上内容与数据,与有连云立场无关,不构成投资建议。据此操作,风险自担。

相关内容

广州市集成电路产业政策:技...
【1月13日广州工信局征求集成电路产业政策意见,设多项奖励】1月1...
2026-01-13 12:36:38
德兰明海取得均衡电路和储能...
国家知识产权局信息显示,深圳市德兰明海新能源股份有限公司取得一项名...
2026-01-13 12:36:36
真兰仪表取得水表光电直读器...
国家知识产权局信息显示,上海真兰仪表科技股份有限公司取得一项名为“...
2026-01-13 12:36:33
埃维登特申请用于无损检测的...
国家知识产权局信息显示,加拿大埃维登特有限公司申请一项名为“用于无...
2026-01-13 12:36:32
喜利得申请集成式马达制动电...
国家知识产权局信息显示,喜利得股份公司申请一项名为“集成式马达制动...
2026-01-13 12:36:30
拓尔微电子取得恒温恒流控制...
国家知识产权局信息显示,拓尔微电子股份有限公司取得一项名为“一种恒...
2026-01-13 12:10:46
GHSP取得用于定子绕组的...
国家知识产权局信息显示,GHSP公司取得一项名为“具有一体式固定结...
2026-01-13 12:10:39
盛吉盛半导体取得应用于集成...
国家知识产权局信息显示,盛吉盛半导体科技(北京)有限公司取得一项名...
2026-01-13 12:10:38
上能电气取得三电平升压电路...
国家知识产权局信息显示,上能电气股份有限公司取得一项名为“一种三电...
2026-01-13 12:10:36

热门资讯

拓尔微电子取得恒温恒流控制系统... 国家知识产权局信息显示,拓尔微电子股份有限公司取得一项名为“一种恒温恒流控制系统、电路以及线性充电器...
微步信息申请印刷电路板布线优化... 国家知识产权局信息显示,深圳微步信息股份有限公司申请一项名为“印刷电路板的布线优化方法、装置、设备及...
极米光电申请分屏投影系统专利,... 国家知识产权局信息显示,宜宾市极米光电有限公司申请一项名为“分屏投影系统”的专利,公开号CN1212...
上海民用航空电源系统取得板卡固... 国家知识产权局信息显示,上海民用航空电源系统有限公司取得一项名为“一种板卡固定装置及机箱”的专利,授...
广汽集团取得燃料电池汽车SOC... 国家知识产权局信息显示,广州汽车集团股份有限公司取得一项名为“SOC平衡控制方法、整车控制器、设备及...
ETF资金榜 | 科创芯片ET... 2026年1月12日,科创芯片ETF富国(588810.SH)收涨1.31%,成交6374.93万元...
鼎泰电路板取得高效散热电路板制... 国家知识产权局信息显示,梅州鼎泰电路板有限公司取得一项名为“高效散热电路板及其制造方法”的专利,授权...
安徽科惠微电子取得半导体清洗装... 国家知识产权局信息显示,安徽科惠微电子有限公司取得一项名为“一种半导体清洗装置”的专利,授权公告号C...
四维图新:三年内聚焦汽车智能化... 有投资者在互动平台向四维图新提问:“请问公司在人形机器人方面有和小鹏机器人合作吗?具体那方面?” 针...
蓝箭电子:公司产品暂未应用于上... 证券之星消息,蓝箭电子(301348)01月12日在投资者关系平台上答复投资者关心的问题。 投资者提...