AI算力新蓝海?基于OCS的TPU芯片是什么?
创始人
2025-12-02 16:36:12
0

2023年以来,大模型训练引爆了算力需求的快速增长。随着算力资本开始攀升,市场对于算力是否过剩、AI是否泡沫化的讨论热度逐渐增加。在此背景下,后来居上的Gemini 3模型及其背后的TPU芯片引发了广泛关注和讨论。

TPU芯片集群基于全光交换(OCS)技术,走出了一条独特的规模化路径——不苛求单芯片性能的巅峰,而是通过高效的光互联,将成千上万个计算单元融合为一个“虚拟超级计算机”。

一、OCS:重新定义芯片互联的智能光路调度

算力中心的构成不仅只有芯片,还包括交换机、高速互联、光模块、机柜系统、散热与能耗管理等完整的技术体系。随着算力规模持续膨胀,算力中心的建设也正从“堆叠更多芯片”转向“打造整体算力系统”。

在交换机方面,传统的 OEO(光-电-光)主要实现光信号与电信号的相互转换,但其速度、耗电发热等方面均有较多局限。随着数据量爆炸式增长,传统光电交换OEO的性能瓶颈愈发明显。而OCS(全光交换)则是让信号在光路中直接“直通”,不再反复转换,因此通常速率快、带宽升级灵活,同时OCS还能较好地利用光纤带宽、显著降低能耗,且容易扩展到成千上万的端口。

而TPU Ironwood超级集群,区别于GPU数据中心的关键就是靠OCS把9216颗TPU直接互联成一个统一的大算力系统,相当于把几千颗“芯片小岛”连成了一块“算力大陆”。整个系统能提供42.5 EFLOPS(FP8)的算力和1.77 PB的 HBM 内存,像一台巨型超级计算机一样协同工作。

得益于OCS的全光架构,该网络性能出现了质变:吞吐提升30%,功耗下降40%,流量完成时间缩短10%,故障时间减少到原来的1/50,资本开支降低30%。

总的看来,TPU借助OCS可以把多个模块随时组合成大网络,让数千颗芯片共享带宽和内存,实现真正的大规模协同训练。这也让超大模型可以更高效地调度和扩展。

图1. Ironwood超级集群

下图展示了在 TPU 集群中TPU芯片、OCS交换机与光模块之间的信号传输路径,说明数据是如何在超大规模系统内进行高速互联的。

图2. TPU集群信号传输

二、OCS主流技术方案

OCS最早用于传统电信,如今在AI数据中心因超大带宽和低时延需求而加速普及。当前OCS主要有多种技术路线,各方案在端口规模、插损和切换速度等方面各有特点。

表1. OCS技术路线对比

资料来源:中泰证券

其中,MEMS OCS是最主流的技术,产业链完善,已在海外龙头企业TPU集群中大规模部署,是当前商业化最成熟的方案。

按成本拆分数据,单台MEMS OCS的BOM成本约2-2.5万美元,售价约6万美元,成本主要来自MEMS阵列、光纤阵列、透镜阵列、环形器与光电模组,其中阵列部分占比最高,是决定性能与成本的核心。

三、市场前景与产业机遇

随着OCS在AI大规模集群中的快速落地,产业链正迎来高速增长期。根据QYResearch,全球OCS市场规模已从2020年的7200万美元增长至2024年的3.6亿美元,CAGR高达49.8%;Cignal AI预计,在海外龙头MEMS OCS的带动下,2025年市场规模约4亿美元,并将在2029年突破16亿美元,2025–2029年 CAGR约41%。目前A股相关企业毛利率约34%,行业盈利能力持续提升。

在应用端,以TPU v4p为例,一个包含 4096 颗TPU的集群需配置48台OCS、总端口超过6500个,单一集群的光交换需求即具备可观价值。随着算力建设加速,2026年TPU 出货量有望达到400万颗,为OCS需求提供持续动能。LightCounting预计,2029年全球OCS出货量将突破5万台,全光交换将成为AI数据中心的关键底座。

以TPU集群为代表的新型算力体系正成为当前算力需求的“第二解法”。

回到市场当下的疑虑:算力是否已经过剩?从 TPU 集群的演进中,我们看到的不是需求的停滞,而是行业对算力极限、对算力体系革新的持续探索与不懈追求。

随着算力结构从单一路径向多元化演进,光模块、OCS等底层互连环节的需求呈现同步放量趋势,也带来了更大的产业延展空间。相应领域的布局工具如云计算ETF汇添富(159273)可作为关注方向。

与此同时,算力芯片生态也在从通用GPU向ASIC专用芯片加速分化。随着大模型场景进一步精细化,专用芯片所代表的“第二路径”正在打开更广阔的创新和产业化空间。围绕专用芯片产业链的工具,如科创芯片50ETF(588750)、芯片50ETF(516920),同样值得跟踪。

风险提示:基金有风险,投资需谨慎。投资人应当阅读《基金合同》《招募说明书》《产品资料概要》等法律文件,了解基金的风险收益特征,特别是特有风险,并根据自身投资目的、投资经验、资产状况等判断是否和自身风险承受能力相适应。基金管理人承诺以诚实信用、谨慎尽责的原则管理和运用基金资产,但不保证基金一定盈利或本金不受损失。科创芯片50ETF属于较高风险等级(R4)产品,适合经客户风险承受等级测评后结果为进取型(C4)及以上的投资者。其余基金属于中等风险等级(R3)产品,适合经客户风险承受等级测评后结果为平衡型(C3)及以上的投资者。请投资者关注指数化投资的风险以及集中投资于SHS云计算指数、科创芯片指数、芯片产业指数成分股的持有风险,请关注部分指数成分股权重较大、集中度较高的风险,请关注指数化投资的风险、ETF运作风险、投资特定品种的特有风险等。云计算ETF汇添富投资范围包括港股,会面临因投资环境、投资标的、市场制度以及交易规则等差异带来的特有风险。文中提及个股仅为指数成份股客观展示列举,本文出现信息只作为参考,投资人须对任何自主决定的投资行为负责。本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议

以上内容与数据,与有连云立场无关,不构成投资建议。据此操作,风险自担。

相关内容

嵌入片区治理的工会服务
“以前搞活动,人手少、资源缺,职工参与度也不高。现在片区协同后,场...
2026-04-23 00:58:58
普联技术取得电源装置及电源...
国家知识产权局信息显示,普联技术有限公司取得一项名为“电源装置及电...
2026-04-23 00:58:39
DCDC 电源拓扑详解,硬...
做硬件设计,电源是绕不开的话题。不管你画什么板子,总得给芯片供电。...
2026-04-23 00:58:15
绿电领跑全省 辽宁新能源装...
来源:央视新闻 辽宁目前火电装机容量接近4200万千瓦,4月20日...
2026-04-23 00:58:01
智能恒电位仪-传统恒电位仪...
2026年,阴极保护领域正在经历一场静默而彻底的更替。传统恒电位仪...
2026-04-23 00:57:34
ABB申请极柱部件专利,用...
国家知识产权局信息显示,ABB瑞士股份有限公司申请一项名为“极柱部...
2026-04-23 00:57:21
爱思开海力士申请调整电源电...
国家知识产权局信息显示,爱思开海力士有限公司申请一项名为“调整电源...
2026-04-23 00:57:10

热门资讯

DCDC 电源拓扑详解,硬件电... 做硬件设计,电源是绕不开的话题。不管你画什么板子,总得给芯片供电。很多人会用DCDC芯片,照着参考电...
绿电领跑全省 辽宁新能源装机规... 来源:央视新闻 辽宁目前火电装机容量接近4200万千瓦,4月20日,随着铁岭昌图润航50万千瓦项目的...
ABB申请极柱部件专利,用于测... 国家知识产权局信息显示,ABB瑞士股份有限公司申请一项名为“极柱部件”的专利,公开号CN121831...
超导概念板块4月20日涨3.0... 证券之星消息,4月20日超导概念板块较上一交易日上涨3.04%,中天科技领涨。当日上证指数报收于40...
三星LG联手攻坚CPO!半导体... 据ETNews,三星电机和LG Innotek已启动合作,开始评估在半导体基板上实现CPO所需的原型...
从华强北柜台到千亿存储帝国:蔡... 文|投资者网 2026年4月14日,深圳股市迎来了一个历史性时刻——国内存储芯片三大龙头江波龙、佰...
为智慧影像而生:华为Pura ... IT之家 4 月 20 日消息,华为 Pura 系列及全场景新品发布会正在进行中。华为常务董事、产品...
AI芯片流片与先进封装共振,驱... 截至2026年4月20日收盘,上证科创板芯片指数(000685)强势上涨1.60%,成分股沪硅产业上...
浙江瑞坦数字能源申请具有测温功... 国家知识产权局信息显示,浙江瑞坦数字能源有限公司申请一项名为“一种具有测温功能的电的开关”的专利,公...
示波器厂家选型指南:适配电子制... 示波器作为电子测量领域的关键工具,广泛应用于电子制造、科研、高校等多个领域。在选择示波器相关产品和服...