Trainium3:3nm AI芯片破解算力瓶颈
创始人
2025-12-06 16:37:26
0

re:Invent2025大会上,针对AI模型规模扩大带来的算力需求,亚马逊云科技推出首款3nm制程的Trainium3 AI芯片,并基于其打造Amazon EC2 Trainium3 UltraServersTrn3 UltraServers),现已正式可用。

Trainium3 AI芯片 通过先进的设计创新、用于加速芯片间数据传输的优化互连结构以及能够在处理大型 AI 模型时消除瓶颈的增强型内存系统,实现了突破性的性能提升。除了性能增长之外, Trainium3 实现显著的节能效果,与前几代相比能效提升 40% ,在大规模部署中尤为关键,从而能够提供更具成本效益的 AI 基础设施,同时降低数据中心的整体能耗与环境影响。

与上一代相比,Trn3 UltraServers计算性能提升4.4倍,能效提升4倍,内存带宽提升近4倍,单系统可集成144颗芯片,总算力达362 FP8 PFLOPs

在实际场景中,Trainium3展现出强劲效能:运行OpenAI开源模型GPT-OSS时,单芯片吞吐量提升3倍,响应速度加快4倍,可将模型训练周期从数月缩短至数周。AnthropicRicoh等客户已通过Trainium系列将训练与推理成本降低50%Amazon Bedrock也已在Trainium3上运行生产级工作负载。

Trainium3的算力突破需匹配低延迟网络才能释放最大价值,亚马逊云科技通过垂直集成的网络架构,为分布式AI计算打通了数据流动通道。

网络升级:构建无延迟的算力协同体系

分布式AI计算的通信瓶颈是行业共性难题,亚马逊云科技通过垂直集成的网络基础设施给出解决方案。Trn3 UltraServers搭载全新NeuronSwitch-v1与增强型Neuron Fabric网络,前者使单台服务器带宽提升2倍,后者将芯片间通信延迟降至不足10微秒。

这种低延迟、高带宽的网络架构,为 agent 系统、 MoE 架构等未来 AI 工作负载提供了数据流动保障,使实时决策系统、无延迟对话式 AI 等此前难以实现的应用成为可能。对于规模化需求, EC2 UltraClusters 3.0 可连接数千台 UltraServer ,最多搭载 100 万颗 Trainium 芯片,规模较上一代提升 10 倍,能够支撑万亿 token 级数据集上的多模态模型训练,或为数百万并发用户提供实时推理服务。

未来布局:Trainium4开启跨架构协同

亚马逊云科技已经着手研发下一代Trainium4,其设计目标是在各项性能指标上实现显著提升,包括至少6倍的FP4处理性能、3倍的FP8性能以及4倍的内存带宽,以支撑下一代前沿模型的训练与推理需求。随着硬件与软件的持续优化,最终的整体性能提升将远高于这些芯片参数本身的提升幅度。

Trainium4在 FP8 性能上的 3 倍提升是一次基础性飞跃,使 AI 模型的训练速度至少提升 3 倍,或处理至少 3 倍的推理请求,并可通过持续的软件增强与特定工作负载优化获得更多额外加速。 FP8 作为行业标准的精度格式,能够在现代 AI 工作负载中平衡模型准确性与计算效率。

扩展性革新成为核心亮点:Trainium4将支持NVIDIA NVLink Fusion技术,实现与Graviton CPUElastic Fabric AdapterEFA)在通用MGX机架内的无缝协作,构建兼容GPUTrainium服务器的机架级AI基础设施,兼顾灵活性与高性能,为高要求AI工作负载提供优化平台。

从芯片到网络,从当前产品到未来布局,Peter DeSantis的分享勾勒出亚马逊云科技的基础设施革新逻辑:以全栈优化打破性能瓶颈,以定制化设计降低运营成本,最终让不同规模的企业都能以更低门槛获取AI时代的核心算力。

相关内容

2026年知名的感应式稳压...
在众多电气设备中,感应式稳压器因其能有效应对电网电压波动,为各类电...
2026-03-03 23:40:25
原创 ...
2026年3月2日,也就是今年MWC开幕的第一天,高通便发布了多款...
2026-03-03 23:40:12
原创 ...
史上最猛手机涨价潮来了! 据报道,自2026年3月起,中国手机市...
2026-03-03 23:40:06
美国内存芯片公司股价在早盘...
每经AI快讯,3月3日,美光科技(Micron Technolog...
2026-03-03 23:39:23
大族数控取得电路板超短槽孔...
国家知识产权局信息显示,深圳市大族数控科技股份有限公司取得一项名为...
2026-03-03 23:39:20
大普微电子取得数据写入保护...
国家知识产权局信息显示,深圳大普微电子股份有限公司取得一项名为“数...
2026-03-03 23:39:17
北方华创申请半导体工艺设备...
国家知识产权局信息显示,北京北方华创微电子装备有限公司申请一项名为...
2026-03-03 22:43:49
苹果推出新款MacBook...
3月3日,苹果官网发布新款MacBook Air,搭载M5芯片,提...
2026-03-03 22:43:40
国显光电取得显示面板及其制...
国家知识产权局信息显示,昆山国显光电有限公司取得一项名为“显示面板...
2026-03-03 22:43:37

热门资讯

电子科大科技园(天府园)︱集成... 园区概况:电子科大科技园(天府园)是推动电子科技大学科技成果转化、创业企业孵化、创新创业人才培养的科...
洛丁光电申请基于时空索引的智慧... 国家知识产权局信息显示,深圳市洛丁光电有限公司申请一项名为“基于时空索引的智慧路灯传感器数据查询方法...
3月3日科泰电源跌9.21%,... 证券之星消息,3月3日科泰电源(300153)跌9.21%,收盘报35.08元,换手率10.71%,...
国科微申请检测电路及信号检测方... 国家知识产权局信息显示,湖南国科微电子股份有限公司申请一项名为“检测电路及信号检测方法”的专利,公开...
加华电子取得基于微磁传感器阵列... 国家知识产权局信息显示,朝阳市加华电子有限公司取得一项名为“一种基于微磁传感器阵列组合的探测和定位方...
格伏恩新能源取得储能系统电池模... 国家知识产权局信息显示,深圳市格伏恩新能源科技有限公司取得一项名为“一种储能系统电池模组的采样结构”...
【投融资动态】中砥半导体Pre... 证券之星消息,根据天眼查APP于3月1日公布的信息整理,中砥半导体(江苏)有限公司Pre-A轮融资,...
半导体设备板块高开低走,半导体... 截至收盘,中证云计算与大数据主题指数下跌4.3%,中证芯片产业指数下跌5.6%,中证半导体材料设备主...
多层pcb快板定做哪家技术强?... 在高速发展的电子行业,产品迭代周期不断缩短,研发阶段的“时间窗口”变得尤为珍贵。对于工程师和采购决策...
伊控动力取得降低杂感的叠层母排... 国家知识产权局信息显示,浙江伊控动力系统有限公司取得一项名为“一种降低杂感的叠层母排结构”的专利,授...