2025年圣诞节前夕,一则来自海外的并购消息在半导体行业激起涟漪。英伟达拟以约200亿美元,收购高性能AI加速芯片初创公司Groq的部分核心技术资产,并引入其关键工程团队,以强化在AI推理领域的布局。在行业同样快速变化和发展的中国,也有这样一个团队,在更早的2018年便有了类似的洞见和研判,并以此为契机,创立了瀚博半导体。“当时我们就确认:AI训练芯片市场固然很大,但具有更大爆发力的是云端AI推理。”近日,瀚博半导体创始人兼CEO钱军接受上海证券报记者采访,详细解析了其投资AI推理市场的逻辑及远大前景。
上证报中国证券网讯(记者 李兴彩)2025年圣诞节前夕,一则来自海外的并购消息在半导体行业激起涟漪。据公开信息显示,英伟达拟以约200亿美元,收购高性能AI加速芯片初创公司Groq的部分核心技术资产,并引入其关键工程团队,以强化在AI推理领域的布局,并帮助英伟达覆盖更广泛的AI推理和实时工作负载。英伟达这一举动,被业内普遍视为一个清晰信号:AI算力的重心,正在从“训练为王”转向“推理为先”。当大模型逐步走向规模化应用,实时、低成本、可部署的推理能力,正成为新的竞争焦点。
在行业同样快速变化和发展的中国,也有这样一个团队,在更早的2018年便有了类似的洞见和研判,并以此为契机,创立了瀚博半导体。
“当时我们就确认:AI训练芯片市场固然很大,但具有更大爆发力的是云端AI推理。”近日,瀚博半导体创始人兼CEO钱军接受上海证券报记者采访,详细解析了其投资AI推理市场的逻辑及远大前景。

钱军强调,AGI(通用人工智能)时代,AI大模型应用对“云端AI推理+云端渲染”产生海量的需求,这个市场不仅很大,还是蓝海。
钱军和张磊(公司联合创始人兼CTO)的超前研判,源于其个人深厚专业积累。作为全球第一颗7纳米GPU设计量产的带头人、AMD前高管,钱军拥有近30年的高端芯片设计经验。而作为AMD院士(AMD FELLOW),张磊在芯片领域也有超过25年的经验,拥有超过50项核心专利和在途专利。
展望即将爆发的AI推理“蓝海”市场。钱军强调,瀚博已领先业界,推出SV和SG两大系列AI推理和渲染芯片,并在国内几乎所有头部互联网公司和多家运营商实现商业化落地。未来,公司将继续秉持初心,专注AI推理市场和商业化落地,为数字和像素世界提供浩瀚算力,争做全球AI推理芯片的领导者。
破局:锚定算力拐点 重塑产业格局
在GPU行业,“生态”往往是一道绕不开的门槛。成熟的软件工具链、开发者社区和算子优化,使英伟达在训练领域形成了极深的护城河。
但在AI推理领域,情况有所不同。相比训练,推理任务更贴近具体场景,对延迟、功耗、成本和稳定性更为敏感;其算子集合相对收敛,也更容易围绕特定负载进行深度优化。
“这意味着,硬件架构与软件算法协同设计,可以真正转化为客户可感知的价值。”钱军说。也正因如此,瀚博选择将资源高度集中,而非追逐全赛道。公司将第一款产品定位于视频处理与AI加速,一个对实时性要求极为苛刻的领域并全情投入研发,首颗芯片即做到回片后8分钟成功点亮。
“瀚博的SV系列芯片在深度学习推理等特定场景下,数据吞吐速度可达到通用GPU的2倍,且带宽要求更低。另外公司产品目前是国内少数原生支持FP8大模型推理的产品。”钱军介绍。以云端渲染建立技术和市场领先身位后,瀚博又凭借SG系列全功能GPU,在云手机、AI Agent云底座、云游戏、云桌面等云端渲染应用领域取得突破性成果,成为互联网和运营商的“首选方案”,这也意味着,公司的超低延时渲染等技术及生态适配,获得了顶级客户认可,为公司加速发展奠定了坚实基础。
“客户真正关心的,并不是某一项指标领先多少,而是整体方案是否可靠、是否划算、是否能规模化部署。”钱军说,“我们卖的不是芯片,是可落地的、具有高性价比的解决方案。”钱军强调,AI训练芯片的重点是“能不能”,AI推理芯片的诉求点则是“是不是划算”;AI推理客户需要的是真正高性价比的产品和服务。
进阶:致远推理征程 攀登算力芯峰
半导体行业从不缺乏宏大叙事,但真正决定企业能走多远的,往往是对时间的理解。
“我们并不认为自己已经站在终点。”钱军说,“如果说瀚博有什么优势,可能只是更早意识到,这是一场长跑。”
谈及AI推理芯片发展趋势,钱军预测,“2027年或是国产AI推理芯片规模化替代的关键节点,到2030年则有望在主流场景全面站稳脚跟。”
钱军表示,现在,瀚博实现了市场化成功与云端渲染领先地位,产品及解决方案在关键场景实现规模化商业落地;未来,瀚博希望成为全球AI推理芯片领域的领导者。