智谱发布GLM-4.6,联手寒武纪,摩尔线程推出模型芯片一体解决方案
创始人
2025-10-01 12:03:09
0

9月30日,国产大模型“六小龙”之一的智谱发布GLM-4.6新模型。

作为GLM系列最新版本,GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面能力有所提升。

官方信息显示,此次升级表现在公开基准与真实编程任务中,GLM-4.6代码能力对齐Claude Sonnet 4;上下文窗口由128K提升至200K,适应更长的代码和智能体任务;新模型提升推理能力,并支持在推理过程中调用工具;搜索方面增强模型的工具调用和搜索智能体。

另外,“模芯联动”是此次新模型发布的重点,GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部署,这也是行业首次在国产芯片上投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,降低推理成本,为国产芯片在大模型本地化运行上探索可行路径。

FP8是8位浮点数(Floating-Point 8)数据类型,动态范围广、精度损失小;Int4是4 位整数(Integer 4)数据类型,压缩比极高,内存占用最少,适配低算力硬件但精度损失相对明显。此次尝试的“FP8+Int4 混合” 模式,并非简单将两种格式叠加,而是根据大模型的“模块功能差异”,针对性分配量化格式,让该省内存的地方用Int4压到极致,该保精度的地方用FP8守住底线,实现合理资源分配。

具体到模型适配过程中,占总内存的60%-80%的大模型核心参数通过Int4量化后,可将权重体积直接压缩为FP16的1/4,大幅降低芯片显存的占用压力;推理环节积累的临时对话数据可以通过Int4压缩内存的同时,将精度损失控制在 “轻微”范围。而FP8可重点针对模型中“数值敏感、影响推理准确性”的模块,降低精度损失、保留精细语义信息。

除了寒武纪,摩尔线程已基于vLLM推理框架完成对GLM-4.6 的适配,新一代GPU可在原生FP8精度下稳定运行模型,验证MUSA架构及全功能GPU在生态兼容性和快速适配能力方面的优势。

寒武纪与摩尔线程此番完成对GLM-4.6的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的 AI 技术生态。接下来,GLM-4.6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务。

相关内容

禾工CT-1PLUS电位滴...
近日,上海禾工科学仪器有限公司再传佳讯。经过严格的技术验证与商务沟...
2025-10-11 18:05:36
全球首颗!复旦大学研发全球...
记者日前从复旦大学获悉,该校集成芯片与系统全国重点实验室、集成电路...
2025-10-11 18:05:20
电解电容2200uf能供多...
电容供电的基本原理 电解电容通过储存电荷实现电能供应,其容量22...
2025-10-11 18:05:05
增值电信业务经营许可电子证...
本文转自【央视新闻客户端】; 记者从工业和信息化部了解到,我国将全...
2025-10-11 18:04:00
原创 ...
此前有网友反馈称,自己的 iPhone 17 Pro Max 机型...
2025-10-11 17:34:47
4年累亏近7亿元,照明龙头...
10月9日晚间,时空科技(SH605178,股价35.83元,市值...
2025-10-11 17:34:31
深圳市德心电子科技有限公司...
天眼查App显示,近日,深圳市德心电子科技有限公司成立,法定代表人...
2025-10-11 17:34:22
工信部:增值电信业务经营许...
据央视新闻消息,记者从工业和信息化部了解到,我国将全面推广增值电信...
2025-10-11 17:34:17

热门资讯

电解电容2200uf能供多久?... 电容供电的基本原理 电解电容通过储存电荷实现电能供应,其容量2200μF代表电荷存储能力。但电容并...
SB-3T传感器 【广州兰瑟★电子-杨工】提供英国OAP SB-3t称重传感器堪称工业测量领域的精密"天平",其卓越性...
安仁县丽虹易通电子中心(个体工... 天眼查App显示,近日,安仁县丽虹易通电子中心(个体工商户)成立,法定代表人为周丽红,注册资本2万人...
如何延长铝电解电容寿命? 铝电解电容寿命受温度、电压、机械应力及环境因素影响显著,以下是专家分享的3大维护技巧,结合工程实践与...
永州市顺宜建电子加工有限公司成... 天眼查App显示,近日,永州市顺宜建电子加工有限公司成立,法定代表人为刘云辉,注册资本5万人民币,经...
亨通光电中标:2025年光电线... 证券之星消息,根据天眼查APP-财产线索数据整理,根据中华人民共和国工业和信息化部原材料工业司10月...
上海:加快培育硅光、6G、第四... 上海今日召开市政府新闻发布会,介绍最新出台的《关于加快推动前沿技术创新与未来产业培育的若干措施》。上...
传苹果将先推出搭载M5芯片的M... 苹果公司计划在高端M5 Pro和M5 Max芯片机型发布之前,率先推出搭载标准M5芯片的基础款Mac...
原创 应... 导语:A股“储能一哥”能否在高负债与价格战中继续领跑新能源赛道? 摘要: 1、业绩三年大增:2022...
化工储罐底部钢板的电流腐蚀保护... 针对化工储罐底部钢板的电流保护方案,采用恒电位仪配合辅助阳极的外加电流阴极保护法是科学且高效的选择。...