嵌入模型榜单大洗牌:谷歌登顶,阿里开源方案紧追不舍
创始人
2025-07-22 03:09:08
0

谷歌正式将其新的高性能Gemini嵌入模型推向正式商用,目前在备受推崇的大规模文本嵌入基准测试(MTEB)中排名第一。该模型(gemini-embedding-001)现已成为Gemini API和Vertex AI的核心组成部分,使开发者能够构建语义搜索和检索增强生成(RAG)等应用。

虽然第一名的排名标志着强势亮相,但嵌入模型市场竞争异常激烈。谷歌的专有模型正面临强大开源替代方案的直接挑战。这为企业带来了新的战略选择:采用排名第一的专有模型,还是选择性能接近但提供更多控制权的开源挑战者。

谷歌Gemini嵌入模型的核心技术

从本质上讲,嵌入技术将文本(或其他数据类型)转换为数值列表,捕获输入的关键特征。具有相似语义含义的数据在数值空间中的嵌入值更接近。这使得强大的应用超越了简单的关键词匹配,例如构建智能检索增强生成(RAG)系统,为大语言模型提供相关信息。

嵌入技术还可以应用于图像、视频和音频等其他模态。例如,电商公司可能利用多模态嵌入模型为产品生成统一的数值表示,同时融合文本描述和图像信息。

对于企业而言,嵌入模型可以驱动更精确的内部搜索引擎、复杂的文档聚类、分类任务、情感分析和异常检测。嵌入技术也正成为智能体应用的重要组成部分,AI智能体需要检索和匹配不同类型的文档和提示。

Gemini嵌入模型的关键特性之一是其内置的灵活性。它通过俄罗斯套娃表示学习(MRL)技术进行训练,允许开发者获得高度详细的3072维嵌入,同时也可以截断为1536或768等较小尺寸,同时保留最相关的特征。这种灵活性使企业能够在模型准确性、性能和存储成本之间取得平衡,这对于高效扩展应用至关重要。

谷歌将Gemini嵌入模型定位为统一模型,设计为在金融、法律和工程等不同领域"开箱即用",无需微调。这为需要通用解决方案的团队简化了开发流程。该模型支持100多种语言,定价具有竞争力,每百万输入Token收费0.15美元,旨在实现广泛的可访问性。

专有模型与开源挑战者的竞争格局

MTEB排行榜显示,虽然Gemini领先,但差距很小。它面临着OpenAI等成熟模型的挑战,OpenAI的嵌入模型被广泛使用,还有Mistral等专业化挑战者,后者提供专门针对代码检索的模型。这些专业化模型的出现表明,对于某些特定任务,针对性工具可能优于通用工具。

另一个关键参与者Cohere直接瞄准企业市场,推出Embed 4模型。虽然其他模型在通用基准测试中竞争,Cohere强调其模型处理企业文档中常见"噪音现实世界数据"的能力,如拼写错误、格式问题,甚至扫描的手写内容。它还提供虚拟私有云或本地部署,为金融和医疗等受监管行业提供了直接吸引力的数据安全水平。

对专有模型主导地位最直接的威胁来自开源社区。阿里巴巴的Qwen3-Embedding模型在MTEB上仅次于Gemini,并采用宽松的Apache 2.0许可证(可用于商业目的)。对于专注于软件开发的企业,Qodo的Qodo-Embed-1-1.5B提供了另一个令人瞩目的开源替代方案,专门为代码设计,声称在特定领域基准测试中优于更大的模型。

对于已经基于Google Cloud和Gemini模型系列构建的公司,采用原生嵌入模型可以带来多项优势,包括无缝集成、简化的MLOps流水线,以及使用顶级通用模型的保证。

然而,Gemini是一个封闭的、仅API的模型。对于优先考虑数据主权、成本控制或在自有基础设施上运行模型能力的企业,现在在Qwen3-Embedding中有了可信的顶级开源选择,或者可以使用特定任务的嵌入模型之一。

相关内容

深南电路:股东总数4145...
有投资者在互动平台向深南电路提问:“深南电路董秘你好,请问公司截止...
2026-04-14 07:45:54
杰华特获得实用新型专利授权...
证券之星消息,根据天眼查APP数据显示杰华特(688141)新获得...
2026-04-14 07:44:12
埃科光电龙虎榜数据(4月1...
4月13日埃科光电(688610)收盘价110.49元,收盘上涨1...
2026-04-14 07:43:41
三星显示申请电子装置和用于...
国家知识产权局信息显示,三星显示有限公司申请一项名为“电子装置和用...
2026-04-14 07:42:00
创识科技新注册《智慧养老-...
证券之星消息,近日创识科技(300941)新注册了《智慧养老-电子...
2026-04-14 07:41:31
宁德时代获得外观设计专利授...
证券之星消息,根据天眼查APP数据显示宁德时代(300750)新获...
2026-04-14 07:40:34
雷曼光电获得外观设计专利授...
证券之星消息,根据天眼查APP数据显示雷曼光电(300162)新获...
2026-04-14 07:40:10
江丰电子获得实用新型专利授...
证券之星消息,根据天眼查APP数据显示江丰电子(300666)新获...
2026-04-14 07:39:38
新亚电子获得实用新型专利授...
证券之星消息,根据天眼查APP数据显示新亚电子(605277)新获...
2026-04-14 07:39:09

热门资讯

宁德时代获得外观设计专利授权:... 证券之星消息,根据天眼查APP数据显示宁德时代(300750)新获得一项外观设计专利授权,专利名为“...
雷曼光电获得外观设计专利授权:... 证券之星消息,根据天眼查APP数据显示雷曼光电(300162)新获得一项外观设计专利授权,专利名为“...
公募机构最新调研动向 聚焦机器... 4月以来,随着上市公司年报业绩密集披露,公募机构密集调研寻找确定性机会。公募排排网数据显示,4月6日...
宏明电子:公司产品暂未用于PC... 每经AI快讯,有投资者在投资者互动平台提问:公司产品是否可用于PCB相关产业链? 宏明电子(3016...
宏明电子:公司主要收入来源于电... 证券之星消息,宏明电子(301682)04月13日在投资者关系平台上答复投资者关心的问题。 投资者提...
纳力新材申请具有U型金属片的集... 国家知识产权局信息显示,扬州纳力新材料科技股份有限公司申请一项名为“一种具有U型金属片的集流体及其制...
新创界自动化申请气体保护中压开... 国家知识产权局信息显示,成都新创界自动化设备有限公司申请一项名为“一种气体保护中压开关柜的监测方法及...
断电电位测不准?极化探头+智能... 阴极保护系统中,断电电位是判断管道保护效果的核心指标。但实际检测中,通电电位往往“说谎”。 IR降的...
四连阳!科创创业50ETF(5... 上周市场波动虽在,但前期受外部扰动压制较多的双创与科技成长方向表现亮眼。科创创业50ETF招商(58...
港股午评:恒指跌1.18%,科... 美伊谈判破裂,市场风险情绪低迷。港股上午盘三大指数集体下跌,恒指跌1.18%,国指跌0.74%,恒生...