国家知识产权局信息显示,北京衔远有限公司申请一项名为“融合检索与大模型蒸馏的嵌入数据合成方法、装置及介质”的专利,公开号CN121365670A,申请日期为2025年12月。
专利摘要显示,本申请提供一种融合检索与大模型蒸馏的嵌入数据合成方法、装置及介质。该方法包括:对垂直领域的非结构化文档进行预处理,将非结构化文档划分为具有层级关联关系的多粒度文本块;基于多粒度文本块组合形成上下文,将垂直领域先验知识对应的扰动信息注入上下文,调用生成模型根据上下文生成检索查询,并确定与检索查询对应的目标文本块作为初始正样本;根据文本块之间的关联关系过滤假负样本文本块,形成正样本集合和负样本集合;构建对比学习训练样本,利用对比学习训练样本训练语义表征模型,以生成用于检索任务的嵌入向量。本申请能够提高检索任务构造效率及真实性、提升正样本覆盖完整性、增强对比学习训练稳定性与检索精度。
天眼查资料显示,北京衔远有限公司,成立于2021年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2480万美元。通过天眼查大数据分析,北京衔远有限公司参与招投标项目3次,财产线索方面有商标信息67条,专利信息48条,此外企业还拥有行政许可2个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯