10月29日消息,亚马逊云科技宣布,Amazon Nova Multimodal Embeddings多模态嵌入模型现已在Amazon Bedrock上线,这是一款专为Agentic RAG与语义搜索应用打造的顶尖多模态嵌入模型。该模型是首个通过单一模型支持文本、文档、图像、视频与音频的统一嵌入模型,能以行业顶尖的准确率实现跨模态检索。
Amazon Nova多模态嵌入模型提供四种输出维度选项:3072、1024、384和256。输出维度越大,生成的表征信息则越详细,但也需要占用更多的存储空间和计算资源。相反,输出维度越小,则能在检索性能与资源效率之间实现更实用的平衡。这种灵活性可帮助用户根据具体应用场景和成本需求进行优化。 该模型能处理较长的上下文内容。
对于文本输入,它单次可处理多达8192个tokens;对于视频和音频输入,支持处理长达30秒的片段,且能对更长的文件进行分段处理。在处理大型媒体文件时,这种分段能力尤为实用——模型会将文件拆分为易于处理的片段,并为每个片段生成嵌入向量。
该模型包含集成了内置于Amazon Bedrock的负责任的AI功能。提交用于生成嵌入向量的内容会经过Amazon Bedrock内容安全过滤器的检测,同时模型还内置公平性措施以减少偏差。
该模型可通过同步和异步API调用。同步API适用于需要即时响应的实时应用场景,例如在搜索界面中处理用户查询;异步API则能更高效地处理对延迟不敏感的工作负载,因此更适合处理视频等大型内容。(果青)