news 2026/2/10 12:48:00

jina-embeddings-v3 现已在 Elastic Inference Service 上可用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
jina-embeddings-v3 现已在 Elastic Inference Service 上可用

作者:来自 Elastic Sean Handley 及 Ranjana Devaji

亲身体验 Elasticsearch:深入了解我们的示例 notebooks,开始免费的 cloud 试用,或立即在本地机器上试用 Elastic。


今天,我们很高兴在 Elastic Inference Service( EIS )上推出 jina-embeddings-v3,使快速的多语言 dense retrieval 能够直接集成到 Elasticsearch 中。jina-embeddings-v3 是首个在 EIS 上可用的 Jina AI 模型,后续还将推出更多模型。

Jina AI 近期通过收购加入 Elastic,是开源多语言和多模态 embeddings、rerankers 以及 small language models 领域的领导者。Jina 在 search foundation models 方面拥有深厚的专业能力,帮助开发者在 text、images、code 以及长篇多语言内容上构建高质量的检索 和 RAG 系统。

Elastic Inference Service( EIS )让开发者能够以可预测、基于使用量的定价方式,轻松为 search、RAG 和 agentic 应用添加快速、高质量且可靠的 semantic retrieval。EIS 提供完全托管的 GPU 推理和开箱即用的 models,无需额外的设置或 hosting 复杂度。

jina-embeddings-v3 支持高质量的多语言 retrieval,具备长上下文推理,并提供针对 RAG 和 agents 的 task-tuned 模式。它为开发者在多种语言中提供快速的 dense embeddings,同时无需承担运维开销。

为什么选择 jina-embeddings-v3?

jina-embeddings-v3 是一个 text embedding 模型,支持 32 种语言和最高 8192-token 的上下文,在更低成本下提供高相关性,并通过 EIS 提供 GPU 驱动的推理。

关键能力

  • 多语言能力:弥合语言差距,在 32 种语言之间对齐语义,包括阿拉伯语、孟加拉语、中文、丹麦语、荷兰语、英语、芬兰语、法语、格鲁吉亚语、德语、希腊语、印地语、印尼语、意大利语、日语、韩语、拉脱维亚语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、斯洛伐克语、西班牙语、瑞典语、泰语、土耳其语、乌克兰语、乌尔都语和越南语。
  • 参数效率:仅使用 570M 参数即可提供更高性能,在更低成本下实现与更大规模、基于 LLM 的 embeddings 相当的效果。
  • 维度控制:默认 1024 维,并支持 Matryoshka 表示法,允许开发者将 embedding 维度一路调低到 32 维,从而根据你的需求在准确率、延迟和存储之间灵活平衡。
  • 任务特定优化:提供任务特定的 Low-Rank Adaptation( LoRA )适配器,使其能够为多种任务生成高质量 embeddings,包括 query-document retrieval、聚类、分类和文本匹配。

开始使用

POST _inference/text_embedding/.jina-embeddings-v3 { "input": ["Rocky Mountain National Park"], "input_type": "ingest" }

该响应:

{ "text_embedding": [ { "embedding": [ -0.06678891, -0.0073341704, 0.011903269, -0.041797, ... ] } ] }

接下来是什么

在这些新 models 的同时,EIS 将持续演进,以支持更多用户,并简化跨环境的 semantic search。

用于EIS 的 Cloud Connect:用于 EIS 的 Cloud Connect 即将把 EIS 带到自托管环境中,降低运维开销,并支持 hybrid 架构和按你最合适方式进行的扩展。

semantic_text 在 EIS 上默认使用 jina-embeddings-v3:semantic_text 目前在后台使用 ELSER 作为 embeddings 模型,但在不久的将来将默认使用 EIS 上的 jina-embeddings-v3 endpoint。这一变化将在数据写入时提供内置推理,使在无需额外配置的情况下更容易采用多语言 search。

更多 models:我们正在扩展 EIS 的 model 目录,以满足客户不断增长的 inference 需求。在接下来的几个月中,我们将推出支持更广泛 search 和 inference 工作负载的新 models。紧随 jina-embeddings-v3 之后,下一个推出的 models 是 jina-reranker-v2-base-multilingual 和 jina-reranker-v3。这两个 Jina AI models 通过多语言 reranking,大幅提升 RAG 和 AI agents 的精度。

总结

通过在 EIS 上使用 jina-embeddings-v3,你可以在无需管理 models、GPUs 或基础设施的情况下,构建多语言、高精度的 retrieval pipelines。你可以获得快速的 dense retrieval,并与 Elasticsearch 的 relevance stack 紧密集成,全部集中在一个平台中。

无论你是在构建全球化的 RAG 系统、search,还是需要可靠 context 的 agentic workflows,Elastic 现在都为你提供了开箱即用的高性能 model,以及从 prototype 顺利走向 production 的运维简化能力。

所有 Elastic Cloud 试用都可以访问 Elastic Inference Service。现在就在 Elastic Cloud Serverless 和 Elastic Cloud Hosted 上试用。

原文:https://www.elastic.co/search-labs/blog/jina-embeddings-v3-elastic-inference-service

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/7 5:28:46

LeaguePrank终极指南:安全美化英雄联盟游戏界面

LeaguePrank终极指南:安全美化英雄联盟游戏界面 【免费下载链接】LeaguePrank 项目地址: https://gitcode.com/gh_mirrors/le/LeaguePrank 想要在英雄联盟中拥有与众不同的游戏体验吗?LeaguePrank这款基于LCU API的美化工具,让你在完…

作者头像 李华
网站建设 2026/2/10 5:31:59

AI姿态识别部署教程:支持33个关键点的轻量级方案

AI姿态识别部署教程:支持33个关键点的轻量级方案 1. 引言:为什么需要轻量级姿态识别? 随着AI在健身指导、动作捕捉、虚拟试衣和人机交互等领域的广泛应用,人体姿态估计(Human Pose Estimation)已成为计算…

作者头像 李华
网站建设 2026/2/7 13:46:14

AI人体骨骼检测多场景落地:医疗康复评估系统搭建教程

AI人体骨骼检测多场景落地:医疗康复评估系统搭建教程 1. 引言:AI 人体骨骼关键点检测的现实价值 随着人工智能在计算机视觉领域的深入发展,人体姿态估计(Human Pose Estimation)正逐步从实验室走向真实世界的应用场景…

作者头像 李华
网站建设 2026/2/4 8:56:32

CCS内存占用分析:一文说清堆栈溢出检测技巧

深入CCS内存管理:教你精准识别与防御堆栈溢出在嵌入式开发的世界里,“程序跑着突然复位”、“Hard Fault莫名其妙触发”、“中断一多就死机”——这些令人头疼的问题,背后往往藏着一个共同的元凶:堆栈溢出。尤其是在使用TI的Code …

作者头像 李华
网站建设 2026/2/6 17:46:02

5分钟极致美化:TranslucentTB让你的Windows任务栏焕然一新

5分钟极致美化:TranslucentTB让你的Windows任务栏焕然一新 【免费下载链接】TranslucentTB 项目地址: https://gitcode.com/gh_mirrors/tra/TranslucentTB 厌倦了千篇一律的Windows任务栏吗?想要打造个性化桌面却担心系统资源占用?透…

作者头像 李华
网站建设 2026/2/8 7:38:42

XUnity游戏翻译插件终极指南:架构深度解析与技术实现

XUnity游戏翻译插件终极指南:架构深度解析与技术实现 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 在全球化游戏生态中,语言壁垒始终是玩家体验完整游戏内容的最大障碍。XUnity …

作者头像 李华