PPIO上线Qwen3-Embedding系列模型

PPIO上线Qwen3-Embedding系列模型

今天,PPIO 已上线 Qwen3-Embedding 系列模型!

Qwen3-Embedding 系列模型是 Qwen 模型家族的新成员。该系列模型专为文本表征、检索与排序任务设计,基于 Qwen3 基础模型进行训练,充分继承了 Qwen3 在多语言文本理解能力方面的优势。

Qwen3-Embedding 系列模型并非 chat 模型,需要通过 API 调用。现在,您可以到 PPIO 官网接入 API 进行体验。

PPIO 登录地址:

https://ppio.cn/?utm_source=official_wechat

如果你是新用户,填写邀请码【N7EUVY】注册还可以得 15 元代金券。此外,通过你的专属邀请码每成功邀请一位好友并完成实名认证,还可以额外获得 30 元代金券。

你还可以在 Bilibili 网站上搜索【PPIO派欧云】查收关于最新的 Embedding 模型的视频教程。


# 01

什么是 Embedding 模型?

Embedding 模型是一种将离散的符号(如单词、句子、图像等)映射到连续的向量空间中的模型。在自然语言处理(NLP)领域,它通常用于将单词或句子转换为向量形式,以便计算机能够更好地处理和理解语言信息。

训练 Embedding 模型的目标是使相似的符号在向量空间中更接近,不相似的符号更远离。例如“苹果”和“香蕉”两个单词,一个好的文本 Embedding 模型会把它们编码成两个接近的向量。这样,AI 系统就可以通过“向量距离”来判断语义相似性。

Embedding 模型常见的应用场景包括:

语义搜索/RAG:用户提问后,先用向量查找相关文本,再送入大模型回答;

推荐系统:将用户和物品编码成向量,进行向量匹配;

多模态检索:输入一段文字,返回相关图片或视频;

聚类/去重/相似性判断:快速找出文本之间的相似程度。

今天上线的 Qwen3-Embedding 系列模型有两个系列:Qwen3-Reranker(文本重排序) 和 Qwen3-Embedding(文本嵌入)。

Qwen3-Embedding 系列提供从 0.6B 到 8B 参数规模的 3 种模型配置,以满足不同场景下的性能与效率需求。开发者可以灵活组合表征与排序模块,实现功能扩展。

此外,模型支持以下定制化特性:

表征维度自定义:允许用户根据实际需求调整表征维度,有效降低应用成本;

指令适配优化:支持用户自定义指令模板,以提升特定任务、语言或场景下的性能表现。

Qwen3-Embedding 系列在多个下游任务评估中达到行业领先水平。其中,8B 参数规模的 Embedding 模型在 MTEB 多语言 Leaderboard 榜单中位列第一(截至 2025 年 6 月 6 日,得分 70.58),性能超越众多商业 API 服务。此外,该系列的排序模型在各类文本检索场景中表现出色,显著提升了搜索结果的相关性。

Qwen3-Embedding 系列支持超过 100 种语言,涵盖主流自然语言及多种编程语言。该系列模型具备强大的多语言、跨语言及代码检索能力,能够有效应对多语言场景下的数据处理需求。


# 02

在 Cherry Studio 接入PPIO 的 Qwen3-Embedding

由于 Qwen3-Embedding 系列模型并非 chat 模型,需要通过 API 调用。我们以 Cherry Studio 为例进行接入。

(1)获取并保存【 API key 】、【 Base URL 】和【模型名称】

注册并登录 PPIO,然后打开 API 密钥管理页面,点击【创建】按钮,输入自定义密钥名称,生成 API 密钥。

!!!注意:密钥在服务端是加密存储,请在生成时保存好密钥(比如记录在备忘录里);若遗失密钥,可以在控制台上删除并创建一个新的密钥。

PPIO 登录地址为:

https://ppio.cn/?utm_source=official_wechat

然后到模型广场获取模型名和 Base URL,固定地址为:

https://api.ppinfra.com/v3/openai

(2)在 Cherry Studio 中集成 API

下载并安装 Cherry Studio,官网地址为:

https://cherry-ai.com/download

打开 Cherry Studio,点击设置,选择【PPIO派欧云】,输入官网生成的 API 密钥。

点击【添加】,填入所需模型名称。

在导航栏左侧点击知识库并添加,自定义名称后,下拉嵌入模型,会看到刚刚添加的 Qwen3-Embedding-8B 模型,将其添加。

然后上传本地文档,这样一个本地知识库就搭建好了。

回到对话页面,选择刚刚构建的知识库,并点击 @ 添加一个模型。

输入问题,就可以通过本地知识库进行回答了。


热门三方平台集成

PPIO 支持在 20+ 主流平台中调用平台模型。

通用对话客户端:Cherrystudio、LobeChat、Nextchat、ChatHub、Chatbox

代码开发工具:Cursor、CLINE

开发/ API 平台:Dify、OneAPI、RAGFlow、FastGPT

生产力套件集成:Word、WPS Office AI,这些是办公软件集成AI功能。

智能翻译工具:沉浸式翻译、欧路词典、流畅阅读、沉浸式导读。

知识管理工具:思源笔记、Obsidian、AnythingLLM

详细教程:

https://ppio.cn/docs/third-party/overview

Read more

PPIO首发上线Kimi K2.7 Code,Kimi最智能的Coding模型

PPIO首发上线Kimi K2.7 Code,Kimi最智能的Coding模型

PPIO 已上线Kimi K2.7 Code,这是 Kimi 迄今最智能的 Coding 模型。 Kimi K2.7 Code 是一个以编码为中心的智能体模型,在长上下文中更可靠地遵循指令,能以更高的成功率完成编程任务,同时支持文本、图片与视频输入,思考模式,对话与 Agent 任务。 相比K2.6 ,Kimi K2.7 Code 大幅改善了在长程任务中的过度思考倾向,平均 token 消耗减少 30%。 其主要特点如下: 长程编码能力突破:Kimi K2.7 Code 作为国内领先的 Coding 模型,在长程代码任务中的表现取得了突破,面对不同编程语言(如 Rust、Go、Python)和任务场景(

By luigi
PPIO登上贵州新闻联播,深化AI算力生态建设

PPIO登上贵州新闻联播,深化AI算力生态建设

近日,PPIO 接受贵州新闻联播《高质量发展调研行》栏目的专题采访,相关报道在贵州卫视播出。 PPIO 作为面向开发者和企业的 Agentic Cloud 云计算平台,积极参与贵州 AI 算力生态建设,借助算力券政策进一步降低用户使用门槛,助力 AI 推理、智能体开发等 AI 业务的规模化落地。 本次合作也是 PPIO 在 AI 云服务领域持续投入所积累的市场认可。政策引力与产业实力的双向契合,正在加速数字经济新动能的形成。 算力政策落地,PPIO 积极参与 AI 算力生态建设 当前,大模型推理、AI 原生应用与智能体开发等 AI 需求爆发式增长,算力的使用与维护成本居高不下,成为众多企业和开发者的核心痛点。 贵州依托国家“东数西算”枢纽节点优势,创新推出“算力券”补贴政策,通过财政直补方式降低企业算力使用成本。政策自推出以来已迭代至 3.

By luigi
PPIO亮相华为云创想者大会:以Agentic Cloud加速中国AI走向全球

PPIO亮相华为云创想者大会:以Agentic Cloud加速中国AI走向全球

近期,PPIO 受邀参加 2026 华为云 INSPIRE 创想者大会。 PPIO MaaS 平台产品专家谢晋发表主题演讲《PPIO MaaS平台如何加速中国 AI 走向全球》,从全球视角系统阐述了中国 AI+Token 出海的两大核心维度、热门出海场景以及 PPIO 的 Agentic Cloud 基础设施战略布局。 PPIO 以两大核心引擎为 AI 原生应用与智能体开发提供基础设施服务:全模态 MaaS 平台,提供一站式算力与模型服务;Agent 沙箱,提供智能体安全隔离的云端运行环境。 截至 2026 年 4 月,PPIO 整合了全球 4800+ 分布式算力节点,日均 Token 调用量超过 10000 亿,较

By luigi
PPIO上线MiniMax M3:限时7天5折优惠

PPIO上线MiniMax M3:限时7天5折优惠

作为 MiniMax 官方 MaaS 合作伙伴,PPIO 已首发上线 MiniMax M3 模型。 MiniMax M3 在编程和智能体等专业任务上达到了前沿的能力,最高支持 1M 超长上下文,也是一个原生多模态模型,支持图片和视频的输入,并能操作电脑桌面。 在衡量 Coding 能力的 SWE-Bench Pro 上,MiniMax M3 超过 GPT-5.5 和 Gemini 3.1 Pro,接近 Opus 4.7。 在综合评估 SVG 生成性能的基准 SVG-Bench 上,MiniMax M3 超过 Opus 4.7。

By PPIO