News

PPIO上线MiniMax-M1-80k：全球首个开源大规模混合架构推理模型

Saiki

17 Jun 2025 — 5 min read

今天，PPIO 首发上线 MiniMax-M1，这是全球首个开源大规模混合架构的推理模型。

MiniMax-M1 采用混合专家（MoE）架构，并结合闪电注意力机制。该模型总共包含 4560 亿个参数，每个令牌激活了 459 亿个参数。M1 模型原生支持 100 万个令牌的上下文长度，是 DeepSeek R1 上下文大小的 8 倍。同时MiniMax-M1 结合 CISPO 算法与混合注意力设计的高效强化学习训练，在长输入推理与真实软件工程场景中实现了业界领先的性能。

因为相对高效的训练和推理算力使用，该模型可以以业内最低的价格提供 API 服务。PPIO 平台的 MiniMax M1-80k 价格为：输入￥4/百万 tokens，输出￥16/百万 tokens，上下文窗口为128k。

快速体验入口：

https://ppio.cn/llm/minimaxai-minimax-m1-80k

第三方平台集成 API：

https://ppio.cn/docs/third-party/overview

API 开发者文档：

https://ppio.cn/docs/model/llm

# 01

在 PPIO 在线体验 MiniMax M1

M1 在面向生产力的复杂场景中能力是开源模型中的最好一档，超过国内的闭源模型，接近海外的最领先模型，同时又有业内最高的性价比。

在 PPIO 官网，输入提示词：

Create an HTML page with a canvas-based animated particle background. The particles should move smoothly and connect when close. Add a central heading text over the canvas。

生成代码的网页效果如下：

M1 有一个显著的优势是支持目前业内最高的 100 万上下文的输入，跟闭源模型里面的 Google Gemini 2.5 Pro 一样，是 DeepSeek R1 的 8 倍，以及业内最长的 8 万tokens 的推理输出。

于是，我们进行了一番测试，直接让 M1 翻译了一份中文版的 M1 的技术报告，点击查看：

https://ppio-cloud.feishu.cn/wiki/SeBiwQQIWiNMGOkrNz7c8I1Hnzf?from=from_copylink

# 02

在第三方平台接入 PPIO API

目前 PPIO 支持在 20+ 主流平台中调用平台模型，具体包括：

通用对话客户端：CherryStudio、Chatbox、LobeChat、Nextchat、ChatHub、
通用 AI 助手：OpenManus、UI-TARS
代码开发工具：Cursor、CLINE
开发/ API 平台：Dify、OneAPI、RAGFlow、FastGPT
生产力套件集成：Word、WPS Office AI，这些是办公软件集成AI功能。
智能翻译工具：沉浸式翻译、欧路词典、流畅阅读、沉浸式导读。
知识管理工具：思源笔记、Obsidian、AnythingLLM

我们以 Cherry Studio 为例接入PPIO API。

（1）获取并保存【 API key 】、【 Base URL 】和【模型名称】

注册并登录 PPIO，然后打开 API 密钥管理页面，点击【创建】按钮，输入自定义密钥名称，生成 API 密钥。

!!!注意：密钥在服务端是加密存储，请在生成时保存好密钥（比如记录在备忘录里）；若遗失密钥，可以在控制台上删除并创建一个新的密钥。

然后到模型广场获取模型名和 Base URL，固定地址为：

https://api.ppinfra.com/v3/openai

（2）在 Cherry Studio 中配置 API 密钥

下载并安装 Cherry Studio，官网地址为：

https://cherry-ai.com/download

打开 Cherry Studio，点击设置，选择【PPIO派欧云】，输入官网生成的 API 密钥。

点击【添加】，填入所需模型名称

minimaxai/minimax-m1-80k。

添加后点击【检测】，选择 MiniMax-M1-80k，会显示检测通过。

回到对话窗口，点击@，选择 MiniMax M1 模型后即可使用。

# 03

API 开发者文档

通过 PPIO 的 API 接口，可以将 LLM API 无缝集成到你的应用程序、工作流或聊天机器人。PPIO 提供多语言 SDK（cURL、Python、JavaScript 等）。

以 Python 为例：

主要特点：

OpenAI 兼容接口：使用 /v3/openai 统一接口，兼容 openai.ChatCompletion 调用方式。
无需部署模型：无需管理模型权重或基础设施，后端完全托管。
输出方式：支持流式和一次性返回

API 开发者文档：

https://ppio.cn/docs/model/llm

PPIO首发上线DeepSeek-V3.1-Terminus

刚刚，PPIO 首发上线 DeepSeek-V3.1 的更新版本 DeepSeek-V3.1-Terminus！该版本的模型输出效果相比前一版本更加稳定。此次更新在保持模型原有能力的基础上，针对用户反馈的问题进行了改进，包括： * 语言一致性：缓解了中英文混杂、偶发异常字符等情况； * Agent 能力：进一步优化了 Code Agent 与 Search Agent 的表现。 “Terminus”源自拉丁语，意为“终点、完结”之意，或许代表了 DeepSeek V3 这一大版本的最终更新，后续的更新或将开启新版本。快速入口： https://ppio.com/llm/deepseek-deepseek-v3.1-terminus 开发者文档： https://ppio.com/docs/model/overview DeepSeek-V3.

PPIO首发上线Qwen3-Next-80B-A3B

今天，阿里通义千问发布了下一代基础模型 Qwen3-Next-80B-A3B，该模型已经首发上线 PPIO！ Qwen3-Next 系列采用了“混合注意力机制”——引入业内前沿的“线性注意力机制”，与经典的“全注意力机制”混搭使用，该架构专为极长上下文和超大规模参数性能而优化。现在，PPIO 上线了 Qwen3-Next-80B-A3B-Instruct 和 Qwen3-Next-80B-A3B-Thinking，其上下文长度为 64k，价格为每百万 tokens 输入，每百万 tokens 输出。前往 PPIO 官网或点击文末阅读原文即可体验，新用户填写邀请码【LYYQD1】注册可得 15 元代金券。 # 01 Qwen3-Next 的架构创新 Qwen3-Next 系列代表了 Qwen 系列下一代的基础模型，专为极长上下文和超大规模参数性能而优化。这一系列引入了一套架构创新，旨在最大化性能的同时最小化计算成本： * 混合注意力（Hybrid Attention）：用

一文看懂2025年Agent六大最新趋势｜AI专栏

2025 年被称为通用 Agent 元年。从 Manus 到各类 Deep Research 产品，掀起了 Agent 热潮。按照 OpenAI 的定义，通往 AGI 之路有五个阶段，而 Agent 正值 L3 阶段。 PPIO AI 专栏基于过去三年模型与 Agent 生态的技术进展，总结了 Agent 行业的最新六大趋势，分别是： 1. 什么是 Agent “套壳”，以及为什么套壳被严重低估 2. Agent 定义：广义的 Agent 面向企业级，狭义的 Agent 面向消费级 3. 代码模型是当前阶段推动 Agent

PPIO姚欣出席首届AI国际人才峰会：AI落地需先找对“钉子”再选好“锤子”

8 月 26 日，由香港投资管理有限公司（下称 “港投公司”）与北京智源人工智能研究院（下称 “智源研究院”）联合主办的首届 “AI 国际人才峰会” 在香港成功举办。香港特别行政区政府财政司司长陈茂波、港投公司行政总裁陈家齐、智源研究院理事长黄铁军等出席并致辞。峰会还汇聚了加拿大皇家科学院院士张大鹏教授、美国国家工程院院士 David Srolovitz 教授、英国皇家工程院院士 Sethu Vijayakumar 教授等全球人工智能领域顶尖专家、海内外青年学者，以及不同产业的 AI 初创企业，共同围绕 AI 前沿技术发展、产业实践以及生态建设展开交流互动。PPIO 联合创始人兼 CEO 姚欣受邀出席峰会并发表题为《从 PPTV 到 PPIO：赋能全球 AI 创业者》的演讲，从自身创业经历出发，同与会者分享 AI 时代创业者所需的特质。