News

PPIO上线Kimi-K2-instruct，参数达1万亿

Saiki

12 Jul 2025 — 3 min read

今天，PPIO 上线 Kimi K2 模型，该模型采用 MoE 架构基础模型，总参数 1T，激活参数 32B。

该模型在代码、Agent、数学推理任务处理上表现突出，在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中，Kimi K2 均取得开源模型中的 SOTA 成绩。

据月之暗面透露，Kimi K2 的预训练阶段使用 MuonClip 优化器，实现万亿参数模型的稳定高效训练。

Kimi K2 模型支持 128k 上下文，价格为输入: ￥4/百万 tokens，输出: ￥16/百万 tokens。

快速体验入口：

https://ppio.com/llm/moonshotai-kimi-k2-instruct

模型特点

Kimi K2 在自主编程（Agentic Coding）、工具调用（Tool Use）和数学推理（Math & Reasoning）三大能力维度性能突出。

（1）代码能力

据月之暗面介绍，在前端开发任务中，Kimi K2 可以生成兼具设计感与视觉表现力的代码。

我们尝试用其生成一个 3D 的银河星系页面，输入提示词：

Create a 3D HTML galactic galaxy that includes both nearby and distant galaxies

将 HTML 代码用网页打开，就得到可这样的效果：

（2）Agent 工具调用能力

Kimi K2 具备复杂指令解析能力，可将需求自动拆解为一系列格式规范、可直接执行的 ToolCall 结构，支持无缝接入 Agent/Coding 框架，完成复杂任务或自动化编码。

你可以前往 PPIO 模型服务用户指南，查看详细接入教程：

https://ppio.com/docs/model/overview

（3）风格化写作能力

Kimi K2 能够准确控制输出风格，模仿不同文风写作，能够同时保留原意和表达风格。

例如，输入指令：模仿鲁迅《阿Q正传》解构网络键盘侠。

PPIO 致力于为企业及开发者提供高性能的模型 API 服务，目前已上线 DeepSeek R1/V3、Qwen3、baidu/ernie-4.5 等系列模型，仅需一行代码即可调用。并且，经过长期实践，PPIO 已经实现大模型推理的 10 倍 + 降本，实现推理效率与资源使用的动态平衡。

PPIO联合张江举办OpenClaw实训营，为200+开发者硬核装机

3月13日下午，PPIO为开发者解锁OpenClaw底层逻辑。

Agent 部署的终极答案？PPClaw 让 OpenClaw 告别“最后一公里”难题

一站式云端 AI 助手，多模型可选.

Qwen3.5重磅发布 PPIO 模型服务平台同步上线

近日，阿里巴巴全新一代大模型千问 Qwen3.5 重磅开源发布，凭借突破性性能登顶全球最强开源模型榜单。 PPIO 模型服务平台在第一时间完成 Qwen3.5-Plus 与 Qwen3.5-397B-A17B 双版本的全面适配与上线，让企业与开发者无需等待，即可率先享受新一代多模态大模型的技术红利。 Qwen3.5 系列模型堪称 “性能与效率的完美平衡体”，总参数3970 亿，激活 170 亿参数即可运转，实现了 “以小胜大” 的技术突破 —— 性能全面超越万亿参数的 Qwen3-Max 模型，同时部署显存占用直降 60%，最大推理吞吐量提升至 19 倍。这一飞跃背后，是其融合线性注意力（Gated Delta Networks）与稀疏混合专家（MoE）的创新架构。作为原生视觉-语言模型，作为原生视觉-语言模型， Qwen3.5-Plus/Qwen3.5-397B-A17B在推理、

PPIO 上线 MiniMax M2.5：体验架构师级编程与高效 Agent 能力

PPIO 上线了 MiniMax M2.5 模型。 MiniMax M2.5 是 MiniMax 发布的最新旗舰模型。据官方介绍，M2.5 在编程、工具调用、搜索及办公等生产力场景中均达到或刷新了行业的 SOTA（State-of-the-art）水平。该模型优化了对复杂任务的拆解能力，大幅提升了运行速度，并凭借极佳的 Token 效率，让无限运行复杂 Agent 在经济上成为可能。现在，你可以到 PPIO 官网体验 MiniMax M2.5 或者调用模型 API。地址： https://ppio.com/llm/minimax-minimax-m2.5 01 模型特征 * 架构师级编程思维，胜任全栈开发 MiniMax