PPIO上线Kimi-K2-instruct,参数达1万亿

PPIO上线Kimi-K2-instruct,参数达1万亿

今天,PPIO 上线 Kimi K2 模型,该模型采用 MoE 架构基础模型,总参数 1T,激活参数 32B。


该模型在代码、Agent、数学推理任务处理上表现突出,在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩。


据月之暗面透露,Kimi K2 的预训练阶段使用 MuonClip 优化器,实现万亿参数模型的稳定高效训练。


Kimi K2 模型支持 128k 上下文,价格为输入: ¥4/百万 tokens,输出: ¥16/百万 tokens。

快速体验入口:

https://ppio.com/llm/moonshotai-kimi-k2-instruct


模型特点

Kimi K2 在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三大能力维度性能突出。


(1)代码能力

据月之暗面介绍,在前端开发任务中,Kimi K2 可以生成兼具设计感与视觉表现力的代码。

我们尝试用其生成一个 3D 的银河星系页面,输入提示词:

Create a 3D HTML galactic  galaxy that includes both nearby and distant galaxies

将 HTML 代码用网页打开,就得到可这样的效果:


(2)Agent 工具调用能力

Kimi K2 具备复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的 ToolCall 结构,支持无缝接入 Agent/Coding 框架,完成复杂任务或自动化编码。

你可以前往 PPIO 模型服务用户指南,查看详细接入教程:

https://ppio.com/docs/model/overview


(3)风格化写作能力

Kimi K2 能够准确控制输出风格,模仿不同文风写作,能够同时保留原意和表达风格。

例如,输入指令:模仿鲁迅《阿Q正传》解构网络键盘侠。

PPIO 致力于为企业及开发者提供高性能的模型 API 服务,目前已上线 DeepSeek R1/V3、Qwen3、baidu/ernie-4.5 等系列模型,仅需一行代码即可调用。并且,经过长期实践,PPIO 已经实现大模型推理的 10 倍 + 降本,实现推理效率与资源使用的动态平衡。

Read more

Qwen3.5重磅发布 PPIO 模型服务平台同步上线

Qwen3.5重磅发布 PPIO 模型服务平台同步上线

近日,阿里巴巴全新一代大模型千问 Qwen3.5 重磅开源发布,凭借突破性性能登顶全球最强开源模型榜单。 PPIO 模型服务平台在第一时间完成 Qwen3.5-Plus 与 Qwen3.5-397B-A17B 双版本的全面适配与上线,让企业与开发者无需等待,即可率先享受新一代多模态大模型的技术红利。 Qwen3.5 系列模型堪称 “性能与效率的完美平衡体”,总参数3970 亿,激活 170 亿参数即可运转,实现了 “以小胜大” 的技术突破 —— 性能全面超越万亿参数的 Qwen3-Max 模型,同时部署显存占用直降 60%,最大推理吞吐量提升至 19 倍。这一飞跃背后,是其融合线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)的创新架构。 作为原生视觉-语言模型,作为原生视觉-语言模型, Qwen3.5-Plus/Qwen3.5-397B-A17B在推理、

By PPIO
PPIO 上线 MiniMax M2.5:体验架构师级编程与高效 Agent 能力

PPIO 上线 MiniMax M2.5:体验架构师级编程与高效 Agent 能力

PPIO 上线了 MiniMax M2.5 模型。 MiniMax M2.5 是 MiniMax 发布的最新旗舰模型。据官方介绍,M2.5 在编程、工具调用、搜索及办公等生产力场景中均达到或刷新了行业的 SOTA(State-of-the-art)水平。该模型优化了对复杂任务的拆解能力,大幅提升了运行速度,并凭借极佳的 Token 效率,让无限运行复杂 Agent 在经济上成为可能。 现在,你可以到 PPIO 官网体验 MiniMax M2.5 或者调用模型 API。 地址: https://ppio.com/llm/minimax-minimax-m2.5 01 模型特征 * 架构师级编程思维,胜任全栈开发 MiniMax

By PPIO