PPIO上线智谱GLM-4.6,Coding 能力创国产模型新高

PPIO上线智谱GLM-4.6,Coding 能力创国产模型新高

今天,PPIO 上线智谱旗舰模型 GLM-4.6。

GLM-4.6 是智谱最强的代码 Coding 模型,较 GLM-4.5 提升 27%,在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。

  1. 高级编码能力:在公开基准与真实编程任务中,GLM-4.6 的代码能力对齐 Claude Sonnet 4,是国内已知的最好的 Coding 模型。
  2. 上下文长度:上下文窗口由 128K 提升至 200K,适应更长的代码和智能体任务。
  3. 推理能力:推理能力提升,并支持在推理过程中调用工具。、搜索能力:增强模型的工具调用和搜索智能体,在智能体框架中表现更好。
  4. 写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。

现在,你可以到 PPIO 官网(或点击文末阅读原文)在线体验 GLM-4.6,或将模型 API 接入 Cherry Studio、ChatBox 或者你自己的 AI 工作流中。新用户填写邀请码【24CGOJ】注册可得 15 元代金券。

在线体验入口:
https://ppio.com/llm/zai-org-glm-4.6
开发者文档:
https://ppio.com/docs/model/overview

Coding 能力创国产模型新高

我们用一个小游戏编程任务直观对比 GLM-4.5、GLM-4.6、Kimi-K2-0905、DeepSeek-V3.2-Exp 的表现。

提示词:
用HTML5 Canvas做一个飞机大战的游戏。要求如下:
1) 有终局BOSS关卡,终局BOSS有自己独有的技能,终局BOSS消灭有难度,只有消灭终局BOSS游戏才能通关
2)击败敌机后会随机爆一些道具,道具可以增加子弹威力、效果,也可以让自己短时间内变大。道具吃到了就要马上用掉,有时间限制
3)击败敌机会有经验值,经验够了会升级,升级后会有更强大的子弹技能。
4) 会有一些小BOSS,小BOSS血厚一点,击败会爆一些更强的道具

GLM-4.6:

GLM-4.5:

DeepSeek网页版:(DeepSeek-V3.2-Exp)

Kimi网页版(Kimi-K2):

从这个编程任务的最终效果来看,GLM-4.6 的代码能力的确更胜一筹

GLM-4.5、GLM-4.6、Kimi-K2-0905、DeepSeek-V3.2-Exp 等模型均已上线 PPIO。值得一提的是,PPIO 提供了与 Anthropic SDK 兼容的 API 服务。如果你已经使用 Anthropic SDK 开发了应用程序,只需要将 base URL 和 API Key 替换为 PPIO 的 API 地址和 API Key 即可。

比如,你可以用 GLM-4.6 来驱动 Claude Code,点击查看“邪修”教程

代码模型的进步将极大驱动 Agent 生态的发展。最后送一份福利:PPIO 整理了 20 余篇 Agent 相关的报告资料,可扫下图二维码下载,以及加入社群交流。

Read more

PPIO上线Kimi K2 Thinking,兼容Anthropic协议

PPIO上线Kimi K2 Thinking,兼容Anthropic协议

今天,PPIO 上线 Kimi K2 Thinking,这是 Kimi 最新、功能最强大的开源思考模型。 Kimi K2 Thinking 基于 Kimi K2 后训练而来的混合专家模型(MoE),总参数达 1T,激活参数 32B,上下文长度 256K。该模型支持深度思考、Function Call、结构化输出、json_schema、json_object 等功能。 现在,你可以到 PPIO 官网在线体现 Kimi K2 Thinking,也可以将 PPIO 的模型 API 部署到 AI 应用中。 PPIO 在线体验地址: https:

By PPIO
PPIO独家上新GPU实例模板,一键部署Kimi-Linear

PPIO独家上新GPU实例模板,一键部署Kimi-Linear

昨晚,月之暗面发布了混合线性注意力架构新模型 Kimi-Linear,旨在解决大语言模型在长上下文推理中的计算瓶颈。 Kimi-Linear 的核心亮点: * Kimi Delta Attention(KDA),一种通过细粒度门控机制改进门控规则的线性注意力架构。 * 混合架构:采用 3:1 的 KDA 与全局 MLA 比例,在保持甚至超越全注意力质量的同时降低内存占用。 * 卓越性能:在 1.4T Token 的训练规模下,经公平对比,KDA 在长文本与类强化学习基准等多项任务上均优于全注意力。 * 高吞吐:在 1M 上下文中实现最高 6 倍的解码吞吐量,显著缩短单输出 Token 耗时(TPOT)。 今天,PPIO 独家上新 GPU 实例模板,可一键部署 Kimi-Linear-48B-A3B-Instruct 的专属模型。 PPIO 算力市场的

By PPIO
为什么说“Spot GPU实例”是AI算力体系的战略级补充?

为什么说“Spot GPU实例”是AI算力体系的战略级补充?

在云计算的成本优化领域,有一种独特的计费模式,它允许用户以极低的折扣获取计算资源,堪比“捡漏”。这就是 Spot 实例。 早期的 Spot 实例是“闲置资源的低价甩卖”,本质是供需调节。但在今天的云原生与 AI 生态中, Spot 实例——尤其是 Spot GPU 实例,变成了 AI 算力编排体系中的战略一环。 对于希望最大化利用云预算的开发者和企业来说,理解并善用 Spot GPU 实例是实现成本效益最大化的关键。 # 01 什么是 Spot 实例? Spot 实例,又被称为竞价实例、抢占式实例,是云服务提供商将数据中心内的闲置计算容量以动态变化的价格进行售卖的一种机制。 Spot 实例在性能上与标准的按需实例(On-Demand Instance)并无二致,但价格却能提供高达 50%~90% 的折扣。 而低价的代价是,当云服务商需要收回这些容量以满足按需或其他更高优先级用户的需求时,

By PPIO
AI正跨越鸿沟,创业者该关注什么?PPIO姚欣提出两大关键指标

AI正跨越鸿沟,创业者该关注什么?PPIO姚欣提出两大关键指标

从 23 岁在宿舍创办PPTV,到率先成立 AI 创业营,再到预见性地布局 AI 云算力基础设施 PPIO ,创业者姚欣的二十一年,是一部穿越了 PC 、移动和 AI 三次技术浪潮的“活历史”。 近日,PPIO 联合创始人兼 CEO 姚欣受邀做客36氪《AI局中人》栏目,直播中分享了他横跨 PC 互联网、移动互联网到 AI 时代的三段创业经历,并与36氪特邀主持人、蚂蚁集团 NEXTA 创新实验室项目负责人何思翀深入探讨了以下内容: · 谈选择:放弃内卷的 AI 应用红海,他为何坚信“送水”是门更好的生意? · 谈数据:日均 2000 亿次 Token 调用的硬核数据里,藏着你没看到的增长密码。 · 谈未来:杀手级应用不是下一个微信,

By PPIO