PPIO出席中国算力大会 首席科学家王晓飞获评“青年先锋人物”

PPIO出席中国算力大会 首席科学家王晓飞获评“青年先锋人物”

近日,中国算力大会在山西大同成功举办,PPIO 首席科学家王晓飞教授受邀参加并出席同期活动“算力中国·星耀之夜”,他在活动上分享了分布式算力网络的理论研究以及创新成果,同时荣获“中国青年先锋人物”称号。

在“算力中国·星耀之夜”交流活动上,王晓飞以“面向大模型服务的分布式算力网络——迈向通用人工智能之路”为题进行分享。他提出,算力资源分布存在“马太效应”与长尾供需难题,网络需要实现精准调度和抗熵演进,并通过“核心+边缘”分层协同,探索算力网络的新发展范式。

王晓飞在演讲中指出,围绕分布式算力赋能大模型与智能体应用, PPIO 目前已取得多项突破:构建了覆盖全球 4000+ 节点的分布式算力网络;依托自研 FP8 算法与 KV Cache 优化,大幅提升推理性能并降低显存消耗,同时打造了兼容主流框架的智能体基座,支撑大规模高效运行。

他强调,人工智能正加速迈向 Agentic AI 时代。因此,具备自主感知、规划与执行复杂任务能力的 Agent 亟需安全、敏捷的运行环境。传统编程模式难以应对其不确定性和潜在安全风险,因此构建安全隔离的执行环境至关重要。

对此,PPIO 推出的国内首款兼容 E2B 接口的“Agent 沙箱”,为 Agent 提供安全可靠的“手和脚”,支持 Browser use、Computer use、MCP、RAG、Search 等多种工具的高效调用,目前已接入 Camel AI、OpenManus、Dify 等开源项目,为 Agent 应用开发提供了系统性支撑与底座。

他同时介绍,PPIO 在模型服务方面也持续突破,第一时间上线并优化主流开源大语言模型,为 Agent 提供强大的“决策大脑”。平台支持百款主流开源与定制 AI 模型的快速接入、弹性部署与高效调用,助力开发者与企业快速构建 AI Agent 应用,实现规划、记忆、执行等完整的 Agent 任务的核心需求。

此外,在中国算力大会主论坛上,王晓飞教授入选“青年先锋人物” 。主办方指出,本次评选不仅是对王晓飞教授科研精神与行业影响力的高度认可,也彰显了 PPIO 在分布式算力网络前沿探索与产品创新方面的领先实力。

Read more

PPIO发布Agent Runtime:让Agent部署像Serverless一样简单

PPIO发布Agent Runtime:让Agent部署像Serverless一样简单

近期,PPIO 发布了基于 Sandbox(沙箱)自研的新产品:Agent Runtime,一个轻量级的 Agent 运行时框架。 Agent Runtime 是为了顺应 Agent 的专属需求而推出,其定位与 AWS AgentCore Runtime 类似。AgentCore 是 AWS 在 2025 年推出的专为 Agent 设计的基础设施平台,AgentCore Runtime 则是其中一个子产品,是基于 Firecracker 微虚拟机的 Serverless 运行时环境,旨在解决 Agent 低成本、高效率的部署问题。 PPIO Agent Runtime 通过简单易用的 SDK 与强大的沙箱运行环境来简化 Agent 的部署过程。用户无需关心基础设施配置、

By PPIO
当Agent计算规模扩大100倍,我们需要什么样的Agentic Infra?

当Agent计算规模扩大100倍,我们需要什么样的Agentic Infra?

近期,PPIO Sandbox(沙箱)发布了一个重要功能:沙箱克隆。 沙箱克隆旨在助力提高 Agent 的并行计算能力,也就是经典的“Scale up”规模扩展问题。 今年最流行的 Agent 产品是 Deep Research,它可以看作对单个研究问题持续追踪、推演、迭代直到形成洞察的长链路串行推理过程。 那么,如果将 Deep Research 的能力 Scale up 一百倍会发生什么?像 Manus 这样的 Agent 正在解决这类挑战,并将这种并行计算架构的 Agent 称之为 Wide Research。 从 Agent 的串行计算到并行计算,离不开“沙箱克隆”这一核心技术的助力,这是 PPIO 在 Agentic Infra

By PPIO
PPIO上线Kimi K2 Thinking,兼容Anthropic协议

PPIO上线Kimi K2 Thinking,兼容Anthropic协议

今天,PPIO 上线 Kimi K2 Thinking,这是 Kimi 最新、功能最强大的开源思考模型。 Kimi K2 Thinking 基于 Kimi K2 后训练而来的混合专家模型(MoE),总参数达 1T,激活参数 32B,上下文长度 256K。该模型支持深度思考、Function Call、结构化输出、json_schema、json_object 等功能。 现在,你可以到 PPIO 官网在线体现 Kimi K2 Thinking,也可以将 PPIO 的模型 API 部署到 AI 应用中。 PPIO 在线体验地址: https:

By PPIO
PPIO独家上新GPU实例模板,一键部署Kimi-Linear

PPIO独家上新GPU实例模板,一键部署Kimi-Linear

昨晚,月之暗面发布了混合线性注意力架构新模型 Kimi-Linear,旨在解决大语言模型在长上下文推理中的计算瓶颈。 Kimi-Linear 的核心亮点: * Kimi Delta Attention(KDA),一种通过细粒度门控机制改进门控规则的线性注意力架构。 * 混合架构:采用 3:1 的 KDA 与全局 MLA 比例,在保持甚至超越全注意力质量的同时降低内存占用。 * 卓越性能:在 1.4T Token 的训练规模下,经公平对比,KDA 在长文本与类强化学习基准等多项任务上均优于全注意力。 * 高吞吐:在 1M 上下文中实现最高 6 倍的解码吞吐量,显著缩短单输出 Token 耗时(TPOT)。 今天,PPIO 独家上新 GPU 实例模板,可一键部署 Kimi-Linear-48B-A3B-Instruct 的专属模型。 PPIO 算力市场的

By PPIO