PPIO发布Agent Runtime:让Agent部署像Serverless一样简单

PPIO发布Agent Runtime:让Agent部署像Serverless一样简单

近期,PPIO 发布了基于 Sandbox(沙箱)自研的新产品:Agent Runtime,一个轻量级的 Agent 运行时框架。

Agent Runtime 是为了顺应 Agent 的专属需求而推出,其定位与 AWS AgentCore Runtime 类似。AgentCore 是 AWS 在 2025 年推出的专为 Agent 设计的基础设施平台,AgentCore Runtime 则是其中一个子产品,是基于 Firecracker 微虚拟机的 Serverless 运行时环境,旨在解决 Agent 低成本、高效率的部署问题。

PPIO Agent Runtime 通过简单易用的 SDK 与强大的沙箱运行环境来简化 Agent 的部署过程。用户无需关心基础设施配置、容器编排、服务暴露等复杂细节,只需专注于 Agent 的业务逻辑开发。

PPIO Agent Runtime 构建在 PPIO 的 Sandbox 之上。Sandbox 提供了硬件级的安全隔离和资源管理,而 Agent Runtime 则在此基础上实现了会话管理、状态保持和快速部署能力。两者结合,为开发者提供了一个可靠的 Agentic Infra 选择。

Sandbox 与 Agent Runtime 的出现,标志着云计算从云原生向 AI 原生基础设施的重要演进。


# 01 

开发者为什么需要 Agent Runtime?

Agent Runtime 的推出并非偶然,而是一个明确市场需求的回应:如何将 Agent 从实验室原型快速、安全、经济地推向生产环境。

Agent 生产环境背后是巨大的商业市场空间。根据市场研究,Agentic AI 市场预计将从 2024 年的 52.5 亿美元增长到2032 年的 961.8 亿美元。但是,也有市场研究机构警告,到 2027 年底将有 40% 的 Agent 项目因部署复杂度、成本失控和价值不清而被取消。

这种矛盾的背后有很多原因,而最核心的关键问题在于,现有的云基础设施并不是为 Agent 的独特执行模式设计的。

以当前云计算的主流架构 Serverless 为例,其特点与 Agent 存在天然的冲突。

首先,Serverless 的生命周期短,而 Agent 的生命周期较长。

Serverless 能够按照任务请求自动弹性伸缩,但本质上是短生命周期执行环境,适合事件驱动的小任务。出于成本和架构设计考虑,Serverless 一般都强制限制最大执行时长,例如AWS Lambda 是 15 分钟,执行超时会被系统强制终止。

然而,一个执行复杂任务的 Agent,尤其是带工具使用、多轮推理、长尾任务的,例如长文档结构化、Deep Research,通常需要数十分钟甚至数小时才能完成任务。

其次,Serverless 架构针对的是无状态任务,而 Agent 天然就是有状态任务。

所谓的无状态意味着一次执行结束后,所有内存状态都被销毁,下一次执行必须从外部重新读回来。而 Agent 需要在多轮交互中保持上下文和会话状态,来统一管理 Agent 的记忆、工具调用历史和任务计划。传统的无状态架构需要频繁的外部存储读写,严重影响性能。

容器理论上可以运行 Agent ,但容器在成本与管理复杂度上挑战很大。

首先是空闲计费。即使 Agent 任务没有在运行,容器也在占据资源,CPU、内存、GPU 都要付钱。而 Agent 任务的工作负载波峰波谷极大,导致容器浪费惊人。其次是管理复杂。面对容器,开发者需要管理生命周期,管理日志、监控、调度、扩容,管理镜像/版本,管理网络、权限、安全组,对小团队、需要快速迭代的 Agent 应用来说都是极高的负担。

基于以上差异,Agent Runtime 应运而生。

Agent Runtime 可提供长时间的有状态会话,实现了 Agent 专用的 Serverless 运行环境。这标志着云计算从通用计算平台向 AI 原生基础设施的重要演进。


# 02

PPIO Agent Runtime 的核心能力:轻量级,低成本

PPIO 针对 Agent 任务所需要的持久性、状态性和自主性的特点而打造的 PPIO Agent Runtime,是一个轻量级 Agent 运行时框架,能够 快速、低成本地将 Agent 部署上线。

PPIO Agent Runtime 的核心能力包括以下几点:

第一,会话级隔离,每个用户会话都会创建一个全新的 Sandbox 实例

基于 PPIO Sandbox 的系统级隔离,每个任务运行在独立环境中,防止数据泄露和越权操作,获得独立的计算资源、内存空间和文件系统。当会话结束时,整个 Sandbox 被彻底销毁,所有会话上下文被安全清除。

这种设计使得会话之间的数据交互必须通过显式的外部服务(如数据库或消息队列),从架构层面杜绝了数据泄露风险。对于处理敏感信息的企业 Agent 应用,这种硬隔离比容器级隔离提供了更强的安全保障。

第二,基于轻量级 Sandbox 实现毫秒级冷启动。

PPIO Sandbox 采用轻量级虚拟化技术,实现了接近容器的启动速度与硬件级的环境隔离。冷启动时间 < 200ms(包含运行时初始化)。且天生适配大量并发场景。这意味着即使是第一次请求,用户也能获得亚秒级的响应速度,远优于传统虚拟机方案。

第三,长时间有状态运行,实现真正的“有状态Serverless”

与传统 Serverless 的短生命周期不同,PPIO Agent Runtime 支持:

- 会话时长:单个会话可持续运行数小时

- 状态保持:会话期间所有内存状态、文件、连接自动保持

这种“有状态 Serverless”模式特别适合需要多轮交互的 Agent 应用,如数据分析助手、代码调试助手、文档处理等。

第四,框架无关性。

PPIO Agent Runtime 不绑定特定的 Agent 开发框架,支持包括 LangGraph、OpenAI Agents SDK、Google ADK、CrewAI、AutoGen 在内的主流框架,以及任何自定义实现。只需添加简单的几行代码即可完成集成。

from ppio_sandbox.agent_runtime import AgentRuntimeApp

# 创建 Agent Runtime 应用实例
app = AgentRuntimeApp()

# 使用装饰器定义 Agent 入口点
@app.entrypoint
def my_agent(request: dict) -> dict:
    prompt = request.get("prompt", "")

    # Agent 业务逻辑
    # 这里可以调用 LLM、使用 Agent 框架、或任何自定义逻辑
    result = f"收到消息: {prompt}"

    return {"result": result}

if name == "__main__":
    app.run()

详情可查看集成指南:

https://ppio.com/docs/sandbox/agent-runtime-frameworks


第五,分钟级部署

PPIO Sandbox CLI 支持一键配置、部署 Agent 到 PPIO Agent 沙箱生态。通过 PPIO Sandbox CLI 工具,从代码到生产环境只需两个命令:

# 初始化项目
ppio-sandbox-cli agent configure

# 部署
ppio-sandbox-cli agent launch

部署成功后,只需在后端服务中集成 PPIO 的 SDK,调用一个方法即可完成调用。

from ppio_sandbox.agent_runtime import AgentRuntimeClient as PPIOAgentRuntimeClient

client = PPIOAgentRuntimeClient(
  api_key=os.getenv("PPIO_API_KEY")
)

response = await client.invoke_agent_runtime(
  agentId=os.getenv("PPIO_AGENT_ID"),
  payload=payload,
)

第六,生产级特性支持

健康检查机制:

@app.ping
def health_check() -> dict:
    return {"status": "healthy", "service": "My Agent"}

用户可以在应用中定期调用 /ping 端点检查 Agent 状态,确保服务可用性。

流式响应支持:

async def stream_response(query):
    async for chunk in agent.process_stream(query):
        yield f"data: {chunk}\n\n"

支持 Server-Sent Events (SSE) 协议,实现实时的流式输出,提升用户体验。您只需使用 Generator 或 AsyncGenerator 返回数据,即可自动实现流式响应。


第七,成本优势。

相比传统部署方式,PPIO Agent Runtime 通过简单易用的 SDK 与强大的沙箱运行环境来简化 Agent 的部署过程,用户无需关心基础设施配置、容器编排、服务暴露等复杂细节,只需专注于 Agent 的业务逻辑开发。

这不仅降低了开发成本,还降低了运维成本,PPIO Agent Runtime 支持全托管服务,实现自动扩缩容。

开发者可基于 PPIO Agent Runtime 实现成本优化,仅为实际使用时间付费。

关于 PPIO Agent Runtime 的部署流程和进阶功能,可查看开发者文档:

https://ppio.com/docs/sandbox/agent-runtime-introduction


# 03

结语

Agent 的大规模应用需要专门的基础设施支持。AWS AgentCore 的推出验证了这一市场需求,而 PPIO Agent Runtime 为国内开发者提供了一个轻量、安全、易用的选择。

如果你正在开发 Agent 应用,正在为部署和运维发愁,不妨试试 PPIO Agent Runtime——也许它正是你需要的那块拼图。

如果你是 PPIO 新用户,用邀请码【24CGOJ】注册可得代金券:

https://ppio.com/ai-computing/sandbox

企业级用户可以扫码获取企业级服务权益与报价。

Read more

PPIO获得量子位年度「杰出产品」「潜力创业公司」「焦点人物」三项AI大奖

PPIO获得量子位年度「杰出产品」「潜力创业公司」「焦点人物」三项AI大奖

12 月 10 日,由量子位主办的 MEET2026 智能未来大会在北京召开。会上,「2025 人工智能年度榜单」正式揭晓,该榜单从技术领先性、长期投入、产品落地能力与产业口碑等多维度综合评估,集中呈现了今年中国 AI 生态中最具代表性的创新力量。 PPIO 凭借扎实的技术底座与持续创新能力,一举获得「2025 人工智能年度潜力创业公司」「2025 人工智能年度杰出产品」「2025 人工智能年度焦点人物」三项重磅荣誉。 # 01 PPIO Agent沙箱入选 「2025人工智能年度杰出产品」 PPIO Agent沙箱与月之暗面 Kimi、Minimax Agent、智谱 Z.ai、字节跳动豆包和扣子、腾讯 ima.copilot、AWS Kiro等产品,一同入围「2025 人工智能年度杰出产品」。 今年,PPIO

By PPIO
首批试点!PPIO获评“数字企业出海服务平台”试点单位,助力数字出海服务体系建设

首批试点!PPIO获评“数字企业出海服务平台”试点单位,助力数字出海服务体系建设

12 月 6 日,2025 上海数字城市活动月主题日活动在黄浦江畔正式启幕。本次活动以‘数城新景 智呈未来’为主题,汇聚上海市数据局、临港集团、上海电信等政企代表及行业智库,集中发布数字出海服务体系重磅成果。作为中国领先的独立分布式云计算服务商,PPIO 受邀参展,并被授予“2025 年上海市数字出海服务平台”试点单位,标志着 PPIO 的跨境算力服务、数字出海技术支撑能力获官方认可。 今年以来,上海以数字出海服务体系建设为核心牵引,持续推动各类服务资源的互联互通与集约共享,全力打造国际数字贸易发展新高地。 在 2025 上海数字城市活动月主题日的数字企业出海服务论坛上,上海市数据局正式发布数字企业出海服务平台首批试点名单,历经申报筛选、专家评审、综合核验等多轮严格流程,PPIO 成功入选首批数字企业出海服务平台试点发布名单中。 这批试点单位覆盖跨境数据、合规咨询、数字营销、智能制造、跨境电商、内容平台等多个关键细分领域,形成了面向数字出海企业的首批专业服务供给矩阵。活动现场,上海市数据局为包括 PPIO 在内的32家试点单位颁发荣誉牌匾。平台试点的推出,

By PPIO
PPIO上线智谱AutoGLM-Phone-9B:快速体验Phone Agent

PPIO上线智谱AutoGLM-Phone-9B:快速体验Phone Agent

今天,智谱开源了 Phone Agent。 Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。 这不仅是一个模型,而是一整套可以「拿来就用」的能力,包括: * 训练好的核心模型; * Phone Use 能力框架与工具链; * 可直接跑通的 Demo,覆盖 50+ 高频中文 App; * 针对 Android 的适配层与示例工程; * 文档、快速上手指南。 今天,PPIO 独家上新 GPU 实例模板,可一键部署 Phone Agent 的底层模型 AutoGLM-Phone-9B。 基于该模型和框架,你可以搭建完整的 Phone Agent 应用,只需用自然语言描述需求,如“打开小红书搜索美食”,Phone

By PPIO