当Agent计算规模扩大100倍,我们需要什么样的Agentic Infra?

当Agent计算规模扩大100倍,我们需要什么样的Agentic Infra?

近期,PPIO Sandbox(沙箱)发布了一个重要功能:沙箱克隆。

沙箱克隆旨在助力提高 Agent 的并行计算能力,也就是经典的“Scale up”规模扩展问题。

今年最流行的 Agent 产品是 Deep Research,它可以看作对单个研究问题持续追踪、推演、迭代直到形成洞察的长链路串行推理过程。

那么,如果将 Deep Research 的能力 Scale up 一百倍会发生什么?像 Manus 这样的 Agent 正在解决这类挑战,并将这种并行计算架构的 Agent 称之为 Wide Research。

从 Agent 的串行计算到并行计算,离不开“沙箱克隆”这一核心技术的助力,这是 PPIO 在 Agentic Infra 方向正在做的事情之一。


# 01 

上下文窗口的根本性瓶颈

在介绍沙箱克隆之前,有必要先解释一下 Deep Research 产品做串行任务的瓶颈。

比如,大多数人都会遇到这样一个令人沮丧的现实,在多主题研究任务中,到第八或第九个项目时,AI 就开始编造内容。

是因为模型的上下文窗口太小吗?众所周知,模型的上下文窗口就是一个有限的记忆缓冲区,限制了模型在任何给定时刻可以主动处理的信息量,扩展上下文窗口就是扩展模型的记忆能力。最新的前沿大模型已经大大扩展了上下文窗口的边界,从 4K 到 32K、128K,甚至 1M+ tokens。

然而,更大的上下文窗口却并不能从根本上解决 Agent 的记忆瓶颈。Agent 的 Scale up,不仅仅是提示词工程问题,也不仅仅是模型的问题,而是一个架构约束——单线程、顺序处理的范式无法突破这种约束。

Manus 在近期的博客中解释了这一现象。模型的检索准确性会随着当前位置的距离而下降,即"迷失在中间"现象。上下文开头和结尾的信息比中间的信息更可靠地被回忆起来。即使是无限上下文,要求单个模型在数十个独立研究任务中保持一致的质量也会产生认知瓶颈。

其中原因跟后训练数据有关系。当前语言模型的后训练数据混合仍然主要由为聊天机器人式交互设计的相对较短的轨迹主导。因此,当消息内容的长度超过某个阈值时,模型自然会经历一种上下文长度压力,促使它加速总结或诉诸于不完整的表达形式,比如开始输出要点列表。

而且,处理更长的上下文也意味着成本是指数级的增长。

那么,要想应对大规模研究任务,应该如何处理?并行处理应运而生。


# 02 

并行处理架构带来的Sandbox需求

日常办公中有一类场景天然适合并行计算架构,包括批量文档处理、多资产创意生成、大规模数据分析、复杂工作流分解等。这些任务的特点是,规模量大但任务类型相似,任务之间具有一定的独立性。

Agent 的并行计算不是要求一个处理器顺序处理 n 个项目,而是像影分身那样部署 n 个并行子Agent 同时处理 n 个项目,然后将子 Agent 的任务成果综合成一个单一的、连贯的、全面的报告。

也就是说,如果需要处理 50 个项目,那就部署 50 个子 Agent ;如果要处理 500 个项目,那就部署 500 个。架构随任务大小线性扩展,而不是像基于上下文的方法那样呈指数级扩展。

最核心的变化在于,子 Agent 之间互相独立。每个子 Agent 都拥有完整的 Sandbox 运行环境,全新的、空的上下文窗口,以及完整的工具库和独立的互联网连接。

因为子 Agent 并行操作,分析 50 个项目所需的实际时间与分析 5 个项目大致相同。即使单个子 Agent 出现错误或幻觉也不会传播到其他子 Agent。这大大降低了整个 Agent 系统的幻觉。

我们知道,Agent 的运行离不开 Sandbox 环境,而现阶段的 Sandbox 通常服务于串行计算的 Agent 架构。当 Agent 架构开始从串行计算往并行计算发展的时候,Sandbox 也相应地需要满足并行计算的要求。

这一功能,就是沙箱克隆。


# 03

PPIO 上线“沙箱克隆”功能

PPIO 在今年7月正式发布 Sandbox 产品,已上线 Computer Use、Browser-use、Code Interpreter 等基础功能。

近期,PPIO 发布了沙箱实例自动暂停和恢复、沙箱克隆、沙箱闲时释放等功能的 Beta 版本。其中,沙箱克隆允许复制正在运行或处于暂停状态的沙箱实例,克隆出的沙箱和原沙箱的文件系统、内存状态保持一致。

借助 “沙箱克隆” 功能,Agent 实现了从 “深度单线探索”(Deep-Research)到 “广度并行探索”(Wide-Research)的架构转变:

  1. 多时间线探索架构:就像决策树一样,Agent 可以从同一个基准状态出发,创建多个独立的沙箱副本,每个副本探索一条不同的解决路径,互不干扰。
  2. 真正的并行计算能力:通过将大任务拆分成批量子任务,Agent 能够将计算能力扩展数十倍甚至上百倍,同时处理数十个、上百个探索分支。
  3. 零风险实验环境:克隆出的沙箱完全隔离,AI 可以在其中自由实验、测试各种可能性,而不会影响原始环境或开发者的主工作流程。
  4. 高效的资源利用:虽然可能同时启动多个沙箱实例,但通过动态管理和及时终止不再有价值的分支(沙箱实例),总体计算资源消耗可以保持在合理范围内。

这种能力使 Agent 能够突破当前的性能瓶颈,从提供理论建议转变为交付经过并行验证、实际测试的可靠方案,真正实现自主探索、迭代和解决复杂问题的能力。

关于更多沙箱克隆的信息,您可以到 PPIO 网站查看我们的开发者文档:

https://ppio.com/docs/sandbox/sandbox-clone

如果您正在探索并行计算的 Agent 架构,欢迎体验 PPIO 的沙箱克隆功能以及完整的 Agentic Infra 解决方案,您可以扫码以下二维码添加专属小助手进行进一步沟通。

参考文章:

Wide Research:超越上下文窗口

Read more

PPIO入选36氪“2026最具价值成长企业100”

PPIO入选36氪“2026最具价值成长企业100”

近日,PPIO 入选 36 氪发布的“2026 最具价值成长企业 100”榜单。 该榜单评选聚焦顺应产业变革、构建长期核心竞争力、持续创造商业与产业价值的创新企业,旨在发掘在新一轮科技变革与产业升级中脱颖而出的成长标杆。与 PPIO 同批入选的还有 DeepSeek、Kimi、阶跃星辰、穹彻智能等一批领先的人工智能/大模型公司。 PPIO 此次入选,体现了其在技术创新与商业化落地方面的综合实力,也反映出行业与市场对 AI 基础设施赛道发展前景的持续看好。 PPIO 是全球领先的 AI 云计算服务商,致力于帮助更多企业、开发者和智能体应用以更低成本、更高效率使用 AI 基础设施服务。 面向 AI 原生应用、智能体开发、AI 编程、多模态应用和企业级大模型服务等新一代需求,PPIO 提供高性价比、超弹性、低延迟的一站式 AI 云平台服务,覆盖

By luigi
香港特区政府财政司司长陈茂波一行到访 PPIO

香港特区政府财政司司长陈茂波一行到访 PPIO

6 月 18 日上午,香港特别行政区政府财政司司长陈茂波一行到访 PPIO 上海总部,参观 PPIO 企业展厅,并围绕人工智能基础设施建设、AI 云服务发展、产业生态协同以及香港创新科技发展等议题开展座谈交流。PPIO 联合创始人、董事长兼 CEO 姚欣等接待来访并参加座谈。 此次来访体现了香港特区政府对人工智能基础设施、分布式AI 云计算以及新一代 AI 服务平台发展的高度关注,也为 PPIO 进一步发挥自身技术与平台优势、深化香港布局、连接国际市场提供了重要交流契机。   来访期间,陈茂波司长一行参观了PPIO 展厅,详细了解 PPIO 的发展历程、技术架构、全球业务布局,以及公司在分布式 算力、模型推理服务、Agentic Cloud、智能体基础设施和全球开发者生态等方面的最新进展。   座谈会上,双方围绕AI产业发展趋势、算力基础设施建设、模型服务能力、AI 应用落地、香港国际化平台优势及未来合作方向等内容进行了深入交流。

By luigi
PPIO入选中国信通院Token服务能力攀登计划

PPIO入选中国信通院Token服务能力攀登计划

6 月 16 日,中国信通院正式发布“Token 服务能力攀登计划”。PPIO 凭借在 MaaS 模型服务性能、稳定性和 Token 输出效率方面的表现,入选首批企业级 Token 服务性能攀登基线。 在通用场景下,PPIO 模型服务实现 TPS ≥55 个/秒、TTFT ≤0.9 秒、调用成功率 ≥99.9%,标志着其模型平台已具备面向企业级 AI 应用和 Agent 场景的高质量 Token 服务能力。 PPIO 此次入选,体现了其在模型推理服务能力、AI 云基础设施建设和企业级 Token 服务质量方面获得权威行业机构认可。 同时,PPIO 还受邀参加高质量词元(Token)服务专题研讨,

By luigi
PPIO首发上线GLM-5.2:代码能力仅次于Claude Fable 5

PPIO首发上线GLM-5.2:代码能力仅次于Claude Fable 5

今天,PPIO 首发上线智谱最新开源旗舰模型 GLM-5.2。 其核心特点如下: ✅Coding 能力开源 SOTA:GLM-5.2 发布即获 LMArena 代码榜开源模型第一、全球模型二,整体表现仅次于 Claude Fable 5; ✅支持真正可用的 1M 上下文:一次任务即可完成“从需求到多端可部署产物“的完整开发链路; ✅自主规划驱动高效迭代:引领开发模式从 Vibe Coding 迈向 Agentic Engineering,构建“规划-实现-迭代”的工程闭环; ✅万级真实任务验证:构建逾万个可验证任务环境,覆盖九大主流编程语言,大幅提升模型软件工程能力。 现在,GLM-5.2 已上线 PPIO 模型广场,您可以在线试用该模型或通过 API 快速集成。  地址:https:

By PPIO