technology

为什么Agent Sandbox会成为下一代AI应用的基石？| 深度

Saiki

20 Jun 2025 — 10 min read

2023 年夏天，当 OpenAI 在 ChatGPT 中悄然上线了一个名为“Code Interpreter（代码解释器）”的功能时，很少有人意识到，这标志着一个全新 AI Agent Infra 技术时代的开启。

在基础的聊天、写文章的功能之上，Code Interpreterr 赋予了 ChatGPT 执行代码的能力，让 ChatGPT 能像一个真正的数据分析师那样，运行 Python 代码、分析数据、生成图表。

然而，这就像打开了潘多拉的魔盒——强大的能力伴随着未知的风险。如果 AI 生成的代码是恶意的呢？如果它试图访问系统文件、删除数据、或者向外发送敏感信息呢？

这个古老而永恒的安全问题，催生了一个全新的技术分支：Agent Sandbox——专为 AI Agent 量身定制的安全沙箱技术。

预告一下，下周 PPIO 将上线 Agent Sandbox 产品，敬请期待。

# 01

守夜人的诞生

——传统安全沙箱时代

Agent Sandbox 故事的起点，要追溯到更早的传统安全沙箱时代。

故事要从 1990 年代的网络安全战场说起。彼时，计算机病毒和恶意软件层出不穷，安全研究人员面临一个棘手的问题：如何安全地分析这些“数字病毒”？

直接在自己的电脑上运行显然是“自杀”行为，但不运行又无法了解它们的行为模式。于是，沙箱（Sandbox）的概念应运而生——创建一个隔离的环境，让恶意代码在其中“表演”，研究人员则在安全距离外观察。

Cuckoo Sandbox 是这一时代的代表作。这个开源项目就像一个数字时代的“隔离病房”，让安全研究人员可以放心地解剖恶意软件，观察它们的一举一动，而不用担心自己的系统被感染。

2000 年代初，一个看似无关的技术开始萌芽：虚拟化。VMware、Xen 等虚拟化技术让一台物理机器可以运行多个隔离的操作系统。这为沙箱技术提供了更强大的隔离能力，但也带来了新的问题——太重了。

启动一个完整的虚拟机需要几分钟，消耗大量内存和 CPU 资源。对于需要频繁创建和销毁隔离环境的场景来说，这显然不够实用。

2013 年，一个名为 Docker 的项目彻底改变了游戏规则。

Docker 的创始人 Solomon Hykes 并非为了安全而创造容器技术，他只是想解决开发环境的一致性问题——“在我的机器上能跑”这个程序员的千古难题。但 Docker 带来的革命性变化是，它让隔离环境变得轻量、快速、标准化。

Docker 的成功不是偶然的。它解决了三个关键问题：

标准化：任何应用都可以被"容器化"
轻量化：共享宿主机内核，资源占用极小
快速化：秒级启动，适合频繁使用

这些特性让 Docker 迅速从开发工具演进为隔离和安全的利器。云计算厂商们很快意识到，Docker 不仅可以用来部署应用，还可以用来隔离不可信的代码执行。

# 02

云端的编程革命

——云端代码执行环境时代

2010 年代末，一个新的趋势开始兴起：在线协作开发。

传统的编程模式下，每个开发者都需要在本地配置复杂的开发环境。但随着项目复杂度的提升和团队协作的增加，这种模式暴露出了明显的弊端：

环境配置复杂，新人上手困难
不同开发者的环境不一致，导致“在我这里不能跑”的问题
缺乏实时协作能力

2017 年，一个名为 CodeSandbox 的项目悄然诞生。创始人 Ives van Hoorne 有一个简单而大胆的想法：为什么不把整个开发环境搬到云端？

CodeSandbox 最初只是一个简单的在线代码编辑器，但它很快演化为一个完整的云端开发环境。开发者只需要打开浏览器，就能获得一个功能完整的 IDE，包括：

代码编辑和语法高亮
实时预览和调试
包管理和依赖安装
多人实时协作

CodeSandbox 的成功证明了一个重要趋势：开发环境正在从本地迁移到云端。

与此同时，另一个平台 Replit 选择了不同的路径。它专注于教育市场，让编程学习变得更加简单。

Replit 的创始人 Amjad Masad 深知初学者的痛点：配置开发环境往往比学习编程本身更困难。Replit 的解决方案是提供一个零配置的编程环境：

支持 50 多种编程语言
无需安装和配置
即时运行和分享
内置AI代码助手

2014 年，亚马逊发布了 AWS Lambda，开启了“无服务器计算（Serverless）”的时代。

Lambda 的理念是：开发者只需要上传代码，无需关心服务器、操作系统、运行时环境。AWS 会自动处理代码的执行、扩缩容、容错等问题。

Lambda 的成功催生了一个重要的底层技术：

Firecracker MicroVM。

2018 年，AWS 开源了 Firecracker，这是一个专为无服务器计算设计的微虚拟机监视器（MicroVM Hypervisor）。

Firecracker 的设计哲学是：结合虚拟机的强隔离性和容器的轻量化优势。它实现了：

毫秒级启动：比传统虚拟机快 1000 倍
强隔离性：比容器更安全的硬件级隔离
高密度部署：单机可运行数千个 MicroVM
极小攻击面：只包含必要的组件

Firecracker 为后来的 Agent Sandbox 技术奠定了关键的技术基础。

# 03

AI 觉醒与新挑战

——AI Agent 定制沙箱时代

2022 年 11 月 30 日，OpenAI 发布了 ChatGPT，人工智能的" iPhone 时刻"终于到来。

但 ChatGPT 最初只是一个聊天机器人，虽然能够生成代码，但无法执行。用户需要手动复制代码到本地环境运行，这极大地限制了 AI 的实用性。

2023 年 7 月，OpenAI 悄然发布了一个改变游戏规则的功能：Code Interpreter（后更名为 Advanced Data Analysis）。用户第一次体验到了真正的 AI Agent：不仅能思考，还能行动。

这正是 Agent Sandbox 的雏形——一个自动化 Agent 可以“动手”写代码、运行任务、产出结果，但所有操作都发生在一个“受限、可控”的沙箱环境中。

但 Code Interpreter 的成功也暴露了一个严峻的问题：AI生成的代码本质上是不可信的。

不同于传统软件开发中程序员编写的代码，AI 生成的代码具有以下特点：

不可预测性：基于概率模型，输出具有随机性
易受注入攻击：恶意用户可能通过提示注入让 AI 生成恶意代码
权限边界模糊：AI 可能不理解某些操作的安全后果

传统的沙箱技术虽然可以提供基础的隔离，但它们并不是为 AI Agent 的特殊需求设计的。AI Agent 需要的是：

极快的启动速度：支持交互式对话
丰富的运行时环境：Python、数据科学库等
状态管理：支持多轮对话的上下文
细粒度的权限控制：精确限制可执行的操作

正是在这样的背景下，E2B 应运而生。

2023 年，两位捷克创业者 Václav Mlejnský 和 Tomáš Valenta 敏锐地捕捉到了这个机会。他们意识到，AI Agent 的普及将催生对专业化沙箱服务的巨大需求。

E2B 的核心理念是：将复杂的沙箱技术封装成简单的 API。

E2B 选择了 Firecracker 作为底层技术，这个选择证明了他们的技术前瞻性：

安全性：虚拟机级别的硬件隔离
性能：毫秒级启动，支持高并发
成本：高密度部署，降低运营成本

E2B 的成功激发了整个生态的发展。2023 年 10 月，E2B 宣布集成到 LangChain 框架，这标志着 Agent Sandbox 开始从单一产品演进为生态基础设施。

OpenAI 的成功让其他大厂也意识到了 Agent Sandbox 的重要性。

Microsoft 选择了一个独特的角度：AI 安全。2024 年，微软开源了 PyRIT 框架，这是一个用于测试 AI 系统安全性的工具。PyRIT 使用沙箱环境来安全地生成和执行潜在的攻击代码，用于测试目标AI系统的安全性。

CodeSandbox 则选择了平台化策略。他们推出了 CodeSandbox SDK，让开发者可以基于他们的云端 IDE 构建定制化的 AI Agent。

与此同时，一些前沿的研究者开始探索更激进的方案：WebAssembly (Wasm)。Wasm 的理念是将代码执行从服务器端推向客户端（浏览器），实现极致的安全隔离：

虽然 Wasm 方案目前还面临生态和性能的限制，但它代表了 Agent Sandbox 技术的一个重要发展方向。

# 04

尾声：基石的奠定

从 1990 年代的恶意软件分析，到 2010 年代的云端开发环境，再到 2020 年代的 AI Agent 沙箱，这个技术演进的故事揭示了一个深刻的规律：每一次计算范式的转变，都会催生新的安全需求和技术解决方案。

今天的 Agent Sandbox 技术，正站在一个历史的转折点上。

技术成熟度：从 Docker 到 Firecracker，底层技术已经足够成熟
市场需求：AI Agent 的普及创造了巨大的市场需求，终端用户每发起一次会话即启动一个 sandbox
生态形成：从 E2B 到大厂布局，生态系统正在快速形成

正如 Docker 改变了软件部署，GitHub 改变了代码协作，Agent Sandbox 也将成为 AI 时代不可或缺的基础设施。

在这个故事的结尾，我们看到的不仅仅是一个技术的演进，更是人类对于赋能与控制这一永恒主题的不断探索。我们既要赋予 AI Agent 强大的能力，也要确保这种能力始终在人类的掌控之下。

Agent Sandbox，就是这个微妙平衡的守护者。