PPIO - PPIO 博客 (Page 3)

News

PPIO上线Prompt Cache：让模型调用更快、更省、更稳

在大模型推理场景中，响应速度直接影响用户体验和系统性能。传统推理服务需要每次都重新计算相同的文本片段，导致不必要的计算开销和延迟，PPIO 推出的 Prompt Cache（提示词缓存）有效解决了这一问题。 PPIO的 Prompt Cache 功能基于智能缓存策略，能够识别和缓存可重复使用的文本模式，并在后续请求中快速调用。这种技术不仅大幅提升了推理效率，更让长文本应用变得更加经济。当前PPIO的 Prompt Cache 功能已支持以下主流大模型，前往PPIO官网即可体验。 * DeepSeek 系列：DeepSeek V3.1 / DeepSeek V3.1 Terminus / DeepSeek V3 0324 * GLM 系列：GLM-4.6 / GLM-4.6v / GLM-4.5 / GLM-4.5V / GLM-4.5-Air * Moonshot 系列：Kimi

News

算力筑巢，孵育AI新力量 | PPIO与上海交大工研院签订战略合作协议

2025 年 12 月 17 日上午，上海交大工业技术创新研究院（以下简称“交大工研院”）与 PPIO 全资子公司生成时代科技（上海）有限公司（以下简称“PPIO”）战略合作协议签约仪式在交大工研院 2 号楼举行。交大工研院执行理事刘晓娜、PPIO 孔杰代表双方签约出席仪式。签约后，双方围绕合作落地机制与长期价值展开深入研讨。刘晓娜表示，交大工研院作为由上海交通大学举办，并与上海市徐汇区政府联合共建的 AI 原生孵化器，始终聚焦 “全域智能” 孵化方向，贯通从技术原理到产业落地的智能全链路。算力是打通这一链路的基础要素，更是支撑 AI 初创企业成长的核心动能。PPIO 在 AI 云及分布式算力领域拥有深厚技术积淀，此次合作将通过资源联动，推动优质算力精准赋能在孵企业，降低创新门槛，加速人工智能科技成果转化，助力区域人工智能产业生态升级。孔杰表示，PPIO 作为专注于 AI

News

PPIO上线阿里Wan 2.6：制作电影级AI视频，对标Sora2

今天，PPIO 上线阿里最新发布的 Wan 2.6 视频生成模型。 Wan 2.6 是一个用于生成高质量视频和图像内容的高级多模态 AI 模型，将文本、图像、视频和音频整合到一个无缝框架中，提供文本转视频、图像转视频和文本转图像等功能。 Wan 2.6 可生成 24fps 的 1080p 视频，具有原生音画同步和精确的口型同步。Wan 2.6 支持多语言内容创作，适用于社交媒体、营销、电影制作和电子商务应用。 Wan 2.6 的主要优势有两个。一是增强生成质量。Wan 2.6 可以与 Sora2 竞争，在参考视频生成、多镜头叙事能力、生成质量和视频时长方面带来了显著改进。二是本地音画同步。Wan

media

PPIO姚欣：AI正在进入自主行动与创造时代，智能体需要全新的操作系统｜MEET2026

https://mp.weixin.qq.com/s/8r9GasreUKly0HgbiHM7Cg

News

PPIO获得量子位年度「杰出产品」「潜力创业公司」「焦点人物」三项AI大奖

12 月 10 日，由量子位主办的 MEET2026 智能未来大会在北京召开。会上，「2025 人工智能年度榜单」正式揭晓，该榜单从技术领先性、长期投入、产品落地能力与产业口碑等多维度综合评估，集中呈现了今年中国 AI 生态中最具代表性的创新力量。 PPIO 凭借扎实的技术底座与持续创新能力，一举获得「2025 人工智能年度潜力创业公司」「2025 人工智能年度杰出产品」「2025 人工智能年度焦点人物」三项重磅荣誉。 # 01 PPIO Agent沙箱入选「2025人工智能年度杰出产品」 PPIO Agent沙箱与月之暗面 Kimi、Minimax Agent、智谱 Z.ai、字节跳动豆包和扣子、腾讯 ima.copilot、AWS Kiro等产品，一同入围「2025 人工智能年度杰出产品」。今年，PPIO

News

首批试点！PPIO获评“数字企业出海服务平台”试点单位，助力数字出海服务体系建设

12 月 6 日，2025 上海数字城市活动月主题日活动在黄浦江畔正式启幕。本次活动以‘数城新景智呈未来’为主题，汇聚上海市数据局、临港集团、上海电信等政企代表及行业智库，集中发布数字出海服务体系重磅成果。作为中国领先的独立分布式云计算服务商，PPIO 受邀参展，并被授予“2025 年上海市数字出海服务平台”试点单位，标志着 PPIO 的跨境算力服务、数字出海技术支撑能力获官方认可。今年以来，上海以数字出海服务体系建设为核心牵引，持续推动各类服务资源的互联互通与集约共享，全力打造国际数字贸易发展新高地。在 2025 上海数字城市活动月主题日的数字企业出海服务论坛上，上海市数据局正式发布数字企业出海服务平台首批试点名单，历经申报筛选、专家评审、综合核验等多轮严格流程，PPIO 成功入选首批数字企业出海服务平台试点发布名单中。这批试点单位覆盖跨境数据、合规咨询、数字营销、智能制造、跨境电商、内容平台等多个关键细分领域，形成了面向数字出海企业的首批专业服务供给矩阵。活动现场，上海市数据局为包括 PPIO 在内的32家试点单位颁发荣誉牌匾。平台试点的推出，

News

PPIO上线智谱AutoGLM-Phone-9B：快速体验Phone Agent

今天，智谱开源了 Phone Agent。 Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架，能够以多模态方式理解手机屏幕内容，并通过自动化操作帮助用户完成任务。这不仅是一个模型，而是一整套可以「拿来就用」的能力，包括： * 训练好的核心模型； * Phone Use 能力框架与工具链； * 可直接跑通的 Demo，覆盖 50+ 高频中文 App； * 针对 Android 的适配层与示例工程； * 文档、快速上手指南。今天，PPIO 独家上新 GPU 实例模板，可一键部署 Phone Agent 的底层模型 AutoGLM-Phone-9B。基于该模型和框架，你可以搭建完整的 Phone Agent 应用，只需用自然语言描述需求，如“打开小红书搜索美食”，Phone

News

PPIO上线GLM-4.6V多模态大模型

今天，PPIO 上线智谱 GLM-4.6V 多模态大模型。 GLM-4.6V 将训练时上下文窗口提升到 128k tokens，在视觉理解精度上达到同参数规模 SOTA，并首次在模型架构中将 Function Call（工具调用）能力原生融入视觉模型，打通从「视觉感知」到「可执行行动（Action）」的链路，为真实业务场景中的多模态 Agent 提供统一的技术底座。在性能优化之外，GLM-4.6V 系列相较于 GLM-4.5V 降价 50%，API 调用价格低至输入 1 元/百万 tokens，输出 3 元/百万 tokens。现在，你可以到 PPIO 官网在线体验

News

PPIO荣获 WISE2025 商业之王「年度最具商业潜力企业」

11月27日，36氪正式发布“WISE2024商业之王年度企业系列名册”。PPIO凭借在AI基础设施领域的持续创新与显著商业潜力，从众多企业中脱颖而出，成功获评「WISE2025商业之王年度最具商业潜力企业」。该评选聚焦企业的创新实力、商业化进程、资本背景与成长潜能，此次获奖标志着行业对PPIO商业价值与发展前景的高度肯定。作为中国商业领域的年度权威盛典，36氪“WISE商业之王”长期关注并挖掘推动产业进步与经济增长的创新力量，为行业树立标杆。PPIO的入选，不仅印证了其在技术与商业落地上的双重实力，也折射出市场对AI基础设施赛道未来发展的充分信心。 PPIO作为国内领先的AI云计算服务商，始终致力于通过分布式计算与智能调度技术，为开发者与企业构建高效、全栈的Agent基础设施。在人工智能向Agentic AI演进的关键阶段，PPIO于今年率先推出国内首个Agentic AI基础设施服务平台，直面智能体规模化落地的基础设施瓶颈，推动Agent技术从实验走向产业实践。 PPIO Agentic AI infra 以高性价比的分布式GPU云为底层支撑，构建覆盖全球1300多个城

News

PPIO发布Agent Runtime：让Agent部署像Serverless一样简单

近期，PPIO 发布了基于 Sandbox（沙箱）自研的新产品：Agent Runtime，一个轻量级的 Agent 运行时框架。 Agent Runtime 是为了顺应 Agent 的专属需求而推出，其定位与 AWS AgentCore Runtime 类似。AgentCore 是 AWS 在 2025 年推出的专为 Agent 设计的基础设施平台，AgentCore Runtime 则是其中一个子产品，是基于 Firecracker 微虚拟机的 Serverless 运行时环境，旨在解决 Agent 低成本、高效率的部署问题。 PPIO Agent Runtime 通过简单易用的 SDK 与强大的沙箱运行环境来简化 Agent 的部署过程。用户无需关心基础设施配置、

technology

当Agent计算规模扩大100倍，我们需要什么样的Agentic Infra？

近期，PPIO Sandbox（沙箱）发布了一个重要功能：沙箱克隆。沙箱克隆旨在助力提高 Agent 的并行计算能力，也就是经典的“Scale up”规模扩展问题。今年最流行的 Agent 产品是 Deep Research，它可以看作对单个研究问题持续追踪、推演、迭代直到形成洞察的长链路串行推理过程。那么，如果将 Deep Research 的能力 Scale up 一百倍会发生什么？像 Manus 这样的 Agent 正在解决这类挑战，并将这种并行计算架构的 Agent 称之为 Wide Research。从 Agent 的串行计算到并行计算，离不开“沙箱克隆”这一核心技术的助力，这是 PPIO 在 Agentic Infra

News

PPIO上线Kimi K2 Thinking，兼容Anthropic协议

今天，PPIO 上线 Kimi K2 Thinking，这是 Kimi 最新、功能最强大的开源思考模型。 Kimi K2 Thinking 基于 Kimi K2 后训练而来的混合专家模型（MoE），总参数达 1T，激活参数 32B，上下文长度 256K。该模型支持深度思考、Function Call、结构化输出、json_schema、json_object 等功能。现在，你可以到 PPIO 官网在线体现 Kimi K2 Thinking，也可以将 PPIO 的模型 API 部署到 AI 应用中。 PPIO 在线体验地址： https: