Latest

PPIO首发上线DeepSeek-V3.1-Terminus

PPIO首发上线DeepSeek-V3.1-Terminus

刚刚,PPIO 首发上线 DeepSeek-V3.1 的更新版本 DeepSeek-V3.1-Terminus!该版本的模型输出效果相比前一版本更加稳定。 此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括: * 语言一致性:缓解了中英文混杂、偶发异常字符等情况; * Agent 能力:进一步优化了 Code Agent 与 Search Agent 的表现。 “Terminus”源自拉丁语,意为“终点、完结”之意,或许代表了 DeepSeek V3 这一大版本的最终更新,后续的更新或将开启新版本。 快速入口: https://ppio.com/llm/deepseek-deepseek-v3.1-terminus 开发者文档: https://ppio.com/docs/model/overview DeepSeek-V3.

By PPIO
PPIO首发上线Qwen3-Next-80B-A3B

PPIO首发上线Qwen3-Next-80B-A3B

今天,阿里通义千问发布了下一代基础模型 Qwen3-Next-80B-A3B,该模型已经首发上线 PPIO! Qwen3-Next 系列采用了“混合注意力机制”——引入业内前沿的“线性注意力机制”,与经典的“全注意力机制”混搭使用,该架构专为极长上下文和超大规模参数性能而优化。 现在,PPIO 上线了 Qwen3-Next-80B-A3B-Instruct 和 Qwen3-Next-80B-A3B-Thinking,其上下文长度为 64k,价格为每百万 tokens 输入,每百万 tokens 输出。 前往 PPIO 官网或点击文末阅读原文即可体验,新用户填写邀请码【LYYQD1】注册可得 15 元代金券。 # 01 Qwen3-Next 的架构创新 Qwen3-Next 系列代表了 Qwen 系列下一代的基础模型,专为极长上下文和超大规模参数性能而优化。 这一系列引入了一套架构创新,旨在最大化性能的同时最小化计算成本: * 混合注意力(Hybrid Attention):用

By PPIO
一文看懂2025年Agent六大最新趋势|AI专栏

一文看懂2025年Agent六大最新趋势|AI专栏

2025 年被称为通用 Agent 元年。从 Manus 到各类 Deep Research 产品,掀起了 Agent 热潮。 按照 OpenAI 的定义,通往 AGI 之路有五个阶段,而 Agent 正值 L3 阶段。 PPIO AI 专栏基于过去三年模型与 Agent 生态的技术进展,总结了 Agent 行业的最新六大趋势,分别是: 1. 什么是 Agent “套壳”,以及为什么套壳被严重低估 2. Agent 定义:广义的 Agent 面向企业级,狭义的 Agent 面向消费级 3. 代码模型是当前阶段推动 Agent

By PPIO
PPIO姚欣出席首届AI国际人才峰会:AI落地需先找对“钉子”再选好“锤子”

PPIO姚欣出席首届AI国际人才峰会:AI落地需先找对“钉子”再选好“锤子”

8 月 26 日,由香港投资管理有限公司(下称 “港投公司”)与北京智源人工智能研究院(下称 “智源研究院”)联合主办的首届 “AI 国际人才峰会” 在香港成功举办。香港特别行政区政府财政司司长陈茂波、港投公司行政总裁陈家齐、智源研究院理事长黄铁军等出席并致辞。 峰会还汇聚了加拿大皇家科学院院士张大鹏教授、美国国家工程院院士 David Srolovitz 教授、英国皇家工程院院士 Sethu Vijayakumar 教授等全球人工智能领域顶尖专家、海内外青年学者,以及不同产业的 AI 初创企业,共同围绕 AI 前沿技术发展、产业实践以及生态建设展开交流互动。PPIO 联合创始人兼 CEO 姚欣受邀出席峰会并发表题为《从 PPTV 到 PPIO:赋能全球 AI 创业者》的演讲,从自身创业经历出发,同与会者分享 AI 时代创业者所需的特质。

By PPIO
PPIO出席中国算力大会 首席科学家王晓飞获评“青年先锋人物”

PPIO出席中国算力大会 首席科学家王晓飞获评“青年先锋人物”

近日,中国算力大会在山西大同成功举办,PPIO 首席科学家王晓飞教授受邀参加并出席同期活动“算力中国·星耀之夜”,他在活动上分享了分布式算力网络的理论研究以及创新成果,同时荣获“中国青年先锋人物”称号。 在“算力中国·星耀之夜”交流活动上,王晓飞以“面向大模型服务的分布式算力网络——迈向通用人工智能之路”为题进行分享。他提出,算力资源分布存在“马太效应”与长尾供需难题,网络需要实现精准调度和抗熵演进,并通过“核心+边缘”分层协同,探索算力网络的新发展范式。 王晓飞在演讲中指出,围绕分布式算力赋能大模型与智能体应用, PPIO 目前已取得多项突破:构建了覆盖全球 4000+ 节点的分布式算力网络;依托自研 FP8 算法与 KV Cache 优化,大幅提升推理性能并降低显存消耗,同时打造了兼容主流框架的智能体基座,支撑大规模高效运行。 他强调,人工智能正加速迈向 Agentic AI 时代。因此,

By PPIO
PPIO首发上线DeepSeek-V3.1,Agent 能力大幅提升

PPIO首发上线DeepSeek-V3.1,Agent 能力大幅提升

刚刚,DeepSeek 正式发布 DeepSeek-V3.1,该模型相比此前 DeepSeek 系列模型拥有更高的思考效率和更强的 Agent 能力,在工具使用与智能体任务中的表现大幅提升。 DeepSeek-V3.1 采用混合推理架构,同时支持思考模式与非思考模式,且官方上下文均已扩展为 128K。经 PPIO 优化后,DeepSeek-V3.1 上下文长度可拓展至 160k,处理长文本及复杂问题的能力进一步增强。 快速入口: https://ppio.com/llm/deepseek-deepseek-v3.1 模型特征 * 工具调用/智能体支持增强 据 DeepSeek 官方发布消息,通过 Post-Training 优化,DeepSeek-V3.1 拥有更强工具调用和任务处理能力。 在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.

By Saiki
PPIO上线Baichuan-M2:全球最强开源医疗模型

PPIO上线Baichuan-M2:全球最强开源医疗模型

今日,PPIO 上线百川医疗增强大模型 Baichuan-M2,该模型是目前全球最强开源医疗模型。 在 HealthBench 医疗健康评测中,Baichuan-M2 以 60.1 的高分,反超 OpenAI 最新开源模型 gpt-oss120b(得分 57.6),优于众多前沿闭源模型,是目前最接近 GPT-5 医疗能力的开源模型 。 在 PPIO 平台,Baichuan-M2 的价格为: 输入: ¥0.5/百万 tokens 输出: ¥0.5/百万 tokens 快速入口: https://ppio.com/llm/baichuan-baichuan-m2-32b 模型特点 医疗复杂问题处理能力比肩 GPT-5 相比于医疗考试,真实医疗场景往往更加复杂。

By Saiki
PPIO上线智谱GLM-4.5V

PPIO上线智谱GLM-4.5V

今天,PPIO 首发上线智谱新一代视觉推理模型 GLM-4.5V,该模型基于 GLM-4.5-Air 基础架构开发,继承了 GLM-4.1V-Thinking 的技术路线,采用 1060 亿参数的混合专家(MoE)架构实现高效扩展。 GLM-4.5V 具备全方位的视觉理解能力,包括图像/视频分析、图形界面交互、复杂文档处理以及精准的视觉元素定位等核心能力。 在中国 GeoGuessr 地理定位挑战赛中,GLM-4.5V 仅用 16 小时就超越了 99% 的人类选手(共 21000 人参与),一周内攀升至第 66 名。 在 PPIO 平台,GLM-4.5V 的价格为:输入: ¥4.5/

By PPIO
热门显卡折扣来袭!长租单卡低至9.9元/小时

热门显卡折扣来袭!长租单卡低至9.9元/小时

H100 是英伟达(NVIDIA)目前最顶级的显卡之一,专为 AI 训练和高性能计算设计。 在深度学习训练、科学模拟等前沿领域,H100 凭借其卓越的并行计算能力和高效的显存管理能力,为各类复杂计算任务提供了强大的硬件支持。 为降低企业算力使用门槛,PPIO 推出 H100 显卡专项优惠计划,按需租用 H100 单卡低至 12.9 元/时,长期租用更可享单卡 9.9 元/时的超值价格,让高性能计算触手可及。 H100 性能一览 H100 基于 Hopper 架构,采用台积电 4nm 制程,相较前代 A100(Ampere 架构,7nm),在能效比、计算密度上提升巨大,主要特性如下: * 架构:Hopper * CUDA核心数:

By Saiki
我在PPIO WAIC展台,亲历Agentic AI的现在与未来

我在PPIO WAIC展台,亲历Agentic AI的现在与未来

7 月 26 日至 29 日,2025 世界人工智能大会(WAIC)在上海世博展览馆盛大召开。作为中国领先的分布式云计算服务商,PPIO 携 AI 智能体平台全产品矩阵亮相 H2-D125 展位,吸引数十万名开发者、企业客户及行业伙伴驻足参观。 一、三大核心展项 解锁Agentic AI无限潜能 在本届 WAIC 上,PPIO 围绕“开发者友好、企业可落地”构建三大核心展区: Agent沙箱:作为国内首款兼容 E2B 接口的Agent沙箱,该产品是专为 Agent 执行任务设计的云端运行环境,为 Agent 赋予安全可靠、高效敏捷的“手和脚”。展台前,来自国内外的开发者围绕安全性、高频调用等问题,与技术团队展开深入交流,对该展项表现出浓厚兴趣。 模型服务:PPIO

By Saiki
一文看懂Agent的9种“记忆系统” | AI专栏

一文看懂Agent的9种“记忆系统” | AI专栏

对 AI Agent 来说,“记忆”指的是它在多轮交互中保留信息、上下文、用户偏好、任务细节的能力。就像一个助理需要记住老板昨天布置的任务一样,AI Agent 也必须“有记性”,才能真正完成连续性的任务。 但 AI 并不天然拥有记忆,它只有 “上下文窗口” —— 就是我们每次和模型交互时,把前面的对话再“重新发一遍”,它才“看得见过去”。 问题来了:上下文窗口有长度限制,信息多了就塞不下;重复发送也会导致 token 成本高昂。 所以,研究者和开发者们就发明了很多不同的“记忆策略”,来让 Agent 更聪明、更节省资源。 AI 工程师 Fareed Khan 总结了 9 种主流 AI Agent Memory 技术方式,以及这些技术各自的优点和缺点。

By Saiki
WAIC 2025 | SHIXP将与PPIO共建分布式智算枢纽平台

WAIC 2025 | SHIXP将与PPIO共建分布式智算枢纽平台

2025 年 7 月 29 日,由上海市工商联数字经济商会主办的“ WAIC CONNECT 数据产业智能化创新场景发布会”暨“上海市工商联数字经济商会数据产业发展专委会揭牌仪式”在上海成功举办。 会上,国家(上海)新型互联网交换中心(以下简称“SHIXP”)与派欧云(以下简称“PPIO”)举行了“共建分布式智算枢纽平台”战略合作签约仪式。 SHIXP 市场部总监蔡欣与 PPIO 智算研发副总裁李星星代表双方进行了战略合作签约,SHIXP 董事长郑荣良与 PPIO 联合创始人兼 CEO 姚欣共同出席见证。 SHIXP 是由工业和信息化部批复成立的国家新型互联网交换中心首批试点单位之一,是实现网络之间流量集中交换的新型信息基础设施;是支撑经济社会数字转型、智能升级、融合创新的重要载体。PPIO 是中国领先的分布式云计算服务商,拥有覆盖全球 1300+ 城市的 4000+ 边缘算力节点和智能调度技术,专注为 AI、

By Saiki
PPIO亮相WAIC 2025,重磅推出国内首个Agentic AI基础设施服务平台

PPIO亮相WAIC 2025,重磅推出国内首个Agentic AI基础设施服务平台

7 月 26 日至 29 日,中国领先的独立分布式云计算服务商 PPIO 亮相 2025 世界人工智能大会暨人工智能全球治理高级别会议(WAIC)。 PPIO 联合创始人兼 CEO 姚欣在 WAIC 活动上重磅发布了国内首个 Agentic AI 基础设施(Infra)服务平台,加速 Agent 应用的开发和规模化落地。 针对 Agent 特性的开发需求,PPIO 推出了 AI 智能体平台产品,分为通用版和企业版。 通用版:以极具性价比的分布式 GPU 云底座为支撑,发布中国首款兼容 E2B 接口的 Agent沙箱,以及更适用于 Agent 构建的模型服务,为个人开发者与中小企业提供兼具性能、效率、成本优势的 AI 智能体平台。

By Saiki
PPIO上线Kimi K2高性能版,TPS翻倍至35 tokens/s

PPIO上线Kimi K2高性能版,TPS翻倍至35 tokens/s

两周前,PPIO 率先上线的 Kimi K2 Instruct 模型深受 AI 开发者的好评。 该模型在自主编程、工具调用、数学推理三大能力上表现突出。而且,PPIO 提供了 Anthropic SDK 兼容的 API 服务,开发者可轻松在 Claude Code 中使用 PPIO 提供的 Kimi K2 模型服务来完成任务。 不过,在衡量一款模型性能的时候,不仅要考量生成的质量,还要考量生成的速度。 TPS(Tokens Per Second),每秒生成的 token 数,就是衡量大模型推理速度的核心指标之一。 今天,PPIO Kimi K2 经过深度优化,TPS 从 17 tokens/

By Saiki
@开发者们:PPIO上线代码模型Qwen3-Coder,挑战Claude Sonnet4

@开发者们:PPIO上线代码模型Qwen3-Coder,挑战Claude Sonnet4

今天,PPIO 上线两款 Qwen3 系列的最新模型: * Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本—— Qwen3-235B-A22B-Instruct-2507。这是一个通用模型,放弃了此前  Qwen3 的混合思考模式,只保留了非思考模式。 * Qwen3-Coder-480B-A35B-Instruct,这是迄今为止 Qwen 最具代理能力的代码模型。 这两款模型在测试基准表现出色,分别超越了 Kimi-K2、DeepSeek-V3,代码能力可以与 Claude Sonnet4 媲美。 目前,两款模型已上线 PPIO,前往 PPIO 官网或点击文末阅读原文即可体验,新用户填写邀请码【LYYQD1】可得 15 元代金券。 快速体验入口: https://ppio.com/llm/qwen-qwen3-235b-a22b-instruct-2507 https://ppio.com/llm/qwen-qwen3-coder-480b-a35b-instruct # 01

By Saiki
PPIO发布AI报告:2025年上半年国产大模型调用量十大趋势

PPIO发布AI报告:2025年上半年国产大模型调用量十大趋势

2025年上半年,各种现象级智能体应用层出不穷,Manus、Flowith、扣子空间、Lovart、MiniMax Agent、Kimi Deep Research 等等。 智能体应用爆发背后,证明了大模型的智能水平已经达到相当可靠、可用的阶段。 其中,开源模型发展迅速,在性能上已经整体逼近甚至追平闭源模型,以 DeepSeek R1、Qwen3-235B-A22B 、Kimi K2 为代表的模型已经跻身全球 top 级模型。同时,开源模型大大降低了模型成本,AI 推理成本正以每年 10 倍的速度降低。 PPIO 提供国内主流开源模型服务,包括 DeepSeek、阿里 Qwen、MiniMax、Kimi、智谱 GLM 等,是国内开源模型服务最全面的 AI 推理云平台之一。根据 PPIO 平台的大模型

By Saiki
为什么主流大模型的上下文窗口都是128k?| 深度

为什么主流大模型的上下文窗口都是128k?| 深度

近期 AI 圈正在流行一个新的概念——Context Engineering(上下文工程),它被 AI 专家安德烈·卡帕西称为“在上下文窗口中填充下一步所需的恰到好处的信息的精细艺术与科学”。 上下文工程的前提是大模型充足的上下文窗口。如果梳理大模型的上下文窗口会发现,今天主流模型基本都把 128k 作为上下文的标准长度。 在闭源模型阵营中,GPT-4-Turbo、GPT-4o 都支持 128k 上下文窗口,Gemini 1.5 Pro 也以 128k 作为标准窗口(企业版可选更高);在开源模型阵营中,Qwen3 系列将 128k 作为上下文标配,DeepSeek V3/R1 的官方最大上下文长度是128k,近期刚刚发布的 Kimi K2 的上下文长度也是 128k 。 当然,很多模型也在尝试把上下文拓展到更大的长度。比如,PPIO 将 DeepSeek

By Saiki
PPIO上线Kimi-K2-instruct,参数达1万亿

News

PPIO上线Kimi-K2-instruct,参数达1万亿

今天,PPIO 上线 Kimi K2 模型,该模型采用 MoE 架构基础模型,总参数 1T,激活参数 32B。 该模型在代码、Agent、数学推理任务处理上表现突出,在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩。 据月之暗面透露,Kimi K2 的预训练阶段使用 MuonClip 优化器,实现万亿参数模型的稳定高效训练。 Kimi K2 模型支持 128k 上下文,价格为输入: ¥4/百万 tokens,输出: ¥16/百万 tokens。 快速体验入口: https:

By Saiki
开启内测|国内首款兼容E2B接口的Agent沙箱

开启内测|国内首款兼容E2B接口的Agent沙箱

今天,PPIO Agent沙箱服务正式开启内测,这是国内首款兼容 E2B 接口的 Agent沙箱。 Agent沙箱是一款专为 AI Agent 场景设计的新一代运行时基础设施,是 Agent 真正可以行动的操作系统底座。该技术为 AI Agent 提供隔离运行环境,允许 Agent 在安全、受限的条件下执行代码。这种沙箱环境可以防止 Agent 访问或篡改系统之外的资源,确保其行为不会对系统造成损害。 Agent沙箱通常可以应用于数据处理、图表生成与可视输出、编程、页面原型即时运行、云端轻量桌面任务以及长任务运行等 Agent 场景。 Agent沙箱支持 Python、JavaScript、C++ 等主流语言,除代码外还支持网页浏览、系统命令、文案管理等行为,并且提供标准化 API / SDK,无缝衔接主流的 AI Agent 框架和工具,支持代码自动生成与执行闭环。 PPIO

By Saiki
为什么Agent Sandbox会成为下一代AI应用的基石?| 深度

technology

为什么Agent Sandbox会成为下一代AI应用的基石?| 深度

2023 年夏天,当 OpenAI 在 ChatGPT 中悄然上线了一个名为“Code Interpreter(代码解释器)”的功能时,很少有人意识到,这标志着一个全新 AI Agent Infra 技术时代的开启。 在基础的聊天、写文章的功能之上,Code Interpreterr 赋予了 ChatGPT 执行代码的能力,让 ChatGPT 能像一个真正的数据分析师那样,运行 Python 代码、分析数据、生成图表。 然而,这就像打开了潘多拉的魔盒——强大的能力伴随着未知的风险。如果 AI 生成的代码是恶意的呢?如果它试图访问系统文件、删除数据、或者向外发送敏感信息呢? 这个古老而永恒的安全问题,催生了一个全新的技术分支:Agent Sandbox——专为 AI Agent 量身定制的安全沙箱技术。 预告一下,

By Saiki
PPIO上线MiniMax-Hailuo-02:全球排名第二的视频模型

PPIO上线MiniMax-Hailuo-02:全球排名第二的视频模型

今天,PPIO 首发上线 MiniMax 最新发布的最新视频生成模型 Hailuo 02! Hailuo 02 可生成 6 秒的 768P 或 1080P 分辨率超清视频,以及 10秒的 768P 分辨率视频。该模型拥有顶尖的指令遵循能力,能够处理极端物理场景,比如做特技表演。 在 Artificial Analysis 最新的图生视频排行榜上,Hailuo 02 位列第二。 现在,你可以通过以下方式在 PPIO 平台使用 MiniMax-Hailuo-02 了! PPIO 官网快速体验入口: https://ppio.cn/model-api/playground#minimax-hailuo-02 API 开发者文档: https://ppio.cn/docs/

By Saiki
PPIO上线MiniMax-M1-80k:全球首个开源大规模混合架构推理模型

PPIO上线MiniMax-M1-80k:全球首个开源大规模混合架构推理模型

今天,PPIO 首发上线 MiniMax-M1,这是全球首个开源大规模混合架构的推理模型。 MiniMax-M1 采用混合专家 (MoE) 架构,并结合闪电注意力机制。该模型总共包含 4560 亿个参数,每个令牌激活了 459 亿个参数。M1 模型原生支持 100 万个令牌的上下文长度,是 DeepSeek R1 上下文大小的 8 倍。同时MiniMax-M1 结合 CISPO 算法与混合注意力设计的高效强化学习训练,在长输入推理与真实软件工程场景中实现了业界领先的性能。 因为相对高效的训练和推理算力使用,该模型可以以业内最低的价格提供 API 服务。PPIO 平台的 MiniMax M1-80k 价格为:输入¥4/百万 tokens,输出 ¥16/百万 tokens,上下文窗口为128k。 快速体验入口:

By Saiki
PPIO上线Qwen3-Embedding系列模型

News

PPIO上线Qwen3-Embedding系列模型

今天,PPIO 已上线 Qwen3-Embedding 系列模型! Qwen3-Embedding 系列模型是 Qwen 模型家族的新成员。该系列模型专为文本表征、检索与排序任务设计,基于 Qwen3 基础模型进行训练,充分继承了 Qwen3 在多语言文本理解能力方面的优势。 Qwen3-Embedding 系列模型并非 chat 模型,需要通过 API 调用。现在,您可以到 PPIO 官网接入 API 进行体验。 PPIO 登录地址: https://ppio.cn/?utm_source=official_wechat 如果你是新用户,填写邀请码【N7EUVY】注册还可以得 15 元代金券。此外,通过你的专属邀请码每成功邀请一位好友并完成实名认证,还可以额外获得 30 元代金券。

By Saiki
PPIO受邀参展碳博会“民企双碳行动足迹”展台,展示绿色智算创新成果

News

PPIO受邀参展碳博会“民企双碳行动足迹”展台,展示绿色智算创新成果

6 月,由上海市国际贸易促进委员会主办的 2025 上海国际碳中和技术、产品与成果博览会(以下简称“碳博会”)在沪圆满落幕。受上海市工商业联合会邀请,作为绿色人工智能计算领域民营企业代表,PPIO 亮相碳博会“民企双碳行动足迹”展台,集中展示绿色智算技术创新成果,彰显民营科技企业在推动“双碳”战略中的积极作用。 展会由主题展览、系列论坛、贸易对接三大板块构成,展览规模达 4 万平方米,吸引来自德国、荷兰、日本、瑞典、西班牙、英国等 15 个国家和地区的 300 余家知名企业参展,为全球低碳科技创新企业搭建交流展示平台。 在“民企双碳行动足迹”展台,PPIO 作为受邀参展企业,重点展示了基于分布式计算架构打造的超低 PUE 绿色智算网络,以及碳足迹可视化管理系统。通过整合跨时空闲置算力资源,采用分布式调度系统,PPIO 实现了算力资源利用率提升 50%

By Saiki