Latest

PPIO上线Qwen-VL-8B/30B、GLM-4.5-Air等多款中小尺寸模型

News

PPIO上线Qwen-VL-8B/30B、GLM-4.5-Air等多款中小尺寸模型

今天,PPIO 上线多个中小尺寸新模型,包括 Qwen3-VL 系列的 8B/30B,以及智谱的 GLM-4.5-Air。 Qwen3-VL 系列是 Qwen3 家族最新发布的视觉理解模型,每个尺寸都有 Instruct 和 Thinking 两大版本。 其中,Qwen3-VL-8B 是稠密(Dense)视觉理解模型,显存占用更低;Qwen3-VL-30B 是 MoE 模型,激活参数仅 3B,体积更小,性能依旧强劲。 GLM-4.5-Air 是此前 GLM-4.5 系列的小尺寸版本,拥有 106B 总参数和 12B 激活参数。 GLM-4.5-Air 是一个混合推理模型,用于复杂推理和工具使用的思考模式,以及用于即时响应的非思考模式。

By PPIO
2025年Q3 tokens调用量趋势:国产开源模型“一超三强”

technology

2025年Q3 tokens调用量趋势:国产开源模型“一超三强”

昨天,我们发布了 2025 年 Q3 海外大模型 tokens 调用量趋势。 海外 AI 推理市场由闭源模型厂商主导,Google、Anthropic、OpenAI 以及 xAI 四家闭源模型占据了60%-80% 的市场份额。 但在国内恰恰相反, DeepSeek 掀起的开源浪潮还在继续,Qwen、GLM、Kimi、百度、MiniMax 等模型公司纷纷拥抱开源。 今天,基于第三季度 PPIO 平台的开源模型调用量表现,我们总结出国内 AI 推理市场五大趋势。 趋势一:国产开源模型“一超三强” 在第三季度,DeepSeek 仍然是用户调用量最大的开源模型,最高占据 90% 以上的市场份额,比上个季度进一步增长。 阿里 Qwen 系列在第三季度的大部分时间里都是用户调用量第二大的开源模型,且用量非常稳定,市场占有率在

By PPIO
2025年Q3大模型tokens调用量观察:Grok逆袭,DeepSeek弥坚

technology

2025年Q3大模型tokens调用量观察:Grok逆袭,DeepSeek弥坚

2025 年第三季度,大模型市场又有哪些新的变化? 基于 OpenRouter 过去三个月的 tokens 调用数据,我们能看到总 token 使用量排名及趋势、不同大模型的市场份额占比、细分领域模型的应用偏好等趋势。 OpenRouter 的数据主要反映了海外闭源模型的调用量趋势。预告一下,下一篇我们将基于 PPIO 数据,分析国产开源模型在国内市场的调用量趋势。 # 01 Tokens 调用量高速增长,Grok 逆袭 * 2025 年第三季度,OpenRouter 的 tokens 调用总量相比上个季度继续增长,9 月份每周平均消耗超过 4T tokens,大约是上个季度周消耗的两倍。也就是说,AI 推理市场仍在高速增长。 * 在 tokens 消耗前二十的模型中,Grok 是一个新面孔。今年上半年,Grok 系列模型表现平平,一直被归类于 Others。但在第三季度,

By PPIO
PPIO上线智谱GLM-4.6,Coding 能力创国产模型新高

News

PPIO上线智谱GLM-4.6,Coding 能力创国产模型新高

今天,PPIO 上线智谱旗舰模型 GLM-4.6。 GLM-4.6 是智谱最强的代码 Coding 模型,较 GLM-4.5 提升 27%,在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。 1. 高级编码能力:在公开基准与真实编程任务中,GLM-4.6 的代码能力对齐 Claude Sonnet 4,是国内已知的最好的 Coding 模型。 2. 上下文长度:上下文窗口由 128K 提升至 200K,适应更长的代码和智能体任务。 3. 推理能力:推理能力提升,并支持在推理过程中调用工具。、搜索能力:增强模型的工具调用和搜索智能体,在智能体框架中表现更好。 4. 写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。

By PPIO
DeepSeek-V3.2-Exp发布,有哪些新变化?

News

DeepSeek-V3.2-Exp发布,有哪些新变化?

今天,DeepSeek 突然发布新版本模型 DeepSeek-V3.2-Exp,PPIO 已经首发上线! DeepSeek-V3.2-Exp 是 DeepSeek 新模型的实验版本,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 “DeepSeek 稀疏注意力机制(DeepSeek Sparse Attention)”,旨在探索和验证在长上下文场景下训练和推理效率的优化。 该实验版本代表了 DeepSeek 对更高效的 Transformer 架构的持续研究,特别注重提高处理扩展文本序列时的计算效率。 1. DeepSeek 稀疏注意力首次实现了细粒度稀疏注意力,在保持几乎相同的模型输出质量的同时,显著提高了长上下文训练和推理效率。DeepSeek-V3.2-Exp 支持 160K 上下文。 2. 为了严格评估引入稀疏注意力机制的影响,DeepSeek 特意将 DeepSeek-V3.2-Exp 的训练配置与 V3.1-Terminus 进行了对齐。

By PPIO
PPIO首席科学家王晓飞教授荣登“终身科学影响力排行榜”

News

PPIO首席科学家王晓飞教授荣登“终身科学影响力排行榜”

近日,美国斯坦福大学(Stanford University)与国际权威学术出版社爱思唯尔(Elsevier)共同发布 2025 年全球前 2% 顶尖科学家榜单(World's Top 2% Scientists)。PPIO 首席科学家、天津大学教授、博导王晓飞教授入选榜单,并同时跻身 “终身科学影响力排行榜” 与 “年度科学影响力排行榜”。 此次入选不仅体现了王晓飞教授在人工智能与分布式计算领域的卓越学术贡献,也进一步巩固了 PPIO 作为全球领先的分布式 AI 云计算服务商的行业地位。 全球前 2% 顶尖科学家榜单评选涵盖全球超 800 万名科学家的职业生涯和年度学术表现,通过引用次数、h指数等多维数据计算生成。因其标准化和透明性,该榜单被公认为国际学术界和产业界衡量学者影响力的重要参照。 王晓飞教授现任天津大学计算机学院副院长,研究领域涵盖人工智能计算、分布式云计算和边缘智能等,已发表 SCI 及国际会议论文 220 余篇,总引用量超 12000

By PPIO
企业大模型选型指南:100位CIO总结的16条采购建议

technology

企业大模型选型指南:100位CIO总结的16条采购建议

生成式 AI 的落地分为两大场景,消费级与企业级。对于消费级 AI,我们可以通过 similarweb 等第三方网站获取其流量与用户使用情况;而对于企业级 AI,则需要参考专业的调研机构数据。 几个月前,知名投资机构 a16z 发布了一篇深度调研报告,通过一手访谈 20 多家企业级 AI 客户,以及 15 个行业的 100 位首席信息官(CIO),总结了 2025 年及未来企业如何使用、购买和规划新一代人工智能的 16 条建议。 AI 是一个快速变化的领域,今年的 AI 的市场结构已经比去年发生明显转变。这些趋势包括: * 企业级 AI 预算超出了本已很高的预测,并从试点项目和创新基金升级为核心 IT 和业务部门预算中的经常性支出项目。 * 企业在混合搭配多种模型以在性能和成本之间进行优化方面变得更加成熟。OpenAI、Google 和 Anthropic

By PPIO
PPIO首发上线DeepSeek-V3.1-Terminus

News

PPIO首发上线DeepSeek-V3.1-Terminus

刚刚,PPIO 首发上线 DeepSeek-V3.1 的更新版本 DeepSeek-V3.1-Terminus!该版本的模型输出效果相比前一版本更加稳定。 此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括: * 语言一致性:缓解了中英文混杂、偶发异常字符等情况; * Agent 能力:进一步优化了 Code Agent 与 Search Agent 的表现。 “Terminus”源自拉丁语,意为“终点、完结”之意,或许代表了 DeepSeek V3 这一大版本的最终更新,后续的更新或将开启新版本。 快速入口: https://ppio.com/llm/deepseek-deepseek-v3.1-terminus 开发者文档: https://ppio.com/docs/model/overview DeepSeek-V3.

By PPIO
PPIO首发上线Qwen3-Next-80B-A3B

News

PPIO首发上线Qwen3-Next-80B-A3B

今天,阿里通义千问发布了下一代基础模型 Qwen3-Next-80B-A3B,该模型已经首发上线 PPIO! Qwen3-Next 系列采用了“混合注意力机制”——引入业内前沿的“线性注意力机制”,与经典的“全注意力机制”混搭使用,该架构专为极长上下文和超大规模参数性能而优化。 现在,PPIO 上线了 Qwen3-Next-80B-A3B-Instruct 和 Qwen3-Next-80B-A3B-Thinking,其上下文长度为 64k,价格为每百万 tokens 输入,每百万 tokens 输出。 前往 PPIO 官网或点击文末阅读原文即可体验,新用户填写邀请码【LYYQD1】注册可得 15 元代金券。 # 01 Qwen3-Next 的架构创新 Qwen3-Next 系列代表了 Qwen 系列下一代的基础模型,专为极长上下文和超大规模参数性能而优化。 这一系列引入了一套架构创新,旨在最大化性能的同时最小化计算成本: * 混合注意力(Hybrid Attention):用

By PPIO
一文看懂2025年Agent六大最新趋势|AI专栏

technology

一文看懂2025年Agent六大最新趋势|AI专栏

2025 年被称为通用 Agent 元年。从 Manus 到各类 Deep Research 产品,掀起了 Agent 热潮。 按照 OpenAI 的定义,通往 AGI 之路有五个阶段,而 Agent 正值 L3 阶段。 PPIO AI 专栏基于过去三年模型与 Agent 生态的技术进展,总结了 Agent 行业的最新六大趋势,分别是: 1. 什么是 Agent “套壳”,以及为什么套壳被严重低估 2. Agent 定义:广义的 Agent 面向企业级,狭义的 Agent 面向消费级 3. 代码模型是当前阶段推动 Agent

By PPIO
PPIO姚欣出席首届AI国际人才峰会:AI落地需先找对“钉子”再选好“锤子”

News

PPIO姚欣出席首届AI国际人才峰会:AI落地需先找对“钉子”再选好“锤子”

8 月 26 日,由香港投资管理有限公司(下称 “港投公司”)与北京智源人工智能研究院(下称 “智源研究院”)联合主办的首届 “AI 国际人才峰会” 在香港成功举办。香港特别行政区政府财政司司长陈茂波、港投公司行政总裁陈家齐、智源研究院理事长黄铁军等出席并致辞。 峰会还汇聚了加拿大皇家科学院院士张大鹏教授、美国国家工程院院士 David Srolovitz 教授、英国皇家工程院院士 Sethu Vijayakumar 教授等全球人工智能领域顶尖专家、海内外青年学者,以及不同产业的 AI 初创企业,共同围绕 AI 前沿技术发展、产业实践以及生态建设展开交流互动。PPIO 联合创始人兼 CEO 姚欣受邀出席峰会并发表题为《从 PPTV 到 PPIO:赋能全球 AI 创业者》的演讲,从自身创业经历出发,同与会者分享 AI 时代创业者所需的特质。

By PPIO
PPIO出席中国算力大会 首席科学家王晓飞获评“青年先锋人物”

News

PPIO出席中国算力大会 首席科学家王晓飞获评“青年先锋人物”

近日,中国算力大会在山西大同成功举办,PPIO 首席科学家王晓飞教授受邀参加并出席同期活动“算力中国·星耀之夜”,他在活动上分享了分布式算力网络的理论研究以及创新成果,同时荣获“中国青年先锋人物”称号。 在“算力中国·星耀之夜”交流活动上,王晓飞以“面向大模型服务的分布式算力网络——迈向通用人工智能之路”为题进行分享。他提出,算力资源分布存在“马太效应”与长尾供需难题,网络需要实现精准调度和抗熵演进,并通过“核心+边缘”分层协同,探索算力网络的新发展范式。 王晓飞在演讲中指出,围绕分布式算力赋能大模型与智能体应用, PPIO 目前已取得多项突破:构建了覆盖全球 4000+ 节点的分布式算力网络;依托自研 FP8 算法与 KV Cache 优化,大幅提升推理性能并降低显存消耗,同时打造了兼容主流框架的智能体基座,支撑大规模高效运行。 他强调,人工智能正加速迈向 Agentic AI 时代。因此,

By PPIO