PPIO发布AI报告:2025年上半年国产大模型调用量十大趋势

PPIO发布AI报告:2025年上半年国产大模型调用量十大趋势

2025年上半年,各种现象级智能体应用层出不穷,Manus、Flowith、扣子空间、Lovart、MiniMax Agent、Kimi Deep Research 等等。

智能体应用爆发背后,证明了大模型的智能水平已经达到相当可靠、可用的阶段。

其中,开源模型发展迅速,在性能上已经整体逼近甚至追平闭源模型,以 DeepSeek R1、Qwen3-235B-A22B 、Kimi K2 为代表的模型已经跻身全球 top 级模型。同时,开源模型大大降低了模型成本,AI 推理成本正以每年 10 倍的速度降低。

PPIO 提供国内主流开源模型服务,包括 DeepSeek、阿里 Qwen、MiniMax、Kimi、智谱 GLM 等,是国内开源模型服务最全面的 AI 推理云平台之一。根据 PPIO 平台的大模型 tokens 调用量,我们总结了 2025 上半年国内大模型十大趋势。


如果你对本 AI 趋势报告感兴趣,可以扫码下载报告原文。


趋势一:

DeepSeek 与 Qwen 分别占据半壁江山,是国内最受欢迎的两大开源模型

去年开源模型的影响力远没有今年大,很多人也并不认为开源模型的性能可以与闭源模型媲美。但 DeepSeek 的出现改变了这一局面。

DeepSeek 有两个大版本,一是 base 模型 V3,首发于 2024 年 12 月,并在 2025 年 3 月 24 日发布更新版本;二是推理模型 R1,首发于 2025 年 1 月,并在 2025 年 5 月 28 日发布更新版本。2025 年第一季度,DeepSeek 模型一枝独秀,在 PPIO 的使用占比高达 99%。直到 5 月份后,DeepSeek 的使用量占比开始有所下降,主要是因为更多优秀模型出现,用户对于模型的选择更加多元化了。

Qwen 就是其中的一个代表。PPIO 目前上线了 Qwen 的三个系列——Qwen2、Qwen2.5 和 Qwen3,前两者是 2024 年发布的模型,Qwen3 在今年 4 月 29 日首发上线 PPIO 。从 2025 年第二季度开始,PPIO 平台的 Qwen 模型的使用量开始高速增长,到 5 月下旬时调用量占比超过一半,最高时达 56%,与 DeepSeek 一同称为最受欢迎的两大开源模型。


趋势二:

尽管 DeepSeek R1 为代表的推理模型引领了强化学习的技术范式,但 DeepSeek V3 这一类非推理模型却更受欢迎

推理模型始于 OpenAI o1 模型,特指使用强化学习、思维链(CoT)等技术来训练的模型,可以将复杂任务场景通过多步骤推理生成答案,思考时间越长,模型性能越强。PPIO 平台上线的推理模型包括 DeepSeek R1、Qwen QwQ、Qwen3 系列、GLM Z1 等。

2025 年 2 月份,推理模型受到广大 AI 开发者的青睐,其全平台的使用量占比保持在 50% 以上。但从 3 月份开始,非推理模型的使用量反超推理模型,并一直延续至今。

这一现象在 DeepSeek 的推理模型 R1 和非推理模型 V3 的调用量中也得到了印证。2025 年 2 月份,R1 在 DeepSeek 模型中的 tokens 调用量要高于 V3,占比超过50%。但从 3 月份开始,R1 之外的非推理模型  tokens 调用量逐渐上升,并长期保持在 60% 以上。

DeepSeek V3 比 DeepSeek R1 更受欢迎,这一现象背后的原因在于不同模型适用于不同的用户需求。

DeepSeek V3 这一类基础模型适用于日常对话、文本生成、多语言处理等高频需求,用户面广,使用门槛低,而且这一类应用场景通常并不需要复杂的推理过程;而 DeepSeek R1 专攻数学竞赛、代码逻辑等深度推理任务,而且由于深度推理需要消耗更多算力,输出成本更高,R1 百万 tokens 成本大约是 V3 的 2 倍左右。


趋势三:

DeepSeek 的数学模型、蒸馏模型的用户使用量较小,更大的意义在于推动行业研究

在 V3 与 R1 两大主力模型之外,DeepSeek 还开源了 Prover V2 数学模型,以及基于 Qwen 等基础模型的 R1 蒸馏模型。

Prover 是 DeepSeek 专门为数理逻辑与高复杂度任务而设计的数学模型,PPIO 在 4 月 30 日 首发上线了 Prover V2 671B;R1 蒸馏模型则是基于 Qwen 模型而蒸馏的 1.5B、7B、14B、32B 四个不同型号的模型,在数学基准测试上优于 GPT-4 和 Claude-3.5-Sonnet,甚至在多项能力上对标 o1-mini,PPIO 也在第一时间部署上线。

由于这两个系列的模型面向的用户场景较为垂直,相比 V3 与 R1 的使用量较小,仅占 DeepSeek 系列的 1% 。不过,这两款模型对于推动 AI 行业的基础研究有着重要的意义。


趋势四:

免费的 Qwen 2.5 调用量远高于性能更强的 Qwen 3,说明相比模型性能,价格依然是用户选型最关心的因素之一

Qwen 是国内最早的开源模型,生态布局广泛。在 2025 年 Hugging Face 的全球开源大模型榜单中,排名前十位的模型全是基于 Qwen 系列二次开发的。

在 PPIO 平台的 Qwen 模型中,最受欢迎的是 Qwen2.5。PPIO 在 4月下旬针对 Qwen2.5-7B-instruct 等模型开放限时免费活动,该系列模型的 tokens 消耗激增,整体消耗占 Qwen 系列整体的 90% 以上。即使在 Qwen3 发布后,Qwen 2.5 依然保持了强劲的用户需求。

如果抛开免费模型,Qwen3 的 tokens 消耗量占据 Qwen 付费模型的 23.48%,在 5 月中旬的使用量一度达到 37%。Qwen3 在业内率先支持混合思考模式,支持 119 种语言和方言,针对模型编码和代理能力做了重点优化,并增强了对 MCP 的支持。


趋势五:

在图片生成模型中,文生图与图生图的调用量占比约为 9:1

PPIO 平台不仅提供大语言模型 API 服务,也提供图像与视频生成等多模态 API 服务,但在不同场景用户有不同的使用偏好。

在生图领域,用户更喜欢使用文生图模型而非图生图模型。2025 年上半年,文生图模型的使用占比从 1 月份的 70% 增长到 6 月份的 90%。

相比图生图,文生图的创作门槛更低,文字描述可以更加精准地传达用户的想法与创意,并为用户提供更多的创意灵感。而且,文生图模型经过大量的数据训练,能够生成具有较高美学价值和质量的图像。


趋势六:

在视频生成模型中,文生视频与图生视频的调用量约为 1:9

视频生成模型的用户使用习惯与图片生成模型恰恰相反,用户更加侧重于图生视频而非文生视频。图生视频模型的使用占比从 1 月份的 20% 左右,增到到 6 月份的 90% 以上。

图片生成视频模型的优势在于可控性更高,稳定性更好。相比文生视频常见的不确定性和难以控制的结果,图生视频模型能够更好地保证视频生成的质量和连贯性,同时也符合视频创作者的从业习惯和工作流程。在视频生成领域常见的工作流是,先用文生图模型生成图片,再用该图片生成视频。

图片

趋势七:

Stable Diffusion XL 逐渐替代 Stable Diffusion 1.5,成为最受欢迎的图片生成模型基础架构

在生图领域,Stable Diffusion 1.5 与 Stable Diffusion XL 是两大最受欢迎的生图模型基础架构,有大量模型基于这两大架构进行二次微调,合计占据平台使用量的80%以上。其中,SD1.5 可支持二次元、卡通与写实风格,SDXL 更适合写实、摄影、插画等细腻风格。

从 3 月下旬开始,SDXL 系列模型使用量迅速增长,反超 SD 1.5系列模型。SD 1.5 系列模型的使用量在 2 月份高达65%左右,但到5月份已经降低到 22% 左右;SDXL 系列模型的使用量在 2 月份为 18% 左右,到 5 月份已经增长到 70%。

究其原因,SDXL 由于参数量更大且采用 Base 模型和 Refiner 模型组合,生成图像细节、色彩、对比度更优,生成图片细节丰富,对自然语言理解更强,社区支持和插件兼容性也逐渐提升。

Flux.1 模型的整体占比在 3% 左右,未见有明显的增长。


趋势八:

阿里万相是国内最受欢迎的开源视频模型

在 2 月份,视频生成模型主要有两类:一是文生视频的 AnimateDiff,这是基于 Stable Diffusion 的动画生成工具,使用量占比大约在70%左右;二是图生视频的 Stable Video Diffusion,使用量占比大约在20%左右。

从 3 月份开始,腾讯的开源视频模型 Hunyuan Video 与阿里的开源视频模型 Wanxiang(万相)上线后,国内开源视频模型开始高速增长。到 6 月份,阿里 Wanxiang 使用量占全平台的 80%以上,成为 PPIO 平台最受欢迎的国产视频开源模型。

6月份,PPIO 首发上线 MiniMax-Hailuo-02 视频模型,这是全球范围内图生视频领域排名第二的 SOTA 模型,上线第一周就斩获了 1.5% 的使用量。


趋势九:

出海需求高涨,约 20% 用户的 AI 应用场景面向海外

全球 AI 市场空间是国内的几倍,海外用户对 AIGC 产品的创造性和付费意愿可能比国内更强,如东南亚、非洲等地区市场潜力大。国内 AI 领域的创业团队和独立开发者更灵活、更迅速地在全球市场崛起。

在 PPIO 平台,有不少客户“立足国内,服务全球”,有大约 20% 的 AI 应用场景面向海外。


趋势十:

2025,智能体大爆发

大模型的业务场景分布在各行各业。可以说,从国有银行到街边奶茶店,从手术台到炼钢炉,大模型已没有行业死角。

在 PPIO 平台。情感陪伴类应用、创意内容生产类工具、办公效率类工具以及高校科研项目是对 AI 最大需求方。

同时,2025 年上半年智能体应用也在快速爆发,Manus、Flowith、扣子空间、Lovart、MiniMax Agent、Kimi Deep Research 等智能体获得了非常高的关注度。

针对智能体应用,PPIO 平台将在 WAIC 期间正式发布Agent Sandbox(沙箱)产品,敬请期待。

最后,如果你对本 AI 趋势报告感兴趣,可以扫码下载报告原文。

Read more

PPIO入选36氪“2026最具价值成长企业100”

PPIO入选36氪“2026最具价值成长企业100”

近日,PPIO 入选 36 氪发布的“2026 最具价值成长企业 100”榜单。 该榜单评选聚焦顺应产业变革、构建长期核心竞争力、持续创造商业与产业价值的创新企业,旨在发掘在新一轮科技变革与产业升级中脱颖而出的成长标杆。与 PPIO 同批入选的还有 DeepSeek、Kimi、阶跃星辰、穹彻智能等一批领先的人工智能/大模型公司。 PPIO 此次入选,体现了其在技术创新与商业化落地方面的综合实力,也反映出行业与市场对 AI 基础设施赛道发展前景的持续看好。 PPIO 是全球领先的 AI 云计算服务商,致力于帮助更多企业、开发者和智能体应用以更低成本、更高效率使用 AI 基础设施服务。 面向 AI 原生应用、智能体开发、AI 编程、多模态应用和企业级大模型服务等新一代需求,PPIO 提供高性价比、超弹性、低延迟的一站式 AI 云平台服务,覆盖

By luigi
香港特区政府财政司司长陈茂波一行到访 PPIO

香港特区政府财政司司长陈茂波一行到访 PPIO

6 月 18 日上午,香港特别行政区政府财政司司长陈茂波一行到访 PPIO 上海总部,参观 PPIO 企业展厅,并围绕人工智能基础设施建设、AI 云服务发展、产业生态协同以及香港创新科技发展等议题开展座谈交流。PPIO 联合创始人、董事长兼 CEO 姚欣等接待来访并参加座谈。 此次来访体现了香港特区政府对人工智能基础设施、分布式AI 云计算以及新一代 AI 服务平台发展的高度关注,也为 PPIO 进一步发挥自身技术与平台优势、深化香港布局、连接国际市场提供了重要交流契机。   来访期间,陈茂波司长一行参观了PPIO 展厅,详细了解 PPIO 的发展历程、技术架构、全球业务布局,以及公司在分布式 算力、模型推理服务、Agentic Cloud、智能体基础设施和全球开发者生态等方面的最新进展。   座谈会上,双方围绕AI产业发展趋势、算力基础设施建设、模型服务能力、AI 应用落地、香港国际化平台优势及未来合作方向等内容进行了深入交流。

By luigi
PPIO入选中国信通院Token服务能力攀登计划

PPIO入选中国信通院Token服务能力攀登计划

6 月 16 日,中国信通院正式发布“Token 服务能力攀登计划”。PPIO 凭借在 MaaS 模型服务性能、稳定性和 Token 输出效率方面的表现,入选首批企业级 Token 服务性能攀登基线。 在通用场景下,PPIO 模型服务实现 TPS ≥55 个/秒、TTFT ≤0.9 秒、调用成功率 ≥99.9%,标志着其模型平台已具备面向企业级 AI 应用和 Agent 场景的高质量 Token 服务能力。 PPIO 此次入选,体现了其在模型推理服务能力、AI 云基础设施建设和企业级 Token 服务质量方面获得权威行业机构认可。 同时,PPIO 还受邀参加高质量词元(Token)服务专题研讨,

By luigi
PPIO首发上线GLM-5.2:代码能力仅次于Claude Fable 5

PPIO首发上线GLM-5.2:代码能力仅次于Claude Fable 5

今天,PPIO 首发上线智谱最新开源旗舰模型 GLM-5.2。 其核心特点如下: ✅Coding 能力开源 SOTA:GLM-5.2 发布即获 LMArena 代码榜开源模型第一、全球模型二,整体表现仅次于 Claude Fable 5; ✅支持真正可用的 1M 上下文:一次任务即可完成“从需求到多端可部署产物“的完整开发链路; ✅自主规划驱动高效迭代:引领开发模式从 Vibe Coding 迈向 Agentic Engineering,构建“规划-实现-迭代”的工程闭环; ✅万级真实任务验证:构建逾万个可验证任务环境,覆盖九大主流编程语言,大幅提升模型软件工程能力。 现在,GLM-5.2 已上线 PPIO 模型广场,您可以在线试用该模型或通过 API 快速集成。  地址:https:

By PPIO