PPIO上线Qwen-VL-8B/30B、GLM-4.5-Air等多款中小尺寸模型

PPIO上线Qwen-VL-8B/30B、GLM-4.5-Air等多款中小尺寸模型

今天,PPIO 上线多个中小尺寸新模型,包括 Qwen3-VL 系列的 8B/30B,以及智谱的 GLM-4.5-Air

Qwen3-VL 系列是 Qwen3 家族最新发布的视觉理解模型,每个尺寸都有 Instruct 和 Thinking 两大版本。

其中,Qwen3-VL-8B 是稠密(Dense)视觉理解模型,显存占用更低;Qwen3-VL-30B 是 MoE 模型,激活参数仅 3B,体积更小,性能依旧强劲。

GLM-4.5-Air 是此前 GLM-4.5 系列的小尺寸版本,拥有 106B 总参数和 12B 激活参数。

GLM-4.5-Air 是一个混合推理模型,用于复杂推理和工具使用的思考模式,以及用于即时响应的非思考模式。

现在,你可以到 PPIO 官网(也可点击文末阅读原文)在线体验,或将模型 API 接入 Cherry Studio 等第三方 AI 应用以及你自己的 AI 工作流中。

新用户填写邀请码【24CGOJ】注册可得 15 元代金券。

快速入口:

https://ppio.com/llm/qwen-qwen3-vl-8b-instruct

https://ppio.com/llm/qwen-qwen3-vl-30b-a3b-instruct

https://ppio.com/llm/qwen-qwen3-vl-30b-a3b-thinking

https://ppio.com/llm/zai-org-glm-4.5-air


# 01 小尺寸,大性能

Qwen3-VL 系列的目标,是让模型不仅能“看到”图像或视频,更能真正看懂世界、理解事件、做出行动。

为此,该模型在多个关键能力维度上做了系统性升级,力求让视觉大模型从“感知”走向“认知”,从“识别”迈向“推理与执行”。

其中,Qwen3-VL-30B-A3B-Instruct 与 Thinking 仅需 30 亿激活参数,即可在 STEM、视觉问答(VQA)、光学字符识别(OCR)、视频理解、智能体(Agent)任务等多个领域媲美 GPT-5-Mini 和 Claude4-Sonnet,甚至表现更优。

Qwen3-VL-8B 在 STEM、VQA、OCR、视频理解和Agent任务等公开评测上表现优异,不仅超越 Gemini 2.5 Flash Lite 和 GPT-5 Nano,甚至可以媲美上一代超大尺寸模型 Qwen2.5-VL-72B。

GLM-4.5-Air 是智谱 GLM-4.5 系列的小尺寸版本。GLM-4.5 系列旨在将推理、编码和智能体能力统一到一个模型中,以满足快速增长的智能体应用日益复杂的需求。

在涵盖智能体(3 项)、推理(7 项)和编程(2 项)的 12 个基准测试上将 GLM-4.5 与来自 OpenAI、Anthropic、Google DeepMind、xAI、阿里巴巴、月之暗面和深度求索的各种模型进行比较,GLM-4.5 排名第 3,GLM-4.5 Air 排名第 6。


# 02 实测效果

我们用两组提示词分别测试一下模型的效果。

针对 Qwen3-VL-30B,我们测试一下其视觉理解能力。

将下方图片发给模型,得到的回复如下:

这张图是一张信息流图(Sankey diagram),展示了人们使用 ChatGPT 的主要目的。图表的标题是“人们用 ChatGPT 做什么?”,它将用户的主要使用动机与他们具体执行的任务联系起来。

根据图表,我们可以提取以下信息:

(1)主要使用动机 (左侧)

图表首先将用户的使用行为分为六个主要类别:

实用指导 (Practical Guidance): 占比 28.3%

写作 (Writing): 占比 28.1%

寻求信息 (Seeking Information): 占比 21.3%

技术帮助 (Technical Help): 占比 7.6%

多媒体 (Multimedia): 占比 5.9%

自我表达 (Self-Expression): 占比 4.3%

(2)具体使用任务 (右侧)

这些主要动机被进一步细分为各种具体的任务,并显示了每个任务所占的百分比。

实用指导 (Practical Guidance) 的细分:

询问特定信息 (Asking for Specific Info): 18.3%

编辑或批评提供的文本 (Edit Or Critique Provided Text): 10.6%

写作 (Writing) 的细分:

辅导或教学 (Tutoring Or Teaching): 10.2%

操作指南 (How-To Advice): 8.5%

个人写作或沟通 (Personal Writing Or Communication): 8%

健康、健身、美容等 (Health, Fitness, Beauty etc.): 5.7%

寻求信息 (Seeking Information) 的细分:

翻译 (Translation): 4.5%

创建图像 (Create An Image): 4.2%

计算机编程 (Computer Programming): 4.2%

其他/未知 (Other / Unknown): 4.1%

创意构思 (Creative Ideation): 3.9%

论证或摘要 (Argument Or Summary): 3.6%

技术帮助 (Technical Help) 的细分:

数学计算 (Mathematical Calculation): 3%

可购买产品 (Purchasable Products): 2.1%

问候和闲聊 (Greetings And Chitchat): 2%

多媒体 (Multimedia) 的细分:

关系和个人反思 (Relationships And Personal Reflection): 1.9%

写小说 (Write Fiction): 1.4%

生成或检索其他媒体 (Generate Or Retrieve Other Media): 1.1%

烹饪和食谱 (Cooking And Recipes): 0.9%

自我表达 (Self-Expression) 的细分:

分析图像 (Analyze An Image): 0.6%

关于模型的提问 (Asking About The Model): 0.4%

游戏和角色扮演 (Games And Role Play): 0.4%

数据分析 (Data Analysis): 0.4%

(3)数据来源

数据来源: OpenAI 研究 (OPENAI STUDY)

时间: 2025 年 9 月

样本: 随机抽取的 110 万条消息

总结

该图表表明,人们最常使用 ChatGPT 进行实用指导和写作,这两个类别的使用率最高(分别为 28.3% 和 28.1%)。在这些大类中,最常见的子任务是“询问特定信息”和“辅导或教学”。

此外,从“寻求信息”类别中衍生出的“创建图像”和“计算机编程”也显示出较高的使用频率,反映了 AI 在创意和编码领域的应用日益广泛。

针对 GLM-4.5-Air,我们测试其编码能力。

提示词:

Using SVG animation to show the development history of language models(使用SVG动画展示语言模型的发展历程)。

回复如下:

I'll create an animated SVG timeline that visualizes the evolution of language models from their early beginnings to the modern era of large language models.

This SVG animation showcases the evolution of language models through:

  1. Timeline Progression: The main timeline appears first,followed by each milestone,appearing sequentially
  2. Color-Coded Eras: Different gradients represent different eras:· Brown tones for early rule-based systems· Blue tones for statistical methods· Purple tones for neural network approaches· Red/orange for the transformer revolution· Green for the current LLM era
  3. Animated Elements:· Pulsing circles at each milestone with different intensities for major breakthroughs· Sequential appearance of each milestone· Progress bar at the bottom showing overall progression· Floating particles for visual interest
  4. Key Milestones Highlighted:· Early rule-based systems (1950s)· ELIZA chatbot (1966)· Statistical methods (1980s-90s)· Word2Vec embeddings (2013)· Seq2Seq models (2014)· Attention mechanism & Transformer (2017) - emphasized with larger circle· BERT pre-training (2018)· GPT series (2018+)· Large Language Models (2020s) - emphasized with larger circle· Future possibilities

The animation creates a visually engaging way to understand how language models have evolved from simple rule-based systems to the sophisticated large language models we have today.

关于 PPIO

PPIO 是中国领先的独立分布式云计算服务商,由 PPTV 创始人、前蓝驰创投投资合伙人姚欣和前 PPTV 首席架构师王闻宇于2018年联合创立,致力于为人工智能、智能体、实时音视频处理、具身智能等新一代场景,提供极致⾼性价⽐、超弹性、低延迟的⼀站式智算、模型及边缘计算服务。

根据 CIC (China lnsights Consultancy) 的资料,按2024年收入计,PPIO 是中国最大的独立边缘云公司,运营着中国最大的算力网络。按日均 tokens 消耗量计,在中国独立 AI 云公司中位列前二名。

新用户现在用邀请码【24CGOJ】注册可得 15 元代金券;企业用户认证后可得 200 元代金券。

如果你有大模型 API、Sandbox、GPU 云等专属需求,可扫码联系我们👇。

Read more

PPIO入选36氪“2026最具价值成长企业100”

PPIO入选36氪“2026最具价值成长企业100”

近日,PPIO 入选 36 氪发布的“2026 最具价值成长企业 100”榜单。 该榜单评选聚焦顺应产业变革、构建长期核心竞争力、持续创造商业与产业价值的创新企业,旨在发掘在新一轮科技变革与产业升级中脱颖而出的成长标杆。与 PPIO 同批入选的还有 DeepSeek、Kimi、阶跃星辰、穹彻智能等一批领先的人工智能/大模型公司。 PPIO 此次入选,体现了其在技术创新与商业化落地方面的综合实力,也反映出行业与市场对 AI 基础设施赛道发展前景的持续看好。 PPIO 是全球领先的 AI 云计算服务商,致力于帮助更多企业、开发者和智能体应用以更低成本、更高效率使用 AI 基础设施服务。 面向 AI 原生应用、智能体开发、AI 编程、多模态应用和企业级大模型服务等新一代需求,PPIO 提供高性价比、超弹性、低延迟的一站式 AI 云平台服务,覆盖

By luigi
香港特区政府财政司司长陈茂波一行到访 PPIO

香港特区政府财政司司长陈茂波一行到访 PPIO

6 月 18 日上午,香港特别行政区政府财政司司长陈茂波一行到访 PPIO 上海总部,参观 PPIO 企业展厅,并围绕人工智能基础设施建设、AI 云服务发展、产业生态协同以及香港创新科技发展等议题开展座谈交流。PPIO 联合创始人、董事长兼 CEO 姚欣等接待来访并参加座谈。 此次来访体现了香港特区政府对人工智能基础设施、分布式AI 云计算以及新一代 AI 服务平台发展的高度关注,也为 PPIO 进一步发挥自身技术与平台优势、深化香港布局、连接国际市场提供了重要交流契机。   来访期间,陈茂波司长一行参观了PPIO 展厅,详细了解 PPIO 的发展历程、技术架构、全球业务布局,以及公司在分布式 算力、模型推理服务、Agentic Cloud、智能体基础设施和全球开发者生态等方面的最新进展。   座谈会上,双方围绕AI产业发展趋势、算力基础设施建设、模型服务能力、AI 应用落地、香港国际化平台优势及未来合作方向等内容进行了深入交流。

By luigi
PPIO入选中国信通院Token服务能力攀登计划

PPIO入选中国信通院Token服务能力攀登计划

6 月 16 日,中国信通院正式发布“Token 服务能力攀登计划”。PPIO 凭借在 MaaS 模型服务性能、稳定性和 Token 输出效率方面的表现,入选首批企业级 Token 服务性能攀登基线。 在通用场景下,PPIO 模型服务实现 TPS ≥55 个/秒、TTFT ≤0.9 秒、调用成功率 ≥99.9%,标志着其模型平台已具备面向企业级 AI 应用和 Agent 场景的高质量 Token 服务能力。 PPIO 此次入选,体现了其在模型推理服务能力、AI 云基础设施建设和企业级 Token 服务质量方面获得权威行业机构认可。 同时,PPIO 还受邀参加高质量词元(Token)服务专题研讨,

By luigi
PPIO首发上线GLM-5.2:代码能力仅次于Claude Fable 5

PPIO首发上线GLM-5.2:代码能力仅次于Claude Fable 5

今天,PPIO 首发上线智谱最新开源旗舰模型 GLM-5.2。 其核心特点如下: ✅Coding 能力开源 SOTA:GLM-5.2 发布即获 LMArena 代码榜开源模型第一、全球模型二,整体表现仅次于 Claude Fable 5; ✅支持真正可用的 1M 上下文:一次任务即可完成“从需求到多端可部署产物“的完整开发链路; ✅自主规划驱动高效迭代:引领开发模式从 Vibe Coding 迈向 Agentic Engineering,构建“规划-实现-迭代”的工程闭环; ✅万级真实任务验证:构建逾万个可验证任务环境,覆盖九大主流编程语言,大幅提升模型软件工程能力。 现在,GLM-5.2 已上线 PPIO 模型广场,您可以在线试用该模型或通过 API 快速集成。  地址:https:

By PPIO