PPIO上线GLM-4-0414系列模型及Qwen2.5-7B-Instruct模型

PPIO上线GLM-4-0414系列模型及Qwen2.5-7B-Instruct模型

早在今年 3 月,智谱就曾预告会在 4 月中旬开源新的 GLM 模型,果然,GLM-4-0414 系列准时登场。

此次开源的新模型覆盖基座、推理、沉思三大类型,根据官方公布数据显示,部分模型可在性能上比肩 OpenAI 的 GPT-4o 和 DeepSeek 的 V3/R1 系列模型。

作为一站式 AIGC 云服务平台,PPIO派欧云随即上线了上述模型及 Qwen2.5-7B-Instruct 限时免费版,并对模型进行了全链路优化,在保持原始模型精度的前提下大幅降低推理延迟,开发者通过 API 接口即可高效调用模型。


模型特点

基座模型 GLM-4-32B/9B-0414

GLM-4-32B-0414 基于 15T 高质量数据预训练,融入推理类合成数据,强化了指令遵循、工程代码生成、函数调用等原子能力。并且,该模型在工程代码、Artifacts 生成、函数调用、搜索问答及报告撰写等任务上均表现出色,部分指标已接近或超越 GPT-4o、DeepSeek-V3 等更大模型水平。

e.g.请分析近三年五一热门出游地,输出包含趋势预测和推荐出游地区的报告文章。


推理模型 GLM-Z1-32B/9B-0414

推理模型 GLM-Z1-0414系列,在基座模型基础上,通过冷启动强化学习,优化数学、代码、逻辑推理能力,显著提升复杂任务解决效率。在部分任务上,GLM-Z1-32B-0414 凭借 32B 参数,性能已能与拥有 671B 参数的 DeepSeek-R1 相媲美。

GLM-Z1-9B-0414 尽管参数更小,但在数学推理及通用任务上依然表现出色,在资源受限的场景下,该模型可以很好地在效率与效果之间取得平衡,为需要轻量化部署的用户提供强有力的选择。

e.g.证明“任一大于 2 的偶数可写成两个素数之和”,并验证当偶数为 100 时的具体素数组合。


沉思模型 GLM-Z1-Rumination-32B-0414

沉思模型 GLM-Z1-Rumination-32B-0414 可通过更多步骤的深度思考来解决高度开放与复杂的问题,并且能在深度思考过程中整合搜索工具处理复杂任务,在研究型写作、复杂检索任务中表现突出。

此外,PPIO派欧云还同步上线 Qwen/Qwen2.5-7B-Instruct,相比 Qwen2,Qwen2.5 知识储备显著提升,并在编程和数学能力上有大幅增强,在指令理解与执行、生成长文本(超过 8K tokens )、理解结构化数据(如表格)、以及生成结构化输出方面表现优秀。

PPIO派欧云致力于为企业及开发者提供高性能的 API 服务,目前已上线 DeepSeek R1/V3 Turbo、Qwen 等系列模型,仅需一行代码即可调用。并且,PPIO 通过 2024 年的实践,已经实现大模型推理的 10 倍 + 降本,实现推理效率与资源使用的动态平衡。

目前,以上模型均已上线 PPIO派欧云官网,thudm/glm-4-9b-0414、thudm/glm-z1-9b-0414、qwen/qwen2.5-7b-instruct 限时免费中,点击以下链接立即体验。

在线体验:https://ppinfra.com/model-api/product/llm-api

API 文档:https://ppinfra.com/docs/model/llm

Read more

PPIO首发上线DeepSeek-V3.1-Terminus

PPIO首发上线DeepSeek-V3.1-Terminus

刚刚,PPIO 首发上线 DeepSeek-V3.1 的更新版本 DeepSeek-V3.1-Terminus!该版本的模型输出效果相比前一版本更加稳定。 此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括: * 语言一致性:缓解了中英文混杂、偶发异常字符等情况; * Agent 能力:进一步优化了 Code Agent 与 Search Agent 的表现。 “Terminus”源自拉丁语,意为“终点、完结”之意,或许代表了 DeepSeek V3 这一大版本的最终更新,后续的更新或将开启新版本。 快速入口: https://ppio.com/llm/deepseek-deepseek-v3.1-terminus 开发者文档: https://ppio.com/docs/model/overview DeepSeek-V3.

By PPIO
PPIO首发上线Qwen3-Next-80B-A3B

PPIO首发上线Qwen3-Next-80B-A3B

今天,阿里通义千问发布了下一代基础模型 Qwen3-Next-80B-A3B,该模型已经首发上线 PPIO! Qwen3-Next 系列采用了“混合注意力机制”——引入业内前沿的“线性注意力机制”,与经典的“全注意力机制”混搭使用,该架构专为极长上下文和超大规模参数性能而优化。 现在,PPIO 上线了 Qwen3-Next-80B-A3B-Instruct 和 Qwen3-Next-80B-A3B-Thinking,其上下文长度为 64k,价格为每百万 tokens 输入,每百万 tokens 输出。 前往 PPIO 官网或点击文末阅读原文即可体验,新用户填写邀请码【LYYQD1】注册可得 15 元代金券。 # 01 Qwen3-Next 的架构创新 Qwen3-Next 系列代表了 Qwen 系列下一代的基础模型,专为极长上下文和超大规模参数性能而优化。 这一系列引入了一套架构创新,旨在最大化性能的同时最小化计算成本: * 混合注意力(Hybrid Attention):用

By PPIO
一文看懂2025年Agent六大最新趋势|AI专栏

一文看懂2025年Agent六大最新趋势|AI专栏

2025 年被称为通用 Agent 元年。从 Manus 到各类 Deep Research 产品,掀起了 Agent 热潮。 按照 OpenAI 的定义,通往 AGI 之路有五个阶段,而 Agent 正值 L3 阶段。 PPIO AI 专栏基于过去三年模型与 Agent 生态的技术进展,总结了 Agent 行业的最新六大趋势,分别是: 1. 什么是 Agent “套壳”,以及为什么套壳被严重低估 2. Agent 定义:广义的 Agent 面向企业级,狭义的 Agent 面向消费级 3. 代码模型是当前阶段推动 Agent

By PPIO
PPIO姚欣出席首届AI国际人才峰会:AI落地需先找对“钉子”再选好“锤子”

PPIO姚欣出席首届AI国际人才峰会:AI落地需先找对“钉子”再选好“锤子”

8 月 26 日,由香港投资管理有限公司(下称 “港投公司”)与北京智源人工智能研究院(下称 “智源研究院”)联合主办的首届 “AI 国际人才峰会” 在香港成功举办。香港特别行政区政府财政司司长陈茂波、港投公司行政总裁陈家齐、智源研究院理事长黄铁军等出席并致辞。 峰会还汇聚了加拿大皇家科学院院士张大鹏教授、美国国家工程院院士 David Srolovitz 教授、英国皇家工程院院士 Sethu Vijayakumar 教授等全球人工智能领域顶尖专家、海内外青年学者,以及不同产业的 AI 初创企业,共同围绕 AI 前沿技术发展、产业实践以及生态建设展开交流互动。PPIO 联合创始人兼 CEO 姚欣受邀出席峰会并发表题为《从 PPTV 到 PPIO:赋能全球 AI 创业者》的演讲,从自身创业经历出发,同与会者分享 AI 时代创业者所需的特质。

By PPIO