PPIO上线GLM-OCR:0.9B参数SOTA性能,支持一键部署

PPIO 算力市场首发上线了 GLM-OCR 模型模板。GLM-OCR 以 0.9B 的参数规模,在 OmniDocBench V1.5 基准测试中取得了 94.6 分的 SOTA 表现,并在公式识别、复杂表格解析及信息抽取等高难度场景中展现出显著优势。

PPIO上线GLM-OCR:0.9B参数SOTA性能,支持一键部署

PPIO 算力市场首发上线了 GLM-OCR 模型模板。作为一款兼具“轻量化”与“高精度”的专业级 OCR 模型,GLM-OCR 以 0.9B 的参数规模,在 OmniDocBench V1.5 基准测试中取得了 94.6 分的 SOTA 表现,并在公式识别、复杂表格解析及信息抽取等高难度场景中展现出显著优势。

现在,开发者可以通过 PPIO 算力市场,将该模型一键部署在 GPU 云服务器上。无需繁琐的环境配置,只需简单几步,即可快速调用并体验其高效、精准的文档解析能力,以更低的算力成本接入业务系统。

一键部署地址:

https://ppio.com/gpu-instance/

#01 GPU 实例+模板,一键部署 GLM-OCR

step 1: 子模版市场选择对应模板,并使用此模板。

step 2: 按照所需配置点击部署。

step 3: 检查磁盘大小等信息,确认无误后点击下一步。

step 4: 稍等一会,实例创建需要一些时间。

step 5: 在实例管理里可以查看到所创建的实例。

#02 使用示例

GLM-OCR 模板支持标准的大模型接口格式(OpenAI-compatible)。部署成功后,开发者无需学习新的 API 规范,只需通过简单的 curl 命令或现有 SDK 即可快速接入。

注意:需要将http://localhost:8000替换为您真正的访问地址

curl -sS http://127.0.0.1:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-ocr",
    "messages": [
      {
        "role": "user",
        "content": [
          { "type": "text", "text": "Text Recognition:" },
          { "type": "image_url", "image_url": { "url": "https://b0.bdstatic.com/ugc/HH-A0qTDkRlm6XZuGRFAsQ011d39f49244e4aadc2b34f17cd87d04.jpg" } }
        ]
      }
    ],
    "max_tokens": 256,
    "temperature": 0
  }'|jq .

PPIO 的算力市场模板致力于帮助企业及个人开发者降低大模型私有化部署的门槛,无需繁琐的环境配置,即可实现高效、安全的模型落地。

目前,PPIO算力市场已上线几十个私有化部署模板,除了 GLM-OCR,你也可以将DeepSeek-OCR-2、 AutoGLM-Phone-9B、 GLM-Image、PaddleOCR-VL 等模型快速进行私有化部署。

Read more

Qwen3.5重磅发布 PPIO 模型服务平台同步上线

Qwen3.5重磅发布 PPIO 模型服务平台同步上线

近日,阿里巴巴全新一代大模型千问 Qwen3.5 重磅开源发布,凭借突破性性能登顶全球最强开源模型榜单。 PPIO 模型服务平台在第一时间完成 Qwen3.5-Plus 与 Qwen3.5-397B-A17B 双版本的全面适配与上线,让企业与开发者无需等待,即可率先享受新一代多模态大模型的技术红利。 Qwen3.5 系列模型堪称 “性能与效率的完美平衡体”,总参数3970 亿,激活 170 亿参数即可运转,实现了 “以小胜大” 的技术突破 —— 性能全面超越万亿参数的 Qwen3-Max 模型,同时部署显存占用直降 60%,最大推理吞吐量提升至 19 倍。这一飞跃背后,是其融合线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)的创新架构。 作为原生视觉-语言模型,作为原生视觉-语言模型, Qwen3.5-Plus/Qwen3.5-397B-A17B在推理、

By PPIO
PPIO 上线 MiniMax M2.5:体验架构师级编程与高效 Agent 能力

PPIO 上线 MiniMax M2.5:体验架构师级编程与高效 Agent 能力

PPIO 上线了 MiniMax M2.5 模型。 MiniMax M2.5 是 MiniMax 发布的最新旗舰模型。据官方介绍,M2.5 在编程、工具调用、搜索及办公等生产力场景中均达到或刷新了行业的 SOTA(State-of-the-art)水平。该模型优化了对复杂任务的拆解能力,大幅提升了运行速度,并凭借极佳的 Token 效率,让无限运行复杂 Agent 在经济上成为可能。 现在,你可以到 PPIO 官网体验 MiniMax M2.5 或者调用模型 API。 地址: https://ppio.com/llm/minimax-minimax-m2.5 01 模型特征 * 架构师级编程思维,胜任全栈开发 MiniMax

By PPIO