News

PPIO独家上新GPU实例模板，一键部署Kimi-Linear

PPIO

31 Oct 2025 — 4 min read

昨晚，月之暗面发布了混合线性注意力架构新模型 Kimi-Linear，旨在解决大语言模型在长上下文推理中的计算瓶颈。

Kimi-Linear 的核心亮点：

Kimi Delta Attention（KDA），一种通过细粒度门控机制改进门控规则的线性注意力架构。
混合架构：采用 3:1 的 KDA 与全局 MLA 比例，在保持甚至超越全注意力质量的同时降低内存占用。
卓越性能：在 1.4T Token 的训练规模下，经公平对比，KDA 在长文本与类强化学习基准等多项任务上均优于全注意力。
高吞吐：在 1M 上下文中实现最高 6 倍的解码吞吐量，显著缩短单输出 Token 耗时（TPOT）。

今天，PPIO 独家上新 GPU 实例模板，可一键部署 Kimi-Linear-48B-A3B-Instruct 的专属模型。

PPIO 算力市场的 GPU 实例模板是将大语言模型进行私有化部署的模板，方便企业及个人开发者降低模型部署成本，实现高效、安全调用。

在线体验：

https://ppio.com/gpu-instance/console/explore

# 01

PPIO GPU 私有化部署模板

一键部署 Kimi-Linear

Step 1: 在 PPIO 算力市场的子模版市场选择 Kimi-Linear 的对应模板，并使用此模板。

Step 2: 按照所需配置点击部署。

Step 3: 检查磁盘大小、计费方式等信息，确认无误后点击下一步。

Step 4: 稍等一会，实例创建需要一些时间。

Step 5: 在实例管理里可以查看到所创建的实例。

Step 6: 查看实例日志，确保服务正常启动。

Step 7: 点击启动 Web Terminal 选项，启动后点击连接选项即可连接到网页终端。

# 02

如何使用？

访问您的私有模型，注意请将下文中的

“http://127.0.0.1:8080” 替换为您真正的访问地址，复制以下代码，访问您的私有模型！

curl --request POST \
  --url http://127.0.0.1:8080/v1/chat/completions \
  --header "Authorization: Bearer " \
  --header "Content-Type: application/json" \
  --data '{
      "model": "moonshotai/Kimi-Linear-48B-A3B-Instruct",
      "messages": [
        {"role": "user", "content":"who are you？"}
      ],
      "max_tokens": 128
  }'
 {"id":"chatcmpl-de7c4de865e94699b80eb1a0d0bc9f22","object":"chat.completion","created":1761904682,"model":"moonshotai/Kimi-Linear-48B-A3B-Instruct","choices":[{"index":0,"message":{"role":"assistant","content":"I'm Kimi, a large language model trained by Moonshot AI. I'm here to help you with any questions or tasks you have. How can I assist you today?","refusal":null,"annotations":null,"audio":null,"function_call":null,"tool_calls":[],"reasoning_content":null},"logprobs":null,"finish_reason":"stop","stop_reason":163586,"token_ids":null}],"service_tier":null,"system_fingerprint":null,"usage":{"prompt_tokens":11,"total_tokens":46,"completion_tokens":35,"prompt_tokens_details":null},"prompt_logprobs":null,"prompt_token_ids":null,"kv_transfer_params":null}

将 API 地址配置到您的 Cherry Studio 等应用，就可以拥有专属模型及聊天助手！

目前，PPIO 算力市场已上线几十个私有化部署模板，除了 Kimi-Linear，你可以将 DeepSeek-R1-Distill-Qwen-1.5B、StableDiffusion:v1.10、PaddleOCR-VL 等模型快速进行私有化部署。

如果你有企业级 Model API 需求，可扫下方二维码获取报价与权益说明。

PPIO姚欣：AI正在进入自主行动与创造时代，智能体需要全新的操作系统｜MEET2026

https://mp.weixin.qq.com/s/8r9GasreUKly0HgbiHM7Cg

PPIO获得量子位年度「杰出产品」「潜力创业公司」「焦点人物」三项AI大奖

12 月 10 日，由量子位主办的 MEET2026 智能未来大会在北京召开。会上，「2025 人工智能年度榜单」正式揭晓，该榜单从技术领先性、长期投入、产品落地能力与产业口碑等多维度综合评估，集中呈现了今年中国 AI 生态中最具代表性的创新力量。 PPIO 凭借扎实的技术底座与持续创新能力，一举获得「2025 人工智能年度潜力创业公司」「2025 人工智能年度杰出产品」「2025 人工智能年度焦点人物」三项重磅荣誉。 # 01 PPIO Agent沙箱入选「2025人工智能年度杰出产品」 PPIO Agent沙箱与月之暗面 Kimi、Minimax Agent、智谱 Z.ai、字节跳动豆包和扣子、腾讯 ima.copilot、AWS Kiro等产品，一同入围「2025 人工智能年度杰出产品」。今年，PPIO

首批试点！PPIO获评“数字企业出海服务平台”试点单位，助力数字出海服务体系建设

12 月 6 日，2025 上海数字城市活动月主题日活动在黄浦江畔正式启幕。本次活动以‘数城新景智呈未来’为主题，汇聚上海市数据局、临港集团、上海电信等政企代表及行业智库，集中发布数字出海服务体系重磅成果。作为中国领先的独立分布式云计算服务商，PPIO 受邀参展，并被授予“2025 年上海市数字出海服务平台”试点单位，标志着 PPIO 的跨境算力服务、数字出海技术支撑能力获官方认可。今年以来，上海以数字出海服务体系建设为核心牵引，持续推动各类服务资源的互联互通与集约共享，全力打造国际数字贸易发展新高地。在 2025 上海数字城市活动月主题日的数字企业出海服务论坛上，上海市数据局正式发布数字企业出海服务平台首批试点名单，历经申报筛选、专家评审、综合核验等多轮严格流程，PPIO 成功入选首批数字企业出海服务平台试点发布名单中。这批试点单位覆盖跨境数据、合规咨询、数字营销、智能制造、跨境电商、内容平台等多个关键细分领域，形成了面向数字出海企业的首批专业服务供给矩阵。活动现场，上海市数据局为包括 PPIO 在内的32家试点单位颁发荣誉牌匾。平台试点的推出，

PPIO上线智谱AutoGLM-Phone-9B：快速体验Phone Agent

今天，智谱开源了 Phone Agent。 Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架，能够以多模态方式理解手机屏幕内容，并通过自动化操作帮助用户完成任务。这不仅是一个模型，而是一整套可以「拿来就用」的能力，包括： * 训练好的核心模型； * Phone Use 能力框架与工具链； * 可直接跑通的 Demo，覆盖 50+ 高频中文 App； * 针对 Android 的适配层与示例工程； * 文档、快速上手指南。今天，PPIO 独家上新 GPU 实例模板，可一键部署 Phone Agent 的底层模型 AutoGLM-Phone-9B。基于该模型和框架，你可以搭建完整的 Phone Agent 应用，只需用自然语言描述需求，如“打开小红书搜索美食”，Phone