AI正跨越鸿沟,创业者该关注什么?PPIO姚欣提出两大关键指标

AI正跨越鸿沟,创业者该关注什么?PPIO姚欣提出两大关键指标

从 23 岁在宿舍创办PPTV,到率先成立 AI 创业营,再到预见性地布局 AI 云算力基础设施 PPIO ,创业者姚欣的二十一年,是一部穿越了 PC 、移动和 AI 三次技术浪潮的“活历史”。

近日,PPIO 联合创始人兼 CEO 姚欣受邀做客36氪《AI局中人》栏目,直播中分享了他横跨 PC 互联网、移动互联网到 AI 时代的三段创业经历,并与36氪特邀主持人、蚂蚁集团 NEXTA 创新实验室项目负责人何思翀深入探讨了以下内容:

· 谈选择:放弃内卷的 AI 应用红海,他为何坚信“送水”是门更好的生意?

· 谈数据:日均 2000 亿次 Token 调用的硬核数据里,藏着你没看到的增长密码。

· 谈未来:杀手级应用不是下一个微信,而是能 24 小时为你打工的「数字生命体」。

· 谈生存:当 AI 开始抢饭碗,普通人的护城河到底该修在哪?


以下为直播访谈实录:

何思翀:

非常感谢姚总今天来到我们的直播间。我们接下来想深入聊一聊,在 AI 时代,创业者如何能够活过下一个十年。

听了您之前的分享,您的创业经历横跨了二十多年,经历了 PC 互联网、移动互联网,再到现在的 AI 浪潮,甚至包括了 AI 的 1.0 和 2.0 阶段。

我注意到您的经历中有几个非常重要的节点:

2004 年,您在华中科技大学读研期间选择休学创业,创办了 PPTV ,这在当时可以说是火遍大江南北。

然后在 2016 年,您又率先创办了全国首个聚焦科技企业的非营利性 AI 创业营,这比当时普遍的孵化器模式要前沿很多。

再到 2018 年,您再次敏锐地捕捉到趋势,创办了 PPIO ,专注于 AI 云算力。

我的问题是,在这几波创业历程中,您为什么总能率先发现机会?是基于对市场趋势的洞察,还是有一套独特的判断方法?

姚欣:

如果把这三次创业经历串联起来看,我认为在不同阶段,我的认知是在不断演进的。

第一次做 PPTV 时,更多是出于个人兴趣和机缘巧合。当时我才 23 岁,在宿舍想看球赛却没有电视,于是就萌生了在线看球的想法——既然可以在线看新闻、娱乐,为什么不能在线看球呢?所以 PPTV 的起点其实是兴趣和偶然。

但到了后续阶段,无论是 2016 年聚焦 AI ,还是创办 PPIO 布局算力分发,这些决策都更多源于对行业发展的系统观察和思考。

特别是在 2016 到 2018 年我做投资人的那三年,给了我大量时间去沉淀和反思。

我逐渐发现,每个时代的技术爆发和发展,都存在一些共通的底层要素。

我现在看待任何新兴领域,无论是 AI 还是其他科技赛道,都会重点关注两个核心指标:供给侧的技术使用成本,以及需求侧的渗透率。

在供给侧,需要关注技术使用成本是否能实现数量级的下降。以移动互联网为例,早期的 iPhone 非常昂贵,但后来小米推出千元机,红米进一步普及,使得手机成本大幅降低。同时,流量资费也从 3G 时代 1GB 几十元,降到 4G 时代的几毛钱。这种成本下降是推动普及的关键。

在需求侧,我借鉴了“跨越鸿沟”理论。当一个技术的用户渗透率达到 20% 左右,就意味着它正在从早期尝鲜者走向主流大众。例如,中国移动互联网用户突破 1.4 亿大概在 2013 - 2014 年,许多超级 APP 的崛起也都有类似的用户规模阈值。

今天看 AI ,全球 70 亿人口, 20 %就是 14 亿用户。目前 ChatGPT 用户已接近 10 亿,加上其他 AI 应用,我们正处在 AI 跨越鸿沟的过程中。

这些指标帮助我们预判行业的发展阶段,无论是自己做投资、创业,还是支持创新者,都能更有针对性地布局未来两三年。

何思翀:

基于这些预判,您提到今年可能是 AI 智能体(Agent)的元年。您如何看待 Agent 当前的发展阶段?

姚欣:

Agent 目前还处于更早期的阶段,大概只有 3 %- 5 %的尝鲜用户。相比之下,广义的 AI 应用已经处在跨越鸿沟、逐步商业化的过程中。

我常把 Agent 类比为汽车的自动驾驶分级: L2 是辅助驾驶, L3 是半自动, L4 开始接近完全自主。

今天的 Agent 大多还处于 L2 阶段,它们本质上是预设工作流,需要人工理解和配置,任务变更时调整不够灵活。

而今年初出现的像 Manus 、Genspark 这类应用,开始挑战 L3 到 L4 级别——你只需要描述任务,大模型就能理解并拆解成可执行代码,在沙箱环境中运行并返回结果。

虽然还不完美,但已经能感受到 AI 正在逐步成为能独立执行任务的数字员工。

何思翀:

从 L2 到 L4 的跃迁,最关键的因素是什么?目前还缺什么?

姚欣:

核心还是供给侧的能力,包括模型本身的能力,以及AI的应用成本。要实现数量级的提升,还需要时间。例如,我们演示的一个简单任务——让 AI 在无预设条件下操控电脑——就消耗了将近 50 万 Token ,成本几块钱。

虽然可行,但成本还不够低,识别速度也偏慢。预计还需要一到两年时间快速成熟。

何思翀:

从您的观察来看,中美在 Agent 发展上是否存在差距?

姚欣:

确实存在差距。通用的 Agent 在海外更流行,部分原因是两边的模型生态不同:中国以开源为主,海外以闭源为主。模型能力上,中美差距大约在 6 - 9 个月;但在应用生态上,差距可能达到一年到一年半。

这种差距也有其好处:我们可以先在海外打磨产品,再引入国内,利用“反向时光机”效应捕捉市场机会。

何思翀:

但当大家都看到类似机会,竞争是否会异常激烈?

姚欣:

确实如此。中国大厂在 AI 创新上非常积极,毫不懈怠。许多 AI 工具在海外兴起三个月内,国内大厂就能快速跟进。例如腾讯会议的智能纪要功能,迅速普及。

相比移动互联网时代,现在的创业者经验更丰富,但挑战也更大。

何思翀:

与移动互联网时代相比,AI 创业有哪些可以借鉴或迁移的经验?

姚欣:

商业化路径是相似的:先 To B,后 To C。移动互联网早期,也是先解决工作学习相关的需求,实现商业化;而像我们当年做视频娱乐,前期只能烧钱,到移动互联网下半场才逐渐收窄亏损。

今天能看到实现商业闭环的AI应用,大多面向企业。但这里的 To B 不太一样,它往往从企业中的个体开始,我们称之为“专业消费者”(Prosumer)——企业内具备技术能力和支付意愿的个人用户。

这些企业内的尝鲜者,与我们说的大众消费者不同。大众消费更多是为了娱乐消遣,属于“消磨时间”;而效率工具解决的是“节省时间”,商业账更容易算清楚。

无论是会议工具、聊天工具还是设计工具,这些提升效率的应用正在率先走向商业化。

何思翀:

您认为未来真正的“杀手级应用”会是什么形态?预计何时会出现?

姚欣:

如果讨论 To C 的杀手级应用,我认为它可能不再是传统意义上的 APP 。未来,我更倾向于它会是某种超级智能体或个人虚拟助手——一个全能的数字个人助理,存在于所有联网设备中。

它就像升级版的智能语音助手,随时可唤醒交互,但与现有工具有本质区别:首先,它最懂你,掌握大量个人数据;其次,它能利用模型能力主动执行任务;再者,它是你的数字分身,能与整个生态融合。

我笃定这样的产品不会由某家大厂推出,而会来自创新创业者。

何思翀:

您自己有考虑亲自打造这样的应用吗?

姚欣:

我必须承认,我可能回不到 24 岁的状态了。因此我们选择支持当年的“姚欣们”,陪伴他们成功。

PPIO 的定位是为下一代 AI 应用提供云服务,我们专注基础设施,做好支撑,伴随优秀创业者共同成长。

何思翀:

回到 PPIO 的业务,您提到平台日均有近 2,000 亿次 Token 调用。从这些数据中,您观察到哪些值得分享的信号?

姚欣:

这 2,000 亿次调用呈现明显的漏斗分布,头部 20 %的客户消耗大部分资源。有几个有趣趋势:

第一,头部客户名单每半年到一年就会洗牌,说明 AI 应用生态迭代极快,竞争激烈。去年初以聊天、陪伴类应用为主;今年则涌现大量生产工具,如编程、 Agent 类应用。

第二,商业化速度是关键。虽然大企业宣称全面拥抱 AI ,但实际应用多停留在研发部门,生产环境尚未规模化。而 To C 应用虽然用户量大,但难以商业闭环。反而是 To B 中的“ Prosumer ”成为典型客户画像,且多为全球化业务,不局限于单一市场。

何思翀:

大企业全面拥抱 AI 的挑战在哪里?为什么难以规模化?

姚欣:

AI 与传统技术不同,具有“反组织”特性。大语言模型存在幻觉问题,本质是生成式 AI 的不确定性。而大型机构在高价值场景中追求确定性,这与 AI 的特性矛盾。

目前,行业正努力解决这一问题。例如,GPT-5 的主要进步不是能力飞跃,而是准确性提升,通过多种手段减少幻觉。另一种思路是并行运行多个 Agent ,通过算力消耗换取可靠性,从 90 %提升到 99 %。

何思翀:

您预计成本和准确性这两个参数,多久能有突破?

姚欣:

作为基础设施公司,我们特别关注成本参数。 2023 年我们提出,同样模型的 Token 成本每年会下降 10 倍,持续三年,即三年降低 1000 倍。

斯坦福最近的报告显示,从 ChatGPT 发布到今年初,同等智能的 AI 模型成本已下降约 280 倍。我们可能修正为四年下降一万倍。同时, Token 用量呈现四五个数量级的增长。这意味着,同样的花费, AI 能力每年提升十倍。

何思翀:

AI 编程能力的爆发,是今年您印象最深刻的变化吗?

姚欣:

是的,尤其我作为计算机背景的创业者。现在我用 AI 编程搭建小系统,内部也在推动组织变革。

AI编程的重要性在于:

第一,它是智能的标志,以前被认为高智商的工作, AI 也能胜任;

第二,代码意味着自动化和智能, AI 能生成代码,就意味着它能控制计算机,未来所有计算机可完成的任务, AI 都可能代劳。

在硅谷,甚至有人认为 AGI (通用人工智能)两三年内就会到来,因为编码能力的质变意味着AI能自动生成、处理和管理,实现 L4 级自动驾驶就等于 AGI 。

何思翀:

在推动组织拥抱 AI 方面,您采取了哪些具体措施?

姚欣:

我们设定目标,推动公司全员具备编程能力,包括 HR 、财务等非技术同事。我身体力行,用 AI 生成会议 PPT 、战略研究报告,甚至让行政团队搭建简单系统。

关键不是技术能力,而是意愿。越资深、越成功的组织成员,面对变革的阻力越大。

我们通过营造氛围,甚至制造一定的危机感,推动大家意识到:在 AI 时代,每个职场人必须能力迁移。

何思翀:

这似乎对中后台员工提出了更高要求?

姚欣:

我们挑战的目标是全员可编程。这不是要求大家成为专家,而是具备问题描述、任务拆解和检查的能力。这种能力在 AI 时代前就已重要,现在更为关键。

我认为大学教育也需为 AI 时代调整。未来的职场要求不再是单一技能,而是成为综合决策者、调度者和分配者。

何思翀:

AI 会如何改变组织形态和生产关系?

姚欣:

超级个体化已是趋势,即使没有 AI 也在发生。但 AI 加剧了两极分化:平台会更垄断,个体能力提升但更碎片化。最受冲击的是中间规模的企业——不如个体灵活,又缺乏平台效应。

创业者也在走向两极。全球 AI 融资的 70 %- 80 %流向少数巨头,它们占据过半的市场收入、人才和资本。模型层走向赢者通吃,应用层刚刚开始,但壁垒和门槛是关键问题。

何思翀:

面对这种不确定性,创业者如何修炼心智,坚定自己的道路?

姚欣:

创业者的宿命就是面对不确定性。

我的底层信念有两条:

第一,相信科技进步。今天的性能效率问题,终会随着技术发展而解决。

第二,相信颠覆式创新。新一代创新与之前不同,这种开放性正是创业者的机会。

创业者必须回归第一性原理,挑战技术和产品的本质。作为基础设施公司,我们的核心指标是资源利用率——如何降低全球算力闲置率,提升资源利用效率。这与技术发展的本质一致:不断提升对地球资源的利用效率。

第一次创业是误打误撞,凭兴趣出发;这次创业,我们的目标是将开创的技术写入下一代计算机教材,成为奠基者。因此我们不在意短期起伏,关注长期本质。

何思翀:

做出不做大模型的决策艰难吗?

姚欣:

当然艰难。同事说我们错过了 2023 - 2024 年倒卖 GPU 的机会。

但战略就是取舍,结合外部环境和自身能力做选择。我们选择放弃大模型训练,聚焦应用推理,因为这与我们分布式技术的积累相符。

我们等到了模型开源时代的认同,特别是 DeepSeek 的崛起。去年开源生态还不丰富,今年中国开源模型已成共识,从智谱、DeepSeek 到通义千问,作为承载它们的云平台,我们的活力被激发。

何思翀:

近期硅谷给了我们哪些新的启示?

姚欣:

行业共识是模型能力迭代放缓,进入应用时代。去年硅谷讨论训练 GPU ,今年转向推理。预计明年是 Agent 之年,大量 Agent 将接管现有工作流。

不谈收入落地的 AI ,都是泡沫。我们从对准确性要求不高、有付费意愿的痛点场景切入,如营销、会议、中后台工具等。

何思翀:

AI 创业者或独立开发者,最大的竞争优势在哪里?

姚欣:

我看到的成功创业者分两类:

一类是机会敏锐型,快速捕捉信息差,整合资源实现盈利;

另一类是行业深耕型,凭借对特定领域的理解,利用AI解锁以往难题。

后者更有潜力打造伟大产品。例如,在线教育创业者用AI将教材成本降低十倍,课件制作效率提升十倍,覆盖用户扩大十倍。

何思翀:

在充满噪音的环境中,创业者或者您如何保持独立思考?

姚欣:

我们的试金石是公司价值观:价值创造、需求落地。

第一,是否用技术创造新增价值?单纯倒卖算力是生意,难成事业。

第二,是否真实落地需求?是作秀展示,还是实际替代人力,实现提效降费?

基于这两点,我们在 AI 热潮初期保持理性,直到看到 OpenAI 推理模型发布,证明不需要堆算力也能解决问题,才确信 AI 必然落地。

何思翀:

在创新人才方面,有人指出中国创业者技能扎实但创新不足,您怎么看?

姚欣:

我不同意。

移动互联网时代,Y Combinator(YC)的 Demo Day 上,三分之一创业者会在 PPT 中展示美团或微信,说自己在模仿中国公司,甚至流行“Copy from China”的说法。

今天,中国的红利不仅是供应链和工程师,还有组织红利——我们对全球化的态度更开放、包容、尊重,愿意适应本地化。

这一波 AI 时代,中美不仅在本土竞争,更在中美之外的市场决战。

何思翀:

当下的创新人才需要哪些特质?

姚欣:

最重要的是本质思考或第一性原理的能力。这是想长期成功的创始人必备的。

此外,还需要广泛的外部视野,理解全球政治经济、科技趋势和资本周期。如,我们去年准备香港上市,就是看好香港资本市场。

创始人既要接近底层本质,又要把握宏观趋势,中间过程通过精益创业和颠覆式创新实现。

何思翀:

这回到了我们今天的主题——穿越周期,本质是创业者心智的进化和修炼。

姚欣:

认知已不是问题,难的是对创始人要求大大提高。

昨天我和一批 95 后创始人交流,他们 30 岁时远比我 30 岁时优秀——知识更全面,看待商业问题更复杂。这证明全行业的创业者水平在提升,竞争壁垒越来越高。

何思翀:

面对更年轻的创业者涌现,您会有压力吗?

姚欣:

就像马化腾曾说,到了某个年龄要认清自己。我 2018 年二次创业时,就坚定选择做赋能型基础设施公司。我知道自己的精力和迭代速度可能无法与最前沿的年轻人同步,但我们可以用经验和能力构建穿越周期的平台。

我以开放、赞赏和尊重的态度看待平台上的AI创业者,哪怕他们比我年轻 10 岁、20 岁。

他们中间充满新的机会和希望。这种心态来自投资经历——我们希望投中下一个颠覆者,用算力和技术能力支持他们。

何思翀:

如果回到 20 多岁,创办 PPTV 的时候,您会给自己什么建议?

姚欣:

抛开时代因素,我想对 20 多岁的自己说:不要过度沉迷技术优化,创业和商业成功是综合命题。我们常说不该“拿着锤子找钉子”。

今天很多 AI 创业者仍热衷于展示跑分、博士数量或专利,但这没有意义。重要的是如何落地应用。减少对技术优化的专注,多思考技术与商业的平衡和组合,这才是关键。

何思翀:

今天非常感谢姚总分享您的故事。

从 PPTV 的初次创业,到投资人的心得,再到 AI 时代的探索,我们看到了创业者心智的成熟——从直觉驱动到理性回归,回归第一性原理。

每一次技术浪潮都带来机会与挑战,关键在于我们如何看待和应对。

Read more

PPIO发布Agent Runtime:让Agent部署像Serverless一样简单

PPIO发布Agent Runtime:让Agent部署像Serverless一样简单

近期,PPIO 发布了基于 Sandbox(沙箱)自研的新产品:Agent Runtime,一个轻量级的 Agent 运行时框架。 Agent Runtime 是为了顺应 Agent 的专属需求而推出,其定位与 AWS AgentCore Runtime 类似。AgentCore 是 AWS 在 2025 年推出的专为 Agent 设计的基础设施平台,AgentCore Runtime 则是其中一个子产品,是基于 Firecracker 微虚拟机的 Serverless 运行时环境,旨在解决 Agent 低成本、高效率的部署问题。 PPIO Agent Runtime 通过简单易用的 SDK 与强大的沙箱运行环境来简化 Agent 的部署过程。用户无需关心基础设施配置、

By PPIO
当Agent计算规模扩大100倍,我们需要什么样的Agentic Infra?

当Agent计算规模扩大100倍,我们需要什么样的Agentic Infra?

近期,PPIO Sandbox(沙箱)发布了一个重要功能:沙箱克隆。 沙箱克隆旨在助力提高 Agent 的并行计算能力,也就是经典的“Scale up”规模扩展问题。 今年最流行的 Agent 产品是 Deep Research,它可以看作对单个研究问题持续追踪、推演、迭代直到形成洞察的长链路串行推理过程。 那么,如果将 Deep Research 的能力 Scale up 一百倍会发生什么?像 Manus 这样的 Agent 正在解决这类挑战,并将这种并行计算架构的 Agent 称之为 Wide Research。 从 Agent 的串行计算到并行计算,离不开“沙箱克隆”这一核心技术的助力,这是 PPIO 在 Agentic Infra

By PPIO
PPIO上线Kimi K2 Thinking,兼容Anthropic协议

PPIO上线Kimi K2 Thinking,兼容Anthropic协议

今天,PPIO 上线 Kimi K2 Thinking,这是 Kimi 最新、功能最强大的开源思考模型。 Kimi K2 Thinking 基于 Kimi K2 后训练而来的混合专家模型(MoE),总参数达 1T,激活参数 32B,上下文长度 256K。该模型支持深度思考、Function Call、结构化输出、json_schema、json_object 等功能。 现在,你可以到 PPIO 官网在线体现 Kimi K2 Thinking,也可以将 PPIO 的模型 API 部署到 AI 应用中。 PPIO 在线体验地址: https:

By PPIO
PPIO独家上新GPU实例模板,一键部署Kimi-Linear

PPIO独家上新GPU实例模板,一键部署Kimi-Linear

昨晚,月之暗面发布了混合线性注意力架构新模型 Kimi-Linear,旨在解决大语言模型在长上下文推理中的计算瓶颈。 Kimi-Linear 的核心亮点: * Kimi Delta Attention(KDA),一种通过细粒度门控机制改进门控规则的线性注意力架构。 * 混合架构:采用 3:1 的 KDA 与全局 MLA 比例,在保持甚至超越全注意力质量的同时降低内存占用。 * 卓越性能:在 1.4T Token 的训练规模下,经公平对比,KDA 在长文本与类强化学习基准等多项任务上均优于全注意力。 * 高吞吐:在 1M 上下文中实现最高 6 倍的解码吞吐量,显著缩短单输出 Token 耗时(TPOT)。 今天,PPIO 独家上新 GPU 实例模板,可一键部署 Kimi-Linear-48B-A3B-Instruct 的专属模型。 PPIO 算力市场的

By PPIO