
综合性价比超越硅谷,PPIO派欧云发布下一代推理加速引擎
https://www.jiemian.com/article/11486699.html
https://www.jiemian.com/article/11486699.html
算力成本高企、大模型参数越来越大、多模态模型让推理成本再提高2个数量级、推理效率低、业务场景丰富但落地链路长等一系列现实问题,成为制约AI应用广泛落地的关键因素。 如何降低算力成本,迎接推理算力爆发时代的到来? 王闻宇先生2024全球机器学习技术大会上,以《如何做到算力基建和推理优化的“软硬兼施”与创新突破》为题,对AI推理成本高企的原因进行深度剖析,并给出两个降低推理成本的有效方法。 当前,AI推理面临的首要问题是高昂的成本: 以GPT-4当前的推理价格为例,如果我们做一个粗略的估算,假设日活跃用户达到10亿,每人每天使用7,000个token(包含上下文信息),并且不考虑目前百万级脱壳的费用,每天产生的费用将高达2.1亿美金。若按365天计算,年费用将达到惊人的600亿美金。 这一数字相当于超过了40座世界第一高楼迪拜的哈利法塔(Burj Khalifa)的造价。更值得注意,这还只是今天的情况,还未考虑到多模态应用等更广泛的普及场景,因此实际使用量可能远超这一数字。 600亿美金的概念意味着,如果AI推理市场的体量再放大十倍,其规模将接近甚至超过当前整个云计算产业的总收
News
PPIO王闻宇,探讨元宇宙网络时延的最优解–边缘云基础设施的架构与建设,并介绍PPIO边缘云在泛云游戏领域的一些思考和实践。
NVIDIA 推出为中国市场量身定制的 RTX 4090D 显卡(以下简称“4090D”)。 NVIDIA 对该显卡的参数进行了特别调整。RTX 4090D 的设计严格遵循了 TPP(总处理性能)的限制,配备了14592 个 CUDA 核心,加速频率达到 2.52 GHz,并搭载了 24GB 384bit GDDR6X 显存。 参数可以做简单对比,实际性能却不能简单换算,可能面临模型、推理框架、算力墙、显存墙等多种因素影响,端到端的性能评测是一个非常复杂严谨的事情。 借着这次派欧算力云(www.paigpu.com) 4090D 资源上线,我们也为大家提供一份完整的性能评测报告! NVIDIA 4090D 规格参数解析 GeForce RTX 4090D采用了 NVIDIA Lovelace
从IBM的“深蓝”到谷歌的“阿尔法狗”,AI技术已经酝酿多年。直到ChatGPT诞生,大力终于出现奇迹,AI被迅速引爆。而今,从芯片到大模型,AI正在各行各业长驱直入,并开始对传统生产方式产生诸多颠覆迹象。 3月13日,PPIO联合创始人兼CEO姚欣受邀参与CAN TALK直播,围绕“从AI变革到产业落地:如何跨越鸿沟、穿越周期”这一话题进行了分享。身为PPTV网络电视创始人和蓝驰创投前投资合伙人,姚欣拥有数十年的互联网和移动互联网创业及从业经验,此次分享,他从创业者和投资人的双重视角,解读了AI技术的发展规律以及未来结合产业落地的路径。 “目前,新一代AI技术即AI 2.0仍处于早期阶段,技术尚不稳定、成本依旧高企,尚未具备大规模落地的条件。”姚欣认为,未来2-3年AI技术仍在爬坡期,目前最有效的方式莫过于先努力积累数据和商业化经验,同时小步快跑,不断叠加AI的辅助作用,为“几年后AI的大规模落地”做好充分准备。 2025年之后会进入一个全新技术时代 以IT行业为例,过去四十年间我们大概经历了PC(1980)、PC互联网(1995)、移动互联网(2010)和人工智能(
近日,AI芯片初创公司Groq推出最快的大模型推理芯片LPU,这是谷歌TPU团队原班人马为大模型推理研发的专用ASIC芯片,基于Groq芯片的推理API也开始向外界开放。
2023年的12月,PPIO凭借在边缘计算领域的卓越表现和创新实力,接连斩获中国信通院、 IDC 、边缘计算社区三项权威机构的重要认可。
12月21日,上海市工商联数字经济商会成立大会暨上海数字经济论坛在西郊宾馆举行,PPIO当选数字经济商会理事单位。
大模型AI席卷全球,推理创新的APP、场景落地越来越多。当训练达到一定阶段,推理必然会形成一个爆发。推理的产品要起来,必然要把推理的成本降到今天 1/ 10 甚至 1/100。此时该如何选好、用好 GPU ,进而影响推理成本
随着推理创新应用的落地开花,GPU作为一种强大的计算工具,正在引领着这场数字化世界的变革。其卓越的高性能计算能力和并行处理能力为AIGC技术的发展提供了强大支持,推动了音视频内容的创新与进步。 从GPU发展角度看AIGC大时代的来临 1.LiveVideoStack:王闻宇老师您好,非常高兴再次邀请到您参与采访。在上海站,您参与了【AIGC与内容生产】专题并分享了精彩的演讲,您参与其中的感受如何?有没有特别令您印象深刻的亮点或观众的提问? 王闻宇:上次活动我演讲结束后,问问题的朋友非常多,很火爆,我感受到咱们大会的观众非常热情。上海站我分享的是“AIGC音视频工具分析和未来创新机会思考”这个话题,主要分析了 AIGC 与音视频的关系,并且站在全球视野,给大家分享了一些知名国外的音视频应用或App,以及他们所背后的前沿技术(详情可查看:《AIGC音视频工具分析和未来创新机会思考》)。 印象里,当时大家对于AI和 AIGC话题的关注度都非常高,但很多朋友对音视频行业在国外发展和一些前沿技术动态是不太熟悉的。最近不一样了,随着大家关注度的提升,国内的很多像字节、美
2023年9月,由郑州市人民政府、河南投资集团有限公司指导,郑州高新技术产业开发区管理委员会、河南颐城控股有限公司主办,河南汇科高新技术研究院有限公司、北京甲子光年科技服务有限公司承办的2023科技新生态发展大会举办。 会议期间,PPIO 联合创始人姚欣出席“逐鹿中原·卓越河南籍商界代表”授予仪式,斩获“逐鹿中原·卓越河南籍商界代表”称号! 此奖为表彰豫籍企业家在推动河南科技民生产业发展方面所做出的杰出贡献,仅有九位豫籍企业家入选。 本届会议以「豫商回豫 创变中原」为题,郑州市委副书记、市长何雄,河南投资集团党委书记、董事长刘新勇,中国科学院院士、中国科学院化学研究所研究员李永舫等领导出席会议。PPIO 联合创始人姚欣有幸与在座领导及来自各行各业的企业家们共聚一堂,探讨河南产业科技创新与高质量发展。 姚欣受邀在会议举办的《如何走好创新驱动高质量发展之路》圆桌论坛中,代表河南籍企业家为推动中原地区科技民生产业的发展和升级建言献策。 姚欣表示,作为一家基于分布式云计算的服务平台,PPIO与河南联系紧密。过去的几年,PPIO通过汇聚网络边缘侧的专业服务器资源,已在全国构建一
technology
LiveVideoStack 2023上海站邀请到了PPIO边缘云的创始人王闻宇,分享近年音视频行业的分析、国外4款AIGC应用工具介绍、最新论文情况介绍~