会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 贱价接入DeepSeek后,百度再掀算力接力赛!

贱价接入DeepSeek后,百度再掀算力接力赛

时间:2025-05-22 20:08:20 来源:锐评时讯 作者:最新热点 阅读:804次

2025年是AI游戏规则被改写的一年。

在DeepSeek以中式务实震动全球之前,AI大模型比赛是一条由本钱和GPU所主导的不计本钱之路,参赛者的技能崇奉只要一个Scaling Law,大力出奇观。DeepSeek-R1掀起的AI遍及浪潮,适当于在大道周围拓荒了一个分岔,它迫使首要参与者开端反思,让更多人把AI用起来的条件不只是技能抢先,还要有足够低的本钱、超预期的体会。

最直观的比方是,ChatGPT-o1虽然与DeepSeek才干适当,但一个月200美元的订阅费现已将大多数普通人拒之门外。幡然醒悟的OpenAI,将1月31日上线的推理模型o3-mini设置为免费用户也可运用。

目之所及,AI大模型的花式降本将成为2025年的主线之一。抵达方法有许多,比方高效算力,又或许算法和工程立异。详细到我国,在DeepSeek的鼓励之下,BAT、字节、华为等国内AI大厂现已赶紧在上述方向你追我赶。

2月5日,业界再传新开展——首个国产芯片万卡集群正式点亮,本乡化AI在高效算力上向前一步。

01。

本乡自研万卡集群正式点亮。

在宣告贱价接入DeepSeek模型两天后,百度再发布算力降本新开展。

2月5日,百度智能云宣告点亮昆仑芯三代万卡集群。这也是国内首个正式点亮的自研万卡集群。

从全球规划来看,以合理本钱取得牢靠的算力,在当时的AI竞赛中至关重要。谷歌、Meta、亚马逊、特斯拉等公司都在加快自研芯片的进程,期望以此打破算力瓶颈、下降模型本钱。与微软因为GPU供给问题而同床异梦的OpenAI,也屡被传出方案自研AI芯片。

不过,具有自研芯片仅仅完结万卡集群的第一步。要练习根底大模型,需求将一万张以上的加快卡(如GPU、TPU或其他专用AI芯片)组成一个高功能的「超级核算机」,工程难度极高。

我国工程院院士、清华大学核算机系教授郑纬民此前表明,当下构建国产自主万卡体系充溢应战,但「至关重要」。

以百度自研万卡集群为例,它不只为百度带来坚实的算力支撑,也有望推进模型降本趋势,成为我国科技界在人工智能范畴的又一次打破。

客观而言,国产芯片前期顶多适当于AI大厂根底设施的一个「副本」,更多是作为算力供给的一个弥补而存在,首要满意单使命算力耗费。而在算力空前严重、技能寻求自主可控的趋势下,国产智算开端接受更多等待,集群效能最大化成为中心方针。

这个中心方针受商场需求驱动。现在国内客户对大模型的要害诉求至少有两个:一是缩短练习时刻。百度智能云工作群总裁沈抖此条件到,因为大模型职业的开展一日千里,客户遍及期望能在两周内完结练习,最晚也应在一个月内完结。

二是降本。从信息年代到AI年代,下降技能本钱曲线是科技职业永久的主题。依照现在的硅谷规则,模型练习本钱每年大约能下降四分之一,但这远不及商场等待。不然DeepSeek也不会在美国引发「强震」。据多方测算,DeepSeek-R1的全体本钱约为OpenAI o1模型的1/30。

DeepSeek现已让全世界看到我国AI花小钱办大事的务实才干。《华尔街日报》称之为「够用就好」战略,英国《金融时报》则直言,「并不是每个司机都需求一辆法拉利。」而百度点亮国产万卡集群,则归于我国AI从算力层面寻求本钱打破的一个解法。

理论上,超大规划并行核算才干可完结练习功率跃升,万卡集群可将千亿参数模型的练习周期大幅下降,满意AI原生运用快速迭代的需求;一起也能支撑更大模型与杂乱使命和多模态数据,支撑Sora类运用的开发。

另一方面,万卡集群能够支撑多使命并发才干,经过动态资源切分,单集群可一起练习多个轻量化模型,经过通讯优化与容错机制,提高集群归纳利用率,完结练习本钱指数级下降。

不过在实践中,超大规划集群的调度功率至关重要。比方怎么做模型的拆分,如何将练习、微调、推理使命混合布置,都会影响算力的有用发挥。

百度能首先点亮自研万卡集群,其实背面离不开百舸AI异构核算渠道4.0等超前根底设施的支撑。

2024年9月晋级的百舸4.0归于大模型降本的「全能型选手」。仅下降通讯瓶颈一项,便将带宽有用性提高到90%以上。在供给容错与安稳性机制上,经过防止因为单卡故障率随规划指数上升而形成的集群有用性大幅下降,确保有用练习率到达98%。

据了解,在百舸4.0的支撑下,百度自研3万卡集群也现已在路上。

从职业开展视点来看,百度经过自研大规划集群的建造,不只处理了本身算力供给的问题,也为整个职业供给了新的思路和方向。

02。

AI运用迸发的杰文斯悖论。

中外科技公司狂卷AI本钱,职业影响深远。

假如没有DeepSeek「上线20天日活2000万」的现场教育,科技界或许很难将大模型降本带来的变量具像化。虽然业界首领都以为这一天迟早会到来。

比方微软CEO纳德拉,在DeepSeek迸发前夕,他还在交际媒体上布道,「跟着人工智能变得愈加高效和遍及,咱们将看到它的运用量陡增,成为一种永久无法满意的产品」,经济学中的「杰文斯悖论」会在AI范畴复现。

AI芯片草创公司Groq的首席执行官此前直言,运转AI模型的本钱越低,AI才干明显就越强,「假如推理本钱太高,人们就不会太多运用」,而更高的运用率才干催生更好的模型。

翻译过来,英伟达的软肋,未尝不是AI开发者以及整个AI生态的幸事。

在移动互联网年代,从运用层到根底设施的倒三角型利益分配,催生了数量很多的超级运用和明星独角兽,支撑了移动生态的持久昌盛。而在生成式AI年代初期,绝大多数AI出资终究流向了根底设施层企业——强如微软,其AI根底设施出资中约有一半的钱也要用来买卡。

这一客观现实无形中抬高了AI运用开发的门槛。

DeepSeek的兴起,意味着AI职业的开展正从硬件根底设施层向软件运用层搬运。花旗在最新工业研报中猜测:DeepSeek、百度等我国模型的高效低本钱将有助于加快全球AI运用开发,或许在全球引发更多技能立异,并推进2025年人工智能运用的拐点。

举个比方,百度自研万卡集群所代表的低本钱算力,能够支撑Sora类多模态运用的开发。现在海外视频生成的本钱并不算低。Runway生成一条5秒视频的价格为1.2美元,Sora生成一个5秒480P视频本钱约为0.5美元,假如多模态模型本钱持续下探,理论上会有更多的多模态运用呈现。

而DeepSeek-R1的高效推理才干,或许会直接带来企业智能体范畴的打破性开展。企业智能体的方针是处理工作使命,假如能以更低的推理本钱具有智能体类的AI职工,企业客户的盈余才干也将直接得到提高。

为了加快AI运用开发的昌盛,在DeepSeek出圈以来,百度智能云、华为云、阿里云、腾讯云、火山引擎等也在争相接入DeepSeek模型,并以优惠条件招引更多的企业客户和开发者。

这其间,百度在「砍门槛」上算是比较急进的一家。2月3日百度智能云直接宣告打折——千帆ModelBuilder渠道上的DeepSeek-R1仅为官方刊例价的5折,DeepSeek-V3仅为官方刊例价的3折,并供给限时免费服务。

「砍门槛」的背面,是百度智能云在推理引擎功能优化技能、推理服务工程架构立异以及推理服务全链路安全确保上的深度交融。

在推理引擎功能上,针对DeepSeek模型MLA结构的核算进行了极致的功能优化,并经过核算、通讯、内存不同资源类型算子的有用堆叠及高效的Prefill/Decode分离式推理架构等,在中心推迟目标TTFT/TPOT满意SLA的条件下,完结模型吞吐的大幅度提高。

在推理服务的工程架构上,百度智能云做了严厉的推/拉形式的功能比照。为了进一步提高体系的安稳性和用户体会,规划了恳求失利的续推机制,这明显增强了体系的容错才干和服务SLA达标率。一起针对多轮对话和system设定等场景中存在重复Prompt前缀的状况,完结了干流的KV-Cache复用技能,并辅以大局Cache感知的流量调度战略。

在安稳安全确保上,集成了百度智能云独家内容安全算子,完结模型安全增强与企业级高可用确保,依据大模型全生命周期数据安全与模型维护机制,在千帆渠道上的模型均具有运用安全的安全确保。

DeepSeek模型上线首日,已有超1.5万家客户经过千帆渠道进行模型调用。

「价格战」背面,实质仍是一个因为AI运用所主导的AI生态之争。

在这个过程中,对冲基金桥水判别,AI对算力的需求不会放缓,反而或许加快。「杰文斯悖论」好像永不过期。

这也是为什么微软、Meta、谷歌、百度、字节本年都在算力上加大投入。依据现在的揭露信息,微软方案在到本年6月份的财年对AI数据中心出资800亿美元,Meta本年方案在AI根底设施等范畴投入650亿美元。用谷歌CEO皮查伊的话说,我们都想拥抱更多的开展机会。

在纳德拉宣告微软在 AI 和云根底设施方面的800亿美元后,马斯克转发了这一音讯。

纵观全球AI竞赛,具有更高功能、更低本钱的算力,始终是AI巨子确保抢先地位的重要抓手。

国内头部企业如百度,除了现已路上的3万卡集群,百舸4.0规划之初可支撑10万卡用量,这一「留白」为我国AI企业更低门槛的立异打破积储了必定的空间。

凭仗其强壮的算力优势、本钱效益以及百舸渠道的全方位赋能,百度等国内AI公司有望为人工智能的开展注入新的生机。

特别声明:本文为协作媒体授权DoNews专栏转载,文章版权归原作者及原出处一切。文章系作者个人观点,不代表DoNews专栏的态度,转载请联络原作者及原出处获取授权。(有任何疑问都请联络idonewsdonews.com)。

内容来源:https://fastrans.nhobethoi.com/app-1/tầy quầy,https://chatbotjud-hml.saude.mg.gov.br/app-1/party-match-aposta

(责任编辑:经济)

    系统发生错误

    系统发生错误

    您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

    [ 错误信息 ]

    页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!