DeepSeek劝不了谷歌们
曩昔一个月,DeepSeek以大约十分之一的练习本钱,推出与OpenAI o1功用挨近的开源模型R1,“小力出奇观”的新范式震慑全球AI大模型职业。一起,外界关于大型科技公司动辄数百亿美元的AI研制开支,也产生了越来越多的质疑。
但被“DeepSeek冲击”吓了一跳的科技巨子,并没有因而改弦更张。相反,他们正挥舞着支票簿,企图靠张狂砸钱,从头攫取AI大模型的制高点。
2月5日,谷歌母公司Alphabet发布2024年第四季度财报,营收和净利润均完结两位数百分比的同比增加。有目共睹的是,Alphabet宣告,2025财年的本钱开销将到达750亿美元(约合人民币5454亿元),以继续扩展其人工智能战略。
一年投入750个“小方针”研制AI,远远超出了华尔街599.4亿美元的预期。不过,谷歌有实力如此烧钱:到上一年底,它持有现金、现金等价物及有价证券约957亿美元。
稍早时分,谷歌还向AI明星创业公司Anthropic追加出资10亿美元。2023年至今,谷歌向这家公司累计出资35.5亿美元。
财大气粗的谷歌投身AI烧钱比赛,其他科技巨子也不遑多让。
本年1月初,微软宣告将于2025财年出资800亿美元,建造AI数据中心。这笔出资创下了微软建立以来的单笔出资最高记载。而在上一财年,微软的本钱开销超500亿美元,大部分用于AI相关的根底设施。
交际网络巨子Meta在1月底宣告,公司将。在本年出资600亿~650亿美元,并大幅扩张AI团队,以期完结Meta AI服务10亿人、Llama 4成为职业抢先大模型的方针。Meta创始人扎克伯格称,本年将是“AI决定性的一年”。
OpenAI则拉上软银、甲骨文、微软、ARM、英伟达。估计出资5000亿美元。中东人工智能基金(MGX)等工业和出资巨子,联手建立“星际之门”,这些资金将被用于数据中心等AI根底设施的建造与运营。
比较之下,国内科技巨子面向AI大模型的砸钱规划小了一个数量级,但也动辄数百亿元,且增加很快。
依据财报等揭露信息,2024年前三季度,百度、阿里、腾讯的总本钱开支约为人民币867亿元。金融数据服务商Visible Alpha估计,到2027年,BAT的本钱开销将到达1767亿元,年复合增加率超26%。考虑到BAT的注重程度,这些本钱开支将有很大一部分流向AI大模型。
不难看出,科技巨子开展AI大模型,砸钱仍然是根本兵器之一。虽然DeepSeek证明晰“小力出奇观”的可行性,但巨子们出于多种原因,仍然沿着“大力出奇观”的道路前行。
这并非仅仅是大公司的惯性使然。OpenAI刚刚发布的o3-mini,现已在物理推理等多项目标上反超R1,而更强壮的o3标准版也现已箭在弦上。这也再次证明,“标准规律”仍然是AI大模型的根本规矩之一,而“小力出奇观”并非置之四海而皆准。
没有找到“金主爸爸”的DeepSeek,在算力、数据、资金和资源方面比不上巨子,正面对被后来者强行超车的风险。不过,R1的成功,也证明晰“小力出奇观”的可行。在DeepSeek轰动全球AI圈后,巨子喜爱的“砸钱”与“小力出奇观”的道路之争仍在继续,远未分出输赢。
A。
面对快速兴起的DeepSeek,美国科技巨子表面上对其技能、产品和方法论赞叹不已,但在战略层面上,并没有对其“小力出奇观”的战略萧规曹随。
恰恰相反,在DeepSeek席卷全球AI大模型范畴后,巨子们的砸钱迈向了新高度。
以OpenAI为例,奥特曼起先关于DeepSeek有所置疑,称“并不新颖,咱们早已具有这一水平的模型”,且“被严峻夸张了”。OpenAI甚至在1月底标明,DeepSeek涉嫌运用OpenAI专有模型练习自己的模型,违反了OpenAI的服务条款。
但短短几天后,奥特曼宣告没有方案申述DeepSeek,一起称誉“DeepSeek是一个令人形象深入的模型”。在推出最新的o3-mini模型后,奥特曼甚至标明,在开源方面,OpenAI一向站在“过错的一边”。
DeepSeek大红大紫,逼得奥特曼前倨后恭、垂头认错,此情此景让不少人感到惊奇和振作。但事实上,OpenAI无论是产品仍是战略,都没有被DeepSeek这只“黑天鹅”所打乱。
1月底,OpenAI推出o3-mini,并初次向免费用户敞开推理模型。测验标明,o3-mini比较上一代o1模型前进极大,多项基准测验体现优异;特别是面对高难度的物理模仿项目——如球体磕碰等,展示出关于R1及其他模型的碾压实力。
几天后,OpenAI又以o3模型为根底发布了Deep Research功用,声称能够在几十分钟内完结人类专家数小时的作业。在包括超3000道问题的归纳测验“人类终究一场考试”中,Deep Research完结了26.6%的正确率,远超DeepSeek R1的9.4%。
o3-mini采用了许多与R1相同的技能,比方强化学习(RL)、稀少化MoE、许多监督微调(SFT)等,终究效果也可谓冷艳。但是,Open并没有在研制范式上向DeepSeek挨近,而是继续沿着“氪金”的道路狂飙。
就在拿出o3-mini对阵DeepSeek R1的一起,OpenAI高调宣告了5000亿美元的“星际之门”方案。依据方案,该方案将在全美国打造20座超算中心;首期将出资1000亿美元,在得州建造10座数据中心。
虽然奥特曼“终身之敌”马斯克火速赶来嘲讽,信誓旦旦地说“他们没有钱”,但星际之门的开展速度较为惊人。方案揭露几天后,奥特曼就晒出了“1号站点”的相片,称之为“雄伟而美丽的修建”。
虽然星际之门得到了软银和甲骨文的鼎力支撑,且上一年营收现已高达37亿美元,OpenAI仍在继续储藏资金。
据报导,OpenAI正寻求以3400亿美元估值融资400亿美元,软银有望领投。而在短短三个月前,OpenAI刚刚以1570亿美元的估值,融到了66亿美元。
奥特曼似乎患上“资金短缺恐惧症”,一边张狂融资,一边大手笔花钱。与之正面PK的其他科技巨子,砸钱相同毫不手软。
本年,谷歌、微软、Meta等均方案投入数百亿美元开展AI,力度之大远超华尔街预期。以Meta为例,扎克伯格方案斥资至少600亿美元,建造一座具有130万块GPU的AI数据中心。
作为比照,据科技咨询公司Omdia测算,字节上一年买了23万块GPU,且为功用较弱的英伟达特供版。即使如此,这一数字也远远超出了DeepSeek现在持有的芯片规划。
B。
除了海外科技巨子,国内互联网公司也在AI大模型范畴投入巨资。DeepSeek的“小力出奇观”,并没有改写这一局势。
一度在AI大模型范畴落后的字节,近两年洒下重金。浙商证券在一份陈述中称,2024年字节本钱开支约800亿元,挨近BAT的总和。
还有报导称,字节2025年本钱开支将超1500亿,大部分用于AI。字节方面随后否认了这一说法。
此外,字节继续“扫货”国内AI范畴的尖端人才。据《财经全国》报导,字节某些AI方向的事务团队在招募闻名院校博士应届生时,年薪可达两三百万元,远超其他大厂的100万元左右。此外,张一鸣还亲自从阿里等对手挖人。
除了研制费用和人才本钱,曩昔一两年,字节在B端和C端一起为AI烧钱,力求抢夺更多企业和个人用户。
在B端,豆包大模型自上一年5月发布之后不断降价,可谓国内AI大模型圈子的“价格屠夫”。据核算,豆包文字大模型比职业廉价99.3%,上一年12月发布的视觉了解模型比职业廉价85%。
一起,在C端,豆包依托广泛投流拉新。据AppGrowing核算,上一年4~5月,豆包投进金额估计为1500万~1750万元。6月上旬,豆包发动新一轮投进活动,投进金额高达1.24亿元。
在猛砸资金后,豆包的用户量陡增,成为国内用户最多的大模型使用。
阿里相同在AI大模型范畴继续投入大笔资金。本年总台春晚,阿里云成为云核算AI独家协作伙伴。仅2024年上半年,阿里在AI根底设施上的本钱开销就到达230亿元。此外,阿里花费超百亿元,出资AI创业公司“六小虎”。
腾讯方面,曩昔六年其研制总投入超2850亿元,其间很大一部分投向了AI。而在AI“六小虎”中,腾讯出资了其间五家。
仅就花钱力度而言,新BAT比不过谷歌、Meta、OpenAI,但仍然是国内AI大模型圈独一档的存在。比较之下,一向没有融资的DeepSeek,仍然靠母公司幻方量化输血;但国内量化出资近年来处于职业谷底,DeepSeek能够得到的资金支撑恐怕不会许多。
不过,面对DeepSeek的强势兴起,新BAT在继续大手笔投钱的一起,也企图伸出橄榄枝、构建“双保险”。
1月底、2月初,国内首要云服务厂商均宣告接入DeepSeek大模型。阿里云宣告支撑云上一键布置V3和R1,百度智能云、腾讯云、字节旗下火山引擎等也先后宣告了相似功用。
众所周知,DeepSeek采用了最“大方”的开源协议,并不约束第三方关于自家开源模型的商用。阿里云等厂商第一时间接入DeepSeek大模型,能够借着后者的泼天流量,为自己争夺一波重视度和新用户。
另一方面,向DeepSeek伸出橄榄枝,也旁边面标明晰大厂的心态:即使DeepSeek与自家AI事务存在竞赛,也无妨先为我所用,并从中取得技能、产品等方面的启示。这些自动示好的行为,也为两边未来更大规划的协作留下了幻想空间。
C。
DeepSeek以“小力出奇观”扬名全国,但现在为止,这一较为性感的新范式并未得到国内外大厂的全面认可与接收。砸钱、砸资源的“大力出奇观”,仍然是大厂参加AI大模型竞赛的首要打法。
与此一起,跟着竞赛对手以新一代模型反击,叠加本身规划扩展导致的种种问题,DeepSeek正面对被全面反超的风险。
产品上,越来越多的用户开掘,DeepSeek的大模型错觉频频呈现。无论是议论从A到B的最佳道路,仍是解析某一首歌曲,亦或是剖析某一专业论题,DeepSeek都存在较为严峻的“不苟言笑胡言乱语”问题。
大模型错觉一向广泛存在,也是整个AI圈子一直未能战胜的难题。DeepSeek在这方面并没有展示比其他模型更超卓的功用,折射出。仅靠大模型工程层面的立异,并不足以霸占更根底的AI难题。
另一方面,短时间内张狂涌入的全球用户,也让DeepSeek有些无能为力。
据核算,DeepSeek自上线各大使用商铺以来,短期内取得1600万次下载,登顶140个使用商场,最高日活泼用户打破2200万。因为用户太多,DeepSeek的深度考虑和联网查找功用一度暂时中止服务。
这也标明,“小力出奇观”或许能够大幅节省模型练习的本钱,但在模型投入运用后,必要的根底设施本钱仍然无法压减。
从商业视点来看,AI大模型注定是一门规划越大、才能越强、本钱越高的生意。巨子们据守“标准规律”,其根基——算力、算法和数据三角模型仍然安定。
在DeepSeek兴起过程中,一个被不少人忽视的问题是,R1推理功用与o1平起平坐,但在许多基准测验中不如o1。而箭在弦上的o3“满血版”,归纳功用远超o1。和同期其他对手比较,比方谷歌的Gemini 2.0 Flash,R1也并非全面抢先,而是与对手各擅胜场。
在专业人士眼中,R1的真实价值是,经过多种技能立异——比方强化学习、GRPO算法结构、DeepSeek MOE等,再加上优异的工程思维,以较低本钱在部分目标挨近或逾越了职业最强壮模型。DeepSeek的“小力出奇观”当然冷艳,但从来不是功用最强的大模型。
OpenAI刚发布的o3-mini,在许多测验中现已反超R1,也让国外巨子继续狂砸钱有了更坚实的证明。这标明,除了优异的人才、超卓的算法外,强壮的算力、丰厚的数据,也是构建更强壮模型,甚至通往AGI的必经之路。
DeepSeek“小力出奇观”证明晰AI大模型的另一条开展途径,却并非是仅有的途径。手握重金的科技巨子,仍然是AI大模型的首要参加者,一起也是DeepSeek继续上攻的强壮对手。
AI大模型远未分出输赢,DeepSeek及其拥趸不能“半场开香槟”。而高性价比道路与“大力出奇观”道路之争,也仍将继续下去,并在相互学习和交融中,推进AI大模型迈向下一个开展阶段。
参考资料:
APPSO,《万字揭秘DeepSeek:顶尖AI人才年薪千万,练习本钱被轻视》。
乱弹山,《我的确轻视了DeepSeek所引发的大面积“AI错觉”》。
亿欧网,《特朗普孙正义组局,预砸5000亿美金建“星际之门”》。
IT之家,《Meta宣告将打造具有 130 万颗 GPU 的 AI 数据中心》。
新智元,《o3-mini物理推理破坏DeepSeek R1,OpenAI王者归来!全网最全实测》。
特别声明:本文为协作媒体授权DoNews专栏转载,文章版权归原作者及原出处一切。文章系作者个人观点,不代表DoNews专栏的态度,转载请联络原作者及原出处获取授权。(有任何疑问都请联络idonewsdonews.com)。