DeepSeek推翻两座大山-锐评时讯

当前位置：首页 > 人文 > DeepSeek推翻两座大山正文

DeepSeek推翻两座大山

时间：2025-05-21 10:17:05 来源：锐评时讯作者：人文阅读：661次

DeepSeek的压力，总算仍是传递到了黄仁勋身上。

北京时刻1月27日晚，英伟达美股股价盘前暴降近11%，按现在市值34928亿美元核算，英伟达市值恐将缩水超3500亿美元。

DeepSeek所掀起的低本钱大模型练习战略，正在让本钱市场置疑，即当用相对较少的算力也能完成不输于OpenAI的模型功用体现时，英伟达所代表的高端算力芯片是否正迎来新的泡沫？

这股忧虑心情正进一步助推着DeepSeek的热度攀升。趁着DeepSeek R1新模型发布档口，短短一周时刻，到1月27日，DeepSeek运用就拿下了美区App Store和我国区App Store免费榜的双料榜首。

值得一提的是，这是初次有AI帮手类产品逾越OpenAI的ChatGPT，且登顶美区App Store。

爆火的用户体会局面，直接导致DeepSeek在两天之内连续呈现服务宕机现象。继1月26日呈现短时闪崩后，1月27日，DeepSeek再次时间短呈现网页/API不可用的服务提示。官方回应称，其或许和服务保护、恳求约束等要素有关。

新模型DeepSeek R1，无疑是引发这场环绕DeepSeek的全球用户大评论的直接导火线。1月20日，DeepSeek正式发布了功用比肩OpenAI o1完好版的R1。

在数据越多、作用越好的Scaling Law（模型规划规律）触达瓶颈之下，上一年9月份，OpenAI对外发布了新推理模型o1，后者采用了RL（强化学习）的新练习方法，被职业视为是大模型范畴的一次“范式搬运”。

但直到DeepSeek R1发布之前，国内一众大模型厂商均没有推出能够对标OpenAI o1的模型。DeepSeek成了榜首个攻破OpenAI技能黑匣子的玩家。

更重要的是，比较OpenAI在模型上的闭源，以及o1模型付费运用约束，DeepSeek R1不只开源，并且还免费供全球用户无限调用。

R1的呈现，除了打破旗舰开源模型只能有科技大厂来推进的职业传统一致之外，还打破了业界涵上一年构成的另一条一致，即通用大模型，正越来越成为一场大厂间的本钱比拼游戏。DeepSeek用不到OpenAI十分之一的资源，就做出了功用堪比o1的R1。

DeepSeek携一众用户带来的冲击，现已让一些大厂坐不住了。

首战之地的是Meta。一向被职业视为“大模型开源之王”的Meta，内部被曝出开端忧虑起还未发布的Llama 4，在功用上或许无法赶上DeepSeek R1。

被拿来全面临标的OpenAI，也开端感受到压力。OpenAI CEO奥特曼不只经过发布首个智能体Operator抢热度，还开端对外剧透起行将上线的o3-mini新音讯。

能够预见的是，DeepSeek掀起的职业地震，涉及的将不仅仅国外公司，国内大厂也难逃破例。

A。

作为一款开源模型，DeepSeek R1在数学、代码、自然言语推理等使命上的功用，声称能够比肩OpenAI o1模型正式版。

在AIME 2024数学基准测验中，DeepSeek R1得分率为79.8%，OpenAI o1的得分率为79.2%；在MATH-500基准测验中，DeepSeek R1得分率为97.3%，OpenAI o1的得分率为96.4%。

同为推理模型，DeepSeek R1不同于OpenAI o1的技能要害点，在于其立异的练习方法，如在数据练习环节运用的R1-Zero道路，直接将强化学习（RL）运用于根底模型，而无需依靠监督微调（SFT）和已标示数据。

此前，OpenAI的数据练习十分依靠人工干预，旗下数据团队乃至被建设成为不同水平的层级，数据量大、标示要求简略清晰的浅层数据，交给肯尼亚等廉价外包劳工，高等级的数据则交给更高本质符号人员，不少都是练习有素的高校博士。

DeepSeek R1的直接强化学习道路，就像让一个天才儿童在没有任何典范和辅导的情况下，朴实经过不断测验和获得反应来学习解题。

Perplexity公司CEO阿拉文·斯里尼瓦斯点评道：“需求是发明之母。由于DeepSeek有必要找到解决办法，终究它们发明出了更高效的技能。”。

除此之外，在获取高质量数据方面，DeepSeek也有所立异。

依据DeepSeek官方技能文档，R1模型运用数据蒸馏技能（Distillation）生成的高质量数据，提升了练习功率。数据蒸馏指的是经过一系列算法和战略，将原始的、杂乱的数据进行去噪、降维、提炼等操作，然后得到更为精粹、有用的数据。

这也是DeepSeek能够凭仗更小参数量，就完成比肩OpenAI o1模型功用的一大要害。人工智能专家丁磊博士告知字母榜（ID：wujicaijing），模型参数量巨细与终究模型呈现的作用之间，两者“投入产出并不成正比，而是非线性的……。数据多仅仅一个定性，更重要的是检测团队数据清洗的才能，不然跟着数据增多，数据搅扰也将随之变大。”。

更重要的是，DeepSeek是在用不到十分之一的资源根底上，获得的上述成果。

上一年12月底发布的DeepSeek-V3开源根底模型，功用对标GPT-4o，但官方介绍的练习本钱只要2048块英伟达H800，总花费约557.6万美元。

作为比照，GPT-4o模型的练习本钱约为1亿美元，占用英伟达GPU量级在万块以上，且是比H800功用更强的H100。

其时，前OpenAI联创、特斯拉自动驾驶担任人安德烈·卡帕西就发文表明，DeepSeek-V3级其他才能，一般需求挨近16000颗GPU的集群。

现在，DeepSeek官方没有发布练习推理模型R1的完好本钱，但官方发布了其API定价，R1每百万输入tokens在1元-4元人民币，每百万输出tokens为16元人民币。作为比照，OpenAI o1的运转本钱约为前者的30倍。

这样的体现也引发Scale AI创始人亚历山大·王（Alexandr Wang）点评道，我国人工智能公司DeepSeek的AI大模型功用大致与美国最好的模型适当。“曩昔十年来，美国或许一直在人工智能比赛中领先于我国，但DeepSeek的AI大模型发布或许会‘改动全部’。”。

a16z合伙人、AI大模型Mistral董事会成员 Anjney Midha更是发文说道，从斯坦福到麻省理工，DeepSeek R1简直一夜之间就成了美国顶尖大学研讨人员的首选模型。

包含斯坦福大学核算机科学系客座教授吴恩达、微软董事长兼CEO萨提亚·纳德拉等大佬在内，也都开端重视起这款来自我国的新模型。

事实上，这并非DeepSeek榜初次出圈。在宣告组成团队自研大模型以来，DeepSeek曾两度引发热议，只不过，之前更多限制在国内。

2023年4月，千亿量化私募巨子幻方量化发布公告，称将会集资源和力气，投身人工智能技能，成立新的独立研讨安排，探究AGI（通用人工智能）。

一个月后的2023年5月，该安排被命名为“深度求索”，并发布了首款模型DeepSeek V1。其时，《财经十一人》报导称，国内具有逾越1万枚GPU的企业不逾越5家。而DeepSeek便是其中之一，并由此开端得到外界重视。

及至2024年5月，DeepSeek再次凭借大模型价格战一跃成名。其时，DeepSeek发布了DeepSeek V2开源模型，并在职业界首先降价，将推理本钱降到每百万token仅1块钱，约等于GPT-4 Turbo的七十分之一。

随后，字节、腾讯、百度、阿里等大厂纷繁降价跟进。我国大模型价格战由此开幕。

B。

DeepSeek R1的呈现，进一步向外界证明着，在大模型，尤其是通用大模型方面，创业公司仍然有时机。

1月初，零一万物创始人李开复对外正式表态，自己将退出对AGI的寻找，未来公司主攻中小参数的职业模型。“从商业视点考虑，咱们以为只要大公司能持续做超大模型。”李开复说道。

出资人们比李开复更急进。从2023年开端，作为金沙江创投主管合伙人的朱啸虎，便觉得大模型在炸毁创业，由于模型、算力和数据等三大支柱都向大厂会集，看不到创业公司的时机，且直接在大模型上做运用护城河太低，屡次提示创业者不要迷信通用大模型。

远望本钱程浩更是直接以为我国版的ChatGPT，只会在5家公司里发生：BAT+字节+华为。在程浩看来，创业者只要在具有先发优势的情况下，才有或许跑赢大厂。

正是由于最初谷歌等国外大厂并不看好OpenAI的大言语模型道路，才让ChatGPT凭借先发势能跑了出来。可是，当下研制大模型现已成为我国科技大厂的一致，乃至百度、阿里推出产品的动作，比创业公司还快。

但在承受暗涌采访中，DeepSeek创始人梁文锋在回应与大厂竞赛中曾说道，“大厂必定有优势，但假如不能很快运用，大厂也纷歧定能持续坚持，由于它更需求看到成果。头部的创业公司也有技能做得很厚实的，但和老的一波AI创业公司相同，都要面临商业化难题。”。

背靠千亿量化基金的DeepSeek，在免除资金的后顾之虑外，挑选了一条颇显理想主义的途径，即只做模型研讨，不考虑商业变现，且斗胆发动年轻人。

在DeepSeek的150左右团队中，大多是一帮Top高校的应届结业生、没结业的博四、博五实习生，以及一些结业才几年的年轻人。

这是梁文锋有意挑选的成果，也是DeepSeek能够抢在大厂前面推出R1模型的诀窍之一，“假如寻求短期方针，找现成有经历的人是对的。但假如看久远，经历就没那么重要，根底才能、发明性、酷爱等更重要。”梁文锋解释道。

这也使得DeepSeek成了我国大模型创业公司中，仅有一家只做根底模型、暂不考虑商业化的公司，还要加上一条，即有才能持续开源旗舰模型的公司。

到现在，DeepSeek R1现已成为开源社区Hugging Face上下载量最高的大模型之一，下载量逾越10万次。

此前，国内以百度创始人李彦宏为代表的一派，坚决以为开源道路打不过闭源道路，且缺少商业化支撑的开源模型，会在往后的竞赛中距离越拉越大。

但最少从现在来看，DeepSeek R1的呈现，证明靠开源道路仍然能够追上大模型头部玩家的脚步，且创业公司仍然有才能推进开源生态开展。

Meta AI首席科学家杨立昆（Yann LeCun）在点评中就说到，“给那些看到DeepSeek的体现后，觉得‘我国在AI方面正在逾越美国’的人，你们的解读是错的。正确的解读应该是，‘开源模型正在逾越专有模型’。”。

在上一年DeepSeek v3发布后，梁文锋就曾对外表明，公司未来不会像OpenAI相同挑选从开源走向闭源，“咱们以为先有一个强壮的技能生态更重要。”。

究竟，OpenAI的经历最少说明晰，在颠覆性的技能面前，闭源难以构成满足的护城河，更无法阻挠被他人赶超。“所以咱们把价值沉积在团队上，咱们的搭档在这个过程中得到生长，堆集许多know-how,构成能够立异的安排和文明，便是咱们的护城河。”。

2020年发布GPT-3时，OpenAI曾具体公开了模型练习的一切技能细节。我国人民大学高瓴人工智能学院履行院长文继荣以为，国内许多大模型其实都有GPT-3的影子。

但跟着OpenAI在GPT-4上一改开源战略，逐步走向关闭，一些国产大模型就此失去了可供仿制的追逐途径。

现在，DeepSeek携开源R1的到来，无疑将给国内外大模型玩家在对标o1的推理模型研制方面，创建起一条新的学习思路。

C。

DeepSeek在大模型范畴掀起的这场蝴蝶效应，现已开端影响到部分大厂。

有Meta职工在硅谷匿名八卦共享渠道Blind上发布音讯称，Meta的生成式AI部分正因DeepSeek处于惊惧中，乃至爆料称没有发布的新一代开源模型Llama 4，在基准测验中现已落后于DeepSeek。

在外媒的进一步报导中，Meta生成式AI团队和根底设施团队，正在组成4个作战小分队来像素级分析DeepSeek，有的企图搞清楚DeepSeek是怎么下降练习和运转本钱的，有的担任研讨DeepSeek或许运用了哪些数据来练习模型，有的则考虑根据DeepSeek模型的特点重组Meta模型的新技能。

与此同时，为了鼓舞士气，作为Meta创始人的扎克伯格，更是放出2025年持续扩展AI出资的新音讯，称2025年环绕AI的全体开销将到达600亿-650亿美元，比较上一年的380亿-400亿美元，增长了逾越70%，然后构建起一个具有130万块GPU的超级核算机集群。

除了跟Meta抢开源之王的名头外，DeepSeek正在从OpenAI手里抢走客户。

在比OpenAI廉价30倍的API价格诱惑力之下，一些草创公司正在改换门庭。企业级AI署理开发商SuperFocus的联合创始人Steve Hsu以为，DeepSeek的功用与为SuperFocus大部分生成式AI功用供给支撑的OpenAI旗舰模型GPT-4类似乃至更好。“SuperFocus或许会在未来几周转向DeepSeek，由于DeepSeek能够免费下载、在自家服务器上存储和运转，并将添加出售产品的利润率。”。

成为更多公司的模型底座，这也是梁文锋规划中DeepSeek最想占有的定位。在梁文锋看来，DeepSeek未来能够只担任根底模型和前沿的立异，然后其他公司在DeepSeek的根底上构建To B、To C的事务。”假如能构成完好的工业上下游，咱们就没必要自己做运用。”梁文锋说道。

国内，对DeepSeek的研讨也在同步进行。有报导称，字节跳动、阿里通义以及智谱、Kimi等团队，都在活跃研讨DeepSeek，字节跳动乃至或许在考虑与DeepSeek打开研讨协作。

在这些公司之前，雷军更是祖先一步挖起了DeepSeek的墙角。上一年12月，榜首财经爆料称，雷军疑似开出千万年薪亲身挖来“95后天才少女”罗福莉，后者是DeepSeek-V2开源模型的要害开发者。未来，罗福莉或将供职于小米AI实验室，领导小米大模型团队。

挖人之外，国内更剧烈的竞赛或将相同环绕API打开，“上一年国内有一批创业公司和中小企业，由于OpenAI断供转向了国内大模型公司，现在DeepSeek很有或许成为克复OpenAI失地的那个野蛮人。”恒业本钱创始人合伙人江一猜测道。

压力传导到了这些国内大模型公司身上。假如它们不能快速将模型作用跟进到R1等级，客户就难免用脚投票。

特别声明：本文为协作媒体授权DoNews专栏转载，文章版权归原作者及原出处一切。文章系作者个人观点，不代表DoNews专栏的态度，转载请联络原作者及原出处获取授权。(有任何疑问都请联络idonewsdonews.com)。

内容来源：https://tongdaidmxanh.com/app-1/barca vs inter,http://chatbotjud-teste.saude.mg.gov.br/app-1/22bet-gratis-bonus

(责任编辑：经济)

系统发生错误

您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

[ 错误信息 ]

页面发生异常错误，系统设置开启调试模式后，刷新本页查看具体错误！