会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 DeepSeek推翻两座大山!
当前位置:首页 > 人文 > DeepSeek推翻两座大山 正文

DeepSeek推翻两座大山

时间:2025-05-21 10:17:05 来源:锐评时讯 作者:人文 阅读:661次

DeepSeek的压力,总算仍是传递到了黄仁勋身上。

北京时刻1月27日晚,英伟达美股股价盘前暴降近11%,按现在市值34928亿美元核算,英伟达市值恐将缩水超3500亿美元。

DeepSeek所掀起的低本钱大模型练习战略,正在让本钱市场置疑,即当用相对较少的算力也能完成不输于OpenAI的模型功用体现时,英伟达所代表的高端算力芯片是否正迎来新的泡沫?

这股忧虑心情正进一步助推着DeepSeek的热度攀升。趁着DeepSeek R1新模型发布档口,短短一周时刻,到1月27日,DeepSeek运用就拿下了美区App Store和我国区App Store免费榜的双料榜首。

值得一提的是,这是初次有AI帮手类产品逾越OpenAI的ChatGPT,且登顶美区App Store。

爆火的用户体会局面,直接导致DeepSeek在两天之内连续呈现服务宕机现象。继1月26日呈现短时闪崩后,1月27日,DeepSeek再次时间短呈现网页/API不可用的服务提示。官方回应称,其或许和服务保护、恳求约束等要素有关。

新模型DeepSeek R1,无疑是引发这场环绕DeepSeek的全球用户大评论的直接导火线。1月20日,DeepSeek正式发布了功用比肩OpenAI o1完好版的R1。

在数据越多、作用越好的Scaling Law(模型规划规律)触达瓶颈之下,上一年9月份,OpenAI对外发布了新推理模型o1,后者采用了RL(强化学习)的新练习方法,被职业视为是大模型范畴的一次“范式搬运”。

但直到DeepSeek R1发布之前,国内一众大模型厂商均没有推出能够对标OpenAI o1的模型。DeepSeek成了榜首个攻破OpenAI技能黑匣子的玩家。

更重要的是,比较OpenAI在模型上的闭源,以及o1模型付费运用约束,DeepSeek R1不只开源,并且还免费供全球用户无限调用。

R1的呈现,除了打破旗舰开源模型只能有科技大厂来推进的职业传统一致之外,还打破了业界涵上一年构成的另一条一致,即通用大模型,正越来越成为一场大厂间的本钱比拼游戏。DeepSeek用不到OpenAI十分之一的资源,就做出了功用堪比o1的R1。

DeepSeek携一众用户带来的冲击,现已让一些大厂坐不住了。

首战之地的是Meta。一向被职业视为“大模型开源之王”的Meta,内部被曝出开端忧虑起还未发布的Llama 4,在功用上或许无法赶上DeepSeek R1。

被拿来全面临标的OpenAI,也开端感受到压力。OpenAI CEO奥特曼不只经过发布首个智能体Operator抢热度,还开端对外剧透起行将上线的o3-mini新音讯。

能够预见的是,DeepSeek掀起的职业地震,涉及的将不仅仅国外公司,国内大厂也难逃破例。

A。

作为一款开源模型,DeepSeek R1在数学、代码、自然言语推理等使命上的功用,声称能够比肩OpenAI o1模型正式版。

在AIME 2024数学基准测验中,DeepSeek R1得分率为79.8%,OpenAI o1的得分率为79.2%;在MATH-500基准测验中,DeepSeek R1得分率为97.3%,OpenAI o1的得分率为96.4%。

同为推理模型,DeepSeek R1不同于OpenAI o1的技能要害点,在于其立异的练习方法,如在数据练习环节运用的R1-Zero道路,直接将强化学习(RL)运用于根底模型,而无需依靠监督微调(SFT)和已标示数据。

此前,OpenAI的数据练习十分依靠人工干预,旗下数据团队乃至被建设成为不同水平的层级,数据量大、标示要求简略清晰的浅层数据,交给肯尼亚等廉价外包劳工,高等级的数据则交给更高本质符号人员,不少都是练习有素的高校博士。

DeepSeek R1的直接强化学习道路,就像让一个天才儿童在没有任何典范和辅导的情况下,朴实经过不断测验和获得反应来学习解题。

Perplexity公司CEO阿拉文·斯里尼瓦斯点评道:“需求是发明之母。由于DeepSeek有必要找到解决办法,终究它们发明出了更高效的技能。”。

除此之外,在获取高质量数据方面,DeepSeek也有所立异。

依据DeepSeek官方技能文档,R1模型运用数据蒸馏技能(Distillation)生成的高质量数据,提升了练习功率。数据蒸馏指的是经过一系列算法和战略,将原始的、杂乱的数据进行去噪、降维、提炼等操作,然后得到更为精粹、有用的数据。

这也是DeepSeek能够凭仗更小参数量,就完成比肩OpenAI o1模型功用的一大要害。人工智能专家丁磊博士告知字母榜(ID:wujicaijing),模型参数量巨细与终究模型呈现的作用之间,两者“投入产出并不成正比,而是非线性的……。数据多仅仅一个定性,更重要的是检测团队数据清洗的才能,不然跟着数据增多,数据搅扰也将随之变大。”。

更重要的是,DeepSeek是在用不到十分之一的资源根底上,获得的上述成果。

上一年12月底发布的DeepSeek-V3开源根底模型,功用对标GPT-4o,但官方介绍的练习本钱只要2048块英伟达H800,总花费约557.6万美元。

作为比照,GPT-4o模型的练习本钱约为1亿美元,占用英伟达GPU量级在万块以上,且是比H800功用更强的H100。

其时,前OpenAI联创、特斯拉自动驾驶担任人安德烈·卡帕西就发文表明,DeepSeek-V3级其他才能,一般需求挨近16000颗GPU的集群。

现在,DeepSeek官方没有发布练习推理模型R1的完好本钱,但官方发布了其API定价,R1每百万输入tokens在1元-4元人民币,每百万输出tokens为16元人民币。作为比照,OpenAI o1的运转本钱约为前者的30倍。

这样的体现也引发Scale AI创始人亚历山大·王(Alexandr Wang)点评道,我国人工智能公司DeepSeek的AI大模型功用大致与美国最好的模型适当。“曩昔十年来,美国或许一直在人工智能比赛中领先于我国,但DeepSeek的AI大模型发布或许会‘改动全部’。”。

a16z合伙人、AI大模型Mistral董事会成员 Anjney Midha更是发文说道,从斯坦福到麻省理工,DeepSeek R1简直一夜之间就成了美国顶尖大学研讨人员的首选模型。

包含斯坦福大学核算机科学系客座教授吴恩达、微软董事长兼CEO萨提亚·纳德拉等大佬在内,也都开端重视起这款来自我国的新模型。

事实上,这并非DeepSeek榜初次出圈。在宣告组成团队自研大模型以来,DeepSeek曾两度引发热议,只不过,之前更多限制在国内。

2023年4月,千亿量化私募巨子幻方量化发布公告,称将会集资源和力气,投身人工智能技能,成立新的独立研讨安排,探究AGI(通用人工智能)。

一个月后的2023年5月,该安排被命名为“深度求索”,并发布了首款模型DeepSeek V1。其时,《财经十一人》报导称,国内具有逾越1万枚GPU的企业不逾越5家。而DeepSeek便是其中之一,并由此开端得到外界重视。

及至2024年5月,DeepSeek再次凭借大模型价格战一跃成名。其时,DeepSeek发布了DeepSeek V2开源模型,并在职业界首先降价,将推理本钱降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一。

随后,字节、腾讯、百度、阿里等大厂纷繁降价跟进。我国大模型价格战由此开幕。

B。

DeepSeek R1的呈现,进一步向外界证明着,在大模型,尤其是通用大模型方面,创业公司仍然有时机。

1月初,零一万物创始人李开复对外正式表态,自己将退出对AGI的寻找,未来公司主攻中小参数的职业模型。“从商业视点考虑,咱们以为只要大公司能持续做超大模型。”李开复说道。

出资人们比李开复更急进。从2023年开端,作为金沙江创投主管合伙人的朱啸虎,便觉得大模型在炸毁创业,由于模型、算力和数据等三大支柱都向大厂会集,看不到创业公司的时机,且直接在大模型上做运用护城河太低,屡次提示创业者不要迷信通用大模型。

远望本钱程浩更是直接以为我国版的ChatGPT,只会在5家公司里发生:BAT+字节+华为。在程浩看来,创业者只要在具有先发优势的情况下,才有或许跑赢大厂。

正是由于最初谷歌等国外大厂并不看好OpenAI的大言语模型道路,才让ChatGPT凭借先发势能跑了出来。可是,当下研制大模型现已成为我国科技大厂的一致,乃至百度、阿里推出产品的动作,比创业公司还快。

但在承受暗涌采访中,DeepSeek创始人梁文锋在回应与大厂竞赛中曾说道,“大厂必定有优势,但假如不能很快运用,大厂也纷歧定能持续坚持,由于它更需求看到成果。头部的创业公司也有技能做得很厚实的,但和老的一波AI创业公司相同,都要面临商业化难题。”。

背靠千亿量化基金的DeepSeek,在免除资金的后顾之虑外,挑选了一条颇显理想主义的途径,即只做模型研讨,不考虑商业变现,且斗胆发动年轻人。

在DeepSeek的150左右团队中,大多是一帮Top高校的应届结业生、没结业的博四、博五实习生,以及一些结业才几年的年轻人。

这是梁文锋有意挑选的成果,也是DeepSeek能够抢在大厂前面推出R1模型的诀窍之一,“假如寻求短期方针,找现成有经历的人是对的。但假如看久远,经历就没那么重要,根底才能、发明性、酷爱等更重要。”梁文锋解释道。

这也使得DeepSeek成了我国大模型创业公司中,仅有一家只做根底模型、暂不考虑商业化的公司,还要加上一条,即有才能持续开源旗舰模型的公司。

到现在,DeepSeek R1现已成为开源社区Hugging Face上下载量最高的大模型之一,下载量逾越10万次。

此前,国内以百度创始人李彦宏为代表的一派,坚决以为开源道路打不过闭源道路,且缺少商业化支撑的开源模型,会在往后的竞赛中距离越拉越大。

但最少从现在来看,DeepSeek R1的呈现,证明靠开源道路仍然能够追上大模型头部玩家的脚步,且创业公司仍然有才能推进开源生态开展。

Meta AI首席科学家杨立昆(Yann LeCun)在点评中就说到,“给那些看到DeepSeek的体现后,觉得‘我国在AI方面正在逾越美国’的人,你们的解读是错的。正确的解读应该是,‘开源模型正在逾越专有模型’。”。

在上一年DeepSeek v3发布后,梁文锋就曾对外表明,公司未来不会像OpenAI相同挑选从开源走向闭源,“咱们以为先有一个强壮的技能生态更重要。”。

究竟,OpenAI的经历最少说明晰,在颠覆性的技能面前,闭源难以构成满足的护城河,更无法阻挠被他人赶超。“所以咱们把价值沉积在团队上,咱们的搭档在这个过程中得到生长,堆集许多know-how,构成能够立异的安排和文明,便是咱们的护城河。”。

2020年发布GPT-3时,OpenAI曾具体公开了模型练习的一切技能细节。我国人民大学高瓴人工智能学院履行院长文继荣以为,国内许多大模型其实都有GPT-3的影子。

但跟着OpenAI在GPT-4上一改开源战略,逐步走向关闭,一些国产大模型就此失去了可供仿制的追逐途径。

现在,DeepSeek携开源R1的到来,无疑将给国内外大模型玩家在对标o1的推理模型研制方面,创建起一条新的学习思路。

C。

DeepSeek在大模型范畴掀起的这场蝴蝶效应,现已开端影响到部分大厂。

有Meta职工在硅谷匿名八卦共享渠道Blind上发布音讯称,Meta的生成式AI部分正因DeepSeek处于惊惧中,乃至爆料称没有发布的新一代开源模型Llama 4,在基准测验中现已落后于DeepSeek。

在外媒的进一步报导中,Meta生成式AI团队和根底设施团队,正在组成4个作战小分队来像素级分析DeepSeek,有的企图搞清楚DeepSeek是怎么下降练习和运转本钱的,有的担任研讨DeepSeek或许运用了哪些数据来练习模型,有的则考虑根据DeepSeek模型的特点重组Meta模型的新技能。

与此同时,为了鼓舞士气,作为Meta创始人的扎克伯格,更是放出2025年持续扩展AI出资的新音讯,称2025年环绕AI的全体开销将到达600亿-650亿美元,比较上一年的380亿-400亿美元,增长了逾越70%,然后构建起一个具有130万块GPU的超级核算机集群。

除了跟Meta抢开源之王的名头外,DeepSeek正在从OpenAI手里抢走客户。

在比OpenAI廉价30倍的API价格诱惑力之下,一些草创公司正在改换门庭。企业级AI署理开发商SuperFocus的联合创始人Steve Hsu以为,DeepSeek的功用与为SuperFocus大部分生成式AI功用供给支撑的OpenAI旗舰模型GPT-4类似乃至更好。“SuperFocus或许会在未来几周转向DeepSeek,由于DeepSeek能够免费下载、在自家服务器上存储和运转,并将添加出售产品的利润率。”。

成为更多公司的模型底座,这也是梁文锋规划中DeepSeek最想占有的定位。在梁文锋看来,DeepSeek未来能够只担任根底模型和前沿的立异,然后其他公司在DeepSeek的根底上构建To B、To C的事务。”假如能构成完好的工业上下游,咱们就没必要自己做运用。”梁文锋说道。

国内,对DeepSeek的研讨也在同步进行。有报导称,字节跳动、阿里通义以及智谱、Kimi等团队,都在活跃研讨DeepSeek,字节跳动乃至或许在考虑与DeepSeek打开研讨协作。

在这些公司之前,雷军更是祖先一步挖起了DeepSeek的墙角。上一年12月,榜首财经爆料称,雷军疑似开出千万年薪亲身挖来“95后天才少女”罗福莉,后者是DeepSeek-V2开源模型的要害开发者。未来,罗福莉或将供职于小米AI实验室,领导小米大模型团队。

挖人之外,国内更剧烈的竞赛或将相同环绕API打开,“上一年国内有一批创业公司和中小企业,由于OpenAI断供转向了国内大模型公司,现在DeepSeek很有或许成为克复OpenAI失地的那个野蛮人。”恒业本钱创始人合伙人江一猜测道。

压力传导到了这些国内大模型公司身上。假如它们不能快速将模型作用跟进到R1等级,客户就难免用脚投票。

特别声明:本文为协作媒体授权DoNews专栏转载,文章版权归原作者及原出处一切。文章系作者个人观点,不代表DoNews专栏的态度,转载请联络原作者及原出处获取授权。(有任何疑问都请联络idonewsdonews.com)。

内容来源:https://tongdaidmxanh.com/app-1/barca vs inter,http://chatbotjud-teste.saude.mg.gov.br/app-1/22bet-gratis-bonus

(责任编辑:经济)

    系统发生错误

    系统发生错误

    您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

    [ 错误信息 ]

    页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!