会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 揭秘Scaling Law背面的“我国基因”:助推OpenAI成功的隐秘推手居然是它!

揭秘Scaling Law背面的“我国基因”:助推OpenAI成功的隐秘推手居然是它

时间:2025-05-23 02:08:25 来源:锐评时讯 作者:男性 阅读:703次

如果说哪条大模型中心理论影响最为深远,那么“Scaling Law”必定位列其间。

所谓“Scaling Law”,是指在深度学习中,增大数据量和模型参数能让模型性能指标提高,这种提高并非线性,而是遵从一种幂律联系。而OpenAI的GPT系列模型,无疑是这一理论最著名的作用展示。

但。让许多人意想不到的事,这个让OpenAI “大力出奇观”创造出GPT而一举成名的理论,最早的研讨来源其实是一家我国企业。

上个月,OpenAI论文的合著者、前OpenAI研讨副总裁、Anthropic创始人Dario Amodei在一档播客中提及,2014年他与吴恩达在百度研讨AI时,就现已发现了模型开展规律Scaling Law这一现象。,直到OpenAI在 2020年的Scaling Law研讨中引用了百度研讨人员2019年宣布的论文,这个理论才真正被职业所熟知。

此外,Meta研讨员、康奈尔大学博士提名人Jack Morris在交际媒体X上引用了一篇标题为《Deep Learning Scaling is Predictable, Empirically》论文,该论文展示了在机器翻译、言语建模、图画处理和语音辨认等四个范畴中,跟着练习集规划的增加,DL 泛化差错和模型巨细呈现出幂律增加(scaling)形式,与现在的“Scaling Law”理论千篇一律。

可见,正是百度的前期研讨,为AI大模型的开展奠定了理论根底。

AI赛道上,我国企业并不落后。

2023年,ChatGPT的面世使大模型成为人工智能职业的焦点。虽然OpenAI在职业中引领风潮,但后来者凭仗规划与技能实力的堆集,敏捷呈现出百家争鸣的状况,海外企业如谷歌、Meta、Anthropic等企业,纷繁推出才干不亚于GPT-4的模型序列。

我国科技企业更是以惊人的速度奋勇赶上。百度、阿里等国内巨子的大模型开端大规划落地,走进千行百业。仅百度文心大模型,日均调用量便已超15亿,自上一年12月初次发表以来增加30倍。一起根据头部企业供给的根底模型才干,国内大模型使用生态现已初具规划。

虽然美国在AI模型立异方面一向被视为领先者,但最新评论显现,我国在探究一些AI范畴概念方面,比美国更为超前。

早在“大模型”技能迸发前,百度便已进行技能储备。2019年3月,百度发布文心大模型1.0版别,并紧随GPT迭代速度进行迭代,在2023年3月敏捷推出文心大模型3.5,成为国内首家推出大模型产品的大厂,同年10月进一步发布文心大模型4.0版别,完结大模型中心才干的全面提高。据悉,百度还将在2025年头推出文心大模型全新版别。

跟着AI全面深化多模态范畴,百度创始人李彦宏在百度世界2024上首发图画检索增强iRAG技能,用以减轻图画生成中的错觉问题,让多模态技能可以更好落地工业。

在智能体方面,百度亦是业界最早布局的大厂之一,2023年9月上线“灵境矩阵” (文心智能体渠道前身)。相比之下,谷歌、Meta等海外企业在2024年才正式发力智能体,而据OpenAI CEO山姆·奥特曼推文泄漏,其智能体产品需比及2025年才会正式发布。

把握必定先发优势,也让国内的大模型生态可以先美国一步走进工业。到2024年11月,百度文心智能体渠道招引了逾越80万开发者和15万家企业入驻,掩盖教育、文娱、零售、制作等多个职业范畴。

我国也是全球AI的黄埔军校。

在全球顶尖AI企业与科学家集体中,华人已成为一股不行忽视的力气。

以OpenAI为例,其前期团队中有9名华人,占团队总人数的10%。其间,5人本科结业于我国高校,别的3人则在美国高校完结本科教育。更广为人知的“AI教母”李飞飞,亦是华人身世,作为“空间智能”理论的奠基者,她的研讨在全球范围内树立了标杆。

值得一提的是,现在在世界尖端AI组织中担任中心职位的许多领军人物,许多都曾在我国企业堆集了名贵的研制经历。例如,2014年吴恩达参加百度担任首席科学家,主导了“百度大脑”方案的开发。在他的邀请下, Dario Amodei斯坦福博士后结业后,参加到了百度硅谷AI实验室,随后又招募了Jim Fan来百度实习。现在,Dario Amodei成为Anthropic的创始人兼首席执行官,而Jim Fan则是英伟达AI范畴的中心人物。

这些从我国企业走向世界舞台的顶尖人才,不只展示了个人的杰出才干,也将我国企业在AI范畴的深刻理解与实践作用传递到全球。在这些AI顶尖人才身上,既凝聚了我国高校与企业的培育见识,也显示了我国作为全球AI“黄埔军校”的重要位置。

自主可控的“母语”大模型。

从工业格式看,为14亿我国用户量身定制、打造契合我国言语习气的“母语AI”,既是我国AI企业的优势地点,也是不行或缺的战略目标。

早在2024年3月,百度李彦宏就揭露表明,“文心大模型4.0在中文处理上显着逾越GPT-4”,这得益于丰厚的中文语料练习,以及深谙中文表达的本乡工程师的精密调试。不只如此,阿里通义、字节豆包、讯飞星火等国产大模型相同完结了在中文语境中的逾越,为我国用户和工业供给了高质量的人工智能服务。

更为重要的是,我国工业对“接地气”的国产大模型有着巨大的需求。这些大模型可以愈加“近水楼台”地接触到工业的多样化需求,并以更高效的方法供给定制化解决方案。在实践使用场景中,我国企业正活跃将AI技能扩展至制作业、医疗、教育等范畴。这种严密结合实践需求的形式,使国产大模型在落地作用上具有明显优势。

与此一起,全球AI竞赛格式的演化,进一步凸显了自主可控的重要性。近来,特朗普提议建立人工智能部长,并将AI技能提高到国防战略层面,直接引发了新一轮的“AI军备竞赛”。这让业界清醒地认识到,只要构建自主可控的大模型生态,将关键技能牢牢把握在自己手中,才干防止在世界竞赛中被“卡脖子”。

从“Scaling Law”背面的深沉堆集,到国产大模型引领中文语境的打破,我国企业现已从“追随者”逐渐迈向“领跑者”的人物,在技能研制、理论立异和工业落地的多维度竞赛中,我国AI企业展示出了极强的适应性与开辟力,在全球AI范畴的影响力也日积月累。

信任在许多国内领军企业的推进下,我国AI生态也必将越来越完善,为全球人工智能工业奉献更多“我国才智”。

内容来源:https://hoangkimngan.com/app-1/bet99,http://chatbotjud.saude.mg.gov.br/app-1/wild-bet-777

(责任编辑:男性)

    系统发生错误

    系统发生错误

    您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

    [ 错误信息 ]

    页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!