会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 Llama 3受美国商场萧瑟,开源模型还香吗?!

Llama 3受美国商场萧瑟,开源模型还香吗?

时间:2025-05-22 21:06:19 来源:锐评时讯 作者:咨询 阅读:649次

作为开源大模型的顶梁柱,Llama3正在遭受萧瑟。 

近来,据美国媒体The Information报导,Llama在全球最大的云核算服务供货商亚马逊的AWS渠道上备受萧瑟,与之相对,Anthropic的闭源模型Claude才是该渠道上最受欢迎的模型。报导称,在另一家云渠道微软Azure上,Llama也并非微软的出售首选。

 

一个月前,Meta发布了最新的开源大模型Llama 3.1 405B,在测验中功能追平GPT-4o。惋惜,测评中的优异成绩没能反映在市场上,据报导,Llama3.1上线一个月后,下载量仅为360万,比上一代模型降低了40%。

门槛高功率低,开源模型“才是最贵的”。

这一现象早有征兆。早在本年4月,Llama 3推出70B和400B模型之后,就有开发者反应“免费的才是最贵的”,Llama 3“底子用不起”的现象。

 其时,一位美国AI创业者Arsenii Shatokhin的采访视频在网上撒播,这位创业者表明,“咱们只要一两个客户有满足资源,来精调或运转700亿参数的Llama开源模型。”。

访谈中,这位AI智能体公司VRSEN的创始人指出,企业自己运转开源大模型的功率远低于运用闭源大模型。他分分出两个原因:

1) 首要,开源模型大都需求企业自己下载后运转,跟着模型参数向百亿、千亿不断攀升,对本地IT设备要求也随之前进,很多企业并不具有与之匹配的满足资源;

2) 其次,与做好精谐和商业化适配的闭源模型不同,假如运用开源模型,企业还要再做优化,需求公司内部有满足的技能人才和技能设备,对企业的技能才干无疑是提出了更高要求。

“咱们只会向具有数据专业知识的客户推销Llama,比方内部有工程师和数据科学家的公司。”据The Information报导中,微软职工这样向媒体表明。

正如百度创始人李彦宏在近期的上海国际人工智能大会上表明,开源模型在学术研究、教育范畴有必定价值,可以让学术界更了解大模型的作业机制、构成理论;但在大大都的运用场景中,开源模型并不适宜,尤其是在剧烈的商业化竞赛中,只要闭源模型,才干让企业的事务功率更高、本钱更低。

缺少商业验证,开源模型将越来越落后。

近期,开源和闭源模型之争一向备受职业重视,尤其是在不时更新的“测评跑分”上,每逢新一代大模型诞生、领跑测评榜时,就会爆出“开源大模型逾越闭源”或“闭源大模型坚持抢先”的各类说法。

但迄今为止,闭源模型功能全体抢先于开源。在斯坦福大学7月发布的大规模多任务言语了解 (MMLU)测验排名中,排名前十的模型中,仅有Llama 3.1为开源,其他9款上榜模型均为闭源。

某种程度上,这与开源模型并非“真开源”有关。有多位开发者表明,当时的开源大模型并非与开源软件不同,仅仅是开放了参数和调用接口,在运用中既存在需求SFT精调、优化的问题,还无法像真开源的Linux那样看到底层代码。

因而,大模型的开源并不能带来模型作用的前进。“开源模型和闭源模型比较,存在功能距离,这种距离将持续扩展。”谷歌前CEO施密特在采访中指出。据介绍,谷歌出资的法国Mistral公司此前推出过开源模型,但从本年2月起,现已转向了闭源模型。

在实用性方面,伴跟着Llama 3的“叫好不叫座”,开源模型更是与闭源模型拉开了距离。有多位开发者表明,大模型的前进与实践运用密不可分,只要实在运用才干不断为模型供给反应,让模型在响应速度、参数巨细等方面不断优化。

跟着商业化的失速,缺少商业验证的开源模型,势必会逐渐掉队。


(大众号:)。


版权文章,未经授权制止转载。概况见转载须知。

内容来源:https://hoangkimngan.com/app-1/sxmn la,http://chatbotjud.saude.mg.gov.br/app-1/444-win-bet

(责任编辑:生活)

    系统发生错误

    系统发生错误

    您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

    [ 错误信息 ]

    页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!