Llama 3受美国商场萧瑟，开源模型还香吗？

时间：2025-05-22 21:06:19 来源：锐评时讯作者：咨询阅读：649次

作为开源大模型的顶梁柱，Llama3正在遭受萧瑟。

近来，据美国媒体The Information报导，Llama在全球最大的云核算服务供货商亚马逊的AWS渠道上备受萧瑟，与之相对，Anthropic的闭源模型Claude才是该渠道上最受欢迎的模型。报导称，在另一家云渠道微软Azure上，Llama也并非微软的出售首选。

一个月前，Meta发布了最新的开源大模型Llama 3.1 405B，在测验中功能追平GPT-4o。惋惜，测评中的优异成绩没能反映在市场上，据报导，Llama3.1上线一个月后，下载量仅为360万，比上一代模型降低了40%。

门槛高功率低，开源模型“才是最贵的”。

这一现象早有征兆。早在本年4月，Llama 3推出70B和400B模型之后，就有开发者反应“免费的才是最贵的”，Llama 3“底子用不起”的现象。

其时，一位美国AI创业者Arsenii Shatokhin的采访视频在网上撒播，这位创业者表明，“咱们只要一两个客户有满足资源，来精调或运转700亿参数的Llama开源模型。”。

访谈中，这位AI智能体公司VRSEN的创始人指出，企业自己运转开源大模型的功率远低于运用闭源大模型。他分分出两个原因：

1）首要，开源模型大都需求企业自己下载后运转，跟着模型参数向百亿、千亿不断攀升，对本地IT设备要求也随之前进，很多企业并不具有与之匹配的满足资源；

2）其次，与做好精谐和商业化适配的闭源模型不同，假如运用开源模型，企业还要再做优化，需求公司内部有满足的技能人才和技能设备，对企业的技能才干无疑是提出了更高要求。

“咱们只会向具有数据专业知识的客户推销Llama，比方内部有工程师和数据科学家的公司。”据The Information报导中，微软职工这样向媒体表明。

正如百度创始人李彦宏在近期的上海国际人工智能大会上表明，开源模型在学术研究、教育范畴有必定价值，可以让学术界更了解大模型的作业机制、构成理论；但在大大都的运用场景中，开源模型并不适宜，尤其是在剧烈的商业化竞赛中，只要闭源模型，才干让企业的事务功率更高、本钱更低。

近期，开源和闭源模型之争一向备受职业重视，尤其是在不时更新的“测评跑分”上，每逢新一代大模型诞生、领跑测评榜时，就会爆出“开源大模型逾越闭源”或“闭源大模型坚持抢先”的各类说法。

但迄今为止，闭源模型功能全体抢先于开源。在斯坦福大学7月发布的大规模多任务言语了解 (MMLU)测验排名中，排名前十的模型中，仅有Llama 3.1为开源，其他9款上榜模型均为闭源。

某种程度上，这与开源模型并非“真开源”有关。有多位开发者表明，当时的开源大模型并非与开源软件不同，仅仅是开放了参数和调用接口，在运用中既存在需求SFT精调、优化的问题，还无法像真开源的Linux那样看到底层代码。

因而，大模型的开源并不能带来模型作用的前进。“开源模型和闭源模型比较，存在功能距离，这种距离将持续扩展。”谷歌前CEO施密特在采访中指出。据介绍，谷歌出资的法国Mistral公司此前推出过开源模型，但从本年2月起，现已转向了闭源模型。

在实用性方面，伴跟着Llama 3的“叫好不叫座”，开源模型更是与闭源模型拉开了距离。有多位开发者表明，大模型的前进与实践运用密不可分，只要实在运用才干不断为模型供给反应，让模型在响应速度、参数巨细等方面不断优化。

跟着商业化的失速，缺少商业验证的开源模型，势必会逐渐掉队。

(大众号：)。

版权文章，未经授权制止转载。概况见转载须知。

(责任编辑：生活)

系统发生错误

您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

[ 错误信息 ]

页面发生异常错误，系统设置开启调试模式后，刷新本页查看具体错误！