AI版权案首例?Meta被指控用盗版网站数据练习LLM -
【CNMO科技音讯】近来,关于人工智能的争议再度加重,Meta被指控运用盗版网站的内容来练习其大型言语模型(LLM)Llama。外媒称,这起案子创始了科技公司因运用盗版内容练习AI而面对版权诉讼的先河。
2023年,Meta因涉嫌在LLM模型Llama的练习过程中运用盗版内容而遭到小说家理查德·卡德雷和克里斯托弗·金登的申述。案子名为“Kadrey等人诉Meta渠道案”,原告宣称Meta未经授权运用了受版权维护的内容。
Meta曾向法院提交通过修改的信息文件,但加利福尼亚州北区联邦区域法院的法官文斯·查布拉要求揭露原始文件。这些文件展现了Meta职工关于Meta AI和Llama的攀谈记载,其间一位工程师说到在公司笔记本上下载盗版内容感到不当,这证明了Meta的确运用了盗版内容来练习AI。此外,还有对话暗示Meta首席执行官马克·扎克伯格(Mark Zuckerberg)默许了运用盗版资料的行为。
依据标明,Meta从LibGen这一盗版书本、杂志和学术论文的大型资源库中获取了内容。LibGen自2008年在俄罗斯创立以来,已屡次卷进版权诉讼,但其实践运营者身份不明。据报道,Meta还从其他不合法资源库中获取了内容用于AI练习。
Meta则辩称,其运用公共资料的行为契合“合理运用”法令准则,该准则答应在特定情况下未经答应运用受版权维护的内容,但需具体情况具体分析。Meta还表明,其运用文本仅是为了进行言语计算建模并生成原始表达。
值得注意的是,这并不是大型科技公司初次面对运用受版权维护内容练习AI模型的指控。上一年的一项查询发现,苹果创立的OpenELM模型包含了来自超越17万个YouTube视频的字幕。尽管开始引发了对苹果运用受版权维护内容练习Apple Intelligence的忧虑,但该公司后来弄清说,OpenELM是一个用于研讨意图的开源模型,其数据库并未用于支撑Apple Intelligence。
苹果表明,其在iOS和macOS上供给的AI功用是在“答应数据”上练习的,包含为增强特定功用而挑选的数据以及由网络爬虫搜集的揭露可用数据。值得一提的是,许多大型出版商,如《纽约时报》和《大西洋月刊》,已挑选不与Apple Intelligence练习同享其内容。
内容来源:https://sonybravia.xyz/app-1/kubet611,http://chatbotjud-teste.saude.mg.gov.br/app-1/h2bet-código-promocional
(责任编辑:经济)