Meta承认使用盗版书籍来训练AI,并拒绝赔偿作家
金融界
2024-01-17 00:55:04

原标题:Meta承认使用盗版书籍来训练AI,并拒绝赔偿作家

DoNews1月15日消息,近日,Meta 就因使用包含大量盗版书籍的“Books3”数据集训练其 LLAM 1 和 LLAM 2 模型而面临包括喜剧演员 Sarah Silverman 和作家 Richard Kadrey 在内的一众作者的集体诉讼。Meta 虽承认使用了 Books3 数据集,却拒绝向作者支付适当的补偿。

Books3 是一个包含 19.5 万本图书、总容量近 37GB 的文本数据集,由 AI 研究者 Shawn Presser 于 2020 年创建,旨在为改进机器学习算法提供更好的数据源。

Meta 也将其用于训练自己的 LLAM 模型,然而 Books3 中包含大量从盗版网站 Bibliotik 爬取的受版权保护作品,使得 Meta 的行为面临法律风险。

Meta 的做法并非特例。此前,《纽约时报》也因 OpenAI 和微软使用其文章训练聊天机器人 ChatGPT 而对其提起诉讼。

OpenAI 则辩称,不使用受版权保护的材料来训练 AI 模型“几乎不可能”,并要求法院驳回相关诉讼。Meta 同样否认故意侵犯版权,声称其使用 Books3 数据集属于合理使用范畴,无需获得许可、署名或支付补偿。

此外,Meta 还在对诉讼作为集体诉讼的合法性提出异议,拒绝向提起诉讼的作家或其他参与 Books3 争议的人士提供任何形式的经济“补偿”。

值得注意的是,Books3 数据集中的部分内容来自盗版网站 Bibliotik,该数据集在 2023 年被丹麦反盗版组织 Rights Alliance 要求下架,目前面临数字存档禁令。

来源:DoNews

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

联邦快递在中国推出智能方案,提... 联邦快递4月7日宣布,在中国创新推出FedEx Surround视必达智能解决方案,旨在帮助中国客户...
以案释法 | 普通人“一场直播... “健康主播”培训乱象: 科普如何更“靠谱” “零基础当‘健康主播’,月入过万不是梦”“三天速成,AI...
卓银科技:从“AI驾校”到产业... 在人工智能浪潮席卷全球的今天,一个普遍存在的困境是:尖端技术如何跨越实验室与商业报告,真正“下沉”到...
创新成果+2,北京两款首创医疗... 近期,北京医疗器械创新领域喜讯连连。两款首创医疗器械相继获得国家药品监督管理局上市批准:分别为超目科...
比亚迪取得用于箱体加工工装专利... 国家知识产权局信息显示,比亚迪股份有限公司、深圳市比亚迪锂电池有限公司取得一项名为“一种用于箱体加工...
TensorWave能否实现跨... 来源:环球市场播报 去年 TensorWave 首席执行官杰夫・塔塔丘克举办的 “超越 CUDA”...
HMD 2026年夏季新机规格... IT之家 4 月 7 日消息,消息源 @smashx_60 现已公布了 HMD Global 今年夏...
中科宇航火箭远海发射相关专利获... 企查查APP显示,近日,北京中科宇航技术有限公司申请的“火箭远海发射方法及一体式海上发射船”专利获授...
小米入股万通康达:硬科技生态落... 图片为AI生成 天眼查工商信息显示,近日,万通康达检测技术(苏州)有限公司发生工商变更,新增小米旗下...
IBM与Arm联手推进企业AI... IBM正在与Arm合作,将Arm原生应用引入其企业系统,扩大对AI工作负载的支持,特别是在那些优先考...