生成式AI相关的版权问题(3)

发布时间:2024-01-25 09:13:39 浏览量:229次

具体问题:训练(4-14)

继续看AI模型训练相关的版权问题:

  • 版权所有人是否必须明确同意(选择加入/opt in)使用他们的作品作为训练材料?是否应向版权所有人提供拒绝(选择退出/opt out)的方法?

1)所有用途都需要同意,还是仅商业用途时才需要版权所有者的同意?

2)如果提供“选择退出”的方法,这一过程对反对将其作品用于训练的版权所有者来说会起到什么作用?是否有技术工具可以促进这一过程(例如以技术标识或元数据表明自动化收集和存储的数据不应用于AI训练)?

版权局在注释中援引了欧盟DSM版权指令中有关文本与数据挖掘版权例外的规定,相关情况前天看过了,此处不再重复。版权局还引用了Emilia David在2023年8月7日发布的文章Now you can block OpenAI’s web crawler,其中提及一些AI公司已经开始允许版权所有者将其作品标记为不可用于AI训练。

3)建立或应用相关流程有什么法律、技术或实践上的障碍吗?考虑到训练使用的作品数量,是否可以事先征得版权所有人的同意?

4)如果异议不被接受,有什么补救办法?现有的侵权救济是适当的,还是应该有单独的诉因?

5)在人类创造者不拥有版权的情况下——比如版权已经转让或作品是雇佣作品,他们是否有权反对使用他们的作品训练AI模型?如果有权,运作机制是什么?

  • 如果训练生成式AI模型需要版权所有者的同意,如何取得许可,或者是否需要取得许可??

1)直接自愿许可(direct voluntary licensing)是否在部分或全部创意行业可行?

2)自愿集体许可计划(voluntary collective licensing scheme)是否可行或可取?现有的集体管理组织是否适合提供此类许可?是否有法律或其他障碍在阻止这些组织发挥相关作用?国会是否应考虑通过立法或其他措施(比如反垄断例外)来促进集体许可的谈判?

通知援引WIPO“WIPO Good Practice Toolkit for CMOs”(collective management organizations-CMOs)和MLC介绍说,集体许可是直接许可制度的一种替代办法。直接许可制度下,版权所有人以个人为单位进行谈判签约,集体许可制度下,权利由一个管理组织集中和管理,管理组织协商许可使用条款并向参与的版权所有者分发报酬。

3)国会是否应该考虑建立一个强制许可制度?如果是这样,这个制度应该是什么样的?许可证应该包括哪些活动,哪些作品将受到许可证的约束,版权所有者是否有能力选择退出?如何设定办税税率和调控,如何分配、报告和分发?

强制或法定许可无需得到版权所有者的同意,只要被许可方遵守许可规定(最显著的就是向版权所有者支付法定版税)。

4)扩展集体许可计划是否可行或可取?

“扩展集体许可计划”(extended collective licensing scheme-ECL)是指相关许可机构在受到某些保障措施的约束下,有权代表其行业的版权所有权持有人对特定的版权作品进行许可。前述“版权所有权持有人”不仅指给予该机构特定许可的成员,也包括非成员。ECL定义可参见LexisNexis Glossary (2023)、版权局人员致司法委员会人员的信(两封日期均是2017年9月29日)。

5)许可制度是否因作品类型不同而不同?

  • 在获得适当的训练许可方面可能存在哪些法律、技术或实际问题?谁(如果有的话)应负责保护它们?(例如,训练数据集的管理者,训练AI模型的开发者和在AI系统中应用该模型的公司是不同实体,可能具有不同的商业或非商业角色?)
  • 确定特定作品对生成式AI系统的特定输出的贡献程度是否可能或可行?请解释。
  • 许可要求对开发和采用生成式AI系统会产生什么经济影响?
  • 请描述您认为与训练AI模型潜在版权责任相关的其他因素。

具体问题:透明度和记录保存

第二个具体事项涉及透明度和记录保存:

  • 为了让版权所有人确定他们的作品是否被使用,是否应该要求AI模型的开发者收集、保留和披露有关模型训练材料的记录?训练数据集的创建者是否应承担类似义务?
  • 要求到什么程度?
  • 应向谁披露?
  • 集成第三方模型的AI系统开发者应承担哪些义务?
  • 对于AI模型或AI系统的开发者、创作者、消费者或其他相关方来说,这种记录保存系统的成本或其他影响是什么?
  • 是否应对“通知版权所有人其作品被用于训练AI模型”设定义务?
  • 版权法之外,是否有现行(美国)法律要求AI模型或系统的开发者保留或披露他们使用的训练材料的记录?

具体问题:生成式AI输出(可版权性、侵权)

生成式AI输出问题分为可版权性、侵权、标签标识三类。

可版权性相关问题包括:

  • 根据版权法,使用生成式AI系统的人是否应在某些情况下被视为该系统产生的材料的“作者”?如果是,哪些因素与决定有关?例如,选择训练AI模型的材料和/或提供一系列迭代的文本命令或提示是否足以使其被视为作者?
  • 是否有必要对版权法进行修订,以澄清人类作者身份的要求,或提供额外的标准,以确定含有AI生成材料的内容何时受到版权保护?
  • 作为一项政策,对AI生成的材料进行法律保护是否可取?是否有必要对AI生成的材料进行法律保护,以鼓励生成式AI技术和系统的发展?对运行生成式AI系统的计算机代码的现有版权保护是否提供了足够的激励?
  • 如果你认为应予保护,它应该是一种版权权利,还是一种单独的自成一体的权利?如果是后者,对AI生成的材料的保护应该在哪些方面不同于版权?

看到这里想起“数据”。最近一年来国内关于数据要素登记、交易、会计准则、出资入股等等的新闻特别多,有些地方甚至在起草登记规则时直接使用“数据产权”一词。总觉得有种趋势是在推动将数据“产权”作为与版权、专利权、商标权并列的新型权利纳入知识产权体系。

  • 美国宪法中的版权条款是否允许对AI生成的材料进行版权保护?这种保护会“促进科学和实用艺术的进步”吗?如果有,怎么做?

侵权相关问题包括:

  • AI生成的输出是否涉及在先版权作品的专有权,例如复制权或衍生作品权?如果是,在什么情况下会涉及?
  • 实质相似性测试是否足以解决基于生成式AI系统输出提出的侵权索赔?或者有其他合适或必要的标准?
  • 如果AI模型的开发人员没有保存或提供其使用的培训材料的记录,版权所有人如何证明复制元素(例如通过证明对受版权保护的作品的访问)?现有的民事证据开示规则是否足以解决这种问题?
  • 如AI生成的材料被发现侵权,谁应该直接或间接承担责任——生成式AI模型的开发者、包含该模型的系统的开发者、系统的最终用户,还是其他方?
  • 系统输出基于“开源”AI模型时,侵权认定是否会有不同的考量?

版权局在这里备注说有一些AI模型是由开发者发布,供公众下载和使用的。这种所谓的“开源”模式可能会通过许可协议条款限制使用方式。例如,MetaAI在2023年7月18日发布的Llama 2社区许可协议中,要求Llama 2 AI模型用户载明归属通知且不得用于月活超过7亿的服务。

  • 如果生成式AI系统是在包含版权管理信息(CMI)的版权作品上进行训练的,那么系统输出时对该信息的处理应如何适用17 U.S.C. 1202(b)?

前面我们看了一系列集体诉讼,版权案件的原告都在诉状中依据1202(b)主张被告违反DMCA,擅自删除、更改相关版权管理信息。

  • 请描述您认为决策者应考虑的AI生成输出相关版权侵权责任的其他问题。

参考:

https://www.lexisnexis.co.uk/legal/Glossary/Extended-Collective-Licensing-ECL-scheme
https://www.copyright.gov/policy/massdigitization/house-Letter.pdf

https://www.copyright.gov/policy/massdigitization/senate-Letter.pdf

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定