宁夏社会科学 | 焦和平 唐文菁:生成式人工智能数据蒸馏的著作权风险及其化解
- 发布时间:
- 2025-12-24
- 文章标题:
- 宁夏社会科学 | 焦和平 唐文菁:生成式人工智能数据蒸馏的著作权风险及其化解
- 内容:
近日,《宁夏社会科学》杂志2025年第6期发表了团队师生学术论文,题为《生成式人工智能数据蒸馏的著作权风险及其化解》。作者:焦和平,西安交通大学法学院教授、博士生导师;唐文菁,西安交通大学法学院硕士研究生。
论文题目:生成式人工智能数据蒸馏的著作权风险及其化解
摘要:数据蒸馏是一种提升模型训练效率的机器学习技术。数据蒸馏的核心主体可以形象化为“学生”与“教师”两个模型。学生模型通过数据蒸馏使用教师模型的训练结果,导致其输入端存在侵犯教师模型生成内容、输出端存在侵犯现有作品及教师模型训练数据集的著作权风险。尽管从法哲学、法经济学、法政策学的视角出发,将数据蒸馏纳入合理使用既有利于实现公平正义、提升社会效益,也有利于促进公平竞争、推动产业发展、提升国际竞争力,但目前仍缺少能够直接适用的立法和司法判断标准。建议在《中华人民共和国著作权法》中新增数据蒸馏为法定情形,将适用范围限定于学生模型投入市场前。针对合理使用无法覆盖的侵权风险,建议模型研发者借助技术手段优化模型,有效规避风险。从长远来看,应在行业层面借助人工智能模型训练开源社区的自治规范,鼓励科技企业选择开放创新模式,从源头上平抑数据蒸馏的著作权风险。
关键词:生成式人工智能;数据蒸馏;著作权


