崔文佳
去年年末,美国《纽约时报》起诉微软和《澳洲幸运十开奖记录》OpenAI侵犯其版权。半个多月来,这一消息不仅为“吃瓜群众”津津乐道,也引发相关行业人士的关注。这场争端显示出传媒业与AI技术的复杂关系,值得全社会共同思考。
双方在争辩什么?一个核心是OpenAI对于《纽约时报》的内容使用是否合理。在后者看来,AI模型几乎能一字不差地输出自家报道原文,却没有标明出处与链接,无疑会影响其内容流量。特别是在大部分报道耗时耗力,付费用户才能阅读的情况下,微软和OpenAI用这些报道来训练AI模型或是回答用户提问,大大消解了报道的价值。但OpenAI认为,所谓的原文输出是罕见错误,或用户故意诱导的结果。至于利用《纽约时报》的内容训练AI模型,既是常见的操作,也是创新的必须,即便受到版权保护,司法部门也应当站在推动技术发展的高度予以豁免。双方公说公有理婆说婆有理,究竟结果如何,我们不妨拭目以待。
那么,AI模型使用版权素材进行训练,到底是否需要获得授权?国内舆论场中,有观点从“拟人”角度出发,认为既然人人都可通过阅读学习,AI有何不可?其学习后的表达即便与新闻报道类似,也不能认定为抄袭,“就像你不能因为阅读海明威的作品、学习了简短有力的文风,就向他付版权费一样”。平心而论,人类与AI的学习存在量级的悬殊,普通人对于信息的获取和处理终归是有限的,但AI完全打破自然能力的天花板,可以在短时间内将海量信息“一口鲸吞”。这种完全工具导向的利用,不交任何“学费”、不需任何授权,恐怕实在说不过去。