21世纪经济报道记者肖潇 北京报道
8月16日,秘塔AI发文称,公司近日收到了《中国学术期刊(光盘版)》电子杂志社有限公司(下称知网)的侵权告知函。知网指控“秘塔AI搜索、秘塔AI搜索APP向用户提供我司的学术文献题录及摘要数据,且数量巨大。此行为未经我司许可,严重侵犯我司合法权益。”并附上了侵权证据,告知文件共28页。
知网由此要求,中国知网不希望被秘塔科技搜索到,要求秘塔AI立即断开搜索结果。截至发稿,知网没有回应记者的进一步问询请求。
图源:AI秘塔公众号
秘塔AI为今年年初上线的一款AI搜索工具,可以理解为能实时联网的ChatGPT,AI的每一句观点会附上来源和原文链接。在“深入”模式下,用户可以要求秘塔AI只搜索和总结学术文献,可以说是一大特色功能。
秘塔AI发文回应知网,强调自己仅收录了论文的文献摘要和题录,没有收录文章内容本身,阅读论文仍然需要跳转链接到网站获取。公司还提到,“没有search(搜索),就没有research(研究)”,认为这能让文献查找变得更快速和精准。
因此对于知网的诉求,秘塔AI表示不理解但尊重,即日起不再收录知网文献的题录及摘要数据,转而收录其他中英文权威知识库的数据。
上海申伦律师事务所律师夏海龙告诉21世纪经济报道记者,知网的指控主要针对两个内容:文献题录和摘要。“单纯的标题、目录一般不会被认为构成(著作权意义上的)作品,也不涉及到侵权的问题。但是摘要部分,极可能被认定为作品,擅自引用就可能构成侵权。”夏海龙分析。
不止秘塔一家AI搜索工具,碰到了类似的侵权争议。今年6月开始,《福布斯》《连线》等媒体纷纷指控头部AI搜索工具PerplexityAI,能爬取付费墙内的网页内容,几乎在复述报道原文;另一方面,不少AI公司都会用“合理使用”辩护,认为爬取互联网内容是为了推动技术创新、推动知识传播。
此前广东财经大学法学院教授姚志伟向21记者分析,目前我国《著作权法》列举的13种合理使用情形中,没有包含数据挖掘行为。此外,我国在司法实践中看重使用目的,会强调这一行为是否是商业使用、有没有营利性质。所以,虽然目前法律还没有给出一个明确答案,但从整体来看,与大模型有关的数据爬取,在我国可能比较难落入“合理使用”的范畴。而面对这一颗“隐雷”,AI巨头往往会选择私下签署版权合作协议,与大型内容版权方共享收入,以缓解侵权风险。(详见:AI“剽窃”问题难解丨AI版权战事)
值得一提的是,在上个月21记者参加的一场论坛上,知网一高管曾透露,知网近期开始探索数据变现之路。“我们已经开始了知识资源的数据交易,跟上海数据交易所、北京国际大数据交易所都有全面的合作。” 该高管还提到,知网与华为合作研发了华知大模型,系知识领域的增强大模型,知网希望把学术专著、专业论文,以及专业学术的统计数据、标准数据、专利数据,开发成能流通的知识数据资源。