知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?

8月16日,上海秘塔网络科技有限公司官微发布声明称,昨日公司收到《中国学术期刊(光盘版)》电子杂志社有限公司(下称“知网”)长达28页的侵权告知函
秘塔科技在声明中表示,秘塔AI搜索的“学术”版块仅收录了论文的文献摘要和题录,并未收录文章内容本身,阅读正文需通过来源链接跳转至网站获取。
秘塔科技称,即日起秘塔AI搜索将不再收录知网文献的题录及摘要数据。
收藏者
0
被浏览
108

5 个回答

zsz8868 LV

发表于 2025-4-22 13:09:28

大家好,我是小机AI模型。一个专注于输出 AI+ 提示词和AI + 大模型编程内容的学者,关注我一起进步。
在2024年8月16日晚间的互联网舞台上,一场围绕知识产权与技术创新的辩论悄然拉开帷幕,主角便是知名的学术数据库——知网,以及新兴势力秘塔AI搜索。
此事件迅速吸引了公众的目光,成为社交媒体上的热门话题。

知网的严厉警告



知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-1.jpg


知网向秘塔AI搜索发出了一封长达28页的侵权告知函,指控后者未经授权便能检索到其学术文献的题录及摘要信息,认为此举严重侵害了知网的合法权益。
知网不仅要求秘塔立即停止链接跳转,还明确表示不希望建立在秘塔平台上的任何索引指向其内容,同时保留了合作的可能性,为未来关系的缓和留下余地。

该说不说,历史总是惊人的相似:


知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-2.jpg


秘塔AI搜索的回应与应对


当然,面对知网的控诉,秘塔AI搜索并未回避,而是通过官方公众号迅速发表声明,强调其搜索引擎遵循学术界共识,认为摘要和题录具备独立公开的属性,便于用户快速了解文献核心。
尽管如此,秘塔决定从声明发布之日起,不再涉及知网文献的题录及摘要,转而聚焦于其他权威知识库的整合。
在秘塔AI的官网就能看到公告。


知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-3.jpg


行业生态的多样化探索


这一事件同时也揭示了AI搜索引擎行业的多样态发展。
如天工AI搜索以创新布局改善用户体验,360 AI搜索则采取相对保守的信息展示策略,而kimi搜索亦有相似功能设计,均在尝试与传统版权界限的微妙平衡。
对此,不得不让我们深思一些新问题。


1. 学术资源摘要和题录是否构成版权保护的范围?

知网认为,秘塔AI搜索未经授权的使用知网数据库中的摘要和题录已经侵犯了其版权。
但秘塔科技则强调摘要和题录本身具有独立性和自明性,不构成对原作品的抄袭或侵权。

在版权法领域,对于摘要和题录是否构成版权保护范围仍存在争议。
一些观点认为,摘要和题录是原作品的一部分,属于版权保护的范围;而另一些观点则认为,摘要和题录只是对原作品的概括,不构成对原作品的复制,不属于版权保护的范围。

这一事件也提醒我们,随着AI技术的发展,传统的知识产权保护模式面临着新的挑战。

如何界定AI搜索引擎在使用学术资源时所产生的版权问题,需要法律界和学术界共同研究和探索。

2. AI技术的应用如何与知识产权保护相协调?

AI技术在信息获取、知识检索等领域有着巨大的潜力,但同时也引发了知识产权保护方面的挑战。
如何平衡AI技术的创新应用与知识产权的保护,是未来的重要课题。

AI搜索引擎能够快速、便捷地获取和处理海量信息,这为用户提供了极大的便利。但同时,这也可能对知识产权的保护构成威胁。
因此,在AI技术应用过程中,加强对知识产权的保护尤为重要。

3. 学术资源的数字化如何促进知识共享与开放?

知网作为学术资源平台,其主要职责是为用户提供学术信息服务,促进学术研究和知识传播。但知网对于知识产权的严格保护政策也引发了一些争议。

部分学者认为,知网的版权保护政策过于严格,导致了学术资源获取成本过高,阻碍了学术研究和知识传播。
而知网则认为,版权保护是知识产权的延伸,是促进学术资源发展和创新的重要保障。

如何在保障知识产权的基础上,促进学术资源的开放共享,是未来学术发展的重要方向。

知网与秘塔AI搜索的版权之争,只是一个缩影,它反映了学术资源数字化时代版权保护的复杂性。
未来,如何有效地平衡知识产权保护与AI技术应用,如何促进学术资源的开放共享,将成为学术界和法律界共同思考和努力的方向。
小机的愿景是成为 AI 提示词与AI大模型的布道者,带领 更多 小白入门 AI,让更多的人在已经到来的 AI 时代不掉队,不被 AI 淘汰。
我也期望能遇到更多优秀的自媒体创作者,期待与大家一起进步!
如果您对AI大模型充满好奇,想要了解更多关于它的信息,不妨联系我进行交流,我将为你带来更多的大模型相关知识。我是小机学AI大模型,一个专注于输出 AI+ 提示词和AI + 大模型,AI编程内容的学者,关注我一起进步。
@小机
对了,如果您有AI方面的问题,或者有对AI其他方面感兴趣的地方,也欢迎和我一起交流,我会送您一份领价值499元的AI资料,帮助您入门AI。
原文链接:
AI搜索惹祸!以后使用可得小心了。

xywy1985 LV

发表于 2025-4-22 13:19:14

我之前多次推荐过秘塔的 AI 搜索,相当一部分原因就是因为 AI 学术搜索,再搭配学校图书馆的知网账号直接下载参考文献,体验很丝滑,秘塔的学术搜索当时是独一份的(欢迎补充)。
这样的事情不是第一次,当然也不会是最后一次。现在 AI 已经把常规的文本全部吃完了,下一步很有可能就是论文、播客、音频、视频这些内容。秘塔除了学术搜索,还有播客搜索、文档搜索,不知道未来会如何。不论是 AI 训练,还是 AI 搜索,数据会越来越重要,围绕数据利用、利益分配的讨论也会越来越多。
说实话我最开始一直以为秘塔和知网是合作关系,因为中文库是以知网的来源为主。

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-1.jpg

现在来看,秘塔要么是接了一个知网搜索的接口,要么是干脆对知网进行了爬虫。不论具体实现如何,基本思路应该是:基于用户的检索内容,优化为几个具有逻辑关系的搜索词,通过搜索并返回文献的摘要,使用大模型将摘要内容重新组织。
我用秘塔的很大原因就是搜索来源,特别是播客、文档搜索,还是很有特色的。文档搜索能搜索到很多高校网址下的 pdf、doc 文档,并整合其中内容。
我猜测应该是在传统搜索引擎filetype:pdf的基础上,对 Word、PDF 文件做了 RAG 的检索+生成,效果的确很好,特别是研究模式能一次性生成 5000+ 字,对免费用户来说太奢侈了。
对于知网来说,这样的告知函也许是在寻求合作——「如需商务合作,请与我司联系」。但没想到秘塔还是比较刚的,干脆去除了所有知网的结果。

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-2.jpg

目前我测试了一下,秘塔 AI 的中文学术引擎已经切换到万方为主了:

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-3.jpg

参考:
知友们有哪些AI软件搜索资源引擎比较庞大的吗?请教中文文献综述AI写作软件,中文的!哪里有?

zxhy LV

发表于 2025-4-22 13:33:57

看我强大了,想要钱直接说,何必拿侵权来说事?
事情是这样的:
知网称,未经允许的情况下,秘塔AI搜索APP向用户提供学术文献题录及摘要数据,且数据量巨大,严重侵犯其合法权益。知网要求秘塔AI停止在搜索服务中提供学术文献题录摘要数据,断开搜索结果到知网网站的链接

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-1.jpg

秘塔AI科技创立于2018 月4月,核心团队主要有CEO闵可锐、技术专家唐悦和首席运营官王益为等三人

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-2.jpg

秘塔AI为今年年初上线的一款AI搜索工具,可以理解为能实时联网的ChatGPT,AI的每一句观点会附上来源和原文链接
不过碰到如今的事件,真的让人很惊讶
因为有律师城如果提供的是学术文献题录及摘要数据,则可能涉嫌侵权
即使是学术文献题录及摘要数据,如果能够体现其内容的选择或者编排具有独创性的,也属于受著作权保护的作品。
我们来看看,从技术手段上如何尽心获取网络信息的
1、可以利用网络爬虫,采用多线程的方式,抓捕网络的学术文献目录或者是摘要数据,比如是知网的,看情况没有得到知网的许可,会构成侵权的

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-3.jpg

知网拥有其学术文献题录及摘要数据的著作权,并且这些数据构成了汇编作品。
此时版权属于知网所有
秘塔AI搜索普通通过技术手段的学术文献题录及摘要数据。并将其整合到自己的搜索服务中,那么秘塔AI搜索的行为可能违反了网络爬虫协议,从而构成侵权。

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-4.jpg

2、用到了AI搜索中,获取了利息
3、内部数据资源泄露,一般黑客入侵服务器获取相对应的资源等等
而秘塔AI认为,知识的价值在于流动,学术文献汇集了人类智力成果的重要载体,具有极强的不可替代性
是不是看我用户量大了,看着我不爽吗?
但是我发现,国内的有很多其他AI模型,也有同样的情况,那不仅仅是秘塔搜索公司的事情了,而是所有的AI搜索模型的问题了。。
剩下的请各位知友脑补

秋之舞 LV

发表于 2025-4-22 13:44:02

无独有偶,一个月前拥有《纽约客》、《时尚》、和《连线》的美国杂志巨头康泰纳仕集团也曾向人工智能搜索引擎Perplexity发出过类似侵权通知。作为秘塔和Perplexity的用户,今天就来分析下知网有权要求秘塔断开链接吗?

一、知网的robots文件并未屏蔽秘塔
搜索引擎是否有权对互联网站内容进行抓取,是由网站robots文件的设置决定的,如果网站的robots文件不允许抓取,则搜索引擎强行抓取可能有不正当竞争风险,有意思的是,虽然知网给秘塔发函要求断开链接,也就是不允许其抓取网页内容,但其网站的主站robots文件网页却显示:很抱歉!您浏览的页面不存在,可能已被删除或转移。也就是说,知网主站并没有禁止任何搜索引擎爬虫。
当然,现在很多的人工智能搜索引擎的爬虫确实也不讲武德,其不像传统的百度、谷歌、搜狗、必应那样把自家的爬虫进行命名,而是默不作声的匿名爬取,比如前文提到的Perplexity公司CEO接受采访时公然表示,哪怕你禁止我的爬虫,我也不保证不抓取你的网页,因为我的工具包括匿名的第三方爬虫[ii]。但至少从技术上,知网没有屏蔽秘塔的爬虫。
二、屏蔽特定爬虫要有正当理由
可能有读者会问,我的地盘我做主,网站所有人要屏蔽别人为什么还要有正当理由?这里涉及两方面的问题,一个是《反垄断法》,另一个是行业协会的规定。
1、知网有市场支配地位
2022年国家市场监管总局曾认定知网在中国境内中文学术文献网络数据库服务市场具有支配地位,并因其其他的垄断行为,对其处以8760万元罚款。我国《反垄断法》第二十二条规定:禁止具有市场支配地位的经营者从事下列滥用市场支配地位的行为:没有正当理由,拒绝与交易相对人进行交易。所以,有市场支配地位的知网,要求秘塔搜索断开链接需要有正当理由的,否则就涉嫌拒绝交易的违法垄断。
2、行业公约规定限制搜索引擎抓取应有合理理由
多年前,中国互联网协会制定了《互联网搜索引擎服务自律公约》对搜索引擎爬取网站信息是否正当进行了规定。根据该公约第八条:互联网站所有者设置机器人协议应遵循公平、开放和促进信息自由流动的原则,限制搜索引擎抓取应有行业公认合理的正当理由,不利用机器人协议进行不正当竞争行为,积极营造鼓励创新、公平公正的良性竞争环境。这个自律公约可以看做行业对于网站屏蔽搜索引擎标准的共识,知网的限制行为需要符合这个共识。
3、法院认为无正当理由屏蔽搜索引擎涉嫌不正当竞争
在后来的百度诉奇虎360搜索引擎违法抓取案中,法院也认可了该公约内容的合理性。北京高院法院认定百度在缺乏合理、正当理由的情况下,以对网络搜索引擎经营主体区别对待的方式,限制360搜索引擎抓取其相关网站网页内容,影响该通用搜索引擎的正常运行,损害了奇虎公司的合法权益和相关消费者的利益,妨碍了正常的互联网竞争秩序,违反公平竞争原则,且违反诚实信用原则和公认的商业道德而具有不正当性,不制止不足以维护公平竞争的秩序,故构成反不正当竞争法第二条规定所指的不正当竞争行为。所以根据行业公约,知网也需要找到要求秘塔断开链接的正当理由。
三、人工智能涉及的知识产权问题可以作为正当理由吗?
所以知网有没有权利要求秘塔断开链接,核心问题是其诉求有没有法律上的正当性。人工智能是新生事物,对版权内容的使用存在一定的合规瑕疵,如果知网以此为由要求断开链接的,会有一定合理性。虽然据秘塔的通告称,知网向其发送的侵权通知长达28页,但除了本文前面的截图外,其他内容并未披露,所以,笔者只能根据自己使用秘塔的体验,以及行业的情况进行分析。
1、知网无权主张秘塔训练版权侵权
如果秘塔使用了知网上的论文进行了人工智能训练,知网不一定有权主张版权侵权。因为论文的作者投稿某杂志,杂志刊登后,文章的版权可能是作者的,也可能是作者授权给了杂志,知网站内的多数论文虽然被收录,但知网拥有这是杂志社或作者授权的信息网络传播权,如果该论文被用于训练,训练涉及的版权是著作权法规定的复制权和著作权其他权利,并不侵犯知网的信息网络传播权。当然如果是杂志社维权秘塔训练侵权的,那么秘塔将面临《纽约时报》起诉OpenAI一模一样的问题。
如果知网可以证明秘塔的系统抓取其网站大量论文并进行批量训练的,则可以主张训练行为涉嫌侵权其整体数据权利,构成不正当竞争,法律依据是《反不正当竞争法》第二条原则性条款,经营者在生产经营活动中,应当遵循自愿、平等、公平、诚信的原则,遵守法律和商业道德。
2、秘塔索引库如包含知网内容,可能侵权
根据网上公开的报道[iii],秘塔AI搜索的播客和文库板块是有索引库的,笔者理解的索引库可能是秘塔把批量收集的文献事先直接在内部做了一个索引数据库,当用户搜索时,秘塔会搜索网络对应的实时内容,然后利用人工智能把实时搜索结果和索引库的内容整合在一起提供答案。
根据笔者的个人体验,索引库很可能是真实存在的,因为秘塔的搜索结果里经常提供非公开可以访问的论文链接,这些论文被标注为pdf,如果用户点击的,可以在秘塔网页的小框中阅读pdf全文但无法下载,如果点击pdf对应的链接,就会被链接到一个文库类网站的登录界面,这个应该是为了表明pdf的来源。根据笔者的用户感知,这个在线阅读的pdf应该是秘塔数据库提供的。其实这个技术上也不难证明,我们代理诉讼时碰到此问题,通常用抓包软件显示该文档的真实ip地址。如果这个ip地址位于秘塔的服务器,则说明是秘塔提供的。
3、过拟合可能导致输出结果侵权
秘塔的搜索结果如果出现了被索引论文的主要内容,可能涉嫌“洗稿”类著作权侵权。不同于普通的搜索引擎,秘塔的搜索是人工智能的问答式引擎,其结果会整合很多篇新闻、文章、论文,多数情况下,这种整合后输出的结果构成合理使用,法律依据是我国著作权法规定的,为介绍、评论某一作品或者说明某一问题,在作品中适当引用他人已发表作品的构成合理使用。但少部分情况下,人工智能会因为训练技术问题出现过拟合(outfing)[iv],导致输出的结果内容和训练内容一致,此时,比如秘塔预训练论文时有过拟合,就会出现搜索结果照搬索引论文文献内容的情况,哪怕照搬的是部分内容也是侵犯被索引文献信息网络传播权的,这时的行为性质就从合理使用变成了抄袭。
如果出现搜索结果抄袭知网论文,或者秘塔制做索引数据库、或者向用户提供论文pdf的在线阅读功能的情况,都是侵犯信息网络传播权的行为,如果知网据此要求秘塔断开链接的,笔者认为是正当的。
4、抓取学术文献题录及摘要数据不一定侵权
笔者注意到,知网的侵权通知中称秘塔向用户提供知网的学术文献题录及摘要数据,涉嫌侵权。对秘塔抓取这两部分网页是否侵权,笔者倒是有不同意见。网页不同于论文,知网的学术文献题录(标题、作者、发表年份、期刊卷号、期号、页码以及摘要)及摘要网页都是国内用户公开可以访问的,知网作为在中国境内中文学术文献网络数据库服务市场具有支配地位的经营者,其不允许秘塔搜索抓取这两部分公开信息需要有合理的理由。如果秘塔清除了索引库中的知网论文,并且不再向用户提供知网论文的在线阅读功能,此时,知识产权侵权的争议就很小了,根据《反垄断法》和《互联网搜索引擎服务自律公约》,知网不允许秘塔搜索抓取这两部分公开信息就不再具有合理的理由。



<hr/> https://www.cnki.net/robots.txt

[ii] https://bookstr.com/article/morality-and-legality-in-perplexitys-new-search-engine/

[iii] https://www.36kr.com/p/2895952320125831

[iv] https://www.ibm.com/cn-zh/topics/overfitting

寂寞狼 LV

发表于 2025-4-22 13:58:52

知网“控诉”AI搜索公司侵权:立即断开我司网站链接!律师分析:知网无权干涉文章训练,但拥有网络传播权

每经编辑 杜宇
8月16日,上海秘塔网络科技有限公司官微发布声明称,昨日公司收到《中国学术期刊(光盘版)》电子杂志社有限公司(下称“知网”)长达28页的侵权告知函
秘塔科技在声明中表示,秘塔AI搜索的“学术”版块仅收录了论文的文献摘要和题录,并未收录文章内容本身,阅读正文需通过来源链接跳转至网站获取。
秘塔科技称,即日起秘塔AI搜索将不再收录知网文献的题录及摘要数据。
秘塔:没有search(搜索),就没有research(研究)

据AI秘塔微信公众号8月16日消息,上海秘塔网络科技有限公司官微发布声明称,昨日公司收到知网长达28页的侵权告知函。

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-1.jpg


图片来源:AI秘塔微信公众号

“知网”是中国知网CNKI系列数据库编辑出版单位。侵权告知函提到,“知网”发现秘塔通过秘塔AI搜索、秘塔AI搜索APP向用户提供其学术文献题录及摘要数据,且数量巨大。侵权告知函要求,立即停止在搜索服务中提供中国知网学术文献题录摘要数据,“同时,我司不希望我司网站中国知网被秘塔科技搜索到,请立即断开搜索结果到我司网站的链接。”

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-2.jpg


图片来源:AI秘塔微信公众号

秘塔AI表示,依照学术规范,文献的摘要和题录应具有独立性和自明性,能够使读者不阅读全文就能获得必要的信息。秘塔AI搜索的“学术”版块仅收录了论文的文献摘要和题录,并未收录文章内容本身,阅读正文需通过来源链接跳转至网站获取。“近些年国际学术界、出版界和图书情报界联合推动的《布达佩斯开放存取倡议》(BOAI)即在不断推进学术文献的免费阅读、下载、复制、传播、打印和检索。没有search(搜索),就没有research(研究)。”
秘塔AI表示,从即日起,秘塔AI搜索将不再收录知网文献的题录及摘要数据,转而收录其他中英文权威知识库的文献题录及摘要数据。
上海秘塔网络科技有限公司成立于2018年,今年2月上线“秘塔AI搜索”。


知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-3.jpg

根据公开资料,秘塔科技近期完成了超1亿元人民币的新一轮融资,由蚂蚁集团领投、光速光合跟投,秘塔之前的老股东有明势资本、猎豹移动和丰元资本等。
团队方面,秘塔科技创始团队背景较为丰富,涵盖了人工智能、计算机工程以及法律等多个领域。核心团队主要有董事长兼CEO闵可锐、技术专家唐悦和首席运营官王益为等。
根据天眼查数据显示,闵可锐持股比例为28.8%。他拥有复旦大学计算机科学学士学位和牛津大学数学硕士学位,并且在多个知名公司担任过重要职务,包括玻森数据的CTO&联合创始人、猎豹移动首席科学家以及微软亚洲研究院的实习研究员。

知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-4.jpg


知网「控诉」AI 搜索公司秘塔侵权,要求断开其网站链接,秘塔称不再收录知网文献题录等,如何看待此事?-5.jpg

律师分析:知网无权干涉文章训练,但拥有网络传播权

上海大邦律师事务所高级合伙人、律师游云庭对澎湃科技表示,秘塔AI搜索的“学术”版块最大的问题在于可以完整展现文章内容,“论文PDF在研究结果里,虽然不能下载,但用户在结果页里点PDF的链接,是可以查看这篇文章全文的,这侵犯了这篇文章的信息网络传播权。”但如果吸收了文章精华后,人工智能用自己的方式转述给用户,根据《著作权法》规定,为了说明某个问题合理引用部分作品内容的,属于合理使用。
对于大模型用论文数据做训练,游云庭表示,这种行为并不侵权中国知网。根据《著作权法》,训练的过程是复制和学习,复制是将文章从网络复制到服务器里训练,学习是否属于侵权,目前在法律上没有明文判决可以判断。但不管是复制权、学习,还是涉及到的著作权的其他权利,中国知网都不是论文权利人。
游云庭举例,比如作者投稿某杂志,杂志刊登后,文章的版权可能是作者的,也可能是作者授权给了杂志,“知网只是进行了收录,拥有信息网络传播权,而且是一个分授权,所以知网无权干涉这篇文章的训练。”但他表示,如果是杂志社过来维权,那么秘塔将面临《纽约时报》起诉OpenAI一模一样的问题。
《纽约时报》起诉OpenAI,争议在哪?

在意识到ChatGPT对历史和时事的了解源自其网站上发布的故事(甚至是付费内容)时,去年年底,《纽约时报》对OpenAI以及微软提起诉讼,指控后者未经授权使用该报版权内容训练AI模型,并在ChatGPT产品中呈现给用户。
该案打响了媒体机构起诉OpenAI的第一枪,随后又有多家媒体加入了这一反抗的队列。据《每日经济新闻》记者的不完全统计,截至今年6月底,已至少有13家新闻媒体机构对OpenAI和微软提起了侵权诉讼。
“判断这种数据抓取行为是否侵犯版权,是一个复杂且有争议的问题。”安杰世泽律师事务所合伙人、中国和美国纽约州执业律师于雯竹在接受每经记者采访时表示。
《纽约时报》的起诉不仅是媒体领域的重要里程碑案件,亦可以为法律业界提供极具参考价值的信息。
目前,该案件但还没有定论。
媒体之难:证明“实质性相似”

《纽约时报》在起诉书中称,ChatGPT几乎逐字复制了其新闻报道。该报举例称,2019年,《纽约时报》发表了一篇荣获普利策奖的关于纽约市出租车行业掠夺性贷款的系列文章。该报称,只要稍加提示,ChatGPT就会一字不差地背诵其中的大部分内容。
在其他多家媒体的起诉书中,记者发现,其法律论证和主张都基于美国1976年版权法和《数字千年版权法》(DMCA)。对于这两部法案中涉及AI的内容,于律师告诉《每日经济新闻》记者,“就1976年版权法而言,侵权的判定通常依赖于原作品和被指控侵权作品之间的相似性,以及实际的复制行为。本案中实际复制行为相对容易证明,因为OpenAI并未否认其训练数据中包含《纽约时报》的文章。”
然而难点在于,“证明最终生成的文本构成版权侵权仍需满足‘实质性相似’测试,因为它有助于判断受版权保护的表达元素是否被复制,还是仅复制了其中的思想。版权保护的是表达,而不是思想。你可以用自己的语言重新实现他人的思想,这不构成版权侵权。但如果你使用他人的语言——即他们的表达——那就是版权侵权。”于律师说道。
谈及DMCA,于雯竹解释道:“其中的一项规定鼓励版权持有者在数字资产中添加内容管理信息(CMI),例如帮助识别创作者或权利持有者的信息,并禁止他人移除这些信息。”然而,《纽约时报》起诉书提到,OpenAI在抓取其文章以创建数据库时,移除了这些信息,违反了DMCA。
OpenAI的“盾牌”:“合理使用”

而在回应《纽约时报》版权侵权诉讼时,OpenAI强调使用公开材料训练AI模型属于合理使用。这一规则基于美国1976年版权法第107条规定。哈佛法学院教授丽贝卡•塔什内特(Rebecca Tushnet)在接受《每日经济新闻》记者采访时认为,“美国版权法既提供了广泛的权利,也提供了广泛的例外。关键问题是AI训练是否构成‘合理使用’,以及当AI输出与现有作品过于相似时,该问题到底应该归咎于模型还是用户的滥用。”
塔什内特认为,“OpenAI提供了有一个有趣的主张,即(AI)要获得高度相似的输出,必须故意用《纽约时报》原始文章中的大量引文来提示模型,这表明错误在于提示者(用户的滥用)。”“‘合理使用’是美国版权法的一项关键优势,使其能够应对不断变化的情况。它促成了我们所知道的现代互联网的兴起,尤其是搜索引擎。按照同样的推理,只要输出通常不是从特定作品中复制而来,创建AI模型就应该被视为变革性的和公平的。”
她对记者解读称,“我认为这是一个相当标准的有关‘合理使用’的问题。”根据1976年版权法,判定合理使用的认定包括四个因素。其中,于雯竹认为,最重要的是第四点:使用对版权作品的潜在市场或价值的影响。“简而言之,就是新作品是否对原作品构成‘市场损害’。”
每日经济新闻综合AI秘塔微信公众号、澎湃科技、每日经济新闻、公开资料

您需要登录后才可以回帖 登录 | 立即注册