双面ChatGPT:数据隐私与版权争议

AI与法律9mos agoupdate lida
68 0 0

文章主题:关键词:明敏,发自,凹非寺;量子位,公众号,QbitAI,两起 lawsuit,ChatGPT,OpenAI,数据隐私,版权问题

666ChatGPT办公新姿势,助力做AI时代先行者!

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

一天吃两起官司,ChatGPT现在有大麻烦了。

原因都和数据有关。

先是16人匿名起诉OpenAI及微软,认为他们在未经允许的情况下使用并泄露了个人隐私数据,索赔金额高达30亿美元

紧接着,2位全职作者提出,OpenAI未经允许使用了他们的小说训练ChatGPT,构成侵权

事实上,双方原告都指出,OpenAI所搜集的互联网数据量庞大,除他们之外,还有许多人的数据正遭受违规利用。

网上的讨论很多,有人表示作家就是应该维权,并且获得适当的报酬。

双面ChatGPT:数据隐私与版权争议

但也有人认为,生成式AI学习互联网数据就像是学生去参观艺术作品一样,应该选择开放。

双面ChatGPT:数据隐私与版权争议

现在这两起诉讼都被递交到了加利福尼亚旧金山联邦法院。

被告方OpenAI暂时没有做出公开回应。

16人索赔30亿

先来看第一起诉讼。

在6月28日,16名神秘的匿名者针对OpenAI和微软公司提起了一场法律诉讼。他们主张,没有经过通知或征得个人同意,基于ChatGPT的AI产品擅自搜集并曝光了他们的个人信息。

双面ChatGPT:数据隐私与版权争议

这种行为违反了AI模型数据相关的法律政策,而且没有付费。

他们从互联网、书籍、文章、网站和帖子中抓取了3000亿个单词,其中包括未经允许获取的个人信息。

这其中包含账户信息、姓名、联系方式、电子邮件、支付信息、交易记录、浏览器数据、社交媒体信息、聊天数据、cookie等等。

个人信息被嵌入到他们的AI产品中,这些信息可以揭示个人喜好、态度、职业经历以及家庭照片等方面。

原告认为OpenAI没能充分将这些敏感信息进行过滤,会导致数百万人面临信息被泄露的风险

而且他们指控如上抓取数据的行为,OpenAI是“秘密进行”的,没有按照适用法律要求的那样注册为数据代理商。

负责这次起诉的律师事务所Clarkson,此前曾负责过数据泄露和虚假广告等问题的大规模集体诉讼。

但能否胜诉目前还很不确定。

著名知识产权律师凯瑟琳·加德纳(Katherine Gardner)指出,当用户在社交平台或其他网站中将内容上传时,他们会赋予平台极大的权限,允许平台自由使用这些内容。

因此,普通用户想要就AI模型的数据获取问题获得赔偿,具有比较高的挑战性

在那份长达157页的诉讼文件中,人们注意到,其中大量引用了关于人工智能伦理和道德方面的专家观点和学术警告。然而,对于实际产生影响的案例却并未给出充分的展示。

双面ChatGPT:数据隐私与版权争议

另一边,两位美国作家也在同一天起诉OpenAI,认为他们的作品被拿去训练ChatGPT。

具体的证据是,ChatGPT能为他们的书生成“非常准确”的摘要,这足以说明这些书被收录在数据库中。

Paul Tremblay和Mona Awad指出,ChatGPT未获得授权就从众多书籍中窃取数据,这无疑侵犯了作家们的著作权。

起诉书中预估,OpenAI的训练数据中至少包含30万本书,其中很多来自侵权网站

比如OpenAI在披露GPT-3训练数据情况时,就表示其中包含两个互联网图书语料库,大概占比为15%。起诉作者认为这些数据就是来自影子图书馆网站的,比如Library Genesis、Sci-Hub等。

以及在2018年,OpenAI透露他们给GPT-1喂的数据中包含7000+本小说。起诉方认为这些书是研究人员从一些盗版网站上复制下来的,而没有获得作者的同意或授权。

双面ChatGPT:数据隐私与版权争议

目前OpenAI方面没有进行公开回应。

实际上,从生成式AI大火以来,AI公司吃版权、数据隐私官司,也真的不稀奇了。

OpenAI一直深陷数据风波

早在去年11月时,OpenAI和GitHub一起推出的代码助手Copilot,就被程序员们告上了法庭。

原告们认为Copilot侵犯了众多原创代码作者的版权,同时还泄露了用户隐私,因此向法院提起诉讼,索赔达90亿美元

但到目前为止,这个案件还没有最终定论。

双面ChatGPT:数据隐私与版权争议

AI画画那边,Stability AI、Midjourney等也同样官司缠身。

因为发现只要输入自己的名字,就能生成个人风格的画作,画家凯利·麦柯南(Kelly McKernan)联合另外两位创作者一起提起诉讼。

律师团队和上面起诉Copilot的都是同一家。

以及网站平台方也不愿意被白嫖数据。

这不最近马斯克给推特限流,给出的理由就是“不想让AI白嫖数据了”。目前限制措施还在实行中,还不知道之后会有怎么样的变化。

双面ChatGPT:数据隐私与版权争议

Reddit则表示自家平台上的数据非常有价值,所以推出了付费API,价格并不低,这个操作导致不少第三方应用被迫关闭。

总之,AI在网络上大规模抓取数据训练后,带来的隐私安全问题、版权问题层出不穷,被牵扯进来的人也越来越多。

但目前版权问题该怎么算,业内还没有形成确定的规范。

只有日本方面传出过消息,不会对训练AI所使用的数据实施版权保护,因为这能加速AI发展。

参考链接:

[1]https://www.theregister.com/2023/06/28/microsoft_openai_sued_privacy/
[2]https://www.reuters.com/legal/lawsuit-says-openai-violated-us-authors-copyrights-train-ai-chatbot-2023-06-29/[3]https://www.washingtonpost.com/technology/2023/06/28/openai-chatgpt-lawsuit-class-action/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

双面ChatGPT:数据隐私与版权争议

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

© Copyright notes

Related posts

No comments

No comments...