张家界武陵源怎么去凤凰古城? 从张家界可以坐旅游大巴车去凤凰古城。由张家界市中心汽车站直接乘旅游大巴车赴凤凰古城每天6班,发车时间为8:30、9:30...
2025-08-21 1.1K+
该案的分析思路对平衡用户个人数据保护和人工智能发展,特别是大模型训练场景下合理使用已公开个人数据的认定具有重要的借鉴意义。
作者 | 王洁 中国互联网协会知识产权工作委员会副秘书长;谢南希 中国政法大学竞争法研究中心研究员
引言
2025年5月23日,德国科隆地方高等法院(下称“法院”)认定,Meta公司将用户的公开帖子等数据用于训练生成式AI模型的行为具有正当利益(legitimate interest),具备《通用数据保护条例》(下称“GDPR”)第6(1)(f)条项下的合法性基础,而且,GDPR第9(1)条关于敏感个人数据的规定不禁止Meta在生成式AI模型训练场景下处理个人数据的行为。1据此,法院驳回了德国消费者权益保护组织提起的临时禁令程序。这一案例表明,在欧盟,AI公司使用已公开的个人数据进行本地化AI产品的开发并对训练数据采取的去标识化、透明度、用户选择退出等措施,已满足欧盟GDPR的合规要求,可以援正当利益作为合法性基础。
目前,海量、高质量数据集对人工智能大模型的重要性已经不言而喻。用于模型训练的数据中主要包含了两类在先权利客体,一类是著作权内容数据,一类是个人信息类数据。围绕模型训练使用著作权内容是否构成合理使用已经有不少学界研究,美国近期也有两例司法案件的初步结论。2但个人信息类数据、特别是已公开个人信息类数据用于模型训练的合法性基础问题仍存较大争议。尽管中国《民法典》第1036条和《个人信息保护法》第27条规定了已公开个人信息的合理使用制度,但模型训练场景下如何理解与适用,特别是如何判断“合理范围内”以及“对个人权益有重大影响”仍不确定。
本案表明,即便是被称为史上最严个人数据保护法的欧盟《通用数据保护条例》,模型训练场景下使用已公开用户个人数据也仅需采取“opt-out”模式,而无需采取事先、逐一获得用户同意的“opt-in”模式。该案的分析思路对平衡用户个人数据保护和人工智能发展,特别是大模型训练场景下合理使用已公开个人数据的认定具有重要的借鉴意义。
一、案件情况
2024年3月,Meta公司告知爱尔兰数据保护机构其希望用欧盟成年用户的数据来训练AI模型,并于2024年6月通知用户将于2024年6月开始训练。由于爱尔兰数据保护机构和德国消费者权益保护组织提出担忧,Meta公司宣布将推迟训练计划。
2024年9月,爱尔兰数据保护机构请求欧盟数据保护委员会就AI模型与GDPR第64条项下的个人数据处理行为发布意见。2024年12月,欧盟数据保护委员会发布《关于人工智能模型中个人数据处理相关数据保护问题的第28/2024号意见》。3爱尔兰数据保护机构收集成员国监管部门反馈后,向Meta公司提出建议。
作为回应,Meta采取了一系列完善措施,包括:(1)更新透明度通知、为用户更改隐私设置提供更长期限、对训练数据去标识化、对数据集和生成内容进行过滤、更新正当利益评估和数据保护影响评估等;(2)采取预防措施,删除未成年人相关敏感数据。4爱尔兰数据保护机构不再禁止相应的数据处理行为,但要求Meta公司于2025年10月汇报已有措施的有效性和适当性。5
2025年4月,Meta公司宣布,自5月27日起,将使用Facebook和Instagram成年用户发布的公开帖子和评论,以及成年用户与Meta AI的互动信息(以下简称“公开个人数据”)来训练AI模型。6具体而言,这些公开个人数据包括:(1)Facebook页面和渠道上的简介图片、公共群组活动;(2)Facebook交易平台上的公开评论、评分等内容;(3)Instagram公开账户上发布的头像、照片、视频和音频;(4)相关元数据。德国消费者权益保护组织随即向Meta公司发送警告函。
2025年5月,德国消费者权益保护组织向德国科隆地方高等法院申请临时禁令,禁止Meta公司基于“正当利益”处理直接从用户处收集的一手数据(first-party data),以达到研发改善AI系统的目的。德国消费者权益保护组织认为,Meta公司未能证明利用用户数据来训练AI模型符合GDPR第6(1)(f)规定的必要性和适当性,Meta公司采取的缓解措施不具有充分的有效性,数据处理行为还违反了GDPR第9(1)条、第5(2)条。
2025年5月23日,德国科隆地方高等法院认定,Meta公司将用户的公开帖子等数据用于训练生成式AI模型的行为具有正当利益,具备GDPR第6(1)(f)条项下的合法性基础,而且,GDPR第9(1)条关于敏感个人数据的规定不禁止Meta在生成式AI模型训练场景下处理个人数据的行为。法院最后驳回了德国消费者权益保护组织提起的临时禁令程序。
二、法院观点
第一,法院认可了Meta公司采取的数据合规措施。
在本案中,法院认定,Meta公司采取的以下措施足以缓解风险:(1)根据GDPR必要性原则,采取了去标识化措施(删除全名、电子邮件地址、电话号码、身份证号、UID、银行卡号码等),将数据整理为非结构化、字符串的形式,即使技术上没法实现完全的去标识化/匿名化。(2)采取了技术、物理和架构上的措施,来防止未经授权访问训练数据,检测AI运营中的安全活动。(3)为用户提供退出训练的工具和方案,允许用户将个人数据的公开状态更改为非公共状态、提出异议。
第二,法院认可Meta公司利用Meta公司旗下Facebook和Instagram平台上德国成年用户公开个人数据来训练AI模型、开发本地化AI产品的利益。
法院认定Meta公司通过了“正当利益”三步测试,明确Meta公司在开发AI产品方面具备正当利益,Meta公司为了提供本地化的AI产品,将用户数据用来训练AI的行为是适当且必要的,而且,用户和第三方对其数据的利益没有超过Meta处理数据的利益。理由如下:
在用户合理期待方面,对于2024年6月26日Meta公司宣布将使用用户数据来训练AI前用户发布的数据,法院无法认定用户的合理期待。但对于2024年6月26日Meta公司宣布将使用用户数据来训练AI之后用户发布的数据,法院认为Meta公司已经清楚表达了其意图。Meta公司使用公开个人数据区别于外部第三方抓取用户数据,用户合理期待不同。
第三,关于敏感个人数据,法院区分“数据主体明显公开的个人数据”和“用户数据中涉及的第三方数据”。法院还明确,在具备合法性基础的前提下,Meta使用这些数据不需要获取同意,用户可以事后提出异议,选择退出训练。
对于数据主体明显公开的个人数据,法院指出,当用户以“公开”的形式将数据上传到用户账户时,一般来说,用户意识到这些数据可能被任何人查看,甚至可能通过搜索引擎检索到,用户将此类信息“公开”上传到用户账户的行为明显表明用户有意将这些数据向公众开放。
对于用户数据中涉及的第三方数据,法院结合欧盟立法者在《人工智能法案》序言中提出的“在全球范围内领导安全、可信、道德可接受的AI开发”“构建一个统一的AI法律框架”的目标,指出如果GDPR禁止生成式AI模型训练大规模数据,并对GDPR第9条禁止处理敏感个人数据的规定进行文义解释,那么欧盟很难在AI领域取得领先地位。GDPR的目标不只是为了保护个人数据,还包括促进数据自由流通,确保数据的可用性。
法院最后指出,Meta公司已经具备了合法性基础,不存在应禁止的数据处理行为。不论是用户上传的本人个人数据,还是其中涉及的第三方数据,都不需要获取同意,用户享有类似于德国立法者在德国《版权法》第44b条项下的异议权(类似“选择-退出”)。
三、解读与评议
本案认可大模型训练使用已公开个人信息可援引“正当利益”作为合法性基础的司法案件。法院的分析遵循了“正当利益”测试法,即天平的一端是Meta开发适应当地风俗AI产品的正当利益,及其所采取的透明度、对训练数据去标识化等措施,天平的另一端则是训练行为对用户的干扰强度、用户合理期待等因素的权衡分析。
值得关注的是:第一,人工智能模型训练所需要的海量数据(数据越多越好)似乎与个人数据保护法所要求的必要性和最小化原则天然存在冲突。对此,本案中,法院一方面援引《人工智能法案》序言里明确认可生成式人工智能模型的训练需要海量文本、图片、视频等数据,认为数据量的差异将导致训练效果不一样,因此数据处理者Meta没有义务去证明每个数据点满足必要性的义务;另一方面认为人工智能训练海量数据是为了提炼模式以及参数,在此情形下,个体层面的数据几乎没有影响,因此,没有必要对个体层面的数据进行检查。再加之没有更优替代方案(如匿名化、合成数据效果不足)。据此认定了Meta训练使用已公开用户个人数据符合必要性和最小化原则。这大大降低了AI公司在这方面的证明、论证义务。
第二,对用户权益的影响方面,尽管学界有不少观点强调了AI对用户隐私及个人信息权益的侵害,但是法院在本案中认为:基于大型训练数据集开发的大语言模型不会定向处理个人数据,也不会识别到个体,在此背景下,个体信息不是训练阶段权益侵害的重点,需要考虑用于研发语言模型的训练数据集体量过大,导致识别到个人的可能性低的情况,据此认可Meta公司处理公开个人数据的行为不太可能对用户的数据权益造成具体损害。
第三,本案具有特殊性,法院仅认可了Meta公司在宣布AI模型训练后使用自身平台用户公开个人数据的场景,案件结论无法类推适用于抓取第三方公开个人数据进行AI模型训练的场景。特别地,法院强调:对于Meta宣布训练AI之前,用户作为数据主体可以合理地期待在外部抓取用户个人数据时会遭到Meta的拒绝,因此外部通过抓取的方式使用用户数据的行为超出了用户委托Meta公司出于产品改进的目的使用数据的合理期待。从这个角度来看,如果Meta使用的是抓取自其他平台的已公开个人数据,或者其他AI厂商抓取了Meta平台的用户公开数据,可能都会被认定为不符合用户的合理期待。
上述法院的观点与韩国个人信息保护委员会2024年7月发布的《处理人工智能(AI)开发和服务中使用“公开数据”标准指南》有诸多相似之处。但韩国在该指南中认定的已公开个人信息范围更广,并不限于本案中Meta自有社交平台的用户已公开数据。该指南中,“公开的个人信息”是任何人都可以合法访问的个人信息。主要是指网站、博客、维基百科、Common Crawl、法令公示和公开的个人信息、出版物、广播媒体等中包含的个人信息。《指南》认为:大模型预训练是将文本、图像等非结构化数据转换为机器可以学习的格式,以查找结构、模式,在此过程中个人识别性可能会降低。大模型的开发需要大规模的学习数据,以模拟人的语言发音结构和脉络等,生成准确的预测,为此,大模型的开发依赖于互联网上公开的数据作为现实方案,这可以称为必要性。考虑到AI开发的目的和公开的个人信息的特性、风险水平等,“正当利益”条款可以成为实质性的合法依据。
当前,人工智能的全球竞争已迈入深水区。各国不仅在技术研发、产业应用层面展开激烈角逐,更在治理规则的探索中持续发力 —— 如何平衡数据保护与技术创新,成为全球司法实践的关键命题。
本案中,德国法院通过“正当利益三步测试”与系列合规措施(去标识化、透明度告知、用户退出机制等),为GDPR “保护个人数据”与“促进数据流通”的双重立法目标提供了司法注脚:既认可海量数据对人工智能训练的必要性,又通过“选择退出”机制保障用户权益,展现了规则落地的司法智慧。
这一探索对中国颇具借鉴意义。尽管我国《个人信息保护法》已确立已公开个人数据的“合理使用”制度,但模型训练场景下“合理范围”的边界与“重大影响”的认定标准仍需细化。未来,如何结合本土立法实践与司法判例,在保障个人权益的同时促进人工智能发展,仍是需要持续探索的课题。
注释
1.https://nrwe.justiz.nrw.de/olgs/koeln/j2025/15_UKl_2_25_Urteil_20250523.html. “二、法院观点”部分来自法院决定,省略脚注。
2.Andrea Bartz等诉Anthropic案,案号:No. C 24-05417 WHA,以及Kadrey等诉Meta案,案号:Case 3:23-cv-03417-VC。
3.https://www.edpb.europa.eu/our-work-tools/our-documents/opinion-board-art-64/opinion-282024-certain-data-protection-aspects_en.
4.https://www.dataprotection.ie/en/news-media/latest-news/dpc-statement-meta-ai.
5.Ibid.
6.https://about.fb.com/news/2025/04/making-ai-work-harder-for-europeans/.
(本文仅代表作者观点,不代表知产力立场)
封面来源 | Pixabay 编辑 | 有得
相关文章
张家界武陵源怎么去凤凰古城? 从张家界可以坐旅游大巴车去凤凰古城。由张家界市中心汽车站直接乘旅游大巴车赴凤凰古城每天6班,发车时间为8:30、9:30...
2025-08-21 1.1K+
在58同城找房子租需要交定金吗多少钱 1、租房需要押金的。在58同城上看房子,看到合适的联系中介或者房东看房,确定租房之后根据租房合同需要向房东预交押...
2025-08-21 1.4K+
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-21 6
该案的分析思路对平衡用户个人数据保护和人工智能发展,特别是大模型训练场景下合理使用已公开个人数据的认定具有重要的借鉴意义。作者 | 王洁 中国互联网协...
2025-08-21 1
大庆11月21日至23日天气形势消息(21号大庆天气预报 1、天气形势11月21日夜间~23日白天,预计我市将有一次大雪、大风天气过程,主要降雪时段...
2025-08-21 1.9K+
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-21 4
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-21 3
无需打开直接搜索微信:本司针对手游进行,选择我们的四大理由: 1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信: 2、自动连接,用户只要开启...
2025-08-21 4
发表评论