X(以前是Twitter)最近更新了其服务条款,明文禁止抓取和爬取其数据,这一举措可能是为了遏制任何试图使用其数据进行人工智能模型训练的行为。
这些新的服务条款从9月29日开始生效,明确禁止任何形式的数据抓取或爬取,除非事先取得“书面同意”。
在此之前的服务条款版本允许根据robots.txt文件的规定进行数据爬取。
新的服务条款中写道:“注意:只有在遵守robots.txt文件的规定的情况下才允许数据爬取服务,但未经我们的事先同意,明确禁止数据爬取服务。”
近几个月来,Twitter还对其robots.txt文件进行了更改。这个文件通常向机器人爬虫提供了有关他们可以访问网站的哪些部分的指示。在这次更新后,除了Google之外的所有爬虫机器人都被排除在外。
值得注意的是,在2015年,Twitter曾经确认与Google签订了一项重要协议,允许Google在其搜索结果中显示推文。
然而,目前尚不清楚在新的管理下,这项协议的性质或条款是否发生了变化。我们已联系Google以获取相关信息,如果获得回应,我们将及时更新报道。
此外,X还修改了其robots.txt文件,以阻止爬虫机器人获取与特定帖子相关的信息,例如喜欢和转发。该文件还禁止机器人机器人查看用户帐户中的喜欢、媒体和照片。
在今年6月,这个社交网络曾短暂地禁止未登录的用户查看帖子。几天后,它取消了查看推文的登录要求。当时,公司的所有者埃隆·马斯克表示,这是一项临时措施,因为该网站的数据被“大量掠夺”,已经影响到了正常用户的服务。
马斯克一直反对公司抓取Twitter/X的数据来训练人工智能模型的行为。今年4月,他曾威胁要起诉微软,指控其非法使用社交网络的数据来训练人工智能模型。7月,他还对一些不明公司提起了抓取诉讼。
最近,X也修改了其隐私政策,明确表示可能会使用公共数据来训练人工智能模型。
马斯克此前在Twitter上的一次直播中提到,他创建的xAI公司,成立于7月,可能会使用公共数据,如推文,来训练其模型。此外,新的隐私政策还包括允许收集用户生物特征数据、教育和工作历史的规定。
这些变化反映出社交媒体公司对于数据隐私和人工智能模型训练的日益关注,以及他们采取的措施来维护用户数据的安全性和隐私权。
随着技术的不断发展,这些问题将继续引发讨论和调整,以寻求平衡数据利用和隐私保护之间的关系。
发布者:5840,转转请注明出处:https://www.5840.cn/lives/1224.html
评论列表(0条)