北京时间7月14日早间消息,据报道,上周Twitter母公司X Corp起诉一批不知名实体,主要是这些实体非法采集Twitter数据。
很多企业会利用自动化程序从可以公开访问的网站收集数据,然后将数据用于各种目的,比如训练AI大语言模型、推送精准广告。
按照描述,被告非法收集德州公民的数据信息,Twitter要求被告赔偿100多万美元。被告还涉嫌与德州达拉斯数据处理设施运营商签署合作合同。
之所以没有公布实体名称,主要是因为X Corp无法确定个体身份,但X Corp提供了4个IP地址。
在美国,如果抓取的是公共可访问数据,一般都是合法的。由于存在数据极端抓取、系统操纵等行为,月初时Twitter已经开始限制用户每天可以读取的推文数量。
当Twitter发现IP地址存在不正常抓取行为时会不会封杀呢?目前还不是很明确。Twitter方面称,在非法抓取数据时,被告不仅无视Twitter服务条款,还忽视Twitter用户的隐私偏好。