马斯克计划用100粉丝窥探推特虚假账户占比 专家:方法错了

5月15日消息,美国特斯拉公司首席执行官埃隆·马斯克于当地时间周五宣布,在确认垃圾和虚假账户占平台总用户数比重不到5%的更多细节披露以前,将暂时搁置收购推特的计划。

此条推文,令推特的股价盘前一度暴泻超20%。

仅两小时后,马斯克再次发文称:仍致力于收购推特。但他仍继续猛烈抨击推特的虚假账户问题,并表示他的团队将对垃圾和虚假账户真实数据进行核实。然而,许多专家认为,马斯克的抽样分析方法错了!

推特自承虚假账户不到5%?

在今年第一季度财报中,推特承认,除了合法的、可货币化的日活跃用户(MDAU)外,其平台上还存在许多“虚假、垃圾以及重复账户”。该公司报告称:“我们对账户样本进行了内部审查,估计2022年第一季度虚假账户、垃圾账户以及重复账户的平均数量不到该季度日活跃用户(2.29亿)的5%。”

推特还承认,在过去三年中,该平台多报了140万至190万用户数量。推特透露,该公司在2019年3月推出了一项功能,允许人们将多个独立账户链接在一起,以便在不同账户之间进行方便的切换。但当时出现错误,通过主帐户执行的操作导致所有链接帐户都被认定为日活跃用户。

然而研究人员估计,根据2017年的一项早期研究和一家监控在线对话的公司最近发布的研究报告,有9%到15%的推特账户都是自动账户或机器人操作。以色列科技公司Cyabra的首席执行官丹·布拉米(Dan Brahmy)说:“显然,他们低估了这个数字。”该公司利用机器学习来识别虚假账户。Cyabra估计,推特虚假账户的比例为13.7%。

Facebook和Instagram母公司Meta也估计,根据其2021年第四季度的最新数据,虚假账户约占Facebook月度活跃用户的5%。Meta还估计,约11%是一个用户操作多个账户的“重复”账户,但这种做法在推特上被认为是可以接受的。

推特的规则确实禁止虚假账户,这意味着如果公司确定虚假账户的目的是“欺骗或操纵他人”,例如参与诈骗、协调滥用活动或人为夸大参与度,它们就会被禁止。

多年来,推特也始终在投资清理虚假账户。2018年,推特收购了名为Smyte的公司,后者专门从事垃圾账户的筛查和清除。为了改善平台的健康状况,推特还删除了“垃圾账户和可疑账户”,这导致其用户数量在2018年7月减少了100万,股价暴跌。

根据研究人员的说法,即使机器人的数量实际上很小,但它们却可以产生巨大的影响,而且少数几个机器人可以在塑造在线对话方面产生严重后果。卡内基梅隆大学的一项研究分析了2020年新冠肺炎谣言的传播情况,发现在最具影响力的50名转发者中,82%是机器人。

随机抽样100位粉丝确认状态

马斯克表示,他将采取措施来确定推特上到底存在多少垃圾账户、虚假账户以及重复账户。他说:“为了找出答案,我的团队将对推特官方账号的粉丝进行随机抽样,确认100位粉丝的状态。我邀请其他人重复同样的过程,看看他们有什么发现。”

马斯克在随后的推文中澄清了自己的研究方法,并补充道:“选择任何粉丝众多的账号,忽略前1000名粉丝,然后每隔10人抽取1人进行核查。当然,我也希望能找到更好的方法。”

马斯克还解释称,在没有提供证据的情况下,他选择100作为其研究的样本数量标准,因为推特在财报中也使用这个数字来计算粉丝数字。

他说:“任何合理的随机抽样过程都可以接受。如果许多人进行独立研究,然后发现虚假账户、垃圾账户以及重复账号占比的数字相似,那就说明问题了。我之所以选择100作为采样基数,因为这也是推特计算出其虚假账户、垃圾账户以及重复账户占比不到5%的数据。”

马斯克的分析方法遭批

尽管马斯克可能有理由对上述数据进行评估,但社交媒体、虚假信息和统计分析方面的专家表示,他提出的分析方法存在严重不足。

当被问及马斯克的方法是否能得出准确结果时,推特拒绝置评。但Facebook联合创始人达斯汀·莫斯科维茨(Dustin Moskovitz)通过自己的推特账户就这个问题发表了看法,他指出,马斯克的方法实际上并非随机抽样,使用的样本也太少,而且留下了大量错误的空间。他写道:“我也觉得‘不信任推特团队帮助提取样本’是一种危险信号。”

分析服务网站BotSentinel创始人兼首席执行官克里斯托弗·布齐(Christopher Bouzy)表示,其公司分析表明,推特上10%到15%的账户可能是“不真实的”,包括冒充者、垃圾邮件发送者、诈骗者、邪恶机器人以及“单一目的仇恨账户”等,这些账户通常针对和骚扰个人,还有其他故意传播虚假信息的人。

BotSentinel主要由众筹支持,它使用机器学习软件和人类审查员相结合,独立分析和识别推特上的不真实用户。该公司目前监控着250多万个推特账号,其中主要是英语用户。布齐说:“我认为推特对‘虚假账号和垃圾账号’的分类并不现实。”

布齐还警告说,根据讨论的话题不同,虚假账户的数量可能会在推特的不同角落出现更高或更低的情况。例如,BotSentinel发现,与讨论小猫和折纸等非争议性话题的账户相比,关于政治、加密货币、气候变化等话题的不真实账户更多。

华盛顿大学教授卡尔·伯格斯特罗姆(Carl T. Bergstrom)与人合著了一本书,旨在帮助人们理解数据,避免上当受骗。他评论马斯克的方法称,对任何推特账户的100名粉丝进行抽样,都不应该被作为进行一笔440亿美元收购交易的“尽职调查”。

伯格斯特罗姆说,在研究账户真假的问题上,社交媒体研究人员通常会使用大量样本,而马斯克随机抽取100个样本的规模小了几个数量级,这种方法将面临的最大问题是存在选择偏见。

伯格斯特罗姆写道:“没有理由相信推特官方账号的粉丝是平台上具有代表性的账户样本,也许机器人不太可能关注这个账户以避免被发现,也许他们更有可能遵循看起来合法的做法。谁知道呢?但我无法理解马斯克除了用这个愚蠢的抽样方案来欺骗我们之外,还有什么其他的事情可做。”(小小)

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注