报道:医疗人工智能公司在网上曝光了数百万条记录-编程之家

安全研究员杰里迈亚·福勒与网站星球研究团队一起发现了一个不受密码保护的数据库,其中包含886521320条记录。数据集的总大小为68.53 GB,包含医疗相关数据。经过进一步研究,有多处引用了Deep6。人工智能包括内部电子邮件和用户名。我们立即发送了一份负责任的披露通知,不久之后,公众访问受到限制。这些记录似乎包含了美国境内人员的数据。

收集的数据类型分为以下几个部分:

日期、文档类型、医生说明、遭遇ID(患者与医疗保健提供者之间为提供医疗保健服务而进行的互动)、患者ID、说明、uuid、患者类型、说明ID、服务日期、说明类型(例如护理/其他)和详细说明文本。其中一些信息是加密的,但笔记和医生信息是纯文本的。危险在于,如果患者ID被解密,身份被暴露,就可以清楚地看到他们的医疗问题或诊断。

6获取原始医疗数据并尝试对其进行管理或组织

根据他们的网站:“Deep6 AI的软件还可以识别病历中未明确提及的患者。因此,Deep6 AI的软件可以在很短的时间内找到更多更好地符合试验标准的患者。” Deepd6位于美国加利福尼亚州帕萨迪纳。

暴露的记录显示,医生记录提供了患者疾病、治疗、药物、家庭、社会甚至情绪问题的详细信息。这些都是非常完整的描述,令人惊讶的是,这些笔记中包含了许多小细节。这是一个罕见的背后看这些笔记如何看,以及由医务人员收集的信息类型。

医生注释示例:

“抽泣无法停止,与pt坐在一起的时间间隔很长。pt从未与治疗师交谈过,也没有开过处方药。社会服务咨询与pt会面,并将在住院期间跟进。在治疗过程中接受了2毫克的阿维坦IVB x2,效果良好。她对狼疮的家庭疼痛控制在HS服用维可丁2片和泰诺#3 2片。\nCV VSS等待PA导管插入弗洛兰以“MICU服务”开始

在取样的10k记录中,“患者”出现8672次,其中一些出现在医生的记录中。“Note”这个词出现了5914次。有人提到。csv文件,我们只能推测这些文件可能包含其他信息。理论上,如果有人获得了这些。csv文档他们可能会将详细说明与患者数据、诊断、药物和治疗相匹配。

发现细节:

总大小:68.53 GB
总记录886521320
概念索引–2100万条记录,公开实验室结果和药物细节,
患者索引–4.22亿条记录。注意:虽然患者的姓名不是纯文本,但它可以清楚地了解这些信息的存储位置。然而,暴露出来的是一个内部患者记录和跟踪过程。
Provider index–8.9万条记录,显示医生姓名、内部患者ID号(这些是内部跟踪号,显示记录格式)、文档位置和位置。CSV文件和其他潜在的敏感信息。
文件还显示了数据的存储位置以及对“生产”数据的引用。
该数据库面临勒索软件攻击的风险,任何有互联网连接的人都可以公开访问该数据库。

报道:医疗人工智能公司在网上曝光了数百万条记录-编程之家报道:医疗人工智能公司在网上曝光了数百万条记录-编程之家

报道:医疗人工智能公司在网上曝光了数百万条记录-编程之家报道:医疗人工智能公司在网上曝光了数百万条记录-编程之家

作为安全研究人员,我们从不绕过网络中受密码保护的区域或尝试解密记录。在样本中,没有出现“演示”一词,只提到“测试”是在患者需求的医学背景下。这些医生似乎都是美国的多供应商网络。医务人员的信息是纯文本的,包括他们的全名、医疗专业领域以及他们在患者护理中的角色。医生或医生的名字都是真实的个体,我只用一个搜索引擎就能验证许多唯一的名字。

根据2021年6月29日发布的新闻稿:

随着最近增加了四个额外的卫生系统,Deep6生态系统现在包含:几十个领先的研究机构,包括6个NCI指定的综合癌症中心、30000名医生和其他提供者、3000万名患者和数千个正在进行的试验。

医疗保健是一个目标

过去几年,医疗保健行业一直受到无休止的网络安全威胁和问题的困扰。去年,美国的医疗保健网络攻击增加了近55%。对医疗保健的网络攻击是一个巨大的问题,短期内不会消失。医学数据远比黑暗网络上的任何其他类型的记录更有价值。据一些消息来源估计,每份病历的平均数据泄露成本现在高达499美元(过去两年为250美元)。医生也是网络罪犯和骗子的目标。在新冠肺炎大流行期间,医生和护士一直与感染患者密切接触。骗子现在正在联系医生,假装是联系人追踪者,然后索要敏感的患者医疗数据。假设这一曝光可以为骗子提供89143名医疗专业人员的名单,他们可以利用内幕信息和自己的笔记来获得信任。

人工智能有多安全?

作为一名安全研究人员,我非常清楚搜索大量数据并确定哪些是敏感的,哪些不是。人工智能的基本思想是让机器使用大量数据进行学习,变得更智能,并在短时间内从这些数据中预测准确的结果。从网络安全的角度来看,使人工智能成为功能性解决方案的同一个概念,也是使人工智能处于风险中的同一个过程。

防御技术往往远远落后于网络罪犯和民族国家,这是一个公开的秘密。随着机器学习在安全领域的发展,网络攻击也变得越来越复杂。每次入侵失败时,机器都会变得更加智能,攻击变得更难预测、预防或停止。

人工智能在医学和医疗保健领域是一项革命性的技术应用,已经对现实生活产生了积极影响。组织必须采取更多措施保护其人工智能应用程序、机器学习模型,最重要的是保护其收集的大量数据。人工智能的最佳网络安全解决方案之一是确保数据存储在安全环境中,并使用加密。

数据保护必须与人工智能应用程序的开发齐头并进。即使是意外的数据泄露,也不仅会泄露数据,还会让网络犯罪分子在幕后看到配置、将应用程序连接在一起的中间件或操作基础设施。有了这些信息,犯罪分子可以对数据库或基础设施发起更加知情和协调的攻击。帮助病人需要多年的研究、测试和临床试验。这还需要收集大量的医疗和患者数据。我们的目标是提高保护有价值的医疗相关数据的意识。我们希望确保所有个人的数据都得到保护和保护。

目前尚不清楚该数据库被公开了多长时间,也不清楚还有谁获得了这些记录的访问权。这一发现引发了这样一个问题:患者拥有什么样的隐私保护,或者他们对医疗服务提供商、研究人员和第三方公司如何使用他们的数据有多大的控制权。目前尚不清楚这些人是否选择参加临床试验,或者医生或医疗保健网络在提供这些数据方面发挥了什么作用?

6。人工智能迅速而专业地关闭了公众对数据集的访问。我们没有暗示Deep6有任何不当行为。ai或他们的合作伙伴,我们只是强调围绕医疗技术的安全漏洞。我们并未表示任何患者、医生或医疗数据存在风险,我们发布我们的调查结果是为了教育网络安全最佳实践。

6的回复:

“8月,一名安全研究人员访问了一个测试环境,其中包含来自麻省理工学院重症监护医疗信息集市(Mick)的虚拟数据该系统是一个行业标准源,用于消除与健康相关的测试数据。为了证实这一点,在这个短暂的测试环境中没有包含真实的患者数据或记录,它与我们的生产系统完全隔离。根据目前的报告,我们已经确认,最近的索赔引用了模拟数据,并且无法访问真实的患者记录。当研究人员在8月份通知我们时,我们立即保护了测试环境,以确保没有进一步的担忧。数据安全和隐私是Deep 6 AI的首要任务,保护数据的责任是我们业务的核心,也是我们所有人的首要考虑。”