谷歌涉及医疗保健数据——我们能相信它吗?

Eerke Boiten的头像

Eerke Boiten开云体育主頁(欢迎您)肯特大学开云体育app客服

谷歌拥有世界上最强大的计算机和最聪明的算法,聘请了一些最优秀的计算人才,最近通过收购英国公司Deepmind获得了人工智能专业知识看到人工智能在围棋比赛中击败了人类大师.那么为什么我们不想把它应用到潜在的医疗问题上——一些谷歌级的问题呢浮夸的,甚至夸张的陈述建议公司希望?

《新科学家》杂志最近揭示了一个数据共享协议皇家自由伦敦NHS信托基金和谷歌Deepmind之间的合作。信托基金发表了不正确的声明(自校正),声称Deepmind不会接收任何可识别患者身份的数据(它会),这导致了数据加密和匿名化能实现什么、不能实现什么的无关紧要的混乱。

由于人们对第三方获取医疗记录的感受非常强烈,所有这些都引起了一些丑闻。但这是一种过度反应吗以前的健康数据崩溃?还是说,这代表了医疗记录共享方面一个令人担忧的新发展?

数据分析

NHS外包其数据分析需求并不是什么新鲜事。NHS数据中心HSCIC定期发布数据共享报告其最新报告向CSL-UK、Northgate、麦肯锡(McKinsey)和福斯特博士(Dr Foster)等公司发布细节。这些公司将把处理过的数据卖回给NHS。

实际上,虽然与公司共享的大多数NHS数据都是出于所谓的次要目的,这些目的不在直接临床护理的提供范围内,但与谷歌的交易被归为直接护理。医生让一个叫Streams的应用它使用患者的实时医疗数据和他们的历史记录来确定他们急性肾损伤的风险。

因此,应用程序访问正在接受治疗的患者的个人身份数据是非常合理的,在此基础上,“谷歌可以访问160万名患者的数据不应成为担忧的理由。特别是谷歌主要是间接访问数据,通过一个未具名的第三方认证的信息安全标准,绕过了谷歌可能滥用数据的问题。

不太清楚

但该交易的另一个明确目的是“实时临床分析、检测、诊断和决策支持”,大概是为了建立一个“医疗数据分析即服务”的在线平台。任何“即服务”通常都意味着处理是在云中完成的,尽管与谷歌的协议很少提到这一点。云处理意味着敏感的个人数据将在某个时候被发送到谷歌服务器。

纳入所有患者5年的历史数据是合理的,以“辅助新产品的服务评估和审核”。但很难看出这与一开始仅仅使用数据来改进肾脏损伤算法有什么不同。Deepmind的声称“Streams没有使用人工智能”与他们声称需要的数据量相比,这是非常奇怪的,因为这些数据量通常用于为机器学习算法提供数据,从而可以做出更好的决策。几乎可以肯定,谷歌本身可以访问这些历史患者数据。

否则,与谷歌的协议声称完全符合《数据保护法》、标准医疗数据原则和NHS程序。数据传输是安全的(和加密的),工作人员已经接受过尊重机密性的培训,并且数据不能用于列出的目的以外的其他目的。

提到的一个原则是Caldicott原则使用所需的最小数据。但在这里,这似乎被解释为:为了使用Streams治疗一名患者,我们需要160万名患者5年的医疗数据。这是通过大规模监控镜头来看待临床护理——我们需要每个人的所有数据,以防他们需要治疗。方便的是,对于临床治疗问题,NHS信息治理允许使用“默示同意”,而不是受试者自己的任何直接参与。

黑匣子监控

当然,问题是我们是否相信谷歌会坚持这些政策。该协议允许NHS信托进行审计,这可能足以遏制更直接和公然的滥用行为。

然而,谷歌经常处理个人数据:我们的搜索历史可能会通过一些分析过程反馈谷歌的搜索排名。我们的Gmail电子邮件被扫描用于营销目的。如果我们停止谷歌记录我们的位置历史供我们自己使用,它们还会作为某个“匿名”人的位置历史保存在谷歌数据库中吗?这里有很多谷歌没有告诉我们的东西。

改进肾脏损伤算法或开发一个使用医疗数据的分析平台将产生更多的数据。新产品的服务评估将产生更多的数据。其中一些数据将存在于人物简介、匿名用户和聚合用户特征的阴暗世界中。这将是一些个人数据,但还不够个人到我们粗糙的数据保护法能够保护它。

在这个世界上黑匣子监控,谷歌可能是世界上最大的播放器。只要它在如何使用和处理数据方面提供的透明度如此之低,我们就不得不在某种程度上不信任它——也许在这种情况下尤其如此。

谈话

Eerke Boiten香港理工大学计算机学院高级讲师及卓越网络安全研究学术中心主任开云体育主頁(欢迎您)肯特大学开云体育app客服

本文最初发表于谈话.读了原文