Google Research 2022 年终总结和展望第八期:健康领域
Google 关注人工智能(AI) 是因为我们相信,这项变革性的技术能够在几乎各个领域和各行各业帮助、协助和赋能人类,并将以此来造福社会。其中,最能对社会产生正面影响的领域,莫过于医疗和医药领域。与 Google 展现这些社会效益的使命相一致,从 2019 年到 2022 年,Google Research 在应用机器学习(ML)领域的项目,每年都帮助 Alphabet 在自然影响指数(Nature Impact Index)健康和生命科学出版物排行榜中跻身最具影响力的企业研究机构前五名。
我们的健康研究出版物具有广泛的影响,横跨多个领域,包括生物标志物(biomarker)、用户传感器、皮肤病学、内窥镜检查、流行病学、医药、基因组学、肿瘤学、眼科学、病理学、公共和环境卫生以及放射学领域。本文重点回顾 Google Research 关注的三个具体主题:
1. 技术伙伴关系的重要性(Criticality of technology partnerships)
2. 转向移动健康(Shift towards mobile health)
3. 生成式 ML 在健康领域的应用(Generative ML in health applications)
文中的每一节都在强调慎重和协作对于健康领域创新的重要性。不同于消费产品开发中典型的“发布和迭代”方式,将 ML 应用于健康领域需要全面而严谨的评估、生态系统认知以及严格的测试。所有医疗技术必须在部署之前向监管机构证明它们是安全且有效的,并且需要符合严格的患者隐私和性能监测标准。但 ML 系统作为这一领域的新晋方法,还必须发掘其在卫生工作流程中的最佳使用方式,并赢得专业医疗人员和患者的信任。在这种特定领域中完成接入、获取认证的工作时,不应该只有技术公司单打独斗,而应当是技术公司与健康领域的专家合作伙伴紧密协作。
技术伙伴关系的重要性
负责任的创新需要耐心和持续的投资,共同遵循从初级研究逐步到影响全人类的长线研究。我们将 ML 用于那些无法得到适当治疗的糖尿病患者,帮助他们预防失明。从发表基础算法研究到最近的部署研究,证明了基于社区的筛选环境中集成 ML 解决方案在实际应用中的准确性,这一过程总共花费了六年的时间。幸运的是,研究人员发现可以通过全面而慎重地构建技术伙伴关系,从根本上加快从 benchtop-ML 到 AI-at-the-bedside 的进展速度。
显然,加速发布与健康相关的 ML 技术是很有必要的。例如,在肿瘤学领域,乳腺癌和肺癌是两种最常见的癌症类型,对于二者而言,早期发现都是关键。如果 ML 能够提高这些癌症筛查的准确性,扩展其可用范围,患者将从中受益,但是等待部署这些进展的时间越长,得到帮助的人就会越少。建立伙伴关系可以让新技术更快而安全地触达患者——成熟的医疗技术公司可以将新的 AI 能力整合到现有的产品组合中,寻求适当的监管许可,并利用他们现有的客户群快速部署这些技术。
我们已经亲眼见证过类似成就的达成。Google 发表了利用 ML 改善乳腺癌筛查的领先研究成果,仅仅两年半之后,我们就与一家领先的乳房 X 线摄影软件供应商 iCAD 合作,开始将我们的技术整合到 iCAD 的产品中。通过与 RadNet 的子公司 Aidence 合作,我们发现,在将低剂量 CT 扫描的深度学习研究转化为肺癌筛查工作流程时,也实现了同样的进展加速。
同样地,在基因组学领域,伙伴关系也被证明可以加速 ML 技术。在过去的一年中,我们与斯坦福大学合作,通过将新型测序技术和 ML 技术相结合,以破纪录的速度对一位患者的整个基因组进行测序,快速诊断遗传病,从而进行干预,以拯救患者生命。另外,我们宣布与 Pacific Biosciences 合作,通过将我们的 ML 技术融入到他们的测序方法中,在我们长期的深度学习基因组学开源项目的基础上,进一步推进研究和临床的基因组技术。同年晚些时候,PacBio 发布了Revio——一个由我们的技术赋能的新的基因组测序工具。
医疗技术公司和 AI 技术公司之间的伙伴关系可以加速技术的转化,但这些伙伴关系是对推动整个领域发展的开放研究和软件的补充,而不是替代。例如,在我们的医学成像系列中,我们推出了一种简化胸部 X 射线模型开发迁移学习的新方法,通过强大而高效的自监督学习来加速医学成像 ML 系统的生命周期的方法,以及使医学成像系统对离群值更加强大的技术——所有这些都是在 2022 年实现的。
展望未来,我们相信这种科学开放和跨行业伙伴关系的结合将成为一个关键催化剂,促进以人为本的 AI 在医疗和医药领域做出贡献。
迈向移动医疗
在整个医疗领域,以及在健康应用的 ML 研究中,重点已经从密集的集中式护理(如:住院)转向分布式护理(如:到患者所在的社区中进行护理)。因此,我们正在努力开发可以触达患者的移动 ML 解决方案,而不是把患者带到(由 ML 赋能的)诊所。2021 年,我们分享了一些使用智能手机摄像头测量心率和帮助判定皮肤状态的早期工作。2022年,研究人员开展了一项新的研究,即智能手机相机自拍可以评估心血管健康和新陈代谢对视力的风险,以及将智能手机麦克风放在胸前帮助解读心脏和肺部声音的可能性。
这些实践成果都是基于已经安装到智能手机上的诸多传感器。虽然这些进展很有价值,但通过开发新的传感技术,在拓展移动健康能力方面仍有很大潜力。在这一领域,我们最令人振奋的研究项目之一就利用了新的传感器,从而可以轻松连接现代智能手机,让资源不足的社区能够使用移动产妇超声波技术。
每年,妊娠和分娩并发症造成 29.5 万孕产妇死亡和 240 万新生儿死亡,对全球低收入人口的影响尤为严重。产科超声是高质量产前护理的一个重要组成部分,但中低收入国家多达50% 的妇女在怀孕期间没有接受超声检查。在超声波硬件领域,创新人员已经在低成本手持便携式超声波探头的研发方面取得了飞速的发展。这种探头只需要一部智能手机就可以驱动。不过这项技术还有一个关键的弱点,即缺乏具备专业技术和知识的现场技术人员,来操作超声波探头并解读其阴影图像。当然,远程解读图像也是可行的,但这在网络连接不稳定或网速慢的情况下是无法实现的。
有了适用的 ML 赋能的移动超声波,助产士、护士和社区卫生工作者等医疗人员就有可能为那些最需要的人提供产科超声波诊疗服务,并及时发现问题。先前的研究已经表明,卷积神经网络(CNN)可以通过使用标准化的采集协议,解读由经过训练的的超声仪采集的超声。AI 为打开拯救生命的信息通道带来了可能。在意识到 AI 的这种潜质之后,我们在过去的几年里与美国和赞比亚的学术伙伴和研究人员合作,提升并拓展自动解读超声波视频捕捉的能力。只需要简单地将超声波探头扫过孕妇的腹部便可以完成采集,即使是非专业人员也可以轻松完成这一程序。
新手只需经过几小时的超声培训,就能完成这一超声采集程序。
这种方法只需要一个低成本、电池供电的超声设备和一部智能手机,在评估胎龄和胎儿畸形方面,其准确性能与现有临床标准的专业超声师相媲美。
在评估胎龄方面,这种 AI 赋能的程序的准确性与临床标准相当。
我们正处于便携式医学成像技术广泛转型的早期阶段。在未来,由 ML 赋能的移动超声将增强手机的内置传感器,允许现场对各种医疗问题进行分诊和筛查,所有这些都用最少的训练数据,就能对数百万人的护理提供帮助。
健康领域的生成式 ML
随着 ML 在健康领域的长期应用,我们期望生成式建模能够成为模式识别系统的补充。在过去,我们已经探讨了生成式图像模型在数据增强中的适用性,讨论了生成式模型如何用于捕获相关临床事件之间的相互影响,甚至出于研究目的,合成一些符合实际的电子医疗记录。
用 EHR-Safe由原始数据生成合成数据。
提到应用生成式模型,肯定要提到大型语言模型(LLM)的最新进展,经过将近十年的研究,通过生成式循环神经网络完成的文本合成的公开演示已经让全行业沸腾了。毫无疑问,这些技术具有在现实世界中应用的潜力,事实上,Google 也是最早在日用消费品中部署这些网络的公司之一。但考虑到它们在健康领域的应用时,我们必须再次回到基本原则,即我们必须负责任地测试技术并谨慎行事,这是我们的根本责任。这样的 ML 系统可能有一天会真实地影响到人们的健康,这一问题的严重性绝不能被低估。
为此,去年12月,我们发表了一份关于 LLM 和临床知识编码的预印本,其中整理和扩展了评估自动化医学问题回答系统的基准,并引入了一个研究级医学问题回答语言模型 Med-PaLM。例如,如果有人提问:“压力大会导致流鼻血吗?”,模型会生成一个回应,解释道:“是的,压力大会导致流鼻血”,并详细说明一些可能的机制。Med-PaLM 的目的是使研究人员能够实验和改进 LLM 对健康信息的表示、检索和交流,但它目前还不是一个医学问题解答产品的最终成品。
在实验结果中,Med-PalM 在这些基准测试上的表现大大超过了其他系统,而且是全面地超越,我们为此感到振奋。也就是说,论文的一个关键点在于,我们和其他机器学习系统都仅仅在一系列医学考试问题上取得了“及格”分数,其安全性和准确性还远远达不到支持实际医学问题解答的水平。我们预计,这一领域将飞速发展,但就像将 CNN 引入医学成像领域一样,LLM 在健康应用方面的成熟还需要进一步的研究、合作、关注和耐心。
我们的 Med-PaLM 模型在 MedQA USMLE数据集上获得了最先进的性能,比之前的最好成绩高出 7%。
总结
我们希望上述这些趋势将在 2023 年延续下去,甚至可能得到加速发展。为了更有效地发展医疗领域的 AI,从创新到带来实际影响,我们将与学术、医疗科技、AI 技术和医疗组织展开更多合作。这可能会积极利用手机和移动传感器,使其在提供护理方面发挥作用。在这一方面,我们已经实现了应用的拓展,但仍具有很大的变革空间,远远超出我们目前对远程医疗的想象。当然,如今在 AI 领域很难不为生成式 AI 和 LLM 的前景感到兴奋。但是,尤其是在健康领域,必须利用伙伴关系和最高标准的测试才能实现这一承诺。技术将不断变革,我们对人类健康的认知也将不断变化。但是,人们会相互关心,会努力取得进步,这一事实永远不会改变。我们为 AI 在未来可能为医疗领域做出的贡献感到兴奋不已。