偏误数据影响 AI 诊断、医学影像判读准确度如何提升？ AACR 2021 精华

数位化时代来袭，科技与医疗的界线逐渐模糊，癌症疗法也因新兴技术变得更精准与多样化。AACR 2021 大会针对 AI、机器学习在癌症治疗的应用与挑战进行讨论，指出健康照护系统的结构不平等可能影响临床照护与诊断算法的训练过程。

Novartis 生物医学中心的 Iya Khalil 博士指出，多元化来源与层级的患者数据可整合于临床数据，以补足健康体系的断层，也提供医护人员符合现实世界的各疾病数据。另外，透过整合分子数据、影片、活体切片结果，科学家可以降低偏误（bias）数据的出现，也可使人类正确理解疾病的运作机制，找到低偏见的治疗方法。

纪念斯隆凯特琳癌症中心的 Christina Leslie 博士则表示，在训练算法时，使用小众且统一的族群数据可能会生成一个不稳定模组，容易漏失重要的数据点。另外，在基础研究中，AI 的目标是依照输入的数据精准预测结果，然而在临床场景中，AI 除了要精准预测外，也得提供得出结论的可信逻辑，使医师愿意相信并使用。

加州大学洛杉矶分校公共卫生学院 Joann Elmore 博士强调，在现实世界中，AI 诊断有伪阳性的应用挑战。而 Apricity Health 执行长 Lynda Chin 博士则经验分享如何透过 AI 将现实世界与控制环境的临床照护差距最小化。

他们也针对科技是否会在代表人数不足或过多的族群中加剧数据落差（digital divide）的问题进行回答。他们认为，要让各地区健康中心拥有同等临床照护的机会与技术，科学家需要开发新工具与强化法规监管，更注意用于训练的数据是否存在偏见。接下来，各讲者将分享他们在癌症研究中应用 AI 的相关经验。

染色质与基因调控的 AI 模型

Leslie 博士表示，表观遗传学大数据可用来解密染色质密码与基因调控的方式。他的实验室的研究是透过不同生理状态的 Hi-C、HiChiP 数据集来将 DNA 序列、启动子（promoters）和增强子（enhancer）活动与可存取数据整合至 AI/机器学习（AI/ML）模组，来预测基因表现。

研究人员透过交互式的 3D 基因体数据打造图神经网络 GraphReg，用来分析与找出人体调节因子的重要互动。GraphReg 之后被训练成只需透过一些属性就能预测到基因体的远距离互动，大大提升了基因模组的表现与功能性增强子的预测力。

经过细胞株数据的训练后，GraphReg 能在真实讯号与预知讯号的相关数据中表现优异，比只使用 1D 数据的基线定序模型来的有效。

GraphReg 被设计成 2 种模式：

Epi-GraphReg：使用 1D 数据与组织蛋白修饰（histone modification）生成神经网络，并搭配 HiChiP 图数据，来预测基因表现和与启动子、增强子的连结性。主要用于细胞种类未知的情况。
Seq-GrapgReg：将 DNA 定序数据输入卷积神经网络（Convolutional Neural Networks，CNN）或图神经网络，用来预测基因表现与表观遗传讯号。主要用于细胞种类特定的情况。

Leslie 博士的研究团队为了理解 AI 如何得出预测，观察机器学习模型如何辨识数据与预测基因表现。他们发现机器学习、表观遗传学、3D 基因体与基因编辑数据都能有效提升基因调节模组的效能。

医学影像判读准确度如何提升？

加州大学洛杉矶分校公共卫生学院 Joann Elmore 教授说到，癌症检测结果常常会因医师不同出现变化，人为因素容易影响癌症筛检精准度，而这与后续疗法、追踪、预防与筛检息息相关。他指出目前也没有影像判读的临床指引或程序能让放射科医师参考。这使得同张照片给不同人判读，就可能出现多种检测结果，使得该领域成为一门非常有难度的学问。

Elmore 博士提到，她曾经看过一个皮肤活体切片样本在不同人中得出 3 种诊断结果，且 2015 年的研究中也出现放射科医师对同一份乳癌切片做出多种截然不同的诊断结果。而 Elmore 博士现在正执行黑色素瘤病理研究，协助量化该肿瘤的皮肤切片诊断精准度与再现性。

她以 3 个专家得出的相同诊断结果为依据，比对超过 250 个放射科医师对 240 个样本的诊断结果。试验中，医师需把样本从症状轻到重分为等级 1 到等级 5，并间隔 6 个月后再判读一次。结果指出放射科医师在轻微、良性与侵袭性黑色素瘤的分类上与专家类似，但中间等级样本的判读出现歧异。

另外，受试者诊断 2 次后发现，在等级高与等级低的样本中，观察者一致性（intra-observer concordance）高，但却在中间等级表现薄弱。会出现这种情形可能源自于一些变异数，譬如患者年龄、是否取得健康照护和旁人意见等。Elmore 博士指出，未来 AI 训练应符合社会决定因素与临床变量，来协助诊断更精准。

她更点出，电脑辅助检测（computer-assisted detection, CAD）工具是生医影像分析的双面刃，可能强化或阻碍诊断结果。所以科学家需要在开发 AI 活体切片工具时谨慎注意训练资料是否偏颇，例如过往一致认同的诊断内容、医师与患者因诊断结果的互动、CAD 的机制都可能会让诊断出现伪阳性，致使患者经济负担增加。

AI 创新落地与生态系

Apricity Health 执行长 Lynda Chin 博士分享 AI 应用落地与打造生态体系的必要条件。他指出，单细胞基因体、DNA 定序、穿戴式装置取得的行为数据、社会决定因素（social determinant）都可作为精准医学的重要养分。精准医学最有效的时候就是结合数据驱动、AI 和科技应用时，另外精准医学也能用来整合临床数据、证据验证与即时决策等医疗照护数据。

Chin 博士指出，医疗照护体系中有许多不平等，而这些都可能阻碍 AI 应用的发展，此外也举出 AI 创新提升患者照护品质的方案。他提到，大数据的复杂度与数量将不断提升，人类需要思考思考新的方式去缩短临床试验与患者照护的应用差距。另外，科技能拓展医疗照护的范围，使患者在家中也可获得咨商与诊疗。但科学家应注意到，多种来源的的患者数据需要让医师依照看诊情境进行分析，才有办法对症下药，达到最好的结果。

Apricity 是 Apricity Health 开发的数位照护平台，使用 AI 技术提供癌症患者为核心的居家照护服务。目前，不少癌症已有核准的免疫疗法，但该疗法往往拥有高毒性与副作用，容易造成健康体系负担，也让患者承担一定的经济压力。Apricity 的平台可让患者在治疗中上传症状与相关数据，上传数据会与病历整合，协助医师找出临床资料，以及理解临床介入的时机需求，强化治疗效果。除此之外，算法也会在患者出现不良反应时，要求样本采检，捕捉疗程的即时数据与副作用，以提出临床决策建议。

Chin 博士指出，次世代癌症免疫疗法将结合 AI 即时整合数据与预测分析模型，让相关人员了解疾病演进与每个患者的不同反应。精准癌症照护将整合患者数据、AI、数位科技来降低临床试验与现实世界的结果差距，使健康照护更平等。

延伸阅读：T 细胞吃什么来抗癌？免疫检查点受体角色？—AACR 2021 精华

参考资料：
1. https://geneonline.news/en/embracing-artificial-intelligence-and-machine-learning-in-cancer-research-and-care/