Dana-Farber开发的新AI工具使用放射学报告识别癌症结果
波士顿 - 达纳法伯癌症研究所的科学家已经证明,人工智能工具可以像人类评论者一样 - 并且更快 - 从肺癌患者的非结构化放射学报告中提取有关肿瘤变化的临床信息。
人工智能工具与受过训练的人类“策展人”在检测癌症存在方面的表现相当;以及它是否对治疗干预做出反应,稳定或恶化。
该研究的目的是相应的作者,医学博士,公共卫生硕士,医学肿瘤学家和Dana-Faber人口科学系的教员,该研究的目的是确定人工智能工具是否可以从放射学中提取最高价值的癌症结果报告,这是一个无处不在但非结构化的数据源。
Kehl指出,电子健康记录现在收集了在像Dana-Farber这样的中心看到的数千名患者的大量信息。然而,除非患者参加临床试验,否则有关其结果的信息,例如他们的癌症是否因治疗而增长或缩小,仅记录在病历的文本中。从历史上看,这种非结构化信息不适用于计算分析,因此不能用于研究治疗的有效性。
由于Dana-Farber / Brigham和女性癌症中心的Profile计划分析了患者肿瘤样本,并创建了可以预测治疗反应性的基因组变异,Dana-Farber研究人员积累了大量关于患者的分子信息。 '癌症。“但是,如果不对患者的医疗记录进行深入检查以衡量其结果,可以很难应用这些信息来了解哪些分子模式可以预测治疗效果。这是实现精准医学全部潜力的关键障碍,”Kehl说。
对于目前的研究,Kehl及其同事为1,112名患者获得了超过14,000份成像报告,并使用“PRISSMM”框架手动审查记录。PRISSMM是Dana-Farber开发的一种物质数据标准,它从电子健康记录中的文本报告中获取非结构化数据并构建它们,以便可以轻松分析它们。PRISSMM构建有关患者病理学,放射学/成像,体征/症状,分子标记物和肿瘤内科医师评估的数据,以创建癌症患者旅程的肖像。
人类评论员分析了成像文本报告,并指出癌症是否存在,如果存在,是否正在恶化或改善,以及癌症是否已扩散到特定的身体部位。然后,这些报告用于训练计算“深度学习”模型,以从文本报告中识别这些结果。作者写道:“我们的假设是深度学习算法可以使用常规生成的放射学文本报告来确定癌症的存在及其随时间的变化程度。”
研究人员对人体和计算机测量结果进行了比较,如无病生存,无进展生存,改善或反应时间,并发现人工智能算法可以复制人类对这些结果的评估。然后应用深度学习算法为1,294名未经人工审查记录的患者注释另外15,000份报告。作者发现,这些患者的计算机结果测量结果可以预测人工评估中人工评估的准确性。
人类策展人能够为每小时约3名患者注释成像报告,一名策展人需要大约6个月的时间来为该队列中的患者注释所有近30,000份成像报告。研究人员在JAMA Oncology的一份报告中说,相比之下,研究人员开发的人工智能模型可以在大约10分钟内为该队列的成像报告注释。
“为了创建真正的肿瘤学习健康系统并促进大规模提供精准医学,需要采用一些方法来加速电子健康记录中癌症相关结果的治疗,”该出版物的作者说。如果得到广泛应用,研究人员表示,“这项技术可以大大加快使用来自所有癌症患者的真实数据的努力,以产生关于治疗方法有效性的证据。”接下来的步骤将包括在来自其他癌症中心的EHR数据上测试该方法,并使用该数据来发现哪些治疗对哪些患者最有效。