近日,瑞典研究团队发表在《刺胳针‧肿瘤》期刊的前列腺癌 AI 辅助诊断研究论文正式公布。
科研人员发现,AI 能准确从活检体测出前列腺癌,进而加快诊断速度并降低医疗资源成本。
目前,全球各地前列腺活检人数增加与泌尿病理学家短缺,为病理科带来巨大压力。此外,前列腺癌的高变异性也导致高频率出现过度治疗和治疗不足两种情况。
为了缓解问题,瑞典研究团队开发具临床可接受准确性的人工智能系统,用于前列腺癌侦测、定位和格里森分级(Gleason,受广泛采用的前列腺癌组织学分级制)。
据论文介绍,AI 系统可接受训练以检出前列腺穿刺活检样本的癌症并分级,在部分数据集的特定问题诊断表现优秀。
研究指出,人工智能技术可透过减少评估良性活检体,并透过自动化测量癌症长度阳性活组织检查核心,以及提供第二种意见,减轻肿瘤学家的工作量。
重要医学 AI 成果
瑞典卡罗林斯卡学院医学流行病学系副教授 Martin Eklund 表示:“我们的 AI 工具可某种程度减少泌尿科病理学家的工作量,使他们专注最困难的病例。”
2012 年 5 月至 2014 年 12 月基于瑞典前瞻性和人群的 STHLM3 诊断研究,瑞典研究团队从 976 名随机年龄在 50~69 岁的参与者,数字化 6,682 张针核活检切片,并从 93 名研究外的男性数字化 271 张切片。
随后影像用来训练评估前列腺活检的深层神经网络。
透过预测来自 STHLM3 的 246 名男性 1,631 例活检,以及来自 73 名男性 330 例活检的外部验证数据集,独立测试数据集的恶性组织存在、程度和 Gleason 分级评估这些网络。此外,还评估国际泌尿病理学会 23 名经验丰富的泌尿病理学家对 87 例活检的分级表现。透过受试者的工作特征和肿瘤范围预测,将预测的肿瘤长度与报告的病理学家测量值相关联,评估认证效能,并使用 Cohen’s kappa 量化 AI 系统和泌尿病理学专家的评分一致性。
结果是 AI 在接收器工作特徴曲线下获得一个区域,在 0.997(95% CI 0·994~0·999)下可区分独立测试数据集的良性(n = 910)和恶性(n = 721)活检核心和外部验证数据集的 0.986(0.972~0.996)(良性 n = 108,恶性 n = 222)。
由 AI 预测并由报告病理学家指定癌症长度的相关性,对独立测试数据集为 0.96(95% CI 0.95~0.97),对独立测试数据集为 0.87(0.84~0.90)。外部验证数据集对 Gleason 等级,AI 平均成对 kappa 为 0.62,这在专家病理学家的相应值范围内(0.60~0.73)。
瑞典团队介绍,从上述数据可看出,用 AI 系统侦测和分级前列腺穿刺活检样品的癌症,在部分场合等级可与前列腺病理学专家相媲美。
临床应用可透过减少评估良性活组织检查,以及自动化在阳性活检核心中测量癌症长度的工作来减少病理学工作量。具专家级评分效能的 AI 系统可能会产生第二种辅助决策意见,有助标准化评分,并在世界部分地区提供病理学专业知识。
此研究也是近期继 Google 乳腺癌 AI 论文之后,学术界发表的第二篇重要医学 AI 成果。
1 月 2 日,Google Health 联合多间机构在《Nature》发表一篇论文,介绍新型深度学习标靶影像系统。据 Google 说法,此系统与之前模型相比,有效减少乳腺癌错误辨识或遗漏,将乳腺癌侦测的假阳性率降低 5.7%,假阴性率也降低 9.4%,并号称击败了 6 名放射科医生。
Google 对成果过于夸大的公关措辞,引来图灵奖得主 Yann Lecun 及中美多位学者在社交媒体炮轰。
(本文由 雷锋网 授权转载;首图来源:卡罗林斯卡学院)
延伸阅读:
- 研究:AI 诊断脑癌,表现跟真人医师一样准确
- Google AI 超聪明,筛检乳癌准确度超越人类专家