据消息,美国国立卫生研究院(NIH)最近发表一个庞大的胸部 X 光数据库,现在已公开近 10,600 张电脑断层扫描(Computed Tomography,简称 CT)图像,以支援医疗人工智能算法的开发和测试。
这个大型成像数据库称为 DeepLesion,是由美国国立卫生研究院的 Ronald Summers 及同事创建。他们标记了机构放射科医生临床相关的 CT 扫描结果。
Summers 是 NIH 影像生物标记和电脑辅助诊断实验室的高级研究员和放射学家。
根据美国国立卫生研究院的说法,这些标记通常很复杂,包括描述病变大小和位置的箭头、线条、分割和文本,以便让临床医生监测疾病变化。标记医学图像需要广泛的临床经验,且耗费大量时间。
实际上,缺乏可用于训练 AI 算法的大型医学图像数据库,一直被认为是 AI 技术寻求突破的主要障碍。Summers 及同事的努力就是为了改变这种状况,至少在 X 光方面。去年他们发表了 ChestX-ray8 数据库,包含 10 万张 X 光图像。
DeepLesion 透过够强大的 CT 扫描数据库和附带标记来训练深度神经网络,进而帮助绕过这些障碍。美国国立卫生研究院建议,有朝一日可以“使科学界创建具统一框架的大规模通用病变检测器”。
据了解,数据库包括来自马里兰州贝塞斯达 NIH 临床中心 4,400 多名患者的大约 10,600 项研究。虽然目前大多数数据库包含 10 至数百个单一类型的病变,但该组设计的 DeepLesion 可容纳超过 32,000 个病灶,涵盖各种放射学发现,如肺结节、淋巴结肿大和肝肿瘤。
有了多范畴的病变数据库,DeepLesion 为研究人员提供了开发人工智能算法的机会,能自动检测和诊断多种病变类型。美国国立卫生研究院指出,未来还可能发展成一个通用病变检测器,可用作初始筛选工具,并将结果发送到其他更专业的算法。此外,研究人员可能可在同一次 CT 扫描中研究不同类型病变之间的关系,进而全面评估癌症负担。
为了开始展示这种潜力,Summers 及同事用 DeepLesion 数据库训练一个典型的通用病变检测器,以发现各种病变。他们的探测器灵敏度达到 81.1%,每个图像有 5 个假阳性。
据了解,研究人员计划继续向 DeepLesion 添加图像,以提高检测器的准确性,他们希望将 MRI 扫描包含到数据库,并结合未来多家医院的数据。研究小组认为,除病变检测外,数据库还能帮助训练算法分类病变,并根据现有模式预测病变的发展。
(本文由 雷锋网 授权转载;首图来源:NIH)