最近,吴恩达的斯坦福团队发布了一个X光诊断算法,基于深度神经网络。
与曾经的肺炎检测专门算法不同,这次的CheXNeXt模型,可以诊断14种疾病,包括肺炎、胸腔积液、肺肿块等等。
在其中10种疾病的诊断上,AI都与人类放射科医生的表现相当,还有一种超过了人类。并且,AI的诊断速度是人类的160倍。
团队说,这样的算法有希望填补医疗资源的短缺,也可以用来减少人类医生因为疲劳而导致的诊断错误。
AI医生如何炼成
最大的数据集
算法是用ChestX-ray14数据集来训练的,这是目前最大的X光数据库,有超过11万张正面胸片,来自3万多位患者。
14,就代表这些胸片里,总共包含了14种肺部疾病。
每一张胸片都要标注,是根据医生的放射学报告,用自动提取 (Automatic Extaction) 的方法来标注的。
训练过程分两步
算法是由多个神经网络集合而成。
第一步,由于是自动标注,所以要解决标签部分不正确 (Partially Incorrect) 的问题。
具体方法是,先让这些神经网络,在数据集里训练14种疾病的预测。然后用它们做出的预测,来重新标注数据集。
第二步,再拿一个新的神经网络集合,在新标注的数据集上训练。这次训练完成,AI就可以去诊断疾病了。
那么,AI预测过程中的重点在哪里?
图上有重点
算法不需要任何额外的监督,就可以用胸片来生成热图 (Heat Map) ,相当于划重点:
颜色越暖的部分,对疾病诊断越有价值。
这是依靠类激活图 (Class Activation Mapping,CAM) 来完成的。
如此一来,AI就像人类一样,知道诊断某种疾病的时候,哪里才是该重点关注的部分。
人机大赛
训练好之后,团队找了9个人类放射科医生来比赛。其中:
6位来自学术机构,平均经验超过12年。
3位来自医院,是放射科高级住院医师。
人类和AI要识别的,是420张正面胸片,也是包含14种疾病:
肺不张,心脏肥大,巩固,水肿,积液,肺气肿,纤维化,疝气,浸润,肿块,结节,胸膜增厚,肺炎,气胸。
比赛结果如下:
只有在心脏肥大,肺气肿和疝气这三项诊断中,AI明显不敌人类选手的准确度。
在肺不张的诊断中,AI的表现明显优于人类。
其他10项,人类与AI不相上下。
总体来说,算法的诊断能力与与放射科医生相近。
所以,还是看一下速度吧。
420张图,AI用时1.5分钟,人类用时240分钟。
吴恩达老师常年追求的“AI颠覆医疗”之说,还是在时间上体现最显著。
One More Thing
随研究成果一同发布的视频里,有一个叫XRay4All的手机应用,只要给胸片拍个照,就可以让AI帮忙诊断了。
不知那会是多远的未来,但这次的人机较量,AI的表现还是能看到希望的。
论文传送门:
https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1002686
“