普瑞纯证

外媒 | 乳腺X光深度学习模型存在泛化能力差的风险-普瑞纯证

乳腺X光深度学习模型存在泛化能力差的风险

最近发表在JAMA Network Open上的一项研究发现,先前验证的高性能深度学习(DL)模型集合用于自动乳腺X光解读,在美国多样化患者人群中的泛化能力不足,并且在某些亚组中表现下降。该研究指出,由于缺乏经验丰富的乳腺放射科医师,乳腺X光筛查计划已经转向人工智能(AI)工具,以提高乳腺癌筛查的诊断准确性和效率。然而,为了有效使用这些工具,必须进行外部验证,以展示它们在不同患者群体和不同实践环境中的表现。本研究旨在外部验证一个这样的工具,即一个集成学习模型,该模型结合了数字乳腺X光对话反向工程评估和方法(DREAM)乳腺X光挑战赛中的11个最高性能的个体AI模型。DREAM挑战赛是乳腺X光AI开发中最大的众包努力之一,利用了来自Kaiser Permanente Washington(KPW)的144,231个乳腺X光筛查图像进行算法训练和内部验证。在这个队列中,该模型与放射科医师评估相结合,可以提高总体诊断准确性。当该模型在瑞典Karolinska Institute(KI)的队列上进行外部验证时,其表现类似。然而,研究作者指出,KPW和KI队列都主要由白人女性组成,并且该模型尚未在更多样化的美国人群中进行外部验证。因此,研究人员利用2010年至2020年收集的26,817名40岁及以上女性的回顾性患者数据进行验证。这些女性接受了37,317次常规乳腺筛查检查,并参加了加州大学洛杉矶分校(UCLA)的Athena乳腺健康网络。为了评估DREAM挑战赛集成方法(CEM)的表现,研究人员将其表现与筛查时原始放射科医师的读片表现以及CEM和放射科医师组合(CEM + R)的表现进行比较。为了衡量表现,他们关注了敏感性、特异性和受试者工作特征曲线下面积(AUROC)。为了生成其输出,CEM模型利用置信度得分进行预测。

版权声明 本网站所有注明“来源:普瑞纯证”或“来源:pureFDA”的文字、图片和音视频资料,版权均属于普瑞纯证网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:普瑞纯证”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。