01 文献速递介绍
本文讨论了人工智能(AI)如何将医学影像转化为可挖掘的高通量数据,并强调了机器学习算法在病变检测、目标分割、疾病诊断和预后预测中的应用,这些算法显著推动了精准医学和临床决策支持。近年来,包括应用AI的超声研究在内的相关文章数量急剧增加。鉴于超声与其他成像方式的独特属性,包括实时扫描、操作者依赖性和多模态特性,读者在评估依赖超声AI的研究时应特别注意。本综述为读者提供了一个针对性的指南,涵盖了评估超声AI研究的关键点,以识别强大和不足的研究。 引言 AI通过分析肉眼难以直接观察到的像素,将医学影像带入了大数据时代。近几年,使用传统机器学习(ML)算法和深度学习(特别是卷积神经网络CNN)的文章数量显著增加。研究报告显示,AI在X射线、计算机断层扫描(CT)、磁共振成像(MRI)、超声等扫描类型中的应用,在疾病检测、特征描述和患者预后预测方面优于传统方法。 目标:临床场景是否明确定义? 医学影像AI研究的目标应遵循两个原则:首先,必须源于临床实践需求;其次,必须适用于AI技术。例如,非增强超声被推荐用于监测高风险肝癌人群,因此它可以作为风险分层工具。理想情况下,非增强超声AI工具将提高肝病变的检测率并协助风险评估。 材料和方法:是否有独立的测试数据集? AI模型容易过拟合。在使用训练集训练模型后,必须在验证集中调整其超参数以提高泛化能力。一旦模型确定,其性能必须在测试集中进行评估,测试集不能与训练或验证集重叠。理想情况下,测试集来自其他中心,涉及不同超声设备和供应商的数据,以及具有不同人口特征的患者。 材料和方法:图像处理过程是否清晰描述? 清晰描述图像处理过程对于评估研究的可重复性和可再现性至关重要。应关注超声数据采集过程和数据范围的有效性。在获取此类信息时,应提出以下问题:数据是回顾性还是前瞻性收集的?研究应用了哪种模态?是否涉及射频信号、灰度、弹性成像、多普勒成像、对比增强超声(CEUS)或模态间转换?
**材料和方法:建模算法是否合适?**传统的ML算法(如逻辑回归、支持向量机(SVM)、随机森林和朴素贝叶斯)的参数远少于深度学习算法。例如,SVM只有13个参数需要调整,而ResNet-50有约2.3×10^7个参数。因此,传统ML算法需要的训练远少于深度学习算法。在有限的样本量情况下,例如只有几百幅图像的数据集,更倾向于使用传统ML算法。然而,对于成千上万幅图像的数据集,建议使用深度学习算法,
尤其是在成像分析中的CNN。 材料和方法:AI算法是否公开可用? 即使在给定研究中的不同数据集中具有普遍适用性,特别是在单一中心进行的研究,AI性能仍需广泛验证。目前公开的医学影像数据集非常有限,没有公开的超声数据集。鼓励作者通过GitHub等网站公开其AI模型,以允许独立验证、微调和更新。 结果:AI模型产生的结果与专家放射科医生的结果如何比较? 医学AI必须与放射科专家的性能进行比较。将AI性能测试程序的设计与现实世界条件下的人类专家性能进行比较,可以确定前瞻性设计AI性能测试程序的价值。在回顾性设计的研究中,不可避免地会在临床实践中收集的数据集中出现缺失数据和目标病变数据不匹配的情况。
**结果:评估指标是否合适?**对于检测和分类目的,AI模型首先通过接收者操作特征曲线(ROC)或精确度-召回曲线(PRC)进行评估,进一步通过其准确度、错误率或F1值进行评估。然而,在医学影像分析程序中,性能是基于临床意义指标来评估的,例如用于诊断和预测程序的敏感性和特异性、用于疾病筛查和病变检测的检测率、用于放射治疗规划中的注释者间一致性和重叠的κ和dice系数。 讨论:结果是否与最新研究报告相比较? AI结果应与最新研究报告进行比较,包括相同设计的先前研究以及使用其他成像方式、传统方法或指南推荐的研究。应记住,没有独立测试或仅内部验证的结果与报告独立测试结果的研究不可比较,无论其统计数据相对于最新结果如何。 讨论:目前工作的未解决问题是什么? 医学AI研究的局限性通常是未来工作的挑战。例如,考虑到AI性能错误和失败案例可能影响临床实践决策,AI系统在什么情况下不会被实施?鉴于硬件要求、算法版本、数据质量和处理程序,AI系统普遍适用于其他中心和人群的潜在因素是什么?这些问题如何在后续研究中解决?样本量是否足够大以构建一个稳健的模型?应评估训练数据集大小与模型性能之间的关系。 Title 题目 Articles That Use ArtificialIntelligence for Ultrasound:A Reader’s Guide
使用人工智能进行超声检查的文章:读者指南 Abstract-Background 摘要 Artificial intelligence (AI) transforms medical images into high-throughput mineable data.Machine learning algorithms, which can be designed for modeling for lesion detection,target segmentation, disease diagnosis, and prognosis prediction, have markedlypromoted precision medicine for clinical decision support. There has been a dramaticincrease in the number of articles, including articles on ultrasound with AI, published in onlya few years. Given the unique properties of ultrasound that differentiate it from otherimaging modalities, including real-time scanning, operator-dependence, and multimodality, readers should pay additional attention to assessing studies that rely onultrasound AI. This review offers the readers a targeted guide covering critical pointsthat can be used to identify strong and underpowered ultrasound AI studies.
人工智能(AI)将医学影像转化为高通量可挖掘的数据。机器学习算法,可用于病灶检测、目标分割、疾病诊断和预后预测的建模,已显著促进了临床决策支持的精准医疗。在短短几年内,包括应用AI的超声文章在内的文献数量急剧增加。鉴于超声独特的属性,它与其他成像方式不同,包括实时扫描、操作者依赖性和多模态性,读者在评估依赖超声AI的研究时应额外注意。本综述为读者提供了一个针对性的指南,涵盖了可用于识别强大和能力不足的超声AI研究的关键点。 Conclusions 结论 Given ultrasound’s unique properties, readers should pay additionalattention when assessing an AI study that relies on ultrasound thanthose that rely on other imaging modalities. Here, we list severalcrucial points to help readers distinguish strong ultrasound AIarticles from underpowered articles. With more formalizedstandards for medical AI studies published in the future,ultrasound AI studies may better benefit the clinical practice.
鉴于超声的独特属性,读者在评估依赖超声的AI研究时,应比评估依赖其他成像方式的研究更加细致。在这里,我们列出了几个关键点,以帮助读者区分强大的超声AI文章和能力不足的文章。随着未来更加规范化的医学AI研究标准的发布,超声AI研究可能会更好地惠及临床实践。