Co hodnocení studie zhodnotilo
Studie zhodnotila výkon automatizovaného detekčního algoritmu založeného na hlubokém učení (DLAD) pro detekci plicních lézí na rentgenech hrudníku v reálném klinickém prostředí s nízkou prevalencí. Algoritmus byl srovnán se šesti radiology různých úrovní zkušeností pomocí retrospektivně shromážděných CXR z běžné nemocniční praxe, přičemž odborný konsensus byl považován za pravdu.
Výsledky studie v klinické praxi
V prostředí s velmi nízkou prevalencí onemocnění DLAD prokázal podstatně vyšší citlivost než všichni zúčastnění radiologové, což významně snížilo riziko přehlédnutí plicních lézí. Specificita byla nižší než u většiny radiologů, což vedlo k většímu počtu falešně pozitivních nálezů. V klinické praxi to podporuje DLAD jako nástroj zvyšující bezpečnost, který pomáhá jak juniorním, tak zkušeným radiologům detekovat vzácné, ale klinicky relevantní nálezy, zejména tam, kde je obtížné držet se ostražitosti vyplývající z prevalence.
Klíčová čísla
Analyzované CXR: 901
Prevalence plicních lézí: 2.3%
Citlivost DLAD: 90.5%
Rozsah citlivosti radiologů: 23.8–66.7%
Specificita DLAD: 89.3%
Rozsah specificity radiologů: 88.4–99.9%
Rapidní pokrok v oblasti umělé inteligence (AI) v medicínském zobrazování přinesl vzrušující vyhlídku na zlepšení diagnostické přesnosti a efektivity. Jednou z aktivních oblastí výzkumu je použití algoritmů pro automatickou detekci založených na hlubokém učení (DLAD) v chest r[x]-grafii, které ukázaly obrovský potenciál při identifikaci různých nálezů, jako je tuberkulóza nebo plicní léze. Nicméně, navzdory slibným výsledkům v kontrolovaných, vysoce prevalenčních simulovaných podmínkách typicky pozorovaných v výzkumných prostředích, existují obavy z použití těchto aplikací v reálném světě. Pro naši studii jsme shromáždili 956 snímků plicních rentgenových vyšetření (CXR) z každodenní klinické praxe v městské nemocnici. Dva hlavní čtenáři se přístupem k předchozím a následným vyšetřením pacienta dosáhli zaslepené shody pro 901 CXR, z nichž 21 bylo vizuálně potvrzeno, že obsahují jednu nebo více plicních lézí (prevalence: 2,3%) a 880 bylo zjištěno, že neobsahují žádné plicní léze. Šest radiologů různých odborností bylo požádáno o provedení retrospektivní analýzy těchto snímků. Následně byla výkonnost každého radiologa porovnána s referenční pravdou a navrhovaným DLAD (2.0.20-v2.01). Navrhovaný DLAD prokázal vyšší citlivost (Se 0.905 (0.715-0.978)) než kterýkoli z hodnocených radiologů (RAD 1 0.238 (0.103-0.448), p < 0.001, RAD 2 0.333 (0.170-0.544), p < 0.001, RAD 3 0.524 (0.324-0.717), p < 0.001, RAD 4 0.619 (0.410-0.794), p < 0.001, RAD 5 0.667 (0.456-0.83), p < 0.001, RAD 6 0.619 (0.41-0.794), p < 0.001), a rozdíl byl statisticky významný. Specificita DLAD (Sp 0.893 (0.871-0.912)) byla významně nižší než u pěti porovnávaných radiologů (RAD 1 0.999 (0.994-1), p < 0.001, RAD 2 0.933 (0.915-0.948), p < 0.001, RAD 4 0.968 (0.955-0.978), p < 0.001, RAD 5 0.991 (0.982-0.996), p < 0.001, RAD 6 0.989 (0.979-0.994), p < 0.001), s výjimkou jednoho, středně zkušeného radiologa, ale rozdíl nebyl statisticky významný (RAD 0.884 (0.861-0.904), p = 0.685). Výsledky této studie ukazují, že navrhovaný DLAD dosahuje vysoké úrovně citlivosti a relativně spolehlivé úrovně specificity, i když je aplikován v podmínkách s nízkou prevalencí v reálném světě. V důsledku toho může být navrhovaný DLAD považován za prospěšný jak pro juniorní, tak pro zkušenější radiology.





