
Co studie hodnotila
Studie hodnotila Carebot AI MMG v rutinní kohortě mamografických vyšetření, kde byla většina vyšetření negativní a suspektní nálezy nálezy se vyskytovaly jen zřídka.
Celkem bylo posouzeno 338 po sobě jdoucích screeningových mamografických vyšetření z nemocnice AGEL Nový Jičín. Po vyloučení 29 neshodných případů bez konsenzu bylo do konečné analýzy zahrnuto 309 vyšetření. Referenční standard byl stanoven třemi seniorními radiology se specializací v mamografii s použitím kategorií v souladu s BI-RADS.
Byly hodnoceny dva předem definované cíle: detekce jakéhokoli ložiskového nálezu a identifikace suspektního vyšetření.
Výsledky studie v klinické praxi
Carebot AI MMG vykázal silnou shodu s konsenzem odborných radiologů při identifikaci mamografických vyšetření s ložiskovými nálezy. U detekce jakéhokoli ložiskového nálezu dosáhla AI senzitivity 0.895 a specificity 0.940, s vysokou negativní prediktivní hodnotou.
Při identifikaci suspektního vyšetření AI správně označila 7 z 8 suspektních případů, což vedlo k senzitivitě 0.875. Protože suspektní vyšetření byla v této kohortě vzácná, pozitivní prediktivní hodnota byla nízká, zatímco negativní prediktivní hodnota zůstala velmi vysoká, 0.996.
V praxi tyto výsledky podporují využívání výstupů AI o riziku jako nástrojů pro podporu rozhodování a prioritizaci, nikoli jako přímé potvrzení malignity. Zjištění také ukazují, proč by se prediktivní hodnoty měly uvádět ve screeningových kohortách reprezentativních z hlediska prevalence.
Klíčová čísla
Původní soubor: 338 screeningových mamografických vyšetření
Referenční standard: konsenzus 3 seniorních radiologů se specializací v mamografii
Prevalence suspektních nálezů: 2.6%
Cíl 1 - detekce jakéhokoli ložiskového nálezu: Se 0.895, Sp 0.940, BA 0.917, PPV 0.829, NPV 0.965
Cíl 2 - identifikace suspektního vyšetření: Se 0.875, Sp 0.857, BA 0.866, PPV 0.140, NPV 0.996
Abstrakt
Nástroje umělé inteligence pro mamografii mohou napomáhat při detekci lézí a stratifikaci rizika, jejich klinická hodnota však závisí na výkonu v podmínkách rutinního screeningu, kde je prevalence onemocnění nízká a převažují negativní nálezy. Tato retrospektivní studie diagnostické přesnosti hodnotila systém Carebot AI MMG na souběžných screeningových mamografických vyšetřeních pořízených v nemocnici AGEL v Novém Jičíně v lednu 2024. Referenční standard stanovili tři zkušení radiologové se specializací v mamografii pomocí konsensuálních kategorií v souladu s BI-RADS. Z 338 posuzovaných vyšetření se u 29 nepodařilo dosáhnout konsensu a byla vyloučena, k analýze bylo zahrnuto 309 vyšetření: 233 negativních, 68 benigních/pravděpodobně benigních a 8 suspektních. Byly hodnoceny dva předem definované koncové body. U detekce jakékoli léze s použitím středního nebo vysokého rizika jako AI-pozitivního dosáhla AI senzitivity 0,895, specificity 0,940, přesnosti 0,929, vyvážené přesnosti 0,917, PPV 0,829 a NPV 0,965. Pro identifikaci podezřelých nálezů s použitím vysokého rizika jako AI-pozitivního dosáhla AI senzitivity 0,875, specificity 0,857, přesnosti 0,858, vyvážené přesnosti 0,866, PPV 0,140 a NPV 0,996. Výsledky podporují použití Carebot AI MMG jako softwaru pro podporu rozhodování při stanovení priorit vyšetření a identifikaci studií, které mohou vyžadovat důkladnější přezkoumání. Studie také zdůrazňuje, že v kohortách s nízkou prevalencí by měly být AI-pozitivní výsledky interpretovány v kontextu pracovního postupu a potvrzeny radiology.



