Co studie hodnotila
Studie se zaměřila na hodnocení denzity prsní tkáně na mamografických snímcích, která patří mezi důležité rizikové faktory vzniku rakoviny prsu. Toto hodnocení provádějí radiologové vizuálně podle kategorií BI-RADS, přičemž mezi jednotlivými lékaři často dochází k rozdílům. Cílem studie bylo ověřit, zda dokáže AI systém automaticky a spolehlivě určovat denzitu prsu na úrovni srovnatelné s odborným hodnocením radiologů.
Výsledky studie v praxi
AI algoritmus dosáhl přesnosti srovnatelné s radiology a v několika případech jejich výsledky dokonce překonal. Zároveň vykazoval vyšší konzistenci hodnocení, tedy menší variabilitu mezi jednotlivými snímky. V klinické praxi to znamená možnost sjednocení hodnocení denzity prsu, snížení subjektivity a přesnější podpory odhadu rizika v rámci screeningových programů.
Klíčová čísla
Přesnost AI: 82 %
Míra shody s radiology (Cohenovo κ): 0,71
Výkon AI: srovnatelný nebo vyšší než u jednotlivých radiologů
Hodnocení denzity prsní tkáně na mamografických snímcích, která představuje klíčový ukazatel rizika vzniku karcinomu prsu, je tradičně prováděno radiology na základě vizuálního posouzení mamografií s využitím kategorií denzity podle systému Breast Imaging-Reporting and Data System (BI-RADS). Tento přístup je však zatížen významnou mezihodnotitelskou variabilitou, což vede k nekonzistencím a potenciálním nepřesnostem v hodnocení denzity a následných odhadech rizika. Za účelem řešení tohoto problému představujeme automatický detekční algoritmus založený na hlubokém učení (DLAD), určený pro automatizované hodnocení denzity prsní tkáně. Multicentrická studie s více hodnotiteli využívala heterogenní datový soubor 122 plně digitálních mamografických vyšetření (488 snímků v projekcích CC a MLO) pocházejících ze tří zdravotnických institucí. Dva zkušení radiologové provedli retrospektivní analýzu a stanovili referenční „ground truth“ pro 72 mamografických studií (BI-RADS A: 18, BI-RADS B: 43, BI-RADS C: 7, BI-RADS D: 4). Následně byla účinnost algoritmu DLAD porovnána s výkonem pěti nezávislých radiologů s různou úrovní zkušeností. Algoritmus DLAD dosáhl stabilního diagnostického výkonu s přesností 0,819 (95% CI: 0,736–0,903), hodnotou F1 skóre 0,798 (0,594–0,905), přesností (precision) 0,806 (0,596–0,896), citlivostí (recall) 0,830 (0,650–0,946) a Cohenovým koeficientem kappa (κ) 0,708 (0,562–0,841). Výkon algoritmu byl srovnatelný s individuálním hodnocením radiologů a ve čtyřech případech jej dokonce překonal. Statistická analýza neprokázala významný rozdíl v přesnosti mezi algoritmem DLAD a radiology, což potvrzuje vysokou míru shody diagnostického výkonu modelu s odborným hodnocením radiologů. Výsledky studie ukazují, že automatický detekční algoritmus založený na hlubokém učení může zvýšit přesnost a konzistenci hodnocení denzity prsní tkáně a představuje spolehlivý nástroj pro zlepšení výsledků mamografického screeningu karcinomu prsu. Kvak, D., Biroš, M., Hrubý, R., Dandár, J., Janů, E., & Atakhanova, A. (2024). Human-Level Computer-Aided Approach for BI-RADS Breast Density Classification: Multi-Reader, Multi-Centric Study. European Congress of Radiology 2024, Vídeň.





