
Co studie hodnotila
Studie hodnotila, zda Carebot AI MMG dokáže dosáhnout diagnostického výkonu na úrovni vyšetření srovnatelného s radiology prsu při 2D digitální mamografii s plným polem.
Celkem bylo ze čtyř center na Slovensku a v České republice shromážděno 4 729 rutinních screeningových vyšetření. Pro primární analýzu byla použita pevně stanovená analytická podmnožina 222 vyšetření, včetně 48 histologicky potvrzených maligních případů a 174 nemaligních případů.
Šest radiologů prsu a software AI nezávisle klasifikovali anonymizovaná mamografická vyšetření. Výkon byl hodnocen ve dvou předem definovaných provozních bodech: vysoká senzitivita pro vylučovací použití a vysoká specificita pro potvrzovací použití.
Výsledky studie v klinické praxi
Carebot AI MMG dosáhl diagnostického výkonu srovnatelného s referenční hodnotou radiologů v obou provozních režimech. Nastavení s vysokou senzitivitou upřednostňovalo detekci rakoviny a dosáhlo senzitivity 0,875 s NPV 0,957. Nastavení s vysokou specificitou zvýšilo specificitu na 0,839 při zachování senzitivity 0,833 a NPV 0,948.
V obou nastaveních vyvážená přesnost splnila předem stanovenou hranici non-inferiority ve srovnání s referenční hodnotou radiologů. To podporuje potenciální využití Carebot AI MMG jako softwaru pro podporu rozhodování v mamografických pracovních postupech s konfigurovatelnými provozními body, které lze sladit s místními prioritami pro detekci rakoviny, řízení recallů nebo podporu pracovní zátěže.
Protože analytická podmnožina byla obohacena o maligní případy, PPV a NPV je třeba vnímat jako popisné hodnoty pro tento soubor dat studie, nikoli jako přímé hodnoty populačního screeningu.
Klíčová čísla
Počáteční soubor dat: 4 729 screeningových mamografických vyšetření
Maligní případy: 48 histologicky potvrzených nádorů
Nemaligní případy: 174 vyšetření
Centra: 4 centra na Slovensku a v České republice
Režim vysoké senzitivity: Se 0,875, Sp 0,770, BA 0,823, NPV 0,957
Režim vysoké specificity: Se 0,833, Sp 0,839, BA 0,836, NPV 0,948
BA benchmarku radiologů: 0,828 v HSe a 0,823 v HSp
Hranice non-inferiority: δBA = 0,05, splněna v obou provozních režimech
Abstrakt
Interpretace mamografických vyšetření je ovlivněna variabilitou mezi hodnotiteli, která může ovlivnit rozhodování o recallu a péči o pacientky. Tato multicentrická retrospektivní diagnostická studie přesnosti s více hodnotiteli hodnotila systém Carebot AI MMG na 2D digitální celopolní mamografii a porovnávala jeho samostatný výkon s výkonem šesti mamografických radiologů. Z 4 729 rutinních screeningových vyšetření získaných ve čtyřech centrech na Slovensku a v České republice byl analyzován pevně stanovený analytický soubor 222 vyšetření, včetně 48 histologicky potvrzených maligních případů a 174 nemaligních případů. Šest radiologů a software s umělou inteligencí nezávisle klasifikovali anonymizované mamogramy, zaslepeni vůči klinickým informacím a referenčnímu standardu. Výkon byl hodnocen ve dvou předem definovaných provozních bodech: vysoká senzitivita a vysoká specificita. V provozním bodě s vysokou senzitivitou dosáhla AI senzitivity 0,875, specificity 0,770 a vyvážené přesnosti 0,823, ve srovnání s referenční vyváženou přesností radiologů 0,828. V provozním bodě s vysokou specificitou dosáhla AI senzitivity 0,833, specificity 0,839 a vyvážené přesnosti 0,836, ve srovnání s referenční hodnotou radiologů 0,823. Negativní prediktivní hodnota v obou nastaveních přesáhla 0,94. Výsledky podporují nevýkonnostní výkon systému Carebot AI MMG na úrovni vyšetření ve srovnání s referenční úrovní radiologů v multicentrickém souboru případů. Studie podporuje AI jako klinicky relevantní software pro podporu rozhodování v mamografii s provozními body, které lze přizpůsobit místním prioritám pro detekci karcinomu a management recallu.




