In een retrospectief onderzoek zijn de prestaties van AI-systemen vergeleken met die van radiologen die het Prostate Imaging-Reporting and Data System versie 2.1 (PI-RADS) gebruiken voor het detecteren van klinisch significante prostaatkanker op MRI. De resultaten voor wat AI op dit gebied kan bieden, zijn veelbelovend. Prospectief onderzoek moet nu duidelijk maken welke gevolgen dit kan hebben voor de klinische praktijk, stellen dr. Maarten de Rooij (radioloog en onderzoeker, Radboudumc, Nijmegen) en prof. dr. Henkjan Huisman (universitair hoofddocent medical AI, Radboudumc).
Het feit dat medische beelden bij uitstek geschikt zijn voor het trainen van algoritmen, verklaart waarom veel AI-onderzoek in de zorg betrekking heeft op radiologie. “Ook specifiek met betrekking tot prostaatkanker gebeurt al wel wat, maar bij onderzoeken op dit specifieke gebied is wel sprake van beperkte datasets”, zegt Maarten de Rooij. Dat is in het nu verrichte onderzoek zeker niet het geval, want in deze internationale studie is een dataset van meer dan 10.000 MRI-scans gebruikt voor het trainen en valideren van een AI-systeem voor het detecteren van klinisch significante prostaattumoren.1
“Deze studie is op twee onderdelen uniek”, vertelt De Rooij. “In de eerste plaats omdat we het zo open mogelijk hebben gehouden. We hebben naar aanleiding van de verzamelde MRI-beelden in een grand challenge tegen AI-ontwikkelaars gezegd: kijk hoe je hieruit het beste AI-algoritme kunt vinden voor het opsporen van prostaatkanker. Daaruit is een top vijf gekomen van algoritmen die zijn getraind op nog meer data en die uiteindelijk zijn samengevoegd tot een soort superalgoritme. Parallel aan deze AI-tak van ons onderzoek hebben we 62 radiologen wereldwijd – die ervaring hebben met het lezen van prostaat-MRI-beelden met behulp van PI-RADS – in een multireader, multicase waarnemersonderzoek dezelfde 400 MRI-scans laten beoordelen als dat samengestelde model. We hebben dus én de data publiek beschikbaar gesteld om een zo goed mogelijk algoritme te trainen én een vergelijking met de beoordeling door radiologen gemaakt. Dat was nog niet eerder gedaan.”
Veelbelovend
De uitkomst was dat het AI-systeem gemiddeld superieur was aan de beoordeling door de radiologen die PI-RADS gebruikten bij het detecteren van klinisch significante prostaatkanker. “We zagen dat het samengestelde model beter is in het vinden van de tumor op de MRI-beelden dan de radioloog”, zegt De Rooij. “En bovendien specifieker, dus met minder fout-positieve uitspraken.”
Interessante en veelbelovende uitkomsten uiteraard, maar wel bewijs op niveau 2b dat het ontwikkelde AI-systeem statistisch superieur is aan de bevindingen van de groep van 62 radiologen en vergelijkbaar nauwkeurig wanneer wordt vergeleken met de oorspronkelijke beoordelingen uit de klinische praktijk. “De beperking is uiteraard dat dit bevindingen uit een retrospectieve studie zijn”, zegt De Rooij. “De logische stap nu is een prospectieve studie, om te bepalen wat de waarde is van toepassing van het AI-systeem in de klinische setting. Dat is de enige manier om echt te kunnen bepalen hoe het systeem zich verhoudt tot de beoordeling van de radioloog.”
Twee projecten
Henkjan Huisman: “In samenwerking met UMC Groningen gaan we op dit gebied twee projecten doen. Eén met ons model en één met een bestaand model van Siemens Healthineers. Op basis hiervan kunnen we prospectief gaan vaststellen hoe goed ons model is.”
Een belangrijke vergelijking, stelt De Rooij. Maar het uiteindelijke doel van het voorgenomen prospectieve onderzoek reikt verder. “Dat is namelijk om twee vragen beantwoord te krijgen”, zegt hij. “De eerste is: wat gebeurt er als je het algoritme in de praktijk gaat gebruiken? Wat doet de radioloog dan? Vertrouwt hij het? Wat betekent het voor de workflow en eventuele tijdsbesparing? De tweede is: hoe ver kun je gaan in het gebruik van algoritmen? Het AI-systeem heeft nu bewezen als assistent te kunnen worden gebruikt. Maar het is heel interessant in de toekomst de vervolgstap te zetten en te kijken of eenvoudige situaties zelfstandig door AI kunnen worden beoordeeld. Dat is een heel spannend speelveld, want de huidige medische wetgeving is daar niet op ingericht. De radioloog moet altijd zijn beoordeling geven over de uitkomst van het algoritme. Als dat voor eenvoudige cases niet meer hoeft of het AI-systeem zet alles nauwkeurig klaar, kan dit het werk versnellen.”
Versnelling van het werk als doel
Zo ver is het dus nog lang niet “Maar het is wel de context waarin de resultaten van ons onderzoek moeten worden gezien”, zegt De Rooij. “Die resultaten zijn veelbelovend, maar moeten nu dus prospectief worden bewezen. En het is wel zaak dat we dit doen, want de verlaging van de werkdruk waarover ik het had, bereiken we als radiologen pas als we de beoordeling van de eenvoudige cases inderdaad volledig aan AI kunnen overlaten. Radiologen kunnen zich dan op meer complexe cases richten en op hun rol als diagnostisch consultant binnen het ziekenhuis. Gelet op de toestroom aan onderzoeken en het beperkte aantal radiologen is dát waar het uiteindelijk om gaat.” Vanuit andere disciplines binnen de radiologie zijn er al aanwijzingen dat dit mogelijk kan zijn. Bijvoorbeeld voor het bepalen van de botleeftijd op handröntgenfoto’s. “Dat gebeurt al jaren automatisch. Maar de prostaat is veel complexer. Je kijkt niet alleen naar of er wel of niet een tumor is, maar ook naar structuren rondom de prostaat, en je probeert een verklaring voor de verhoogde PSA-waarde te vinden.”
Ook Huisman ziet het belang van de vervolgstap die De Rooij zo essentieel vindt. “Je hoort steeds vaker de roep om het efficiënter maken van de zorg”, zegt hij. “Daarbij wordt dan gezegd dat AI hierin een rol kan spelen. Maar wees gewaarschuwd: zo ver is AI op dit moment nog helemaal niet. Dit vraagt nadrukkelijk om objectieve, betrouwbare maten om mee te meten. En die zouden we heel graag willen hebben, maar die hebben we nog niet.”
Proces dat jaren vergt
Vooralsnog heeft MRI het prostaatonderzoek al ingrijpend veranderd. “Het biedt een hoge nauwkeurigheid en het leidt daarmee tot veel minder biopten en onnodige behandelingen”, zegt De Rooij. “Het heeft heel veel voordelen gebracht, met als keerzijde dat veel meer onderzoeken worden aangevraagd. Het vergt veel ervaring om die MRI-scans goed te kunnen beoordelen. Er zijn zeker radiologen die dit kunnen. En radiologen die in hun beoordeling van beelden niet onderdoen voor AI, dat is een belangrijke kanttekening. Maar AI kan wel minder ervaren radiologen helpen nauwkeuriger te worden.”
En uiteindelijk moet het dus méér kunnen, is zijn stelling. “Al verwacht ik dat het eerder tien dan vijf jaar gaat duren voordat we zover zijn dat AI daadwerkelijk zelfstandige beoordelingen kan doen”, zegt hij. “In reactie op ons onderzoek hoorde ik van sommige collega’s echter ook nu al de reactie: ‘Ben je niet je eigen beroepsgroep aan het vernietigen?’. Daar ben ik niet zo bang voor. Ook niet als het eenmaal zo ver is dat het prospectief onderzoek het bewijs heeft geleverd waarnaar we nu op zoek zijn en als de juridische vraagstukken zijn opgelost die zelfstandige beoordeling door AI nu nog onmogelijk maken. De radioloog is namelijk opgeleid om de beschikbare informatie goed in de klinische context te kunnen plaatsen, daar is AI vooralsnog niet klaar voor.”
Patiënten staan overigens nu veelal al positief tegenover de mogelijkheden die AI in de radiologie kan bieden. “Bijna 80% van de patiënten ziet de meerwaarde als AI de radioloog helpt”, zegt De Rooij afsluitend.
Referentie
1. Saha A, et al. Lancet Oncol 2024;25:879-87.
Drs. Frank van Wijck, wetenschapsjournalist
Oncologie Up-to-date 2024 vol 15 nummer 5