De detectie van meetbare restziekte (MRD) is bij patiënten met acute myeloïde leukemie belangrijk voor klinische beslismomenten. De analyse van flowcytometrische MRD-bepalingen vereist echter de nodige expertise en vaardigheid. Onderzoeker dr. Costa Bachas (Amsterdam UMC) werkt aan de inzet van kunstmatige intelligentie om dit proces verder te objectiveren en standaardiseren.
De detectie van meetbare restziekte (MRD) – de proportie van resterende leukemiecellen ten opzichte van de andere witte bloedcellen in een beenmergbiopt – geeft aan hoe groot het risico is op een recidief voor patiënten met acute myeloïde leukemie (AML) die in remissie zijn na inductietherapie. “In de context van inductie-chemotherapie is MRD-bepaling een gevalideerde methode die relevant is voor klinische beslismomenten. Aan de hand daarvan wordt bepaald of intensivering van de volgende therapie nodig is”, vertelt Costa Bachas. Ook in andere contexten zijn er toepassingen voor de MRD-bepaling, zoals bij nieuwe doelgerichte therapieën of bij stamceltransplanties om het graft-versus-leukemie-effect te bepalen, maar deze vergen nog verder onderzoek en validatie.
Omdat het gaat om de detectie van heel zeldzame cellen, zijn zeer gevoelige technieken nodig. MRD kan bepaald worden met moleculaire sequencingtechnieken, die uitgaan van indirecte detectie van leukemiecellen door mutaties te detecteren, of met flowcytometrie, door direct leukemiecellen te identificeren op basis van specifieke biologische kenmerken. Bachas: “Daarmee kijken we naar de expressie van eiwitten op het celoppervlak die niet passen bij een normale myeloïde cel, ofwel leukemie-geassocieerde immunofenotypes.”
Heterogeniteit
Het punt bij AML is dat de ziekte zeer heterogeen is, zowel qua genetische als qua biologische kenmerken en qua klinische aspecten, zegt Bachas. “Voor flowcytometrie is de uitdaging dat er heel veel verschillende combinaties kunnen zijn van die leukemie-geassocieerde immunofenotypes, dus veel verschillende eiwitexpressiepatronen. Vlak na inductietherapie kunnen dat soort patronen ook ontstaan door het regenereren van hematopoëse, en zie je soms aspecifieke effecten. Dus het vergt heel veel training en expertise om die leukemie-geassocieerde patronen te herkennen.”
In centra die een beperkt aantal MRD-bepalingen per jaar doen kunnen grote verschillen in uitslagen ontstaan wanneer verschillende mensen de flowcytometriedata analyseren. “Die interobservervariabiliteit kan een beslissing van de ene naar de andere kant duwen, en verstrekkende gevolgen hebben voor de verdere behandeling.”
Objectiever
De inzet van kunstmatige intelligentie (AI) zou kunnen helpen om in ieder geval het analysedeel objectiever te maken en MRD-bepalingen overal op een gestandaardiseerde manier uit te kunnen voeren, zodat de resultaten altijd betrouwbaar zijn, denkt Bachas. “Dat maakt de bepaling minder afhankelijk van de persoonlijke expertise. Ook snelheid en kosten zijn belangrijke aspecten. De analyse door een expert kan wel 30-45 minuten per sample kosten, en dan moet er nog een tweede expert naar kijken volgens ons vier-ogensysteem. Bovendien is de bepaling zoals we die nu doen niet 100% accuraat in grotere patiëntengroepen. Met objectievere methodes, en ook met nieuwe flowcytometrietechnieken die meer parameters kunnen meten, kunnen we daar mogelijk verbetering in aanbrengen.”
Leren wat normaal is
De toepassing van AI voor de detectie van MRD kent echter nog wel wat uitdagingen, vertelt Bachas. “Omdat er zoveel verschillende leukemie-geassocieerde immunofenotypes zijn, zouden heel grote datasets nodig zijn om al die leukemie-eigenschappen te leren aan een algoritme. Vervolgens zijn nog meer onafhankelijke datasets nodig om het algoritme te valideren. Bovendien gaat het om zeldzame cellen, en moeten per sample veel cellen geanalyseerd worden om die paar leukemische cellen te kunnen detecteren. De digitale verwerking daarvan vergt een grote rekenkracht waar niet alle algoritmes mee om kunnen gaan. Bestaande AI-methodes nemen een willekeurig sample uit de data van 10.000 tot maximaal 100.000 cellen en proberen daar een voorspelling op te doen. Maar dat gaat ten koste van de gevoeligheid.”1
Samen met promovendus Tim Mocking en andere collega’s koos Bachas voor een andere benadering: een methode waarmee ze een algoritme leren wat een niet-afwijkend beenmergbeeld is. “We leren het algoritme wat gezond is, met mogelijk nog wat effecten van regeneratie erin. Als het algoritme dat weet, zijn er veel minder trainingsdata nodig en kun je vervolgens makkelijk bepalen wat waarschijnlijk niet normaal is, en daarmee ook waarschijnlijker leukemisch. Deze methode noemen ze ook wel novelty detection. Het komt erop neer dat we een algoritme leren wat normaal is, en vervolgens tegen die referentieset voor elke cel in onze samples bepalen of ze een leukemiecel zijn of een normale cel. Daarmee kunnen we de MRD-bepaling zoals experts dat doen nabootsen.”2
Vergelijking met handmatige analyse
De onderzoekers valideerden de door hen ontwikkelde methode op data van de HOVON132-studie.3 Daarbij bekeken ze ook hoe deze computationele detectie van leukemiecellen zich verhoudt tot de handmatige analyse. “Dat hebben we gedaan door te kijken naar de uitkomstassociaties, oftewel: hoe goed is de methode in het voorspellen van het risico op een recidief? We hoopten dat de uitkomstassociaties net zo goed zouden zijn als met de handmatige analyse, maar deze bleken met de computationele analyse zelfs iets sterker te zijn.” De individuele analyses kwamen in ruim 80% van de gevallen overeen, maar er waren ook discrepanties: soms werd iets door de computer als leukemiecel geclassificeerd wat handmatig misschien over het hoofd was gezien, en vice versa. “Dat zijn we nu aan het uitdiepen”, zegt Bachas.
Het algoritme geeft bovendien snel een uitslag, gemiddeld in ongeveer drie seconden. “De versterking van de uitkomstassociaties geeft hoop voor de toekomst. Met externe validatie hopen we te bevestigen dat dit een objectieve en snelle methode is die minstens zo goed kan werken als de handmatige analyse.”
Volledig uitlegbaar
Training en een zekere mate van expertise zullen nodig blijven. In gevallen waarin de kans dat iets classificeert als een leukemiecel laag is, zal er nog een expert naar moeten kijken. “Maar we hebben onze methode specifiek ontwikkeld met het doel om dit ook werkelijk te kunnen implementeren”, benadrukt Bachas. Daarom kozen ze voor een benadering die terugvalt op statistische modellen, waarbij op elk niveau teruggekeken kan worden waarom iets geclassificeerd is als leukemie. “Een kracht van onze methode is dat het volledig uitlegbaar is. De resultaten zijn echt te verklaren.”
Omdat gekozen is voor de novelty detection-methode, zijn minder trainingsdata nodig en kan de methode ook makkelijker geïmplementeerd worden in ziekenhuizen of landen waar minder AML-patiënten gezien worden. Ook artsen die andere assays gebruiken, met andere combinaties van oppervlakte-eiwitten, kunnen relatief makkelijk een training volgen en de methode valideren op hun eigen data. “Dit willen we samen met partners in andere ziekenhuizen en andere landen gaan doen om te laten zien dat het ook met die eiwitcombinaties werkt.”
AI kan helpen om de MRD-bepaling nog verder te standaardiseren, iets waar door het European Leukemia Network al veel tijd en moeite in is gestopt. “Een zo zuiver mogelijk resultaat krijgen is belangrijk voor de klinische beslissing. Dit is een volgende stap in dat proces om de bepaling nog verder te objectiveren en te standaardiseren, en de uitslag niet afhankelijk te laten zijn van subjectieve interpretaties.”
Referenties
1. Mocking TR, et al. Hemasphere 2025;9:e70138.
2. Mocking TR, et al. Commun Med (Lond) 2024;4(1):271.
3. Mocking TR, et al. Leukemia 2025 Sep 3. doi: 10.1038/s41375-025-02747-8.
Dr. Astrid Danen, wetenschapsjournalist
Oncologie Up-to-date 2025 vol 16 nummer 5