Artikelen
Thema Artificiële intelligentie - Een paar klikken en de richtlijn is klaar (2023-08)
Artikel in PDF
E.J. Vlieger, W.A. van Enst
Disclaimer: Deze publicatie is tot stand gekomen zonder enige tussenkomst of bemoeienis van artificiële intelligentie (ChatGPT, Bard)
Richtlijnen spelen een cruciale rol bij het vertalen van de grote hoeveelheid heterogene onderzoeksresultaten naar praktische aanbevelingen. Door de adviezen uit de richtlijn te volgen, wordt de kwaliteit van zorg bevorderd en wordt ongewenste praktijkvariatie voorkomen. Echter, richtlijnen hebben ook enkele nadelen. Het duurt vaak te lang voordat nieuwe kennis een plek krijgt in richtlijnen, gemiddeld 8 jaar. [1] Bovendien worden niet altijd alle gewenste onderwerpen in een richtlijn besproken, wat te wijten is aan beperkte menselijke capaciteit en financiële middelen. Zou de komst van artificiële intelligentie deze beperkingen kunnen oplossen? Wij onderzoeken de potentiële toepassingen van artificiële intelligentie in richtlijnontwikkeling, evalueren de rol van AI-zorgtoepassingen in richtlijnen en bespreken de voordelen die artificiële intelligentie kan bieden aan dermatologen.
Wat is artificiële intelligentie?
Voordat we dieper ingaan op de rol van artificiële intelligentie bij richtlijnontwikkeling, is het belangrijk om een duidelijk beeld te hebben van wat artificiële intelligentie, oftewel kunstmatige intelligentie, precies inhoudt. Kunstmatige intelligentie verwijst naar het vermogen van computersystemen om taken uit te voeren die normaal gesproken menselijke intelligentie vereisen, zoals leren, redeneren, beslissingen nemen en problemen oplossen. In de ‘online’ wereld zijn er talloze gegevens beschikbaar. Naar schatting bedroeg de hoeveelheid gegevens in 2018 33 zettabyte, en dit zal naar verwachting groeien naar 175 zettabyte in 2025 (1 zettabyte is duizend miljard gigabyte). Met kunstmatige intelligentie kunnen
al deze gegevens worden geanalyseerd om antwoorden te verkrijgen op uiteenlopende vragen. Er zijn verschillende vormen van artificiële intelligentie. Een daarvan gericht op beeldherkenning, zoals bij dermale naevi in de dermatologie. Een andere vorm is gericht op natuurlijke taalverwerking, waarbij AI-systemen intelligente gesprekken kunnen voeren. Artificiële intelligentie heeft ook toepassingen in de muziek, emotieherkenning en nog veel meer. In dit artikel richten we ons op AI-systemen die gespecialiseerd zijn in natuurlijke taalverwerking voor richtlijnontwikkeling en bespreken we kort hoe ‘andere’ vormen van artificiële intelligentie in de klinische praktijk kunnen worden opgenomen via richtlijnen. praktijk, zowel vanuit het perspectief van zorgverleners als zorggebruikers. We spreken bij elk onderdeel de rol van AI.
De vragen in richtlijnen zijn meestal beperkt tot onderwerpen waarbij ongewenste praktijkvariatie optreedt. Ongewenste praktijkvariatie in de zorg verwijst naar situaties waarin er ongerechtvaardigde verschillen zijn in de manier waarop medische zorg wordt verleend aan patiënten met vergelijkbare gezondheidsproblemen. Deze variatie kan voorkomen op verschillende niveaus, zoals tussen regio’s, zorginstellingen, zorgverleners of zelfs binnen dezelfde instelling of praktijk. Artificiële intelligentie kan een grote en belangrijke rol spelen bij het signaleren van ongewenste praktijkvariatie door het analyseren van grote hoeveelheden zorgdata, zoals elektronische patiëntendossiers, richtlijnen en zorguitkomsten. Met behulp van geavanceerde algoritmen en machinaal leren kan artificiële intelligentie patronen en trends herkennen die kunnen wijzen op ongewenste praktijkvariatie. Het kan bijvoorbeeld afwijkingen in behandelingsbeslissingen detecteren, variaties in behandelingsresultaten identificeren of ongelijkheden in de toegang tot zorg aan het licht brengen. Het is echter belangrijk op te merken dat er nog geen construct is waarin een AI-toepassing alle patiëntgegevens kan doorzoeken en analyseren en dat dit waarschijnlijk ook voorlopig zo zal blijven.
Bij het uitvoeren van systematische reviews worden steeds meer programma’s ontwikkeld om het proces te ondersteunen of zelfs uit te voeren met behulp van AI-toepassingen. Met behulp van AI-ondersteunde natuurlijke taalverwerking kunnen grote hoeveelheden wetenschappelijke artikelen snel worden beoordeeld. Het is inmiddels duidelijk dat artificiële intelligentie uitstekend kan helpen bij het selecteren van artikelen op basis van abstracts. Complexe taken zoals het beoordelen van het bewijsniveau volgens GRADE zijn waarschijnlijk nog een uitdaging. Hieronder worden enkele bekende programma’s beschreven die het reviewproces ondersteunen:
• ASReview is een open-source softwaretool ontwikkeld door een onderzoeksteam van het UMC Utrecht, die is ontworpen om de screeningsfase van systematische reviews te versnellen. [2] Het maakt gebruik van machine learning-algoritmen, zoals actief leren, om relevante artikelen te prioriteren en te classificeren op basis van de screening van titels en abstracts. ASReview wordt veel gebruikt en heeft zijn effectiviteit bewezen in het verminderen van de screeningstijd met behoud van een hoge nauwkeurigheid. [3]
• RobotReviewer is een AI-tool die bepaalde aspecten van het systematische reviewproces automatiseert, zoals gegevensextractie en beoordeling van het risico op vertekening. Het maakt gebruik van natuurlijke taalverwerkingstechnieken om informatie uit volledige tekstartikelen te analyseren en te extraheren. RobotReviewer heeft als doel de tijd en moeite die nodig zijn voor systematische reviews te verminderen door arbeidsintensieve taken te automatiseren.
• SciLite is een browserextensie die het proces van literatuurbeoordeling verbetert door contextuele informatie te bieden voor wetenschappelijke artikelen. Het integreert bekende referentiebeheerprogramma’s, zoals PubMed en Google Scholar, en toont annotaties, citaten en gerelateerde artikelen naast het beoordeelde artikel. SciLite helpt onderzoekers snel de relevantie en betrouwbaarheid van artikelen te beoordelen.
Naast deze specifiek ontwikkelde programma’s lijkt ook ChatGPT het reviewproces te kunnen ondersteunen. Een onderzoeksgroep heeft ChatGPT ingezet om verschillende taken in het richtlijnproces over te nemen, met veelbelovende resultaten. [4] Het programma hielp bij het formuleren van gestructureerde reviewvragen, het opstellen van selectiecriteria en het formuleren van zoekstrategieën. ChatGPT kon ook codes genereren voor meta-analyses en verschillende programmeertalen gebruiken. Hoewel er nog enkele coderingsfouten waren die opgelost moesten worden door een gebruiker met methodologische expertise, toonde het experiment het potentieel van artificiële intelligentie bij richtlijnontwikkeling aan. Hoewel we nog niet op alle gebieden volledig zijn, zal het merendeel van het richtlijnwerk op relatief korte termijn kunnen worden ondersteund door AI-oplossingen. Voor dit artikel hebben we een experiment uitgevoerd waarbij we ChatGPT vroegen om een richtlijn voor de behandeling van actinische keratose op te stellen, inclusief het prioriteren van behandelingen, waaronder tirbanibuline. Het resultaat is redelijk, maar het AI-model verwarde tirbanibuline met Picato©, het medicijn dat in 2020 werd teruggeroepen vanwege het verhoogde risico op huidkanker. De gegenereerde richtlijn is toegevoegd als bijlage. Dit voorbeeld illustreert opnieuw het belang van deskundige beoordeling bij het uitbesteden van taken aan AI-programma’s, waarbij nauwkeurige controle van de resultaten vereist is.
Het spiegelen van de resultaten van het literatuuronderzoek aan de ervaringen van zorgverleners en zorggebruikers lijkt met name een taak te zijn die bij menselijke experts en ervaringsdeskundigen moet blijven liggen. Experts en ervaringsdeskundigen kunnen contextuele kennis, ervaring en ethische overwegingen toevoegen die moeilijk kunnen worden vastgelegd door artificiële intelligentie. Daarom is nauwe samenwerking tussen AI-systemen en menselijke richtlijnontwikkelaars noodzakelijk om de kwaliteit en relevantie van de richtlijnen te waarborgen. Door menselijke en AI-expertise te combineren, kunnen richtlijnen verrijkt worden met zowel wetenschappelijke nauwkeurigheid als menselijke waarden.
Zorgtoepassingen in richtlijnen
Naast de toepassing van artificiële intelligentie die richtlijnontwikkeling ondersteunen, zullen er ook steeds meer AI-toepassingen hun weg naar ziekenhuizen vinden, zoals beeldherkenningsalgoritmen. Het opnemen van dergelijke AI-toepassingen in richtlijnen vereist een gestandaardiseerde methode om de betrouwbaarheid van studieresultaten te evalueren. Momenteel wordt er gewerkt aan methoden om dergelijke studies te beoordelen.
Meten is weten
Het gebruik van artificiële intelligentie bij het uitvoeren van de systematische reviews die nodig zijn voor richtlijnen biedt aanzienlijke voordelen. Het kan de werklast van richtlijnontwikkelaars verminderen en tijd vrijmaken voor frequentere updates van richtlijnen en een groter aantal uitgangsvragen per richtlijn. Ook zullen AI-toepassingen zorgen voor een verhoogde precisie en reproduceerbaarheid van richtlijnen, aangezien artificiële intelligentie zeer nauwkeurig kan worden aangestuurd. Om de stap te zetten naar het daadwerkelijk vervangen van menselijke inzet door artificiële intelligentie zal dit eerst geëvalueerd moeten worden.
De NVDV overweegt om samen met Alii, een bedrijf dat zich inzet voor beschikbaar maken van medische kennis, een vergelijkend onderzoek uit te voeren, waarbij een werkgroep op traditionele wijze een richtlijn ontwikkelt, terwijl dezelfde vragen aan artificiële intelligentie worden voorgelegd. Dit onderzoek beoogt betrouwbare statistieken te genereren over de prestaties van artificiële intelligentie in vergelijking met menselijke richtlijnontwikkelaars op verschillende onderdelen van het richtlijn proces. In het vergelijkend onderzoek worden dan in ieder geval de volgende taken vergeleken tussen de AI en de werkgroep:
• In- en exclusie op basis van abstract.
• In- en exclusie op basis van full text.
• Extractie van bevindingen.
• Koppelen van de bevindingen aan de uitgangsvragen.
• Beoordelen van risk of bias per artike.l
• GRADE: beoordelen van de body of evidence.
• Het formuleren van conclusies, overwegingen en aanbevelingen.
Alii en de NVDV werken momenteel al samen in het ontsluiten van dermatologische kennis.
Betekenis voor de toekomst
Wanneer een groot deel van het reviewproces sneller gaat en minder inspanningen van een onderzoeker vraagt, dan is de vraag hoe het landschap van richtlijnontwikkeling zal of moet veranderen. Een richtlijn wordt nu nog elke vijf jaar herzien. Indien de frequentie toeneemt, naar jaarlijks of nog korter, dan moet er heel kritisch gekeken worden naar de mogelijkheden om resultaten in de praktijk te kunnen implementeren. Idealiter is de richtlijn dan direct gekoppeld aan het EPD en is de richtlijn voor elke dermatoloog op deze wijze direct beschikbaar. Ook moeten de afgeleide producten, zoals patiënteninformatie en keuzehulpen, niet vergeten worden en meer frequent herzien worden.
Gepersonaliseerde geneeskunde, oftewel personalized medicine, is al geruime tijd een onderwerp van discussie. Dit omvat het aanpassen van zorg aan de individuele kenmerken van patiënten, zoals genetische opmaak, om op maat gemaakte preventie, diagnose en behandeling te bieden. Mogelijk dat dit met artificiële intelligentie een rol kan krijgen in richtlijnen, zodat wetenschappelijk gevalideerde aanbevelingen kunnen worden geformuleerd voor diverse variabele patiëntkenmerken. Dit onderdeel van zorg zal pas echt een vlucht nemen, als artificiële intelligentie wel kan worden ingezet om in alle patiëntendata te kunnen kijken, maar zoals eerder geschreven heeft dat nogal wat voeten in de aarde op gebied van privacywetgeving en samenwerking.
Tot slot kan gevraagd worden welke taken arts-onderzoekers en andere richtlijnontwikkelaars krijgen, wanneer een belangrijk deel van hun werk bij de NVDV wordt uitgevoerd door artificiële intelligentie. Naar schatting van de Europarlementaire Think Tank, zullen 14% van de banen in westerse landen geautomatiseerd kunnen worden en 32% kunnen aanzienlijke veranderingen ondergaan. [4] Het takenpakket zal ongetwijfeld in de toekomst gaan veranderen. Zaken die nu nog onderbelicht worden, kunnen dan mogelijk meer aandacht krijgen. Te denken valt aan een brede inventarisatie van patiëntvoorkeuren, uitvoerige kostenanalyse, of ontwikkeling van meer implementatieproducten.
Conclusie
Artificiële intelligentie kan potentieel bijdragen aan de richtlijnontwikkeling in de dermatologie. Artificiële intelligentie kan helpen bij het signaleren van ongewenste praktijkvariatie, het versnellen van systematische reviews, en het ondersteunen van het richtlijnproces. Het gebruik van artificiële intelligentie kan de werklast verminderen, de nauwkeurigheid en reproduceerbaarheid vergroten, en frequentere updates van richtlijnen mogelijk maken. Echter, samenwerking tussen AI-systemen en menselijke experts is noodzakelijk om de kwaliteit en relevantie van richtlijnen te waarborgen. Hoewel AI-toepassingen veelbelovend zijn, zijn er nog uitdagingen en ethische overwegingen die moeten worden aangepakt.
Literatuur
1. Grant J, Cottrell R, Cluzeau F, Fawcett G. Evaluating “payback” on biomedical research from papers cited in clinical guidelines: applied bibliometric study. BMJ. 2000 Apr 22;320(7242):1107-11. doi: 10.1136/bmj.320.7242.1107. PMID: 10775218; PMCID: PMC27352.
2. van de Schoot R, Bruin JD, Schram R, et al. An open source machine learning framework for efficient and transparent systematic reviews. Nat Mach Intell. 2021. DOI: 10.1038/s42256-020-00287-7
3. Ferdinands G, Schram R, de Bruin J, et al. Performance of active learning models of screening prioritization in systemic reviews; a simulation study into the average time to discover relevant records. Syst Rev. 2023; 12: 100
4. Qureshi R, Shaughnessy D, Gill KAR, et al. Are ChatGPT and large language models “the answer” to bringing us closer to systematic review automation? Syst Rev. 2023 Apr 29;12(1):72. doi: 10.1186/s13643-023-02243-z. PMID: 37120563; PMCID: PMC10148473.
5. European Parliament (EP) Think Tank. Opportunities of Artificial Intelligence. (2020). Geraadpleegd via https://www.europarl.europa.eu/RegData/etudes/STUD/2020/652713/IPOL_STU(2020)652713_EN.pdf.
Correspondentieadres
Annefloor van Enst
E-mail: a.vanenst@nvdv.nl