Steeds vaker spookbronnen in wetenschappelijke artikelen door gebruik AI

NOS Nieuws•vandaag, 11:15

Indy Scholtens

redacteur Online

Indy Scholtens

redacteur Online

Het komt steeds vaker voor: citaten die “gehallucineerd” zijn door het gebruik van kunstmatige intelligentie (AI), en dus niet bestaan. Uit onderzoek(opent in nieuw venster) van de Groene Amsterdammer blijkt ook de Nederlandse wetenschap niet immuun te zijn tegen dergelijke “spookcitaten”.

In februari bleek al bij onderzoek(opent in nieuw venster) van het wetenschappelijk blad Nature dat minstens 10.000 publicaties uit 2025 door AI verzonnen academische verwijzingen bevatten. Volgens de Groene Amsterdammer hebben in de afgelopen drie jaar ook honderden aan Nederlandse universiteiten verbonden wetenschappers artikelen gepubliceerd met spookreferenties.

Het tijdschrift onderzocht samen met de Data School van de Universiteit Utrecht ruim 100.000 publicaties in wetenschappelijke tijdschriften. Daarbij vonden ze dat het percentage artikelen met spookreferenties in drie jaar tijd is verzevenvoudigd: bevatte in 2023 nog een op de 1400 artikelen een spookreferentie, dat was in de eerste maanden van 2026 een op de 200.

In totaal vond de Groene in 208 gepeerreviewde artikelen ruim 748 verwijzingen naar wetenschappelijke onderzoeken die niet bestaan.

AI voor referentielijsten

“Iedereen schrok heel erg van wat ze hoorden en probeerden het onmiddellijk recht te zetten bij de journals”, vertelt Yannick van der Heijden, een van de journalisten die meewerkte aan het onderzoek. “Vaak hoorden we als reden toch een stukje slordigheid.”

De journalisten besloten niet alle wetenschappers bij naam te noemen, maar benaderden hen wel. De wetenschappers zeiden dat zij met behulp van AI de alfabetische volgorde of stijl van hun referentielijst wilden aanpassen. Daarbij zouden hallucinaties zijn ontstaan.

In andere gevallen ging het om wetenschappers die via AI aanvullende bronnen wilden verkrijgen die hun hypotheses of stellingen bevestigden. Daarbij controleerden ze niet zorgvuldig of die gesuggereerde referenties ook daadwerkelijk bestonden.

Sneeuwbaleffect

Het gevaar van nepreferenties, vertelt Van Der Heijden, is dat die een sneeuwbaleffect kunnen opleveren, als een niet-bestaand artikel dat een chatbot verzint meerdere keren wordt geciteerd. De onderzoekers zagen hoe een enkele nepreferentie “een eigen leven” begon te leiden.

“We kwamen bijvoorbeeld een onderzoek tegen over de behandeling van hersenkanker, waarbij een bepaalde behandeling werd onderbouwd door bestaande en niet-bestaande bronnen.” De consensus die dan wordt gesuggereerd is gebaseerd is op een broze basis. “Een verkeerd beeld van de bestaande literatuur kan serieuze consequenties hebben”, aldus Van Der Heijden.

Niet controleren op referenties

Onder meer wetenschappers van de Wageningen Universiteit en het Rotterdamse Erasmus MC hebben artikelen gepubliceerd met spookreferenties, blijkt uit het onderzoek.

De Wageningen Universiteit zegt tegen de NOS geschrokken te zijn van het nieuws. Een woordvoerder laat weten dat de universiteit “niet inhoudelijk” kan ingaan op vragen, omdat de universiteit niet weet om welke artikelen het gaat. De universiteit noemt het onderzoek een “belangrijk signaal”. “We gaan intern kijken of controlemechanismen aangescherpt moeten worden.” Het Erasmus MC is gevraagd om een reactie.

Al langer onder druk

De klassieke controle die moet plaatsvinden, de peer review waarbij een artikel door andere wetenschappelijke collega’s wordt nagekeken, kan lang duren en wordt volgens sommige wetenschappers niet altijd even nauwkeurig nageleefd.

De fouten in de citaties zijn dan ook niet nieuw in de academische wereld, zegt Mohammad Hosseini, die onderzoekethiek en -integriteit bestudeert aan Northwestern University, in de Groene. Ook voor de komst van generatieve AI waren volgens Hosseini al onnauwkeurigheden in citaties.

Zo zouden sommige wetenschappers niet even secuur zijn in het lezen van de artikelen die ze citeren, waardoor deze niet altijd aansluiten bij de bewering. Of nemen ze claims over zonder de bron te controleren.

Volgens Hosseini is dat deels te wijten aan de publicatiedruk onder wetenschappers. Hoe meer een wetenschapper namelijk publiceert en wordt geciteerd, hoe groter de kans is op bepaalde functies of beurzen, stelt hij.

Nieuwe richtlijn

Sommige uitgeverijen ontwikkelen nu detectiesystemen om AI te herkennen. Ook hebben de tijdschriften Springer Nature en Elsevier hun integriteitsteams uitgebreid, zeggen ze tegen de Groene Amsterdammer. Volgens Elsevier zijn “de ’traditionele controlemechanismen’ niet meer genoeg”.

Dat beaamt ook Bert Seghers, voorzitter van Enrio, het Europese samenwerkingsverband voor wetenschappelijke integriteit. Seghers werkt aan een nieuwe globale rapporteringsstandaard over AI in de wetenschap, die volgens hem hoog nodig zijn, gezien er geen gemeenschappelijke richtlijnen zijn.

“Referenties zijn maar een stuk van de vraag. Dit is nog een van de dingen die we kunnen zien: een gehallucineerde referentie van AI kan je gewoon opzoeken en zien dat die niet bestaat”, zegt Seghers tegen de NOS. “Maar als het al kan gebeuren met referenties, wat kan dat ons vertellen over de inhoud van papers die we niet kunnen checken?”

“Het is dan ook cruciaal dat wetenschappers transparant zijn over hoe ze AI gebruikt hebben, en hoe ze op AI toezicht houden, bijvoorbeeld hoe ze output geverifieerd hebben.”