AI-hallucinaties

AI-hallucinaties in papers AI-conferenties ontmaskerd met AI

Sinds de komst van Artificial Intelligence(AI) weten we dat naast positieve kanten ook evident negatieve bestaan. Dat betreft zogenaamde hallucinaties. Daarbij gaat het om een uitingen van de AI-tool die niet gerechtvaardigd lijkt door de werkelijkheid of de trainingsgegevens waarop de tool getraind werd. Het leidt soms tot zotte dingen. Een zeer recent voorbeeld daarvan is de toespraak van de Belgische rector van de universiteit van Gent, Petra de Sutter. Die haalde in een toespraak een citaat aan van Albert Einstein, die deze nooit geuit heeft. De toespraak was deels met AI gegenereerd. Op de website van het online tech-magazine The Register stond op 22 januari 2026 een zeer interessant artikel over een flink aantal hallucinaties, in de vorm van niet bestaande verwijzingen, in papers die auteurs naar AI-conferenties stuurden. Een bedrijf uit New York dat een AI-tool maakte om hallucinaties op te sporen publiceerde die bevindingen recent.

GTPZero

De tool waar het om gaat noemen de makers GTPZero. Die spoort AI-gegenereerde tekst op met eigenschappen die het bedrijf “perplexiteit” en “burstiness” noemt om te proberen te bepalen of een passage door AI is gegenereerd. Het gaat om wat ingewikkelde begrippen. Volgens het bedrijf is perplexiteit de mate waarin de tekst in een zin willekeurig is. En of de manier waarop de zin is opgebouwd ongewoon of “verrassend” is voor de toepassing. Teksten met taal die chaotischer of onbekend is voor taalmodellen—oftewel die het model waarschijnlijk zullen “verwarren”—worden als meer door mensen geschreven beschouwd. Daarentegen vergelijkt burstiness zinnen met elkaar, waarmee ze hun gelijkenis bepalen. Menselijke tekst is meer discontinu, wat betekent dat mensen meestal met meer zinsvariatie schrijven dan AI. Hieronder een beoordeling van een stuk tekst op mijn website dat over AI-ging.

AI-hallucinaties

Fake literatuurverwijzingen

Met GTPZero ontdekten de makers bij twee conferenties over AI behoorlijk wat AI-hallucinaties in ingezonden papers. Het ging dan om niet bestaande literatuurverwijzingen. Men vond 100 hallucinaties in meer dan 51 papers die geaccepteerd waren voor de Conference on Neural Information Processing Systems (NeurIPS). Daarnaast vond GTPZero dat tenminste 50 ingezonden papers minstens één hallucinatie bevatten in de literatuurverwijzingen van ingezonden stukken van de prestigieuze International Conference on Learning Representations (ICLR).

Zorgelijk

De hier boven genoemde casuïstiek geeft aan dat men tekst in de breedste zin des woords alert moet zijn op door AI gegenereerde onzin. Het betekent dat je niet volledig op AI kunt vertrouwen en op onverwachte plekken geconfronteerd kan worden met totale onzin. Soms is het in één oogopslag duidelijk zoals bijv door AI-gegenereerde plaatsje waarop mensen opeens handen met vijf vingers hebben. Bij tekst blijkt het dus naast het hebben van vakkennis op het gebied waarover de tekst gaat ook verstand moet hebben van de nukken en grillen van AI.

Fout positieven

Dat de GTPZero-tool helemaal feilloos werkt kan ook niet voor 100 procent gezegd worden. The Washington Post merkte in augustus 2023 op dat GPTZero soms last heeft van vals-positieven. De krant benadrukte dat zelfs een klein vals-positieven-foutpercentage betekent dat sommige studenten/wetenschappers ten onrechte beschuldigd kunnen worden van (academisch) wangedrag. Zo is er ook het aparte fenomeen dat de Amerikaanse grondwet door een AI-check-tool bestempeld werd als waarschijnlijk door AI-gegenereerd. Naar ik lees is GTPZero de laatste twee jaar verder vervolmaakt. In september 2025 vergeleek Business Insider het hulpmiddel met zeven andere AI-detectietools en noemde GPTZero de “beste gratis AI-detector.”

Ook bij rechtszaken

Ook in stukken die bij rechtszaken ingediend worden blijkt er sprake van hallucinaties in naar de rechterlijke instanties gezonden teksten. Er bestaat een website die wereldwijd bij houdt of er hallucinaties bij rechterlijke procedures speelden. De Fransman Damien Charlotin houdt het op zijn website bij en komt nu tot 853 gevallen.

Nu moet men niet denken dat zoiets niet in Nederland voorkomt. Damien heeft er vijf op zijn website staan. Allemaal uit 2024 en 2025. De meest recente gaat om een zaak waarover de rechtbank op 19 november 2025 duidelijk maakte dat er door ChatGTP gefabriceerde, niet bestaande, jurisprudentie speelde.

Conclusie

Het gebruik van AI-tools om hallucinaties van AI op te sporen heeft iets weg van wat in protestantse kringen het “de duivel uitdrijven met Beëlzebub” heet . Dat berust op een tekst uit het Nieuwe Testament, en wel Mattheüs 12 vers 24. Toch kan een tool als GTPZero licht werpen op onzinteksten in al dan niet met AI-gegenereerde teksten. Op welk gebied dan ook.

 W.J. Jongejan, 28 januari 2026

Afbeelding van Alexandra_Koch via Pixabay

0 antwoorden

Plaats een Reactie

Meepraten?
Draag gerust bij!

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.