Wat weet ChatGPT over jou? Zo werkt AI met jouw gegevens
In dit artikel:
AI-expert David Graus (UvA) onderzocht samen met journaliste Marieke Duchatteau welke informatie grote taalmodellen over mensen kunnen ophalen. Het onderzoek bestond uit een simpele proef: eerst vroeg Graus het model zonder internettoegang iets over Duchatteau; vervolgens gaf hij toestemming om online te zoeken en voegde context toe (dat zij journalist is). Het resultaat: zonder live zoeken kende het model haar niet, met zoeken kwam er wel een herkenbaar, maar ongelijkmatig profiel boven water — bedrijfsnaam, publicaties en een vermoedelijke woonplaats.
Graus gebruikt hiermee het onderscheid tussen twee soorten “kennis”: de interne patronen die een model tijdens training opbouwt (geen losse feitjes maar statistische verbanden in enorme tekstmassa’s) en de externe, actuele informatie die een model kan ophalen via zoekfuncties. Zonder zoektoegang produceert een model antwoorden op basis van waarschijnlijkheden; met zoektoegang verzamelt en vat het de meest vindbare onlinebronnen samen. Dat verklaart ook waarom sommige relevante input — zoals tientallen artikelen van Duchatteau — niet automatisch naar voren kwam: niet alles op internet is even vindbaar. Robots.txt, crawler-beperkingen, zoekmachinepositie en zelfs technische details zoals de plek van een item in een lijst bepalen sterk of informatie wordt meegenomen.
Graus waarschuwt dat de indruk dat een model iemand “kent” misleidend is: taalmodellen voorspellen woordenpatronen, ze hebben geen begrip. In de vakwereld heet dat soms een “stochastic parrot”: een papegaai die plausibele tekst herhaalt zonder echte kennis. Toch kunnen die voorspellingen overtuigend persoonlijk overkomen omdat mensen relatief voorspelbaar zijn.
Over privacy en opslag: één zoekactie wordt doorgaans niet toegevoegd aan het basismodel, omdat hertraining extreem kostbaar is. Wel bestaan functies binnen accounts die gesprekken onthouden; dat is iets anders dan structurele wijziging van het getrainde model. Als je later zelf informatie online zet die zoekmachines oppikken, kan die wel in antwoorden terugkomen. Juridisch biedt Europa het “recht om vergeten te worden”, maar hoe dat precies werkt bij AI-systemen moet zich nog uitkristalliseren via rechtszaken. Praktisch advies blijft daarom: wees zuinig met wat je online zet en gebruik opt-outmogelijkheden waar mogelijk.
De conclusie van Duchatteau en Graus: ChatGPT en soortgelijke modellen combineren en voorspellen op basis van beschikbare data, maar kennen je niet echt. Voor gedetailleerde, betrouwbare persoonsinformatie is ouderwets googelen — of gewoon een persoonlijk gesprek — vaak effectiever dan blind vertrouwen op een taalmodel.