Nieuwsmedia leveren archieven aan GPT-NL, vergoeding voor freelance journalisten nog onduidelijk

Interview met Saskia Lensink (Product-Manager GPT-NL) en Jesse van Oort (Lead data acquisitie GPT-NL)

16 april 2026

GPT-NL bouwt een taalmodel dat het Nederlandse alternatief moet worden voor de taalmodellen van Amerikaanse bedrijven als Meta, OpenAI, Google en Antrhopic, die gebouwd zijn op geroofd auteursrechtelijk beschermd werk. Het Ministerie van Economische Zaken gaf 13,5 miljoen euro subsidie om te komen tot een transparant, eerlijk en toetsbaar gebruik van artificiële intelligentie.

De leden van NDP Nieuwsmedia stelden bijna alle artikelen van de afgelopen twintig jaar uit hun archieven beschikbaar, met uitzondering van die van de laatste zes maanden. De afspraak is dat GPT-NL geen nieuws gaat genereren en dus geen concurrent wordt van nieuwsmedia. De nieuwsmedia die meedoen krijgen hier nu nog geen geld voor, maar als GPT-NL winst gaat maken, delen ze in de opbrengsten. Hoe gaan (freelance) journalisten hier iets van terugzien? Dat is op dit moment niet bekend bij de Auteursbond en de NJV. Een goede reden om met de makers van GPT-NL in gesprek te gaan.

Wanneer wordt jullie taalmodel in gebruik genomen?

‘De bèta-versie is net af, dat wil zeggen de proefversie die we nu willen uitproberen met tien van onze klanten, zowel uit de publieke als de private sector. Daarna kunnen we het model evalueren. De bredere uitrol van het taalmodel zal pas in de zomer van 2026 plaatsvinden.’

Wat zijn voorbeelden van gebruikte datasets?

‘We hebben datasets van Nederlandse instellingen gebruikt, zoals van de Koninklijke Bibliotheek, het Utrechts Archief en WikiWijs. Data waar geen copyright (meer) op rust. We publiceren de datasets die we hebben gebruikt op Hugging Face. We willen transparant zijn over de gebruikte datasets en die publiek maken.’

Zitten daar ook vertalingen bij?

‘Ja, we hebben niet alleen Nederlandstalige teksten gebruikt, maar ook Engelstalige, code, en een aantal bronnen in andere Germaanse talen, zoals Duits en Deens. Daarbovenop hebben we een aantal vertalingen gebruikt, we hebben onder meer Wikidata en YouTubeCommons data vertaald.’

Waarom is het taalmodel van GPT-NL straks alleen beschikbaar voor de overheid en het bedrijfsleven? Dit taalmodel is toch met publiek geld gemaakt? Schrijvers/journalisten dragen er nu zelfs aan bij zonder er een vergoeding voor te hebben gekregen. Zou niet iedereen gebruik moeten mogen maken van dit taalmodel?

‘Er zijn Europese, open source, alternatieven beschikbaar die gebruikmaken van dezelfde publieke datasets. Wij hebben gekozen voor een betaald licentiemodel en dat heeft meerdere redenen. Ten eerste zijn we ervan overtuigd dat er een eerlijke dataketen moet komen. Auteursrechthebbenden moeten worden gecompenseerd voor de data die worden gebruikt voor de training van ons taalmodel. Data zijn heel veel geld waard. We hebben nu niet de middelen om de volledige afbetaling van datasets te realiseren. We kiezen er nu voor om een deel van het geld dat we verdienen aan het zakelijk gebruik van GTP-NL terug te laten vloeien naar de eigenaren van de data. Ten tweede vinden we het belangrijk dat het model dat we maken duurzaam is voor de toekomst.’

Maar als meer mensen GPT-NL gebruiken en ze er ook voor betalen, vloeit er toch juist ook meer geld terug naar de data-eigenaren? Nu hebben journalisten wel gratis data geleverd, maar ze mogen het model niet gebruiken.

‘We kiezen nu uitsluitend voor de zakelijke markt en de overheid. Voor de dertienenhalf miljoen subsidie die we hebben gekregen, kun je niet alles doen, dan moet je keuzes maken. Voor de commerciële BV-Nederland is het ook belangrijk dat er gebruikgemaakt kan worden van een model dat op een eerlijke manier is gebouwd.’

Kunnen jullie je voorstellen dat daar wel kritiek op is, bijvoorbeeld van journalisten die er niet zelf voor hebben gekozen dat hun data in het taalmodel van GPT-NL terechtkomen?

‘Zeker. Dit taalmodel is gericht op een specifiek aantal taken en vooral geschikt voor overheidsinstanties, zoals bijvoorbeeld samenvatten. We focussen ons minder op de particuliere markt. GPT-NL is niet gericht op het schrijven van een artikel, een gedicht of nieuwsbericht. We hebben met NDP Nieuwsmedia afgesproken dat er geen concurrerende diensten worden gemaakt die hun business ondergraaft. Wij beseffen ook dat een democratie valt of staat met een gedegen journalistiek. NDP wilde het gesprek met ons aangaan om te onderzoeken hoe ze AI kunnen gebruiken en hoe de nieuwssector in deze nieuwe tijd kan overleven. Hun data worden nu op grote schaal gestolen door grote, buitenlandse taalbedrijven. We slaan de gegevens van gebruikers niet op, die blijven binnen een beschermde omgeving.’

Het is intussen bekend dat de informatie die taalmodellen geven onbetrouwbaar is. Ook als je betrouwbare data gebruikt, blijft een taalmodel een wiskundig model dat op basis van statistiek het volgende woord in een zin voorspelt. Is de onbetrouwbaarheid van de tekst die een taalmodel genereert geen risico voor de overheid? Krijgen we een nieuwe Toeslagenaffaire?

‘Dit is waar deze testronde voor dient. Kun je het model van GTP-NL gebruiken binnen een specifieke context? Wij zien LLM’s als technologie die heel nuttig is, maar niet per se accuraat voor waar ze nu vaak voor wordt gebruikt. LLM’s zijn wel goed in specifieke taken, zoals het samenvatten of vertalen van een tekst, of het veranderen van het taalniveau, het versimpelen van brieven aan de burger, of het overnemen van een deel van een klantenservice. De human-in-the-loop blijft heel belangrijk, het taalmodel moet niet zelf keuzes maken. Er zijn ook hoog-risicocategorieën waarin je niet aan de slag moet gaan met AI, zoals de zorg, al zitten daar nog wel gradaties in.’

Gaat het in gebruik nemen van jullie taalmodel straks veel banen kosten?

‘Op dit moment krijgen we signalen dat er te weinig tekstschrijvers bij de overheid zijn. Maar de ontwikkeling van AI zal zeker een impact hebben op de toekomst van werk.’

Is er een kans dat mensen de controleur van een schrijfbot worden?

‘Het wordt inderdaad spannend hoe dit zich gaat ontwikkelen. Dat geldt ook voor andere beroepen, dat kunnen we niet voorkomen. We proberen vanuit TNO in de gaten te houden wat de impact van generatieve AI op werk is. Een aantal mensen zal nieuwe vaardigheden moeten leren en op een andere manier moeten gaan werken.’

Er is een deal gesloten met NDP. Hoe garanderen jullie dat de vergoeding voor het gebruik van het archief van al deze kranten ook echt bij journalisten terechtkomt? Freelancers maken zich zorgen, want hun werk zit er evengoed in. Hoe zullen jullie ervoor zorgen dat er ook geld naar hen toestroomt?

‘We hebben met NDP afgesproken dat zij daar goed naar kijken. Dit thema is ook in de gesprekken naar voren gekomen. Zij hebben aangegeven dat ze hierover in gesprek zijn gegaan met hun achterban en daarbij de juiste waarborgen en processen hebben ingericht.’

Wij vertegenwoordigen als Auteursbond ook freelancers en hebben hierover bovendien contact met de Nederlandse Vereniging van Journalisten (NVJ). Zij weten niets van vergoedingen. Hebben jullie afspraken gemaakt met de krantenbazen of gaat jullie zorg verder?

‘Vervelend dat er zorgen zijn bij journalisten. Dat is voor ons een reden om opnieuw het gesprek aan te gaan met NDP. We hebben de afspraak gemaakt dat we alleen content accepteren en gebruiken waarvan het zeker is dat de rechten zijn overgedragen aan de nieuwsbedrijven. We zijn ervan uitgegaan dat alle content die geleverd is, ook geleverd mocht worden.’

Dus de controle daarvan ligt bij de leverancier van de data?

‘Ja. De leveranciers van de data hebben daar ook in de contracten de verantwoordelijkheid over.’

Dus we moeten deze vraag nu bij degenen neerleggen met wie jullie de contracten hebben afgesloten?

‘Ja, de verantwoordelijkheid voor het nakomen van de afspraken rondom de rechtmatigheid van de data die ligt bij de dataleverancier.’

Zou het niet netjes zijn om vanuit GTP-NL ook te kijken of dat geld straks ook echt bij de (freelance) journalisten terechtkomt?

‘Wij kunnen verder geen commentaar geven op hoe de afspraken tussen de nieuwsbedrijven en de journalisten tot stand zijn gekomen, dat is echt aan die bedrijven zelf. Het contract met NDP staat op onze website.’

Als het gaat om betaald krijgen voor je werk, sluiten journalisten en schrijvers nu achteraan aan. Er wordt neem ik aan niet achteraf betaald voor de stroom, voor de medewerkers, etc. Zou het niet eerlijk zijn als de mensen die de echte grondstof leveren voor taalmodellen, schrijvers, juist vooraan in de rij staan als het om het uitbetalen gaat?

‘Wij kunnen geen commentaar geven op hoe de afspraken met freelance-journalisten tot stand zijn gekomen tussen hen en de bedrijven waar ze content aan hebben geleverd. Dat is echt aan de organisaties die de contracten hebben gesloten. Ik vind het een interessant signaal wat we horen. We nemen het zeker mee.’

Zal het taalmodel het werk van mensen die (deels) van de pen leven straks door GPT-NL worden overgenomen? Worden zij (bijvoorbeeld vertalers die bij de overheid werken) de assistent van de bot?

‘We weten dat het werk sowieso gaat veranderen door genAI, dat is niet te voorkomen. De vraag is hoe we daar met zijn allen mee omgaan. Voor schrijvers en vertalers is het spannend hoe dit zich gaat ontwikkelen. Een aantal mensen zal in de toekomst ander werk moeten gaan vinden en nieuwe vaardigheden moeten ontwikkelen.’

Waar moeten we dan aan denken?

‘Met AI als assistent kun je misschien andere verhalen, betere verhalen, of meer verhalen maken. Misschien kun je een breder publiek bereiken, omdat je opeens een vertaaltool naast je hebt liggen.’

Krijgen zij een compensatie van de overheid, van u? Of staan ze straks op straat?

‘Dat is een politieke keuze en niet iets waar GTP-NL een besluit over neemt. Er zal mogelijk meer geld in onderwijs moeten worden gestoken. GPT-NL wordt gericht ontwikkeld voor niet-creatieve taken, zoals samenvatten. Als ontwikkelaar hebben we een verantwoordelijkheid. Je kunt niet zeggen: wij ontwikkelen alleen de technologie en de impact is voor rekening van iemand anders, dat is te makkelijk. Door ons te focussen op dat deel van de arbeidsmarkt waar tekorten zijn, hopen we een probleem op te lossen. Maar we zijn ook onderdeel van de uitdaging waarbij werk er in de toekomst anders uit gaat zien. Het is van alle tijden dat beroepen verdwijnen én verschijnen.’

Taalmodellen gebruiken veel stroom. We bevinden ons in een klimaatcrises. Wordt hierover ook nagedacht binnen GPT-NL?

‘Ja, wij willen leider zijn op het gebied van waar je taalmodellen voor moet gebruiken en waarvoor niet. Voor specifieke taken is AI een nuttige tool, voor andere taken kun je AI beter niet gebruiken. We moeten af van het narratief dat LLM’s een orakel zijn en alles moeten kunnen. Een LLM is gewoon een tool in je toolbox.

Kennis haal je niet uit een taalmodel, dat is niet het doel. Een simpele vraag oké, maar als je een relatief complexe vraag stelt, moet je niet verwachten dat een taalmodel, dat alleen de samenhang tussen bepaalde woorden kent, daar het juiste antwoord op kan geven. Ons idee is dat het model vooral interpreteert. Je geeft het informatie en vraagt je taalmodel daar iets mee te doen, maar niet om die kennis terug te geven, want toen de informatie in het model werd gestopt is alle context verloren gegaan.’

Hoe kun je als relatief klein taalmodel met grotere modellen concurreren? Hoe haal je bedrijven straks over dit Nederlandse model te gebruiken?

‘We lopen misschien achter als het gaat om het verwezenlijken van agent-technologie, maar we lopen voor als het gaat om LLM’s ontwikkelen op een zo eerlijk mogelijke manier.

Wij zijn een betrouwbare organisatie, dus als je soevereiniteit belangrijk vindt en je niet wilt dat je data gestolen worden, moet je bij ons zijn. Geeft een partij alleen maar om performance, dan kan die waarschijnlijk beter verder kijken.’

Denken jullie er ook over na ook recentere literatuur/non-fictie te gebruiken? Is fictie wel geschikt voor zo’n model?

‘We hebben vanwege het auteursrecht alleen toegang tot werken waarvan de auteur zeventig jaar of langer geleden is overleden. Fictie is in sommige gevallen inderdaad niet handig. Het model ziet geen verschil tussen oude en nieuwe taal en tussen fictie en non-fictie. Maar als een taalmodel vooral als gereedschap wordt gebruikt en geen orakel hoeft te zijn, gaat het bij de ontwikkeling vooral om de kwaliteit van de tekst en dan kan literatuur heel bruikbaar zijn.’

Anja Sicking en Noor van der Heijden