De snelle opkomst van ChatGPT

Wat betekent dit voor schrijvers?
7 juni 2023

Door Anja Sicking

Zal het geïndustrialiseerde taalgebruik van ChatGPT en andere artificiële intelligentie systemen het werk van schrijvers deels overnemen of hebben we te maken met de zoveelste hype van de techindustrie? In Nederland is het relatief rustig in de schrijverswereld in vergelijking met de Verenigde Staten, waar 15.000 scenaristen sinds begin mei staken.

De scenaristen staken niet alleen voor een hoger salaris en betere arbeidsvoorwaarden. Ze anticiperen ook op een toekomst waarin het werk dat ze doen mogelijk deels wordt overgenomen door AI-systemen. Ze willen nu al afspraken maken met producenten over het gebruik van AI (artificiële intelligentie) bij het schrijven van scripts. Ze staan lijnrecht tegenover de spelers uit de techindustrie, die juist willen dat AI in de toekomst een essentieel hulpmiddel zal zijn bij het maken van films en series. Mogelijk zullen acteurs zich binnenkort bij de stakende scenaristen aansluiten, dan komt Hollywood volledig plat te liggen. Sommige acteurs doen nu al mee, of zorgen ervoor dat foodtrucks langs de stakers rijden om eten te brengen. Bands treden gratis op. Tijdens een AI-conferentie vloog er een crowdfunded vliegtuig over filmstudio’s met een spandoek waarop stond: ‘Pay the writers, you AI-holes’.

Tekst op basis van statistiek

ChatGPT is een large language model (LLM) dat het techbedrijf OpenAI eind 2022 lanceerde. Een klets- of schrijfbot zou je het ook kunnen noemen. ChatGPT is getraind met (onder andere) een gigantische hoeveelheid digitale teksten, meer dan een mens ooit in zijn leven zou kunnen lezen. Het model kent aan al die reeksen woorden een ‘waarschijnlijkheid’ toe. Dat betekent dat het getraind is om het volgende woord te ‘berekenen’ aan de hand van de woorden die eraan voorafgaan. Hiervoor is enorm veel rekenkracht en opslagruimte in de cloud nodig, wat alleen reusachtige techbedrijven kunnen betalen. Andere bekende LLM’s zijn Bard, van Google, en LLaMA, van Meta.

Hoewel Lidwien Gevers in Het Journaal dolenthousiast zei dat je met ChaptGPT ‘de nieuwe Harry Potter kan schrijven’, begrijpt het grote taalmodel net zomin iets van de teksten die het produceert als een vertaalprogramma. Het niveau van de scripts, de verhalen of de literaire vertalingen die met LLM’s worden gegenereerd is op dit moment dan ook weinig indrukwekkend. De toneel- en scenarioschrijver Nathan Vecht legt in Nieuwsuur (14-5-23) uit hoe dat komt. ‘Er wordt een gemiddelde gezocht van alle scripts die gemaakt zijn. Maar wat een goed verhaal, een goed verhaal maakt, is juist dat het bovengemiddeld is.’

Digitale assistent

Tegelijk is het ook wél indrukwekkend wat LLM’s al kunnen. Een LLM kan binnen een minuut een sonnet over de tweede wet van de thermodynamica generen en dat in zevenentwintig talen vertalen.

Sommige scenaristen, vertalers, prozaïsten, dichters, journalisten en toneelschrijvers gebruiken ChatGPT al om ideeën op te doen, of als assistent. Helaas vindt het model die ideeën vaak in het werk van andere, menselijke schrijvers. Als een uitgewerkt idee letterlijk wordt overgenomen, kan een digitale assistent ‘hightechplagiaat’ plegen.

ChatGPT geeft wel (een deel van) de bronnen waarop de teksten die het taalmodel genereert zijn gebaseerd, maar die zijn lang niet altijd betrouwbaar. ChatGPT hallucineert soms, waarmee wordt bedoeld dat het informatie en ook bronnen verzint. De journalist Chris Moran schrijft The Guardian (6-4-23) dat deze krant soms als bron wordt genoemd bij artikelen die daar nooit in zijn verschenen. Om niet het risico te lopen uit fake-artikelen te citeren, zal een schrijver alle door een ChatGPT gegeven bronnen alsnog zelf moeten controleren.

Auteursrecht en ChatGPT

In de VS hebben grote media als CNN en Dow Jones (de uitgever van Wall Street Journal) al bezwaar gemaakt tegen het gebruik van het auteursrechtelijk beschermde werk van hun journalisten door OpenAI.

Nederlandse kranten en tijdschriften dienen ook als ‘voer’ voor de LLM’s.  Waarschijnlijk wordt het auteursrecht hierdoor in ons land op grote schaal door techbedrijven geschonden, hoewel de kwestie ingewikkeld ligt. Auteursbond-juriste Marloes van Rossum ging hier tijdens de workshop ‘AI en auteursrecht’ van de Auteursbond op in en zal hier in een volgend artikel meer over vertellen. Over het mogelijk schenden van het auteursrecht zijn al Kamervragen gesteld. Minister Adriaansens heeft gezegd dat OpenAI auteursrechtelijk beschermd werk niet zonder toestemming mag gebruiken voor het trainen van zijn AI-model. OpenAI heeft zelf toegegeven het internet af te schrapen.

Op dit moment is het nog onduidelijk wie de eigenaar is van de door LLM’s gegenereerde teksten. Degene die een prompt intikt en de tekst die uit de machine rolt als eerste publiceert? De techbedrijven?

‘Als een AI-model aan de haal gaat met wat journalisten produceren, en dat op een eigen manier presenteren aan het brede publiek, dan droogt de inkomstenstroom van uitgevers, waar journalisten van betaald worden op,’ aldus Herman Wolswinkel, directeur van NDP Nieuwsmedia (NRC 24-3-23). ‘Op basis van tests die we hebben gedaan krijgen we de indruk dat er artikelen van achter de betaalmuur worden gebruikt.’

Niets wijst erop dat politici voldoende hebben nagedacht over het beschermen van het auteursrecht, of over de veiligheid van LLM’s voordat die op de markt zijn toegelaten. Veel mensen hebben al gewaarschuwd dat betrouwbare nieuwsbronnen verder ondergesneeuwd kunnen raken door nepnieuws, zeker nu gebruikers van LLM’s vooraanstaande journalisten daarmee imiteren. Dit zou democratieën verder onder druk kunnen zetten. ‘Flood the zone with sh*t,’ noemde de topadviseur Steve Bannon het al in het Trump-tijdperk.

Informatie is zelden neutraal en LLM’s zijn daardoor zelden onbevooroordeeld. ChatGPT is getraind met 300 miljard woorden die van het internet zijn gehaald, ook van sites waarop discriminerende informatie staat, die het taalmodel reproduceert, ondanks de filters. Dit zal de discriminatie van bepaalde groepen in stand houden.

Bedrijven, zoals Microsoft, doen enorme investeringen (10 miljard) in LLM’s, die moeten worden terugverdiend. Wie (een deel van) zijn tekst laat schrijven door een LLM, laat zijn pen door een bedrijf vasthouden. Een bedrijf met een bepaald belang, zoals het industrialiseren van ons taalgebruik.

Verbeeldingskracht

De essayist Jan Postma zei in een interview dat het veel verbeeldingskracht vraagt om je een wereld voor te stellen waarin bepaalde technologie aan banden wordt gelegd. ‘Ik denk dat als je van mensen verwacht dat ze in het nu politieke beslissingen nemen over de wereld die ze willen, dat samenhangt met welke voorstelling ze zich kunnen maken van die wereld. Als die voorstelling heel beperkt is, dan kun je daar ook niet op anticiperen.’ (Jan Hanlo Podcast 23-4-23)

Als je de ontwikkeling van AI van de afgelopen vijf jaar naar voren klapt dan zou het kunnen dat de LLM’s heel snel veel beter worden dan ze nu zijn. Wat dat betreft hebben de stakende scriptschrijvers waarschijnlijk gelijk dat ze nu al invloed op deze ontwikkelingen eisen. Ze anticiperen op de gevolgen van de LLM’s op de middellange en lange termijn. Hun staking getuigt van verbeeldingskracht en het stemt hoopvol dat ze zich hebben verenigd.

De Auteursbond volgt de ontwikkelingen rond AI en wat die betekenen voor schrijvers en vertalers. We blijven je hierover informeren.