Hoe controleer je of jouw AI-tool 'geleend' materiaal produceert?

Uitgevers zoals Encyclopedia Britannica en Merriam-Webster dagen OpenAI voor de rechter omdat ze stellen dat ChatGPT hun auteursrechtelijk beschermde inhoud heeft ‘gememoriseerd’ en soms bijna letterlijk kopieert. Voor jou als ondernemer is dit geen abstract juridisch gevecht, maar een praktische waarschuwing. Het toont een reëel risico aan: de AI-tools die je gebruikt voor content, marketing of productontwikkeling kunnen onbedoeld beschermd werk reproduceren. Dat brengt juridische aansprakelijkheid en reputatieschade met zich mee.

Wat betekent ‘memoriseren’ in de praktijk?

Volgens de aanklacht kan GPT-4, wanneer daarom gevraagd, “aanzienlijke delen” van de encyclopedie “bijna woordelijk kopiëren”. Dit fenomeen, waarbij een groot taalmodel specifieke trainingsdata onthoudt en reproduceert, staat bekend als ‘memorization’. Het is niet hetzelfde als geïnspireerd raken of parafraseren; het gaat om een directe, herkenbare reproductie. Voor een bedrijf betekent dit dat een door AI gegenereerde productbeschrijving, blogpost of handleiding mogelijk te veel lijkt op een bestaande, beschermde tekst van een concurrent of uitgeverij.

Hoe herken je het risico in je eigen werk?

Het lastige is dat je als gebruiker niet kunt zien op welke data een tool als ChatGPT getraind is. Toch zijn er manieren om het risico te beperken. Een eerste stap is bewustwording: AI-output is geen origineel werk in de traditionele zin, maar een statistische reconstructie uit bestaande bronnen. Hoe specifieker en unieker de opdracht (“schrijf een gedetailleerde samenvatting van de Eerste Wereldoorlog in de stijl van Encyclopedia Britannica”), hoe groter de kans dat de output lijkt op bestaande, bekende teksten.

Wat zijn de gevolgen voor jouw bedrijf?

De directe juridische gevolgen treffen in eerste instantie de maker van het AI-model, zoals OpenAI. Maar als jij de gegenereerde content publiceert als jouw eigen werk, loop je ook risico. Een concurrent of copyright-houder kan je aanspreken op inbreuk. Reputatieschade is een minstens zo groot gevaar: het kan je bedrijf schaden als blijkt dat je ‘geleende’ content gebruikt, ook al was dat onbedoeld. Het ondermijnt het vertrouwen in je originaliteit en professionaliteit.

Hoe kun je dit vandaag toepassen?

Een mogelijke stap is om AI-gegenereerde content altijd te controleren op unieke passages, vooral bij feitelijke of zeer specifieke onderwerpen. Je zou kunnen overwegen om een deel van de tekst in een zoekmachine te plakken tussen aanhalingstekens om te zien of er letterlijke matches zijn. De meest praktische benadering is om AI-output te zien als een ruwe schets of eerste concept die je grondig herschrijft, aanvult met eigen kennis en toetst aan je eigen stem en boodschap.

De toepassingen in dit artikel zijn suggesties op basis van het bronartikel, geen gevalideerd advies.

Bron: The Verge

Wat betekent ‘memoriseren’ in de praktijk?#

Hoe herken je het risico in je eigen werk?#

Wat zijn de gevolgen voor jouw bedrijf?#

Hoe kun je dit vandaag toepassen?#

Lees ook

Wat betekent ‘memoriseren’ in de praktijk?

Hoe herken je het risico in je eigen werk?

Wat zijn de gevolgen voor jouw bedrijf?

Hoe kun je dit vandaag toepassen?