Wikipedia verbiedt AI-gegenereerde inhoud op haar platform, maar verkoopt tegelijkertijd haar data aan grote techbedrijven voor AI-training. Deze opmerkelijke spreidstand zet een spiegel voor: het is een praktisch dilemma waar ook ondernemers mee te maken krijgen bij het inzetten van AI voor content en data.

Wat er aan de hand is

De online-encyclopedie Wikipedia heeft een nieuw beleid ingevoerd dat inhoud die gegenereerd is door grote taalmodellen (LLM’s) verbiedt voor het schrijven of herschrijven van artikelen. Dit besluit kwam na een intern debat onder de ongeveer 250.000 vrijwillige redacteuren. De organisatie stelt dat het gebruik van LLM’s “vaak de kernprincipes van Wikipedia schendt”, zoals verificatie en bronvermelding. Er zijn twee uitzonderingen: AI mag worden gebruikt voor vertalingen en kleine tekstcorrecties, mits een mens deze controleert. Zelfs dan waarschuwt het beleid voorzichtig te zijn, omdat modellen verder kunnen gaan dan gevraagd en de betekenis kunnen veranderen.

Tegelijkertijd sloot de non-profit organisatie, die draait op donaties, deals met bedrijven als Microsoft, Meta en Amazon. Deze bedrijven mogen Wikipedia-inhoud gebruiken om hun eigen AI-modellen te trainen. Wikipedia worstelt al jaren met bots die de site “leegschrapen” voor trainingsdata, wat de infrastructuurkosten opdrijft. Tussen begin 2024 en april 2025 steeg de bandbreedte voor multimediadownloads met 50 procent door dit botverkeer. Minstens 65 procent van het resource-intensieve verkeer bleek van bots afkomstig.

Wat dit betekent

Dit betekent dat de grootste kennisbank ter wereld een fundamentele onduidelijkheid blootlegt over de rol van AI. Aan de ene kant wordt AI-gegenereerde content als onbetrouwbaar en risicovol gezien voor de kern van een kennisplatform. Aan de andere kant is de data die door mensen is gemaakt wel waardevol genoeg om te verkopen voor de ontwikkeling van diezelfde technologie. Voor ondernemers en professionals is dit een herkenbaar dilemma: hoe verhoud je je tot een technologie die je enerzijds wilt gebruiken voor efficiëntie, maar waarvan je de output niet volledig vertrouwt? Het toont aan dat zelfs grote organisaties worstelen met een coherent beleid, wat ruimte laat voor eigen interpretatie en keuzes in je bedrijfsvoering.

Hoe je dit kunt toepassen

De praktische toepassing hangt af van jouw situatie. Wikipedia’s dubbele houding is een spiegel voor je eigen content- en data-strategie. Het nodigt uit om kritisch te kijken naar waar en hoe je AI inzet.

Als je een kennisintensieve website of blog runt… kun je overwegen om een transparantiebeleid op te stellen. Net als Wikipedia kun je besluiten dat kerncontent, zoals productbeschrijvingen, handleidingen of artikelen die je autoriteit vestigen, door mensen wordt geschreven of grondig wordt geverifieerd. Voor ondersteunende taken, zoals het genereren van meta-beschrijvingen of het vertalen van bestaande content, zou je AI kunnen inzetten met een menselijke controle, vergelijkbaar met Wikipedia’s uitzonderingen.

Als je data verzamelt of beheert… is het zaak bewust om te gaan met hoe die data gebruikt wordt. Wikipedia’s ervaring met bots die de site leegschrapen, laat zien dat data een waardevolle grondstof is. Je zou kunnen nadenken over de voorwaarden waaronder anderen (zoals leveranciers of partners) jouw data mogen gebruiken, zelfs als die openbaar toegankelijk is. Het stelt de vraag: wat is de waarde van jouw data, en wil je die gratis weggeven voor AI-training?

Als je AI-tools gebruikt voor klantcommunicatie… zoals chatbots of e-mailgeneratie, is de waarschuwing van Wikipedia relevant. Modellen kunnen “verder gaan dan gevraagd” en inhoud genereren die niet wordt onderbouwd door feiten. Een mogelijkheid is om een strikte menselijke review in te bouwen voor alle externe communicatie, vooral waar het gaat om feitelijke claims, garanties of prijzen. Dit beperkt het risico op misleidende of verzonnen informatie.

De kern is dat er geen eenduidig antwoord is. Wikipedia’s keuze illustreert dat je voor verschillende doeleinden verschillende regels kunt hanteren. Het gaat om het maken van een bewuste afweging tussen efficiëntie, betrouwbaarheid en kosten, afgestemd op wat voor jouw bedrijf het belangrijkst is.

Bron: Computable