Wikipedia's AI-verbod: een les in consistent beleid voor je bedrijf

Wikipedia’s strikte verbod op AI-gegenereerde inhoud, terwijl het tegelijkertijd data verkoopt aan grote techbedrijven voor hun AI-training, is een praktijkvoorbeeld van inconsistent beleid. Voor ondernemers toont dit de noodzaak om AI-regels niet alleen intern, maar ook in externe partnerschappen helder en eenduidig te definiëren.

Wat er aan de hand is

De online-encyclopedie Wikipedia heeft formeel besloten dat kunstmatige intelligentie geen inhoud meer mag schrijven of herschrijven voor haar platform. Dit besluit, genomen na een intern debat onder de ongeveer 250.000 vrijwillige redacteuren, bevestigt het al twintig jaar bestaande principe van menselijke verificatie. Er zijn twee uitzonderingen: AI mag worden gebruikt voor vertalingen en kleine tekstcorrecties, mits een mens deze controleert. De organisatie waarschuwt expliciet voor de risico’s, omdat grote taalmodellen (LLM’s) verder kunnen gaan dan gevraagd en de betekenis van een tekst kunnen veranderen zonder onderbouwing door bronnen.

Tegelijkertijd heeft Wikipedia, een non-profitorganisatie, commerciële deals gesloten met bedrijven als Microsoft, Meta en Amazon. Deze bedrijven mogen de Wikipedia-inhoud gebruiken om hun eigen AI-modellen te trainen. De organisatie worstelt bovendien met een stortvloed aan geautomatiseerde ‘bots’ die de site leegschrapen voor trainingsdata. Dit verstoort de toegang en heeft de bandbreedte voor multimediadownloads tussen begin 2024 en april 2025 met 50 procent doen stijgen. Minstens 65 procent van dit resource-intensieve verkeer blijkt van bots afkomstig.

Wat dit betekent

Dit betekent dat je als ondernemer voorzichtig moet zijn met het aannemen van eenzijdige AI-regels. Het toont een fundamentele spanning: intern kan een organisatie AI afwijzen vanwege kwaliteits- en controle-redenen, maar extern kan dezelfde technologie als waardevolle grondstof worden verhandeld. Voor sectoren die draaien op betrouwbaarheid en vertrouwen, zoals advies, journalistiek, onderwijs of zorg, is dit een belangrijk signaal. Je klanten en partners verwachten consistentie. Als je intern zegt dat je ‘menselijk maatwerk’ levert, maar extern wel AI-tools gebruikt die klantdata verwerken, kan dat je geloofwaardigheid aantasten. De praktijk van Wikipedia laat zien dat een beleid dat niet alle kanalen dekt – van contentcreatie tot dataverkoop – als hypocriet kan worden ervaren.

Hoe je dit kunt toepassen

De praktische les is om je AI-beleid holistisch op te stellen, zodat het zowel interne processen als externe relaties dekt. Begin met het definiëren van je kernprincipes rond betrouwbaarheid en transparantie, en toets daar alle AI-toepassingen aan.

Als je een content- of kennisbedrijf runt… kun je een duidelijk onderscheid maken tussen wat je produceert en wat je archiveert. Je zou kunnen besluiten dat alle gepubliceerde content door mensen wordt geschreven en gecheckt, naar het voorbeeld van Wikipedia. Voor interne research of het structureren van je eigen archief zou je wel AI-hulpmiddelen kunnen inzetten. Het cruciale punt is dat je dit beleid communiceert naar je klanten, zodat zij weten wat ze kunnen verwachten.

Als je samenwerkt met tech-leveranciers of platforms… is het zaak om in contracten vast te leggen hoe zij met jouw data omgaan. Vraag expliciet of jouw content, klantreviews of productinformatie wordt gebruikt om AI-modellen te trainen. Wikipedia verkoopt haar data bewust, maar als jij gratis content plaatst op een sociaal platform, zou diezelfde data zomaar voor AI-training gebruikt kunnen worden zonder dat je het weet. Stel deze vraag voortaan standaard in je due diligence.

Als je een AI-beleid voor je team opstelt… beperk je dan niet tot het gebruik van tools zoals ChatGPT. Neem ook het omgaan met externe partijen mee. Stel regels op voor welke data wel en niet gedeeld mag worden met SaaS-leveranciers, clouddiensten of marketingplatforms voor analyse. Een simpele regel zou kunnen zijn: “Klantdata en unieke bedrijfskennis delen we nooit met een platform waarvan het privacybeleid niet expliciet uitsluit dat data voor AI-training wordt gebruikt.”

Als je kosten beheert voor online infrastructuur… wees je bewust van het effect van bots. Net zoals bij Wikipedia kan ongewenst geautomatiseerd verkeer (scraping) je serverkosten opdrijven. Overweeg om je IT-leverancier te vragen naar monitoringtools die abnormaal dataverkeer signaleren, zodat je tijdig maatregelen kunt nemen om je operationele kosten onder controle te houden.

Bron: Computable

Wat er aan de hand is#

Wat dit betekent#

Hoe je dit kunt toepassen#

Lees ook

Wat er aan de hand is

Wat dit betekent

Hoe je dit kunt toepassen