MIT-onderzoekers maken AI-agents slimmer door ze fouten te laten herstellen

AI-agents zijn softwareprogramma’s die zelfstandig taken kunnen uitvoeren door op bepaalde momenten een groot taalmodel (LLM) zoals ChatGPT te raadplegen. Denk aan een systeem dat automatisch klantvragen categoriseert en beantwoordt, of dat een oude codebase analyseert en vertaalt naar een moderne programmeertaal. Het grote probleem is dat zo’n agent vast kan komen te zitten als het taalmodel een fout maakt of een onhandig antwoord geeft. Tot nu toe moest een programmeur dan handmatig code schrijven om de agent te laten ’teruggaan’ en een andere aanpak te proberen. Onderzoekers van MIT hebben nu een framework ontwikkeld, genaamd EnCompass, dat dit probleem automatisch oplost.

Hoe EnCompass AI-agents slimmer maakt

Het EnCompass-framework werkt als een slimme begeleider voor een AI-agent. Stel, je bouwt een agent die een database met klantrecensies analyseert en samenvat. De agent stelt een vraag aan een LLM, maar krijgt een onvolledig of irrelevant antwoord terug. In plaats van vast te lopen of een foutief eindresultaat te produceren, kan EnCompass de agent automatisch laten terugkeren naar het punt vóór die vraag. Vervolgens kan het de vraag anders formuleren of een andere tak in de logica proberen. Het framework kan zelfs meerdere pogingen parallel uitvoeren, als het ware verschillende paden tegelijk verkennen, om het beste mogelijke resultaat te vinden. Dit maakt de agent veel robuuster en betrouwbaarder zonder dat je als bouwer al die foutafhandelingslogica zelf hoeft te programmeren.

Praktische toepassingen voor ondernemers

Voor ondernemers betekent dit dat het in de toekomst eenvoudiger wordt om complexe, geautomatiseerde workflows te bouwen die minder snel breken. Een voorbeeld is een agent voor marktonderzoek: je kunt het vragen om het internet af te struinen naar trends in jouw sector, artikelen samen te vatten en een rapport te schrijven. Zonder een systeem als EnCompass zou één verkeerd geïnterpreteerd artikel de hele keten kunnen verstoren. Met EnCompass kan de agent zelf die fout herkennen en corrigeren. Andere toepassingen liggen in klantenservice (waar een agent ticketclassificatie en eerste antwoorden kan afhandelen), het analyseren van financiële documenten, of het onderhouden en updaten van software. Het framework is vooral nuttig voor taken die uit meerdere stappen bestaan en waarbij de tussenresultaten van een LLM cruciaal zijn.

Hoe kun je dit vandaag toepassen?

Het EnCompass-framework is op dit moment een onderzoeksproject en nog niet direct beschikbaar als kant-en-klare tool. Het belangrijkste inzicht voor nu is dat de ontwikkeling van AI-agents snel volwassener wordt. Je kunt je voorbereiden door te experimenteren met het bouwen van eenvoudige automaties met bestaande tools. Platforms zoals n8n of Make (voorheen Integromat) laten je workflows bouwen waarin je ook AI-stappen (via OpenAI’s API) kunt inlassen. Begin met een kleine, repetitieve taak, zoals het automatisch categoriseren van inkomende e-mails of het genereren van eerste concepten voor sociale media-berichten. Zo krijg je gevoel bij de kracht en de valkuilen van geautomatiseerde AI-workflows.

Bron: MIT News

Hoe EnCompass AI-agents slimmer maakt#

Praktische toepassingen voor ondernemers#

Hoe kun je dit vandaag toepassen?#

Lees ook

Hoe EnCompass AI-agents slimmer maakt

Praktische toepassingen voor ondernemers

Hoe kun je dit vandaag toepassen?