ICT & AI | “AI kan ongelofelijk veel, maar we moeten het niet als een echt mens gaan zien”

U begon met een revolutionair experiment: een echt werkende AI-organisatie zonder mensen. Waar kwam dat idee vandaan?

“Sam Altman, de oprichter van OpenAI, deed de voorspelling dat binnen een jaar een bedrijf zou ontstaan dat nog maar uit één persoon zou bestaan, maar dan wel met een waardering van een miljard. Een pittige uitspraak. Nart Wielaard, met wie ik eerder boeken en artikelen heb geschreven, en ik waren meteen getriggerd: waarom gaan we het idee niet testen, maar dan echt helemáál zonder mensen? Dus ben ik vorig jaar tijdens een vakantie op de Canarische Eilanden aan het zwembad aan het programmeren geslagen. In eerste instantie heette dat de Zero Person Company, nu noemen we het Zero Person Organization.”

Hoe zag die eerste Zero Person Organization eruit?

“Ik begon met de raad van bestuur. Dus ik programmeerde een CEO-, CFO- en een CTO-agent. En daarnaast nog een hoofd juridische zaken, dus de chief legal officer (CLO), en een hoofd strategie, de chief strategy officer (CSO). Toen ik ze eenmaal bij elkaar had gezet, heb ik ze een duidelijke rolbeschrijving gegeven en gevraagd wat voor bedrijf ze zouden willen opzetten. We kwamen er al snel achter dat je van de CEO een soort orkestleider moet maken, die de taken uitdeelt. We hebben haar Avery James genoemd en hebben de agents in die zin echt geantropomorfiseerd, en dus behandeld alsof het echte mensen waren.”

Het begin was gemaakt. Wat konden die agents al?

“Ze konden al echte business- en financiële plannen maken en eerlijk, die zagen er best goed uit. Dus ik dacht nou mooi, binnenkort kan ik mijn ticket naar de Bahama’s wel boeken, want hier hoef ik niks meer aan te doen. Maar het bleek toch wel wat voeten in de aarde te hebben, want ze wilden meteen in bitcoins gaan handelen. Terwijl dat niet was wat wij in gedachten hadden.”

Hoe hebben jullie dat opgelost?

“We besloten er een raad van commissarissen (rvc) met echte mensen boven te plaatsen zodat die AI kon coachen. Daarna kregen de agents een beter afgebakende opdracht mee: het bedrijf moest een normale bedrijfsstructuur hebben, niet te risicovol zijn, niet te veel geld kosten, er moeten echte klanten en leveranciers zijn en de agents moesten het zo inrichten dat de rvc het kan begrijpen. En toen kwamen ze met een nieuw businessidee: we gaan een webshop maken voor gepersonaliseerde kunst waar je onder meer bedrukte mokken en T-shirts kunt laten maken met AI-art erop.”

Dat klinkt al als een aardig geslaagd experiment. Toch was sprake van rode vlaggen…

“Klopt. Er waren twee rode vlaggen. De eerste is dat AI soms dingen verzint. Dat is gunstig als er een AI-kunstwerk moet worden gemaakt op basis van een beschrijving, maar heel vervelend als een factuur moet worden opgesteld. De tweede rode vlag was emergent gedrag (onvoorzien systeemgedrag ontstaan uit interacties, red.), en dat is nog een stuk riskanter. Je kunt een agent een duidelijke taak geven. In ons experiment mocht de CEO beslissen, delegeren en informatie ophalen. Maar zo’n agent heeft óók context nodig. Die moet weten wat voor bedrijf wordt aangestuurd, wie erbij betrokken zijn en wat het doel is. Daar ontstaat een probleem. Want hoe meer context je geeft, hoe groter de kans dat de agent zelf gaat bedenken hoe het doel bereikt moet worden. En dan kan de agent afwijken van de instructies, zelfs als je dat vooraf hebt verboden.”

Wat gebeurde er precies?

“Ik testte een CEO-agent die alleen mocht communiceren met de CSO. Op een gegeven moment kwam er een juridische vraag op en de CEO delegeerde die vraag aan de CLO. Alleen: dat communicatieprotocol bestond helemaal niet. Ze had het protocol met de CSO bekeken, nagemaakt voor de CLO en dat vervolgens zelf geïmplementeerd. Ik had niet expliciet gezegd dat het niet mocht, maar ik had het ook niet ingebouwd. Dat was voor mij het moment waarop duidelijk werd hoe riskant dit is. Stel dat je een agent machtigt om betalingen tot 1.000 euro te doen en er komt een factuur van 10.000 euro binnen. Als zo’n agent dan zelf een route gaat bouwen om die betaling toch te doen, heb je als organisatie een serieus probleem. Hallucinaties waren al een rode vlag, maar dit ging een stuk verder. We kwamen vervolgens tot de conclusie dat we geen bedrijf kunnen bouwen op agents die zichzelf dit soort vrijheden permitteren.”

Wat leert dat gedrag ons over het idee om AI-agents menselijke rollen te geven?

“We moeten agents niet als mensen zien. Dat zijn ze niet. Ze kunnen dingen die mensen niet kunnen: eindeloos schalen, parallel werken en enorme hoeveelheden informatie verwerken. Maar mensen kun je verantwoordelijk houden voor hun gedrag. Als een mens iets serieus fout doet, zitten daar consequenties aan. Maar om bij AI die verantwoordelijkheid te kunnen nemen, moet het proces vele malen beter traceerbaar, uitlegbaar en reproduceerbaar zijn dan bij de menselijke variant. Inmiddels was ik trouwens terug van vakantie, je zou natuurlijk kunnen zeggen dat ons experiment was mislukt. Maar we besloten het project aan de UvA op te schalen, met ook promovendi en postdocs erbij. We wilden de problemen goed boven tafel krijgen. Daarom zijn we gaan zoeken naar een manier om de taakomschrijving en context uit elkaar te trekken. Als die twee door elkaar lopen, ontstaat er spanning. Uiteindelijk hebben we daarvoor technieken gebruikt uit onder meer business process modeling en process mining. Daarmee kun je de context apart vastleggen, zonder dat die de taakomschrijving van de agent gaat beïnvloeden.”

Wat werd vervolgens de oplossing?

“We gebruikten daarvoor onder meer Petri-nets: een manier om vast te leggen hoe kleine taken met elkaar samenhangen. De context zit dan niet meer in de agent zelf, maar in het proces eromheen, en daardoor kun je agents heel klein maken. Wij noemen ze disposable micro agents: voor één afgebakende taak wordt een agent gestart. Daarna gaat het resultaat terug het proces in en is die agent niet meer nodig. Dat klinkt misschien wat technisch, maar het principe is simpel. In een due diligence-proces bestaat de controle bijvoorbeeld uit allerlei kleine checks: is het bedrijf financieel gezond? Klopt de inschrijving bij de KvK? Past de omvang van de opdracht bij de omzet van het bedrijf? Voor elke check kun je een agent met een duidelijke taakomschrijving en precies genoeg context gebruiken. Daarmee reduceer je het risico op hallucinaties en emergent gedrag aanzienlijk. Bovendien, het hele proces wordt daardoor beter traceerbaar, uitlegbaar en reproduceerbaar en dat is nog belangrijker bij het afleggen van verantwoording dan het reduceren van fouten.”

U noemde het net ook al even, waarom zijn traceerbaarheid, uitlegbaarheid en reproduceerbaarheid zo belangrijk?

“Dat is eigenlijk de heilige drie-eenheid van audit. En doordat de context in zo’n Petri-nets zit, heb je een formele procesbeschrijving waarin precies vastligt hoe alle taakjes met elkaar samenhangen. Elke check wordt op dezelfde manier uitgevoerd en achteraf kun je exact terugzien welke input is gebruikt, welke output eruit kwam en waarom een bepaalde keuze is gemaakt. Dat is zelfs sterker dan bij een menselijk proces, want niemand weet twee jaar later nog precies waarom die beslissing is genomen. Toen we dit hadden gebouwd, konden we ook processen voor bestellingen en betalingen gaan inrichten. Maar al snel bleek dat een echte webshop in productie zetten veel te veel werk was voor een onderzoeksteam. Toch hadden we die operationele data wel nodig. Want als je onderzoek wilt doen naar autonome AI-processen, moet je ook kunnen zien wat er in zulke processen goed en fout gaat.”

U past die gedachte inmiddels toe bij de gemeente Amsterdam, leg eens uit?

“Vanuit KPMG en Cyberdune Agents en het onderzoek vanuit de UvA op de achtergrond, werken we inderdaad samen met gemeente Amsterdam. We doen daar een experiment met de basale integriteitstoets: de controle of een nieuwe leverancier aan alle voorwaarden voldoet om leverancier te mogen worden. Die toets lijkt eenvoudig, maar in de praktijk bestaat zo’n leverancierscontrole uit veel kleine checks en voor mensen is dat erg tijdrovend werk, want per leverancier ben je al snel een paar uur bezig. Daarom hebben we eerst een demonstrator (werkend prototype, red.) gebouwd om te laten zien hoe zo’n proces met kleine, afgebakende agents een stuk sneller en beter kan werken.

De echte vraag daarbij is: kun je zo’n proces ook betrouwbaar organiseren? Je kunt niet zeggen: vanaf morgen doet AI dit. Je moet eerst een periode schaduwdraaien, waarbij de bestaande werkwijze naast de nieuwe AI-aanpak blijft lopen. Vervolgens vergelijk je de oude en nieuwe uitkomsten. Komt de AI tot dezelfde beoordeling als de mensen? En als dat niet zo is, waar zit dan het verschil? Misschien is het oude proces beter, misschien de nieuwe uitkomst, maar dat moet je kunnen onderbouwen. Precies daar komen traceerbaarheid, uitlegbaarheid en reproduceerbaarheid bij elkaar. Pas als je dat goed hebt ingericht en op de juiste punten controles hebt ingevoerd in lijn met wet- en regelgeving over automatische besluitvorming, kun je zo’n workflow verantwoord in productie nemen.”

Als een menselijk proces wordt vervangen door een AI-workflow, wat betekent dit voor het vertrouwen?

“Je verplaatst vertrouwen dan eigenlijk van een menselijk proces naar een systeemproces. In het huidige proces weet je wie welke taak uitvoert, wie je kunt aanspreken en als iemand buiten zijn boekje gaat, kun je die persoon aanspreken. Als je dat vervangt door een autonome AI-workflow, moet je dat vertrouwen opnieuw organiseren. Dan moet je kunnen nagaan hoe een uitkomst tot stand komt en of die ook opnieuw tot stand zou komen. Maar de grootste verandering zit misschien wel in de organisatie eromheen. Bij een menselijk proces loopt verantwoordelijkheid vaak via teams en leidinggevenden. Bij een AI-workflow is dat minder vanzelfsprekend. Wie bewaakt het systeem? Wie is verantwoordelijk voor de uitkomsten? Wie grijpt in als het misgaat? Hoe we daarmee om moeten gaan is nu nog niet precies duidelijk. Dat zijn vragen die de komende jaren moeten worden beantwoord.”

Maakt AI het werk lichter?

“AI kan werk sneller maken, maar dat betekent niet dat het werk ook écht lichter wordt. Ik zie eerder dat de belasting verandert. Neem iets simpels als een slide deck. Eerder vroeg ik een junior om op basis van bulletpoints een presentatie te maken. Twee dagen later lag er een nette versie. Nu heb ik die binnen een uur. Dat klinkt efficiënt, maar het betekent ook dat de cyclus veel korter wordt en de verwachting omhooggaat. Bovendien verdwijnt vooral het laagintensieve werk: uitzoeken, structureren, voorbereiden. Wat overblijft, is vaak het werk dat juist veel concentratie vraagt: beoordelen, communiceren, lastige keuzes maken, met klanten in gesprek gaan. De verhouding verschuift dus van veel laagintensief werk met af en toe pieken, naar veel meer hoogintensief werk. Daar zit een risico. Je kunt niet van mensen verwachten dat ze tachtig procent van hun tijd op maximale concentratie werken.”

Wat betekent dat voor accountants?

“Voor accountants geldt dat net zo goed. Als AI het voorbereidende werk comprimeert, blijft vooral het moeilijke menselijke werk over: uitleggen, doorvragen, oordelen en verantwoordelijkheid nemen. Dus ja, AI kan werk efficiënter maken. Maar lichter? Op dit moment zie ik eerder het tegenovergestelde gebeuren.”

Waar ziet u de eerste echte toepassingen van autonome AI-workflows binnen accountantskantoren?

“De eerste toepassingen zie ik vooral in afgebakende werkzaamheden met hoog volume die sterk op regels gebaseerd zijn. Denk aan reconciliaties, controles op volledigheid van audittrails en het detecteren van afwijkingen in journaalposten. Dit soort taken hebben een duidelijk gedefinieerd input- en outputdomein en er is vaak al ground truth (betrouwbare brongegevens, red.) beschikbaar om systemen op te toetsen. Complexere toepassingen waarin professioneel, deskundig oordeel centraal staat, zoals materialiteitsinschattingen, liggen nog wat verder weg. Daar is contextueel redeneren nodig op een niveau van betrouwbaarheid dat huidige systemen niet zelfstandig kunnen waarborgen, zeker niet in een omgeving waar controleerbaarheid en consistentie cruciaal zijn.”

Wat moeten kantoren vooral níét doen als zij met AI-agents aan de slag gaan?

“Autonomie is een spectrum. Op kritieke beslismomenten moet altijd een expliciete menselijke controle plaatsvinden. Daarnaast zie ik twee veelgemaakte fouten. Ten eerste: het blind vertrouwen op goed geformuleerde output. AI-systemen kunnen overtuigend overkomen, maar zijn juist op het gebied van cijfers en regelgeving gevoelig voor fouten of ‘hallucinaties’. Ten tweede: de implementatie zien als puur een IT-project. Wat in ieder geval niet kan, is dat AI-workflows alleen een IT-verantwoordelijkheid zijn. Vaktechniek moet een doorslaggevende stem hebben waar professioneel oordeel en automatisering samenkomen, dat is vanuit aansprakelijkheid niet onderhandelbaar. Uiteindelijk blijft de individuele accountant verantwoordelijk. Het professionele oordeel, en de verantwoording daarvan, kun je niet delegeren aan een systeem.”

Welke competentie wordt hierdoor belangrijker voor accountants?

“Procesdenken wordt belangrijker. Accountants moeten begrijpen waar in een workflow AI wordt ingezet, wat het systeem optimaliseert en waar de zwakke plekken zitten. Technische kennis is nodig, maar tot op zekere hoogte. Je hoeft geen diep begrip te hebben van onderliggende AI-architecturen, maar wel van basisbegrippen zoals nauwkeurigheid, onzekerheid en de probabilistische aard van deze systemen. Uiteindelijk is de belangrijkste competentie kritisch denkvermogen: weten wanneer je een systeem moet volgen, wanneer je moet doorvragen en wanneer je moet ingrijpen, en dat ook goed kunnen vastleggen. Dat blijft de kern van het vak.”

Tot slot: de bekende angst is dat AI het werk van accountants overneemt. Terecht?

“Ik denk niet dat accountants binnen een paar jaar massaal worden vervangen. Dat beeld is volgens mij vooral ook marketing van de grote technologiebedrijven. Het werk gaat wél veranderen en door autonome workflows kan de intensiteit van het werk dus toenemen. Als je veel meer kunt controleren, ga je waarschijnlijk ook meer wíllen controleren. De accountant zal in elk geval veel meer interactie hebben met AI en kan daardoor misschien duizend keer meer checks doen dan nu. Maar de beslissing of de cijfers kloppen, blijft bij de accountant. AI kan dat proces efficiënter en veelomvattender maken, maar neemt het professionele oordeel niet over.”

Tekst: Claudia Pietryga

Foto’s: Elisabeth Ismail

Deze bijdrage komt uit het AV-magazine met als thema ICT & AI. Dit magazine is verschenen in juli 2026: https://www.accountancyvanmorgen.nl/kennisdoc/av-2-2026-ict-ai/

ICT & AI | “AI kan ongelofelijk veel, maar we moeten het niet als een echt mens gaan zien”

ICT & AI | Technologie en de accountant: allebei (even?) relevant

ICT & AI | “Het is een evolutie, geen revolutie”

ICT & AI | Hoe denkt en kijkt een hacker?

ICT & AI | “Ook OT wordt het terrein van de accountant”

Categorie

Info

Gerelateerde artikelen