AI is nog nooit zo goedkoop geweest als nu

Hoeveel werk zou jij verrichten voor €20 in de maand?

Mijn AI tool houdt voor €20 in de maand mijn boekhouding bij, schrijft mijn nieuwsbrieven, zet mijn meeting notes om in actiepunten, update mijn CRM, monitort mijn social media performance, houdt de bewegingen van mijn concurrenten in het oog, en zo kan ik nog even doorgaan.

Ik heb een eenmanszaak en toch voelt het alsof ik een team van minstens 5 werknemers heb.

Te mooi om zo te blijven? Klopt.

Die vaste prijs houdt geen stand.

Gelukkig worden AI-bedrijven vandaag nog goed gesubsidieerd, want ze scheuren er hun broek aan: zware gebruikers kosten hen meer dan ze opbrengen. En met een beursgang in zicht, is dat niet langer houdbaar.

Sam Altman - founder van OpenAI, het bedrijf achter ChatGPT - zei het in maart al in een interview:

"we see a future where intelligence is a utility like water or electricity and people buy it from us on a meter."

Intelligentie als nutsvoorziening, afgerekend per verbruik.

Enkele maanden geleden leverde die uitspraak best wat commotie op, vandaag zien we het geleidelijk aan realiteit worden:

Op 16 juni rolde Microsoft Copilot Cowork uit naar al zijn gebruikers, met afrekening per verbruik. Geen vast bedrag meer, maar een meter die meeloopt met wat je gebruikt. Reken grofweg zo'n €3 euro per kleine taak en €10 per grote taak. Voor heavy users zoals mezelf, zit je snel aan €500 per maand.
Vanaf 7 juli, wordt ook het nieuwste model van Anthropic in Claude - Fable 5 - betalend per verbruik.

Het wordt voor velen de eerste keer dat je je moet afvragen of je écht de hoogste intelligentie nodig hebt voor de taak die je wil uitvoeren en of je bereid bent daar een premium voor te betalen.

Token management wordt dé skill van de komende jaren.

Tokens zijn de stukjes tekst waarmee een AI-model rekent, en hoe meer je er verbruikt, hoe hoger de rekening wanneer je betaalt per verbruik.

Slim omgaan met je tokens wordt dus belangrijker dan ooit. Want wie nu niet oplet, krijgt straks hetzelfde voor als Uber.

Het bedrijf zag in vier maanden zijn complete jaarbudget voor AI verdampen.

Ook al heb je vandaag nog een vast abonnement, en heb je als Copilot-gebruiker geen (zichtbare) token-limieten, is een goed begrip van tokens vandaag al belangrijk voor jou, om twee redenen.

De snelheid en kwaliteit van je antwoorden. Ook al zie je het niet, hoe meer tokens jij gebruikt, hoe voller het werkgeheugen van je model geraakt, en hoe meer het elke beurt moet herlezen. Dat maakt antwoorden trager en vaak slechter, want het model verliest focus tussen de ruis.
Het in de vingers krijgen voor wanneer het echt telt. Copilot Cowork & Fable 5 zijn de eerste signalen van een grotere verschuiving die volop bezig is. Voor je het weet wordt jouw vaste prijs ook variabel. De gewoontes die je nu opbouwt, bepalen straks mee je rekening.

Hoe het werkt: wat verbruikt tokens?

Je input. Alles wat jij in je chat stopt: je prompt, je bestanden, de hele gesprekshistoriek, je instructies.

Je output. Alles wat het model teruggeeft. En daar zit een addertje: output weegt ongeveer vijf keer zwaarder door dan input. Bij Claude Sonnet bijvoorbeeld kost een miljoen input-tokens 3 dollar, een miljoen output-tokens 15 dollar. De reden: je input wordt in één keer gelezen, je output moet woord per woord gegenereerd worden.

En dan de stille verbruikers. Telkens jouw AI-tool een andere tool aanroept, een web search uitvoert, een berekening maakt, of bij complexe taken even "nadenkt", worden daar tokens voor gebruikt.

De rode draad: alles wat in je chat blijft staan, betaal je elke beurt opnieuw. Een lange chat stapelt dus snel verbruik op.

Zeven gewoontes om tokens te besparen.

1. Eerst denken, dan prompten

Bereid je prompt zo goed mogelijk voor. Laat AI je eerst extra vragen stellen voor extra context, in plaats van blind te starten en daarna drie keer te moeten bijsturen.

2. Gebruik Markdown waar mogelijk

Markdown is een bestandsformaat, net zoals PDF, PPT, Excel, Word etc. Het goede aan Markdown is dat het 'tekst-only' is en daardoor heel goed gelezen en geproduceerd kan worden door AI. Hierdoor kost het je ook minder tokens. Ter vergelijking:

Eén markdown-bestand kost minder dan 100 tokens.
Datzelfde stuk tekst als screenshot: ongeveer 1.300.
Als PDF-pagina: ongeveer 3.000.

Gebruik dus nooit een screenshot als je de tekst gewoon kan kopiëren. En zet al je context die puur tekstueel mag zijn om in Markdown-formaat. Tip: gebruik File2Markdown.ai of vraag het aan je AI-tool.

3. Start een nieuwe chat en batch je vragen

Bij elke nieuwe vraag in dezelfde chat herleest je AI-tool je volledige gesprek. Na 10 vragen tellen die tokens pijlsnel op. Nieuw onderwerp? Start een nieuwe chat. En stel je vragen gebundeld: vijf vragen in één prompt kost minder dan vijf losse opeenvolgende vragen. Iets vergeten? Bewerk je vorige prompt in plaats van een nieuwe te sturen.

4. Beperk je outputlengte actief

Output weegt vijf keer zwaarder, weet je nog. Dit is dus je grootste hefboom. Zeg expliciet hoe lang het antwoord mag zijn: "max 3 bullet points", "alleen de conclusie", "geen inleiding".

5. Kies bewust je model

Niet elke taak heeft het nieuwste - en dus meest intelligente - model nodig. Een lichter model voor een lichte taak verbruikt een fractie. In Claude is het nieuwste model - Fable 5 - bijvoorbeeld dubbel zo duur in tokens vs. het vorige model Opus 8. By default staat vaak het nieuwste model geselecteerd, kies dus bewust welk model je nodig hebt.

6. Verbeter je instructies

Verbeter je prompts, skills, agents en geplande taken bij elke iteratie. Betrap je jezelf erop dat je steeds dezelfde correctie geeft? Leg ze één keer vast, dan moet je niet telkens herwerken. Meer hierover in deze nieuwsbrief over de opmars van skills.

7. Hou je lopende zaken op orde

Connectoren, skills, geplande taken, kunnen je ongelooflijk veel tijd besparen. Maar als je er niet naar omkijkt, kunnen ze ook ongelooflijk veel tokens verspillen. Doe dus om de zoveel tijd eens grote kuis. Welke connectors gebruik je niet meer? Welke geplande prompt of skill mag op non-actief?

Pro tip: begin bij je duurste gewoonte. Voor de meeste mensen is dat output. Zet er deze week één regel op, bijvoorbeeld "antwoord in max 5 bullets", en kijk hoeveel sneller en scherper je antwoorden worden.

Krijg het in de vingers voor de meter begint te lopen.

Experimenteren met AI was nog nooit zo goedkoop als vandaag. Zorg dat je het nu in de vingers krijgt, zodat je het efficiënt inzet wanneer je straks voor elke token betaalt.

Wanneer jij er klaar voor bent, help ik je graag verder:

AI-first Bootcamp (met focus op Claude): in vier weken leer je hoe je AI structureel inbouwt in je werkdag, van de juiste tools tot de workflows die je tijd écht terugwinnen. Verzeker één van de 15 plekjes voor augustus!
Team Coaching (Copilot, Claude of ChatGPT): van een AI Keynote die je medewerkers maanden later nog aan het experimenteren houdt, tot een AI Academy waarop je team zijn eerste AI-agenten bouwt. Aangepast aan jouw level, toolstack en werkweek.

Liefs, Emma

Krijg de laatste inzichten in jouw mailbox.

De wereld van AI evolueert razendsnel. Ik onderzoek 24/7 de mogelijkheden en deel mijn strafste ontdekkingen met jou in een wekelijkse* nieuwsbrief.

* Geen verplicht nummertje. Ik stuur je enkel wanneer ik écht iets te vertellen heb.