AI-gestuurde telefonie
AI-telefonie is geen PBX-project meer: voice agents bestaan uit orchestration, SIP, STT/TTS, LLM en workflowintegraties.
Telefonie, STT/TTS, LLM, orchestration en workflow-integraties kunnen los gekozen worden.
Vapi, Retell AI en Bland AI bedienen verschillende keuzes tussen controle, gesprekskwaliteit en volume.
De waarde zit niet in bellen alleen, maar in CRM-acties, opvolging, kwalificatie en overdracht.
1. De moderne stack is modulair
Een AI voice agent bestaat meestal uit vijf lagen: een AI orchestration layer, SIP trunk of telephony-provider, speech-to-text en text-to-speech, een LLM en koppelingen met CRM of workflow-systemen. Die onderdelen hoeven niet meer allemaal in één zelfgebouwde stack te zitten.
Dat verandert de businesscase. Vroeger moest je diep in PBX-configuratie, realtime audio streaming, VAD, latency-optimalisatie en telecomdebugging duiken. Nu kun je veel van die infrastructuur inkopen en je eigen energie steken in de gesprekslogica, data-integraties, opvolging en security.
2. Vapi, Retell AI en Bland AI hebben verschillende rollen
Vapi past goed bij developers die controle willen houden. Het platform ondersteunt onder andere SIP-scenario’s, eigen assistants, tools/function calling en webhooks. De logische verdeling is: Vapi doet voice-infrastructuur en realtime gespreksafhandeling, terwijl jij de businesslogica, validaties, CRM-acties en workflow-integraties bouwt.
Retell AI is interessant wanneer natuurlijke gesprekken, interrupt handling en lage latency belangrijk zijn. Het platform ondersteunt inbound en outbound calling, SIP-integraties, custom functions en custom LLM-integraties via WebSocket. Daardoor past het goed bij AI-receptionists, sales intake en servicegesprekken waar conversation quality zwaar weegt.
Bland AI is sterker gericht op outbound automation en batch/campaign-workflows. Denk aan leadopvolging, reminders, dataverzameling of grote belcampagnes. Voor complexe enterprise orchestration met veel maatwerklogica zou ik eerder naar Vapi of Retell kijken, maar voor volume en campagnegedreven outbound kan Bland praktisch zijn.
3. Begin niet met bellen, begin met beslissen
De fout bij AI-telefonie is om te starten met een stem en een script. Professioneel gezien begin je met de beslisboom: wanneer mag de agent informatie geven, wanneer moet hij verifiëren, wanneer moet hij escaleren, wanneer wordt een taak aangemaakt en wanneer mag er absoluut geen toezegging gedaan worden?
Daarna ontwerp je pas het gesprek. Een goede voice agent heeft korte beurten, duidelijke fallbackregels, logging, transcriptanalyse en een overdracht naar mens of workflow. De stem is zichtbaar voor de gebruiker, maar de echte kwaliteit zit in de afhandeling erachter.
- Leg vast welke acties de agent zelfstandig mag uitvoeren.
- Koppel elk gesprek aan een dossier, lead, ticket of workflow.
- Bewaar transcript, samenvatting, intentie en beslissingen controleerbaar.
- Test op stilte, interrupties, accenten, slechte verbindingen en afwijkende vragen.
4. Security en compliance moeten vroeg mee
Telefonie raakt vaak persoonsgegevens, klantdossiers, afspraken en commerciële informatie. Daarom moet je vooraf bepalen welke data naar de voice-provider gaat, welke gegevens worden opgeslagen, hoe lang transcripts blijven bestaan en wie toegang heeft tot recordings.
Voor serieuze implementaties hoort daar ook monitoring bij: gespreksuitval, latency, escalaties, foutieve classificaties en ongewenste antwoorden. AI-telefonie is pas production-ready wanneer je niet alleen succesvolle gesprekken kunt demonstreren, maar ook falende gesprekken gecontroleerd kunt afhandelen.