Google lanceert realtime spraakvertaling via Gemini Live API
10 juni 2026 om 14:00 · Claude (Anthropic) · claude-sonnet-4-6
Google heeft live spraakvertaling toegevoegd aan de Gemini Live API. Met het nieuwe gemini-3.5-live-translate-preview model kunnen ontwikkelaars real-time, spraak-naar-spraak vertalingen bouwen in meer dan 70 talen, waaronder Nederlands.
Google heeft een belangrijke uitbreiding doorgevoerd voor de Gemini Live API: realtime spraakvertaling met extreem lage vertraging, ondersteund in meer dan 70 talen. Met het nieuwe model gemini-3.5-live-translate-preview kunnen ontwikkelaars applicaties bouwen die gesproken taal direct en vloeiend vertalen — zonder te wachten op beurtwisselingen in een gesprek. Dit is een belangrijke stap in de geschiedenis van kunstmatige intelligentie op het gebied van meertalige communicatie.
Wat is de Gemini Live API?
De Gemini Live API is Google's platform voor real-time, multimodale interacties met het Gemini-taalmodel. De API is ontworpen voor toepassingen waarbij lage latentie cruciaal is, zoals live gesprekken, interactieve assistenten en — nu dus ook — directe spraakvertaling. In tegenstelling tot traditionele vertaaldiensten, die tekst als tussenstap gebruiken, werkt de Gemini Live API volledig spraak-naar-spraak: de gebruiker spreekt, en het systeem levert vrijwel onmiddellijk vertaalde spraak terug.
Hoe werkt live vertaling met Gemini?
Het systeem verwerkt binnenkomende audio continu, in blokken van 100 milliseconden, zonder te wachten tot een spreker uitgesproken is. Dit zorgt voor een vloeiende, ononderbroken vertaalervaring die dicht in de buurt komt van simultaanvertaling door een menselijke tolk.
Technisch gezien verwerkt de API audio-input als raw 16-bit PCM bij 16kHz en levert het de vertaalde spraak terug als raw 16-bit PCM bij 24kHz — een hogere uitvoerkwaliteit dan de invoer. Talen worden gespecificeerd via internationale BCP-47 taalcodes (bijvoorbeeld "nl" voor Nederlands of "es" voor Spaans). Optioneel kunnen ontwikkelaars ook transcripties opvragen van zowel de originele als de vertaalde spraak, wat handig is voor logging, toegankelijkheid of ondertiteling.
Meer dan 70 talen, inclusief Nederlands
Een van de opvallendste kenmerken is de brede taalondersteuning: de Gemini Live API ondersteunt meer dan 70 talen, waaronder Nederlands, Duits, Frans, Spaans, Italiaans, Pools en vele andere. Voor Nederlandse bedrijven en ontwikkelaars is dit bijzonder relevant: Nederland-specifieke toepassingen — van klantenserviceplatforms tot internationale vergadertools — kunnen nu profiteren van hoogwaardige, realtime AI-vertaling.
Dit sluit aan op de bredere trend van AI-toepassingen die de taalbarrière in zakelijke en persoonlijke communicatie verlagen. Google positioneert zich hiermee als serieuze concurrent voor gespecialiseerde vertaaldiensten en real-time communicatieplatforms.
Technische mogelijkheden voor ontwikkelaars
Google biedt ontwikkelaars toegang via meerdere programmeertalen en protocollen. De Gemini Live API met live vertaling is beschikbaar in:
- Python — via de officiële Google AI SDK
- JavaScript/TypeScript — voor web- en Node.js-toepassingen
- WebSockets — voor directe, platformonafhankelijke integraties
Een handige extra functie is echoTargetLanguage: hiermee bepalen ontwikkelaars of spraak die al in de doeltaal is gesproken herhaald wordt of als stilte wordt behandeld. Dit maakt de API flexibel inzetbaar voor zowel eenrichtingsvertaling als tweerichtingsgesprekken.
Beperkingen om rekening mee te houden
Ondanks de indrukwekkende mogelijkheden kent het systeem ook enkele beperkingen. De API accepteert uitsluitend audio-input — tekstinvoer wordt (nog) niet ondersteund. Daarnaast erkent Google dat stemreplicatie niet altijd consistent is, en dat automatische taaldetectie moeite kan hebben met zware accenten of snelle taalwisselingen. Voor toepassingen waarbij precisie absoluut noodzakelijk is, zoals medische of juridische tolkdiensten, verdient dit extra aandacht bij de implementatie.
Wat betekent dit voor de markt?
De introductie van realtime AI-spraakvertaling via een ontwikkelaarsplatform als de Gemini Live API heeft verstrekkende gevolgen. Denk aan videobelsoftware die automatisch tolkt, klantenservicebots die moeiteloos schakelen tussen talen, of reisapps die direct mondeling communiceren in het land van bestemming. Google maakt deze technologie toegankelijk voor elke ontwikkelaar met een API-sleutel, wat de drempel voor innovatieve meertalige producten aanzienlijk verlaagt.
Conclusie
Met de Gemini Live API live vertaalfunctie zet Google een grote stap richting naadloze, AI-gedreven meertalige communicatie. De combinatie van lage latentie, brede taalondersteuning — inclusief Nederlands — en toegankelijke integratiemogelijkheden maakt dit tot een van de meest veelbelovende AI-releases van dit moment. Ontwikkelaars en bedrijven die willen profiteren van deze technologie, doen er goed aan deze API nu al te verkennen. Wil je meer weten over vergelijkbare ontwikkelingen? Bezoek meer AI-nieuws of verdiep je via onze kennisbank.
Bron: Google AI for Developers
Ster Software
Het meest complete Nederlandstalige informatieplatform over kunstmatige intelligentie.
Kraaienjagersweg 24
7341 PT Beemte Broekland
© 2026 Ster Software BV · KvK 75474913
Inhoud gegenereerd door Claude (Anthropic) · model: claude-sonnet-4-6
Deze website is gebouwd met Obelisk MCP Services van Ster Software.