Google Gemini Live API biedt realtime spraakvertaling in meer dan 70 talen

10 juni 2026 · 06:00 · Claude (Anthropic) · claude-sonnet-4-6

Google heeft de Gemini Live API uitgebreid met live spraak-naar-spraak vertaling in meer dan 70 talen. Met het nieuwe gemini-3.5-live-translate-preview model kunnen ontwikkelaars taalbarrières in realtime doorbreken met ultralage latency.

Google heeft zijn Gemini Live API uitgebreid met een krachtige realtime vertaalfunctie: live spraak-naar-spraak vertaling in meer dan 70 talen. Met het nieuwe model gemini-3.5-live-translate-preview biedt Google ontwikkelaars de mogelijkheid om taalbarrières in realtime te doorbreken — van klantenservicegesprekken tot internationale vergaderingen. Deze doorbraak markeert een nieuwe fase in AI-gedreven communicatietechnologie.

Wat is de Gemini Live API met live vertaling?

De Gemini Live API is Google's platform voor realtime, multimodale AI-interactie. De nieuwste uitbreiding richt zich specifiek op simultaanvertaling van gesproken taal. In tegenstelling tot traditionele vertaalsoftware die wacht tot een zin volledig is uitgesproken, verwerkt deze API continu audiostromen — vergelijkbaar met een professionele tolk die meeluistert en direct vertaalt.

Het model ondersteunt meer dan 70 talen, waaronder Nederlands, Engels, Spaans, Frans, Duits, Russisch, Chinees, Japans en Koreaans. Elke taal wordt geïdentificeerd via een BCP-47-taalcode (zoals "nl" voor Nederlands), wat naadloze integratie in bestaande applicaties mogelijk maakt. Bekijk voor meer context over de ontwikkeling van zulke technologieën onze pagina over de geschiedenis van kunstmatige intelligentie.

Hoe werkt de realtime vertaling technisch?

De technische implementatie is indrukwekkend in zijn doeltreffendheid. Ontwikkelaars sturen ruwe PCM-audiodata — 16-bit, 16 kHz — in kleine blokken van 100 milliseconden naar de API. Terug ontvangen zij vertaalde audio op 24 kHz, wat zorgt voor een hoge audiokwaliteit aan de uitvoerzijde.

Een opvallend kenmerk is de lage latency. Omdat het systeem continu luistert in plaats van te wachten op pauzes in de spraak, is de vertraging minimaal. Dit maakt de functie geschikt voor toepassingen waarbij snelheid essentieel is. Naast de vertaalde audio biedt de API ook optionele realtime transcripties, zowel van de originele invoer als van de vertaalde uitvoer — handig voor toepassingen die ook een schriftelijk verslag van een gesprek willen bijhouden.

Configuratiemogelijkheden en veilige integratie

Ontwikkelaars kunnen de API aanpassen via de targetLanguageCode-parameter, waarmee ze de doeltaal instellen. Een extra parameter, echoTargetLanguage, biedt verdere controle over het systeemgedrag. Belangrijk om te weten: de API ondersteunt momenteel alleen audio-invoer — tekstinvoer voor vertaling is niet mogelijk binnen deze live modus.

Voor client-side toepassingen — zoals mobiele apps of webapplicaties — biedt Google ephemeral tokens aan. Dit zijn tijdelijke authenticatietokens waarmee ontwikkelaars hun API-sleutels veilig kunnen verbergen voor eindgebruikers, een cruciaal beveiligingsvoordeel voor productieomgevingen.

Beperkingen en uitdagingen

Google is transparant over de huidige beperkingen van de technologie. Zo kunnen sterke accenten de taaldetectie bemoeilijken, en bij snelle wisseling tussen talen kan het systeem moeite hebben met het bijhouden van de juiste taal. Daarnaast kan de stemreplicatie inconsistent zijn bij lange pauzes, en kan achtergrondgeluid leiden tot artefacten in de vertaalde audio.

Het feit dat Google deze beperkingen openlijk documenteert, getuigt van een volwassen benadering van AI-productontwikkeling. Eerlijkheid over wat de technologie wel en niet kan, helpt ontwikkelaars om realistische verwachtingen te stellen en de juiste use cases te kiezen.

Toepassingsmogelijkheden voor bedrijven en ontwikkelaars

De mogelijkheden van realtime AI-vertaling zijn enorm breed. Enkele veelbelovende AI-toepassingen zijn:

Klantenservice: bedrijven kunnen meertalig communiceren zonder tweetalig personeel aan te nemen.
Internationale vergaderingen: deelnemers spreken hun moedertaal terwijl anderen een directe vertaling ontvangen.
Onderwijs: taalonderwijs en internationale uitwisselingsprogramma's profiteren van directe vertaalondersteuning.
Telemedische zorg: artsen en patiënten met verschillende moedertalen kunnen effectiever communiceren.

Conclusie: Google zet de standaard voor realtime AI-communicatie

Met de live vertaalfunctie in de Gemini Live API laat Google zien dat AI-gedreven communicatietechnologie een nieuwe fase ingaat. Waar vertaalsoftware vroeger batchgewijs werkte en soms seconden nodig had, is realtime spraak-naar-spraak vertaling in meer dan 70 talen nu toegankelijk voor iedere ontwikkelaar via een eenvoudige API-integratie.

De combinatie van lage latency, hoogwaardige audio-uitvoer, optionele transcripties en veilige authenticatie maakt dit een serieuze tool voor productieomgevingen. Tegelijkertijd zijn er nog uitdagingen te overwinnen, met name rondom accenten en achtergrondgeluid — verbeteringen die ongetwijfeld in toekomstige modelversies zullen volgen. Volg meer AI-nieuws op Stersoftware of bezoek onze kennisbank voor diepgaandere informatie over de nieuwste AI-ontwikkelingen.

Google AI for Developers

Bron: Google AI for Developers

Gerelateerd nieuws

OpenAI-AI-agent hackt Hugging Face: incident pas na een week ontdekt

Google zet toon met recordinvesteringen in AI-infrastructuur

OpenAI AI-agent ontsnapt uit testomgeving en voert hack uit op Hugging Face

Google Gemini Live API biedt realtime spraakvertaling in meer dan 70 talen

Wat is de Gemini Live API met live vertaling?

Hoe werkt de realtime vertaling technisch?

Configuratiemogelijkheden en veilige integratie

Beperkingen en uitdagingen

Toepassingsmogelijkheden voor bedrijven en ontwikkelaars

Conclusie: Google zet de standaard voor realtime AI-communicatie

Gerelateerd nieuws

Ster Software

Verkennen

Over

Juridisch