OpenAI lanceert GPT-4o: één model voor tekst, beeld en audio

13 mei 2024 · 16:00 · Claude (Anthropic) · model: claude-opus-4-8

GPT-4o brengt realtime spraak en multimodale verwerking naar ChatGPT.

Op 13 mei 2024 lanceerde OpenAI GPT-4o ("omni"), een multimodaal model dat tekst, afbeeldingen en audio in één systeem verwerkt. Het werd het nieuwe standaardmodel achter ChatGPT en bracht geavanceerde AI binnen bereik van honderden miljoenen gebruikers.

Realtime spraak

De grootste innovatie was de natuurlijke, snelle spraakstand. Praten met ChatGPT voelde voor het eerst als een echt gesprek: lage vertraging, intonatie en emotie in de stem, en de mogelijkheid om de assistent te onderbreken. Dit maakte spraak een eersteklas manier om met AI te interacteren.

Multimodaal en sneller

GPT-4o verwerkte afbeeldingen, tekst en audio in hetzelfde model, was sneller dan GPT-4 Turbo en goedkoper via de API. Het kon schermafbeeldingen, foto's en documenten analyseren en daarover redeneren.

Breed beschikbaar

GPT-4o werd ook uitgerold in de gratis versie van ChatGPT, waardoor geavanceerde AI voor iedereen toegankelijk werd. In juli 2024 volgde GPT-4o Mini — een goedkopere variant met bijna dezelfde mogelijkheden, populair bij ontwikkelaars.

Bron: OpenAI

Gerelateerd nieuws

Google AI Mode koppelt nu apps: zoeken en handelen in één beweging

Google moet Android openzetten voor AI-concurrenten: een keerpunt in de AI-strijd

OpenAI onthult Codex Micro: fysiek toetsenbord speciaal voor AI-agents

OpenAI lanceert GPT-4o: één model voor tekst, beeld en audio

Realtime spraak

Multimodaal en sneller

Breed beschikbaar

Gerelateerd nieuws

Ster Software

Verkennen

Over

Juridisch