Iets opzoeken met behulp van ChatGPT vereist niet langer dat je de juiste tekstprompt invoert. OpenAI is dit najaar begonnen met meer gebruikers de mogelijkheid te geven om verbaal vragen te stellen aan het AI-model. Dat kan onder meer via de ChatGPT-app voor Android- en iOS-smartphones.
De bedoeling is dat je een natuurlijk aanvoelende conversatie met de AI-assistent kunt voeren. Jij spreekt, waarna de AI in gewone zinnen antwoordt. Net zoals bij de tekstversie kun je bijkomende vragen stellen om zo een lopend gesprek te voeren. Achteraf kun je het volledige gesprek tekstueel raadplegen.
Achter de schermen zit niet enkel het ChatGPT 4.0-model, maar ook extra technologie. De omzetting van verbale vragen naar tekstdata die ChatGPT kan verwerken, gebeurt door OpenAI’s Whisper-spraakherkenning. Om weerwoord te kunnen bieden, nam OpenAI dan weer de stemmen van vijf acteurs op. Deze opnames dienden als trainingsdata voor een nieuw tekst-naar-spraak-model. Het is immers onmogelijk om alle potentiële antwoorden vooraf op te nemen, de gesproken respons wordt ad hoc gecreëerd. In de app kies je welke van de vijf stemmen worden gebruikt. Vragen stellen kan in het Nederlands, maar het antwoord is voorlopig in het Engels.
Wat met de intelligente assistenten die spraak herkennen, zoals Google Assistant en Siri van Apple? De bestaande assistenten staan niet zo ver wat betreft het verstaan van natuurlijk gevormde zinnen. Ook op het vlak van het verstaan van complexe vragen en het formuleren van antwoorden die een synthese bieden, staan Google en co niet zo ver. Vooralsnog, want onder meer Google werkt aan zijn eigen Bard AI-model dat op termijn met Google Assistant zal gekoppeld worden.
Bron: OpenAI