Un modello di ChatGPT che parla e risponde in modo umano: spunta GPT Bidi 1

Un nuovo leak svela GPT Bidi 1, il nuovo modello audio bidirezionale di OpenAI capace di parlare e ascoltare contemporaneamente senza interruzioni.
Un modello di ChatGPT che parla e risponde in modo umano: spunta GPT Bidi 1

Salto di qualità nelle interazioni vocali di ChatGPT: secondo recenti leak, OpenAI starebbe sviluppando un nuovo modello audio bidirezionale chiamato GPT Bidi 1, una tecnologia che potrebbe cambiare radicalmente il modo in cui gli utenti conversano con ChatGPT. Questo nuovo modello, infatti, consentirebbe all’assistente di parlare, ascoltare e comprendere l’utente simultaneamente.

Gestirà input e output audio nello stesso istante

Le informazioni sono state individuate da TestingCatalog, che ha scoperto riferimenti interni al nuovo modello all’interno del codice dell’applicazione.

“Bidi” sarebbe l’abbreviazione di “bidirectional”, ovvero una struttura bidirezionale progettata per permettere all’assistente di gestire contemporaneamente input e output vocali. Nei riferimenti interni, GPT Bidi 1 viene descritto come un “grande salto in avanti nell’intelligenza artificiale” e come “la prossima generazione vocale” per ChatGPT.

Secondo quanto emerso, il modello sarà collocato nel selettore dei modelli tra le impostazioni dell’app, accanto alle modalità vocali standard e avanzata. Una volta selezionato GPT Bidi 1, l’interfaccia mostrerebbe una bolla vocale di colore giallo per indicare l’attivazione.

Un successivo report pubblicato da TestingCatalog sostiene che GPT Bidi 1 abbia già iniziato a raggiungere una parte degli utenti dell’app ChatGPT. La distribuzione limitata suggerisce che OpenAI potrebbe essere pronta a lanciare ufficialmente la nuova funzione nel corso dei prossimi giorni, anche se al momento non esistono comunicazioni ufficiali da parte dell’azienda.

GPT Bidi 1 risponderà in modo naturale

Ma come funzionerà GPT Bidi 1? Stando alle prime informazioni, il modello sarà capace di reagire in modo molto più naturale durante una conversazione, fornendo anche piccoli segnali vocali di conferma, come un semplice “ok” quando l’utente rallenta o fa una pausa, senza interrompere il flusso della conversazione.

L’obiettivo sembra essere quello di simulare un dialogo umano più realistico, eliminando alcune delle rigidità che caratterizzano ancora oggi le interazioni vocali con gli assistenti AI. Sembrerebbe inoltre possibile modificare il comportamento in tempo reale durante una richiesta.

Ad esempio, se un utente chiedesse al modello di contare da uno a dieci e successivamente interrompesse la richiesta chiedendo di invertire l’ordine del conteggio, GPT Bidi 1 sarebbe in grado di adattarsi immediatamente senza perdere il contesto della conversazione.

Uno dei limiti della modalità vocale di ChatGPT sono sempre state le conversazioni lunghe. Secondo il leak, GPT Bidi 1 sarebbe progettato per mantenere il filo dell’intera conversazione anche durante dialoghi lunghi, mantenendo informazioni o riferimenti.

Ti consigliamo anche

Link copiato negli appunti