Un modello di ChatGPT che parla e risponde in modo umano: spunta GPT Bidi 1

Aggiungi telefonino.net come Fonte preferita su Google

Salto di qualità nelle interazioni vocali di ChatGPT: secondo recenti leak, OpenAI starebbe sviluppando un nuovo modello audio bidirezionale chiamato GPT Bidi 1, una tecnologia che potrebbe cambiare radicalmente il modo in cui gli utenti conversano con ChatGPT. Questo nuovo modello, infatti, consentirebbe all’assistente di parlare, ascoltare e comprendere l’utente simultaneamente.

Gestirà input e output audio nello stesso istante

Le informazioni sono state individuate da TestingCatalog, che ha scoperto riferimenti interni al nuovo modello all’interno del codice dell’applicazione.

“Bidi” sarebbe l’abbreviazione di “bidirectional”, ovvero una struttura bidirezionale progettata per permettere all’assistente di gestire contemporaneamente input e output vocali. Nei riferimenti interni, GPT Bidi 1 viene descritto come un “grande salto in avanti nell’intelligenza artificiale” e come “la prossima generazione vocale” per ChatGPT.

Secondo quanto emerso, il modello sarà collocato nel selettore dei modelli tra le impostazioni dell’app, accanto alle modalità vocali standard e avanzata. Una volta selezionato GPT Bidi 1, l’interfaccia mostrerebbe una bolla vocale di colore giallo per indicare l’attivazione.

Un successivo report pubblicato da TestingCatalog sostiene che GPT Bidi 1 abbia già iniziato a raggiungere una parte degli utenti dell’app ChatGPT. La distribuzione limitata suggerisce che OpenAI potrebbe essere pronta a lanciare ufficialmente la nuova funzione nel corso dei prossimi giorni, anche se al momento non esistono comunicazioni ufficiali da parte dell’azienda.

GPT Bidi 1 risponderà in modo naturale

Ma come funzionerà GPT Bidi 1? Stando alle prime informazioni, il modello sarà capace di reagire in modo molto più naturale durante una conversazione, fornendo anche piccoli segnali vocali di conferma, come un semplice “ok” quando l’utente rallenta o fa una pausa, senza interrompere il flusso della conversazione.

L’obiettivo sembra essere quello di simulare un dialogo umano più realistico, eliminando alcune delle rigidità che caratterizzano ancora oggi le interazioni vocali con gli assistenti AI. Sembrerebbe inoltre possibile modificare il comportamento in tempo reale durante una richiesta.

Ad esempio, se un utente chiedesse al modello di contare da uno a dieci e successivamente interrompesse la richiesta chiedendo di invertire l’ordine del conteggio, GPT Bidi 1 sarebbe in grado di adattarsi immediatamente senza perdere il contesto della conversazione.

Uno dei limiti della modalità vocale di ChatGPT sono sempre state le conversazioni lunghe. Secondo il leak, GPT Bidi 1 sarebbe progettato per mantenere il filo dell’intera conversazione anche durante dialoghi lunghi, mantenendo informazioni o riferimenti.

Segui telefonino.net su Google Discover

Un modello di ChatGPT che parla e risponde in modo umano: spunta GPT Bidi 1

Gestirà input e output audio nello stesso istante

GPT Bidi 1 risponderà in modo naturale

Ti consigliamo anche

Gemini aggiunge video AI, musica e Canvas nell’overlay

iOS 27 Beta 2: tutte le novità per Siri, Wallet e RCS

Google Health 5.02: più statistiche e attività orarie

WhatsApp porta il design Liquid Glass nelle chat iPhone