OpenAI ha lanciato ChatGPT Images 2.0: la piattaforma passa da semplice generatore di immagini a un sistema di progettazione strutturato, con template che rendono ancora più semplice la creazione di immagini personalizzate.
Risolti i problemi di rendering del testo e supporto multilingue
La principale novità di ChatGPT Images 2.0 sta nell’introduzione del “ragionamento” applicato alla generazione di immagini. Il modello è ora in grado di elaborare istruzioni complesse prima di procedere alla generazione effettiva e, con l’integrazione di modelli di ragionamento avanzati, può anche consultare il web per ottenere informazioni di contesto.
Tra le nuove funzionalità c’è la possibilità di generare fino a otto immagini contemporaneamente, che mantengono una coerenza visiva tra loro: ad esempio, è possibile creare storyboard o campagne pubblicitarie mantenendo le caratteristiche dei personaggi generati e degli oggetti.
Fin dall’inizio, i testi scritti male sono sempre stati il tallone d’Achille dell’AI generativa. OpenAI dichiara di aver risolto in gran parte il problema con miglioramenti significativi nella tipografia, visibili anche nei caratteri di piccole dimensioni e nelle etichette tecniche. L’aggiornamento, inoltre, potenzia il supporto multilingue e la resa visiva di lingue con caratteri complessi, come giapponese, coreano, cinese, hindi e bengalese.
Migliora anche la flessibilità: il modello ora supporta diversi rapporti d’immagine, che spaziano dall’ultra-wide (3:1) al formato molto stretto e lungo (1:3). Così è possibile creare banner per web, social media, infografiche, poster, prototipi e molto altro con il giusto rapporto visivo. È stato inoltre implementato un maggiore controllo su illuminazione, texture e composizione spaziale.
La generazione base di ChatGPT Images 2.0 è disponibile gratuitamente per tutti gli utenti, anche quelli gratuiti. Le funzioni di ragionamento avanzato e i modelli di “pensiero” sono invece riservati agli abbonati Plus, Pro e Business.