Gemini 3.5 Flash ora può vedere lo schermo e usare il computer da solo

Gemini 3.5 Flash può controllare il computer, navigare sul web ed eseguire attività in autonomia grazie al nuovo strumento integrato.
Gemini 3.5 Flash ora può vedere lo schermo e usare il computer da solo

Novità per Gemini 3.5 Flash, che ora può vedere ciò che accade sullo schermo, utilizzare un computer e completare attività in autonomia grazie a una nuova funzione integrata chiamata “computer use”.

Gemini individua voli economici per conto suo

L’annuncio è arrivato attraverso un post ufficiale pubblicato da Google. In precedenza, la creazione di agenti personalizzati in grado di controllare un computer richiedeva l’utilizzo di uno specifico modello dedicato, Gemini 2.5 Computer Use. Con Gemini 3.5 Flash questa funzionalità diventa invece uno strumento integrato direttamente nel modello principale.

La novità è già disponibile per gli sviluppatori che utilizzano le API Gemini e per gli utenti della piattaforma Gemini Enterprise Agent Platform.

Per mostrare le potenzialità del sistema, Google ha realizzato un’istanza dimostrativa basata su Browserbase. Attraverso questa piattaforma, gli utenti possono assegnare un compito a Gemini 3.5 Flash e osservare l’intelligenza artificiale mentre naviga autonomamente nel browser, interagisce con siti web, raccoglie informazioni e restituisce un risultato finale.

Tra gli esempi mostrati, la ricerca dei voli più economici tra Nuova Delhi e Tokyo. In questo scenario Gemini visita diversi siti di prenotazione, inserisce le date di partenza e ritorno, confronta le offerte disponibili e individua le soluzioni più convenienti.

Quali sono i rischi per la sicurezza?

Una tecnologia così avanzata solleva inevitabilmente interrogativi dal punto di vista della sicurezza. L’azienda afferma di aver sottoposto il modello a specifici processi di addestramento in modo da prevenire comportamenti indesiderati, oltre ad aver integrato due nuove misure di protezione.

La prima permette di configurare il sistema affinché richieda una conferma esplicita dell’utente prima di eseguire azioni considerate sensibili o irreversibili. La seconda permette invece a Gemini 3.5 Flash di interrompere automaticamente un’attività nel caso in cui rilevi un tentativo di prompt injection. Google raccomanda inoltre agli sviluppatori di affiancare queste protezioni a ulteriori misure di sicurezza.

Ti consigliamo anche

Link copiato negli appunti