O Google ha annunciato, questo martedì (14), il suo nuovo modello di generazione video, Veo, che fa parte dello strumento VideoFX. La nuova funzionalità consentirà la creazione di video basati su istruzioni testuali e arriva come concorrente Sora da OpenAI.
Lo strumento è stato annunciato in una trasmissione in diretta durante il Google I / O 2024. Oltre a consentire la creazione di contenuti, la piattaforma consentirà l'interazione con le altre tecnologie dell'azienda, come lo strumento per creare musica utilizzando l'intelligenza artificiale.
Cos'è Veo

Durante la presentazione dell'ultima intelligenza artificiale sviluppata da Google per la creazione di video, è stato sottolineato un punto chiave: Veo va oltre la tipica durata di un minuto, offrendo risultati con una risoluzione di 1080p e la possibilità di esplorare una varietà di stili cinematografici e immagini.
Secondo l'azienda, questa IA ha conoscenze avanzate sia nel linguaggio naturale che nella semantica visiva, consentendo un rendering più accurato anche con comandi più lunghi e dettagliati.
Google afferma che Veo è in grado di generare contenuti coerenti e coesi, in cui persone, animali e oggetti si muovono in modo realistico nei video. Inoltre, lo strumento è in grado di comprendere termini specifici dell’universo cinematografico, come “timelapse” e “registrazione aerea di un paesaggio”, fornendo così un maggiore controllo creativo sui risultati desiderati.
La presentazione della nuova IA era rivolta a un gruppo di filmmaker e creatori, che hanno avuto l'opportunità di provare il modello e fornire feedback all'azienda, contribuendo a possibili miglioramenti futuri.
Google ha inoltre annunciato che alcune funzionalità di Veo verranno gradualmente integrate in YouTube Shorts e in altri prodotti dell'azienda, senza però specificare una data in merito.
Video FX
VideoFX è un portale a cui si accede tramite il browser stesso per utilizzare Veo, un modello generativo creato dall'azienda per competere con Sora, di OpenAI. Attualmente la novità è disponibile in fase sperimentale solo negli Stati Uniti.
Con solo un messaggio di testo, immagine o video, le nuove funzionalità consentono di creare e modificare video di oltre 60 secondi in diversi stili visivi, consentendo all'utente di esplorare le idee più diverse.
Secondo Google, lo strumento offre anche alcune opzioni di modifica, come la modalità Storyboard per lavorare sulle scene generate, oltre all'inclusione di musica ed effetti sonori.
I residenti negli Stati Uniti possono accedere allo strumento tramite a lista d'attesa. Al momento non è previsto il lancio in Brasile e in altri paesi.
Immagine FX
Google ha anche annunciato Image 3, disponibile in ImageFX da Google Labs. Con esso è possibile creare immagini completamente nuove basate su un messaggio di testo, qualcosa di molto simile a quello che vediamo ad esempio in MidJourney.
Con la 3a generazione, Google promette che gli utenti avranno immagini altrettanto fedeli alla realtà, grazie ai miglioramenti nella qualità e nella fedeltà della generazione delle immagini.
Secondo il colosso di Mountain View, Imagem 3 sarà anche in grado di inserire parole e frasi nelle immagini, cosa che presenta ancora qualche problema su piattaforme con proposte simili.
Musica FX
Google ha anche annunciato un altro strumento di intelligenza artificiale generativa per la creazione di musica, MusicFX con AI Sandbox. La nuova funzionalità, che arriva in collaborazione con YouTube, competerà direttamente con aziende come Moises.ai, che utilizza l'intelligenza artificiale per separare le tracce della stessa canzone.
"Questi strumenti sono progettati per aprire un nuovo parco giochi alla creatività, consentendo alle persone di creare nuove sezioni strumentali da zero, trasformare il suono in nuovi modi e molto altro ancora.“, ha affermato Google durante la presentazione.
ImparaLM

Infine, Google ha rivelato la sua nuova famiglia di modelli di intelligenza artificiale generativa ottimizzati per l’apprendimento. LearnLM è progettato per guidare gli studenti in modo “conversazionale” su una varietà di argomenti.
"LearnLM si basa sulla ricerca educativa, rendendo le esperienze di apprendimento più personali e coinvolgenti", ha spiegato James Manyika, vicepresidente senior per la ricerca, la tecnologia e la società di Google Research, al Google I/O martedì.
LearnLM è attualmente basato su funzionalità di tutti i prodotti Google, tra cui YouTube, le app Gemini di Google, Ricerca Google e Google Classroom.
Nelle applicazioni Gemini, ad esempio, sarà possibile, nei prossimi mesi, creare chatbot personalizzati che potranno agire come esperti su diverse materie. I chatbot forniranno guida allo studio e attività pratiche, come quiz e giochi, rispettando le preferenze individuali di ogni studente.
Vedi anche:
Google mostra Astra, un rivale GPT-4 che vede il mondo reale attraverso la fotocamera del cellulare.
Fonte: Google.
Scopri di più su Showmetech
Iscriviti per ricevere le nostre ultime novità via e-mail.