Stile urbano notturno a Tokyo con una donna alla moda in una strada vivace e illuminata.

OpenAI mostra SORA, l'intelligenza artificiale che crea video straordinari!

avatar snello di caterina
Lo strumento ti consente di trasformare i comandi di testo in video fino a 60 secondi. I risultati finali sono incredibili. Aspetto!

In un mondo in cui la creatività incontra la tecnologia all’avanguardia, OpenAI, ancora una volta, sorprende con la sua ultima innovazione: il SORA. Questo nuovo progresso nell’intelligenza artificiale promette di rivoluzionare il modo in cui vengono creati i video, offrendo uno strumento in grado di trasformare i suggerimenti di testo in esperienze visive sorprendenti.

Con un'impressionante capacità di riprodurre scene dettagliate, dal mondo della barriera corallina su carta ai mammut lanosi in una prateria innevata, il SORA è pronto a stupire e ispirare.

Come funziona SORA?

Una donna elegante cammina di notte lungo una strada illuminata di una città giapponese, mettendo in mostra neon, moda urbana, tecnologia e cultura pop.
L'intelligenza artificiale che rende i video impressionanti per la ricchezza di dettagli (Immagine: OpenAI)

Conoscevamo già modelli di intelligenza artificiale che creavano immagini piuttosto sorprendenti basate su testi, come nel caso di questo caso DALL-E, Per esempio. Tuttavia, ora abbiamo a che fare con qualcosa di un po’ più d’impatto con il SORA.

Sebbene esistano già altri tipi di progetti IA che convertono testo in video, SORA si distingue per la sua impressionante capacità di creare immagini fotorealistiche e di produrre clip più lunghi, fino a un minuto. A differenza dei modelli concorrenti che generano solo brevi frammenti di video, la nuova intelligenza artificiale ha il potenziale per creare narrazioni più complesse e coinvolgenti.

La società sviluppatrice garantisce che il file SORA è in grado di creare video della durata massima di un minuto senza perdere la qualità visiva e rimanendo fedele ai parametri definiti dal comando dell'utente. Questo è il grande dettaglio che fa la differenza.

Ma è importante ricordare che il OpenAI sta ancora distribuendo lo strumento ad alcuni creatori selezionati ed esperti di sicurezza per valutare possibili vulnerabilità. L’intenzione è di renderlo disponibile ad un pubblico più vasto nel prossimo futuro.

Esempi

Secondo il post introduttivo di OpenAI, la nuova intelligenza artificiale per i video ha la capacità di creare "Scene complesse con più personaggi, movimenti specifici e dettagli precisi dell'ambiente e dei personaggi“. Inoltre riesce anche a capire come funzionano gli oggetti”interagire nel mondo reale" e anche "Interpreta accuratamente gli oggetti di scena, generando personaggi coinvolgenti che esprimono emozioni vivide“. Un altro dettaglio molto rilevante è la generazione di un video partendo da un'immagine statica, oltre al riempimento dei fotogrammi mancanti in un video esistente o alla possibilità di estenderlo.

Sebbene alcuni video possano ancora rivelare indizi tipici della generazione dell'intelligenza artificiale, il OpenAI afferma che a SORA "potrebbe avere difficoltà a simulare accuratamente la fisica di una scena complessa“. Tuttavia, nel complesso, i risultati sono piuttosto impressionanti. Con una descrizione molto dettagliata, è possibile che Sora superi le aspettative, come nel caso del video qui sotto.

Secondo l'esempio pubblicato da OpenAi, questo è stato il risultato con il prompt “La scena animata presenta un primo piano di un mostro basso e peloso inginocchiato accanto a una candela rossa che si scioglie. Lo stile artistico è 3D e realistico, con particolare attenzione all'illuminazione e alla trama. L'atmosfera del dipinto è di meraviglia e curiosità, poiché il mostro osserva la fiamma con gli occhi spalancati e la bocca aperta. La sua posa e la sua espressione trasmettono un senso di innocenza e giocosità, come se stesse esplorando il mondo che la circonda per la prima volta. L'uso di colori caldi e luci drammatiche migliora ulteriormente l'atmosfera accogliente dell'immagine."

I ricercatori dietro il SORA Non hanno rivelato quanto tempo ci vuole per riprodurre i video, ma suggeriscono che il processo è relativamente veloce, paragonabile a una pausa spuntino. Se gli esempi mostrati sono indicativi delle potenzialità dello strumento, possiamo aspettarci una rivoluzione nel modo in cui i contenuti audiovisivi vengono prodotti e consumati.

Pensando ad una barriera corallina, è possibile ottenere un risultato come questo da un semplice messaggio come “un mondo di barriera corallina splendidamente rappresentato su carta, pieno di pesci colorati e creature marine"

Bill Peebles, membro del gruppo di ricerca, lo nota inoltre SORA ha creato una narrazione coerente attraverso gli angoli di ripresa e i tempi. Dice che ci sono diversi cambiamenti di scena, tutti generati dal modello in un'unica iterazione, cioè nessuno istruisce il modello a farlo, lo fa semplicemente automaticamente.

Un altro ottimo esempio è la descrizione di “Diversi giganteschi mammut lanosi si avvicinano, calpestando una prateria innevata. I loro lunghi cappotti di lana ondeggiano dolcemente nel vento mentre camminano, alberi coperti di neve e spettacolari montagne innevate sullo sfondo, la luce pomeridiana con nuvole leggere e un sole alto in lontananza creano una calda luce, la vista dalla telecamera bassa è sbalorditiva, catturando il grande mammifero peloso con una bellissima fotografia e profondità di campo” e ottieni questo:

Impatti delle IA che generano video

Tastiera del computer con simbolo di criptovaluta su sfondo digitale, tecnologia, innovazione, valute digitali, blockchain, mercato finanziario.
I nuovi modelli di intelligenza artificiale presentano vantaggi e svantaggi (Immagine: WIRED)

Mentre le immagini fornite dalla nuova AI OpenAI sono sicuramente impressionanti, è nelle loro capacità inaspettate che risiede la vera sorpresa. Guidato da una versione del modello di diffusione utilizzato dall'imager LASTRA-3, insieme al motore basato su trasformatore del GPT-4 SORA va oltre il semplice soddisfacimento delle richieste degli stimoli, rivelando una comprensione emergente della grammatica cinematografica.

Qualcosa da tenere in considerazione è il fatto che è soggetto a restrizioni sui contenuti con violenza, pornografia, appropriazione non autorizzata di identità o stili di artisti famosi. Inoltre OpenAI si impegna a fornire agli spettatori un mezzo per identificare chiaramente i contenuti generati da SORA come creato dall'intelligenza artificiale. Recentemente, il cantante Taylor Swift ha dovuto affrontare alcuni conflitti con la sua immagine legati a questo tipo di scenario negativo deepfakes su internet.

Ma la verità è che, sebbene l'intelligenza artificiale per i video sia una grande novità, non è ancora perfetta. Nonostante l’impatto positivo, la tecnologia deve ancora affrontare le sue sfide. Un esempio di ciò è la questione della sicurezza e della veridicità, oltre alla violazione del copyright da parte dei contenuti prodotti.

La soluzione alla disinformazione richiederà non solo un’azione da parte nostra, ma anche una comprensione collettiva della società e l’adattamento dei social media.

Aditya Ramesh, leader della squadra Dall-E

Tuttavia, l’intelligenza artificiale che genera video continua a essere vista come una possibile aggiunta a diverse situazioni. Il punto non è vederlo come un sostituto, ma saperlo utilizzare strategicamente. La produzione cinematografica, ad esempio, può sfruttare la tecnologia per trasformare gli scenari in modo pratico. Secondo Bill Peebles, “per produrre un film professionale sono necessarie attrezzature costose. Questo modello consentirà agli utenti quotidiani dei social media di creare contenuti di alta qualità”.

Showmetech TRIO

Guarda questa e altre notizie su Showmetech TRIO, il tuo trio di notizie settimanali:

Vedi anche

Gemini sostituisce Bard come principale assistente di intelligenza artificiale di Google. Scopri come utilizzare

Fonti: CABLATA, La Verge

Testo corretto da: Pedro Bomfim


Scopri di più su Showmetech

Iscriviti per ricevere le nostre ultime novità via e-mail.

Related posts