Indice
In mezzo alla magniloquenza tendenza delle foto in stile anime, potresti esserti chiesto: come funziona il ChatGPT realizza immagini nello stile di Studio Ghibli? Prima non poteva? Bene... si scopre che la nuova capacità di imaging generativo di OpenAI È davvero una novità e comporta un grande cambiamento nel funzionamento del modello di intelligenza artificiale dell'azienda. Comprendere, in questo testo, come il ChatGPT è riuscito a replicare l'arte di Studio Ghibli e le principali differenze rispetto agli altri modelli.
Come fa ChatGPT a creare immagini in stile Ghibli?
Per capire come ChatGPT ha iniziato a essere in grado di generare immagini come quelle create in tendenza do Studio Ghibli, è necessario conoscere i principali cambiamenti apportati da OpenAI nel modello GPT-4o, leggi sotto.
Cosa è cambiato nel modello GPT-4o?

La generazione di immagini nel GPT-4o si basa sull'architettura trasformatore, che analizza i modelli e associa le descrizioni testuali agli elementi visivi. A differenza dei “modelli di diffusione”, che iniziano con un’immagine casuale e la perfezionano progressivamente, GPT-4o adotta un metodo autoregressivo, costruendo l'immagine in passaggi sequenziali, il che migliora la coerenza visiva e la fedeltà allo stile desiderato.
Man mano che la precisione e la resa del testo nelle immagini migliorano, e la capacità di comprendere e seguire istruzioni dettagliate migliora, ChatGPT ha aumentato la sua capacità di gestire il numero di oggetti distinti in una singola scena (fino a 20, rispetto ai precedenti 5-8 oggetti) e riesce a mantenere le corrette relazioni tra di essi.
Rispetto ai modelli precedenti come il DALL-MI3, che ha utilizzato oleodotti (insieme di passaggi o processi) separati per diversi tipi di media, il GPT-4o adotta un approccio unificato, consentendo risposte più rapide e immagini più coerenti con i comandi testuali, eliminando la necessità di molteplici processi intermedi. Ciò significa che il modello è in grado di interpretare meglio le sfumature dei messaggi forniti dagli utenti, garantendo che l'output visivo sia maggiormente in linea con l'intento originale.
Tutto questo potere porta con sé un problema controverso: con una maggiore richiesta di elaborazione grafica dovuta all'esplosione della moda su Internet, OpenAI necessario limitare l'usabilità dello strumento per alcuni giorni, soprattutto per gli utenti gratuiti di ChatGPT, perché il loro GPU si stavano “sciogliendo”, secondo il CEO dell’azienda, Sam Altman. Nonostante l'inconveniente, la generazione di immagini avanzate è già stata rilasciata dall'azienda per gli utenti del piano gratuito, come annunciato dal dirigente.
In che modo l'aggiornamento abilita le immagini in stile Ghibli?

Ma cosa significa tutto questo per la capacità dell'intelligenza artificiale di catturare l'estetica di Studio Ghibli? Si scopre che con il nuovo aggiornamento, il GPT-4o Inizia a comprendere meglio i modelli di stile, partendo da enormi esempi di immagini, e impara a replicare queste caratteristiche in base ai comandi forniti dall'utente.
Sebbene il OpenAI non hanno dichiarato esplicitamente se il loro set di dati di formazione includeva opere d'arte specifiche Studio GhibliCome Il viaggio di Chihiro ou Il ragazzo e la gru – colmando un divario che differenzia la riproduzione degli stili dello studio da quelli degli artisti viventi – la competenza del modello nel riprodurre l'estetica dello studio suggerisce fortemente che egli sia stato esposto a un gran numero di esempi di film e stili correlati.
Attraverso questa mostra, il GPT-4o scopri le principali caratteristiche visive che definiscono lo stile di Studio Ghibli, tra cui: la sensazione dell'animazione disegnata a mano, che spesso ricorda l'animazione tradizionale su carta; sfondi che evocano un senso di meraviglia e tranquillità; personaggi espressivi caratterizzati in genere da occhi grandi ed emotivi; una tavolozza di colori tenui e naturali, dominata da toni pastello e tenui; ambienti dettagliati che spesso mescolano elementi fantasy con realismo
Inoltre, il GPT-4o Può anche elaborare immagini come input, consentendo agli utenti di trasformare elementi visivi esistenti o di utilizzarli come base per generare nuovi contenuti. In questo modo, oltre a non dover dire tutti i dettagli sullo stile artistico che vogliono riprodurre, gli utenti non hanno nemmeno bisogno di descrivere se stessi o la foto che vogliono ricreare, ma semplicemente di inserire una foto nella chat e chiedere all'IA di riprodurla con lo stile di animazione – come puoi vedere nel nostro articolo su Come realizzare immagini in stile Ghibli con ChatGPT, con suggerimenti e spunti.
Altre IA possono riprodurre lo stile dello Studio Ghibli?
Crea nuove immagini utilizzando chatbots non è una novità recente, tuttavia, la capacità raggiunta aggiornando il ChatGPT nell'analizzare e riprodurre i dettagli suggeriti dal prompt, sostituiscono l'IA OpenAI davanti ai suoi principali concorrenti, come GeminiDi Google, GrokDi XAi e Secondo pilotaDi Microsoft, in termini di generazione di immagini.
Guarda la differenza tra la stessa immagine trasformata in un disegno con una linea ispirata a Studio Ghibli seguendo lo stesso prompt:
Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli

Oltre a catturare meglio i dettagli dell'immagine originale, uno dei più grandi progressi nell'imaging generativo GPT-4o Ciò è evidente nella capacità di riprodurre il logo e le lettere sulla maglietta, cosa molto difficile in altri modelli.
Mentre l' Grok riesce, in un certo senso, a ricreare caratteristiche dello stile di Studio Ghibli, anche se soffre del dettaglio dell'immagine, il Gemini va completamente controcorrente, dando vita ad un'arte generica. Vale la pena ricordare che il Google investe già in un aggiornamento delle immagini generative di Gemini, consentendo la creazione di immagini complesse e l'editing fotografico, strumenti che può essere testato tramite AI Studio. la Secondo pilotaDi Microsoft, non ha risposto al prompt.
Hai già testato lo strumento per entrare nel Tendenza Studio Ghibli? Diteci nei commenti.
Vedi anche
Testo revisionato da Alessandro Marchesi il 01/04/2025.
Fonti: The Times of India, Tempi di Hindustan, Tempi economici
Scopri di più su Showmetech
Iscriviti per ricevere le nostre ultime novità via e-mail.