Immagini di donna dalla pelle di foglie e di città futuristiche generate da una diffusione stabile

Le immagini create da Stable Diffusion sono sorprendenti, ma il suo open source preoccupa

Avatar di Pedro Spadoni
Stable Diffusion è un imager AI come DALL-E, ma con una differenza fondamentale: è già stato rilasciato al grande pubblico

La storia dei generatori di immagini che utilizzano l'Intelligenza Artificiale (AI) ha guadagnato un altro capitolo (con diverse note a piè di pagina): il Diffusione stabile. È come DALL-E – che quest'anno è diventato famoso sui social media per essere in grado di creare strane scene usando comandi testuali – tranne che con due importanti differenze: è già stato rilasciato al pubblico ed è open source.

Questi due punti, uniti alla potenzialità della Diffusione Stabile di generare immagini spettacolari – e, soprattutto, credibili – hanno generato dibattiti e preoccupazioni sul web. Alcuni sono entusiasti delle possibilità creative e della portata democratica dello strumento. D'altra parte, c'è chi è preoccupato per secondi fini quando lo usa. E c'è chi si incazza che il generatore riesca a imitare, quasi alla perfezione, gli stili artistici (compresi quelli di chi è ancora in vita).

Il fatto è che Stable Diffusion sta cavalcando l'onda degli strumenti creativi che utilizzano apprendimento profondo (deep learning, in traduzione libera) per creare media visivi, insieme ad altri strumenti, come DALL-E 2, da OpenAI; A metà viaggio; e Imagen di Google. E poiché è stato recentemente rilasciato, il suo universo ha ancora quell'energia terrestre senza legge.

Cos'è la diffusione stabile?

Immagine generata dalla diffusione stabile di una città futuristica
Utilizzando comandi di testo e immagini di riferimento, Stable Diffusion crea paesaggi surreali.

È un generatore di immagini basato sull'intelligenza artificiale. Con esso, chiunque abbia un computer e una scheda grafica relativamente buona (al momento funziona solo con le schede Nvidia) può creare praticamente qualsiasi pittura digitale che possa immaginare. Ritratto di Beyonce dipinto da Van Gogh? È possibile. vista di una città cyberpunk nello stile dell'artista giapponese del XVIII secolo Hokusai? Si può fare.

Sì, lo strumento può imitare praticamente qualsiasi stile visivo, dai famosi fumettisti ai dagherrotipisti del XIX secolo (questo esisteva davvero, puoi verificarlo su Google). E puoi anche includere frasi descrittive e immagini come riferimento durante la configurazione della domanda nello strumento.

Stable Diffusion è nato dalla mente di Emad Mostaque, fondatore e CEO della startup Stability AI, la cui missione è creare progetti di intelligenza artificiale open source. È con questo pretesto che il nuovo strumento è arrivato al pubblico alla fine di agosto. Ma questa non è la prima impresa per l'imprenditore, che si avvicina ai 40 anni.

Nel 2019 Mostaque, originario del Bangladesh ma attualmente residente in Inghilterra, ha fondato Symmitree. Lo scopo di questo startup, creato 14 anni dopo essersi laureato all'Università di Oxford, aveva lo scopo di ridurre il costo della tecnologia per le persone in condizioni di povertà. Un bel progetto, ma che non è andato avanti, interrotto l'anno dopo la sua creazione. E poi, alla fine del 2020, è arrivata Stability AI.

Come utilizzare l'imager con l'intelligenza artificiale?

Puoi giocare, gratuitamente, con una versione demo di Stable Diffusion, che funziona nei browser anche accedendo a pagine come HugginFace (società socia di startup nello sviluppo degli strumenti), Studio dei sogni (pagina commerciale creata da Stability AI per lo strumento) e Google Collabora. Tuttavia, sono tutti in inglese, con interfacce poco intuitive. E devi essere paziente, perché ci vuole un po' prima che lo strumento generi belle immagini. Nella pagina DreamStudio puoi anche scaricare e installare lo strumento.

Per quanto riguarda le modalità di utilizzo del generatore di immagini AI, alcuni sostengono l'idea di lavorarci come se fosse uno strumento, simile a un produttore musicale o artista visivo, che sceglie strumenti diversi durante l'assemblaggio di un battere o dipingere un quadro.

Al giorno d'oggi ci sono più di un imager AI e ognuno ha i suoi punti di forza e di debolezza. Allora perché non combinarli per creare qualcosa? Questo è quello che ha provato a fare la regista Karen Cheng. Ha avuto l'idea di utilizzare l'intelligenza artificiale per generare capi di abbigliamento e sovrapporli a un video e ha condiviso l'intero processo in un thread su Twitter (in questo caso, ha utilizzato DALL-E ed EbSynth).

Open source e altri problemi

Immagini generate da diffusione stabile utilizzando volti di personaggi famosi
La possibilità di realizzare deepfake in Stable Diffusion ha allertato la community (Immagine: Riproduzione/Ars Technica)

Ok, finora abbiamo visto il potenziale di Stable Diffusion (e generatori simili) per progetti creativi. Ma il mondo non è una grande Disneyland. Tanto meno Internet. Quindi, è necessario sottolineare il lato spinoso dell'atteggiamento di Stability AI nel rilasciare uno strumento così potente in modo così aperto e quasi senza restrizioni.

Il lancio dello strumento al pubblico ha lasciato molti in uno stato di allerta a causa dei timori legati agli impatti culturali ed economici. È solo che, a differenza di Dall-e, il database di Stable Diffusion è disponibile per chiunque possa modificarlo e utilizzarlo senza troppe restrizioni.

In pratica, ciò significa che le persone possono utilizzare Stable Diffusion per generare immagini che OpenAI esclude in Dall-e, ad esempio. Tra questi tipi di immagini ci sono scene violente, pornografia, scene che possono violare i diritti aziendali e di copyright, deepfake di celebrità e produzione di materiale di disinformazione e fake news.

La “versione ufficiale” dello strumento dispone di filtri che bloccano, ad esempio, la nudità. Tuttavia, grazie all’open source, queste barriere possono essere superate. E considerando che Stable Diffusion è a disposizione di tutti coloro che vogliono usarlo, controllarne (e bloccarne) l'utilizzo con motivazioni nascoste è praticamente impossibile. A questo proposito il CEO di Stability AI si è limitato a dire:

Crediamo nella responsabilità individuale. Includiamo una politica di utilizzo e strumenti per mitigare i danni.

Emad Mostaque, fondatore e CEO della startup Stability AI, in un'intervista al sito di Art Technica

Un altro fronte che ha generato scompiglio è la capacità di Stable Diffusion di imitare gli stili degli artisti. Il punto è che l'azienda ha "alimentato" lo strumento con le opere degli artisti senza chiedere permesso o cucire alcun tipo di accordo. Ciò ha sollevato una serie di questioni etiche e di copyright.

Prossimi passi per l'azienda

Comunque sia, il successo di Stable Diffusion, anche se è stato rilasciato meno di un mese fa, ha già aumentato la valutazione di Stability AI sul mercato. La società ha anche avuto incontri con gli investitori per raccogliere risorse per 100 milioni di dollari (523 milioni di R$, alla quotazione attuale). E una società di investimento avrebbe espresso interesse a chiudere un accordo che porterebbe il valore della startup a 500 milioni di dollari (2,6 miliardi di R$), secondo fonti di Forbes.

L'amministratore delegato dell'azienda ha dichiarato, in una recente intervista al machine learning e lo YouTuber Yannic Kilcher, che punta a partnership con "governi e istituzioni leader".

Mostaque ha anche condiviso, su un social network, che Stability AI ha investito 600 dollari USA (3,1 milioni di R$) per "addestrare" Stable Diffusion. Finora, l'investimento ha dato i suoi frutti.

Vedi anche:

DALL-E, l'intelligenza artificiale che crea immagini, ha rilasciato test pubblici e DALL-E ora immagina cosa c'è oltre i confini delle opere d'arte

Fonti: Ars Technica, metaltech, Stabilità AI, TechCrunch, Forbes e DevOps


Scopri di più su Showmetech

Iscriviti per ricevere le nostre ultime novità via e-mail.

Related posts