Alcune immagini generate con DALL·E 2; fornite cortesemente da Paolo Rota. 

Innovazione

I capolavori dell’intelligenza artificiale

Quando sono i software a fare il lavoro creativo

8 settembre 2022
Versione stampabile
di Johnny Gretter
Studente collaboratore Ufficio stampa e relazioni esterne

Nel film Io, robot, il detective Del Spooner – interpretato da Will Smith – chiede a un automa: «Un robot può comporre una sinfonia? Un robot può prendere una tela bianca e trasformarla in un capolavoro?». L’automa risponde, genuinamente e senza sarcasmo: «Tu puoi?». Una domanda legittima: non sono molte le persone che riuscirebbero a prendere una tela e dipingere un quadro ispirato a quelli di Vermeer, oppure qualcosa di più ridicolo e fantasioso come un astronauta che si rilassa in un resort tropicale nello spazio in stile vaporwave. Invece, alcuni software possono farlo senza problemi, partendo solo da un piccolo spunto. 

Programmi simili sono Midjourney e DALL·E 2, reti neurali artificiali che generano immagini a partire da un testo inserito dall’utente, qualunque esso sia. L’immagine dell’astronauta che si rilassa è uno dei primi esempi esposti sul sito di DALL·E, assieme a una serie di varianti sullo stesso tema: magari un utente vuole generare un astronauta che gioca a basket, disegnato con gli acquerelli, e anche allora il software lo accontenta. Ma DALL·E può anche creare delle proprie versioni di un’immagine preesistente: poco sotto i disegni di astronauti, sono messe in mostra una decina di Ragazze con l’orecchino di perla, tutte differenti ma dipinte con uno stile molto simile all’originale.

Una foca con l'orecchino di perla e una scimmia astronauta

Ma volendo si possono pure generare delle Foche con l'orecchino di perla o delle scimmie-astronauta.

Ma come funzionano questi programmi basati sull’intelligenza artificiale? Lo spiega Paolo Rota, ricercatore del Dipartimento di Ingegneria e Scienza dell'informazione di UniTrento: «Fino a poco tempo fa, le reti neurali erano allenate utilizzando due reti che lavorano assieme, le generative adversarial network. Una ha il compito di generare delle immagini, mentre l’altra cerca di capire se si tratta di un’immagine vera o generata: quando non riesce più a fare questa distinzione, la prima rete è diventata capace di creare immagini plausibili. Invece, DALL·E 2 è addestrato con un diffusion model: la rete neurale impara a rimuovere progressivamente il rumore da un’immagine totalmente distorta. Addestrandosi in questo modo, la rete diventa estremamente abile anche a generare immagini “realistiche” partendo da puro rumore, senza aver più bisogno di un’immagine di riferimento». 

Tutti questi processi di generazione e ricostruzione devono essere ripetuti moltissime volte e si basano su database di immagini a cui è associata una descrizione: è proprio grazie a quest’ultime che una rete neurale impara a creare immagini a partire da un testo. «La grande novità di DALL·E è il fatto di essere allenata su dataset enormi, che non sono alla portata di università e aziende italiane, come non lo è la potenza di calcolo richiesta per allenare una rete attraverso un diffusion model», conclude Rota. 

Certo, astronauti che si rilassano su una sdraio o che tirano a canestro non sono esattamente capolavori, ma i programmi che li generano potrebbero comunque sostituire il lavoro di artiste e artisti. «Si è tradizionalmente pensato che i lavori creativi fossero quelli più al riparo dall’automazione» spiega Alessandro Rossi, professore associato del Dipartimento di Economia e Management. «Ora, invece, molti software sono in grado di raggiungere ottimi risultati anche in questi settori. È vero per la generazione di immagini, ma anche per quella di testi, come ad esempio copy.ai».

«In ogni caso, è molto probabile che alla fine si arriverà a delle forme di coesistenza», continua Rossi. «Un cliente potrebbe farsi da solo un bozzetto utilizzando un software, e poi chiedere a un artista di disegnare alcune illustrazioni partendo da quella base. Oppure un illustratore potrebbe usare DALL·E per fare brainstorming e trovare ispirazione: potrebbe suggerirgli uno stile artistico a cui non aveva ancora pensato. Probabilmente saranno sempre più necessarie nuove professioni di dialogo, in grado di capire come usare i risultati di queste tecnologie e sviluppare servizi che creino valore per utenti e consumatori». 

Le reti che generano immagini non cambiano solo l’industria creativa, ma anche il nostro modo di valutare la creatività: «L’idea creativa vera e propria diventa sempre più svincolata dall’esecuzione, come la composizione di un’immagine. Con l’ausilio dell’intelligenza artificiale, l’attività creativa si sposta a monte: nell’esempio di DALL·E è la scrittura di una stringa di testo efficace. Il punto diventa quindi costruire un dialogo con la macchina, e capire dove inizia il contributo umano. Alla fine, la macchina e l’artista lavorano in modo diverso, arrivando a risultati simili. DALL·E disegna aggregando le informazioni di milioni di foto, il secondo trova l’ispirazione sfogliando cataloghi e studiando il contributo di altri artisti. E sempre di più, l’artista userà in futuro anche l’intelligenza delle macchine per accelerare flussi di lavoro ripetitivi e noiosi e dare nuovi spunti alla sua immaginazione».