In che modo la generazione di immagini AI con DALL·E 2 può essere utilizzata nel marketing digitale?
Pubblicato: 2022-10-17“Wow, l'hai preso? Aspetta un minuto, è stato fatto da un fotografo professionista...?”
Questa è stata la reazione di Jake, il nostro MD, quando gli ho mostrato l'immagine qui sotto: un'immagine fotorealistica generata da DALL·E 2 di OpenAI, creata in pochi secondi, utilizzando un prompt che ho inserito per "una macro foto di una farfalla su un girasole" .
È una foto che sembra così reale e ha catturato la nitidezza e il colore di una farfalla in primo piano e la messa a fuoco morbida del girasole sullo sfondo. In effetti, così tanto che sarebbe difficile trovare molte persone in grado di trovare segni evidenti di coda, artefatti o un senso di errore, che possono essere comuni nelle immagini generate dall'IA.
Questo è stato il momento in cui ho capito che siamo entrati nel punto in cui i sistemi di intelligenza artificiale avanzati possono comprendere e creare immagini fotorealistiche che, in molti casi, sono indistinguibili dalla vita reale. Ciò ha implicazioni interessanti per chiunque lavori nelle industrie creative e digitali, o addirittura per qualsiasi ruolo che implichi l'acquisizione di immagini o la manipolazione delle immagini.
In questo articolo, esploro alcune applicazioni pratiche dell'utilizzo di DALL·E 2 di OpenAI nel mondo del marketing creativo e digitale e come gli strumenti di editing recentemente aggiornati di DALL·E 2 possono essere utilizzati per supportare il lavoro creativo.
Cos'è DALL·E 2?
DALL·E 2 di OpenAI è un generatore di immagini basato sull'intelligenza artificiale che richiede un semplice prompt basato su testo e genera immagini in base alla comprensione dell'IA di tale prompt. In pochi secondi, otterrai quattro variazioni di immagine generate che possono quindi essere scaricate, condivise o salvate come preferite all'interno del tuo account OpenAI.
DALL·E 2 è ora disponibile per tutti. Ottieni 15 crediti gratuiti al mese, con 1 credito richiesto per generazione e ogni 115 crediti al costo di $ 15. Puoi generare immagini da zero o caricare le tue foto per manipolarle a condizione che seguano la Politica sui contenuti di DALL·E 2 e, in base ai termini di utilizzo, "puoi utilizzare Generations per qualsiasi scopo legale, incluso per uso commerciale".
Questo rende l'attribuzione un argomento interessante e quanto credito dovrebbe essere dato alla persona che fornisce i suggerimenti, alla fonte dell'immagine durante la modifica di un'immagine o DALL·E 2. Tutte le immagini che ho usato in questo post del blog, ad esempio, generato con DALL·E 2 o generato un'immagine di libreria modificata, ma mi sentirei un po' un imbroglione se attribuissi queste generazioni o modifiche a me stesso.
Le immagini possono essere generate in base a:
- Oggetto: puoi generare immagini di qualsiasi cosa tu voglia; paesaggi, animali, oggetti, concetti astratti purché seguano la policy sui contenuti che vieta ad esempio di generare immagini di personaggi famosi per evitare il proliferare di deepfake.
- Medium: da schizzi a matita e dipinti a olio fino a pixel art e illustrazioni digitali, DALL·E 2 può generare immagini che rappresentano qualsiasi tipo di supporto.
- Impostazioni ambientali: aggiungi alla richiesta fattori ambientali come "tramonto" o "nebbia" per dare alle tue immagini un po' di atmosfera.
- Posizione: se hai bisogno di posizionare le tue immagini in una posizione particolare, dai al prompt una città o un paese e dovresti ottenere punti di riferimento, stili di costruzione ecc. associati a quel luogo.
- Stile artistico: DALL·E 2 può generare immagini nello stile di diversi artisti. Aggiungi semplicemente "nello stile di [artista]" ai tuoi prompt.
- Impostazioni della fotocamera: particolarmente utile per gli stili fotografici, puoi aggiungere alle tue richieste le impostazioni della fotocamera per dare alle foto una varietà di scatti e qualità diverse. Gli esempi includono "Scatto Macro 35 mm", "esposizione lunga" o "obiettivo fisheye".
Usa il linguaggio naturale per combinare uno qualsiasi dei precedenti per aiutare a descrivere ciò che desideri come "Homer Simpson in un caffè parigino nello stile di Picasso" e in pochi secondi otterrai diverse generazioni.
È facile perdersi in una tana di possibilità quando si esplorano le capacità di DALL·E 2, ma ci sono anche molte applicazioni pratiche dello strumento, specialmente nel design e nel marketing, che verranno esplorate più avanti in questo articolo.
Come funziona DALL·E 2?
Non pretendo di aver capito completamente o cercherò di spiegare esattamente come funziona la generazione di immagini AI di DALL·E 2: ci sono molti articoli che lo fanno. Ma quello che posso dire è che è molto più di un algoritmo intelligente che utilizza un insieme complesso di logica. È l'apprendimento automatico. Un'intelligenza artificiale che è stata addestrata, nel tempo, da miliardi di immagini sorgente e dal linguaggio naturale e dal rapporto tra entrambi.
Al centro c'è un modello di diffusione che inizia con un rumore casuale e che viene perfezionato in modo iterativo su più cicli fino a quando emerge qualcosa di simile alla comprensione dell'IA del prompt richiesto.
Lo stesso strumento DALL·E 2 è semplice da usare. Una volta effettuato l'accesso, verrai accolto con un semplice campo di input in cui puoi iniziare a generare immagini in base a un messaggio di testo o puoi caricare la tua immagine da modificare.
Una serie di strumenti di modifica delle immagini diventano disponibili sia per le immagini generate che per quelle caricate che esploreremo più avanti in questo articolo.
Utilizzo di DALL·E 2 per l'acquisizione di immagini
Uno degli usi più ovvi della generazione di immagini basata sull'intelligenza artificiale è l'approvvigionamento di foto o altri stili di immagine da utilizzare per post di blog, presentazioni, siti Web, pubblicità e vari altri mezzi. Le librerie di foto d'archivio come ShutterStock, iStockPhotos o Unsplash sono spesso scelte popolari quando si tratta di sourcing di immagini, ma probabilmente vedremo persone sempre più rivolgersi a DALL·E 2 per un'alternativa più veloce e a basso costo, oltre alla creazione di immagini che è davvero unico e non esiste da nessun'altra parte online.
DALL·E 2 può essere particolarmente utile quando si ricercano immagini che hanno un argomento molto specifico come un "Golden Retriever seduto su una spiaggia a guardare il tramonto" o una "Foto di una volpe che salta tra le campanule in un bosco con il sole splendente tra gli alberi”. L'approvvigionamento di immagini simili da varie raccolte di foto d'archivio richiederebbe probabilmente più tempo e in molti casi è improbabile che l'argomento esista.
Quello che trovo davvero sorprendente con lo stile fotografico di generazione delle immagini è che DALL·E 2 può replicare accuratamente tutti i tipi di impostazioni ambientali. Dal bagliore della luce solare e l'accurata proiezione delle ombre fino alla nitidezza degli oggetti in primo piano e alla graduale sfocatura degli elementi più distanti. Puoi anche includere richieste per varie configurazioni basate sulla fotocamera come "Macro 35mm", "Fisheye" o "Raglio obiettivo".
Durante la generazione di immagini di qualità fotografica, ho osservato generazioni più realistiche da argomenti più comuni. Ci sono molte più fotografie di cani sulle spiagge, ad esempio, di quante volpi saltano nelle campanule, quindi più contenuti per un'IA da cui trarre riferimenti.
Una limitazione chiave che vale la pena sottolineare è che tutte le immagini generate sono limitate a 1024 x 1024 pixel, quindi non genereremo presto foto per cartelloni pubblicitari...
Estendere le dimensioni dell'immagine
Uno degli usi più comuni che vedo per DALL·E 2 nel mondo della creatività e del marketing è il miglioramento e l'editing di immagini esistenti, piuttosto che la generazione completa di nuove immagini. Come sviluppatore web, mi imbatto comunemente in sfide in cui si trova un'immagine decente ma il rapporto e le dimensioni causano scarsi ritagli quando l'immagine viene caricata a causa del fatto che il contenitore dell'immagine ha un rapporto diverso dall'immagine.
Ecco un esempio. Una bella immagine d'archivio di un cane che si sporge dal finestrino di un'auto che era destinata all'uso su un'unità eroe in primo piano, ma il rapporto orizzontale standard della fotografia originale non funzionava bene con un rapporto 21:9 super ampio di un eroe in primo piano striscione.
Caricando l'immagine su DALL·E 2 e utilizzando lo strumento 'Generazione Frame', possiamo estendere l'immagine lasciando che l'IA riempia gli spazi vuoti. Quando utilizzi il Frame di generazione, vorrai sempre mantenere parte dell'immagine originale all'interno del frame per fornire all'IA più informazioni su cui lavorare.
Anche il testo del prompt è importante qui e di solito vorrai descrivere ciò che desideri nel frame di generazione piuttosto che nell'intera immagine. Per questo prompt, ho usato semplicemente "colline e cielo" e ho lasciato che DALL·E 2 facesse il resto.
Per ogni generazione, DALL·E 2 ti darà quattro varianti tra cui scegliere. L'immagine sopra che ho sentito era la più credibile; con una buona estensione della strada, una manciata di alberi generati, alcune nuvole interessanti senza essere sovrapposte drammatiche e un ruscello (che non ho chiesto ma una buona aggiunta) che scorre dietro gli alberi.
Modifica degli artefatti
È anche possibile apportare modifiche alle parti problematiche delle immagini in modo rapido ed efficiente utilizzando DALL·E 2. L'esempio seguente era una recente richiesta che dovevamo sostituire un riflesso che distrae negli occhiali di sicurezza di un direttore dei lavori.
Utilizzando lo strumento Gomma per modificare la parte riflessa dell'immagine mostrata in alto a sinistra, oltre a fornire il prompt "Donna con occhiali di sicurezza che guarda iPad", DALL·E 2 ha generato il resto, fino al bordo ed evidenziare dei vetri, sfumature e accurati abbinamenti cromatici.
Aggiunta di contenuto a un'immagine esistente
Allo stesso modo, aggiungere elementi a un'immagine può essere facile come rimuoverli. Ecco un esempio di una foto di una persona che guarda attraverso una valle. Non sarebbe bello se il loro migliore amico fosse accanto a loro? Nessun problema, basta cancellare uno spazio delle dimensioni di un cane dall'immagine usando lo strumento Gomma e dare un prompt appropriato; "Un golden retriever seduto accanto alla donna che guarda in lontananza" è stato utilizzato nell'esempio seguente
Generazione di immagini visivamente simili
Forse hai trovato un'immagine davvero buona in termini di composizione e soggetto, ma per qualsiasi motivo non funziona proprio. Senza apportare modifiche o modifiche al testo del prompt, è possibile utilizzare la funzione "Genera variazioni" per creare immagini simili dal punto di vista stilistico e compositivo.
Nell'esempio seguente, l'illuminazione, l'ombreggiatura, gli angoli della telecamera sono tutti molto simili e viene rigenerato lo stesso tipo di cane, insieme a una donna che indossa una giacca che guarda verso le colline con una strada che le attraversa, ma gli elementi hanno tutto cambiato; le colline e la strada sono nuove e la donna e il cane sono entrambi diversi.
Creazione di Moodboard
Durante le prime fasi di un progetto creativo, le Mood Board vengono spesso utilizzate per impostare lo stile visivo, il tono e la direzione creativa procurando un mix di schermate, testo e immagini esistenti. Poiché puoi richiedere a DALL·E 2 qualsiasi tipo di stile visivo, dai disegni a matita e pittura fino alla pixel art e ai rendering 3D, l'IA generativa può fornire un buon punto di partenza per impostare un tono visivo o una direzione.
Supporto al lancio del marchio
Quando si lancia un nuovo marchio, è comune simulare l'aspetto dei nuovi design su diversi articoli fissi o visualizzare i progetti di siti Web in situ su dispositivi diversi. DALL·E 2 forse in grado di supportare la generazione di uno sfondo unico che si lega al business del cliente.
Ad esempio, generare un'immagine di biglietti da visita in un campo di fiori selvatici per un marchio eco-orientato o simulare un laptop con una casa moderna sullo sfondo per un'azienda nel settore dell'edilizia abitativa.
Ottenere ispirazione
Penso che siamo ancora molto lontani dalla generazione di elementi visivi pronti per la stampa o completamente progettati per implementazioni creative, ma un'area in cui DALL·E 2 potrebbe essere utile per supportare il processo di progettazione è fornire una rapida ispirazione per far fluire i succhi creativi .
Ad esempio, ho generato quanto segue nel tentativo di generare un logo per una nuova birra a tema steampunk utilizzando il prompt "un logo design per una birra steampunk". Mentre DALL·E 2 è ottimo per comprendere i messaggi di testo, la generazione del testo è un'area in cui DALL·E 2 ha difficoltà. In tutte le variazioni prodotte, il testo è idoneo o privo di senso. Nonostante ciò, penso che ci sia ancora il potenziale per trarre ispirazione da questo tipo di generazioni, che si tratti di colori, composizione o elementi utilizzati all'interno delle immagini prodotte.
Produzione di layout approssimativi
Un'altra area in cui DALL·E 2 potrebbe essere in grado di supportare è l'approvvigionamento di layout e composizioni approssimativi che possono essere utilizzati come idea o punto di partenza per annunci del calibro di design di siti Web e pubblicità. Gli esempi seguenti per la progettazione di un sito Web e l'annuncio pubblicitario di una brochure erano basati sui suggerimenti "Un design [sito web] [brochure] per un'azienda di energia sostenibile"
Con l'apprendimento automatico e la comprensione di miliardi di immagini sorgente, DALL·E 2 incorporerà naturalmente convenzioni standard quando si tratta di layout. Con l'esempio di progettazione del sito Web, la navigazione principale è mostrata in alto per tutte le varianti, il logo del marchio era solitamente in alto a sinistra e c'era quasi sempre una grande unità eroe e un grande titolo sotto l'intestazione seguito da paragrafi di testo sotto. Allo stesso modo il verde era un tema di colore comune con queste variazioni poiché ha naturalmente una forte associazione con la parola "sostenibilità".
Il testo è notevolmente illeggibile e molte delle immagini all'interno dei layout sono oscure, ma da un punto di vista compositivo, penso che ci sia abbastanza potenziale per DALL·E 2 per assumere un ruolo di supporto quando si cerca ispirazione per i layout.
Conclusione
DALL·E 2 di OpenAI e il progresso che ora vediamo con i modelli di generazione di immagini basati sull'intelligenza artificiale come Imagen di Google (non ancora per il consumo pubblico) sono senza dubbio impressionanti e vedo che il loro ruolo nel marketing digitale e nello spazio creativo è molto più di un uno di supporto piuttosto che una minaccia diretta ai ruoli creativi e basati sul marketing. Come abbiamo visto con alcuni degli esempi precedenti, ci sono alcune ovvie limitazioni, specialmente per quanto riguarda la dimensione dell'output e la generazione del testo. Anche con la maggior parte delle immagini basate sulla fotografia utilizzate nell'articolo, la maggior parte delle persone sarebbe probabilmente in grado di dire che la maggior parte non sono foto reali, ma questo diventerà sempre più difficile da individuare nel tempo.
Siamo ancora nelle prime fasi della generazione basata sull'intelligenza artificiale, ma vedo molte applicazioni utili per il settore creativo e di marketing dalla generazione di ispirazione e idee, fino al sourcing di immagini e all'editing avanzato delle immagini. Non passerà molto tempo prima che le API per questi strumenti diventino disponibili e integrate con strumenti di progettazione popolari come PhotoShop o Figma. È un campo affascinante e ne seguirò i progressi nei prossimi mesi e anni.