DaciAi: come l'Ai può cambiare il panorama del fotoinserimento

dacia duster ai santamato 

L'ai, lo sappiamo, ha cambiato (e cambierà) ogni ambito in cui lavoriamo. È un dato di fatto. Nella mia personalissima discesa negli “inferi” delle Ai sto sperimentando con mano quanto questi strumenti siano davvero potenti.

Oggi vorrei sottoporvi l'ultimo “esercizio” che ho realizzato e che ha come obiettivo quello di mostrare la potenza di questi sistemi per quanto riguarda il fotoinserimento.

 

 

LO SHOOTING

 

Lo shooting fotografico può essere problematico: costi e logistica rendono questi strumenti non sempre efficienti.

L'Ai può essere un valido sostituto, in determinate situazioni, ma anche lei hai dei limiti strutturali.

Chiedere a StableDiffusion (o Midsjourney): "realizzami lo scatto fotografico di una macchina rossa in montagna" non è la stessa cosa che chiedere all'algoritmo "disegnami LA MIA DACIA ROSSA in montagna".

La specifica della Dacia” è un'informazione che il sistema non sa interpretare. Non lo conosce. E qui, se si parla di specifiche richieste di business, spesso ci si ferma e l'Ai non viene utilizzata.

È però possibile allenare l'Ai a riconoscere la mia Dacia? In modo che possa poi utilizzarla in qualsiasi situazione? La risposta è sì. ;)

 

 

TRAINING

Quando si lavora con strumenti come Stable Diffusion si usano i cosidetti “checkpoint” ovvero modelli allenati per riprodurre un certo tipo di stile. Ci sono CP per riprodurre solo auto da corsa, solo cartoni animati, solo cartoni animati giapponesi... la lista è lunghissima.

Ma questi modelli sono molto “pesanti” e lavorano su un impasto generale dell'immagine;  spesso c'è bisogno di un piccolo aggiustamento che quel modello non copre per intero. Se vuoi che il focus della tua immagine sia una specifica auto, il CP non riuscirà a riprodurla perché per lui sarà sempre e solo un'auto, un'auto generica.

Ecco che qui intervengono i LoRA (Low-rank Adaptation) che sono dei “micro modelli” che aiutano i CP ha eseguire un compito più preciso.

 

LoRa model

 

 

 

Senza essere troppo tecnici, i LoRA lavorano in quella parte gialla chiamata “cross attention layer” che sono i punti dove l'immagine si incontra con il prompt. Quindi agiscono su una parte del tutto, lavorando, appunto, di fino.

Invece di allenare un intero modello è possibile allenare un LoRA con un dispendio di energie marginalmente minore e supportare così la struttura generale del CP utilizzato.

 

 

L'ESPERIMENTO

Senza girarci molto attorno, i LoRa vengono utilizzati per riprodurre essenzialmente le sembianze di altre persone o di altri personaggi famosi ( deepfake vi dice nulla?...ecco sono la stessa cosa), ma è teoricamente possibile allenarli per riconoscere qualsiasi cosa.

Ed è quello che ho fatto.

  • Per prima cosa ho raccolto alcune foto dal vero della mia mitica Dacia Duster.
    Dacia Duster Ai



  • Poi ho chiesto a un programma di “decodificare” queste immagini per legare un prompt all'immagine in modo da capire quando venissero “comprese” dall'algoritmo.

 

Dacia duster Ai

  • Ho poi collezionato 3500 immagini di auto (con l'aiuto di repository online chiaramente) per spiegare all'algoritmo che sto parlando sempre e solo di auto.

    dacia duster ai

  • Ho poi settato i parametri del programma in modo che non impiegasse 36 ore per creare il modello e che l'output fosse corretto

    dacia duster ai

    dacia duster ai


  • E ho lanciato il tutto.

 

 

Una volta creato questo LoRA sono tornato su StableDiffusion e ho cominciato a giocare.

 

IL RISULTATO

Daci Duster Ai Santamato

Daci Duster Ai Santamato

 

Dacia Duster Ai Santamato

Dacia Duster Ai Santamato

 

Come potete vedere i risultati hanno dell'incredibile. Al netto di imprecisioni (che sono dovute a un pool di immagini iniziale non enorme e una potenza di calcolo rispettabile, ma non esorbitante) i risultati soddisfano appieno la mia curiosità.
Ogni immagine che ho creato rappresenta una Dacia rossa in situazioni sempre diverse, con un resa di ombre, posizioni, prospettiva, proporzioni... incredibile. L'aggiunta di ambienti, o soggetti, non fa che migliorare la credibilità dell'immagine.

E questo può spingerci anche a sperimentare, sempre partendo da una base precisa che è il nostro prodotto.

 

Dacia Duster Ai Santamato

Dacia Duster Ai Santamato

 

 

CONCLUSIONI

 

Avere la possibilità di ricreare una replica fedele di qualunque oggetto, apre a possibilità infinite in ogni tipo di ambito. Che sia una macchina, un orologio, una penna, una merendina, un pack, un biscotto, un quello che volete voi, è sempre possibile allenare questi sistemi a riconoscere e riprodurre ciò che desideriamo.

Quando la potenza di calcolo aumenterà ancora e avremo a disposizione ancora più capacità, i limiti di oggi saranno un ricordo lontano, anzi lontanissimo.

 

 (Nessuna Dacia è stata maltrattata per realizzare questo articolo)