Speaking Portrait

Speaking Portrait, come trasformare le foto in video realistici

Una nuova tecnologia è in grado di dare vita e voce alle vecchie foto
Speaking Portrait, come trasformare le foto in video realistici FASTWEB S.p.A.

L'azienda la cui tecnologia ha alimentato la sensazionale app MyHeritage, che trasforma le classiche foto di famiglia in realistici ritratti in movimento, è tornata con una nuova implementazione della sua tecnologia: trasformare le fotografie fisse in video ultra-realistici, in grado di dire quello che si vuole.

Gli Speaking Portraits di D-ID possono ricordare i famigerati deepfake che hanno fatto notizia negli ultimi anni, ma la tecnologia è in realtà piuttosto diversa e non richiede alcuna formazione per le funzionalità di base.

D-ID ha presentato il suo prodotto Speaking Portrait al TechCrunch Disrupt 2021. La società ha mostrato una serie di casi d'uso, incluso l'utilizzo di questa tecnologia per creare un conduttore televisivo multilingue in grado di esprimere diverse emozioni; la creazione di chatbot virtuali per le interazioni con l'assistenza clienti; lo sviluppo di corsi di formazione per lo sviluppo professionale; e la creazione di chioschi con annunci video interattivi.

Sia questo nuovo prodotto che la partnership di D-ID con MyHeritage, che ha visto l'app di quest'ultima azienda conquistare brevemente la vetta delle classifiche dell'App Store di Apple, sono ovviamente importanti deviazioni dall'obiettivo iniziale dell'azienda. Fino a maggio dello scorso anno, D-ID stava ancora raccogliendo fondi per il suo approccio precedente, ma la partnership con MyHeritage ha debuttato a febbraio, seguita da un accordo simile con GoodTrust e da una vistosa collaborazione con Warner Bros. Per il film di Hugh Jackman “Reminiscence” che permette ai fan di inserirsi nel trailer.

L’obiettivo di D-ID potrebbe sembrare quindi molto ampio, ma da un punto di vista tecnico questo nuovo focus sul dare vita alle foto non è così lontano dal suo software di de-identificazione.

Il CEO e co-fondatore di D-ID Gil Perry ha riferito che l'azienda ha scelto questa nuova direzione perché era evidente che esiste un mercato indirizzabile molto ampio, quando si tratta di questo tipo di applicazione.

Clienti con grandi nomi come Warner Bros., così come un'app che domina l'App Store di un marchio relativamente sconosciuto, sembrerebbero supportare tale valutazione. Speaking Portrait, tuttavia, è rivolto ad un bacino di clienti molto variegato e consente a chiunque di generare un video Full HD da un'immagine sorgente, con voce registrata o testo digitato. D-ID sta lanciando il prodotto con supporto per l’inglese, lo spagnolo e il giapponese, ma prevede di aggiungere anche altre lingue in futuro, poiché i clienti ne richiedono il supporto.

D-ID offre due categorie di base di Speaking Portrait. Il primo consiste in un "Ritratto singolo" che può essere realizzato utilizzando una singola immagine fissa, ovvero una testa animata mentre le altre parti rimangono statiche.

Per una realtà un po' più inquietante, c'è l'opzione "Personaggio addestrato" che richiede l'invio di un video di addestramento di 10 minuti del personaggio richiesto, seguendo le linee guida fornite dall'azienda. Questo ha il vantaggio di poter lavorare su uno sfondo personalizzato e intercambiabile e presenta alcune opzioni di animazione preimpostate per il corpo e le mani del personaggio.

Qui sotto potete dare un'occhiata ad un esempio di una giornalista di Speaking Portrait generata utilizzando questo metodo:

La demo che Perry ha mostrato dal vivo al Disrupt è stata creata da una sua foto da bambino. La foto è stata mappata alle espressioni facciali eseguite da una sorta di burattinaio umano che ha anche doppiato la sua versione Ritratto. Ecco un video di come le espressioni dell'oratore sono state rispecchiate dalla foto animata:

 

Ovviamente, la capacità di creare video realistici da una sola foto in grado di dire in modo convincente tutto quello che desideriamo, è un po' una prospettiva da brividi. Abbiamo già assistito a dibattiti di vasta portata sull'etica dei deepfake, nonché gli sforzi del settore per cercare di rilevare le impronte digitali e identificare quando l'IA ha generato risultati realistici, ma artificiali.

Perry ha affermato che D-ID è "vuole assicurarsi di essere usato per il bene, non per il male" e che per raggiungere questo obiettivo alla fine di ottobre rilasceranno un impegno, insieme ai partner, che delinea i loro obiettivi di "trasparenza e consenso". Lo scopo di tale impegno è garantire che "gli utenti non siano confusi su ciò che stanno vedendo e che le persone coinvolte diano sempre il loro consenso".

Ma sebbene D-ID intende fornire garanzie nei suoi termini di utilizzo sull'uso improprio di questo tipo di tecnologia, Perry afferma che "non può farlo da solo", motivo per cui chiede agli altri nell'ecosistema di unire le forze per evitare abusi.
 

Fonte: techcrunch.com
Condividi
Ebook
Sicurezza in Rete: ne sai abbastanza?
Strumenti utili, suggerimenti pratici e tutto quello che devi assolutamente sapere per proteggere davvero i tuoi dispositivi e i tuoi dati personali quando sei connesso
scarica l'ebook

Iscriviti alla
newsletter del
Digital Magazine di
Fastweb

Riceverai ogni settimana le notizie più interessanti sul mondo della tecnologia!
Iscriviti

Grazie per esserti iscritto!

Abbiamo inviato una mail all'indirizzo che hai indicato: per completare l'iscrizione alla newsletter del Digital Magazine di FASTWEB clicca sul link all'interno della mail