Text to video: intelligenza artificiale ora genera video da un testo

Ascolta l'articolo

L’intelligenza artificiale text to video è capace di creare contenuti multimediali a partire da una richiesta scritta. Tra i primi tool annunciati Gen 2 e ModelScope

Shutterstock

Se fossi un device, quale saresti?
Fai il test

LinkedIn X Facebook WhatsApp Email

Crea una playlist
Condividi l'articolo

LinkedIn X Facebook WhatsApp Email

Negli anni passati gli utenti hanno iniziato a conoscere il mondo dell’intelligenza artificiale attraverso strumenti di tipo text to text o text toimage.

È il caso ad esempio di ChatGPT, che elabora contenuti complessi partendo da indicazioni testuali anche vaghe. Ma anche di DALL-E, che realizza immagini a partire dai desideri scritti degli internauti.

Il 2023 con ogni probabilità sarà l’anno di un nuovo salto tecnologico e dell’affermazione dell’intelligenza artificiale di tipo text to video. Anche perché proprio in queste settimane stanno venendo presentati i primi strumenti capaci di creazione o editing video a partire da una richiesta scritta.

Runway: intelligenza artificiale a favore delle storie

intelligenza artificiale

Credits Shutterstock

Uno dei primi strumenti text to video annunciati in assoluto è ad opera di Runway: una realtà che si presenta come “fondata da artisti” e che insegue l’obiettivo di portare le potenzialità dell’intelligenza artificiale a chiunque abbia qualcosa da dire.

Poco importa che si tratti di editing video, scrittura di testi o podcast. Runway punta a rendere la creazione di contenuti accessibile a tutti. Per farlo scommette su un mix di creatività e competenza tecnologica, servendosi di strumenti avanzati di machine learning.

L’elemento artistico e creativo è una caratteristica distintiva di Runway e rappresenta una vera e propria bussola per tutte le operazioni della startup. In tal senso un’intelligenza artificiale che svolga il ruolo di generatore di video è soltanto il passo di un percorso.

Runway vuole creare nuovo valore nel mondo attraverso l’interazione tra essere umano e macchina. Questa mission, unita a un’attenzione assoluta verso il cliente, ha permesso al team Runway di ottenere finanziamenti da investitori quali Felicis, Coaute, Amplify, Lux e Compound.

Fastweb Mobile Full

10,95€/mese

Internet 200 GB e Minuti illimitati

Spedizione SIM GRATIS

scopri

Come funziona lo strumento text to video di Runway

intelligenza artificiale

Credits Shutterstock

L’intelligenza artificiale annunciata da Runway potrebbe essere uno dei primi generatori video che partono da un semplice input testuale disponibili per il grande pubblico. Un modello text to video che rischia di anticipare l’operato di colossi quali Microsoft, Google e Meta.

Un risultato più che rimarchevole, considerato che il team di Runway è composto da meno di 50 persone. Certo, si tratta di professionisti dell’editing video, con lunga esperienza anche nel settore dell’AI.

Si pensi in tal senso a Gen-1, uno strumento di creazione video o di trasformazione video, che si basa su prompt di testo o su immagini di riferimento. Le possibilità di Gen-1 sono già considerevoli: ad esempio è in grado di trasformare un rendering cambiando radicalmente l’ambientazione o i connotati del suo protagonista.

L’annunciato strumento di AI Gen-2 dovrebbe però andare ben oltre. Stando a Runway permetterà agli utenti di creare video a partire da semplici indicazioni testuali. In fase di lancio si tratterà di contenuti di breve durata (massimo 3 secondi), ma nulla vieta che il limite di tempo venga superato.

Ad oggi Gen 2 è uno strumento quasi totalmente sconosciuto. Runway ha diffuso dei filmati dimostrativi del suo utilizzo, ma quasi nessuno ha potuto sperimentarlo al di fuori dell’azienda.

Modelscope: il primo generatore video basato su intelligenza artificiale?

intelligenza artificiale

Credits Shutterstock

In attesa di poter testare le potenzialità di Gen 2 di Runway, gli appassionati di intelligenza artificiale segnalano un altro strumento text to video apparentemente degno di nota. Si tratta di ModelScope, un tool realizzato da DAMO Vision Intelligence Lab: una divisione di ricerca legata al colosso dell’e-commerce Alibaba.

ModelScope è attualmente in fase di test presso il pubblico ed è disponibile in versione open source su Hugging Face. Il suo utilizzo è gratuito, ma potrebbe essere necessario pagare una cifra simbolica per poter eseguire il sistema su server GPU separato.

Ad oggi i campioni rilasciati da ModelScope sono ancora grezzi, ma le potenzialità dello strumento sembrano comunque impressionanti. Il tool è in grado di arrivare alla creazione di un video partendo da una qualsiasi richiesta testuale. L’unico limite in tal senso è la fantasia dell’utente, che potrebbe preferire vedere un palombaro ballerino, piuttosto che una giraffa su un deltaplano.

ModelScope si prenderà qualche minuto per elaborare la richiesta, procedendo alla creazione e all’editing del video. Il risultato è in linea con le aspettative, ma a onor del vero non è ancora completamente competitivo.

Le animazioni sono ancora limitate e soprattutto molte delle immagini utilizzate come base presentano i watermark di celebri siti stock internazionali. Anche se a onor del vero quest’ultimo problema è condiviso anche da molti generatori AI di tipo text to image in circolazione.

Non a caso l’agenzia fotografica Getty Images ha recentemente fatto causa alla società che ha rilasciato lo strumento AI Stable Diffusion: un generatore di immagini che, stando all’accusa, crea una versione corrotta della filigrana Getty, utilizzando impropriamente materiale protetto da diritto d’autore.

Le prossime sfide dei tool AI text to video

impostazioni video nello smartphone

Credits Shutterstock

L’integrazione di un database vasto e libero è sicuramente una delle sfide più importanti condivise da Runaway Gen 2, ModelScope e i vari strumenti di intelligenza artificiale text to video che arriveranno nei mesi a venire.

Allo stesso tempo le aziende vorranno sicuramente provvedere a sviluppare la creazione video: tanto dal punto di vista della durata quanto da quello della qualità e quantità delle animazioni.

L’impressione degli addetti ai lavori è che Gen 2 non sia ancora pronto per essere testato a pieno. Nel frattempo dunque il suggerimento è di sperimentare con ModelScope, tenendo conto del suo stato attuale di avanzamento.

Limiti strutturali o di copyright che comunque non stanno impedendo alla community degli utenti di sbizzarrire la propria creatività. Basta effettuare qualche ricerca approfondita sul web per individuare già diversi prodotti figli dell’intelligenza artificiale. Dai video di Darth Vader che gira per un supermercato, a quelli di Spiderman che salva il mondo al fianco di un roditore capibara.

Per saperne di più: Intelligenza Artificiale, cos'è e cosa può fare per noi

A cura di Cultur-e

Topic:

Intelligenza Artificiale

#CuriositaTech

#NuoveTecnologie

#SicurezzaInformatica

Addestramento IA non consentito: É assolutamente vietato l’utilizzo del contenuto di questa pubblicazione, in qualsiasi forma o modalità, per addestrare sistemi e piattaforme di intelligenza artificiale generativa. I contenuti sono coperti da copyright.

TecnologicaMente

Se fossi un device, quale saresti?

Se fossi un device, quale saresti?

Scopri il tuo alter ego tech: uno smartphone, un drone o un e-reader

Fai il test gratuito

LinkedIn X Facebook WhatsApp Email

Grok 4 supera Gemini e ChatGPT, cosa può fare l'AI di Elon Musk

Elon Musk ha presentato ufficialmente Grok 4, il nuovo modello di intelligenza artificiale che promette di cambiare per sempre il settore dell’AI generativa

HOW-TO

Intelligenza Artificiale

Come ottenere velocemente dei riassunti con Microsoft Copilot

Con Microsoft Copilot è possibile ottenere rapidamente dei riassunti di diverse tipologie di contenuti e documenti. Scopriamo come fare in pochi clic

Intelligenza Artificiale

Cos'è il Codice di Condotta per l’AI e cosa cambia per le aziende

L’Europa vuole regolamentare l’intelligenza artificiale e per farlo ha redatto un nuovo Codice di Condotta per disciplinare le aziende che operano nel settore

Scopri i corsi gratuiti della Fastweb Digital Academy

Come interrogare le intelligenze artificiali: prompt engineering

Dopo il lancio di Chat-GPT di OpenAI, molti utenti si sono resi conto che la qualità della risposta spesso dipende dall’accuratezza della domanda, il…

A. I. copywriting – Come usare l’intelligenza artificiale per creare contenuti

L’intelligenza artificiale sta facendo passi da gigante in tutti i campi: dalla gestione e interpretazione dei big data ai chatbot e virtual…

Tutto quello che serve sapere su Intelligenza Artificiale

L’intelligenza artificiale è ormai pervasiva nella nostra quotidianità. Da sistemi di traduzione automatica, ad assistenti vocali sullo smartphone, a…