Nuova intelligenza artificiale “sogna” e crea video partendo da singola immagine

Credito: DALL-E di OpenAI (immagine generata da intelligenza artificiale)

Si chiama Transframer il nuovo algoritmo video creato da DeepMind, “succursale “di Google, descritto tra l’altro in uno studio pubblicato su arXiv. La stessa DeepMind ha pubblicato un nuovo tweet in cui fornisce alcuni esempi di video, che per ora risultano avere una risoluzione abbastanza bassa, che l’intelligenza artificiale ha creato partendo da una singola immagine.

Framework generativo generico

Come spiega lo stesso tweet, Transframer è un “framework generativo generico” che gestisce immagini e video in ambienti probabilistici. In sostanza “prevede” i frame con i quali si può comporre un video partendo da una singola immagine. Deriva da algoritmi che tra l’altro si sono diffusi molto nel corso degli ultimi anni e che sono in grado di generare del testo in base a dei “suggerimenti” (detti anche “prompt”) iniziali forniti da un utente umano. Alcuni hanno modificato questo algoritmo per creare immagini partendo da una descrizione (anch’essa fornita da un umano) ed è questo il caso del noto DALL-E di OpenAI.

Algoritmo può creare video coerenti della durata di 30 secondi

In molti sospettavano che qualche cosa stesse bollendo in pentola anche per quanto riguarda la generazione di video. Transframer è un’intelligenza artificiale che prevede, attraverso calcoli probabilistici, un particolare ambiente utilizzando un’immagine di partenza: ad esempio può prevedere come può apparire un oggetto presente immagine ripreso da un’altra angolazione. Da previsioni come queste risulta poi relativamente a “facile” creare dei frame per comporre un video. “Il nostro approccio unifica un’ampia gamma di attività, dalla segmentazione delle immagini, alla sintesi di viste innovative e all’interpolazione video”, spiegano i ricercatori nell’abstract. L’algoritmo può creare video coerenti della durata di 30 secondi partendo da una singola immagine e senza che si debbano fornire dati o informazioni geometriche esplicite.

In futuro basterà fornire sceneggiatura ad un’intelligenza artificiale?

C’è già chi pensa di utilizzare le immagini create dalle intelligenze artificiali come DALL-E per creare proprio le immagini di partenza con cui una seconda intelligenza artificiale come Transframer possa lavorare. Tutto lascia presagire che in un futuro neanche lontanissimo sarà possibile dare un suggerimento ad un’intelligenza artificiale affinché crei un vero e proprio video. Quanto sarà lontano il momento in cui basterà dare una “sceneggiatura” in pasto ad un’intelligenza artificiale per fargli realizzare un nuovo lungometraggio in uscita al cinema?

Note e approfondimenti

  1. [2203.09494] Transframer: Arbitrary Frame Prediction with Generative Models (lo studio su arXiv)
  2. Il tweet di DeepMind
  3. Transframer

Articoli correlati


Condividi questo articolo


Dati articolo