
In uno dei tanti laboratori che sviluppano tecnologie all’avanguardia di Microsoft è stato sviluppato uno speciale algoritmo permette ad un software di generare immagini partendo da descrizioni testuali. Non si tratta di una novità assoluta ma la precisione con cui questo nuovo sistema genera le immagini partendo da una descrizione neanche troppo dettagliata colpisce non poco.
La nuova tecnologia, ovviamente ancora in fase di sviluppo, presta un’attenzione notevole alle singole parole contenute nella descrizione tanto che può produrre, secondo Microsoft, immagini con un livello di qualità e di precisione tre volte migliore rispetto alle precedenti tecniche.
La ricerca dietro agli algoritmi di questo nuovo software ha prodotto puoi un documento pubblicato su arXiv.
C’è da specificare una cosa abbastanza importante: il nuovo sistema non va a cercare un’immagine su Internet, come avviene con diversi software, sviluppati per esempio anche da Google, sempre in prima linea quando si tratta di cercare informazioni o immagini. Questo sistema crea un’immagine da zero, un vero e proprio disegno eseguito da un bot. E le immagini vengono create pixel per pixel.
L’esempio che fa Microsoft è quello di un uccellino disegnato da software partendo dalla descrizione “uccello giallo con ali nere e un becco corto”. Come si può vedere dall’immagine, la rappresentazione “artistica” risulta più che precisa, con una qualità che si avvicina a quella delle reali fotografie.
La cosa affascinante, come dichiara Xiaodong He, uno dei ricercatori impegnati nel progetto, è che questi uccelli non esistono nella realtà, né nessuno li ha mai immaginati: sono semplicemente stati partoriti dalla “immaginazione” di un computer.
Possibili utilizzi di una tecnologia del genere? Si può immaginare un utilizzo di algoritmi come questi in studi di architettura o di design o in tutte quelle professioni basate sul disegno o sulla pittura.
Qualcuno immagina film di animazione creati in maniera automatica partendo semplicemente da sceneggiature scritte: fantascienza o possibile realtà?
Fonti e approfondimenti
- Microsoft researchers build an AI that draws what you tell it to (IA)
- [1711.10485] AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks (IA)
- Autori ricerca: Tao Xu, Pengchuan Zhang, Qiuyuan Huang, Han Zhang, Zhe Gan, Xiaolei Huang, Xiaodong He
- Crediti immagine: microsoft.com