Google saca los colores a Meta con su IA creadoras de vídeos

Google saca los colores a Meta con su IA creadoras de vídeos

Daniel Marín

El mundo de la generación de imágenes a través de inteligencia artificial está avanzando demasiado rápido. Resulta incluso difícil mantenerse al día de todo lo que va saliendo. La semana pasada, Meta mostró al mundo que ellos también estaban dentro de este negocio. Los de Zuckerberg mostraron una serie de vídeos cortos que habían logrado generar con un simple input de texto. Apenas ha llegado a pasar una semana, pero Google ya ha superado el nivel de los de Facebook con Imagen Video, una inteligencia que parece tener muchísimo potencial.

Seguir el ritmo a los avances en IA es agotador

Estamos en un momento histórico sin precedentes. Algunas aplicaciones de inteligencia artificial se están desarrollando tan rápido que apenas da tiempo a procesar una nueva tecnología cuando ya ha llegado la siguiente para superarla. Hace poco más de un mes, Stable Diffusion se presentaba como una IA gratuita y de código abierto. Una auténtica revolución.

La semana pasada, DreamBooth cambió la forma de usar Stable Diffusion, pues el sistema permite entrenar la IA con nuestra cara o cualquier tipo de concepto que se nos ocurra. DreamBooth requería en un principio usar hardware profesional de Nvidia, pero en cuestión de horas, la comunidad hizo tantos forks que acabó siendo posible ejecutar el programa en un ordenador doméstico. No fue tampoco la única noticia importante de la semana. Meta también enseñó al mundo sus avances en este sector. Mostraron una serie de vídeos cortos de figuras generadas por IA. Como decíamos, Google no ha tardado en superar a su competencia.

Google da un paso al frente con el ‘text to video’

Hace unas cuantas semanas, el divulgador Carlos Santana (dotcsv) planteaba en YouTube si era posible hacer una película con una IA. En su exposición, el experto en inteligencia artificial veía que el escenario todavía era complicado, pero no imposible.

Como decimos, este mundillo avanza a un ritmo muy frenético. Ayer mismo, Google enseñó al mundo Imagen Video, una inteligencia artificial capaz de generar vídeos cortos utilizando un comando de texto con lenguaje natural. El proyecto fue presentado en Twitter por Jonathan Ho. El programador mostró un pequeño vídeo de cinco segundos de unas hojas cayendo sobre un lago que formaban las palabras ‘Imagen Video’. Aparentemente, no parece nada espectacular, pero lo cierto es que, hasta la fecha, prácticamente ninguna de las IA que conocemos sabe generar texto dentro de las imágenes.

Imagen del usuario de twitter
Jonathan Ho
@hojonathanho
Excited to announce Imagen Video, our new text-conditioned video diffusion model that generates 1280×768 24fps HD videos! #ImagenVideo
https://t.co/JWj3L7MpBU
Work w/ @wchan212 @Chitwan_Saharia @jaywhang_ @RuiqiGao @agritsenko @dpkingma @poolio @mo_norouzi @fleet_dj @TimSalimans https://t.co/eN81LqZW7I
05 de octubre, 2022 • 19:29

3.3K

243

El enlace de la publicación muestra un poco más sobre esta tecnología. Se trata de una aplicación extra de Google Imagen Research, que tiene un funcionamiento muy similar a Dall-E 2. Google Imagen Video permite crear clips con resolución HD (1280 por 768 píxeles) a 24 fotogramas por segundo. La diferencia respecto a lo que mostró Meta la semana pasada es notable, pues la compañía de Mark Zuckerberg simplemente mostró unos renders de objetos vectoriales que giraban alrededor de una cámara. Para nada, un resultado tan llamativo y útil como esta tecnología que acaban de presentar los de Mountain View.

El objetivo de esta publicación es claramente mostrar al mundo que están por delante de Meta en este terreno. No obstante, todavía es pronto para saber qué planes de futuro tiene Google con este programa.