No solo los NFTs avanzaron en 2021
2021 trajo muchos avances en el terreno de la inteligencia artificial. Por primera vez en la historia, el procesamiento del lenguaje natural y los modelos generativos se dieron la mano. A mitad de año, OpenAI ya había avanzado tanto que comenzaron a comercializarse los primeros productos basados en su API. Entre ellos destacaron las IA de redacción, en el que el usuario escribe una instrucción con lenguaje normal y corriente y la máquina da como resultado una frase o un párrafo con una estructura sintáctica correcta —no necesariamente la información de salida será correcta—.
Ocurrió lo mismo con las imágenes. A principio de 2021, OpenAI presentó Dall-E, una implementación de su inteligencia artificial capaz de generar imágenes a golpe de texto y sin depender exclusivamente de un entrenamiento específico en un campo. Sin embargo, la versión original de Dall-E no duró demasiado. En cuestión de meses, OpenAI estuvo en el punto de mira con CLIP, una IA capaz de aprender modelos visuales y capaz de generar imágenes con ciertos estilos. Es de hecho la base de entrenamiento que utiliza la app Wombo Art para generar imágenes estilo Estudio Ghibli o Salvador Dalí entre otras muchas variaciones disponibles.
Pero CLIP tampoco fue la gran revolución de 2021. A finales de año, los del OpenAI lanzaron GLIDE, una especie de fork de Dall-E con unas capacidades impresionantes, pues era capaz de dar solución a cualquier input de texto usando un único modelo. A nivel visual, CLIP era superior a Dall-E. También en cuanto a resolución y detalle. El youtuber Dot CSV es un experto en esta materia, y durante todo el pasado año, se dedicó a subir vídeos divulgativos a su canal explicando cómo iba mejorando esta tecnología a pasos agigantados.
Dall-E vuelve mejorado en 2022
Sin embargo, este 2022, Dall-E ha vuelto a la carga con Dall-E 2. OpenAI vuelve a demostrar que está a la cabeza en el desarrollo de modelos generativos con esta nueva versión, que además de igualar las características de GLIDE, que ya eran bastante impresionantes, también añade sus funciones propias. Esta nueva versión puede escalar imágenes y crear variaciones de una foto. También ha mejorado significativamente a la hora de generar sombras, reflejos y texturas en las imágenes.
Por ejemplo, una de las funciones estrella de versiones anteriores de las inteligencias artificiales de la compañía han sido la generación de rostros. Pues bien, la segunda generación del Dall-E impide crear caras por software. Esto se ha hecho con vistas a que la gente no pueda crear imágenes o vídeos realistas de personajes públicos. De este modo, la inteligencia artificial no podrá ser utilizada para generar deep fakes para crear bulos, desinformación o denigrar a otras personas.
Por el momento, esta tecnología no está disponibles para el gran público. No obstante, algunas implementaciones de OpenAI son accesibles a través de servicios de terceros (algunas como las de escritura son de pago) y otras requieren una cuenta académica para poder utilizar el software.
Sé el primero en comentar