Google ha comenzado a mostrar de forma práctica hasta dónde puede llegar su nueva generación de modelos de mundo con Genie 3. A través de Project Genie, la compañía está permitiendo que usuarios seleccionados creen y exploren entornos interactivos generados por inteligencia artificial a partir de descripciones en lenguaje natural y algunas imágenes de referencia.
Este movimiento se enmarca en la apuesta de Google DeepMind por sistemas capaces de simular dinámicas complejas del mundo real, más allá de los clásicos agentes que dominan juegos cerrados como el ajedrez o el Go. Aunque, por ahora, el acceso está restringido a suscriptores de pago en Estados Unidos, el proyecto apunta a un futuro en el que diseñar mundos virtuales podría ser tan sencillo como escribir lo que uno tiene en mente.
Genie 3: el modelo de mundo que está detrás del experimento
En el corazón de Project Genie se encuentra Genie 3, un modelo de propósito general desarrollado por Google DeepMind. A diferencia de otros sistemas más estáticos, su función no es solo dibujar paisajes bonitos, sino predecir cómo cambia un entorno cuando el usuario se mueve, interactúa o altera elementos dentro de él.
Este tipo de arquitectura se conoce como modelo de mundo: un sistema de IA capaz de anticipar la evolución de un escenario y el impacto de las acciones en ese entorno. Genie 3 genera el camino por el que avanzas en tiempo real, cuadro a cuadro, manteniendo una coherencia espacial y visual que va más allá de una simple animación o de un paseo por una escena 3D congelada.
Para lograrlo, el modelo utiliza generación autorregresiva, una técnica con la que construye el mundo paso a paso, recordando lo que ya ha creado. Si el personaje se gira o regresa sobre sus pasos, la IA “se acuerda” de lo que había antes y lo reconstruye de forma consistente, algo clave si se quiere simular espacios amplios y creíbles, ya sea un entorno urbano, un paisaje histórico o un mundo completamente ficticio.
Cómo funciona Project Genie: del texto al mundo jugable
Project Genie se presenta como una aplicación accesible desde el navegador, al estilo de otros servicios de Google basados en IA. No hace falta instalar nada ni tener conocimientos técnicos avanzados: la interacción se reduce, en esencia, a describir lo que se quiere conseguir y dejar que el sistema haga el resto.
El proceso arranca con una fase de lo que Google denomina “bocetado de mundos”. El usuario responde a preguntas sencillas del tipo “¿Cómo es tu mundo?” y aporta detalles sobre el escenario (paisaje, clima, estilo gráfico, atmósfera) y sobre la forma en la que prefiere explorarlo: caminando, volando, conduciendo, montando a caballo u otros modos de desplazamiento. También se indica la perspectiva deseada, ya sea en primera o en tercera persona.

A continuación, hay que definir el personaje: puede ser una persona, un animal, un objeto u otra entidad más abstracta. Con esa información, entra en juego Nano Banana Pro, otro modelo de Google que genera una imagen estática de vista previa. Esta especie de foto inicial sirve para comprobar si el mundo se ajusta a lo que el usuario tiene en mente antes de lanzarse a la exploración interactiva.
Si el resultado no convence, es posible retocar el prompt, cambiar elementos de la escena, modificar la apariencia del avatar o ajustar el estilo visual. El usuario puede subir sus propias imágenes, utilizar material generado por otras IAs o partir de fotografías reales, y el sistema combina todos esos datos para afinar el entorno que después se transformará en una experiencia navegable.
Exploración en tiempo real: mundos que reaccionan a tus movimientos
Una vez definido el mundo y aceptada la vista previa, Project Genie pasa al modo interactivo. Aquí es donde Genie 3 despliega su capacidad de simulación: al avanzar por el escenario, el modelo genera en tiempo real lo que hay delante del jugador, teniendo en cuenta lo que ya ha creado y las reglas físicas aproximadas del entorno.
El usuario se mueve mediante controles habituales en videojuegos de PC, como las teclas W, A, S y D para desplazarse, y puede ajustar la cámara para cambiar el ángulo de visión. La experiencia se ejecuta a una resolución de hasta 720p y con una velocidad de interacción en torno a los 20-24 fotogramas por segundo, lo suficiente para ofrecer una sensación de fluidez razonable en esta fase experimental.
Ejemplos propuestos por Google incluyen, por ejemplo, un océano de olas gigantes visto desde la punta de una tabla de surf, o un escenario de alta montaña con nieve deformable en el que el jugador encarna a un alpinista con movimiento omnidireccional. En ambos casos, el interés no está solo en el paisaje inicial, sino en cómo el entorno responde a las acciones, a los cambios de dirección o a los saltos del personaje.
Remezclar, compartir y experimentar con otros mundos
Project Genie no se limita a empezar desde cero cada vez. Una de sus funciones más llamativas es la capacidad de “remezclar mundos” ya existentes. Los usuarios pueden explorar escenarios creados previamente, bien por ellos mismos, bien por otras personas, o seleccionados en una galería curada, y utilizarlos como base para generar nuevas versiones.
Esta opción de remezcla permite aplicar nuevas instrucciones sobre un mundo ya generado, alterando su estilo, añadiendo elementos, cambiando la forma en la que se explora o modificando por completo el tipo de personaje. Además, existe un modo de generación aleatoria, el llamado “randomizer”, que propone entornos con características impredecibles para quien busque inspiración o simplemente quiera experimentar.
Al terminar una sesión, el sistema ofrece la posibilidad de descargar vídeos del recorrido, una forma sencilla de compartir las creaciones en redes sociales, en plataformas de vídeo o en contextos profesionales, como estudios de animación, diseño de niveles o laboratorios de investigación que quieran documentar sus pruebas.
Limitaciones técnicas y estado actual del proyecto
A pesar de todo su potencial, Google insiste en que Project Genie es, por ahora, un prototipo de investigación en fase temprana. Eso se nota en varias restricciones que el propio laboratorio detalla en su blog y en los avisos de uso.
La más clara es la limitación temporal de las sesiones: cada mundo solo puede explorarse durante un máximo de 60 segundos, que es el límite de memoria visual que Genie 3 puede manejar actualmente de manera estable. Esto acota la duración de las experiencias, que por ahora se parecen más a microaventuras o escenas breves que a videojuegos completos.
Además, Google advierte de que los escenarios no son completamente fotorrealistas ni siguen siempre al pie de la letra las indicaciones del usuario. La física también puede resultar aproximada: ciertos comportamientos, colisiones o movimientos pueden no respetar en todo momento las leyes del mundo real, algo esperable en un sistema que todavía está en desarrollo.
Otro punto señalado es el control de los personajes, que pueden mostrar cierta latencia o falta de precisión en la respuesta a las órdenes del usuario. Aunque la tasa de fotogramas es razonable, pequeñas demoras en el control se notan, especialmente para quienes vienen acostumbrados a videojuegos comerciales muy pulidos.
Por último, algunas capacidades avanzadas de Genie 3 anunciadas en demostraciones anteriores todavía no están presentes en esta versión. Entre ellas, los eventos desencadenables que modifican el mundo a medida que se explora, una característica que podría dar pie a dinámicas mucho más ricas, pero que de momento sigue en la hoja de ruta.
Acceso restringido y planes de expansión geográfica
En esta primera etapa, el acceso a Project Genie está limitado a usuarios mayores de 18 años suscritos a Google AI Ultra en Estados Unidos. Esta suscripción, con una cuota mensual elevada, deja claro que el experimento se dirige inicialmente a un público reducido y con un perfil más bien profesional o muy entusiasta.
Google ha señalado su intención de ampliar la disponibilidad a otros territorios una vez que el sistema sea más robusto y haya recogido suficiente información sobre su uso real. Aunque no se han concretado fechas ni países, es de esperar que, si el prototipo avanza, acabe abriéndose paso hacia otros mercados clave, entre ellos la Unión Europea y, dentro de ella, España.
Esa expansión, en cualquier caso, dependerá no solo de cuestiones técnicas, sino también de requisitos regulatorios y de protección de datos que son especialmente estrictos en Europa. La propia Google insiste en que va a ir paso a paso y que no duda en cerrar proyectos que no encajen con sus objetivos, algo que ya se ha visto con otros servicios de la compañía.
Un laboratorio para la AGI y la creación digital
Más allá del impacto inmediato en videojuegos o entretenimiento, Genie 3 y Project Genie encajan en la estrategia de Google DeepMind para avanzar hacia sistemas de inteligencia artificial más generales. Los modelos de mundo son especialmente valiosos para entrenar agentes que necesiten comprender contextos complejos, predecir consecuencias y actuar de forma coherente en entornos cambiantes.
Las aplicaciones potenciales van desde la robótica y la simulación de escenarios físicos hasta el modelado de animaciones, la recreación de localizaciones históricas o la exploración de mundos ficticios en cine, televisión y contenidos interactivos. Poder iterar rápidamente sobre entornos generados por IA reduce tiempos y costes, algo que podría interesar tanto a estudios pequeños como a grandes productoras europeas.
Al mismo tiempo, abrir un prototipo de este tipo a usuarios externos funciona como un banco de pruebas a gran escala. Las interacciones, los errores y las ideas que aporten los participantes ayudarán a ajustar el modelo, a identificar casos de uso que quizá no se habían previsto y a evaluar riesgos, tanto técnicos como éticos, asociados a estas simulaciones cada vez más realistas.
Con Genie 3 y Project Genie, Google está tanteando un terreno en el que la creación de mundos virtuales se vuelve mucho más accesible, aunque todavía con límites claros en calidad visual, control y duración de las experiencias; si el experimento madura y supera la fase de acceso restringido, podría convertirse en una herramienta relevante también para usuarios y empresas de España y del resto de Europa interesados en nuevas formas de diseño interactivo y simulación con IA.