Goku AI, así son los videos creados con la IA gratuita: ¿cómo usar esta herramienta china?

Goku AI es una inteligencia artificial (IA) generativa destinada a la creación de videos y desarrollada por ByteDance, empresa china también a cargo de la app TikTok. Un reportero de Unotv.com pudo utilizar esta herramienta de código abierto para explicar cómo se usa y brindar ejemplos de sus resultados.
¡Así son los videos creados con Goku AI!
El periodista de Uno TV empezó a usar Goku AI este viernes 14 de febrero con un ejemplo, insertando el siguiente prompt simple:
“Imagina un grupo de asteroides en forma de corazón, con la Tierra y la Luna viéndose en el fondo”.
Primer prompt de prueba en Goku AI
La plataforma tardó casi cinco minutos en generar el resultado final y entregó un video de cinco segundos en el que sólo se ve la Luna de fondo y el grupo de asteroides no corresponde con la realidad.
Debido a que medios internacionales destacaron que Goku AI ofrecía videos realistas, el reportero probó con un prompt de carácter más real:
“Imagina una mujer con expresión seria, de 50 años, asistiendo con un doctor en un consultorio pequeño, mientras el médico le muestra una radiografía de sus pulmones”.
Primer prompt de prueba en Goku AI
Aunque las dos personas que aparecen en el video corto parecen sacadas directamente de la vida real y sus gestos lucen naturales, uno de los personajes tiene tres manos.

[TE RECOMENDAMOS: Aguas, no caigas en este “fraude del Bienestar”: video que circula sobre supuestas inversiones es falso]
¿Cómo usar esta herramienta de código abierto?
El reportero de Unotv.com trató de usar Goku AI a través de la plataforma de GitHub, pero no pudo acceder a la inteligencia artificial ni crear prompts.
Por esta razón, se dirigió a la plataforma de Yeschat.AI, en la página que muestra la siguiente descripción:
“Descubra el poder de Goku AI de ByteDance: generación de videos avanzada a su alcance. Transforme sus ideas en videos asombrosos al instante con Goku AI, impulsado por la tecnología de vanguardia de ByteDance”.
Descripción de la página de Yeschat.AI
Para crear videos con esta plataforma, los usuarios deben seguir estos pasos:
- Entra al siguiente link: https://www.yeschat.ai/features/goku-ai
- Presiona el botón “Use for free”
- Elige la opción “Text to…”
- Escribe el prompt de la idea que deseas desarrollar
- Escoge la relación de aspecto: 16:9 o 9:16
- Aprieta el botón “Generate”
- Espera entre cuatro y cinco minutos a que termine el video
Cuando Goku AI termina de crear el video de cinco segundos, brinda la opción de verlo en pantalla completa y muestra tres puntos que despliegan un menú con tres opciones:
- Descargar
- Velocidad de reproducción
- Imagen en imagen
Cabe destacar que esta herramienta también describe imágenes que se suban a la plataforma. Es posible subir archivos en formato JPG, JPEG y PNG con un peso de hasta 10MB.
¿Qué es Goku AI?
GokuAI es una inteligencia artificial de código abierto creada por la empresa china para la creación de videos a partir de prompts. Una de las principales características de esta herramienta es que puede utilizarse gratis, contrario a la mayoría de opciones que eran de paga, según describe el portal Xataka.
Al ser un modelo de código abierto, cualquier usuario puede acceder a ella y replicarla, además de que se puede usar su código para instalarse gratis en dispositivos, según el sitio especializado en tecnología.
- Actualmente, no existen modelos destilados de Goku AI para instalarse en ordenadores, y el modelo completo requiere de GPU potentes, así como de conocimientos técnicos para instalarse, señala el medio español.
Goku AI funciona como un modelo de generación de video basado en el flujo y alimentado por un Transformador de Flujo Rectificado (TFR) para mejorar su calidad y eficacia.
“Con esta tecnología puede ir afinando las imágenes y cada fotograma del vídeo progresivamente, haciendo que las transiciones de movimientos sean suaves y tengan una alta fidelidad visual”, según Xataka.
La tecnología de esta plataforma permite mantener una buena calidad minimizando la carga computacional del proceso, el cual usa un renderizado neural que garantiza movimientos realistas y transiciones fluidas.
También se usa una arquitectura basada en transformadores para modelar las dependencias temporales en las secuencias de video, remató el portal.




