OpenAI, la compañía responsable de ChatGPT, lanzó Sora, un nuevo modelo de IA generativa “que puede crear escenas realistas e imaginativas a partir de instrucciones de texto”.
El encargado en anunciarlo fue Sam Altman, director ejecutivo de Open IA. Lo hizo en X y la red social se llenó de videos creados con esta nueva herramienta: desde escenas futuristas, a clips de dibujos animados o escenas de un pueblo del Oeste americano. Por ahora tienen solo un minuto de duración y son mediante instrucciones textuales. También puede alargar videos ya existentes.
Por ahora Sora no está abierto al público general. Sólo está disponible para un pequeño grupo de “artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos”.
Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos de los protagonistas y del fondo. Según sus creadores, “el modelo comprende no solo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico”.
Los videos muestran imágenes con personajes que resultan convincentes y con una gran consistencia visual a lo largo de los distintos planos y tomas que la IA también es capaz de generar. Aún tiene dificultades, como reconocen desde Open AI, “para simular con precisión la física de una escena compleja y es posible que no comprenda casos específicos de causa y efecto. Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco”. Del mismo modo, “también puede confundir los detalles espaciales de un prompt, por ejemplo, mezclando izquierda y derecha -como se observa en el video del hombre corriendo en la cinta de ejercicios-, y puede tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica”.
Cuando Sora se abra al uso del público se rechazarán las solicitudes de ingreso de texto que pidan generar videos que muestren “violencia extrema, contenido sexual, imágenes de odio o imágenes de celebridades”, aseguran sus creadores.
Fuente: Minuto Uno