sora | OpenAI anuncia IA para crear vídeos

OpenAI anunció la llegada de Sora, una inteligencia artificial generativa para crear vídeos a partir de comandos de texto. La novedad se presenta este jueves (15) como algo capaz de “simular el mundo físico en movimiento” y se une a las IA para crear texto (ChatGPT) e imágenes estáticas (DALL-E) de la empresa dirigida por Sam Altman.
Sora es capaz de crear vídeos de hasta un minuto de duración sin perder calidad visual y manteniéndose fiel a los parámetros definidos por la orden del usuario, garantiza el desarrollador. Los ejemplos de videos creados con IA publicados por OpenAI son absolutamente increíbles y plantean la idea de una tecnología de punta capaz de crear videos “desde cero” de manera impecable; mira los videos a lo largo de este texto.
A pesar del gran potencial para despertar la curiosidad del público, Sora está actualmente disponible para un grupo restringido de probadores de seguridad, que intentan identificar posibles daños y riesgos generados por la IA. Además, OpenAI advierte que ya ha liberado la tecnología a artistas visuales y cineastas con el fin de obtener comentarios para que la herramienta sea "lo más útil posible para los profesionales creativos".
Del texto al vídeo
Actualmente ya existen algunas IA capaces de crear vídeos de forma satisfactoria, pero parece que OpenAI quiere ir más allá. La nueva tecnología de IA sería capaz de comprender la solicitud de quien ingresa un comando de forma contextualizada para generar un resultado avanzado y coherente con el mundo real.
“Sora puede generar escenas complejas con diferentes personajes, tipos de movimiento específicos y detalles precisos de la escena principal y el fondo”, explica el creador de ChatGPT. "El modelo comprende no sólo lo que el usuario solicitó en el mensaje, sino también cómo existen esas cosas en el mundo real".
En este sentido, Sora promete poder crear varias "capturas" de imágenes con diferentes perspectivas para lograr el estándar solicitado por el mensaje.
No todo son flores
A pesar de no escatimar elogios a su propia herramienta, OpenAI también advierte de sus debilidades. Según la empresa, Sora puede tener dificultades para simular la física de efectos más complejos y comprender cosas muy específicas.
“Por ejemplo, una persona puede morder un trozo de galleta, pero después de eso, la galleta ya no tiene la marca de los dientes”, explica la empresa.
Ubicar la “cámara” en el espacio que guía la perspectiva del espectador también puede ser un problema para Sora. Según el desarrollador, el modelo "puede tener problemas con descripciones precisas de eventos que suceden a lo largo del tiempo, como seguir una trayectoria de cámara específica".
¿Y los riesgos?
En un mundo cada vez más lleno de deepfakes eróticos de personas famosas y no, la poderosa IA para crear videos genera algunas preocupaciones. OpenAI parece consciente de ello y refuerza de antemano que su nuevo modelo ha sido probado por expertos en áreas clave como la desinformación, el contenido de odio y los prejuicios.
“También creamos herramientas para ayudar a detectar el uso indebido de contenido, como un clasificador que notifica cuando Sora genera un video”, agrega la empresa. El propietario de ChatGPT también informa que planea incluir códigos de metadatos C2PA, el mismo que comenzó a utilizar recientemente en las imágenes generadas por DALL-E, para facilitar la identificación del contenido generado por IA.
Finalmente, OpenAI garantiza que trabaja junto con “legisladores, educadores y artistas de todo el mundo” para comprender posibles usos erróneos y dañinos de la tecnología.
Otro punto crucial relacionado con la IA generativa, la base de datos para entrenar dichos modelos, no ganó mucha importancia por parte de OpenAI en el anuncio de la herramienta. La única mención de esto indica que Sora se basó en “investigaciones previas con los modelos GPT y DALL-E”.
En cualquier caso, la compañía se comprometió a publicar este jueves el documento técnico con todos los detalles de la nueva IA.
Disponibilidad
OpenAI no ha revelado cuándo se lanzará Sora (o cualquier producto basado en esta tecnología) al público en general.