Montevideo Portal
La empresa OpenAI, uno de los líderes en inteligencia artificial generativa, presentó su modelo Sora, que acepta instrucciones en texto y las convierte en escenas de video, realistas, con múltiples caracteres y movimientos específicos.
Según la firma, establecida en 2015 y dirigida por Sam Altman, que ha desarrollado ChatGPT y el generador de imágenes fijas DALL-E, Sora es capaz de crear “escenas complejas con detalles del componente principal y el trasfondo”.
La compañía también indicó que su modelo puede “entender cómo existen los objetos en el mundo físico”, y tiene la capacidad de “interpretar acertadamente las instrucciones y de generar caracteres convincentes que expresan emociones vibrantes”.
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Sora es el término en japones para “cielo”, y la compañía todavía no la ha puesto a disposición del público porque sigue analizándola para comprender los peligros del sistema, según indicó el diario The New York Times.
En cambio, OpenAI ha compartido la tecnología con un pequeño grupo de académicos y otros investigadores externos cuya tarea es detectar las maneras en las cuales Sora podría usarse con fines maliciosos.
https://t.co/qbj02M4ng8 pic.twitter.com/EvngqF2ZIX
— Sam Altman (@sama) February 15, 2024
Steven Levy, de la revista Wired, describió su experiencia cuando OpenAI le permitió ver, aunque no operar, el modelo Sora en respuesta a la instrucción en texto para crear una escena de la ciudad de Tokio captada por una cámara que se mueve por las calles, sigue a algunas personas en un día con nieve.
“El resultado es una vista convincente de lo que es, sin duda, Tokio en ese momento, cuando coexisten los copos de nieve y los capullos de cerezos”, escribió Levy. “La cámara virtual, colocada en un robot volador (dron), sigue a una pareja que camina por el paisaje”, agregó.
La firma indica que Sora permite la creación de muchos mundos, con escenas realistas o fantásticas, tridimensionales, con movimientos fluidos, y aún en las escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctas.
De este modo, OpenAI, que revolucionó el emergente sector de los servicios de IA regenerativa, dispondrá de un conjunto de servicios que van desde la generación de texto, imagen estática y video.
EFE
Montevideo Portal
Acerca de los comentarios
Hemos reformulado nuestra manera de mostrar comentarios, agregando tecnología de forma de que cada lector pueda decidir qué comentarios se le mostrarán en base a la valoración que tengan estos por parte de la comunidad. AMPLIAREsto es para poder mejorar el intercambio entre los usuarios y que sea un lugar que respete las normas de convivencia.
A su vez, habilitamos la casilla [email protected], para que los lectores puedan reportar comentarios que consideren fuera de lugar y que rompan las normas de convivencia.
Si querés leerlo hacé clic aquí[+]