Por The New York Times | Cade Metz
Ian Sansavera, un arquitecto de software de una empresa emergente neoyorquina llamada Runway AI, tecleó una breve descripción de lo que quería ver en un video. “Un río tranquilo en el bosque”, escribió.
Menos de dos minutos después, un servicio experimental de internet generó un video corto de un río tranquilo en un bosque. El agua corriente del río brillaba bajo el sol mientras se pasaba entre árboles y helechos, doblaba por un recodo y salpicaba suavemente sobre las rocas.
Runway, la cual planea abrir su servicio a un pequeño grupo de probadores esta semana, es una de varias empresas que están creando tecnología de inteligencia artificial que pronto permitirá a los usuarios generar videos solo con teclear varias palabras en un recuadro de la pantalla de una computadora.
Representan la siguiente etapa de una carrera industrial —en la que participan gigantes como Microsoft y Google, así como empresas emergentes mucho más pequeñas— para crear nuevos tipos de sistemas de inteligencia artificial que algunos creen que podrían ser el siguiente gran avance tecnológico, tan importante como los navegadores web o el iPhone.
Los nuevos sistemas de generación de video podrían acelerar el trabajo de los cineastas y otros artistas digitales, mientras se convierten en un nuevo y rápido mecanismo que crea desinformación en línea difícil de detectar, lo cual dificulta todavía más saber qué es real en el internet.
Los sistemas son ejemplos de lo que se conoce como inteligencia artificial generativa, la cual puede crear texto, imágenes y sonidos en un instante. Otro ejemplo es ChatGPT, el chatbot en línea creado por OpenAI, una empresa emergente de San Francisco, que sorprendió a la industria tecnológica con sus habilidades a finales del año pasado.
Google y Meta, la empresa matriz de Facebook, develaron los primeros sistemas de generación de video el año pasado, pero no los compartieron con el público porque les preocupaba que los sistemas se utilizaran para difundir desinformación con una rapidez y eficacia recién adquiridas.
Sin embargo, para Cristóbal Valenzuela, director ejecutivo de Runway, la tecnología era demasiado importante como para mantenerla en un laboratorio de investigación, a pesar de sus riesgos. “Es una de las tecnologías más impresionantes de los últimos cien años”, afirmó. “De hecho, es necesario que la gente la utilice”.
Por supuesto que la capacidad de editar y manipular películas y videos no es nada nuevo. Los cineastas lo han hecho durante más de un siglo. En años recientes, investigadores y artistas digitales han utilizado diversas tecnologías de inteligencia artificial y programas de software para crear y editar videos que a menudo se denominan videos ultrafalsos.
No obstante, sistemas como el que ha creado Runway, con el tiempo, podrían remplazar las habilidades de edición con solo presionar un botón.
La tecnología de Runway genera videos a partir de cualquier descripción breve. Para empezar, solo basta teclear una descripción como si fuera una nota rápida.
Eso funciona mejor si la escena tiene algo de acción —pero no demasiada—, algo así como “un día lluvioso en la gran ciudad” o “un perro con un teléfono celular en el parque”. Presionas aceptar y el sistema generará un video en uno o dos minutos.
La tecnología puede reproducir imágenes comunes, como un gato durmiendo sobre una alfombra. O puede combinar conceptos dispares para generar videos raros pero divertidos, como una vaca en una fiesta de cumpleaños.
Los videos tan solo duran cuatro segundos y el video está entrecortado y borroso si se mira de cerca. A veces, las imágenes son extrañas, distorsionadas y perturbadoras. El sistema puede fusionar animales como perros y gatos con objetos inanimados como pelotas y teléfonos celulares. No obstante, si se le dan las indicaciones correctas, produce videos que muestran hacia dónde se dirige la tecnología.
“En este momento, si veo un video de alta resolución, probablemente confíe en que es verdadero”, opinó Phillip Isola, profesor del Instituto Tecnológico de Massachusetts especializado en inteligencia artificial. “Pero eso cambiará con mucha rapidez”.
Al igual que otras tecnologías de inteligencia artificial generativa, el sistema de Runway aprende analizando datos digitales, en este caso fotos, videos y pies de fotos que describen el contenido de esas imágenes. Al entrenar este tipo de tecnología con cantidades cada vez mayores de datos, los investigadores están seguros de poder mejorar y ampliar rápidamente sus capacidades. Los expertos creen que pronto generarán minipelículas de aspecto profesional, con música y diálogos. “En los viejos tiempos, para hacer algo que se pareciera aunque fuera un poco a esto, debías tener una cámara, utilería, una locación, un permiso, dinero”, explicó Susan Bonser, autora y editora de Pensilvania que ha experimentado con las primeras versiones de la tecnología del video generativo. “Ahora no hace falta nada de eso. Puedes sentarte e imaginarlo”. De izquierda a derecha: Alejandro Matamala-Ortiz, Cristóbal Valenzuela y Anastasis Germanidis, fundadores de Runway, en su oficina de Manhattan, el 31 de marzo de 2023. (Justin J Wee/The New York Times) Anastasis Germanidis, arriba, Alejandro Matamala-Ortiz, izquierda, y Cristóbal Valenzuela, fundadores de Runway, en su oficina de Manhattan, el 31 de marzo de 2023. (Justin J Wee/The New York Times)