La empresa OpenAI, creadora del ChatGPT, presentó este lunes su nuevo modelo de inteligencia artificial generativa, GPT-4o, con nuevas capacidades de producción y comprensión de textos, imágenes y sonidos, que estará disponible de forma gratuita.

“Estamos muy, muy entusiasmados de presentar GPT-4o a todos nuestros usuarios gratuitos”, declaró en una conferencia de prensa virtual Mira Murati, directora tecnológica de la startup con sede en California, Estados Unidos.

El nuevo modelo será desplegado en los productos de OpenAI en las próximas semanas, según la compañía.

Este modelo ahora capta emociones, puede ser interrumpido sin inconvenientes y además traduce en tiempo real, entre otras características.

"GPT-4o":
Por el nuevo modelo de inteligencia artificial que presentó OpenAI pic.twitter.com/e4JgISHNbg

— ¿Por qué es tendencia? (@porquetendencia) May 13, 2024

La presentación de la empresa que lanzó la revolución de la inteligencia artificial generativa era muy esperada, en momentos en que los gigantes de la tecnología multiplican los anuncios de nuevas herramientas de IA, cada vez más potentes y personalizadas.

Al presentar esta nueva versión, OpenAI mostró un asistente accionado por voz, capaz de reproducir de forma asombrosa la fluidez de discusiones entre humanos.

“Están la transcripción, la inteligencia y la capacidad de hablar reunidas para aportarles el modo vocal”, resumió Murati, quien mostró junto a dos colegas cómo los usuarios pueden interactuar con ChatGPT.

La nueva versión de ChatGPT fue capaz de “percibir la emoción” de un usuario nervioso, le recomendó hacer respiraciones, bromeó con que parecía "una aspiradora", y mostró un rango de estilos y tonos en su voz leyendo un cuento para niños.

Entre otras cosas, el 'chatbot' ahora puede ser interrumpido y responder inmediatamente sin tardar segundos, resolver problemas matemáticos a través de vídeo, o hacer interpretación y traducción simultánea de idiomas de viva voz.

Math problems with GPT-4o and @khanacademy pic.twitter.com/RfKaYx5pTJ

— OpenAI (@OpenAI) May 13, 2024

Carrera por la IA

Esta nueva versión del programa de OpenAI llega un día antes de una también esperada presentación de Google sobre su motor de búsqueda Gemini, su herramienta de IA que compite con ChatGPT.

Esta carrera detrás de los modelos de IA llevó a Microsoft (principal inversor de OpenAI) a convertirse en la mayor empresa del mundo por capitalización bursátil, arrebatando el primer puesto a Apple.

OpenAI y Microsoft disputan con Google el puesto de líder del sector, aunque Meta (matriz de Facebook) y Anthropic (con inversión de Amazon) también están haciendo sus armas para disputar un lugar.

Todas las empresas del rubro están intentando descifrar cómo cubrir los costos exorbitantes de la IA generativa, que en gran parte se va para la gigante estadounidense de los chips o semiconductores NVIDIA.

Hasta ahora, las versiones gratuitas disponibles han sido aquellas con menos funciones de los programas de OpenAI o de Google, y existen dudas si el gran público está dispuesto a pagar para seguir teniendo acceso.

Los creadores de estos programas también enfrentan una presión creciente por parte de autores y creadores, que han empezado a exigir contribuciones por usar sus contenidos para entrenar a sus modelos informáticos, algo que también tiende a encarecer la tecnología.

OpenAI ha firmado acuerdos de contenido con Associated Press, el Financial Times y Axel Springer, pero también se ha visto envuelta en una demanda judicial con el diario New York Times.

También enfrenta diferentes demandas judiciales de artistas, músicos y autores en Estados Unidos.

Con información de AFP y EFE.