En Perspectiva

IA no puedo más

“No se esperaba el impacto que tuvo”: Mangarelli analizó el caso de DeepSeek

El ingeniero indicó que la empresa china empleó una “enorme” estrategia de comunicación al hacer el chatbot de código abierto.

30.01.2025 18:55

Lectura: 4'

2025-01-30T18:55:00
Compartir en

Por En perspectiva

La empresa china DeepSeek lanzó el 10 de este mes un nuevo chatbot de inteligencia artificial (IA) generativa.

El rendimiento de la aplicación está a la par de otras muy conocidas como ChatGPT. Sin embargo, DeepSeek tuvo un costo de desarrollo muchísimo menor que la inversión que necesitaron grandes compañías estadounidenses como Microsoft o Google.

El lunes, DeepSeek subió al primer puesto de las aplicaciones más descargadas para teléfonos móviles. Su éxito sacudió a las empresas tecnológicas estadounidenses en Wall Street. Por ejemplo, la compañía Nvidia, que fabrica chips ultrapotentes y de alto costo para la industria de la IA, perdió en un solo día US$ 600.000 millones de capitalización bursátil.

En entrevista con En Perspectiva, el ingeniero Eduardo Mangarelli analizó la aparición de DeepSeek y destacó que “no se esperaba el impacto que tuvo” y que la estrategia de comunicación al hacer el producto open source fue una decisión “enorme” a la hora de determinar el éxito de la aplicación.

“Hoy se considera que en esto de los modelos de lenguaje (GPT-4 de OpenAI, Gemini de Google, Cloud de Antropica AI, entre otros) ya se había alcanzado un estado del arte, hasta que DeepSeek anuncia la semana pasada y publica toda la documentación de cómo está hecho, o si nos ponemos un poquito más técnicos, un código abierto u open source”, detalló el ingeniero y adjudicó que fue el causante que “produjo este temblor”.

Mangarelli comentó que primeramente, DeepSeek había impactado en las empresas productoras de chips dedicados a la IA, particularmente Nvidia, “porque las infraestructuras para poner a funcionar estos sistemas requieren gran demanda de energía, y las optimizaciones que generó DeepSeek enviaron una señal de que quizás no se necesitaba tanta energía para hacer esto”. 

En 2024, Estados Unidos había bloqueado por orden ejecutiva la exportación de chips de última generación a China, y “lo que implicó esto fue que en China pudieran utilizar chips con ciertas restricciones, particularmente un modelo que se llama H800, que, de alguna forma, motivó, disparó y fue la innovación en este equipo de investigación de China y de otros también, de cómo poder lograr ciertos objetivos con muchos menores recursos o con ciertas restricciones”, interpretó el ingeniero.

El factor más relevante según Mangarelli fue que DeepSeek sea un producto open source, es decir, que “tiene un objetivo de servir a la comunidad y al mismo tiempo es construido por alguien que luego espera que eso que construyó y que va a usar sea mejorado y perfeccionado por el resto de la comunidad”.

“Esta empresa, DeepSeek, que ofrece esto en forma gratuita que puede usar cualquiera que está escuchando, tiene otro servicio por el cual sí cobra, que es el que le permite a una empresa que desarrolla aplicaciones integrar el servicio de DeepSeek a la aplicación en cuestión”, mencionó el entrevistado. “Imaginate que nosotros desarrollamos un sistema de gestión de clientes y que queremos agregar la inteligencia de DeepSeek. Para eso nos vamos a conectar con su sistema y vamos a pagar por el uso. Ahí hay un negocio”, agregó.

Mangarelli concluyó que, de cara al futuro, “no es raro pensar que esta es una enorme estrategia de comunicación que tiene como uno de los componentes el objetivo de llevar o motivar a empresas tecnológicas para que utilicen la infraestructura de DeepSeek”.