Waymo, la empresa de taxis que se conducen por su cuenta, introdujo este miércoles un informe donde entró en detalle sobre un “modelo multimodal de conducción autónoma” abreviado EMMA en inglés (End-to-End Multimodal Model for Autonomous Driving) que utilizará a la inteligencia artificial de Google, Gemini para su procesamiento de datos y asegurar una “trayectoria precisa” a la hora de conducir y elegir rutas.

Esta investigación es uno de los primeros indicadores que la empresa líder en conducción autónoma diseña planes para utilizar IAs de este tipo en sus operaciones. Dicha indicación también puede implicar que los modelos de lenguaje multimodal (Gemini, ChatGPT, entre otros) podrían explorar nuevos horizontes más allá de ser chatbots, organizadores de correo electrónico y generadores de imagen, según dijo The Verge

En concreto, Waymo explicó en su documento que apunta a “desarrollar un sistema de manejo autónomo donde la IA es un ciudadano de primera clase”.

El informe explica que históricamente, los sistemas que se usan para conducir estos vehículos opera a base de ciertos “módulos” que se basan en factores como percepción, mapeo, predicción y planeamiento, lo que a criterio del servicio de taxis tiene como desventaja una “avalancha de errores” que lo limita y hace más “lento” a la adaptación.

A partir de esa base, el artículo argumentó que Gemini trae una posible solución a esa desventaja del modelo que usan sus taxis, ya que tiene capacidades de razonamiento “superiores” y puede invocar “trenes de pensamiento como un ser humano”, teniendo una capacidad lógica más aguda a la hora de resolver cuestiones complejas en poco tiempo.

“Esperamos que los resultados inspiren nuevas investigaciones para mitigar este tipo de problemas y así evolucione el estado del arte de arquitecturas de modelos de conducción autónoma”, concluyó Waymo.