Microsoft presentó el nuevo modelo de IA que emplea para las descripciones automáticas de imágenes. Para su desarrollo, el equipo responsable ha utilizado un conjunto de imágenes emparejadas con etiquetas, cada una de ellas asignada a un objeto específico de la imagen.
La diferencia en este modelo es que no han empleado descripciones completas, sino etiquetas, ya que estas últimas son "más eficientes" y permiten "introducir muchos datos al modelo", explican en el blog oficial.
De esta forma pudo "preentrenar" al modelo con vocabulario visual, es decir, para que identifique palabras individuales con las imágenes correspondientes. Posteriormente, lo han ajustado para las descripciones sobre un conjunto de descripciones de imágenes, con lo que aprende a redactar una frase.
Este enfoque de aprendizaje permite que el modelo, cuando está ante una imagen con nuevos objetos, "aproveche el vocabulario visual para generar una descripción precisa". La compañía asegura que ante imágenes sin descripciones, la IA es capaz de generar descripciones más precisas que las que fueron escritas por personas.
Este nuevo modelo es, además, el doble de preciso que el que la compañía ha estado utilizando desde 2015 en sus productos y servicios.
"El uso de subtítulos de imágenes para generar una descripción de la foto, conocido como texto alternativo, en una página web o documento es especialmente importante para las personas ciegas o con escasa visión", ha señalado el responsable de ingeniería de software del grupo de Plataformas de Inteligencia Artificial de Microsoft, Saqib Shaikh.
Desde Microsoft aceleraron la implantación del nuevo modelo en Azure, donde está disponible en Cognitive Services, y también en Seeing AI, la app que facilita el reconocimiento y descripción del entorno a personas ciegas. A finales de año también llegará a Word y Outlook, para Windows y Mac, y PowerPoint para Windows, Mac y web.
Con información de Europa Press
Acerca de los comentarios
Hemos reformulado nuestra manera de mostrar comentarios, agregando tecnología de forma de que cada lector pueda decidir qué comentarios se le mostrarán en base a la valoración que tengan estos por parte de la comunidad. AMPLIAREsto es para poder mejorar el intercambio entre los usuarios y que sea un lugar que respete las normas de convivencia.
A su vez, habilitamos la casilla [email protected], para que los lectores puedan reportar comentarios que consideren fuera de lugar y que rompan las normas de convivencia.
Si querés leerlo hacé clic aquí[+]