Avances en IA: Alibaba presenta sus innovadores modelos para comprender texto e imágenes

Alibaba avanza en la competencia por el liderazgo en el ámbito de la Inteligencia Artificial (IA). El conglomerado Alibaba ha revelado el debut de su fresco modelo de IA, el cual, según detallan en el comunicado, tiene la capacidad de comprender tanto imágenes como textos de mayor complejidad.
La filial de Alibaba encargada de los proyectos relacionados con la IA es Alibaba Cloud. Hace unos meses, dieron a conocer su primer prototipo de IA, llamado Tongyi Qianwen, que puede transformar texto en imágenes. En esta ocasión, Alibaba ha dado un paso más allá con la presentación de dos novedosos modelos de IA. El primero de ellos, denominado Qwen-VL, tiene la capacidad de responder a preguntas abiertas vinculadas a imágenes con textos en chino e inglés, además de generar títulos para las imágenes. Por otro lado, el segundo, Qwen-VL-Chat, puede llevar a cabo tareas más complejas, tales como realizar cálculos matemáticos y construir narrativas basadas en múltiples imágenes, o incluso responder a múltiples rondas de preguntas.

Ambos nuevos modelos de Alibaba estarán disponibles en código abierto, lo que permitirá a investigadores, académicos y compañías de todo el mundo emplearlos para crear sus propias aplicaciones de IA sin necesidad de incurrir en grandes costos económicos y temporales para entrenar sus propios sistemas.
Hasta el momento, la mayoría de los sistemas generativos de IA se habían centrado en la interpretación de textos. Sin embargo, tanto OpenAI como Alibaba han sentado las bases de la próxima tendencia en este ámbito, en el cual la comprensión de contenidos multimedia comienza a cobrar mayor relevancia.
El gigante tecnológico tiene sus miras puestas en el desarrollo de nuevas modalidades de IA y, hasta el momento, no está implementando tarifas por su utilización. Esto beneficia a la empresa en su objetivo de llegar a un mayor número de usuarios y de continuar expandiéndose en preparación para su eventual salida a bolsa.
