Alibaba lanza Qwen, su nuevo modelo de inteligencia artificial que supera a DeepSeek y Llama

Según indican desde la firma, esta nueva IA se destaca en la comprensión avanzada de textos, tablas, diagramas, gráficos e imágenes.

Maxi Fanelli enero 31, 2025

3 minutos de lectura

Este miércoles, el gigante tecnológico Alibaba ha presentado su nuevo modelo de inteligencia artificial Qwen, llmado Qwen2.5-Max, que según la compañía supera «casi totalmente» al V3 de DeepSeek, un modelo que ha generado gran revuelo en el sector en los últimos días. Además, Alibaba asegura que su IA también aventaja a modelos como GPT-4o de OpenAI y Llama-3.1-405B de Meta, situándose a la par del Claude-3.5-Sonnet de Anthropic.

Según informó, a través de un comunicado, Alibaba Cloud, la división de computación en la nube del grupo, Qwen2.5-Max se destaca en la comprensión avanzada de textos, tablas, diagramas, gráficos e imágenes. Además, es capaz de analizar videos de más de una hora y responder preguntas con una precisión de segundos específicos dentro del contenido. Otra de sus fortalezas es la conversión de facturas, formularios y tablas en datos estructurados, una herramienta clave para la automatización de informes financieros y documentos legales.

China refuerza su apuesta por la IA: la guerra de la Inteligencia Artificial

Alibaba se sumó a la competencia en el sector de la inteligencia artificial en abril de 2023 con el lanzamiento de Tongyi Qianwen, su alternativa a ChatGPT. Este desarrollo la posicionó junto a otras tecnológicas chinas como Baidu, que ganó notoriedad con su modelo ERNIE Bot.

Uno de los nombres que irrumpió con fuerza recientemente es DeepSeek, una compañía hasta hace poco desconocida fuera de China, que captó la atención mundial con su modelo V3, desarrollado en solo dos meses y con un costo inferior a 6 millones de dólares. El 20 de enero lanzó su versión R1, la cual ha sido celebrada por los medios oficiales chinos debido a su bajo costo frente a las alternativas estadounidenses.

Sin embargo, el crecimiento de DeepSeek también generó controversia. Su aplicación, que se convirtió en la más descargada en la App Store de EE.UU., fue criticada por negarse a comentar sobre temas censurados en China, como la Masacre de Tiananmén de 1989 o la independencia de Taiwán. Esta situación no es nueva, ya que en 2023 Pekín reguló los modelos de IA para que respeten los «valores socialistas fundamentales«, prohibiendo la generación de contenidos que atenten contra la seguridad nacional, la unidad territorial y la estabilidad social.

DeepSeek captó la atención mundial con su modelo V3 — DeepSeek, la nueva IA Gen que captó la atención mundial con su modelo V3

¿Cómo probar Qwen?

Para acceder a Qwen, los usuarios pueden dirigirse a sus repositorios en Hugging Face o GitHub, donde Alibaba Cloud ha publicado tanto el modelo como sus instrucciones de implementación. Para esto es necesario tener conocimientos de Python, además de tener instalado un entorno como Google Colab o una máquina con una GPU, para así ejecutar el modelo con mayor eficiencia y velocidad.

Una alternativa más sencilla es usar ModelScope, la plataforma en la nube de Alibaba que permite ejecutar el modelo sin necesidad de configuración local. Solo es necesario crear una cuenta, seleccionar la versión deseada y comenzar a generar texto desde la interfaz web. Esta opción es ideal para quienes buscan experimentar con la IA sin experiencia en programación.

Qwen: un modelo con tecnología avanzada

Alibaba ha incorporado en Qwen2.5-Max una arquitectura basada en Mixture of Experts (MoE), un enfoque que mejora la eficiencia y escalabilidad de los modelos de lenguaje. En lugar de tener un sistema monolítico, la información se divide en varios «expertos» especializados en diferentes tipos de datos o tareas. Un enrutador determina cuál de estos expertos debe procesar cada entrada, optimizando el rendimiento.

Gracias a esta técnica, junto con el entrenamiento con más de 20.000 millones de tókens y el uso de metodologías como el Ajuste Fino Supervisado (SFT) y el Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF), Qwen2.5-Max se posiciona como uno de los modelos más avanzados del mercado. En pruebas de referencia como Arena-Hard, LiveBench, LiveCodeBench y GPQA-Diamond, Qwen2.5-Max superó a DeepSeek V3, además de ofrecer desempeños competitivos en evaluaciones como MMLU-Pro.

El futuro de la inteligencia artificial dependerá del uso y aplicaciones de estos modelos. Con el avance de Qwen2.5-Max, Alibaba refuerza su apuesta por la IA y busca consolidarse como un líder en el sector.

Leer más

DeepSeek R1: revolución en inteligencia artificial global

Manuel Beaudroit, de belo: “Nuestro objetivo es que enviar dinero sea tan simple como mandar un mensaje”

Fintech Americas anuncia los ganadores de los Premios Fintech 2025

Autor

Maxi Fanelli

Periodista especializado en tecnologías y responsable de contenidos comerciales en ITSitio y en la Comunidad de Gaming. Editor de Overcluster. Anteriormente, trabajé en medios de IT; y como colaborador en Clarín, TN Tecno, Crónica TV y PC Users. Lic. Comunicación Social y Periodismo en la UNLP.
Ver todas las entradas