Alibaba lanza Qwen, su nuevo modelo de inteligencia artificial que supera a DeepSeek y Llama
Según indican desde la firma, esta nueva IA se destaca en la comprensión avanzada de textos, tablas, diagramas, gráficos e imágenes.
Este miércoles, el gigante tecnológico Alibaba ha presentado su nuevo modelo de inteligencia artificial Qwen, llmado Qwen2.5-Max, que según la compañía supera «casi totalmente» al V3 de DeepSeek, un modelo que ha generado gran revuelo en el sector en los últimos días. Además, Alibaba asegura que su IA también aventaja a modelos como GPT-4o de OpenAI y Llama-3.1-405B de Meta, situándose a la par del Claude-3.5-Sonnet de Anthropic.
Según informó, a través de un comunicado, Alibaba Cloud, la división de computación en la nube del grupo, Qwen2.5-Max se destaca en la comprensión avanzada de textos, tablas, diagramas, gráficos e imágenes. Además, es capaz de analizar videos de más de una hora y responder preguntas con una precisión de segundos específicos dentro del contenido. Otra de sus fortalezas es la conversión de facturas, formularios y tablas en datos estructurados, una herramienta clave para la automatización de informes financieros y documentos legales.
China refuerza su apuesta por la IA: la guerra de la Inteligencia Artificial
Alibaba se sumó a la competencia en el sector de la inteligencia artificial en abril de 2023 con el lanzamiento de Tongyi Qianwen, su alternativa a ChatGPT. Este desarrollo la posicionó junto a otras tecnológicas chinas como Baidu, que ganó notoriedad con su modelo ERNIE Bot.
Uno de los nombres que irrumpió con fuerza recientemente es DeepSeek, una compañía hasta hace poco desconocida fuera de China, que captó la atención mundial con su modelo V3, desarrollado en solo dos meses y con un costo inferior a 6 millones de dólares. El 20 de enero lanzó su versión R1, la cual ha sido celebrada por los medios oficiales chinos debido a su bajo costo frente a las alternativas estadounidenses.
Sin embargo, el crecimiento de DeepSeek también generó controversia. Su aplicación, que se convirtió en la más descargada en la App Store de EE.UU., fue criticada por negarse a comentar sobre temas censurados en China, como la Masacre de Tiananmén de 1989 o la independencia de Taiwán. Esta situación no es nueva, ya que en 2023 Pekín reguló los modelos de IA para que respeten los «valores socialistas fundamentales«, prohibiendo la generación de contenidos que atenten contra la seguridad nacional, la unidad territorial y la estabilidad social.
¿Cómo probar Qwen?
Para acceder a Qwen, los usuarios pueden dirigirse a sus repositorios en Hugging Face o GitHub, donde Alibaba Cloud ha publicado tanto el modelo como sus instrucciones de implementación. Para esto es necesario tener conocimientos de Python, además de tener instalado un entorno como Google Colab o una máquina con una GPU, para así ejecutar el modelo con mayor eficiencia y velocidad.
Una alternativa más sencilla es usar ModelScope, la plataforma en la nube de Alibaba que permite ejecutar el modelo sin necesidad de configuración local. Solo es necesario crear una cuenta, seleccionar la versión deseada y comenzar a generar texto desde la interfaz web. Esta opción es ideal para quienes buscan experimentar con la IA sin experiencia en programación.
Qwen: un modelo con tecnología avanzada
Alibaba ha incorporado en Qwen2.5-Max una arquitectura basada en Mixture of Experts (MoE), un enfoque que mejora la eficiencia y escalabilidad de los modelos de lenguaje. En lugar de tener un sistema monolítico, la información se divide en varios «expertos» especializados en diferentes tipos de datos o tareas. Un enrutador determina cuál de estos expertos debe procesar cada entrada, optimizando el rendimiento.
Gracias a esta técnica, junto con el entrenamiento con más de 20.000 millones de tókens y el uso de metodologías como el Ajuste Fino Supervisado (SFT) y el Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF), Qwen2.5-Max se posiciona como uno de los modelos más avanzados del mercado. En pruebas de referencia como Arena-Hard, LiveBench, LiveCodeBench y GPQA-Diamond, Qwen2.5-Max superó a DeepSeek V3, además de ofrecer desempeños competitivos en evaluaciones como MMLU-Pro.
El futuro de la inteligencia artificial dependerá del uso y aplicaciones de estos modelos. Con el avance de Qwen2.5-Max, Alibaba refuerza su apuesta por la IA y busca consolidarse como un líder en el sector.
Leer más
DeepSeek R1: revolución en inteligencia artificial global
Fintech Americas anuncia los ganadores de los Premios Fintech 2025