IBM presenta Granite 3.0: modelos de IA de alto rendimiento diseñados para las empresas
Los nuevos modelos Granite 3.0 8B y 2B, publicados bajo la licencia permisiva Apache 2.0, ofrecen un sólido rendimiento en múltiples pruebas académicas y empresariales, siendo capaces de superar o igualar a modelos de tamaño similar.
IBM ha anunciado hoy, en el TechXchange de IBM, el lanzamiento de su familia de modelos de IA más avanzada hasta la fecha, Granite 3.0. La tercera generación de modelos de lenguaje Granite de IBM puede superar o igualar el rendimiento de modelos de tamaño similar de proveedores líderes en muchas pruebas de referencia académicas y del sector, demostrando un sólido rendimiento, transparencia y seguridad.
En línea con el compromiso de la compañía con la IA de código abierto, los modelos Granite se publican bajo la licencia permisiva Apache 2.0, lo que los hace únicos por la combinación de rendimiento, flexibilidad y autonomía para los clientes empresariales y la comunidad en general.
La familia Granite 3.0 de IBM incluye:
- Propósito general/Lenguaje: Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
- Barreras de protección y seguridad: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
- Mixture of Experts (MoE): Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base, Granite 3.0 1B A400M Base
Los nuevos modelos de lenguaje Granite 3.0 8B y 2B están diseñados como «caballos de batalla» para la IA empresarial, ofreciendo un gran rendimiento y rentabilidad en tareas como la regeneración aumentada de recuperación (RAG), clasificación, resumen, extracción de entidades y uso de herramientas.
El lanzamiento de Granite 3.0 reafirma el compromiso de IBM con la creación de transparencia, la seguridad y la confianza en los productos de IA. Como punto fundamental, IBM ofrece una indemnización de propiedad intelectual (IP) para todos los modelos Granite en watsonx.ai, lo que permite a los clientes empresariales tener mayor confianza al combinar sus datos con estos modelos.
Subiendo la barra: pruebas de Granite 3.0
En las tareas empresariales básicas de RAG, uso de herramientas y tareas en el ámbito de la ciberseguridad, el modelo Granite 3.0 8B Instruct muestra un rendimiento superior de media en comparación con los modelos de código abierto de tamaño similar de Mistral y Meta.
Los modelos Granite 3.0 se han estrenado con más de 12 billones de tokens de datos a partir de 12 lenguajes naturales y 116 lenguajes de programación diferentes, utilizando un novedoso método de entrenamiento en dos fases, que aprovecha los resultados de varios miles de experimentos diseñados para optimizar la calidad y la selección de datos y los parámetros de entrenamiento. Para finales de año, se espera que los modelos lingüísticos 8B y 2B también incluyan soporte para una ventana de contexto extendida de 128K y capacidades de comprensión multimodal de documentos.
Presentando Granite Guardian 3.0: la nueva era de la IA responsable
Como parte de este lanzamiento, IBM también ha presentado una nueva familia de modelos Granite Guardian que permiten a los desarrolladores de aplicaciones implementar barreras de seguridad mediante la comprobación de los avisos al usuario y las respuestas LLM para detectar una variedad de riesgos. Los modelos Granite 3.0 8B y 2B ofrecen el conjunto más completo de capacidades de detección de riesgos y daños disponibles actualmente en el mercado.
Además de las dimensiones de daño, como prejuicios sociales, odio, toxicidad, blasfemia, violencia, técnicas de jailbreak etc., estos modelos también proporcionan una serie de comprobaciones únicas específicas de RAG, como el fundamento, la relevancia del contexto y la relevancia de la respuesta.
Disponibilidad de los modelos Granite 3.0
Toda la suite de modelos Granite 3.0 y los modelos actualizados series temporales están disponibles para su descarga en Hugging Face bajo la licencia permisiva Apache 2.0. Las variantes instructivas de los nuevos modelos lingüísticos Granite 3.0 8B y 2B y los modelos Granite Guardian 3.0 estarán disponibles desde hoy para uso comercial en la plataforma watsonx de IBM. A su vez, estará disponible una selección de modelos Granite 3.0 como microservicios NVIDIA NIM y a través de las integraciones Vertex AI Model Garden de Google Cloud con Hugging Face.
De asistentes a agentes: haciendo realidad el futuro de la IA empresarial
IBM está impulsando la IA empresarial a través de una amplia gama de tecnologías, desde modelos y asistentes hasta las herramientas necesarias para ajustar y desplegar la IA específicamente para los datos y casos de uso únicos de las empresas. IBM también está allanando el camino para que los futuros agentes de IA puedan autodirigirse, reflexionar y realizar tareas complejas en entornos empresariales dinámicos.
Asimismo, IBM ha presentado hoy la próxima versión de watsonx Code Assistant, basada en los modelos de código Granite, para ofrecer asistencia de programación de uso general en lenguajes como C, C++, Go, Java y Python, con capacidades avanzadas de modernización de aplicaciones para Enterprise Java Applications. Ahora también se puede acceder a las funciones de código de Granite a través de una extensión de Visual Studio Code, IBM Granite.Code.
Ampliación de la plataforma con IA para impulsar a los consultores de IBM con IA
IBM también ha anunciado una importante expansión de su plataforma de prestación de servicios impulsada por IA, IBM Consulting Advantage. La plataforma multimodal cuenta con agentes de IA, aplicaciones y métodos como marcos replicables que pueden capacitar a 160.000 consultores de IBM para ofrecer un valor al cliente mejor y más rápido a un coste menor.
Otra parte clave de la expansión es la introducción de IBM Consulting Advantage for Cloud Transformation and Management e IBM Consulting Advantage for Business Operations. Cada una incluye agentes de IA específicos para varios campos, aplicaciones y métodos infusionados con las mejores prácticas de IBM, para que los consultores de IBM puedan acelerar las transformaciones de nube e IA de los clientes en tareas como la modernización de código y la ingeniería de calidad, o transformar y ejecutar operaciones a través de diversos dominios, como finanzas, recursos humanos y adquisiciones.