Inteligencia Artificial

Presentando Amazon Nova: una nueva generación de modelos fundacionales

Los nuevos modelos fundacionales de última generación de Amazon ofrecen inteligencia de vanguardia y un rendimiento de precios líder en la industria.

En AWS re:Invent, Amazon.com Inc presentó Amazon Nova, una nueva generación de modelos fundacionales (FM, su sigla en inglés) que cuentan con inteligencia de última generación con una amplia gama de tareas y una relación precio-rendimiento líder en la industria. Los modelos de Amazon Nova estarán disponibles en Amazon Bedrock e incluyen: Amazon Nova Micro (un modelo de texto a texto muy rápido); y Amazon Nova Lite, Amazon Nova Pro y Amazon Nova Premier (modelos multimodales que pueden procesar imágenes y videos para generar texto). Amazon también lanzó dos modelos adicionales: Amazon Nova Canvas (que genera imágenes con calidad de estudio) y Amazon Nova Reel (que genera videos con calidad de estudio).

“En Amazon, tenemos cerca de 1,000 aplicaciones de IA generativa en funcionamiento y hemos tenido una visión general de lo que los desarrolladores de aplicaciones aún están afrontando”, afirmó Rohit Prasad, vicepresidente sénior de Inteligencia Artificial General de Amazon. “Nuestros nuevos modelos Amazon Nova están pensados ​​para ayudar a los desarrolladores internos y externos a afrontar estos desafíos, y proporcionar una inteligencia y una generación de contenido convincentes, al tiempo que ofrecen un progreso significativo en latencia, rentabilidad, personalización, Generación Aumentada de Recuperación (RAG, su sigla en inglés) y capacidades de agente”.

Los modelos de comprensión de Amazon Nova demuestran inteligencia, capacidades y velocidad excepcionales

Amazon Nova incluye cuatro modelos de última generación. El primero, Amazon Nova Micro, es un modelo de solo texto que ofrece las respuestas con la latencia más baja a un costo muy pequeño. Los tres siguientes son: Amazon Nova Lite, un modelo multimodal de muy bajo costo que es increíblemente rápido para procesar entradas de imágenes, videos y texto; Amazon Nova Pro, un modelo multimodal de gran capacidad con la mejor combinación de precisión, velocidad y costo para una amplia gama de tareas; y Amazon Nova Premier, el modelo multimodal más capaz de Amazon para tareas de razonamiento complejas y para su uso como el mejor maestro para destilar modelos personalizados.

Presentando Amazon Nova: una nueva generación de modelos fundacionales
Amazon Nova Micro, Amazon Nova Lite y Amazon Nova Pro están disponibles; Amazon Nova Premier estará disponible en el primer trimestre de 2025.

Probamos los modelos Amazon Nova en comparación con una amplia gama de parámetros de referencia estándar de la industria. Amazon Nova Micro, Amazon Nova Lite y Amazon Nova Pro tienen un rendimiento bastante competitivo en comparación con los mejores modelos en sus respectivas categorías.

Se determinó que Amazon Nova Micro es igual o mejor que Meta LLaMa 3.1 8B en los 11 puntos de referencia aplicables y que Google Gemini 1.5 Flash-8B en los 12 puntos de referencia aplicables. Con la velocidad líder en la industria de Amazon Nova Micro de 210 tokens de salida por segundo, es ideal para aplicaciones que requieren respuestas rápidas.

Amazon Nova Lite también es altamente competitivo con otros modelos de la misma clase de inteligencia; tiene un rendimiento igual o mejor en 17 de 19 puntos de referencia en comparación con GPT-4o mini de OpenAI, igual o mejor en 17 de 21 puntos de referencia en comparación con Gemini 1.5 Flash-8B de Google, e igual o mejor en 10 de 12 puntos de referencia en comparación con Claude Haiku 3.5 de Anthropic. Además de ofrecer precisión en los puntos de referencia de texto, Amazon Nova Lite se destaca en la comprensión de videos, gráficos y documentos según lo medido por puntos de referencia como VATEX, ChartQA y DocVQA. Amazon Nova Lite también se destaca en flujos de trabajo de agentes, como la llamada de función medida por Berkeley Function Calling Leaderboard, y en las capacidades básicas de comprensión de elementos visuales para realizar acciones en navegadores y pantallas de computadora, según lo medido por VisualWebBench (punto de referencia para acciones en navegador web) y Mind2Web (punto de referencia de agentes multimodales generalistas).

Amazon Nova Pro tuvo un rendimiento igual o mejor en 17 de 20 puntos de referencia en comparación con GPT-4o de OpenAI, igual o mejor en 16 de 21 puntos de referencia en comparación con Gemini 1.5 Pro de Google, e igual o mejor en 9 de 20 puntos de referencia en comparación con Anthropic Claude Sonnet 3.5v2. Además de la precisión en los puntos de referencia de inteligencia visual y de texto, Amazon Nova Pro se destaca en el seguimiento de instrucciones y los flujos de trabajo de agentes multimodales, según las mediciones del Comprehensive RAG Benchmark (CRAG), el Berkeley Function Calling Leaderboard y Mind2Web.

Compatibilidad multilingüe y multimodal con contexto extenso

Amazon Nova Micro, Lite y Pro admiten más de 200 idiomas. Amazon Nova Micro admite una longitud de contexto de 128,000 tokens de entrada, mientras que Amazon Nova Lite y Amazon Nova Pro admiten una longitud de contexto de 300,000 tokens, o 30 minutos de procesamiento de video. A principios del 2025, Amazon admitirá una longitud de contexto de más de 2 millones de tokens de entrada.

Rápido y rentable

Todos los modelos de Amazon Nova son rápidos, rentables y se han diseñado para que resulten fáciles de usar con los sistemas y los datos de un cliente. Amazon Nova Micro, Amazon Nova Lite y Amazon Nova Pro son al menos un 75% más económicos que los modelos con mejor rendimiento en sus respectivas clases de inteligencia en Amazon Bedrock. También son los modelos más rápidos en sus respectivas clases de inteligencia en Amazon Bedrock.

Integración continua con Amazon Bedrock

Todos los modelos de Amazon Nova están integrados con Amazon Bedrock, un servicio totalmente administrado que hace que los FM de alto rendimiento de las principales empresas de IA y Amazon estén disponibles para su uso a través de una única API. Con Amazon Bedrock, los clientes pueden experimentar y evaluar fácilmente los modelos de Amazon Nova, así como otros FM, para determinar cuál es el mejor modelo para una aplicación.

Soporte para realizar ajustes finos a fines de aumentar la precisión

Los modelos también admiten ajustes finos personalizados, que permiten a los clientes indicarles ejemplos en sus propios datos propietarios que han sido etiquetados para aumentar la precisión. El modelo de Amazon Nova aprende lo que más le importa al cliente a partir de sus propios datos (incluidos texto, imágenes y videos) y, luego, Amazon Bedrock entrena un modelo privado que proporcionará respuestas personalizadas.

Destilación para entrenar modelos más pequeños y eficientes

Además de respaldar el ajuste fino, los modelos también admiten la destilación, que permite la transferencia de conocimiento específico desde un “modelo maestro” más grande y de gran capacidad a un modelo más pequeño y eficiente que es altamente preciso, pero también más rápido y económico de ejecutar.

RAG para fundamentar las respuestas en los datos

Los modelos de Amazon Nova están integrados con las bde Amazon Bedrock y se destacan en la , lo que permite que los clientes garanticen la mejor precisión al fundamentar las respuestas en los datos propios de la organización.

Optimizado para aplicaciones de agentes

Los modelos de Amazon Nova se han optimizado para que sean fáciles de usar y eficaces en aplicaciones de agentes que requieren interactuar con los sistemas y datos propietarios de una organización a través de múltiples API para ejecutar tareas de varios pasos.

Presentando Amazon Nova: una nueva generación de modelos fundacionales
Imagen creada con Amazon Nova.

Acceso a contenido visual de calidad de producción con los modelos de generación de contenido creativo de Nova

Amazon Nova Canvas es un modelo de generación de imágenes de última generación que crea imágenes de calidad profesional a partir de texto o imágenes proporcionadas en las prompts Amazon Nova Canvas también proporciona funciones que facilitan la edición de imágenes mediante entradas de texto y proporciona controles para ajustar el esquema de colores y el diseño. El modelo viene con controles integrados para respaldar el uso seguro y responsable de la IA, que incluyen funciones como la marca de agua, que permite rastrear siempre la fuente de una imagen, y la moderación de contenido, que limita la generación de contenido potencialmente dañino. Amazon Nova Canvas tiene un mejor rendimiento que los generadores de imágenes como OpenAI DALL-E 3 y Stable Diffusion en evaluaciones humanas en paralelo realizadas por un tercero y en métricas automatizadas clave.

Amazon Nova Reel es un modelo de generación de videos de última generación que permite a los clientes crear fácilmente videos de alta calidad a partir de texto e imágenes. Es ideal para la creación de contenido en publicidad, marketing o capacitación. Los clientes pueden usar prompts en lenguaje natural para controlar el estilo visual y el ritmo, incluido el movimiento de la cámara, la rotación y el zoom. Supera a los modelos comparables en calidad y consistencia, según evaluaciones humanas en paralelo realizadas por un tercero que prefirió los videos generados por Amazon Nova Reel sobre los generados por Gen-3 Alpha de Runway. Al igual que Amazon Nova Canvas, Amazon Nova Reel viene con controles integrados para respaldar la seguridad y el uso responsable de la IA, incluida la marca de agua y la moderación de contenido. Amazon Nova Reel genera actualmente videos de seis segundos y admitirá la generación de videos de hasta dos minutos de duración en los próximos meses.

Próximos pasos: modelos de voz a voz y multimodal a multimodal

Amazon presentará un modelo de voz a voz Amazon Nova en el primer trimestre de 2025. El modelo está diseñado para transformar las aplicaciones de IA conversacional al comprender la entrada de voz en lenguaje natural, interpretar señales verbales y no verbales (como el tono y la cadencia) y brindar interacciones naturales reciprocas, similares a las humanas, con baja latencia.

Amazon también está desarrollando un modelo novedoso que puede tomar texto, imágenes, audio y video como entrada y generar salidas en cualquiera de estas modalidades. Este modelo Amazon Nova con capacidades nativas de multimodal a multimodal (o de cualquier modalidad a cualquier modalidad) se presentará a mediados de 2025. Simplificará el desarrollo de aplicaciones en las que se puede utilizar el mismo modelo para realizar una amplia variedad de tareas, como traducir contenido de una modalidad a otra, editar contenido y potenciar agentes de IA que puedan comprender y generar todas las modalidades.

Los socios y clientes de AWS ya están aprovechando las capacidades y la relación precio-rendimiento de los modelos de Amazon Nova

SAP, un socio estratégico de AWS, está integrando los modelos de Amazon Nova en la familia de modelo de lenguaje de gran tamaño (LLM) compatibles de su hub de IA generativa SAP AI Core. Esto permite a los desarrolladores crear nuevas habilidades para Joule, el copiloto de inteligencia artificial de SAP, y desarrollar de forma segura soluciones impulsadas por inteligencia artificial que aprovechen todo el contexto empresarial capturado en los datos de SAP, lo que permite la automatización, la personalización y soluciones avanzadas como la planificación de la cadena de suministro.

Deloitte, socio estratégico de AWS, se compromete a ofrecer los mejores servicios de IA generativa a empresas globales de todos los sectores. Deloitte sabe que las soluciones de inteligencia artificial y los modelos básicos no son iguales para todos y cree que las capacidades avanzadas de personalización y la seguridad mejorada de los modelos de Amazon Nova impulsarán la innovación que ofrece un valor excepcional a sus clientes en todo el mundo.

Dentsu Digital Inc., una empresa de marketing digital, está integrando Amazon Nova Reel en su proceso creativo, lo que le permite a su equipo mejorar y acelerar el desarrollo de sus campañas, desde la presentación de informes hasta el desarrollo del concepto y la generación de contenido de video creativo. Amazon Nova Reel reduce el tiempo total que lleva generar nuevos activos de semanas a días.

Musixmatch es la plataforma de letras de canciones más grande del mundo, con más de 80 millones de usuarios y una base de datos de más de 11 millones de letras únicas. Musixmatch incluye Amazon Nova Reel en Musixmatch Pro, que ayuda a los creadores a distribuir letras en todos los principales servicios de streaming digital y redes sociales. Los artistas emergentes pueden usar Amazon Nova Reel para producir videos musicales de alta calidad utilizando el contexto de sus canciones como entrada y personalizarlos con prompts en lenguaje natural.

123RF, un portal de fotografías y videos de archivo con una biblioteca de más de 200 millones de imágenes y videos, utiliza Amazon Nova Canvas y Amazon Nova Reel para simplificar el proceso de diseño con herramientas más inteligentes, rápidas y fáciles de usar para los creadores que producen medios visuales. La relación precio-rendimiento líder de Amazon Nova, la velocidad, el razonamiento multilingüe y la moderación de contenido a escala ayudan a ofrecer estas nuevas capacidades a clientes y creadores de todo el mundo.

Caylent, una empresa de servicios en la nube de última generación, está utilizando los modelos de Amazon Nova para ofrecer capacidades de comprensión de video a clientes de los sectores de los medios de comunicación, los deportes y el comercio minorista. Anteriormente, Caylent combinaba diferentes técnicas y modelos para ofrecer comprensión de video a clientes de estos sectores. Ahora, Amazon Nova ofrece resultados líderes en la industria por una fracción del costo, al tiempo que reduce el tiempo que lleva pasar del prototipo a la producción y elimina complejidades como el mosaico de imágenes, el muestreo y el .

Palantir Technologies crea software que permite la toma de decisiones basada en IA en muchos de los contextos más críticos del mundo. Las capacidades de razonamiento avanzado de Amazon Nova Pro se integrarán con el Sistema Ontology dentro de la (AIP, su sigla en inglés) de Palantir para impulsar nuevas eficiencias operativas y flujos de trabajo de toma de decisiones en más de 40 industrias. Por ejemplo, esta integración potenciará a los agentes de seguros que procesan solicitudes de pólizas complejas y a los agentes de la cadena de suministro que organizan procesos de reasignación de extremo a extremo.

Shutterstock es una plataforma creativa líder que ofrece soluciones integrales, contenido de alta calidad y herramientas para marcas transformadoras, medios digitales y empresas de marketing. Basándose en la alta calidad de imagen de Amazon Nova Canvas, el equipo de Shutterstock está entusiasmado por incluir el modelo en el generador de imágenes con IA de Shutterstock, lo que ofrece a los usuarios una oferta intuitiva y fácil de usar.

Amazon está comprometida con el desarrollo responsable de la inteligencia artificial

Los modelos de Amazon Nova están diseñados con medidas de seguridad y protecciones integradas. La empresa ha lanzado las AI Service Cards de AWS para Amazon Nova, que ofrecen información transparente sobre casos de uso, limitaciones y prácticas de inteligencia artificial responsables.

Autor

[mdx-adserve-bstreet region="MED"]

Related Articles

Back to top button