AWS anuncia nuevos componentes para centros de datos y apoyar la innovación en IA al tiempo que mejora la eficiencia energética
Un nuevo conjunto de componentes flexibles para centros de datos respaldará la próxima generación de innovación en IA generativa, ofreciendo un 12% más de capacidad de cómputo y mejorando la disponibilidad y la eficiencia
Durante el evento AWS re:Invent, Amazon Web Services, Inc. (AWS), una empresa de Amazon.com, Inc, anunció nuevos componentes para centros de datos diseñados para respaldar la próxima generación de innovación en inteligencia artificial (IA) y las necesidades cambiantes de los clientes. Estas capacidades combinan innovaciones en energía, refrigeración y diseño de hardware para crear centros de datos más eficientes energéticamente que impulsarán la innovación de los clientes. Las nuevas capacidades se implementarán a nivel mundial en los nuevos centros de datos de AWS, y muchos de los componentes ya están desplegados en sus centros de datos actuales.
“AWS continúa innovando incansablemente su infraestructura para construir la nube más eficiente, resiliente, segura y sostenible para clientes de todo el mundo”, dijo Prasad Kalyanaraman, vicepresidente de Servicios de Infraestructura en AWS. “Estas capacidades para centros de datos representan un importante avance, con mayor eficiencia energética y soporte flexible para las nuevas cargas de trabajo. Pero lo que resulta aún más emocionante es que están diseñadas para ser modulares, lo que nos permite adaptar nuestra infraestructura actual con refrigeración líquida y eficiencia energética, alimentando aplicaciones de IA generativa y reduciendo nuestra huella de carbono”.
AWS ha estado construyendo centros de datos a gran escala durante 18 años y servidores basados en GPU para cargas de trabajo de IA durante 13 años. Actualmente, los centros de datos de AWS respaldan a millones de clientes activos en todo el mundo, incluyendo cientos de miles que utilizan servicios de IA y machine learning de AWS, y decenas de miles de clientes globales que emplean Amazon Bedrock para desarrollar sus aplicaciones de IA generativa. A medida que el uso de IA generativa sigue creciendo y las demandas de capacidad de procesamiento aumentan, los centros de datos de AWS están adaptándose para admitir densidades de energía cada vez mayores. Las principales mejorías incluyen:
1. Diseño eléctrico y mecánico simplificado para alta disponibilidad
AWS sigue centrando sus esfuerzos en ofrecer a los clientes la infraestructura más confiable. Los diseños eléctricos y mecánicos simplificados son más fiables y fáciles de mantener, garantizando que los clientes disfruten de los beneficios de alta confiabilidad que AWS ha ofrecido desde el principio.
Las últimas mejoras en el diseño de los centros de datos de AWS incluyen distribución eléctrica y sistemas mecánicos simplificados, lo que permite una disponibilidad de la infraestructura del 99,9999%. Estos sistemas simplificados también reducen en un 89% la cantidad potencial de racks que podrían verse afectados por problemas eléctricos.
En un centro de datos, la electricidad pasa por múltiples sistemas de conversión y distribución antes de llegar al equipamiento de TI. Cada paso introduce naturalmente ineficiencia, pérdida de energía y puntos potenciales de falla. Como ejemplo de un nuevo diseño, AWS simplificó la distribución eléctrica y, al hacerlo, redujo en un 20% los posibles puntos de falla. Otros ejemplos de simplificación incluyen acercar la energía de respaldo al rack y reducir la cantidad de ventiladores utilizados para expulsar el aire caliente. AWS está utilizando la diferencia de presión natural para expulsar el aire caliente, lo que mejora la cantidad de electricidad disponible para los servidores.
2. Innovaciones en refrigeración, diseño de racks y sistemas de control
AWS ha desarrollado una serie de nuevas capacidades mejoradas para ofrecer a sus clientes una infraestructura con el máximo rendimiento, alta disponibilidad y eficiencia energética. Las innovaciones más recientes en los centros de datos incluyen:
- Refrigeración líquida: Los servidores más recientes de IA se benefician de la refrigeración líquida para enfriar de manera más eficiente los chips de alta densidad. AWS ha desarrollado soluciones mecánicas innovadoras que permiten refrigeración líquida configurable directamente en el chip, tanto en sus centros de datos nuevos como en los actuales. Algunas tecnologías de AWS utilizan infraestructura de red y almacenamiento que no requieren refrigeración líquida. Por ello, los sistemas de refrigeración actualizados integrarán sin problemas capacidades de refrigeración por aire y por líquido para los chips de IA más avanzados, como AWS Trainium2, y soluciones de supercomputación de IA a nivel de rack, como NVIDIA GB200 NVL72, además de los switches de red y servidores de almacenamiento de AWS. Este diseño flexible y multimodal permite que AWS ofrezca el máximo rendimiento y eficiencia al menor costo, ya sea ejecutando cargas de trabajo tradicionales o modelos de IA. El diseño único de racks refrigerados por líquido fue desarrollado en colaboración con fabricantes líderes de chips para acelerar el tiempo de comercialización de las cargas de trabajo de IA.
- Soporte para cargas de trabajo de IA de alta densidad: AWS está maximizando el uso de la energía optimizando la disposición de los racks en un centro de datos. Esto se logró mediante un software impulsado por datos e IA generativa que predice la forma más eficiente de ubicar servidores. AWS ahora reducirá la cantidad de energía desaprovechada —energía disponible pero no utilizada o subutilizada— y hará un uso más eficiente de la energía disponible.
Este diseño admitirá la próxima generación de hardware y racks de alta densidad necesarios para cargas de trabajo de IA, pero es lo suficientemente flexible para adaptarse a una amplia gama de otros tipos de hardware. La infraestructura de AWS ofrece la plataforma de cómputo más amplia y profunda, con más de 750 instancias de Amazon Elastic Cloud Compute (Amazon EC2), lo que brinda a los clientes opciones de procesador, almacenamiento, red, sistema operativo y modelo de compra para cualquier carga de trabajo. Además del diseño flexible de refrigeración multimodal, AWS ha desarrollado innovaciones de ingeniería en sus sistemas de distribución de energía, lo que permitirá a AWS aumentar la densidad de potencia en racks seis veces durante los próximos dos años, y otras tres veces en el futuro. Esto se logra, en parte, mediante un nuevo estante de energía que distribuye eficientemente la energía del centro de datos en los racks, reduciendo las pérdidas por conversión eléctrica.
En conjunto, estas innovaciones permiten a AWS ofrecer un 12% más de capacidad de cómputo por sitio para las cargas de trabajo de los clientes. Estos cambios reducirán la cantidad total de centros de datos necesarios para proporcionar la misma capacidad de cómputo.
- Sistemas de control actualizados: La implementación de un sistema de control propio de Amazon en los dispositivos eléctricos y mecánicos de AWS permite estandarizar la supervisión, las alarmas y las secuencias operativas. Por ejemplo, las herramientas internas de telemetría de AWS utilizan tecnologías de la empresa para ofrecer diagnósticos en tiempo real y servicios de resolución de problemas, lo que permite mantener condiciones óptimas de operación en beneficio de los clientes. Además, AWS ha incrementado la redundancia en sus sistemas de control, al mismo tiempo que reduce la complejidad.
3. Mayor eficiencia energética y sostenibilidad, incluyendo una reducción del 46% en el consumo de energía mecánica y una reducción del 35% en el carbono incorporado en el concreto utilizado
Durante muchos años, AWS ha sido pionera en la mejora de la eficiencia energética y la sostenibilidad en su infraestructura. Las investigaciones estiman que la infraestructura de AWS es actualmente hasta 4.1 veces más eficiente que la infraestructura local, y cuando las cargas de trabajo se optimizan en AWS, la huella de carbono asociada puede reducirse hasta en el 99%.
AWS evalúa continuamente cómo operan sus centros de datos y determina formas de permitir que su infraestructura utilice la energía de manera más eficiente mediante la innovación constante. Los nuevos componentes incluyen las siguientes mejorías para la eficiencia energética y la sostenibilidad:
- Un sistema de refrigeración más eficiente que se espera que reduzca el consumo de energía mecánica en hasta un 46% en comparación con su diseño anterior durante las condiciones de refrigeración máxima, sin aumentar el uso de agua por megavatio. Los cambios de diseño incluyen un nuevo sistema de refrigeración unilateral, reducción de equipamiento de refrigeración e introducción de capacidades de refrigeración líquida.
- Reducción del carbono incorporado en el concreto de la estructura del centro de datos en hasta un 35%, en comparación con el promedio de la industria. AWS está adoptando especificaciones para acero y concreto de menor carbono, y optimizando el diseño estructural para usar menos acero en general.
- Los generadores de respaldo podrán funcionar con diésel renovable, un combustible biodegradable y no tóxico que puede reducir las emisiones de gases de efecto invernadero en hasta un 90% durante el ciclo de vida del combustible, en comparación con el diésel fósil. AWS ya ha comenzado a hacer la transición al diésel renovable para alimentar generadores de respaldo en centros de datos existentes en Europa y América.
«Los centros de datos deben evolucionar para satisfacer las demandas transformadoras de la IA», dijo Ian Buck, vicepresidente de Hyperscale y HPC en NVIDIA. «Al habilitar soluciones avanzadas de refrigeración líquida, la infraestructura de IA puede enfriarse de manera eficiente mientras se minimiza el uso de energía. Nuestro trabajo con AWS en su diseño de racks de refrigeración líquida permitirá a los clientes ejecutar cargas de trabajo de IA exigentes con un rendimiento y eficiencia excepcionales.»
«A medida que Anthropic desarrolla nuestros modelos de base líderes, el acceso a una infraestructura segura, de alto rendimiento y eficiente en energía es crucial para nuestro éxito», dijo James Bradbury, ingeniero distinguido de Cómputo en Anthropic. «El compromiso de AWS para construir centro de datos de vanguardia es una de las razones clave por las que los hemos elegido nuestro proveedor principal de nube y socio de capacitación. Sus mejoras en el diseño representan un paso importante hacia la provisión de infraestructura segura, escalable y eficiente para alimentar modelos de IA e impulsar la innovación en este campo.»
«Los avances continuos en la infraestructura de AWS nos permiten concentrarnos en innovar nuevos servicios que ayudan a nuestros clientes a tomar decisiones financieras más informadas, en lugar de en el pesado trabajo no diferenciado de gestionar centro de datos», dijo Alex Lintner, CEO de Tecnología, Soluciones de Software e Innovación en Experian. «La seguridad y el cumplimiento normativo son fundamentales para nosotros, y trabajar con AWS ayuda a fortalecer nuestra posición como un proveedor tecnológico confiable, apoyando a empresas en una variedad de industrias. Con sus instalaciones eficientes en energía y optimizadas para IA, podemos dedicar más recursos a la entrega rápida de nuevos productos impulsados por datos, en lugar de gestionar los centros de datos.»
«Nuestros clientes dependen de nosotros para ofrecer innovación confiable y altamente segura de IA generativa en un entorno privado y confiable», dijo Jeff Reihl, director de tecnología de LexisNexis Legal & Professional. «Nuestra asociación de larga data con AWS y su infraestructura líder nos permite ofrecer esto, y también cumplir con nuestro objetivo de aumentar nuestro impacto ambiental positivo mientras trabajamos para reducir nuestra huella ambiental.»
Los nuevos componentes de los centros de datos están diseñados para escalar a través de toda la infraestructura de AWS a nivel mundial, incluyendo sus 34 regiones, 108 zonas de disponibilidad y otras ofertas de infraestructura como Zonas locales de AWS. Se espera que la construcción de nuevos centros de datos de AWS con el conjunto completo de componentes comience a principios de 2025 en los Estados Unidos.
Para obtener más información, visite: https://www.youtube.com/watch?v=NUIrNGwUu14.