Aspectos destacados de la presentación sobre infraestructura de la conferencia AWS re:Invent 2021 con Peter DeSantis

by Jason Pavao, Senior Solution Architect, Rackspace Technology

AWS re:Invent 2021 Keynote with Peter DeSantis

El miércoles 1.° de diciembre, Peter DeSantis, vicepresidente sénior de Cómputo de Utilidades y Aplicaciones en Amazon Web Services (AWS), entró en escena para su décima presentación en re:Invent, con un viaje en el tiempo. Hace quince años, AWS nació como S3 y, unos meses más tarde, le siguieron SQS y EC2. En ese momento, el cómputo en la nube no estaba en nuestro vocabulario general, pero como sabemos, las cosas cambian rápido.

“Es asombroso ver lo lejos que hemos llegado desde esos humildes comienzos”, dijo DeSantis mientras contaba cuando AWS en sus principios era una sola región, y las zonas de disponibilidad ni siquiera eran un concepto todavía. El único medio de almacenamiento subyacente para EC2 era efímero y solo había un tipo de instancia disponible.

Peter nos recuerda que los requisitos mínimos de todos los servicios de AWS siempre han sido: seguridad, disponibilidad, elasticidad, rendimiento, costo y sostenibilidad. Con esos puntos clave, Peter preparó el terreno para dar su pronóstico de presentación: AWS siempre será un líder en innovación.

 

AWS Nitro SSD

Si bien Nitro no representa un anuncio de producto nuevo, ocupó gran parte de la presentación de Peter: “Nitro es la razón por la que AWS comenzó a desarrollar silicio a nivel interno”. El controlador de Nitro hace posible que haya congruencia entre los múltiples almacenamientos, procesadores y proveedores de redes, lo que proporciona una experiencia fluida a los clientes de AWS. Con la incorporación de Nitro SSD, AWS ofrece EBS io2 Block Express, que proporciona 260,000 IOPS con latencia de submilisegundos constante.

 

AWS Graviton 3

AWS se enfoca en ofrecer mejoras de rendimiento en las cargas de trabajo de los clientes del mundo real. Aunque la mayoría de los fabricantes de chips buscan impresionar al incorporar estadísticas en pegatinas, como la frecuencia del procesador y la cantidad de núcleos, estas estadísticas no son el objetivo final y consumen mucha más energía. Más consumo de energía produce más calor, lo que se traduce en menos eficiencia.

Entonces, ¿cómo aumentó AWS de manera eficiente el rendimiento de un núcleo de Graviton? La respuesta: ¡al hacer que el núcleo sea más extenso! Un núcleo más extenso puede trabajar más por ciclo de procesamiento. Así que en lugar de aumentar el número de ciclos por segundo, se aumentó la cantidad de trabajo que puede hacer cada ciclo de cinco a ocho instrucciones por ciclo, lo que se denomina “paralelismo en la ejecución de instrucciones”. Otra forma en la que AWS mejoró el rendimiento del Graviton 3 fue al agregar un 50 % más de ancho de banda de memoria frente al anterior procesador Graviton 2.

Si bien se encuentra en versión preliminar y no está disponible para el público, el procesador Graviton 3 tiene un rendimiento general mejorado del 25 % para la mayoría de las cargas de trabajo.

 

Mejoras en el machine learning con los procesadores AWS Trainium e Inferentia

Lo primero que hay que tener en cuenta es que necesitará una infraestructura muy diferente para el entrenamiento y las inferencias. Lo segundo es que el machine learning tiene dos componentes distintos: entrenamiento e inferencia.

El entrenamiento es donde construye su modelo iterando a través de sus datos de entrenamiento. Piense en un modelo como una fórmula matemática con muchas variables. Todos los cálculos matemáticos se realizan en matrices enormes con números de punto flotante. El entrenamiento usa estadísticas para encontrar coeficientes óptimos para todas esas variables. Dichos coeficientes se denominan parámetros.

La inferencia es donde toma el modelo que entrena para hacer predicciones. La inferencia representa la parte mayoritaria de los costos porque siempre se realizan inferencias contra sus modelos de machine learning.

AWS Trainium e Inferentia son procesadores especialmente diseñados que ofrecen el mejor entrenamiento en machine learning y un rendimiento continuo de las inferencias.

 

Técnicas de entrenamiento distribuido

La forma sencilla de realizar el entrenamiento distribuido se denomina “paralelismo de datos”, y usa varios procesadores de entrenamiento. Cada procesador cuenta con una copia completa del modelo en la memoria. Los datos de entrenamiento se dividen, y cada procesador procesa un subconjunto de los datos de entrenamiento. De vez en cuando, los procesadores deben intercambiar información a medida que convergen hacia una solución común que evita los embotellamientos en la red.

 

AWS Climate Pledge

Desde el diseño de los centros de datos hasta el modelado y el seguimiento del rendimiento de las operaciones de AWS, los beneficios más significativos en cuanto a la eficiencia han sido en el diseño del silicio de AWS. Por ejemplo, Graviton es el procesador de uso general más eficiente de AWS que provee un 60 % más de eficiencia para la mayoría de las cargas de trabajo. Además, Inferentia es el procesador de inferencias de AWS más eficiente disponible hoy en el mercado. Lamentablemente, AWS no tuvo referencias reales en cuanto a la eficiencia del trabajo real para el procesador Trainium durante su presentación.

Amazon tomó el compromiso de convertirse en una empresa con cero emisiones netas de carbono antes del 2040 mediante inversiones sustanciales en tecnologías ecológicas, por lo que se adelantaría 10 años al Acuerdo de París. Además, Amazon siempre ha trabajado para mejorar la eficiencia y reducir la energía necesaria para prestar servicios a los clientes al centrarse en todos los aspectos de su infraestructura.

Tan solo una manera más en la que Amazon Web Services (AWS) marca el camino en la innovación. Rackspace Technology se enorgullece de ser un socio consultor preferente integral de la red de socios de AWS (APN) que cuenta con profunda experiencia en AWS y escalabilidad para asumir los proyectos más complejos de AWS.

Obtenga acceso al instante a un equipo de expertos de AWS altamente capacitados