LANL instala la supercomputadora más nueva, Crossroads
HogarHogar > Blog > LANL instala la supercomputadora más nueva, Crossroads

LANL instala la supercomputadora más nueva, Crossroads

Sep 20, 2023

31 de agosto de 2023

31 de agosto de 2023: en la primera semana de junio, una caravana de camiones con remolque trajo los componentes necesarios para comenzar la instalación de Crossroads, la supercomputadora más nueva del Laboratorio Nacional de Los Álamos, al Complejo de Computación Estratégica (SCC). Aproximadamente dos semanas después, cuando llegaron los últimos seis gabinetes de computación y las unidades de refrigeración por agua asociadas, todo el hardware necesario para el ensamblaje y la instalación del sistema estaba en su lugar.

Días después, un equipo in situ de Hewlett Packard Enterprise (HPE), el proveedor del sistema, completó la conexión de Crossroads a los sistemas de distribución de energía y refrigeración del laboratorio. Una vez completada la integración con esta infraestructura crítica, los cables de fibra óptica se conectaron a la red de computación de alto rendimiento (HPC) del Laboratorio.

"Crossroads es emblemático del futuro", afirmó Irene Qualters, directora asociada del Laboratorio de Simulación y Computación. “Con la introducción de un elemento clave de diseño de código, la memoria de gran ancho de banda, Crossroads ofrecerá un rendimiento de cuatro a ocho veces mejor que Trinity en nuestros códigos de simulación de existencias más desafiantes. Y esperamos mejoras adicionales en rendimiento y fidelidad en sistemas futuros”.

Unas sólidas capacidades de supercomputación son vitales para evaluar la salud del arsenal de armas nucleares del país. Los experimentos modernos generan conjuntos de datos muy grandes que deben compararse con predicciones de simulación para que los científicos e ingenieros tomen decisiones informadas sobre la misión de disuasión nuclear de la nación. Para analizar toda esta información, el laboratorio necesita modelos computacionales, plataformas y capacidades de visualización de clase mundial.

"Crossroads representa un avance significativo en la capacidad de la nación para evaluar la seguridad y confiabilidad de las reservas", dijo Charlie Nakhleh, director asociado del Laboratorio de Física de Armas, "así como la modernización del elemento de disuasión para hacer frente a un nuevo panorama de seguridad nacional".

Desde 2015, la supercomputadora Trinity ha brindado esa capacidad a usuarios de los tres laboratorios de la Administración Nacional de Seguridad Nuclear (NNSA) (Los Alamos, Sandia y Lawrence Livermore), y Crossroads es su sucesor.

Actualmente, los equipos de laboratorio y HPE están ejecutando diagnósticos iniciales para todo el sistema Crossroads, que se espera que esté disponible para los usuarios en tres laboratorios de la NNSA este otoño.

Acerca del sistema

Como parte de la estrategia informática para el Programa de Computación y Simulación Avanzada de la NNSA, se implementan sistemas de tecnología avanzada (ATS) para proporcionar capacidad de simulación de vanguardia en apoyo de la administración de arsenales de armas nucleares.

“Implementar una supercomputadora de clase mundial requiere la unión de una sinfonía de experiencia y un ejército diverso de profesionales capacitados”, dijo Jim Luján, Director del proyecto Crossroads del Laboratorio. "Desde planificadores visionarios e ingenieros de hardware hasta arquitectos de software y expertos en redes, es un testimonio del poder de la brillantez colaborativa para dar forma al futuro de las posibilidades computacionales".

Cada supercomputadora está representada por un número ATS secuencial asociado a ella. Finalmente, cada ATS se bautiza con un nombre único.

Primero, el Laboratorio Nacional de Los Álamos tenía Trinity (ATS-1). Sierra (ATS-2) estaba en el Laboratorio Nacional Lawrence Livermore. Crossroads (ATS-3) se encuentra ahora en Los Alamos.

"Crossroads es la plataforma ATS más nueva, por lo que ahora es la estrella del espectáculo", dijo Amanda.Bonnie, directora de proyectos de laboratorio de Crossroads.

Con el tiempo, El Capitán (ATS-4) estará en Lawrence Livermore y un próximo ATS-5, aún sin nombre, estará ubicado en Los Álamos.

Velocidad y eficiencia no son lo mismo

Debido a que las simulaciones asociadas con la administración de existencias son tan exigentes, la oficina del Programa de Computación y Simulación Avanzada requiere que las máquinas ATS no solo sean grandes y rápidas, sino, más importante aún, que tengan un tamaño de memoria y accesibilidad a la memoria adaptadas a sus necesidades específicas.

"Dado el alboroto en la prensa sobre la 'computadora más rápida del mundo', uno podría pensar que deberíamos comprar computadoras con la mayor cantidad de FLOPS", explicó Gary Grider, líder de la división de Computación de Alto Rendimiento del Laboratorio. “Cada clase de problema requiere un equilibrio diferente de FLOPS, tamaño de memoria y acceso a la memoria. Para los problemas en los que estamos trabajando, el tiempo que lleva obtener un resultado está determinado principalmente por el tamaño y el acceso a la memoria, no por los FLOPS”. (FLOPS es una unidad para medir la cantidad de operaciones de punto flotante que una computadora puede realizar en un segundo).

Esta filosofía significa que el laboratorio a menudo analiza algunas de las áreas de vanguardia del mercado de HPC: un nuevo tipo de red, un nuevo tipo de procesador o, en el caso de Crossroads, una nueva tecnología de memoria.

La memoria de gran ancho de banda lleva la memoria directamente al chip de procesamiento y permite una “conversación” más rápida entre la CPU y la memoria. Muchos códigos de laboratorio tienen un ancho de banda de memoria limitado, por lo que tiene sentido que esto sea algo que entusiasme a HPC.

Las primeras pruebas han indicado que se puede esperar que Crossroads proporcione una mejora de cuatro a ocho veces en la eficiencia general con respecto a Trinity.

"En informática, casi nunca sucede que puedas pasar a un nuevo sistema y ver enormes ganancias sin cambiar los códigos", dijo Grider. "Pero el cambio de Trinity a Crossroads logrará precisamente eso".

Rocinante, Razorback y Tycho: subsistemas de supercomputadoras

"Existe una especie de conjunto normal de sistemas asociados con estas adquisiciones más importantes de ATS", dijo Bonnie. "Está el sistema principal en sí, Crossroads en este caso, y luego sistemas de soporte más pequeños".

Para Crossroads, estos sistemas auxiliares son Rocinante, Razorback y Tycho, llamados así por las naves espaciales del libro de ciencia ficción y la serie de televisión "The Expanse".

Debido a que los desarrolladores de código hacen parte de su trabajo en un entorno no clasificado, una versión “mini-yo” de Crossroads con la misma arquitectura (solo que a una escala más pequeña) es un componente clave. Llamado Sistema de Regresión de Aplicaciones, permite a los usuarios desarrollar códigos y trabajar en un entorno abierto. Rocinante cumple ese propósito de apoyar a Crossroads.

Asimismo, existe un pequeño banco de pruebas solo para administradores de sistemas. Razorback, al que los usuarios habituales no pueden acceder, es una versión aún más pequeña del sistema que los administradores utilizan para preparar y probar actualizaciones, parches y otros cambios antes de aplicarlos a las máquinas más grandes.

Finalmente, está Tycho. Tycho se entregó a finales del año pasado con casi la misma arquitectura que Crossroads, con la diferencia de que los nodos informáticos presentaban más memoria convencional en lugar de la tecnología avanzada de memoria de gran ancho de banda. Esto proporciona ciclos para almacenar usuarios de simulación que de otro modo podrían haber estado esperando en Crossroads. En junio, HPC anunció que Tycho estaba disponible para los tres trilab a través del proceso de la Campaña de Computación de Tecnología Avanzada.

Luján se apresura a reconocer que darle vida a Crossroads y sus subsistemas ha sido el resultado de un amplio esfuerzo de grupo. "Literalmente docenas de empleados de laboratorio de cada uno de los seis grupos de HPC, así como personal de todos los trilabs de NNSA, han hecho importantes contribuciones a este proyecto", dijo.

ATS-5 en el horizonte

Los principales sistemas que diseña e implementa el laboratorio suelen tener un plazo de planificación de cuatro a seis años, con una vida útil operativa óptima de aproximadamente cinco años. Eso significa que, aunque Crossroads está actualmente en proceso de instalación, HPC ha estado haciendo planes para el eventual despliegue del sistema ATS-5, aún sin nombre, durante los últimos años.

LA-UR-23-29610

Para conocer en profundidad las máquinas soñadas del pasado, presente y futuro del laboratorio, consulte la edición de primavera de 2023 de la revista 1663.

Fuente: LANL

Acerca del sistema,Velocidad y eficiencia no son lo mismoRocinante, Razorback y Tycho: subsistemas de supercomputadorasATS-5 en el horizonte