“Tout le monde en haut et en bas de la ligne est allé après l’efficacité.”
—Brad McCredie, AMD
En mai au Conférence internationale de supercalcul 2022 à Hambourg, Frontier a révélé une efficiency globale de 1,1 exaflops, soit 1,1 quintillion d’opérations en virgule flottante par seconde, le lançant à la tête de la liste Prime500 des supercalculateurs les additionally puissants au monde. Il peut devenir encore furthermore puissant, avec une general performance maximale théorique de 2 exaflops.
De furthermore, Frontier est classé premier sur la dernière liste Green500, qui mesure l’efficacité énergétique des supercalculateurs. (Ce qui n’est peut-être pas accessoire à sa overall performance globale en tant que le as well as rapide du monde.) Alors que le précédent prime equipment Inexperienced500, MN-3 au Japonfourni 39,38 gigaflops par watt, le système de check et de développement Frontier atteint 62,68 gigaflops par watt.
De as well as, Frontier a remporté la première position dans une catégorie furthermore récente, l’informatique à précision mixte, qui évalue les performances dans les formats informatiques couramment utilisés pour l’intelligence artificielle. Sur la dernière Introspection haute efficiency Linpack-Accelerator ou HPL-AI test, les performances de Frontier ont atteint approximativement 6,86 exaflops.
Un component clé du succès de Frontier est la manière dont ses processeurs et GPU sont liés au sein de chaque nœud by way of AMD. Tissu infini architecture d’interconnexion. Cela permet de renforcer la cohérence entre le CPU et les GPU, c’est-à-dire de leur donner à tous la même vue des données partagées.
“La cohérence est très importante pour vous permettre d’augmenter les performances”, déclare Brad McCredie, vice-président du centre de données GPU et traitement accéléré chez AMD à Austin. « Cela vous aide à vous assurer que vous pouvez exécuter les bonnes charges de travail sur les bons processeurs. Cela permet aux processeurs d’effectuer très facilement de petits travaux et aux GPU d’effectuer de gros travaux en parallèle.
Au cours du développement de Frontier, AMD a noté que le additionally grand défi auquel il était confronté était les performances énergétiques. “Il y avait beaucoup de documentation sur le fait qu’il faudrait des centaines de milliers de GPU et 150 à 500 MW pour arriver à un exaflop, et nous voulions le faire avec des dizaines de milliers de GPU et 20 MW”, explique McCredie. “Donc, tout le monde en haut et en bas de la ligne est allé après l’efficacité.”
Par exemple, les GPU de Frontier ont chacun 128 gigaoctets de mémoire à bande passante élevéesoudé dessus. Cela les aide à surmonter un goulot d’étranglement critique pour les performances : le brassage des données entre la mémoire et le traitement.
De additionally, les GPU de Frontier utilisaient chacun le nœud avancé de 6 nanomètres de TSMC (Taiwan Semiconductor Production Co.). Par conséquent, “ils peuvent exécuter opérations en virgule flottante à double précision aussi vite que opérations à virgule flottante very simple précisionce qui était une grande innovation », déclare McCredie.
Le classement n ° 1 de Frontier sur la liste Eco-friendly500 n’est peut-être pas non plus un issue accessoire.
Ces développements apparemment sans conséquence ont en fait aidé Frontier à s’appuyer sur des dizaines de milliers de GPU plutôt que sur des centaines de milliers, “en déplaçant le fardeau du programmeur vers le matériel lorsqu’il s’agit de gérer tout ce parallélisme”, déclare McCredie. “Cela rend le système beaucoup as well as programmable.”
Deux nœuds AMD tiennent sur une « lame de calcul », et 64 de ces lames sont chargées dans chaque armoire. Les lames de calcul sont reliées entre elles par Interconnexions HPE Slingshot, chacun avec un commutateur à 64 ports conçu sur mesure qui fournit 12,8 térabits par seconde de bande passante réseau. Des groupes de lames sont reliés entre eux par un soi-disant topologie libellule dans lequel des centaines d’armoires avec des centaines de milliers de nœuds peuvent toutes communiquer avec seulement trois sauts au most entre tous les nœuds.
« Les déploiements Slingshot sont hautement optimisés pour utiliser le câblage le moreover économe en énergie (câbles en cuivre à connexion directe et câbles optiques actifs) adaptés aux distances requises », déclare Mike Woodacre, vice-président et directeur technique de l’équipe HPC et IA de HPE. L’élimination des composants à use général moins efficaces, ajoute-t-il, “réduit considérablement la consommation d’énergie du tissu”.
Les lames dans les armoires sont refroidies à l’aide refroidissement liquide. Selon Gerald Kleyn, vice-président des systèmes HPC et IA chez HPE, le supercalculateur peut atteindre jusqu’à cinq fois la densité d’une architecture traditionnelle refroidie par air. Le résultat est un système compact qui, à son tour, réduit considérablement les besoins en câblage et les dépenses d’exploitation.
“Briser la barrière de l’exaflop était significant, mais le faire tout en atteignant le n ° 1 sur la liste Eco-friendly500 est remarquable”, déclare Kleyn. De furthermore, accomplir cela au milieu d’une pandémie et de problèmes de chaîne d’approvisionnement mondiale, dit-il, “a nécessité un work d’équipe herculéen entre le laboratoire nationwide d’Oak Ridge, HPE et AMD”.
Malgré les défis, notamment les problèmes de chaîne d’approvisionnement liés à la pandémie, la livraison du système de supercalculateur Frontier a eu lieu entre septembre et novembre 2021. Carlos Jones/ORNL/Département américain de l’énergie
Les prochaines étapes pour Frontier incluent la poursuite des exams et la validation du système. Le laboratoire indique qu’il reste sur la bonne voie pour l’acceptation finale et l’accès précoce à la science as well as tard en 2022 et qu’il est prévu d’ouvrir pour la science complète au début de 2023.
Les projets déjà prévus pour Frontier incluent la recherche sur le most cancers, la découverte de médicaments, la fusion nucléaire, les matériaux exotiques, les moteurs super efficaces et les explosions stellaires. Le but de la device est d’accélérer le temps nécessaire à un tel travail de semaines en heures et d’heures en secondes.
“Frontier permet aux scientifiques de faire as well as de science, ce qui signifie se rapprocher d’une énergie as well as propre et as well as efficace, trouver moreover rapidement des vaccins encore in addition efficaces contre les virus”, a déclaré McCredie. “Nous avons commencé toute cette aventure avec Frontier pour être le premier à un exaflop, mais en voyant les gens d’Oak Ridge travailler pour résoudre les problèmes climatiques, énergétiques, la pandémie, les principaux défis auxquels l’humanité est confrontée, nous sommes passés de vouloir construire un puissant ordinateur pour construire quelque selected qui aidera tout le monde.
À partir des articles or blog posts de votre website
Content articles connexes sur le World-wide-web