Comment l’Alimentation des Cartes Accélératrices d’IA Affecte-t-elle leur Efficacité et Durabilité ?

pelectrique
26 Min Lecture

Les exigences de puissance strictes des cartes d’accélérateur AI impactent la performance du système. Cet article examine les exigences du réseau de distribution de puissance des cartes d’accélérateur AI, dissèque l’impact des transitoires et présente une solution de livraison d’énergie multiphase pour répondre à ces besoins.

Cet article est publié par pÉlectrique dans le cadre d’un partenariat exclusif de contenu numérique avec Bodo’s Power Systems.

 

L’IA nécessite une grande puissance de calcul, surtout lorsqu’elle apprend et fait des inférences. Cela continue de pousser les limites des réseaux de distribution d’énergie à de nouveaux niveaux. Ces charges de travail à haute densité sont devenues plus sophistiquées, avec des demandes transitoires plus élevées poussant chaque partie du réseau de distribution de puissance à fonctionner à sa capacité maximale. Les exigences de puissance strictes des cartes d’accélérateur AI affectent la performance du système. L’IA révolutionne les architectures de calcul pour reproduire des réseaux neuronaux qui imitent le cerveau humain. Il semble que l’IA soit déjà partout, mais en réalité, la technologie qui la propulse est encore en développement. Les circuits intégrés d’accélérateur de processeurs spécialisés pour les calculs AI incluent les GPU, les circuits logiques programmables sur le terrain (FPGA), les TPU et d’autres types d’ASIC. Cet article se référera collectivement à tous ces dispositifs sous le terme XPUs.

Les centres de données continueront à acheter des cartes d’accélérateur AI en gros à mesure que le déploiement technologique augmente. Selon Gartner, les revenus des puces AI ont dépassé 34 milliards de dollars en 2021 et devraient atteindre 86 milliards de dollars d’ici 2026. Les XPUs offrent un bond considérable en performance AI par rapport à un CPU ordinaire grâce à des implémentations de calcul massivement parallèles. En raison de leur grand nombre de cœurs de petite taille, les XPUs sont bien adaptés aux charges de travail AI, facilitant à la fois l’entraînement des réseaux neuronaux et l’inférence AI. Cependant, ils nécessitent généralement une consommation de puissance relativement élevée pour les calculs AI et les mouvements de données. En résumé, les XPUs sont des circuits intégrés gourmands en énergie. Leurs exigences de puissance strictes imposent de nouvelles demandes sur les cartes d’accélérateur AI qui affectent désormais la performance du système. Dans cet article, nous passerons en revue les exigences du réseau de distribution de puissance de la carte d’accélérateur AI et présenterons une solution de livraison d’énergie multiphase d’ADI qui répond à ces exigences strictes.

 

Le défi de la livraison d’énergie imposé par l’IA

L’IA est bien des choses, mais économique en énergie n’en fait pas partie. Lorsque l’IA fonctionne, en particulier lors du traitement de charges de travail AI telles que l’apprentissage profond et l’inférence, elle nécessite une puissance de calcul extrême. Au niveau du système, les accélérateurs AI jouent un rôle critique pour fournir les résultats quasi instantanés qui leur donnent de la valeur. Tous les XPUs ont plusieurs cœurs haut de gamme construits à partir de milliards de transistors et consomment de nombreux centaines d’ampères. Les tensions de cœur (VCORE) de ces XPUs ont été ramenées à des niveaux inférieurs à 1,0 V. La figure 1 montre un diagramme de bloc générique d’une carte d’accélérateur AI. L’article se concentrera sur le contrôleur multiphase et les circuits intégrés de puissance associés proposés pour un tel système.

 

Figure 1. Un diagramme de bloc d’une carte d’accélérateur AI générique. Image utilisée avec l’aimable autorisation de Bodo’s Power Systems []

 

Les densités de courant de pointe rencontrées sur les cartes d’accélérateur AI sont devenues extrêmement élevées pour tout circuit imprimé à gérer. La nature hautement dynamique des charges de travail et les transitoires de courant extrêmement élevés entraînent des di/dt très élevés et des transitoires de tension en spike durant plusieurs microsecondes, ce qui est très perturbateur et peut potentiellement endommager l’XPU. Avec une charge de travail AI moyenne durant aussi longtemps, les condensateurs de découplage ne peuvent pas fournir l’énergie nécessaire pour répondre à la demande instantanée tout le temps. La section suivante de l’article présentera une proposition de solution multiphasée ADI pour le point de charge (PoL) qui éliminera les transitoires typiques des accélérateurs AI qui créent un stress à travers le réseau de distribution de puissance. Mais d’abord, discutons des défis de conception de puissance introduits par l’IA.

 

Les défis de conception de puissance introduits par l’IA

Les exigences d’alimentation de l’IA dépassent actuellement de loin les capacités des réseaux de livraison d’énergie traditionnels. Les exigences pour les régulateurs de tension XPU (VR) sont très différentes de celles des régulateurs PoL standards. L’industrie observe des livraisons supérieures à 1000 A à

 

Gestion des pics de tension et des transitoires

Une des exigences clés d’une carte d’accélérateur AI est d’avoir le VR conçu pour offrir une gestion supérieure des transitoires de tension. Fournir des kilowatts de puissance à un système est toujours un défi de premier ordre. La tension de sortie, y compris les tolérances, les ondulations et les pics et creux transitoires de charge, doit rester au-dessus de la tension minimale de l’XPU pour éviter un blocage du système et en dessous de la tension maximale de l’XPU pour éviter les dommages à l’XPU. Les pics de puissance transitoires de ces cartes peuvent demander 2× et plus que la cible de puissance thermique maximum.

Ce qui est important ici, c’est que la bande passante de la boucle PoL soit suffisamment large pour faire face aux types de transitoires plus rapides qui se présentent. Plus la bande passante est élevée, plus la boucle réagit rapidement, avec moins de déviation de tension. L’une des méthodes les plus simples pour obtenir des rails de puissance transitoires rapides est de sélectionner des régulateurs avec une performance transitoire rapide. La famille de circuits intégrés ADI AI VCORE présente un bruit de sortie à basse fréquence exceptionnellement faible, une réponse transitoire rapide et une grande efficacité. En ajoutant son support de ligne de charge à cela, les chipsets d’alimentation AI font un excellent travail d’aide aux concepteurs d’alimentation pour gérer leurs transitoires et pics induits par la charge de travail AI.

 

Perte I2R sur les longues traces de puissance et gestion thermique

Alors que le courant du processeur AI XPU continue d’augmenter, la densité de la solution de distribution d’énergie vers le PoL est devenue un élément critique. Il devient extrêmement difficile de livrer de l’énergie de manière fiable à chaque partie de l’XPU sans se soucier de la chaleur dissipée pouvant affecter la fiabilité de la puce et provoquer un emballement thermique. En d’autres termes, la gestion thermique est l’un des défis les plus importants dans la conception de cette alimentation haute puissance. Les méthodes traditionnelles de livraison d’énergie placent le régulateur de tension sur le côté de l’XPU de manière à ce que l’énergie soit délivrée latéralement au processeur. Même la plus petite résistance dans ces traces peut entraîner des chutes de tension (I2R) inacceptables. Une chute de tension à travers la résistance du plan de puissance PCB augmente proportionnellement avec le courant de l’XPU. Cela représente quelques centimètres de traces de puissance PCB entre le VR et les broches BGA, et c’est là qu’une quantité significative de pertes se produit. De telles pertes dans les plans de cuivre de puissance PCB sont devenues les facteurs les plus dominants dans le calcul de l’efficacité et de la performance de la conception du régulateur. L’utilisation d’un circuit intégré de puissance stage monolithique, avec les blocs de circuits de courant et de température intégrés, peut considérablement réduire le nombre de traces à fort courant nécessaires sur le PCB pour mettre en œuvre une solution de livraison de puissance traditionnelle à 3 puces (discrètes).

 

La proposition de valeur d’ADI

La précision des régulateurs de tension AI est devenue encore plus strictes. L’efficacité et la taille sont des priorités élevées. La performance et les pertes de puissance sont également sous une grande surveillance. Comme il a été présenté dans la section précédente, résoudre les problèmes de conception des VR des cartes d’accélérateur AI est devenu une tâche ardue. Les concepteurs comprennent trop bien que générer de grands sauts dans le courant demandé ne peut être satisfait sans traiter les effets transitoires indésirables. S’attaquer à ces effets transitoires nécessite également un positionnement de voltage dynamique ou un schéma de ligne de charge à haute précision. ADI est fortement investi sur le marché de l’IA et dispose d’un portefeuille complet de solutions pour les systèmes de 48 V et 12 V. Cette section de l’article propose les chipsets de puissance multiphases ADI AI, le contrôleur multiphasé MAX16602 et le niveau de puissance MAX20790, ainsi que notre technologie de bobine couplée (CL) brevetée, pour aider à relever ces défis de conception PoL AI. La figure 2 montre le MAX16602, le MAX20790, et la connexion du diagramme de bloc de haut niveau pour un design MAX16602CL8_EV à 8 phases. Ce design relativement propre atteint une capacité de livraison de courant élevée d’environ 88 APK par phase. La compensation interne et l’algorithme de contrôle avancé, ainsi que les circuits de détection du courant intégrés dans le niveau de puissance et la bobine couplée, en font une solution de petite taille avec une efficacité de classe mondiale.

 

Figure 2. Un design VR à 8 phases avec des chipsets de puissance à haute intégration d’ADI facilite un design à haute densité avec moins de connexions externes. Image utilisée avec l’aimable autorisation de Bodo’s Power Systems []

 

Circuit intégré de puissance stage monolithique intelligent avec plus d’intégration

Le MAX20790 est un circuit intégré de puissance stage intelligent riche en fonctionnalités conçu pour travailler avec le MAX16602 (et quelques autres contrôleurs ADI dans le portefeuille) pour implémenter un régulateur de tension multiphasé à haute densité. C’est une intégration monolithique qui élimine presque la résistance et l’inductance parasitaires entre les FETs et le pilote présents dans les conceptions discrètes, permettant des vitesses de commutation élevées avec des pertes de puissance considérablement inférieures aux implémentations traditionnelles. Si un défaut du nœud de commutation (VX) est détecté, le stage de puissance s’éteint immédiatement et communique l’ID de défaut au contrôleur. Ce circuit intégré de puissance stage intelligent comprend également un capteur de courant sur puce. Ce bloc de circuit de détection de courant est bien supérieur aux méthodes utilisant la résistance DC d’une inductance. La détection DCR est connue pour être inexacte et nécessite une compensation thermique pour que la mesure de courant soit digne de confiance.

 

Contrôleur IC

Le MAX16602 est un contrôleur multiphasé pour les VRs VCORE XPU. Le circuit intégré fournit une solution flexible et évolutive à haute densité pour alimenter les XPUs AI. L’appareil prend en charge la modulation de largeur d’impulsion (PWM) parallèle pour contrôler jusqu’à 16 phases. L’architecture du circuit intégré simplifie la conception, réduit le nombre de composants, permet une gestion de puissance avancée et une télémétrie, et augmente les économies d’énergie sur toute la plage de charge. Une dissipation de phase autonome est mise en œuvre pour maintenir une efficacité élevée sur l’ensemble de la plage de charge. Le chipset complet est un convertisseur buck multiphasé hautement efficace avec de nombreuses caractéristiques de mesure de statut et de paramètres. Les paramètres de protection et d’arrêt sont fixés et surveillés via l’interface PMBus série, y compris même les défauts collectés dans les circuits intégrés de puissance.

 

Schéma de modulation avancée

Le MAX16602 inclut un schéma de modulation avancé (AMS) pour améliorer la réponse transitoire. Le schéma de modulation permet de mettre sous tension et de couper les phases avec un délai minimal. En fonction de la demande de charge, plusieurs phases peuvent s’activer simultanément lorsque la charge augmente ou s’éteindre immédiatement lorsque la charge diminue. Avec AMS activé, la bande passante de la boucle fermée du système peut être étendue sans pénalité de marge de phase. Cela permet au PoL d’avoir une meilleure chance de répondre au type de demande de courant instantanée et dynamique rencontrée avec les VR AI.

 

Contrôle de ligne de charge

La ligne de charge permet à VCORE de passer entre son minimum et son maximum en fonction du courant de sortie. Elle fixe essentiellement VCORE haut pour les charges légères et bas pour les charges lourdes. La raison principale est de permettre à la boucle de contrôle de gérer un courant de charge supérieur (et cela est nécessaire pour que tout fonctionne bien). Le contrôleur ADI fournit un contrôle de ligne de charge de sortie précis sur toute l’étendue des courants de sortie. Le positionnement de la tension de sortie est effectué en utilisant les signaux de détection de courant sans perte provenant du circuit intégré de puissance, qui sont renvoyés au contrôleur. La ligne de charge est fixée dans le contrôleur par programmation numérique du gain DC de l’amplificateur d’erreur de la boucle de contrôle de tension. Une large gamme de profils de ligne de charge DC est présentée dans le tableau EC du contrôleur et dans le tableau 6 de la fiche technique, allant de 0,105 mΩ à 0,979 mΩ. La figure 5 montre le graphique transitoire d’une conception PoL à 16 phases pour un pas de charge de 40 A à 360 A à un taux de variation de 800 A/µs. Le résultat montre un dépassement minimal.

Dans l’ensemble, les produits de conversion multiphasés ADI et PoL offrent une efficacité élevée et une haute densité de puissance. La figure 3 montre le graphique d’efficacité avec les pertes par polarisation et inductance de notre carte d’évaluation à 16 phases MAX16602 + MAX20790 + CLH1110-4. ADI propose des régulateurs de tension et d’autres solutions de conversion de puissance pour diverses applications d’accélérateurs AI. Nos solutions de contrôleur multiphasé et de stage de puissance intégré permettent aux clients d’ADI de répondre aux exigences dynamiques les plus strictes en matière de puissance XPU et aux défis de conception présents dans les applications AI d’aujourd’hui.

 

Figure 3. Graphique transitoire d’un VR à 16 phases pour un pas de charge de 40 A à 360 A à un taux de 800 A/µs. Image utilisée avec l’aimable autorisation de Bodo’s Power Systems []

 

Ajouter un positionnement de tension actif à la conception réduit les exigences sur la réponse transitoire de charge et utilise mieux la fenêtre de tolérance totale de l’XPU. Le contrôle de ligne de charge aide à réduire la déviation de tension de sortie crête à crête pour un pas de charge donné tout en permettant de réduire la quantité de capacité de masse sur le rail de sortie. La fluctuation totale de tension est réduite, diminuant le risque de plantage ou de dommages à l’XPU. Notez que le bloc de circuit de ligne de charge peut être désactivé dans le MAX16602.

 

Avantages de la bobine couplée

ADI a investi dans sa technologie CL brevetée depuis plus d’une décennie. La technologie permet une densité plus élevée, une plus grande bande passante, des solutions transitoires plus rapides, et par rapport à une implémentation discrète, offre 50 % d’efficacité en plus et une magnétique 1,82 fois plus petite. CL fonctionne efficacement comme une grande inductance en état stable et comme une petite inductance dans un transitoire, permettant des économies en COUT et une taille d’inductance plus petite. La figure 4 montre une série d’inducteurs couplés couramment utilisés dans les conceptions VR multiphases d’ADI.

En fonction des spécifications de conception et des priorités, l’avantage de l’annulation du ripple de courant des inducteurs couplés peut être échangé pour soit une taille plus petite, soit une efficacité plus élevée. Le bénéfice majeur pour le système et le différenciateur d’ADI est que les concepteurs de PoL AI peuvent utiliser CL pour les aider à atteindre relativement facilement une solution VR de petite empreinte totale. Plusieurs fournisseurs de magnétique bien connus et populaires ont une licence CL gratuite d’ADI et peuvent fournir plusieurs sources pour les pièces nécessaires.

 

Packages refroidis par le dessus

Le refroidissement par le dessus fournit une alternative pour la dissipation de chaleur des packages montés en surface. À la fois le MAX16602 et le MAX20790 sont des packages flip-chip quad flat no-lead (FCQFN) avec des pads thermiques exposés sur le dessus. Le FCQFN est un packaging avancé avec des performances thermiques de classe mondiale que les concepteurs apprécieront. Ce package sans broche réduit non seulement les inductances parasitaires mais permet également la dissipation de chaleur directement de la jonction du dispositif vers l’environnement ambiant. Le MAX20790 a une résistance thermique jonction-à-boîtier dessus (θJC-TOP) de 0,25°C/W. Tirer parti de la configuration de refroidissement par le dessus avec les conceptions de puissance AI peut améliorer les performances thermiques du système et la flexibilité de conception.

 

Figure 4. Une série d’inducteurs couplés couramment utilisés avec les conceptions VR multiphases d’ADI. Image utilisée avec l’aimable autorisation de Bodo’s Power Systems []

 

Alimentation verticale

L’industrie a connu une augmentation dramatique de la puissance consommée avec l’avènement des XPUs traitant des fonctions AI complexes. Les régulateurs de tension capables de fournir jusqu’à 650 A de courant continu et plus de 1000 A de courant de pointe sont devenus courants. Les défis d’alimentation des processeurs AI résident dans le maintien de l’efficacité. Les architectures de puissance conventionnelles ne pourront pas suivre ces XPUs AI gourmands en énergie. Les fabricants de puces VR et les architectes recherchent fondamentalement différentes approches pour la livraison d’énergie. Une nouvelle tendance dans l’alimentation des XPUs AI est l’alimentation verticale, également connue sous le nom de livraison de puissance par le dessous.

 

Figure 5. Graphique d’efficacité d’une conception de carte d’évaluation VR AI à 16 phases. Image utilisée avec l’aimable autorisation de Bodo’s Power Systems []

 

Les régulateurs de tension doivent être placés aussi près que possible des broches d’alimentation d’entrée de l’XPU pour des livraisons de courant élevé. Nous ne pouvons pas y parvenir avec des méthodes traditionnelles de livraison d’énergie latérale. La livraison de puissance verticale déplace et relocalise le régulateur de puissance directement sous le processeur lui-même, éliminant toutes les pertes que l’on aurait sur le PCB. La structure consiste à placer le convertisseur de puissance, les stades de puissance, les condensateurs et les composants magnétiques sur l’arrière du PCB et à délivrer la puissance verticalement par des vias vers l’XPU. En d’autres termes, la livraison de courant se produit verticalement depuis le bas de la matrice BGA de l’XPU. C’est un chemin vertical de longueur réduite qui réduit considérablement l’impédance et élimine les pertes. La figure 6 montre l’architecture du module de puissance vertical monté sous l’XPU de l’autre côté du PCB. Ceci est à des fins d’illustration uniquement. ADI dispose d’un large portefeuille de solutions AI x PU VCORE pour résoudre ces problèmes dès aujourd’hui. Nos solutions d’alimentation permettent une efficacité de premier ordre dans le plus petit format. La combinaison proposée du contrôleur multiphasé MAX16602 et du niveau de puissance monolithique intelligent MAX20790 offre la plus haute efficacité de conversion de puissance, la réponse transitoire la plus rapide, et le rapport de télémétrie le plus précis de l’industrie.

 

Figure 6. Une architecture de module de puissance verticale (à des fins d’illustration uniquement). Image utilisée avec l’aimable autorisation de Bodo’s Power Systems []

 

Sur le dessous de l’XPU, de l’autre côté du PCB, se trouve également l’emplacement idéal pour les condensateurs de découplage haute fréquence nécessaires pour le stockage d’énergie afin de répondre aux demandes d’énergie instantanées. La livraison de puissance verticale associée à la technologie CL d’ADI atteint une densité de courant, une densité de puissance et une performance transitoire plus élevées. La puissance verticale offre aux fabricants de PoL comme ADI de nouvelles opportunités d’innover et de continuer, à leur manière, à soutenir l’avancement de la loi de Moore.

 

L’IA vers l’avenir

Avec l’apprentissage automatique et l’apprentissage profond, les cartes d’accélérateur ont fait passer l’IA de la théorie au grand public en permettant la puissance de traitement parallèle requise pour accélérer à la fois les charges de travail d’entraînement et d’inférence. Concevoir un VR PoL pour une carte d’accélérateur AI haute performance est une tâche complexe, d’autant plus que les exigences en matière de puissance continuent d’augmenter en termes de niveaux de courant et de précision de tension requises par les XPUs avancés actuels. Les exigences pour le VR de l’XPU sont très différentes de celles des régulateurs PoL standards. Les rails de l’XPU présentent des changements de charge extrêmement rapides, nécessitent un positionnement de tension dynamique ou une ligne de charge, et doivent être compacts.

 

Cet article est paru à l’origine dans Bodo’s Power Systems [] magazine.

Partager cet Article
Laisser un commentaire

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *