La technologie Intel Gaudi2 surpasse NVIDIA en matière d'inférence de modèle de langage

Auteur：Eve Cole Date de mise à jour：2025-01-21 14:32:01

La puce Gaudi2 d'Intel a fait preuve d'une forte compétitivité dans le domaine de l'IA, en particulier dans l'inférence de modèles de langage à grande échelle. Ses performances sont comparables à celles des accélérateurs haut de gamme de NVIDIA, et les surpassent même à certains égards. Non seulement Gaudi2 est égal, voire supérieur, au Nvidia H100 en termes de vitesse de décodage, mais il présente également un avantage en termes de rapport coût-performance, ce qui le rend plus attractif pour le déploiement dans le cloud. Cela marque une avancée significative pour Intel sur le marché des accélérateurs d’IA.

La technologie Gaudi2 d'Intel excelle dans l'inférence de modèles de langage à grande échelle, rivalisant avec les accélérateurs d'IA de Nvidia. Les performances de décodage de Gaudi2 sont comparables à celles du système NVIDIA H100 et même meilleures que celles du NVIDIA A100. Basé sur la tarification du cloud public, Gaudi2 est également plus rentable que les A100 et H100 de NVIDIA en termes de formation et d'inférence. Intel prévoit de lancer la technologie Gaudi3 en 2024, qui fournira une puissance de traitement et une bande passante réseau plus puissantes pour améliorer encore les performances.

Le développement continu des puces de la série Gaudi d'Intel indique que des solutions plus puissantes et plus rentables apparaîtront à l'avenir dans le domaine de l'IA, injectant une nouvelle vitalité dans le développement de la technologie de l'intelligence artificielle et offrant aux utilisateurs un plus large éventail de choix.