GPU NVIDIA Ampere A100 250W TDP pe PCIe 4.0 creat pentru AI, știința datelor și supercomputere lansat cu o performanță promisă de 90% a modelului 400W

Hardware / GPU NVIDIA Ampere A100 250W TDP pe PCIe 4.0 creat pentru AI, știința datelor și supercomputere lansat cu o performanță promisă de 90% a modelului 400W 2 minute citite

Nvidia



NVIDIA a lansat oficial A100, un GPU compatibil PCIe 4.0 bazat pe arhitectura Ampere de ultimă generație. Deși are un profil TDP mai mic de 250 W, NVIDIA promite că GPU-ul PCIe 4.0 Ampere A100 va putea oferi până la 90 la sută din performanța întregii GPU A100 HGX de 400 W. A treia variantă a familiei sale în creștere de GPU Ampere A100, A100 PCIe este concepută pentru servere care rulează clusterele de inteligență artificială (AI), știința datelor și supercomputere.

NVIDIA a dezvăluit o variantă PCI-Express 4.0 a GPU-ului A100. GPU se bazează pe microarhitectura Ampere de 7 nm. În plus, compania a anunțat, de asemenea, mai multe sisteme alimentate cu A100 de la principalii producători de servere, inclusiv Asus, Dell, Cisco, Lenovo și multe altele. Acceleratorul GPU A100 PCIe 4.0 de 250 W este destul de similar cu varianta completă TDP de 400 W, iar NVIDIA promite, de asemenea, performanțe aproape identice, în ciuda scăderii semnificative a profilului TDP.



GPU NVIDIA A100 Ampere în PCIe 4.0 Factor de formă cu aceeași configurație de 400W A100 HGX GPU, dar la 250W:

NVIDIA și-a anunțat acceleratorul PCIe 4.0 A100 PCIe GPU. GPU-ul Ampere este disponibil pentru un set divers de cazuri de utilizare industrială, cu sisteme care variază de la o singură GPU PCIe A100 până la servere care utilizează două carduri în același timp, prin intermediul celor 12 canale NVLINK, care oferă un total de 600 GB / s de lățime de bandă de interconectare. Acceleratorul GPU PCIe TDP A100 de 250W nu se schimbă prea mult în ceea ce privește configurația de bază în comparație cu GPU-ul 400W A100 HGX.



GPU-ul GA100 are specificațiile variantei 400W A100 HGX cu 6912 nuclee CUDA dispuse în 108 unități SM, 432 nuclee tensoriale și 40 GB de memorie HBM2 care oferă aceeași lățime de bandă de memorie de 1,55 TB / s (rotunjită la 1,6 TB / s). Cu toate acestea, implementarea pachetului GPU pe Standard PCIe 4.0 avea propriul său dezavantaj de a reduce semnificativ TDP. Se presupune că aceasta înseamnă o penalizare de performanță de 10 până la 50% în funcție de volumul de muncă. Mai mult, varianta TDP de 250W a GPU-ului A100 este mai potrivită pentru rafale scurte decât pentru sarcini susținute.

GPU NVIDIA A100 Ampere în performanța factorului de formă PCIe 4.0:

Datorită reducerii semnificative a profilului TDP, s-ar putea presupune că cardul ar avea ceasuri mai mici pentru a compensa intrarea TDP mai mică. Cu toate acestea, valorile de performanță pe care NVIDIA le-a lansat sunt cu adevărat surprinzătoare, deoarece se apropie destul de mult de varianta TDP de 400W. Performanța FP64 este încă evaluată la 9,7 / 19,5 TFLOPs, performanța FP32 este evaluată la 19,5 / 156/312 TFLOPs (Sparsity), performanța FP16 este evaluată la 312/624 TFLOPs (Sparsity), iar INT8 este evaluată la 624/1248 TOPs ( Raritate).



Matematica simplă indică și NVIDIA asigură că GPU-ul pe bază de ampere PCIe 4.0 250W A100 poate furniza 90 la sută din performanța cardului A100 HGX (400W) în aplicațiile de top ale serverului. Acest lucru este justificat, deoarece este nevoie de mai puțin timp pentru ca noua variantă să îndeplinească sarcinile menționate mai sus. Cu toate acestea, numerele ar trebui să fie valabile numai pentru intervale scurte. În situații complexe, care necesitau capacități GPU susținute, GPU-ul PCIe 4.0 de 250W poate furniza oriunde de la până la 90% până la 50% performanța GPU-ului A100 HGX de 400W.

Microarhitectura Ampere va beneficia cu siguranță de noul A100. NVIDIA promite cel puțin o creștere a performanței de 20X față de predecesorul Volta. GPU-ul PCIe 4.0 A100 are tehnologie GPU multi-instanță. Aceasta înseamnă că un singur A100 poate fi partiționat în șapte GPU-uri separate pentru a gestiona diferite sarcini de calcul. În timp ce acest lucru stimulează segmentarea, există NVLink de generația a treia, care permite mai multor GPU-uri să fie unite într-un singur GPU gigant.

Etichete nvidia