NVIDIA Hopper Mimarisi ve H100 GPU Tanıtıldı

0 0
Read Time:4 Minute, 0 Second

NVIDIA, GPU Teknoloji Konferansı’nda (GTC) Hopper mimarisinin ve yeni kuşak H100 GPU’sunun detaylarını açıkladı. Şirketin bir müddettir yeni jenerasyon GPU’lar üzerinde çalıştığını biliyoruz, lakin artık elimizde birtakım somut özellikler var. Hopper mimarisi ve H100 GPU, geleceğin GeForce kartlarını güçlendirecek tüketici odaklı Ada Lovelace mimarisi ile büsbütün farklı.

Yeşil takım şimdi ‘Ada’ mimarisi hakkında rastgele bir detay açıklamadı. Hopper H100 ise Volta V100’ün yerine geçen Ampere A100’ün yerini alacak ve bunların hepsi bilgi merkezlerinde kullanılıyor. NVIDIA, AMD’nin Instinct MI250/250X ve yeni duyurulan Instinct MI210 üzere hızlandırıcılarıyla rekabet edecek ve HPC’de liderliğini sağlamlaştırmak istiyor.

H100, AI (yapay zeka) yeteneklerine odaklanan harika bilgisayarlar için tasarlanırken mevcut A100’e nazaran kıymetli yükseltmeler ve güncellemeler getiriyor. Yongada 80 milyar transistör bir ortaya geliyor ve özel bir TSMC 4N üretim teknolojisi kullanılarak inşa edildi. Bunun TSMC’nin sunduğu genel N4 4nm süreciyle karşılaştırılmaması gerekiyor ve NVIDIA için özel bir üretim teknolojisi. Bir not olarak, geçmiş kuşak A100’de 54 milyar transistör yer alıyordu ve artış hakikaten kıymetli düzeyde.

NVIDIA çekirdek sayılarını yahut saatlerini açıklamadı lakin diğer detaylar verdi. H100, şirketin 128 GB/s’ye kadar bant genişliği sunabilen dördüncü kuşak NVLink arabirimini destekliyor. Ayrıyeten NVLink kullanmayan sistemler için PCIe 5.0 takviyesi sunuluyor ve bu da 128 GB/sn sürat demek. Güncellenmiş NVLink ilişkisi, A100’den 1,5 kat daha fazla bant genişliği sağlarken, PCIe 5.0 ise PCIe 4.0’ın iki katı bant genişliği sunuyor. Genel olarak konuşursak, H100 evvelki modele kıyasla %50 daha fazla belleğe ve arayüz bant genişliğine sahip.

Elbette bellekler kıymetli, lakin Hooper’ın öteki kıymetli artıları da var. Yeni NVIDIA H100, 2.000 TFLOPS’a kadar FP16 süreç, 1.000 TFLOPS’a kadar TF32 süreç ve ayrıyeten 60 TFLOPS genel hedefli FP64 süreç gücü sağlayabiliyor. Yani her üç durumda da A100’e kıyasla üç katlık bir performans artışı kelam konusu. Hopper öte yandan A100’den (yerel FP8 takviyesi olmadığı için FP16’ya güvenmek zorunda kalan) altı kat daha süratli olan 4.000 TFLOPS’a kadar hesaplama ile gelişmiş FP8 takviyesi getiriyor. Performansı optimize etmek isteyen NVIDIA, iş yüküne bağlı olarak FP8 ve FP16 formatları ortasında otomatik olarak geçiş yapacak yeni bir transformatör motoruna sahip.

Yeşil takım, dinamik programlamayı hızlandırmak için tasarlanmış yeni DPX talimatları da ekleyecek. Bunlar rota optimizasyonu ve genomik dahil olmak üzere çok çeşitli algoritmalarda yardımcı olabilir ve NVIDIA, bu algoritmalardaki performansın evvelki jenerasyon GPU’larından 7 kata kadar ve CPU tabanlı algoritmalardan 40 kata kadar daha süratli olduğunu argüman ediyor.

Tüm bu değişiklikler harika bilgi süreç ve yapay zeka bölümü için kıymetli. Lakin bu avantajlar birtakım dezavantajları da beraberinde getiriyor. Daha küçük bir üretim teknolojijisine karşın, SXM varyantı için H100 TDP, A100 SXM modülleri için 400W’a kıyasla 700W’a yükseltildi. Bu iş yüküne bağlı olarak %50 ile %500 ortasında değişen geliştirmeler için %75 daha fazla güç demek. Genel olarak performansın NVIDIA A100’den iki ila üç kat daha süratli olması bekleniyor lakin güç tüketimi bir oldukça artmış görünüyor.

Çip üreticisi, genel olarak H100’ün A100’den daha düzgün ölçeklendiğini ve yapay zeka eğitiminde 9 kata kadar daha fazla randıman sağlayabileceğini argüman ediyor. Ayrıyeten bir kıyaslama olarak Megatron 530B çıktısını kullanarak 16X ila 30X daha fazla performans sunuluyor. Son olarak, 3D FFT (fast Fourier transform) ve genom dizileme üzere HPC uygulamalarında H100’ün A100’den 7 kata kadar daha süratli olduğu vurgulanıyor.

A100’de olduğu üzere, Hopper tabanlı GPU’lar başlangıçta yeni bir DGX H100 rafa monte sunucu olarak sunulacak. Her DGX H100 sistemi, 640 GB HBM3 belleğe sahip 32 PFLOPS AI hesaplama ve 0,5 PFLOPS FP64 sunan sekiz H100 GPU içeriyor.

Şirket ayrıca Grace CPU’sunu ve Hopper GPU’sunu tek bir modül üzerinde birleştiren, ikisi ortasında 900 GB/sn dengeli bir arayüze sahip “Grace Hopper Superchips” tahlilini sunacak. Hopper bu yılın üçüncü çeyreğinde gelecek olsa da, Grace Hopper Superchip 2023’ün 3. çeyreğine kadar piyasada olmayacak. Bunların gelecekteki DGX sunucularında kullanılıp kullanılmayacağı net değil.

Evvelki jenerasyon A100, NVIDIA’nın Ampere serisinin geri kalanı için kullanılan Samsung 8N teknolojisinin tersine TSMC 7N’yi (NVIDIA için özel N7) kullanıyordu. Söylentilere nazaran son tüketicilere ulaşacak olan Ada GPU’lar Hopper’dan biraz daha az gelişmiş bir üretim teknolojisini kullanacak. Beklentiler ise 4N’den çok da farklı olmayan TSMC N5 üretimi üzerinde ağırlaşıyor.

Hopper mimarisi ile yapılan devasa performans artışları, aslında GeForce ekran kartlarıyla sunulabilecek şeylerin bir habercisi. Teknoloji devi muhtemelen Ada GPU’ları için HBM3 kullanmayacak, fakat H100 ile A100’ün performansı ortasında potansiyel olarak iki ile üç kat fark olacağı söyleniyor. Yeni üretim teknolojileri ve mimari geliştirmelerle birlikte, GeForce RTX 4090‘ın RTX 3090’dan iki kat daha süratli olması mümkün. Daha evvel birkaç kere yeni jenerasyon GeForce RTX 40 serisi kartların 600W’a kadar TGP ile gelebileceğini gösteren söylentiler yayılmıştı. Yani Hopper’da olduğu üzere, Ada Lovelace kartlar da yüksek performansın yanı sıra yüksek güç tüketimiyle gelebilir.

Happy
Happy
0 %
Sad
Sad
0 %
Excited
Excited
0 %
Sleepy
Sleepy
0 %
Angry
Angry
0 %
Surprise
Surprise
0 %

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.

This site uses Akismet to reduce spam. Learn how your comment data is processed.