AMD prezentuje akceleratory Instinct MI350 i zapowiada platformę Helios

11 miesięcy temu 177

ZIZOO.PL

Instinct MI350X i MI355X — pierwsze takie akceleratory AMD

Nowa rodzina akceleratorów Instinct, które już zaczęły trafiać do klientów AMD, składa się z dwóch modeli — MI350X i MI355X — różniących się jedynie tym, że MI355X ma wyższy limit energetyczny (TBP wynosi 1400 zamiast 1000 W) i w związku z tym jest przeznaczony do systemów chłodzonych cieczą. Dla AMD jest to bardzo ważna generacja akceleratorów, ponieważ jej GPU po raz pierwszy od samego początku było projektowane i optymalizowane pod kątem tylko i wyłącznie obliczeń AI — w przeciwieństwie do na przykład serii MI300, na której ostateczny kształt spory wpływ miały zamówienia na superkomputery, zwłaszcza El Capitan.

Foto: / AMD

W praktyce objawia się to tym, że przy zbliżonej liczbie CU (Compute Unit, czyli najmniejszy w pełni niezależny element GPU AMD, w pewnym sensie odpowiednik rdzenia CPU) MI350/355X oferuje zaledwie połowę wydajności swojego poprzednika w niektórych obliczeniach naukowych, ale dwukrotnie wyższą wydajność w operacjach na popularnych w zastosowaniach AI liczbach w formacie FP16 i FP8. Oprócz tego, w MI350 dodano obsługę FP4 i FP6. Jeśli weźmiemy model językowy wykorzystujący te mniej precyzyjne formaty danych i uwzględnimy zwiększone TGP MI355X, okazuje się, że choć GPU MI350 ma tylko 21 proc. więcej tranzystorów (185 kontra 153 mld) i mniej aktywnych CU niż MI300X, to może zaoferować dwu, trzy lub nawet ponad czterokrotnie wyższą wydajność.

N6/N5	N6/N3P
192 GB HBM3	288 GB HBM3E
8 x 38 CDNA3	8 x 32 (+4 dezaktywowane) CDNA4
750 W	1400 W
81,7 TFLOPs	78,6 TFLOPs
163,4 TFLOPs	78,6 TFLOPs
163,4 TFLOPs	157,3 TFLOPs
1,3 PFLOPs	2,5 PFLOPs
2,6 PFLOPs	5 PFLOPs
N/A	10 PFLOPs
N/A	10 PFLOPs

AMD kontra Nvidia, Instinct MI355X kontra Blackwell

Jednak wszystkich o wiele bardziej interesuje to, jak MI350/355X wypada na tle konkurencji od Nvidii. Skrótowo widać to w poniższej tabeli i... gdyby to był egzamin, to można by było odnieść wrażenie, że AMD czasem przepisywało od Nvidii ;)

186 GB HBM3	288 GB HBM3E	288 GB HBM3E
1200 W	1400 W	1400 W
40 TFLOPs	1,3 TFLOPs	78,6 TFLOPs
80 TFLOPs	80 TFLOPs	157,3 TFLOPs
2,5 PFLOPs	2,5 PFLOPs	2,5 PFLOPs
5 PFLOPs	5 PFLOPs	5 PFLOPs
5 PFLOPs	10 PFLOPs	10 PFLOPs
10 PFLOPs	15 PFLOPs	10 PFLOPs

MI350 jest trochę mieszanką B300 i B200, bo maksymalna teoretyczna wydajność jest z grubsza zbliżona do B200/GB200, natomiast ilość i przepustowość pamięci ma jak w B300/GB300. Unikalną przewagą AMD nad Nvidią jest wydajność w obliczeniach FP6, które dzięki dodatkowej logice są wykonywane z szybkością obliczeń FP4, a nie FP8.

Oczywiście w tabelce tej widać jedynie teoretyczną moc obliczeniową, która wcale nie musi się przekładać na praktykę, ale trzeba przyznać, że na papierze wygląda to ciekawie. Efektywność energetyczna, która w środowisku ze sztywnymi limitami zasilania mocno przekłada się na ostateczną wydajność, również zapowiada się dobrze: AMD między innymi przeprojektowało architekturę SoC, przez co w MI350 są dwa chiplety I/O zamiast czterech, a łączące wszystko w jedną całość Infinity Fabric jest teraz szersze, ale wolniej taktowane, przez co zasilane mniejszym napięciem i bardziej energooszczędne. Poza tym cztery chiplety obliczeniowe MI350 są produkowane w procesie klasy 3 nm, a konkurencja od Nvidii to nadal 4 nm. Jeśli więc cena będzie odpowiednia, jakość oprogramowania AMD będzie się dalej poprawiać w takim tempie, w jakim robi to od kilku miesięcy (a wszystko wskazuje na to, że będzie), to AMD ma szansę na powalczenie o mniej wymagających klientów.

Lisa Su z GPU Instinct MI350X

Lisa Su z GPU Instinct MI350XŻródło: Komputer Świat / Mieszko Krzykowski

AMD nadal z dziurą w portfolio...

No właśnie — mniej wymagających. Problemem AMD pozostaje to, że nadal nie ma konkurencji dla systemów Nvidii pokroju GB200 NVL72, a obecnie to właśnie głównie na nich zarabiają pieniądze "zieloni", a nie na klasycznej platformie HGX, z którą będzie konkurować AMD za pomocą MI350X i MI355X. Przedstawiciel AMD, który wypowiadał się na ten temat w czasie omawiania architektury nowych systemów złożonych z MI350, zapewniał, że brak konkurencji dla systemów NVL72/NVL144 to świadomy wybór wynikający z chęci uniknięcia dodatkowych problemów w momencie, gdy jeszcze większość obecnych modeli można spokojnie obsłużyć za pomocą "klasycznych" systemów. Jednak raczej jest to zasłona dymna, bo nawet gdyby AMD chciało stworzyć konkurencję dla szafowych konfiguracji Nvidii, to na razie nie miałoby jak, bo dopiero pod koniec marca zakończyło przejmowanie ZT Systems, a specyfikacja UALink (czyli odpowiednika tej części NVLink służącej do łączenia ze sobą szuflad szafy serwerowej w jedno "GPU") została opublikowana na początku kwietnia. Ta dziura w portfolio AMD ma jednak zostać załatana już w przyszłym roku.

...którą w przyszłym roku ma załatać Helios

Foto: / AMD

Bo w przyszłym roku AMD ma pokazać światu systemy Helios, w których 72 GPU MI400 będą połączone ze sobą za pomocą UALink i będą konkurencją dla platformy Oberon Nvidii zbudowanej z układów Vera Rubin. Jeśli te wszystkie klocki na czas poskładają się w sensowną całość, AMD w końcu wejdzie do tej samej ligi co Nvidia i będzie miało szansę zdobyć trochę większy udział w rynku AI. Nvidia nadal będzie miała przewagę w postaci bardzo efektywnego NVLinka, własnej infrastruktury sieciowej z obsługą fotoniki krzemowej i lepszej gęstości obliczeniowej (zauważcie, że Helios ma szerokość dwóch klasycznych szaf serwerowych), ale w końcu będzie można mówić o tej samej lidze. Większy problem polega na tym, że nie wszystkie klocki z tej układanki są w rękach AMD, natomiast Jensen Huang układa swoją tak, jak mu się podoba, kiedy mu się podoba i w każdej chwili może zmienić zasady gry.

Przeczytaj źródło