Giga Computing rozšiřuje své portfolio GPU serverů GIGABYTE v reakci na poptávku po generativní AI

Společnost Asbis představuje novinky v nabídce serverů firmy Giga Computing. Jedná se o dceřinou společnost firmy GIGABYTE a lídra v oboru vysoce výkonných serverů, serverových základních desek a pracovních stanic. Nově nabízí řadu výkonných GPU serverů s nejnovějšími procesory Intel, včetně serverů NVIDIA HGX H100 se 4 i 8 GPU moduly. S rostoucím zájmem o aplikace HPC (high performance computing) a umělé inteligence, konkrétně generativní umělé inteligence (GAI), se tato řada serverů spoléhá ve velké míře právě na výkon GPU, aby zvládla výpočetně náročné úlohy, které zpracovávají velké množství dat.

S příchodem ChatGPT od OpenAI a dalších chatbotů AI se nasazují velké clustery GPU s optimalizací na úrovni systému pro trénování velkých jazykových modelů (LLM, large language model). Tyto LLM mohou být zpracovávány novými servery GIGABYTE s optimalizovaným designem, které nabízejí vysokou úroveň přizpůsobení na základě požadovaných pracovních zátěží a potřeb uživatelů.

Servery GIGABYTE řady G jsou postaveny především pro podporu výkonných výpočtů na GPU jednotkách využívající nejnovější technologie PCIe. Počínaje 2U servery mohou nové modely G293 podporovat až 8 dvouslotových GPU nebo 16 jednoslotových GPU v závislosti na modelu serveru. Pro maximální výkon CPU a GPU jsou tu servery G493 4U, které kromě podpory osmi GPU (Gen5 x16), nabízí i různé síťové možnosti a konfigurace pro úložiště. A nakonec nejvyšší výkon pro HPC a AI podporují řady G363 a G593 s grafickými procesory NVIDIA H100 Tensor Core.

Všechny tyto nové 2U servery se dvěma paticemi pro CPU jsou určeny buď pro procesory AMD EPYC™ 4. generace, nebo pro procesory Intel® Xeon® Scalable 4. generace.

Řada G293

Servery se dvěma paticemi Intel Xeon (TDP až 225 W), které podporují buď osm dvouslotových GPU, nebo šestnáct jednoslotových GPU, a také osm 2,5" pozic pro úložiště.
Nové modely: G293-S42, G293-S43, G293-S45.

Řada G363

Dvoupaticový server Intel Xeon se 4 GPU NVIDIA HGX H100 a šesti nízkoprofilovými sloty.
Nový model: G363-SR0.

Řada G493

Servery Intel Xeon se dvěma paticemi, které podporují více rozšiřujících slotů a možností pro ukládání dat.
Nové modely: G493-SB0, G493-SB1, G493-SB2, G493-SB3

Řada G593

Server Intel Xeon se dvěma paticemi pro 8 grafických procesorů NVIDIA HGX H100.
Nový model: G593-SD0.

Servery NVIDIA HGX H100

NVIDIA HGX H100 je aktuálně nejvýkonnější superpočítačová platforma pro umělou inteligenci na světě, která spojuje plný výkon grafických procesorů NVIDIA H100 a plně optimalizovaný software NVIDIA AI Enterprise a NVIDIA HPC a poskytuje nejvyšší výkon v oblasti simulací, analýzy dat a umělé inteligence. Softwarová vrstva platformy NVIDIA AI Enterprise urychluje datové vědecké procesy a zefektivňuje vývoj a nasazení produkčních AI včetně generativní AI, strojového vidění, hlasové AI a dalších. Obsahuje více než 50 frameworků, předtrénovaných modelů a vývojových nástrojů.

HGX H100 je k dispozici jako serverový stavební blok v podobě integrovaných základních desek v konfiguracích se čtyřmi nebo osmi grafickými procesory H100. Čtyři grafické procesory H100 nabízejí propojení mezi GPU přes NVLink, zatímco konfigurace s osmi GPU nabízí plnou šířku pásma mezi GPU prostřednictvím technologie NVIDIA NVSwitch. S využitím výkonu procesorových jader Tensor poskytuje osmi-směrný server HGX H100 výpočetní výkon pro pokročilé učení až 32 petaFLOPS FP8.