SystemOnline.cz
Giga Computing rozšiřuje své portfolio GPU serverů GIGABYTE v reakci na poptávku po generativní AI |
S příchodem ChatGPT od OpenAI a dalších chatbotů AI se nasazují velké clustery GPU s optimalizací na úrovni systému pro trénování velkých jazykových modelů (LLM, large language model). Tyto LLM mohou být zpracovávány novými servery GIGABYTE s optimalizovaným designem, které nabízejí vysokou úroveň přizpůsobení na základě požadovaných pracovních zátěží a potřeb uživatelů. Servery GIGABYTE řady G jsou postaveny především pro podporu výkonných výpočtů na GPU jednotkách využívající nejnovější technologie PCIe. Počínaje 2U servery mohou nové modely G293 podporovat až 8 dvouslotových GPU nebo 16 jednoslotových GPU v závislosti na modelu serveru. Pro maximální výkon CPU a GPU jsou tu servery G493 4U, které kromě podpory osmi GPU (Gen5 x16), nabízí i různé síťové možnosti a konfigurace pro úložiště. A nakonec nejvyšší výkon pro HPC a AI podporují řady G363 a G593 s grafickými procesory NVIDIA H100 Tensor Core. Všechny tyto nové 2U servery se dvěma paticemi pro CPU jsou určeny buď pro procesory AMD EPYC™ 4. generace, nebo pro procesory Intel® Xeon® Scalable 4. generace.
Řada G293 Servery se dvěma paticemi Intel Xeon (TDP až 225 W), které podporují buď osm dvouslotových GPU, nebo šestnáct jednoslotových GPU, a také osm 2,5" pozic pro úložiště.
Řada G363 Dvoupaticový server Intel Xeon se 4 GPU NVIDIA HGX H100 a šesti nízkoprofilovými sloty.
Řada G493 Servery Intel Xeon se dvěma paticemi, které podporují více rozšiřujících slotů a možností pro ukládání dat.
Řada G593 Server Intel Xeon se dvěma paticemi pro 8 grafických procesorů NVIDIA HGX H100.
Servery NVIDIA HGX H100 NVIDIA HGX H100 je aktuálně nejvýkonnější superpočítačová platforma pro umělou inteligenci na světě, která spojuje plný výkon grafických procesorů NVIDIA H100 a plně optimalizovaný software NVIDIA AI Enterprise a NVIDIA HPC a poskytuje nejvyšší výkon v oblasti simulací, analýzy dat a umělé inteligence. Softwarová vrstva platformy NVIDIA AI Enterprise urychluje datové vědecké procesy a zefektivňuje vývoj a nasazení produkčních AI včetně generativní AI, strojového vidění, hlasové AI a dalších. Obsahuje více než 50 frameworků, předtrénovaných modelů a vývojových nástrojů. HGX H100 je k dispozici jako serverový stavební blok v podobě integrovaných základních desek v konfiguracích se čtyřmi nebo osmi grafickými procesory H100. Čtyři grafické procesory H100 nabízejí propojení mezi GPU přes NVLink, zatímco konfigurace s osmi GPU nabízí plnou šířku pásma mezi GPU prostřednictvím technologie NVIDIA NVSwitch. S využitím výkonu procesorových jader Tensor poskytuje osmi-směrný server HGX H100 výpočetní výkon pro pokročilé učení až 32 petaFLOPS FP8. |