Tečno hlađeni AI serveri suočavaju se s uskim grlima
Sep 30, 2024
Ostavi poruku
Sa povećanjem isporuka Blackwell čipova, spremnost kupaca da usvoje tečno hlađenje će takođe rasti.
Insajderi iz industrije izvještavaju da opskrba univerzalnim uređajima za brzo isključivanje (UQD) za rješenja za hlađenje tekućinom postaje ograničena, što može postati glavno usko grlo za rast tečnog hlađenja AI servera.
Proizvođači ODM servera navode da će Nvidijini Blackwell AI čipovi, uključujući B100 i B200, početi da se isporučuju ove godine, dok GB200 rješenje neće ući u masovnu proizvodnju do kraja 2024. ili 2025. Većina kupaca B100 i B200 i dalje koristi dizajn zračnog hlađenja , ali ODM proizvođači izvještavaju o stalnom porastu prodora tečnog hlađenja, predviđajući da će spremnost kupaca da usvoje tečno hlađenje također porasti s povećanjem isporuka Blackwell čipova.

▲ AI serveri hlađeni tekućinom
I Proširivanje kapaciteta kako bi se zadovoljila rastuća potražnja za tečnim hlađenjem
Relevantne kompanije proširuju proizvodnju kako bi dočekale novu eru tečnog hlađenja. Proizvođač termalnih modula Amlogic planira da poveća mjesečni kapacitet proizvodnje ploča za hlađenje vode sa 30,000 na 300,000 jedinica.
Auras je osnovao novu fabriku na Tajlandu kako bi se pozabavio geopolitičkim problemima i zahtjevima kupaca. Očekuje se da će ova fabrika početi masovnu proizvodnju u trećem kvartalu. Osim proširenja lokalnih proizvodnih kapaciteta za rashladne ploče, Auras također planira proizvodnju rashladnih distributivnih jedinica (CDU) i razdjelnika rashladnog fluida (CDM) lokalno, sa planiranim mjesečnim kapacitetom od približno 2,000-3,{{2 }} skupova.
Proizvođač termičkih modula AVC je u svom nedavnom pozivu za zaradu naveo da je njegov mjesečni proizvodni kapacitet modula rashladnih ploča u Kini i Vijetnamu oko 115,000 jedinica, što znači mjesečnu proizvodnju od oko 420,000 jedinica kada izračunato prema rashladnim pločama.
AVC planira proširiti svoje kapacitete za 50% do kraja godine. AVC također planira povećati svoj mjesečni proizvodni kapacitet za CDU-ove na 1,000 jedinica i za CDM-ove na 30,000 kompleta. AVC je naglasio da se ovaj planirani kapacitet može fleksibilno prilagoditi na osnovu zahtjeva kupaca.
Thermo Technology Company Goli Thermal Processing proširuje svoje kapacitete u fabrici Zhongli na Tajvanu zbog povećane potražnje kupaca za tekućim hlađenjem. Do kraja trećeg tromjesečja očekuje se povećanje mjesečnog kapaciteta za CDM-ove sa 1,000 jedinice na 2,000 jedinice, a do kraja godine na 4,{{5} } jedinica, a očekuje se da će godišnja CDU proizvodnja dostići 2,000 jedinica do kraja godine.
Ovi proizvođači imaju velika očekivanja u pogledu potražnje za tekućim hlađenjem, uglavnom zbog računarske efikasnosti i PUE standarda data centara u Kini i EU, ali najznačajniji faktor je što je Nvidia ukinula samonametnuta ograničenja na termičke specifikacije za proizvođače čipova.
II Brzi rast tečnog hlađenja dovodi do nestašica UQD
Kako industrija željno iščekuje dolazak ere tečnog hlađenja, UQD je postao najveće usko grlo za rast. Proizvođači termalnih modula su istakli da je opskrba UQD-ima nedavno postala tesna. Iako je trenutni tržišni udio tekućeg hlađenja samo jednocifren, ako u budućnosti poraste na dvocifren broj, UQD može postati teško dobiti.
UQD dobavljači prvenstveno dolaze iz Evrope i Sjedinjenih Država, kao što su velike američke kompanije Parker Hannifin i CPC, švajcarski Staubli International, danski Danfoss i švedski Cejn. Tajvanski gigant komponenti konektora Lotes također aktivno ulazi na tržište i započeo je isporuku uzoraka.
Predsjedavajući Anbo Technology-a, Liang Zhijian, istakao je da, budući da tečno hlađenje prvenstveno ima za cilj izbjegavanje curenja, a UQD su komponente koje su najsklone curenju, opskrba UQD je najograničenija među komponentama za hlađenje tekućinom. Ovo nije samo tehničko pitanje; relevantni proizvođači takođe imaju patentnu zaštitu, a Anbo Technology istražuje načine da probije ove patentne barijere.
Insajderi iz industrije su primijetili da, iako proizvođači UQD-a imaju patentnu zaštitu, oni također moraju proći kroz višestruke validacije, uključujući OCP certifikaciju i validacije klijenata, koje zahtijevaju mnogo vremena i truda. Štaviše, postojeći evropski i američki proizvođači nemaju nameru da proširuju kapacitete, što će postati glavno usko grlo za brzi razvoj tečnog hlađenja.
Supermicro je jedan od najbrže rastućih proizvođača tekućih hlađenja. Osnivač i izvršni direktor Liang Jianhou je istakao da je tekuće hlađenje činilo samo 1% tržišta servera u posljednjih 30 godina, ali procjenjuje da će do 2025. stopa penetracije skočiti na 30%.
III Hlađenje tekućinom kao potencijalno rješenje; AI grana vrši pritisak na mrežu
Brzi razvoj generativne umjetne inteligencije doveo je do neviđene ekspanzije centara podataka, izazivajući zabrinutost zbog njihovog utjecaja na električnu mrežu. Ovi energetski intenzivni objekti mogu dovesti do nestanka struje i povećanja troškova energije. Prema procjenama Instituta za istraživanje električne energije, do 2030. podatkovni centri mogli bi trošiti 9% električne energije u Sjedinjenim Državama, što bi udvostručilo trenutnu cifru. Potrošnja električne energije velikog data centra jednaka je potrošnji električne energije stotina hiljada domaćinstava.
Posebno je zabrinjavajuća sve veća potražnja za moći umjetne inteligencije. Rani AI modeli su trošili deset puta više energije od Google pretrage, dok noviji čipovi zahtijevaju još više energije. Stručnjaci upozoravaju da budući razvoj vještačke inteligencije može biti ograničen našom sposobnošću da generišemo dovoljnu snagu.
Neke zemlje se suočavaju sa ozbiljnim izazovima. Na primjer, do 2026. Irska bi mogla imati 30% svoje električne energije namijenjene centrima podataka. U SAD-u, potrošnja električne energije u podatkovnim centrima koncentrirana je u 15 država, a najveća su Teksas i Virdžinija. Kalifornija je u kritičnoj situaciji, a očekuje se da će novi centri podataka proizvoditi potrebe za električnom energijom koje su veće od onih u nuklearnim elektranama.
IV Data centri: Ogromna potrošnja energije i porast hlađenja tekućinom
Računarski zahtjevi umjetne inteligencije povećavaju temperaturu servera i emisije ugljika, što rezultira značajnim povećanjem potražnje za sistemima hlađenja. Sistemi za hlađenje čine 40% ukupne potrošnje energije data centra, što ih čini drugim najvećim izvorom potrošnje energije nakon samih servera. Predviđa se da će globalno tržište hlađenja servera porasti sa 20 milijardi dolara u 2024. na 90 milijardi dolara do 2027. Očekuje se da će tržište tekućih rashladnih sistema u podatkovnim centrima porasti sa 1% na 22%, a tržišna vrijednost će porasti sa 317 miliona dolara na 7,8 milijardi dolara u naredne tri godine.
Rješenja za hlađenje tekućinom, koja koriste vodu ili rashladne tekućine za hlađenje servera, postaju sve popularnija. Nove tehnologije uključuju hlađenje uronjavanjem (uranjanje cijelih serverskih rekova u neprovodne tekućine) i direktno hlađenje tekućinom (kruženje vode oko servera). Iako je trenutno skuplji od sistema za hlađenje vazduha, tečno hlađenje može smanjiti potrošnju energije data centra za 10% ili više.
Istraživačka kompanija Global Market Insights predviđa da će globalno tržište tekućeg hlađenja za podatkovne centre porasti sa 2,1 milijarde dolara u 2022. na 12,2 milijarde dolara do 2032. godine. Istraživanje Uptime instituta pokazalo je da 16% menadžera data centara vjeruje da će tečno hlađenje postati primarno hlađenje metoda za 1-3 godina, dok 41% misli da će trebati 4-6 godina. Stoga je vjerovatnije da će se hibridne metode hlađenja pojaviti u kratkom roku.
Upsite Technologies, lider u upravljanju sistemima hlađenja zraka za podatkovne centre, primijetio je da, iako tehnologija kontinuirano napreduje, postizanje 100% podatkovnih centara hlađenih tekućinom je malo vjerovatno u kratkom roku, jer oprema za hlađenje tekućinom i dalje zahtijeva hlađenje zraka za odvođenje topline . Iako je tečno hlađenje efikasnije, teško ga je implementirati u velikim razmjerima i zahtijeva značajna ulaganja unaprijed. Vazdušno hlađenje je jeftinije, ali i manje efikasno. Dakle, hibridna postrojenja za hlađenje postaju sve popularnija kako bi se maksimalno iskoristile prednosti i tekućeg i zračnog hlađenja.
V Energetska kriza podatkovnog centra zahtijeva hitnu akciju
Zbog njihovog uticaja na životnu sredinu, data centri su pod sve većom pažnjom. Vlade širom svijeta provode propise za kontrolu potrošnje energije i ugljičnog otiska. Kineske smjernice „Zelenog centra podataka“ i slične inicijative u Njemačkoj, Singapuru i Japanu ilustruju ovaj trend. Stručnjaci iz industrije kao što je Schneider Electric naglašavaju potrebu za sveobuhvatnim ekološkim metrikama za procjenu održivosti centara podataka, uključujući faktore izvan upotrebe energije, kao što su vodni resursi i stvaranje otpada.
Američka vlada vrši pritisak na velike tehnološke kompanije da ulažu u čistu energiju i prepoznaju značajan utjecaj koji rastuća potražnja za energijom umjetne inteligencije ima na okoliš.
VI Pronalaženje odgovarajućih izvora energije: Data Center i energetski izazovi
Data centrima je potreban raznoliki energetski miks kako bi uravnotežili pouzdanost i održivost, a istovremeno zadovoljili rastuće zahtjeve. Obnovljivi izvori energije poput sunca i vjetra su atraktivni zbog niskog ugljičnog otiska. Međutim, njihova ovisnost o vremenskim uvjetima može dovesti do nestabilnog izlaza, što ih čini neprikladnim kao jedini izvor napajanja za podatkovne centre. Izgradnja redundantnih objekata za kompenzaciju ove nedosljednosti može biti neophodna, ali skupa.
Nuklearna energija se pojavila kao potencijalno rješenje. Tradicionalne nuklearne elektrane pružaju pouzdanu energiju baznog opterećenja, stvarajući stabilnu električnu energiju ključnu za rad podatkovnog centra. Štaviše, očekuje se da će globalno tržište nuklearne energije postići stabilan rast u narednoj deceniji.
Inovacije u nuklearnom sektoru nude više obećavajuće mogućnosti. Mali modularni reaktori (SMR) se razvijaju kao manje, sigurnije i skalabilnije alternative tradicionalnim nuklearnim elektranama. Iako su još uvek u fazi istraživanja i razvoja, SMR-ovi imaju potencijal da se primene direktno u data centrima, obezbeđujući namjensku čistu energiju.

▲ Globalno tržište tekućeg hlađenja (US$b)
Međutim, široko usvajanje SMR-ova suočava se sa značajnim preprekama. Regulatorni i proizvodni izazovi mogli bi odgoditi njihovu komercijalnu primjenu za nekoliko godina. Američka vlada aktivno istražuje rješenja, uključujući partnerstvo s tehnološkim divovima za smanjenje troškova i pojednostavljenje procesa.
Drugi način da se smanje energetski zahtjevi centara podataka je optimizacija opterećenja umjetnom inteligencijom. Prebacivanjem nekih zadataka AI s oblaka na lokalne uređaje s manjim modelima umjetne inteligencije koji zahtijevaju manje resursa, ukupna potrošnja energije može se smanjiti.
Budući razvoj centara podataka zahtijeva višestrani pristup. Usvajanje raznolikog energetskog miksa, uključujući pouzdane izvore energije kao što je nuklearna energija, uz aktivno traženje obnovljivih i inovativnih rješenja poput SMR-a, je od suštinskog značaja. Osim toga, optimizacija AI radnih opterećenja na lokalnim uređajima može dodatno promovirati održivost podatkovnih centara.
