Upravljanje toplinom AI čipa
Trenutačno drugi tehnološki divovi poput Microsofta, Googlea i Mete također proširuju svoje podatkovne centre kako bi obučili i pokrenuli svoje modele umjetne inteligencije. Prema izvješćima, Microsoft i OpenAI planiraju izgraditi projekt podatkovnog centra koji će uključivati superračunalo s milijunima namjenskih poslužiteljskih čipova, a trenutni bi projekt mogao stajati 115 milijardi dolara, uključujući superračunalo s umjetnom inteligencijom nazvano Stargate, čije se lansiranje očekuje 2028. godine. Izvršni direktor Mete Mark Zuckerberg također je u siječnju ove godine izjavio da će kompanijska računalna infrastruktura uključivati 30000 H100 grafičkih kartica do kraja 2024. Također je dodao, 'Ako su uključeni i drugi GPU-ovi, postoji približno 600000 H100 ekvivalentnih izračuna.'

AIGC se temelji na velikim modelima i velikim podacima. Veliki model odnosi se na model koji se može prilagoditi daljnjim zadacima nakon obuke na velikim i širokim podacima. Nakon pojave velikog modela, (1) parametri modela se povećavaju; (2) Diverzificirana potražnja ubrzava raznoliku nadogradnju računalne snage: Računalna snaga može se podijeliti na osnovnu računalnu snagu, inteligentnu računalnu snagu i superračunalnu snagu prema usklađenosti potražnje. U 2021. ukupna računalna snaga globalnih računalnih uređaja dosegla je 615 EFlopsa, uz stopu rasta od 44%. Očekuje se da će se do 2030. povećati na 56ZFlops, s CAGR-om od 65%. Inteligentna računalna snaga povećat će se s 232EFlops na 52,5ZFlops, s CAGR-om većim od 80%; Nakon pojave velikog modela, donio je novi trend rasta računalne snage, s prosječnim vremenom udvostručenja od 9,9 mjeseci za računalnu snagu.

Iza poboljšanja računalne snage, čipovi moraju imati veću računalnu učinkovitost i izvršiti više izračuna u kraćem vremenu, što neizbježno dovodi do povećanja potrošnje energije čipa. Karakteristike velike gustoće i velike potrošnje energije podatkovnih centara u superračunalnim centrima čine probleme disipacije topline sve istaknutijima. Moderni podatkovni centri, posebice superračunalni centri, obično sadrže velik broj uređaja velike snage koji tijekom rada stvaraju značajnu količinu topline. Ako se toplina ne može odvesti na vrijeme i učinkovito, to neće utjecati samo na performanse uređaja, već može dovesti i do kvarova hardvera. Prema izvješću IDC-a, oko 40% potrošnje energije u podatkovnim centrima koristi se za sustave hlađenja, što ukazuje da su učinkovita rashladna rješenja ključna za rad podatkovnih centara.

Tradicionalni sustavi zračnog hlađenja više ne mogu zadovoljiti potrebe za hlađenjem trenutnih superračunala, pa je tehnologija tekućeg hlađenja postupno postala glavni izbor u industriji. Primjena tehnologije tekućeg hlađenja omogućuje podatkovnim centrima smještaj više računalnih uređaja u istom prostoru, uz smanjenje potrošnje energije rashladnog sustava. Primjena tehnologije tekućeg hlađenja ne samo da poboljšava računsku učinkovitost, već i značajno smanjuje potrošnju energije i operativne troškove. Tehnologija hlađenja tekućinom može podnijeti više računalnih zadataka uz istu potrošnju energije putem učinkovitijeg provođenja topline.

Uz sve veću potražnju za obukom AI i računalstvom visokih performansi, tehnologija tekućeg hlađenja igrat će važniju ulogu u budućim superračunalnim centrima. Očekuje se da će tehnologija tekućeg hlađenja postati standardna konfiguracija u superračunalnim centrima i velikim podatkovnim centrima u nadolazećim godinama kako bi se zadovoljili rastući računalni zahtjevi i izazovi rasipanja topline.






