AMD INSTINCT MI100 Hive Reflection Left 1024x680 1

U dalekoj, dalekoj galaksiji… unutar superkompjutera

Najveći događaj u svetu nauke i informacionih tehnologija koji će obeležiti 2021. svakako je puštanje u rad najmoćnijeg superkompjutera na planeti – ORNL (Oak Ridge national Laboratory) “Frontier“.

Frontier” će omogućiti performanse koje prevazilaze 1,5 ExaFLOPS-a. Poređenja radi, trenutno najbrži superkompjuter na svetu je japanski “Fugaku” sa teoretskim maksimuom od 0,53 EFLOPS-a. Ovakva računarska moće je kreirana sa ciljem probijanja novih granica u naučnim istraživanjima. Najteži naučni problemi zahtevaju najveću moguću proračunsku snagu. Istraživanje mogućnosti primene fuzione energije, pronalaženje novih materijala, otključavanje tajni univerzuma, svi ovi, a i mnogi drugi, problemi su ključni za dalji razvoj čovečanstva.

ORNL je povodom priprema za uvođenje u rad punog kapaciteta, kreirala poseban “CAAR” program u čijoj je selekciji osam velikih naučnih problema na kojima će “Frontier” raditi kao svojevrsni prolog za prelazak u režim punih performansi. Najzahtevniji od tih osam problema jeste, svakako, precizna simulacija čitave galaksije koja je po veličini slična našem Mlečnom putu.

CHOLLA” program za simulaciju čitavih galaksija je delo astrofizičara sa renomiranog univerziteta Princenton. Ovaj program je do sada radio na “Titan” superkompjuteru, čija je snaga 0,027 EFLOPS-a! S tim u vidu ne čudi zašto je baš “CHOLLA” odabran kao prvi program koji će biti pokrenut na novom superkompjuteru.

Dodatni razlog zašto je “CHOLLA” odabran za testiranje “Frontier-a” jeste to što se u potpunosti oslanja na GPU procesiranje, što se da zaključiti, kada se ova skraćenica razvije: “Computational Hydrodynamics on Parallel Architecture”.

Obzirom da je “Titan” koristio Nvidia “Kepler” GPU-ove, tim programera sa Princetona je u saradnji sa AMD-ovim i HPE-ovim (HPE je kupio Cray) inženjerima omogućio veoma lako i veoma brzo prebacivanje kompletnog “CHOLLA” programskog koda sa NVIDIA-ine CUDA-e na AMD-ov ROCm, koristeći HIP translacioni sloj. Prema rečima Reubena Budiardja, prebacivanje koda je bilo veoma lako i nije zahtevalo više od par sati posla. Prema inicijalnim testovima “CHOLLA” na AMD Instinct MI50 akceleratorima, koristeći ROCm, ima ekvivalentne performanse kao na NVIDIA Tesla V100 akceleratorima, koristeći CUDA-u. Sa prelaskom na AMD Instinct MI100 akceleratore dobija se instant ubrzanje od 40% bez ikakvog menjanja samog ROCm koda. Tim očekuje još veća ubrzanja sa boljom optimizacijom za novu AMD CDNA arhitekturu.

Zašto je svaki “TFLOPS” bitan kod ovakve vrste proračuna? Jednostavan odgovor je zbog rezolucije detalja. Naime, “CHOLLA” ima ambiciju da kroz simulaciju rađanja i smrti svake zvezde u galaksiji, uz najveću moguću preciznost simulira kako fluidnu dinamiku gasova, tako i gravitacione interakcije između zvezda u gasnim maglinama. Bez adekvatne proračunske snage, ovaj ključni aspekt zvezdanog uticaja na nastanak i oblik galaksija nije moguće simulirati u zahtevanoj rezoluciji i razmeri.

Zahvaljujući proračunskoj snazi AMD Instinct MI100 akceleratora, zasnovanih na najnovijoj “CDNA” arhitekturi, tim sa Princenton univerziteta će moći svoj “CHOLLA” program pokrenuti u punoj rezoluciji, što će po prvi put omogućiti poređenje simuliranih rezultata unutar superkompjutera sa vizuelnim podacima koje su godinama sakupljale teleskopske laboratorije širom planete, kao i vanplanetarni Habl teleskop. Poređenje te dve vrste podataka će naučnicima omogućiti kreiranje još preciznijih algoritama za simulaciju galaksija unutar superkompjutera, a sa daljim hardverskim unapređenjima te simulacije će se moći proširiti i na galaktička jata, kao što je “lokalno jato” kome pripada i Mlečni Put.