TÜ esimese arvutifarmi nimi oli Aurumasin. Nüüd on Delta keskuses uued ja võimsad serverid.
FOTO: Andres Tennus/Henry Narits

TÜ teadusarvutuste keskus ulatab teadlastele abikäe

Aktuaalne

TÜ teadusarvutuste keskus on juba rohkem kui kümme aastat pakkunud teadlastele ja üliõpilastele arvutusressurssi, et lahendada suuremahulisi arvutusi nõudvaid probleeme. Soomes käivitub peagi uus superarvuti, mis suurendab hüppeliselt ka meie teadusarvutuste keskuse arvutusvõimsust.

Elame maailmas, kus iga päevaga koguneb üha rohkem andmeid. Möödunud aastal genereeriti, kopeeriti ja tarbiti üle maailma 59 zettabaiti andmeid. Tehnoloogiaanalüüside koostaja International Data Corporation prognoosib, et 2025. aastal on andmehulk ligi kolm korda suurem. Võrdluseks: ühe zettabaidi andmete säilitamiseks oleks vaja ligikaudu kaks miljardit sülearvuti kõvaketast. Et nii suuri andmehulki teadlaste, tööstusettevõtete, riigiasutuste ja tavakodanike heaks tööle panna, ei piisa tavapärasest andmetöötlusest. Tuleb appi võtta kõrgjõudlusega andmetöötlus ehk HPC (ingl high-performance computing).

Digiajastul on HPC hädavajalik väga paljude probleemide lahendamisel, kus puututakse kokku hiiglaslike andmehulkadega. HPC tegeleb selliste arvutustega, millega tavaarvutid toime ei tule. Personaal- ja täppismeditsiin vajab HPC-d, et töödelda haiguste ennetamiseks, diagnoosimiseks ja ravimiseks vajalikke andmeid. Samuti võimaldab HPC simuleerida inimaju tegevust.

Geoteadlased kasutavad HPC-d täpsemaks ilma ennustamiseks ja kliimamuutuste prognoosimiseks, keemikud ja molekulaarbioloogid ravimikandidaatide leidmiseks ning molekulide omavaheliste reaktsioonide uurimiseks. Hiljuti alustati Euroopas projektiga, mille raames analüüsitakse HPC abil 500 miljardi ravimimolekuli mõju koroonaviirusele. Tavaarvutiga kuluks iga molekuli analüüsiks mitu kuud, kuid HPC korral on sama töö tegemiseks vaja vaid 50 millisekundit.

Lisaks on HPC asendamatu materjaliteaduses, riigikaitses, säästva põllumajanduse arendamisel, nutikal linnaplaneerimisel, keeletehnoloogias ja veel paljudes valdkondades.

TÜ oma Aurumasin

2008. aastal kehtestas rektor Alar Karis statuudi, millega pandi alus TÜ teadusarvutuste keskusele. Ülikoolis oli toona mitu arvutustega tegelevat teadusrühma, kuid arvutite võimsus ja hulk ei rahuldanud kõiki vajadusi. Seetõttu otsustati luua ülikooli juurde nn arvutifarm, mida kõik ülikoolis töötavad teadlased ja üliõpilased saaksid kasutada, et teha suuremahulisi arvutusi.

HPC administraator kontrollib, kas kõik kõvakettad puhkavad sahtlis rahulikult. FOTO: Henry Narits

Esimese arvutiklastri nimeks sai Aurumasin. Juhtmasinat kutsuti Auruks, salvestusseadet Uduks ja arvutussõlmi hüüti Kateldeks. Kokku oli Aurumasina serverites 336 arvutustuuma, 1,3 terabaiti mälu ja 9 terabaiti salvestusruumi. Arvutustöid hakati värskelt komplekteeritud süsteemi abil tegema 2009. aasta hakul.

Praegune arvutuskeskus pakub teadlastele andmetöötluse terviklahendust, mis hõlmab nii analüüside tegemist, administreerimist kui ka andmete hoiustamist. Viimaste aastatega on arvutuskeskuse mõõtmed kasvanud mitu korda. Praegu on süsteemis 11 500 arvutustuuma. Pakutava salvestusruumi suurus on 23 petabaiti.

Võrdluseks võib öelda, et sama infokoguse talletamiseks vajatakse viis miljonit DVD-plaati. Kui laduda need üksteise otsa, moodustuks rohkem kui seitsme kilomeetri kõrgune kuhi. Kõik keskuse serverid ei mahu enam ära ühte ruumi, vaid paiknevad Delta keskuses ja Lossi tänav 3 õppehoones.

Arvutuskeskus lihtsustab teadustööd

Ainuüksi arvutite võimsusest poleks mingit kasu, kui puuduksid inimesed, kes oskavad nendega ümber käia ja kasutajaid aidata. Praegu töötab teadusarvutuste keskuses rohkem kui 20 spetsialisti, kelle ülesanne on süsteemi käigus hoida, arendada ja kasutajatuge pakkuda.

Teadusarvutuste keskus teeb teadlaste töö kergemaks ja aitab kokku hoida palju aega. Mitmed arvutuste tegemiseks vajalikud toimingud, näiteks tarkvara installimise, võib usaldada arvutuskeskuse spetsialistidele.

Lisaks TÜ uurimisrühmadele pakutakse HPC teenuseid ka teistele Eesti teadus- ja arendusasutustele. Hiljuti liidestati arvutuskeskuse taristu Riigipilvega. See tähendab, et infosüsteemide ja seadmete vahele tekitati ühendus andmevahetuse lihtsustamiseks. Riigipilve klientidel on võimalik pilveplatvormi kasutades hallata näiteks andmesalvestusmahtu, avalikke IP-aadresse ja privaatvõrke.

Igal aastal ilmub hulgaliselt teadustöid, mille valmimisel on kasutatud arvutuskeskuse võimalusi. Suurimate ressursikasutajate hulka kuuluvad evolutsioonilise bioloogia ja andmeteaduse õppetoolid ning loodus- ja täppisteaduste valdkonna uurimisrühmad, samuti geenivaramu.

Ühe zettabaidi andmete säilitamiseks oleks vaja ligikaudu kaks miljardit sülearvuti kõvaketast.

Geeniteadlased pääsevad ülikooli arvutusressursile ligi eriti kergelt – Galaxy platvormi kaudu (galaxy.hpc.ut.ee). See pakub suures valikus veebipõhiseid tööriistu näiteks nukleiinhapete järjestuste analüüsiks, proteoomikaprobleemide lahendamiseks ja statistiliseks analüüsiks. Galaxy kasutamine ei nõua eelnevat programmeerimiskogemust ega eelteadmisi bioinformaatikast. Seega on suure arvutusvõimsuse kasutamine lihtne.

Kümme korda võimsam arvuti

Sageli nimetatakse HPC-ks kasutatavaid arvuteid superarvutiteks. Need on teiste arvutite hulgas justkui vormel 1 sõidukid teiste autode seas. Ligi pool maailma viiesajast kõige kiiremast superarvutist paikneb Hiinas, ent kõige võimsam asub praegu Jaapanis.

2021. aasta suvel käivitub Soomes superarvuti LUMI ehk Large Unified Modern Infrastructure, mis avab Eesti kasutajatele enneolematud tehnoloogilised võimalused. LUMI on avamise hetkel üks võimsamaid superarvuteid terves maailmas. Šveitsis asuvat superarvutit Piz Daint, mida peetakse praegu Euroopa kiireimaks, ületab LUMI võimsuse poolest rohkem kui kümme korda. Uut superarvutit hakkab haldama kümnest Euroopa riigist koosnev konsortsium. Pole kahtlust, et LUMI viib Euroopa ettevõtete ja teaduse konkurentsivõime uuele tasemele.

Eesti ja LUMI on seotud mitmel moel. Näiteks arendavad Eesti teadusarvutuste infrastruktuuri spetsialistid praegu kasutajaliidest, mille abil saab võimalikuks ligipääs LUMI ressurssidele. Eesti saab kasutada 2% LUMI ressurssidest. Võttes arvesse arvuti erakordset võimsust, pole see sugugi väike näitaja.

Teoreetiliselt on LUMI võimeline sooritama rohkem kui 550 kvadriljonit (miljonit miljardit) arvutust sekundis. See on umbes sama palju, nagu suudaksid 1,5 miljonit MacBook Pro sülearvutit. Muide, kui selline hulk sülearvuteid asetada üksteise otsa, saaksime rohkem kui 23 kilomeetri kõrguse virna!

LUMI maksumuseks kujunes ligi 150 miljonit eurot. Kogu arvutite süsteem kaalub peaaegu 150 tonni ja hõlmab tenniseväljaku suuruse ala. Samas on LUMI maailma üks n-ö rohelisemaid superarvuteid, kuna selle mõju keskkonnale on minimaalne. LUMI töötab täielikult hüdroelektrienergia abil. Masinate töö käigus tekkivat soojust kasutatakse selleks, et kütta Kajaani linna, kus arvuti asub. See vähendab märkimisväärselt kogu linna CO2 jalajälge.

Veel tuleb rõhutada, et LUMI kasutajatel on täielik ülevaade sellest, mida nende andmetega ette võetakse. See tähendab, et erinevalt Google’i või Amazoni pakutud pilveteenustest sobib LUMI ka tundlike andmete turvaliseks töötlemiseks ja säilitamiseks.

Ühendavad koostööprojektid

Euroopa teadlased ja tööstusettevõtted töötlevad praegu andmeid sageli väljaspool Euroopa Liitu, kuna siin ei pakuta neile piisavalt suurt arvutusvõimsust. Sestap käib töö selle nimel, et võtta Euroopas kasutusele maailmatasemel superarvutite taristu. Samal ajal püütakse Euroopa riikide HPC kompetentsi viia ühtlaselt kõrgele tasemele ja muuta HPC võimalused kättesaadavaks kõikidele teaduse, ettevõtluse ja avaliku halduse valdkondadele, kus need võiksid ühiskonnale kasu tuua.

Alates 2020. aasta septembrist osaleb teadusarvutuste keskus Euroopa Liidu ühisettevõtte Euroopa Andmetaristu projektis „EuroCC“, mille käigus rajatakse kahe aastaga Euroopasse 33 riiklikku HPC kompetentsikeskust. „EuroCC“ tegevusi koordineerib Stuttgardis paiknev HPC keskus. Projekti maksumus on 57 miljonit eurot. Pool sellest rahast tuleb Euroopa Liidu teadusuuringute ja innovatsiooni raamprogrammi „Horisont 2020“ vahenditest ja teise poole katavad projektiga liitunud riigid.

HPC-ks kasutatavaid arvuteid hüütakse superarvutiteks. Need on justkui vormel 1 sõidukid autode seas.

„EuroCC“ projekti käigus hinnatakse riikide HPC-kompetentsust, misjärel kavandatakse tegevusi puudujääkide täitmiseks. Ühtlasi edendatakse riikidevahelist koostööd ja vahetatakse kogemusi. Loodavad HPC kompetentsikeskused hakkavad HPC-ga seotud tegevusi koordineerima riiklikul tasemel. Need pakuvad tulevikus teadlastele ja tööstusettevõtetele eksperdituge HPC ja tehisintellekti alal, vahendavad arvutusressursse ja korraldavad koolitusi.

Kõige sellega on tegeldud varemgi, kuid siiani on Euroopa kippunud superarvutite vallas muust maailmast maha jääma. Ometi on suur HPC-kompetentsus Euroopa Liidu tehnoloogilise autonoomia ja konkurentsivõime tugevdamisel väga tähtis.

Alates möödunud aastast on Eesti täievoliline Põhjamaade koostööinitsiatiivi NeIC (ingl Nordic e-Infrastructure Collaboration) liige. NeIC-i kaudu tehakse suur osa Põhjamaade e-taristute strateegilisest koostööst. Meie teadustaristutele annab see võimaluse osaleda suure mõjuga rahvusvahelistes koostööprojektides ja arendada enda konkurentsivõimet.

NeIC-i peamiste eesmärkide hulka kuulub teadlaskonnale suunatud e-taristute teenuste arendamine ja käigushoidmine. Üheks selliseks on Põhjamaade teaduspilve loomist koordineeriv projekt EOSC-Nordic, milles osaleb 24 institutsiooni kümnest riigist. Nende hulka kuuluvad e-taristu pakkujad, uurimisasutused ja ekspertide võrgustik.

Superarvutid tööstuses

Paari lähima aasta jooksul muutuvad kõigile kättesaadavaks järgmise põlvkonna superarvutid, mis suudavad teha rohkem kui miljard miljardit (1018) arvutust sekundis. See on võrreldav terve Euroopa Liidu elanike nutitelefonide jõudlusega.

HPC on innovatiivne jõud, mis seisab inimeste elukvaliteeti parandavate murranguliste teadusavastuste taga. Lisaks teadusasutustele tunnevad HPC vastu üha rohkem huvi ka tööstusettevõtted. Suurt arvutusvõimsust kasutades on võimalik märkimisväärselt vähendada toodete disainile kuluvat aega ja raha ning pakkuda suurema väärtusega tooteid ja teenuseid.

Näiteks auto arendusele kuluvat aega on õnnestunud lühendada rohkem kui kaks korda. Ka autode turvakatseid on HPC simulatsioonide abil palju lihtsam ja odavam teha, kui korraldada tõelisi autoõnnetusi. Peale auto- ja lennukitööstuses kasutamise luuakse HPC abil finantsmudeleid ning analüüsitakse ettevõtete kliendiandmeid. Filmistuudiod salvestavad superarvutite abil eriefekte ja naftafirmad simuleerivad maapõues toimuvaid protsesse.

Väikeste ja keskmise suurusega ettevõtete jaoks on enda HPC süsteemi arendamine kulukas, kuid pilvepõhiste HPC teenuste kasutamine pole üldjuhul kuigi kallis. Sel juhul ei tule maksta terve arvutifarmi eest, vaid üksnes selle ressursi eest, mida kasutati. Kõike seda arvesse võttes tasub Eesti ettevõtetel tõsiselt kaaluda HPC võimalusi, et luua ja pakkuda konkurentsivõimelisi tooteid ning teenuseid. TÜ teadusarvutuste keskusel on selleks olemas nii tehniline võimekus kui ka ekspertide tugi.

Ülar Allas

teadusarvutuste keskuse konsultant

Jaga artiklit