Kolm keelevaldkonna juhtivat teadusasutust moodustasid konsortsiumi selleks, et eesti keele digitaalsed ressursid oleks võrgu kaudu kättesaadavad ning käiksid kaasas tehnoloogilise arenguga. Aja jooksul üha täienevasse varamusse leiavad tee kõige erinevamad keeleandmestikud. Videri sõnul on keskus mõeldud eelkõige teadlastele ning see kuulub ühe objektina Eesti teaduse infrastruktuuride teekaardile. «Kui räägime sellest, kes oleks potentsiaalsed kasutajad, siis nendeks on kindlasti kõik Eesti keeletehnoloogia riikliku programmi projektides osalejad, keda on praegu 160 ringis. Nende projektide kõik tulemused aga omakorda jõuavad keskuse repositooriumisse, millele pääseb ligi loodava veebiportaali kaudu,» lausus Vider.
Mis puudutab juba olemasolevaid keeleressursse, näiteks keeletöötlusvahendeid ja nende prototüüpe, siis on keskuse üheks tegevuseks võimalike kasutajate teavitamine ja nende koolitamine. Millised keeleressursid aga keskusesse täpsemalt koonduvad? «Ilmselt on kasutajal kergem endale ette kujutada kõiksugu leksikone, sõnavara- ja terminoloogiakogumeid,» selgitas Vider. «Teisest küljest on keeleandmestikud sellised teksti- või kõnekorpused, kuhu on juba väljendatud keelt koondatud kas tekstidena või kõne kujul, näiteks helifailidena. Samuti on keeleressursid kõik need infotehnoloogilised vahendid, mille abil keelt töödelda nii, et see oleks inimestele kergemini hallatav ja samas ka arvutile arusaadavam.»
Keskuse ressurssidele saavad ligipääsu ja võimaluse ise panustada ka need teadlased, kes otseselt keeletehnoloogiaga kokku ei puutu. «Huvi on tulnud ka teiste valdkondade teadlastelt, et näiteks luua oma valdkonna terminoloogia ühes keskkonnas ja neid siis ristkasutada. Juba olemegi mõelnud, kuidas terminoloogiakeskkonna osa luua, et valdkonna spetsialistid saaksid ise sinna panustada ja samas oleks see hõlpsasti kasutatav ja kõigile ligipääsetav,» selgitas keskuse juht.
Internetiajastul räägitakse tihtilugu inglise keele aktiivsest pealetungist. See aga tähendab, et ülejäänutel ning eriti väiksematel keeltel tuleb ajaga kaasas käimiseks arendada omakeelset keeletehnoloogiat. Milline paistab Eesti seis, kui jälgida näiteks teadlaste, riigi ja firmade initsiatiivi tegeleda keeleküsimustega? Videri hinnangul firmade huvi praegu väga suur pole, sest puhtalt eestikeelsele keeletehnoloogiale keskendunud firmasid pole kasulik nii väikse kasutajaskonna juures ülal pidada. «Meil on firma Filosoft, mis on teinud kõige laiemalt kasutatava ja töökindla eesti keele spelleri. Aga ka Baltimaade tuntud keeletehnoloogiafirma Tilde tuleb tõenäoliselt keskuse koostööpartneriks. Kõik IT-firmad, kes loovad otsisüsteeme, võiksid rakendada eesti sõnavormide tundlikkust, nii et leitakse üles ka päringusõna teised käände- ja pöördevormid,» pakkus Vider. Lisades, et üks suur rakendusvaldkondi saab olema pimedatele mõeldud tooted, et vaegnägijad saaksid tekstilist infot kõnesüntesaatori abiga kuulata.
Autor: Sven Paulus



