Keeletehnoloogia (ingl language technology) on erialadevaheline valdkond, mis tegeleb keelelise informatsiooni – teksti ja kõne – arvutitöötluseks vajalike meetodite uurimise ja rakenduste arendamisega. (Meister 2018)
ILLUSTRATSIOON: Pixabay.com

Mis on keeletehnoloogia?

Keelenurk

Kui veel paarkümmend aastat tagasi peeti rääkivat ja isemõtlevat autot pigem ulme valdkonda kuuluvaks, siis nüüd ei imestata enam sugugi selle üle, et auto mõistab häälkäsklusi ja arvuti parandab õigekirjavigu. Keeletehnoloogia rakendused on saanud meie igapäevaelu osaks, nii et tavakasutaja ei küsigi enam, kuidas arvuti suudab keelt mõista. Speller, kõnetuvastus ja kõnesüntees, masintõlge, veebisõnastikud, infootsing ja suuline suhtlus arvutiga on näited keeletehnoloogia enimlevinud rakendustest.

Vaata ja täienda Vikipeedias artiklit «Keeletehnoloogia». Kõigi mõistete loendi leiad aadressilt Vikipeedia:Tartu Ülikooli keelenurk.

Termineid keeletehnoloogia ja arvutilingvistika kasutatakse sageli sünonüümidena, kuid sisuliselt tuleks neid siiski eristada. Arvutilingvistikas tegeldakse eelkõige kirjaliku keele arvutitöötluse teoreetiliste aspektidega ja seda peetakse keeleteaduse haruks. Keeletehnoloogias tegeldakse keele ja arvuti seoste rakendusliku poolega, mistõttu on see pigem informaatika või arvutiteaduse haru. Termin keeletehnoloogia võeti kasutusele 1990. aastal, kui infotehnoloogia edenedes hakkas arvutilingvistika alal tekkima vajadus spetsiifilisema eristuse järele.

Viimaste aastate arengut info- ja kommunikatsioonitehnoloogias võrreldakse Gutenbergi trükipressi leiutamise mõjuga. On leitud, et keeled, mis tol ajal trükisõnas ei levinud, sattusid ohtu ja hääbusid. Niisamuti tuuakse nüüdsel ajal esile tõika, et keeled, millel on keeletehnoloogiline tugi, on elujõulisemad kui need, millel seda pole. Keeletehnoloogilise toe all peetakse silmas võimalusi keelelist teavet automaatselt töödelda ja vahendada.

Maailma keelte staatust ja elujõulisust võrreldes võetakse arvesse eelkõige keeletehnoloogilise toe näitajaid. Eesti keel kuulub 50 kõige arenenuma keele hulka, sest see on keeletehnoloogiliselt hästi toetatud juba ala algusaegadest peale: teadlased on tublisti arendanud nii keeleressursse kui ka keeletarkvara. Näiteks Tartu Ülikoolis on muu hulgas välja töötatud tõlkemootor Neurotõlge, mis suudab hästi võistelda ka Google’i masintõlkega.

Keelenurka toimetab Miljon+ töörühm (Riina Reinsalu, Ann Siiman ja Sirli Zupping).

Jaga artiklit