FOTO: Wikimedia Commons

Keelekonverents paneb masintõlke proovile Vikipeedia häkatonil

Uudis

Tallinnas toimub 19.–20. aprillil konverents «Eesti keeletehnoloogia 2017». Konverentsi eelpäev ehk 18. aprill on aga töötubade päralt. Üks neist on masintõlkimise häkaton, kus proovitakse järele, kuidas saavad masinad Vikipeedia arendamisele kaasa aidata.

Eesti keeletehnoloogia programmi koordineerija Tartu ülikoolis ja konverentsi üks korraldaja Kadri Vare ütles, et emakeelepäeval käivitus projekt Miljon+, mille eesmärk on viia eestikeelne Vikipeedia miljoni artiklini. «Kuidas saavad eesmärgile kaasa aidata tõlkemasinad, et seejuures keeleline ja sisuline kvaliteet säiliks? Just sellele küsimusele häkatonil lahendusi otsitaksegi,» rääkis Vare.

Häkatonil kasutatakse uusimaid närvivõrkudel põhinevaid masintõlkemudeleid, mis pakuvad ladusat eestikeelset tõlget just järeltoimetamise otstarbeks. Osalevad nii tõlkijad, kes annavad hinnanguid erinevatele tõlkimismeetoditele kui ka toimetajad, kes pimesi hindavad järeltoimetatud masintõlget ning inimtõlget.

Üks masintõlkevahend, mida kasutatakse, on TÜ arvutiteaduse instituudi masintõlkeprojekt KaMa – Kasutatav Eesti Masintõlge –, mida arendab TÜ keeletehnoloogia õppetooli juhataja Mark Fišel. Proovile pannakse ka eraturul masintõlget pakkuv Tilde Eesti OÜ tõlkeprogramm.

Toimub ka Pythoni tarkvarateegi töötuba. Python pakub eestikeelsete tekstide töötlemiseks mitmeid funktsionaalsusi. Töötoa korraldab Eesti esimene keeletehnoloogia idufirma TEXTA, mis on töövahendite raamistik vabatekstiliste (suur)andmetega tutvumiseks ja nende analüüsimiseks. Töötoas kasutatakse seda ühe Eesti ministeeriumi dokumendiregistri uurimiseks. «Näiteks, kes ja millistel teemadel kirjutab ministeeriumisse kõige rohkem kirju, mil määral ja milliseid isikuandmeid leidub avaldatud dokumentides või milliseid tüüpvastuseid ametlikus kirjavahetuses kasutatakse,» sõnas Vare.

19. aprill on kavas ka lõppeva riikliku Eesti keeletehnoloogia programmi ülevaade ning uue programmi tutvustus. Samuti saab tutvuda keeletehnoloogilise tarkvara ja rakendustega.

Konverents ja õpipajad on tasuta, vajalik on registreerumine aadressil www.keeletehnoloogia.ee

Jaga artiklit