REDAKCIJA - KOLOFON (EKIPA)

Registracija edicije: Elektronski časopis INSAJDER je vpisan pri Ministrstvu za kulturo z odločbo št. 006-203/01 pod zaporedno številko 36. Mednarodna serijska številka edicije: ISSN 1408-0990. Odgovorni urednik Igor Mekina.

Država zaradi gospodarske krize prenehala skrbeti za slovenščino

Država zaradi gospodarske krize prenehala skrbeti za slovenščino

Objavljamo drugi del pogovora z Mirom Romihom, direktorjem kamniškega podjetja Amebis, ki že od leta 1991 deluje na področju izdelave jezikovnih računalniških programov. 

Koliko sodelujete z uradnimi ustanovami s področja jezikoslovja?
Sodelujemo precej, in sicer v dveh vlogah. V prvi vlogi smo jim predvsem tehnološka podpora, saj se morajo tudi oni prilagoditi sodobni tehnologiji, a po navadi nimajo ustreznega znanja s področja računalništva in jezikovnih tehnologij. Tako npr. pomagamo Inštitutu za slovenski jezik Frana Ramovša pri ZRC SAZU pri razvoju portala Fran, pa tudi nekaterih drugih delih in projektih.

Po drugi strani pa se na te ustanove obračamo zaradi določenih jezikovnih nasvetov in to znanje potem vgrajujemo v končne izdelke. Na ta način prenašamo tudi njihovo znanje v uporabna orodja. Pri Besani, avtomatski lektorici, je npr. upoštevan zadnji pravopis, ki spremenjen v računalniško orodje ljudem v praksi omogoča pravilnejše pisanje na lažji in hitrejši način.

Ko smo že pri Besani, na kakšni tehnologiji temelji program? 
Razvoj Besane je bil dolgotrajen in je sledil dostopnosti takratne tehnologije. Ko smo jo začeli razvijati, je bila v uporabi analiza besedila na osnovi pravil - računalniških ukazov, ki narekujejo izvedbo določene operacije. Pravila lahko uporabljajo različne jezikovne baze s podatki o posameznih besedah, njihovih pomenskih povezavah, pregibnosti, vezljivosti itd. Na osnovi teh baz in pravil je bil nato razvit algoritem, ki analizira besedilo in poskuša najti napake. 

Besana / Amebis
Besana | VIR: Amebis
Pravila lahko uporabljajo različne jezikovne baze s podatki o posameznih besedah, njihovih pomenskih povezavah, pregibnosti, vezljivosti itd.

Pozneje so se razvile še statistične metode, metode strojnega in globokega učenja (nevtronske mreže). Vse te metode se tudi uporabljajo pri jezikovnih tehnologijah. Je pa tako, da ima vsaka metoda določene prednosti in pomanjkljivosti, zato ni enako primerna in uporabna za različne jezikovne tehnologije. Običajno so na koncu najboljši hibridni modeli, ki zajemajo dobre lastnosti vseh uporabljenih tehnologij.

Pri statističnih metodah oz. strojnem učenju je največkrat problematična učna baza (besedil), iz katere se računalniški program uči. V primeru slovničnega pregledovalnika morajo imeti besedila v bazi tako napake kot tudi njihove popravke, da jih bo lahko program analiziral in pozneje uporabil. Izdelati tako veliko množico, da bi bila učinkovita v vsakdanji uporabi, zahteva ogromno ročnega dela. Zato je treba pretehtati, če bi izdelava take množice podatkov zahtevala več časa, kot izdelava pravil na podlagi slovarja. Še posebej, ker se jezik (besedišče) in jezikovna pravila (slovnica, pravopis) stalno spreminjata.

Kdo so uporabniki vaših orodij?
Če začnemo pri Besani: tu so uporabniki iz vseh družbenih skupin, vsi, ki pišejo v slovenščini. Tako Besano uporabljajo fizične osebe ter pravne osebe (ustanove) iz gospodarstva in javne uprave.

V teh 30. letih delovanja je najbolj presenetljiv premik pri uporabi naših orodij pri lektorjih. Na začetku so bili lektorji najhujši nasprotniki Besane, ker so jo po eni strani dojemali kot konkurenta, ki jim ogroža posel, po drugi strani pa program ne zna toliko, kot oni sami, in si z njim ne morejo dosti pomagati. A po vseh letih nadgrajevanja programa so lektorji sedaj postali najbolj hvaležni uporabniki, saj so spoznali, da je Besana kakovostno orodje, ki jim omogoča hiter pregled in popravke slovničnih napak.

Besana npr. ni zaspana, ni pod stresom in vedno dela optimalno, medtem ko so lektorji samo ljudje, ki tudi delajo napake. Program jim zvišuje kakovost njihovega dela in prihrani veliko časa. Običajno Besano uporabljajo za osnovni pregled, nato pa besedilo še dodatno slogovno pregledajo.

Druga naša orodja so bolj osredotočena na posamezne skupine uporabnikov. To so slovarji iz določenih področij, eBralec (za slepe in slabovidne), Piflar za interakcijo z uporabnikom itd. 

Miro Romih / Amebis
Miro Romih, direktor kamniškega podjetja Amebis | VIR: Amebis

Ali država dovolj poskrbi za pomoč podjetjem, ki delujejo na področju slovenskega jezika?
Do neke mere država podpira delovanje in to predvsem z določenimi razpisi za razvojne projekte, na katere se lahko prijavimo. V okviru teh projektov lahko po navadi dobimo tudi sredstva za strateški razvoj, za izboljšanje oz. oblikovanje novih rešitev.

Manj sredstev je od države namenjenih izdelavi konkretnih orodij, namenjenih končnim uporabnikom. Upam, da bo v prihodnje glede tega bolje. Primer takega projekta je eBralec (sofinanciran preko Zveze društev slepih in slabovidnih Slovenije), ki je brezplačno dostopen slepim in slabovidnim, ljudem z motnjami branja (dislektikom) ter javnim ustanovam, medtem ko je za preostale uporabnike plačljiv.

Sicer pa je državnih sredstev premalo, da bi lahko v celoti pokrivali naše delovanje, kar je razumljivo. Večino sredstev tako še vedno pridobimo s prodajo svojih izdelkov na tržišču. Ker je slovenščina živ jezik, moramo seveda nenehno posodabljati svoje izdelke, ki dejansko nikdar niso končani.

Pri državnih razpisih je običajno največji problem financiranje delovanja oz. posodabljanja programov po končanem začetnem razvoju oz. po začetku uporabe, saj praviloma ni zagotovljenih sredstev za programske in jezikovne posodobitve ter vzdrževanje strojne opreme.

Pri državnih razpisih je običajno največji problem financiranje delovanja oz. posodabljanja programov po končanem začetnem razvoju oz. po začetku uporabe, saj praviloma ni zagotovljenih sredstev za programske in jezikovne posodobitve ter vzdrževanje strojne opreme.

Lahko pa bi država pomagala tudi z nakupom naših programov ter na ta način pomagala sebi in nam, kot je to že bilo pred leti. Pred gospodarsko krizo so namreč skoraj vsa ministrstva uporabljala Besano. Državna uprava je imela nekaj tisoč licenc tega programa, kar se je precej poznalo pri besedilih, ki so jih objavljali - bila so kolikor toliko brez napak. A v finančni krizi so zaradi varčevanja ukinili vse licence, pri čemer do danes niso kupili še niti ene, čeprav je krize že konec. To se vidi tudi na njihovih spletnih straneh, dopisih, razpisih, zakonih (tudi v ustavi) in drugih besedilih, v katerih so pravopisne napake bolj pravilo kot izjema. Vsekakor ne najlepši zgled državljanom, ki jih država preko šolskega sistema uči (oz. jim predpisuje pravila) pravilnega pisanja, sama pa se na to požvižga.

Povezane novice