Nizzegiar la digitalisaziun per rinforzar la lingua rumantscha sin plaun naziunal, quai è la motivaziun da «Translatur-ia». Cun quest project da perscrutaziun mussa la Scola auta spezialisada dal Grischun ils potenzials e las sfidas dal svilup d'applicaziuns linguisticas.
Text (tudestg): Philipp Kuntschik / illustraziuns: Philipp Kuntschik, Lia Rumantscha / translaziun: Lia Rumantscha
Avant passa 80 onns ha il rumantsch survegnì il status da quarta lingua naziunala da la Svizra. Tuttina èsi fin oz anc strusch pussaivel da s'infurmar per rumantsch sin plaun naziunal a moda adequata. La digitalisaziun pussibilitescha ussa da midar quai. Il project Translatur-ia da la FH Grischun sviluppa metodas per optimar applicaziuns linguisticas per il rumantsch (p.ex. servetschs da translaziun) cun agid da la tecnologia da computer. Ensemen cun la Lia Rumantscha èsi reussì da sviluppar in prototip che mussa ch'ins po realisar in agid da translaziun qualitativamain bun, malgrà la pitschna quantitad da datas disponiblas. Projects da perscrutaziun futurs pon sa basar sin questas experientschas per sviluppar vinavant il prototip.
Metodas modernas da l'intelligenza artifiziala
Programs da translaziun online moderns cuntanschan oz bunamain in nivel da qualitad sco quel d'umans, perquai ch'els applitgeschan raits neuronalas per las linguas fitg derasadas. Questa metoda moderna nizzegia immensas quantitads da datas per crear in model da computer cun agid da trenaments repetitivs. Quest model permetta silsuenter da translatar texts da tuts geners en las linguas trenadas. La sfida per il rumantsch è il fatg che la quantitad da datas disponiblas è mo pauc suffizienta; la disciplina concreta vegn perquai numnada «Low Resource Machine Translation». Ils resultats actuals en questa disciplina n'èn per bler betg cumparegliabels cun quels ch’ins survegn per linguas fitg derasadas (p.ex. tudestg <> englais).
Las ideas matematicas davos las raits neuronalas n'èn betg novas, ellas èn naschidas gia avant passa 70 onns. Ma pir l'augment rasant da la prestaziun matematica disponibla ha pussibilità ils ultims onns da nizzegiar questas metodas en adina dapli secturs. Ellas vegnan applitgadas oz surtut per elavurar maletgs, per elavurar lingua e qua oravant tut per far translaziuns automaticas. L'applicaziun da raits neuronalas sa differenziescha dal tuttafatg da las metodas classicas en il champ d'applicaziun correspundent. La translaziun automatica classica sa basava sin grammaticas cumplessivas elavuradas a maun che vegnivan transferidas en il program cun agid da numerusas reglas, medemamain creadas a maun. In sistem modern «emprenda» da translatar texts correctamain cun analisar numerus exempels. L'interacziun umana è plitost pitschna, persuenter dovri fitg blera prestaziun matematica, perquai ch'il program, ditg a moda simplifitgada, emprova ora «tut» las reglas.
Tecnicamain descrivan raits neuronalas in construct matematic per gronda part autonom che sa cumpona d'almain duas stresas: la stresa d'input interpretescha matematicamain las datas primaras entant che la stresa d'output reunescha las calculaziuns da la rait sco resultat represchentativ. Sch'ins integrescha tranter questas duas stresas ulteriuras stresas zuppadas, discurr'ins da «Deep Neural Networks» u «Deep Learning», pia emprender a moda approfundada. Durant il trenament vegnan mussads al sistem pèrs da datas che sa cumponan da las datas primaras spetgadas (datas d'input) e dal resultat giavischà (label). La rait emprova autonomamain da crear in resultat cun agid da las datas d'input, cumpareglia quel cun ils labels giavischads e nizzegia silsuenter la differenza constatada tranter il resultat e l'aspectativa per calibrar «enavos» las singulas stresas («back-propagation»). Cun agid da pliras iteraziuns «emprenda» il sistem uschia d'interpretar las datas e po crear il resultat giavischà.
La cumplexitad d'in tal sistem per incumbensas da classifitgar è per gronda part survesaivla, cunquai che tut las valurs da resultat pussaivlas èn per il solit gia enconuschentas (p.ex. endretg/fallà u categorias sco a, b, ..., z). Sch'i sa tracta dentant da manipular u da generar cuntegns (p.ex. per incumbensas da translaziun), è la quantitad dals resultats virtualmain infinita. L'architectura da codar e decodar applitgada en tals cas po vegnir chapida sco connexiun da duas raits neuronalas: l'emprima rait (il codader) creescha in vectur matematic che vegn eventualmain manipulà e silsuenter puspè transfurmà en ina sequenza raschunaivla cun agid d'ina segunda rait (il decodader). Las datas da trenament necessarias consistan perquai da pèrs da datas da partenza e da datas d'arriv u, en il cas d'ina translaziun, da la medema frasa en omaduas linguas.
Datas, datas, datas
Las datas da translaziun utilisadas per sviluppar il prototip èn vegnidas messas a disposiziun da la Lia Rumantscha e d'ulteriurs partenaris da l'economia ed èn era vegnidas rimnadas en l'internet. «Per il futur dal rumantsch èsi absolutamain central da pudair accelerar il process da translatar texts d'autras linguas en rumantsch e dal rumantsch en autras linguas», di Conradin Klaiss, manader Furmaziun da la Lia Rumantscha. «Uschia èsi pussaivel da generar dapli texts d'auta qualitad en il medem temp e cun las medemas resursas finanzialas sco fin ussa. En pli gida quai a meglierar la chapientscha tranter las cuminanzas linguisticas da la Svizra.» Per promover vinavant il project han ins creà ina gruppa d'interess. Quella duai accelerar il svilup futur da tecnologias e l'adattaziun da quellas als basegns specifics da las branschas. Tschertgadas èn unitads da datas da texts en rumantsch grischun e tut ils idioms, en il cas ideal cun in pendant tudestg, sco era cas d'applicaziuns che profitassan da tecnologias linguisticas per il rumantsch. Applitgadras ed applitgaders, ma era tut las autras persunas interessadas, duain per plaschair s'annunziar tar la FH Grischun u tar la Lia Rumantscha.
Il project è vegnì finanzià l'onn 2020 da l'uniun da promoziun da la FHGR.
Beitrag von
Philipp Kuntschik, collavuratur scientific
Institut svizzer per scienzas d'infurmaziun (collaziun a la pagina tudestga)