Euskara sare eta ehun neuronaletan barrena

Dorleta Agiriano Lai 2018ko abe. 13a, 10:36
Modelaren arduradunetako bat da Itziar Cortes. (Utzitako argazkia)

Adimen artifizialaren bidez eta sare neuronaletan oinarrituz, euskararen eta gazteleraren arteko itzulpen automatikorako sistema berria sortu dute, Modela izenekoa. Tresna berritzailearen sortzaile eta arduradunetako bat da Itziar Cortes Orioko bizilaguna.

Azaroak utzi zuen albistea. Euskararen itzulpen automatikorako tresna berritzailea sortu dute, adimen artifizialaren bidez garatua eta sare neuronaletan oinarritua: Modela. Muga eta konplexutasun morfologikoak gaindituz, euskara eremu berrietara zabaltzea ahalbidetuko duela uste dute sortzaileek. 2016-2017 bitartean burututako ikerketa-proiektu bat izan zen Modelaren abiapuntua.

Ametzagaiñak, Vicomtechek, Elhuyarrek, ISEAk eta UPV/EHUk hartu zuten parte azterketan, eta helburua itzulpen automatikorako teknika berri batzuk probatzea zen, adimen artifizialean oinarritutakoak. Ikusi genuen beste hizkuntza batzuekin teknika berriak aplikatzen hasiak zirela eta emaitzak onak ari zirela izaten, eta euskararekin saiatu nahi genuen, azaldu du Itziar Cortesek. Modelaren arduradun eta sortzaileetako bat da zarauztarra; ingeniaritza informatikoa ikasi zuen, eta egun, Elhuyarreko itzulpengintzarako teknologien arduraduna ere bada.

Ikerketa-proiektu horren bidez hasi ziren euskara eta itzulpen automatiko neuronala harremanetan jartzen; probak ondo joan ziren, eta azkenean, aurten emaitza merkaturatzea erabaki dugu, Modela izenpean. Cortesen esanetan, euskararen eta gazteleraren arteko itzulpen-sistema berriak orain arte ikusi gabeko emaitzak eman ditu. Kalitate maila oso altua eskaintzen du, eta emaitzak oso naturalak dira. Batzuetan kosta egiten da itzultzaile automatikoa dela jakitea.

Teknikak berrasmatzen
Itzulpen automatikorako aurreko sistemek, hasiera batean, hiztegiak eta erregela sintaktikoak izaten zituzten oinarri. Bi hizkuntzetako baliabide linguistikoak landu behar izaten zituzten itzultzaile automatikoa sortzeko, eta beraz, beharrezkoa izaten zen hizkuntzalariek erregelak idatzi, hiztegiak sortu eta hau guztia martxan jartzea, Cortesen arabera.

Gero, sistema aurreratuagoak sortu ziren, estatistiketan oinarritutakoak; Google da horren adibide bat. Sistema hauek aurrez itzulita dauden testuak behar dituzte, adibideetan oinarritzen baitira. Nolabait esateko, sistema hauek entrenatu egiten dira. Testu zatiak eta probabilitateak gordetzen dituzte, informazioa jasotzen dute. Itzulpen berri bat egin behar dutenean, informazio horretara jo eta emaitza bat ekoizten dute, adierazi du Cortesek.

Sortu berri duten Modela sistema ere entrenatu egiten da, baina beste modu batera: ez du testu edo itzulpen zatirik gordetzen; funtzio matematikoen segida bat sortzen du, sare neuronal bat. Cortesek azaldu duenez, euskarak ezaugarri bereziak ditu, eta morfologikoki konplexua da. Sistema berritzaile honek orain arte mugak izan zitezkeenak gainditu eta hizkuntzaren aberastasun morfologikoa modu zuzenean interpretatu eta landu dezake. Lehen ezin zen euskararen eta gazteleraren itzulpen automatikoa ia inon modu zuzenean aplikatu, orain, ordea, aukera berriak zabaltzen zaizkigu.

Baliabide berri bat
Cortesen arabera, adimen artifiziala eta sare neuronalak ez dira itzulpengintzan soilik aplikatzen; beste esparru batzuetan ere baliatzen dira teknika hauek, esate baterako, irudien errekonozimenduan edo testuen polaritatea identifikatzeko, eta orokorrean, hizkuntza naturalaren prozesamenduan. Dena den, Cortesen iritziz, oraindik ez da posible itzultzaile automatiko batek hezur-haragizko itzultzaile bat ordezkatzea. Ikusi dugu lortzen ari garen itzultzaile automatikoak hobetzen ari direla, baina oraindik ezin ditu itzultzaile batek betetzen dituen lanak bete, azaldu du.

Akatsak akats, oso deskribatzaileak diren testuak oso ondo itzultzen ditu sistema automatikoak, baina, esate baterako, leloak, metaforak eta abar itzultzeko oraindik ez du balio. Cortesek uste du itzultzaile profesionalen lana eraldatzen joango dela, teknologiaren garapenak hala eskatzen baitu, baina orain arte gertatu den bezala; etengabe egokitu behar izan dute.

Itzultzaile automatikoa baliabide bat dela azpimarratu du, ekarpen bat, hiztegia izan daitekeen bezala. Sortzen ditugun itzulpengintzarako sistemak aurretik sortutako eta itzulitako testuetan oinarritzen dira. Kalitatezko testuak badira, itzultzaileak ere kalitatezkoak izango dira. Beraz, kalitatezko sistemak sortzen jarraitu ahal izateko, itzulitako testuak kalitatezkoak izatea behar dugu, eta itzultzaile profesionalak ezinbestekoak dira horretarako, teknologia hauetan sakontzen jarraitu ahal izateko.

KARKARAk zu bezalako irakurleen babesa behar du aurrera egiteko. Orain arte bezala, kalitatezko eduki libreak eskaini nahi dizkizugu. Euskaraz informatzea da gure eginkizuna, eta zure eskubidea. Izan zaitez KARKARAko laguntzaile, urtean 40 euro besterik ez dira!


Izan zaitez KARKARAko laguntzaile!