"Etorkizun hurbil bat irudikatzea hizkuntza teknologietan zaila da"

Miren Garate - Gipuzkoako Hitza 2023ko mar. 11a, 11:30
Itziar Cortes. (Wikipedia)

Hilabete gutxi dira ChatGPT erabiltzeko aukera dagoenetik, baina "boom" handi bat izan dela esan du Itziar Cortesek, informatika ingeniariak eta Elhuyarreko Hizkuntza eta Teknologia unitateko koordinatzaileak. Arlo digitalean euskara erabiltzeko ohiturak sortzeko, euskarazko sistemak behar direla dio.

Elhuyarrek eta Donostia Kulturak Emakume zientzialarien argitan solasaldi zikloa antolatu dute, emakume zientzialariak ezagutarazteko. Hiru saio izango dira, eta asteartean izango da lehena: Itziar Cortes Etxabe (Zarautz, 1985) informatika ingeniari eta Elhuyarreko Hizkuntza eta Teknologia unitateko koordinatzaileak Hizkuntzak aro digitalean hitzaldia emango du. Ernest Lluch kultur etxeko areto nagusian izango da, 19:00etan. Beste bi saioak apirilaren 18an eta maiatzaren 16an izango dira, eta, hurrenez hurren, Marian Iriarte Ormazabal EHUko Kimika Fakultateko dekanoak eta Aiora Zabala Aizpuru Ekonomia Ekologikoan doktoreak parte hartuko dute.

Hizkuntzak aro digitalean hitzaldia emango duzu asteartean, eta, besteak beste, hizkuntza teknologien arloko erronkak izango dituzu hizpide. Zer landuko duzu hitzaldian?

Nire ikuspegia emango dut euskarak eta hizkuntza teknologiek gaur egungo gizartean daukaten eragin edo garrantziaz. Adibidez, aipatuko dut euskarak zergatik egon behar duen mundu digitalean. Gaur egun, euskarak indar handia du arlo horretan, baina gehiago behar du, beste hizkuntzek gain ez hartzeko.

Elhuyarreko Hezkuntza eta Teknologia alorreko koordinatzailea zara. Zuen proiekturik ezagunenetako bat itzultzaile automatikoa da (Elia.eus). Euskarak arlo digitalen dituen erronka guztien artean hura garatzea jo duzue lehentasuntzat?

Ni orain dela hamalau urte hasi nintzen Elhuyarren lanean, eta itzultzaile automatikoarekin hasi nintzen. Garai hartan ikerketan hasi nintzen, ikerketan boladan zeuden teknikak aplikatzen. Gaur egun, jada teknika horiek ez dira erabiltzen. Itzulpen automatikoak zer bide egin duen ikusi dut. Googlek itzulpen automatiko neuronala atera zuen 2016an, eta guk 2018an merkaturatu genuen gure lehen itzultzailea. Abangoardia horretan egoten saiatu gara. Itzultzaile automatikoa izan da, agian, gure produktu ikusgarriena, baina beste hainbat ere baditugu.

Zein, adibidez?

Orain dela aste batzuk aurkeztu genuen ahotsa sortzeko sistema (Etsneuronala.elhuyar.eus), sintesirakoa, eta euskaraz funtzionatzen du. Testua ahots bihurtzeko sistema bat da; hau da, beste hizkuntza teknologia bat. Aurretik ere bagenituen itzulpen automatikoko sistemak eta ahotsak sintetizatzeko sistemak, baina azken teknikak erabiltzen saiatzen gara, adimen artifizialean oinarritutakoak; horri esker, sistema askoz hobeak izatea lortzen dugu, eta, ondorioz, hobeto sartzen dira gizartera, eta gehiago erabiltzen dira.

Etorkizunera begira, zein izan daitezke lehentasunak hizkuntza teknologietan?

Etorkizun hurbil bat irudikatzea oso zaila da. 2022 amaieran, beste boom handi bat etorri zen: ChatGPT. Sare neuronaletan oinarritutako modelo batzuk dira, aurrez entrenatuak eta asko dakitenak. Elkarrizketa bat sortzeko gaitasuna dute, ulertu egin dezakete, hizkuntza horretan erantzunak sortzen dituzte, eta testuak sortu, laburtu eta aztertzeko erabiltzen dira. Jada oso ondo funtzionatzen dute hizkuntza handietan, baina, adimen artifizialeko beste sistema guztiek bezala, alborapenaren arazoa ere hor dago: generoari, arrazari eta abar lotutako alborapena sortzen da. Ezin dugu guztia sistema horien mende utzi.

Elkarrizketa osorik irakur daiteke Gipuzkoako Hitzaren atari digitalean.

KARKARAk zu bezalako irakurleen babesa behar du aurrera egiteko. Orain arte bezala, kalitatezko eduki libreak eskaini nahi dizkizugu. Euskaraz informatzea da gure eginkizuna, eta zure eskubidea. Izan zaitez KARKARAko laguntzaile, urtean 40 euro besterik ez dira!


Izan zaitez KARKARAko laguntzaile!