AMETRA:
Itzulpenari laguntza, itzulpen memorietan oinarrituta
Proiektu honetako zentru teknologikoak:
- EHUko Zientzia Fakultatea (Bilbo)
- Institut
Tecnològic d’Informàtica de Valencia
Jarduera
urteak:
2002-2004
Xedea
eta emaitzak:
AMETRA proiektua itzulpen memorietako sistemen eremuan kokatzen da, eta bere xedea Ordenadorez Lagundutako Itzulpen erraminta sortzea da, funts desberdinetako teknikak uztartuz: itzulpen memoriak, hizkuntz azterketa eta metodo estatistikoak.
ACOTE proiektuaren berezko jarraipena da, eta hark bezala, honek ere euskara eta gaztelania hartzen ditu aintzat; aplikazio esparrua, berriz, administrazio itzulpenena da (buletin ofizialak, lege agiriak, e.a.).
Itzulpenari laguntzeko tresna ia guztiek (Trados, WordFast...), itzulpen memorietan pilatutako esaldiekiko alderaketak egiten dituzte, eta horretarako logika lausoan oinarritutako teknikak erabiltzen dituzte. Azken aldian, badira
esaldiaren zatikatzea lortzearren oso azaleko hizkuntz azterketa erabiltzen hasi direnak (DéjàVu).
Praktikan, itzulpen memorietako esaldiekiko antzekotasuna ez da gertatzen begiz jota dirudien bezain handia. Horrek asko mugatzen du tresna tradizionalen eragingarritasuna.
Proiektu honetako partaideen aurretikako esperientziatik abiatuta, elkarrekin lanean jarri dira teknika linguistikoak eta metodo estatistikoak, itzulpen berriak egiteko orduan aurretik itzuliak dauden esaldien arteko antzekotasuna maila eta modu desberdinetan baliatu ahal izateko. Honako teknikak garatu dira:
HIZKUNTZ
AZTERKETA
- Lematizazioa
eta azterketa morfosintaktikoa.
- Segmentazioa
eta corpus elebidunen lerrokatzea.
- Hitz berrien
sintesia.
- Digituen, izen propioen
eta siglen identifikazioa.
EREDU
ESTATISTIKOAK
- Hitzen lerrokatze estatistikoetan
oinarritutako segmentazio elebiduna.
- Hitzen lerrokatze estatistikoa hobetzearren
hizkuntz informazioa bereganatzea.
- Segmentu laburren itzulpen
estatistikorako software eraginkorra garatzea.
- Eremu murritzeko testuetarako itzulpen
estatistiko hutsa.
ITZULPEN
MEMORIAK
- Esaldien, segmentuen eta hitzen
indexazioa, baliokidetzak barne.
- Segmentuen eta segmentu multzoen
errepikakortasunean oinarritutako berreskuratzea.
ERA BEREAN,
ONDOKO LANABES OSAGARRIAK ERE GARATU DIRA
- Baliokidetza sistematikoen glosarioak (terminologikoak, berreskurapenekoak, itzulpenerakoak).
- Konkordantzien bistaratzailea.
- Base guztiak (itzulpen memoriak,
glosarioak), egindako itzulpen berriez ostera elikatzea.
Erabilitako teknika guztiak erraminta bakarrean
uztartuta eta elkarrekin lanean jartzeak giza itzultzailearentzat aurrerapen nabarmena dakar.
|