AMETRA: Itzulpenari laguntza, itzulpen memorietan oinarrituta

NOR GAREN

JARDUERA

PROIEKTUAK

TALDEKO ENPRESAK

SOFTWARE INGENIARITZA

PRENTSA ETA ARGITALPENAK

KOMUNIKAZIOA - GRAFIKAGINTZA

Ikerketa proiektuak

Beste zentru teknologikoekiko lankidetza

KAPSULA 2000: Eduki dokumentalen eskuratzea, lengoaia naturalean oinarrituta

ACOTE: Itzulpenari laguntza, hizkuntz teknikekin uztartuta

AMETRA: Itzulpenari laguntza, itzulpen memorietan oinarrituta

JAZOHARI: Informazioaren eta erantzunen erauzketa, gertakariei zuzenduta

MULCOR: Adquisición de conocimiento multilingüe a partir de corpus.

DICCICOR: Diccionarios combinatorios y de frecuencias basados en corpus.

OLITE: Ordenagailuz Lagundutako Itzulpen Tresna Eleaniztuna.

AMETRA: Itzulpenari laguntza, itzulpen memorietan oinarrituta

Proiektu honetako zentru teknologikoak:

EHUko Zientzia Fakultatea (Bilbo)
Institut Tecnològic d’Informàtica de Valencia

Jarduera urteak: 2002-2004

Xedea eta emaitzak:

AMETRA proiektua itzulpen memorietako sistemen eremuan kokatzen da, eta bere xedea Ordenadorez Lagundutako Itzulpen erraminta sortzea da, funts desberdinetako teknikak uztartuz: itzulpen memoriak, hizkuntz azterketa eta metodo estatistikoak.

ACOTE proiektuaren berezko jarraipena da, eta hark bezala, honek ere euskara eta gaztelania hartzen ditu aintzat; aplikazio esparrua, berriz, administrazio itzulpenena da (buletin ofizialak, lege agiriak, e.a.).

Itzulpenari laguntzeko tresna ia guztiek (Trados, WordFast...), itzulpen memorietan pilatutako esaldiekiko alderaketak egiten dituzte, eta horretarako logika lausoan oinarritutako teknikak erabiltzen dituzte. Azken aldian, badira esaldiaren zatikatzea lortzearren oso azaleko hizkuntz azterketa erabiltzen hasi direnak (DéjàVu).

Praktikan, itzulpen memorietako esaldiekiko antzekotasuna ez da gertatzen begiz jota dirudien bezain handia. Horrek asko mugatzen du tresna tradizionalen eragingarritasuna.

Proiektu honetako partaideen aurretikako esperientziatik abiatuta, elkarrekin lanean jarri dira teknika linguistikoak eta metodo estatistikoak, itzulpen berriak egiteko orduan aurretik itzuliak dauden esaldien arteko antzekotasuna maila eta modu desberdinetan baliatu ahal izateko. Honako teknikak garatu dira:

HIZKUNTZ AZTERKETA

Lematizazioa eta azterketa morfosintaktikoa.
Segmentazioa eta corpus elebidunen lerrokatzea.
Hitz berrien sintesia.
Digituen, izen propioen eta siglen identifikazioa.

EREDU ESTATISTIKOAK

Hitzen lerrokatze estatistikoetan oinarritutako segmentazio elebiduna.
Hitzen lerrokatze estatistikoa hobetzearren hizkuntz informazioa bereganatzea.
Segmentu laburren itzulpen estatistikorako software eraginkorra garatzea.
Eremu murritzeko testuetarako itzulpen estatistiko hutsa.

ITZULPEN MEMORIAK

Esaldien, segmentuen eta hitzen indexazioa, baliokidetzak barne.
Segmentuen eta segmentu multzoen errepikakortasunean oinarritutako berreskuratzea.

ERA BEREAN, ONDOKO LANABES OSAGARRIAK ERE GARATU DIRA

Baliokidetza sistematikoen glosarioak (terminologikoak, berreskurapenekoak, itzulpenerakoak).
Konkordantzien bistaratzailea.
Base guztiak (itzulpen memoriak, glosarioak), egindako itzulpen berriez ostera elikatzea.

Erabilitako teknika guztiak erraminta bakarrean uztartuta eta elkarrekin lanean jartzeak giza itzultzailearentzat aurrerapen nabarmena dakar.

Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Sailak zatiz finantziatutako proiektua