NOR GAREN
 
JARDUERA
 
PROIEKTUAK
 
TALDEKO ENPRESAK
 
 
 

 
Ikerketa proiektuak
Beste zentru teknologikoekiko lankidetza
KAPSULA 2000: Eduki dokumentalen eskuratzea, lengoaia naturalean oinarrituta
 
ACOTE: Itzulpenari laguntza, hizkuntz teknikekin uztartuta
 
AMETRA: Itzulpenari laguntza, itzulpen memorietan oinarrituta
 
JAZOHARI: Informazioaren eta erantzunen erauzketa, gertakariei zuzenduta
 
MULCOR: Adquisición de conocimiento multilingüe a partir de corpus.
 
DICCICOR: Diccionarios combinatorios y de frecuencias basados en corpus.
 
OLITE: Ordenagailuz Lagundutako Itzulpen Tresna Eleaniztuna.

AMETRA: Itzulpenari laguntza, itzulpen memorietan oinarrituta

Proiektu honetako zentru teknologikoak:

  • EHUko Zientzia Fakultatea (Bilbo)
  • Institut Tecnològic d’Informàtica de Valencia

Jarduera urteak: 2002-2004

Xedea eta emaitzak:

AMETRA proiektua itzulpen memorietako sistemen eremuan kokatzen da, eta bere xedea Ordenadorez Lagundutako Itzulpen erraminta sortzea da, funts desberdinetako teknikak uztartuz: itzulpen memoriak, hizkuntz azterketa eta metodo estatistikoak.

ACOTE proiektuaren berezko jarraipena da, eta hark bezala, honek ere euskara eta gaztelania hartzen ditu aintzat; aplikazio esparrua, berriz, administrazio itzulpenena da (buletin ofizialak, lege agiriak, e.a.).

Itzulpenari laguntzeko tresna ia guztiek (Trados, WordFast...), itzulpen memorietan pilatutako esaldiekiko alderaketak egiten dituzte, eta horretarako logika lausoan oinarritutako teknikak erabiltzen dituzte. Azken aldian, badira esaldiaren zatikatzea lortzearren oso azaleko hizkuntz azterketa erabiltzen hasi direnak (DéjàVu).

Praktikan, itzulpen memorietako esaldiekiko antzekotasuna ez da gertatzen begiz jota dirudien bezain handia. Horrek asko mugatzen du tresna tradizionalen eragingarritasuna.

Proiektu honetako partaideen aurretikako esperientziatik abiatuta, elkarrekin lanean jarri dira teknika linguistikoak eta metodo estatistikoak, itzulpen berriak egiteko orduan aurretik itzuliak dauden esaldien arteko antzekotasuna maila eta modu desberdinetan baliatu ahal izateko. Honako teknikak garatu dira:

HIZKUNTZ AZTERKETA

  • Lematizazioa eta azterketa morfosintaktikoa.
  • Segmentazioa eta corpus elebidunen lerrokatzea.
  • Hitz berrien sintesia.
  • Digituen, izen propioen eta siglen identifikazioa.

EREDU ESTATISTIKOAK

  • Hitzen lerrokatze estatistikoetan oinarritutako segmentazio elebiduna.
  • Hitzen lerrokatze estatistikoa hobetzearren hizkuntz informazioa bereganatzea.
  • Segmentu laburren itzulpen estatistikorako software eraginkorra garatzea.
  • Eremu murritzeko testuetarako itzulpen estatistiko hutsa.

ITZULPEN MEMORIAK

  • Esaldien, segmentuen eta hitzen indexazioa, baliokidetzak barne.
  • Segmentuen eta segmentu multzoen errepikakortasunean oinarritutako berreskuratzea.

ERA BEREAN, ONDOKO LANABES OSAGARRIAK ERE GARATU DIRA

  • Baliokidetza sistematikoen glosarioak (terminologikoak, berreskurapenekoak, itzulpenerakoak).
  • Konkordantzien bistaratzailea.
  • Base guztiak (itzulpen memoriak, glosarioak), egindako itzulpen berriez ostera elikatzea.

Erabilitako teknika guztiak erraminta bakarrean uztartuta eta elkarrekin lanean jartzeak giza itzultzailearentzat aurrerapen nabarmena dakar.

Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Sailak zatiz finantziatutako proiektua