NOR GAREN
 
JARDUERA
 
PROIEKTUAK
 
TALDEKO ENPRESAK
 
 
 

 
Ikerketa proiektuak
 
PLN: Lengoaia naturalaren prozesaketarako egitasmoak
 
TRANSPAR: Plataforma anitzeko software garapenerako eta berrerabilgarritasunerako sistema
 
IROM: Esaldien araberako indexatze eta berreskuratze eleanitza
 
PLNGI: Informazioaren kudeatzeari zuzendutako lengoaia naturalaren prozesaketa
 
PLNEE: Enpresa inguruneari zuzendutako lengoaia naturalaren prozesaketa
 
TLA: Hizkuntz teknika aurreratuak
 
LABUR - Erreferentzia eta hizkuntza anitzetako sumarizazioa
 
GALDE - Erantzunak bilatzeko sistema, euskara eta gaztelaniarentzat.
 
TEIS - Terminologi txertatzearen jarraipena Internet bitartez.
 
JAZO - Gertakarien detekzioa eta jarraipena, euskara eta gaztelaniarentzat.
 
decITZUL: Itzulpen eleanitzetan oinarritutako informazio liguistikoaren erauzketa
 
decCORLIS: Información lingüística y terminológica a partir de corpus
 
decCORLAN: Información lingüística, terminológica y sintáctica a partir de corpus
 
decCORSIN: Optimización y mejoras en el análisis morfo-sintáctico e implementación en herramientas de explotación
 
decARSIN: Transición hacia un análisis sintáctico robusto y creación de árboles sintácticos
 
decAUSIN: Optimización del análisis morfo-sintáctico a través de técnicas de aprendizaje automático
 
decPROTRAD: Propuestas avanzadas de traducción
 
decTRADI: Mejoras inteligentes en las propuestas avanzadas de traducción
Beste zentru teknologikoekiko lankidetza

CORLIS: Información lingüística y terminológica a partir de corpus

Años de actividad: 2009 - 2010

Objetivos:

  • El objetivo del presente Plan de Especialización es profundizar en el conocimiento de la Lingüística de Corpus, así como lograr un desarrollo innovador en las tecnologí­as relacionadas con dicha disciplina.
  • La tarea investigadora se divide en tres apartados:
    • Extracción de información léxica compleja
    • Extracción de terminología
    • Sistema de frecuencias lingüísticas
  • El apartado de Extracción de información léxica compleja, supone una continuación del trabajo iniciado en el Plan de Especialización anterior y pretende lograr una identificación más extensa y eficaz de las unidades léxicas de más de una palabra.
  • En la fase dedicada a la Extracción terminológica, se busca la obtención automática de palabras o grupos de palabras susceptibles de ser consideradas como términos específicos de un subcorpus concreto. La principal diferencia respecto al anterior apartado estriba en que se trabaja con corpus monolingües.
  • Por último, en el Sistema de frecuencias lingüísticas, el objetivo es la obtención, a partir de corpus, de una estructura interrelacionada de alrededor de una decena de indicadores o variables, tanto formales como léxicos. Si bien sus aplicaciones son múltiples, últimamente las más notables han sido en el campo de la Neurolingüística.
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Sailak zatiz finantziatutako proiektua