CORLIS: Extracción de información lingüística a partir de traducciones multilingües

PROIEKTUAK

TALDEKO ENPRESAK

SOFTWARE INGENIARITZA

PRENTSA ETA ARGITALPENAK

KOMUNIKAZIOA - GRAFIKAGINTZA

Ikerketa proiektuak

PLN: Lengoaia naturalaren prozesaketarako egitasmoak

TRANSPAR: Plataforma anitzeko software garapenerako eta berrerabilgarritasunerako sistema

IROM: Esaldien araberako indexatze eta berreskuratze eleanitza

PLNGI: Informazioaren kudeatzeari zuzendutako lengoaia naturalaren prozesaketa

PLNEE: Enpresa inguruneari zuzendutako lengoaia naturalaren prozesaketa

TLA: Hizkuntz teknika aurreratuak

LABUR - Erreferentzia eta hizkuntza anitzetako sumarizazioa

GALDE - Erantzunak bilatzeko sistema, euskara eta gaztelaniarentzat.

TEIS - Terminologi txertatzearen jarraipena Internet bitartez.

JAZO - Gertakarien detekzioa eta jarraipena, euskara eta gaztelaniarentzat.

ITZUL: Itzulpen eleanitzetan oinarritutako informazio liguistikoaren erauzketa

CORLIS: Información lingüística y terminológica a partir de corpus

CORLAN: Información lingüística, terminológica y sintáctica a partir de corpus

CORSIN: Optimización y mejoras en el análisis morfo-sintáctico e implementación en herramientas de explotación

ARSIN: Transición hacia un análisis sintáctico robusto y creación de árboles sintácticos

AUSIN: Optimización del análisis morfo-sintáctico a través de técnicas de aprendizaje automático

PROTRAD: Propuestas avanzadas de traducción

TRADI: Mejoras inteligentes en las propuestas avanzadas de traducción

KALITRAD: Investigación de la calidad de las traducciones

MODELA: Modelado Estadístico y Deep Learning para Traducción Automática de Alta Calidad

PROPOST: Propuestas avanzadas de traducción

QUALES: Aprendizaje Automático mediante Supervisión Modulable para la Estimación Automática de la Calidad de Traducción

TECPOST: Tecnologías avanzadas para la PostEdición de traducciones

MODENA: Modelado Neuronal Avanzado para Traducción Automática de Alta Calidad

SUBTRAD: Subsegmentos pretraducidos para facilitar la traducción

MINTZAI: Sistemas de Aprendizaje Profundo E2E para Traducción Automática del Habla

TANDO: Métodos y Sistemas de Traducción Automática Neuronal Coherente

Beste zentru teknologikoekiko lankidetza

Proyectos de desarrollo en el ámbito del transporte de mercancías

Colaboraciones con otros centros tecnológicos

CORLIS: Información lingüística y terminológica a partir de corpus

Años de actividad: 2009 - 2010

Objetivos:

El objetivo del presente Plan de Especialización es profundizar en el conocimiento de la Lingüística de Corpus, así como lograr un desarrollo innovador en las tecnologías relacionadas con dicha disciplina.
La tarea investigadora se divide en tres apartados:
- Extracción de información léxica compleja
- Extracción de terminología
- Sistema de frecuencias lingüísticas
El apartado de Extracción de información léxica compleja, supone una continuación del trabajo iniciado en el Plan de Especialización anterior y pretende lograr una identificación más extensa y eficaz de las unidades léxicas de más de una palabra.
En la fase dedicada a la Extracción terminológica, se busca la obtención automática de palabras o grupos de palabras susceptibles de ser consideradas como términos específicos de un subcorpus concreto. La principal diferencia respecto al anterior apartado estriba en que se trabaja con corpus monolingües.
Por último, en el Sistema de frecuencias lingüísticas, el objetivo es la obtención, a partir de corpus, de una estructura interrelacionada de alrededor de una decena de indicadores o variables, tanto formales como léxicos. Si bien sus aplicaciones son múltiples, últimamente las más notables han sido en el campo de la Neurolingüística.

Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Sailak zatiz finantziatutako proiektua