MULCOR:
Adquisición de conocimiento multilingüe a partir de corpus.
En este proyecto participan tres empresas
además del centro tecnológico.
Años
de actividad:
2009-2010
Objetivos:
El proyecto MULCOR tiene por objeto crear una plataforma para la adquisición automática de conocimiento a partir de corpus multilingüe. Dicha plataforma permitirá la síntesis no-asistida de diferentes tipos de bases de conocimiento, tomando como origen de los datos diversas fuentes de información.
Los tipos de bases de conocimiento que se generarán son:
-
Ontologías para el intercambio computerizado de contenidos (Web Semántica).
-
Repositorios y síntesis de material de ayuda a la enseñanza, tanto presencial como virtual (e-learning).
-
Creación de diccionarios y lexicones bilingües basados en traducciones previas.
-
Reutilización de traducciones ya realizadas para la ayuda de nuevas traducciones.
Las fuentes de datos que se utilizarán serán:
-
Memorias bilingües de traducción.
-
Corpus multilingüe y alineado de traducciones.
-
Corpus multilingüe paralelo (no-alineado) de contenido enciclopédico.
Todos los desarrollos del proyecto se realizarán con textos redactados en cuatro lenguas: inglés, francés, castellano y euskera.
|