QUIENES SOMOS
 
ACTIVIDADES
 
PROYECTOS
 
EMPRESAS DEL GRUPO
 
 
 

 
Proyectos de investigación
 
PLN: Programas para el procesamiento del lenguaje natural
 
TRANSPAR: Transparence. Sistema de reusabilidad y de desarrollo de software multiplataforma
 
IROM: Indexación y recuperación oracional multilingüe de texto libre
 
PLNGI: Procesamiento del lenguaje natural aplicado a la gestión de la información
 
PLNEE: Procesamiento del lenguaje natural aplicado al entorno empresarial
 
TLA: Técnicas lingüísticas avanzadas
 
decLABUR: Sumarización multireferencia y multilingüe
 
decGALDE: Sistema de búsqueda de respuestas para euskera y español
 
decTEIS: Seguimiento de la implantación terminológica a través de Internet
 
decJAZO: Detección y seguimiento de sucesos para euskera y español
 
decITZUL: Extracción de información lingüística a partir de traducciones multilingües
 
decCORLIS: Información lingüística y terminológica a partir de corpus
 
decCORLAN: Información lingüística, terminológica y sintáctica a partir de corpus
 
decCORSIN: Optimización y mejoras en el análisis morfo-sintáctico e implementación en herramientas de explotación
 
decARSIN: Transición hacia un análisis sintáctico robusto y creación de árboles sintácticos
 
decAUSIN: Optimización del análisis morfo-sintáctico a través de técnicas de aprendizaje automático
 
decPROTRAD: Propuestas avanzadas de traducción
 
decTRADI: Mejoras inteligentes en las propuestas avanzadas de traducción
Proyectos de desarrollo en el ámbito lingüístico
Proyectos de desarrollo en el ámbito del transporte de mercancías
Colaboraciones con otros centros tecnológicos

MODENA: Modelado Neuronal Avanzado para Traducción Automática de Alta Calidad

Años de actividad: 2018 - 2019

Objetivos:

A través de MODENA se plantea un proyecto de investigación orientado a afrontar los desafíos descritos anteriormente y contribuir a la consolidación del posicionamiento de Euskadi como punto de referencia en materia de tecnologías lingüísticas. El objeto principal del proyecto es el siguiente:

Investigación, desarrollo y validación de sistemas de traducción automática de alta calidad mediante arquitecturas y procesos basados en aprendizaje profundo y redes neuronales artificiales

El objeto principal del proyecto se descompone en los siguientes objetivos científico-tecnológicos:

  1. Investigación y desarrollo de arquitecturas y algoritmos de traducción neuronal para la mejora significativa de la calidad de traducción y la preservación de información.
  2. Investigación y desarrollo de métodos de modelado y explotación de datos para la mejora de la calidad de las traducciones automáticas.
  3. Creación de sistemas de traducción automática neuronal avanzados de alta calidad genéricos y adaptados a dominios específicos.
  4. Creación y preparación de conjuntos de datos para la traducción genérica euskera-castellano y la traducción castellano-inglés en el dominio de la salud.
  5. Evaluación automática y humana de los sistemas desarrollados.

Asimismo, se han definido los siguientes objetivos de alcance e impacto:

  1. Definición de un caso piloto de sistema genérico para el par euskera-castellano y adaptado al dominio de la salud para el par castellano-inglés
  2. Validación de los prototipos en relación al estado del arte en cuanto a adaptabilidad y precisión de los sistemas de traducción automática neuronal avanzados.
  3. Difusión académica de los resultados del proyecto en conferencias internacionales.
  4. Transferencia de resultados a la industria y análisis de las posibilidades de explotación comercial.

De cara a la consecución de estos objetivos, MODENA cuenta con un consorcio potente y con gran experiencia en el ámbito de las tecnologías lingüísticas que aspira a convertirse en un punto de referencia en la materia. Se trata de un proyecto de carácter estratégico para todas las entidades participantes y para Eiken, MondragonLingua, Eleka, Argia y EITB.

Web del proyecto MODENA

Proyecto financiado parcialmente por la Diputación Foral de Gipuzkoa - Gipuzkoako Foru Aldundia