MODENA: Modelado Neuronal Avanzado para Traducción Automática de Alta Calidad

QUIENES SOMOS

ACTIVIDADES

PROYECTOS

EMPRESAS DEL GRUPO

INGENIERÍA DE SOFTWARE

PRENSA Y PUBLICACIONES

COMUNICACIÓN - ARTES GRÁFICAS

Proyectos de investigación

PLN: Programas para el procesamiento del lenguaje natural

TRANSPAR: Transparence. Sistema de reusabilidad y de desarrollo de software multiplataforma

IROM: Indexación y recuperación oracional multilingüe de texto libre

PLNGI: Procesamiento del lenguaje natural aplicado a la gestión de la información

PLNEE: Procesamiento del lenguaje natural aplicado al entorno empresarial

TLA: Técnicas lingüísticas avanzadas

LABUR: Sumarización multireferencia y multilingüe

GALDE: Sistema de búsqueda de respuestas para euskera y español

TEIS: Seguimiento de la implantación terminológica a través de Internet

JAZO: Detección y seguimiento de sucesos para euskera y español

ITZUL: Extracción de información lingüística a partir de traducciones multilingües

CORLIS: Información lingüística y terminológica a partir de corpus

CORLAN: Información lingüística, terminológica y sintáctica a partir de corpus

CORSIN: Optimización y mejoras en el análisis morfo-sintáctico e implementación en herramientas de explotación

ARSIN: Transición hacia un análisis sintáctico robusto y creación de árboles sintácticos

AUSIN: Optimización del análisis morfo-sintáctico a través de técnicas de aprendizaje automático

PROTRAD: Propuestas avanzadas de traducción

TRADI: Mejoras inteligentes en las propuestas avanzadas de traducción

KALITRAD: Investigación de la calidad de las traducciones

MODELA: Modelado Estadístico y Deep Learning para Traducción Automática de Alta Calidad

PROPOST: Propuestas avanzadas de traducción

QUALES: Aprendizaje Automático mediante Supervisión Modulable para la Estimación Automática de la Calidad de Traducción

TECPOST: Tecnologías avanzadas para la PostEdición de traducciones

MODENA: Modelado Neuronal Avanzado para Traducción Automática de Alta Calidad

SUBTRAD: Subsegmentos pretraducidos para facilitar la traducción

MINTZAI: Sistemas de Aprendizaje Profundo E2E para Traducción Automática del Habla

TANDO: Métodos y Sistemas de Traducción Automática Neuronal Coherente

Proyectos de desarrollo en el ámbito lingüístico

Proyectos de desarrollo en el ámbito del transporte de mercancías

Colaboraciones con otros centros tecnológicos

MODENA: Modelado Neuronal Avanzado para Traducción Automática de Alta Calidad

Años de actividad: 2018 - 2019

Objetivos:

A través de MODENA se plantea un proyecto de investigación orientado a afrontar los desafíos descritos y contribuir a la consolidación del posicionamiento de Euskadi como punto de referencia en materia de tecnologías lingüísticas. El objeto principal del proyecto es el siguiente:

Investigación, desarrollo y validación de sistemas de traducción automática de alta calidad mediante arquitecturas y procesos basados en aprendizaje profundo y redes neuronales artificiales

El objeto principal del proyecto se descompone en los siguientes objetivos científico-tecnológicos:

Investigación y desarrollo de arquitecturas y algoritmos de traducción neuronal para la mejora significativa de la calidad de traducción y la preservación de información.

Investigación y desarrollo de métodos de modelado y explotación de datos para la mejora de la calidad de las traducciones automáticas.

Creación de sistemas de traducción automática neuronal avanzados de alta calidad genéricos y adaptados a dominios específicos.

Creación y preparación de conjuntos de datos para la traducción genérica euskera-castellano y la traducción castellano-inglés en el dominio de la salud.

Evaluación automática y humana de los sistemas desarrollados.

Asimismo, se han definido los siguientes objetivos de alcance e impacto:

Definición de un caso piloto de sistema genérico para el par euskera-castellano y adaptado al dominio de la salud para el par castellano-inglés

Validación de los prototipos en relación al estado del arte en cuanto a adaptabilidad y precisión de los sistemas de traducción automática neuronal avanzados.

Difusión académica de los resultados del proyecto en conferencias internacionales.

Transferencia de resultados a la industria y análisis de las posibilidades de explotación comercial.

De cara a la consecución de estos objetivos, MODENA cuenta con un consorcio potente y con gran experiencia en el ámbito de las tecnologías lingüísticas que aspira a convertirse en un punto de referencia en la materia. Se trata de un proyecto de carácter estratégico para todas las entidades participantes y para Eiken, MondragonLingua, Eleka, Argia y EITB.

Web del proyecto MODENA

Proyecto financiado parcialmente por el Gobierno Vasco y fondos FEDER
a través de la convocatoria de ayudas ELKARTEK de SPRI