TECPOST: Tecnologías avanzadas para la PostEdición de traducciones
Años
de actividad: 2018 - 2019
Objetivos:
El proyecto TECPOST tiene como objetivo el desarrollo de las tecnologías necesarias para agilizar la traducción de textos, basándose en el control y la optimización del proceso de post-edición que realiza el traductor.
El trabajo se centra en dos funcionalidades claves, por un lado, mejorando las propuestas de traducción presentadas al traductor, acorde con sus necesidades, teniendo en cuenta el dominio de los textos, los contenidos previamente traducidos y los idiomas en los que está trabajando. De esta forma el traductor encontrará como primera propuesta de traducción la que debería ser la mejor propuesta disponible, y podrá generar la traducción final de manera rápida y efectiva.
Por otro lado, registrando las acciones realizadas por los traductores y correctores durante la post-edición e investigando metodologías actuales que permitan extraer información relevante para realizar mejoras de todo el proceso. El análisis de la información recogida debería permitir la localización de patrones de mejora que aplicar a las propuestas automáticas de traducción.
El objetivo del proyecto es crear un sistema para lograr minimizar las correcciones que deben hacerse a las propuestas de traducción. Buscamos la eficiencia a la hora de realizar estos trabajos, así que nuestra función consistirá en crear propuestas cada vez mejores de forma automática, partiendo de los resultados obtenidos en los proyectos TrADI2015 y PROTRAD2014. Además, se medirá la calidad de los nuevos resultados utilizando las métricas que se han desarrollado en el proyecto KALITRAD2016.
Aunque se han hecho avances en la traducción automática, como el prototipo presentado en el proyecto MODELA2016 , sigue siendo un área de investigación viva y en constante cambio tanto en las técnicas de traducción automática como en la apertura de nuevos enfoques o áreas debido a que los resultados de los sistemas automáticos han de ser revisados y corregidos por los traductores. En este proyecto se analizarán las ventajas e inconvenientes que suponen utilizar la traducción automática de alta calidad como base de trabajo en las propuestas de traducción mejoradas lingüísticamente.
En el transcurso de este proyecto obtendremos nuevas propuestas lingüísticas que compararemos con las traducciones previas hechas con diferentes herramientas, para evaluar el grado de mejora obtenido con la aplicación de las nuevas técnicas.
Este proyecto se puede considerar una ampliación de las investigaciones realizadas en los proyectos ya citados KALITRAD2016, TrADI2015 y PROTRAD2014. Todos estos proyectos tienen en común la necesidad de investigar mejoras que resuelvan las carencias detectadas en las herramientas de traducción asistida por ordenador (TAO) y en concreto en OLITE , ante los nuevos paradigmas de la traducción: la traducción automática y la post-edición de textos traducidos (o no) de forma automática. Esto ha generado la necesidad de corregir o post-editar textos donde antes el trabajo consistía en que la persona traductora debía crear un texto en el idioma destino partiendo desde cero, lo que también ha influido en el perfil de los traductores.
El prototipo de OLITE nos sirve como base de nuestra investigación pues dispone de unas características altamente avanzadas e inteligentes, poniendo en valor el conocimiento y la experiencia que tenemos en el procesamiento del lenguaje natural, en las que se combinan técnicas de Memorias de Traducción, Análisis Lingüístico, Métodos Estadísticos y Sistemas de Traducción Automática.
En cuanto a las nuevas propuestas generadas para visualizarlas en OLITE, se aprovechará el conocimiento lingüístico para mejorar las propuestas de traducción, mezclando de forma efectiva las tecnologías lingüística y estadística y se mejorará el posicionamiento de subsegmentos en las propuestas de traducción. La correcta alineación de los subsegmentos del texto generado en las propuestas es una tarea de alta complejidad, en especial entre lenguas con construcciones gramaticales tan lejanas como el euskera y el español.
El objetivo del estudio y los métodos investigados deberían servir para cualquier par de lenguas de las que se dispongan traducciones y conozcamos en profundidad. Para este proyecto se emplearán fundamentalmente el español y el euskera, por nuestro conocimiento lingüístico previo y por la disponibilidad de recursos específicos y generadores de propuestas. Entendemos que las peculiaridades planteadas por estas dos lenguas pueden sentar las bases de tratamiento necesarias para cualquier otro par de lenguas occidentales, con sus matices.
|