CORLIS: Información lingüística y terminológica a partir de corpus
Años
de actividad: 2009 - 2010
Objetivos:
- El objetivo del presente Plan de Especialización es profundizar en el conocimiento de la Lingüística de Corpus, así como lograr un desarrollo innovador en las tecnologías relacionadas con dicha disciplina.
- La tarea investigadora se divide en tres apartados:
- Extracción de información léxica compleja
- Extracción de terminología
- Sistema de frecuencias lingüísticas
-
El apartado de Extracción de información léxica compleja, supone una continuación del trabajo iniciado en el Plan de Especialización anterior y pretende lograr una identificación más extensa y eficaz de las unidades léxicas de más de una palabra.
-
En la fase dedicada a la Extracción terminológica, se busca la obtención automática de palabras o grupos de palabras susceptibles de ser consideradas como términos específicos de un subcorpus concreto. La principal diferencia respecto al anterior apartado estriba en que se trabaja con corpus monolingües.
-
Por último, en el Sistema de frecuencias lingüísticas, el objetivo es la obtención, a partir de corpus, de una estructura interrelacionada de alrededor de una decena de indicadores o variables, tanto formales como léxicos. Si bien sus aplicaciones son múltiples, últimamente las más notables han sido en el campo de la Neurolingüística.
|