KAPSULA
2000: Adquisición de contenidos documentales en lenguajes
naturales
En este proyecto
de cooperación, integrado en el programa INTEK, participaron
seis empresas, además del centro tecnológico.
Años
de actividad: 1997-2000
Objetivos
y resultados:
El proyecto
KAPSULA 2000, definido como un proyecto para la adquisición
de contenidos documentales en lenguajes naturales, tenía
como objetivo la creación de sistemas automáticos
que permitieran la captura de contenidos documentales, desde diversos
tipos de soportes y formatos, de información tanto gráfica
como textual en lenguaje natural.
Los contenidos documentales capturados desde una diversidad de soportes
fuente y formatos se exportan tanto en ficheros planos posicionales
como en ficheros planos de identificación de campos por etiquetas
o en ficheros de texto, para que puedan ser incorporados a bases
documentales orgánicas cualesquiera (bases de datos en general),
a bases documentales de indexación de todo el texto (full-text),
a productos de edición y multimedia estándar del mercado
o a sistemas de navegación hipertexto.
Inicialmente, el lenguaje natural tratado era el euskera, dado que
es el idioma nativo de la herramienta de análisis empleada
en este desarrollo, aunque también se soporta el análisis
del castellano, adquiriendo capacidades multilingües.
|