KAPSULA
2000: Eduki dokumentalen eskuratzea, lengoaia naturalean oinarrituta
INTEK programaren barruan garatutako lankidetza proiektu honetan, zentru teknologikoaz gain, sei enpresak parte hartu zuten.
Jarduera urteak: 1997-2000
Xedea
eta emaitza:
KAPSULA 2000 proiektuaren xedea
eduki dokumentalak eskuratzeko lengoia naturalak aintzat hartuko zituzten
sistema automatikoak sortzea zen; horren ondorioz, hainbat euskarri eta formatu erabili
ahalko ziren, irudi gisa edota lengoaia naturaleko testu gisa.
Hainbat iturburu eta euskarritatik eskuratutako eduki dokumental horiek esportatzeko,
modu desberdinetako formatuak erabiltzen dira, hala nola kokapenak edo etiketadun eremuak
gordetzen dituzten testu soileko fitxategiak; horrela, edozein base dokumentaletan (datubaseak, orohar),
testu osoko indexazioko base dokumentaletan (full-text), merkatuko edizio eta multimedia
aplikazio estandarretan, edota hipertestuko nabigazio sistemetan integratzen ahal dira.
Hasiera batean, aintzat hartutako hizkuntza euskara izan zen, garapen honetan
erabilitako jatorrizko hizkuntza horixe baitzen, nahiz eta
gerora gaztelaniaren azterketa ere barne hartu zen, bide batez ahalmen eleanitzak bereganatuz.
|