Un algoritmo para la extracción de rasgos morfológicos a partir de descriptores
En este trabajo se propone un algoritmo para la alimentación de un diccionario español a partir de un conjunto de términos para la indización de documentos (descriptores) organizados en un tesauro. Se establecen e implementan heurísticas basadas en la estructura sintáctica de los descriptores y en l...
Saved in:
| Main Author: | |
|---|---|
| Format: | report |
| Language: | Spanish |
| Published: |
1996
|
| Subjects: | |
| Online Access: | http://hdl.handle.net/20.500.12008/3491 |
| Tags: |
No Tags, Be the first to tag this record!
|
| Summary: | En este trabajo se propone un algoritmo para la alimentación de un diccionario español a partir de un conjunto de términos para la indización de documentos (descriptores) organizados en un tesauro. Se establecen e implementan heurísticas basadas en la estructura sintáctica de los descriptores y en la forma de las palabras que permiten deducir los siguientes rasgos morfológicos: categoría gramatical (sustantivo, adjetivo), número, género y formas flexionadas. Se utilizan como fuente de datos un tesauro y un diccionario de palabras "vacías" (conjunto base) tales como preposiciones, artículos, etc. |
|---|