Análisis de superficie basado en puntuación

A pesar que los símbolos de puntuación son fundamentales en la estructuración del texto, casi ninguna herramienta informática de análisis textual los aprovecha. Varios estudios confirrman la importancia de su tratamiento en el idioma inglés; sin embargo, para el idioma español, es prácticamente inex...

Descripció completa

Guardat en:
Dades bibliogràfiques
Autor principal: Garat Baridon, Diego (author)
Format: masterThesis
Idioma:espanyol
Publicat: 2006
Matèries:
Accés en línia:http://hdl.handle.net/20.500.12008/2940
Etiquetes: Afegir etiqueta
Sense etiquetes, Sigues el primer a etiquetar aquest registre!
_version_ 1868890081453932544
author Garat Baridon, Diego
author_browse Garat Baridon, Diego
author_facet Garat Baridon, Diego
author_role author
collection COLIBRI
dc.creator.none.fl_str_mv Garat Baridon, Diego
dc.date.none.fl_str_mv 2006
2014-11-24T22:36:03Z
2014-11-24T22:36:03Z
20141202
dc.format.none.fl_str_mv 126 p.
application/pdf
dc.identifier.none.fl_str_mv GARAT BARIDON, D. "Análisis de superficie basado en puntuación". Tesis de maestría, Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación – PEDECIBA, 2006.
http://hdl.handle.net/20.500.12008/2940
dc.language.none.fl_str_mv es
spa
dc.publisher.none.fl_str_mv UR. FI-INCO,
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)
dc.source.none.fl_str_mv reponame:COLIBRI
instname:Universidad de la República
instacron:Universidad de la República
dc.subject.none.fl_str_mv PUNTUACION
ANALISIS SINTACTICO DE SUPEFICIE
APRENDIZAJE AUTOMATICO
COMBINACION DE METODOS SIMBOLICOS Y ESTADISTICOS
dc.title.none.fl_str_mv Análisis de superficie basado en puntuación
dc.type.none.fl_str_mv Tesis de maestría
info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/acceptedVersion
description A pesar que los símbolos de puntuación son fundamentales en la estructuración del texto, casi ninguna herramienta informática de análisis textual los aprovecha. Varios estudios confirrman la importancia de su tratamiento en el idioma inglés; sin embargo, para el idioma español, es prácticamente inexistente la investigación sobre este tema dentro de la lingüística computacional. El presente trabajo estudia el uso de la puntuación para el análisis de superficie de textos en español, y, como caso particular, se centra en la coma, por ser este el signo que presenta la mayor variedad de usos en la estructuración de texto. Con tal fin, se construye una categorización de las funciones de la coma que se adapte al procesamiento automático. Esto se realiza a partir del estudio de distintas clasificaciones existentes, pero corroborándola contra un corpus de textos periodísticos en español. Finalmente, se construye un analizador sintáctico de superficie combinando métodos estadísticos y simbólicos. Por un lado, se obtiene un evaluador de la función de las comas a través de técnicas de aprendizaje automático. Por otro, se escriben reglas de análisis que aprovechan la clasificación realizada por el evaluador [aprendido], utilizando un formalismo de reglas de reescritura. Se concluye que el tratamiento de la puntuación en el análisis sintáctico también es útil en el español. Además, se observa que la combinación de métodos simbólicos y estadísticos puede potenciar los resultados de ambos enfoques
eu_rights_str_mv openAccess
format masterThesis
id anni_6641e5c71ae8a4a2a67fa8bdc6b59678
identifier_str_mv GARAT BARIDON, D. "Análisis de superficie basado en puntuación". Tesis de maestría, Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación – PEDECIBA, 2006.
instacron_str Universidad de la República
institution Universidad de la República
instname_str Universidad de la República
language spa
language_invalid_str_mv es
network_acronym_str anni
network_name_str oai-lr-anni
oai_identifier_str oai:colibri.udelar.edu.uy:20.500.12008/2940
publishDate 2006
publishDateSort 2006
publisher.none.fl_str_mv UR. FI-INCO,
reponame_str COLIBRI
repository.mail.fl_str_mv
repository.name.fl_str_mv
repository_id_str
rights_invalid_str_mv Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)
spelling Análisis de superficie basado en puntuaciónGarat Baridon, DiegoPUNTUACIONANALISIS SINTACTICO DE SUPEFICIEAPRENDIZAJE AUTOMATICOCOMBINACION DE METODOS SIMBOLICOS Y ESTADISTICOSA pesar que los símbolos de puntuación son fundamentales en la estructuración del texto, casi ninguna herramienta informática de análisis textual los aprovecha. Varios estudios confirrman la importancia de su tratamiento en el idioma inglés; sin embargo, para el idioma español, es prácticamente inexistente la investigación sobre este tema dentro de la lingüística computacional. El presente trabajo estudia el uso de la puntuación para el análisis de superficie de textos en español, y, como caso particular, se centra en la coma, por ser este el signo que presenta la mayor variedad de usos en la estructuración de texto. Con tal fin, se construye una categorización de las funciones de la coma que se adapte al procesamiento automático. Esto se realiza a partir del estudio de distintas clasificaciones existentes, pero corroborándola contra un corpus de textos periodísticos en español. Finalmente, se construye un analizador sintáctico de superficie combinando métodos estadísticos y simbólicos. Por un lado, se obtiene un evaluador de la función de las comas a través de técnicas de aprendizaje automático. Por otro, se escriben reglas de análisis que aprovechan la clasificación realizada por el evaluador [aprendido], utilizando un formalismo de reglas de reescritura. Se concluye que el tratamiento de la puntuación en el análisis sintáctico también es útil en el español. Además, se observa que la combinación de métodos simbólicos y estadísticos puede potenciar los resultados de ambos enfoquesUR. FI-INCO,2014-11-24T22:36:03Z2014-11-24T22:36:03Z200620141202Tesis de maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersion126 p.application/pdfGARAT BARIDON, D. "Análisis de superficie basado en puntuación". Tesis de maestría, Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación – PEDECIBA, 2006.http://hdl.handle.net/20.500.12008/2940reponame:COLIBRIinstname:Universidad de la Repúblicainstacron:Universidad de la RepúblicaesspaLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad De La República. (Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)info:eu-repo/semantics/openAccessLicencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)oai:colibri.udelar.edu.uy:20.500.12008/29402026-04-14T10:27:50Z
spellingShingle Análisis de superficie basado en puntuación
Garat Baridon, Diego
PUNTUACION
ANALISIS SINTACTICO DE SUPEFICIE
APRENDIZAJE AUTOMATICO
COMBINACION DE METODOS SIMBOLICOS Y ESTADISTICOS
status_str acceptedVersion
title Análisis de superficie basado en puntuación
title_full Análisis de superficie basado en puntuación
title_fullStr Análisis de superficie basado en puntuación
title_full_unstemmed Análisis de superficie basado en puntuación
title_short Análisis de superficie basado en puntuación
title_sort Análisis de superficie basado en puntuación
topic PUNTUACION
ANALISIS SINTACTICO DE SUPEFICIE
APRENDIZAJE AUTOMATICO
COMBINACION DE METODOS SIMBOLICOS Y ESTADISTICOS
url http://hdl.handle.net/20.500.12008/2940