Análisis de superficie basado en puntuación
A pesar que los símbolos de puntuación son fundamentales en la estructuración del texto, casi ninguna herramienta informática de análisis textual los aprovecha. Varios estudios confirrman la importancia de su tratamiento en el idioma inglés; sin embargo, para el idioma español, es prácticamente inex...
Guardat en:
| Autor principal: | |
|---|---|
| Format: | masterThesis |
| Idioma: | espanyol |
| Publicat: |
2006
|
| Matèries: | |
| Accés en línia: | http://hdl.handle.net/20.500.12008/2940 |
| Etiquetes: |
Sense etiquetes, Sigues el primer a etiquetar aquest registre!
|
| _version_ | 1868890081453932544 |
|---|---|
| author | Garat Baridon, Diego |
| author_browse | Garat Baridon, Diego |
| author_facet | Garat Baridon, Diego |
| author_role | author |
| collection | COLIBRI |
| dc.creator.none.fl_str_mv | Garat Baridon, Diego |
| dc.date.none.fl_str_mv | 2006 2014-11-24T22:36:03Z 2014-11-24T22:36:03Z 20141202 |
| dc.format.none.fl_str_mv | 126 p. application/pdf |
| dc.identifier.none.fl_str_mv | GARAT BARIDON, D. "Análisis de superficie basado en puntuación". Tesis de maestría, Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación – PEDECIBA, 2006. http://hdl.handle.net/20.500.12008/2940 |
| dc.language.none.fl_str_mv | es spa |
| dc.publisher.none.fl_str_mv | UR. FI-INCO, |
| dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0) |
| dc.source.none.fl_str_mv | reponame:COLIBRI instname:Universidad de la República instacron:Universidad de la República |
| dc.subject.none.fl_str_mv | PUNTUACION ANALISIS SINTACTICO DE SUPEFICIE APRENDIZAJE AUTOMATICO COMBINACION DE METODOS SIMBOLICOS Y ESTADISTICOS |
| dc.title.none.fl_str_mv | Análisis de superficie basado en puntuación |
| dc.type.none.fl_str_mv | Tesis de maestría info:eu-repo/semantics/masterThesis info:eu-repo/semantics/acceptedVersion |
| description | A pesar que los símbolos de puntuación son fundamentales en la estructuración del texto, casi ninguna herramienta informática de análisis textual los aprovecha. Varios estudios confirrman la importancia de su tratamiento en el idioma inglés; sin embargo, para el idioma español, es prácticamente inexistente la investigación sobre este tema dentro de la lingüística computacional. El presente trabajo estudia el uso de la puntuación para el análisis de superficie de textos en español, y, como caso particular, se centra en la coma, por ser este el signo que presenta la mayor variedad de usos en la estructuración de texto. Con tal fin, se construye una categorización de las funciones de la coma que se adapte al procesamiento automático. Esto se realiza a partir del estudio de distintas clasificaciones existentes, pero corroborándola contra un corpus de textos periodísticos en español. Finalmente, se construye un analizador sintáctico de superficie combinando métodos estadísticos y simbólicos. Por un lado, se obtiene un evaluador de la función de las comas a través de técnicas de aprendizaje automático. Por otro, se escriben reglas de análisis que aprovechan la clasificación realizada por el evaluador [aprendido], utilizando un formalismo de reglas de reescritura. Se concluye que el tratamiento de la puntuación en el análisis sintáctico también es útil en el español. Además, se observa que la combinación de métodos simbólicos y estadísticos puede potenciar los resultados de ambos enfoques |
| eu_rights_str_mv | openAccess |
| format | masterThesis |
| id | anni_6641e5c71ae8a4a2a67fa8bdc6b59678 |
| identifier_str_mv | GARAT BARIDON, D. "Análisis de superficie basado en puntuación". Tesis de maestría, Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación – PEDECIBA, 2006. |
| instacron_str | Universidad de la República |
| institution | Universidad de la República |
| instname_str | Universidad de la República |
| language | spa |
| language_invalid_str_mv | es |
| network_acronym_str | anni |
| network_name_str | oai-lr-anni |
| oai_identifier_str | oai:colibri.udelar.edu.uy:20.500.12008/2940 |
| publishDate | 2006 |
| publishDateSort | 2006 |
| publisher.none.fl_str_mv | UR. FI-INCO, |
| reponame_str | COLIBRI |
| repository.mail.fl_str_mv | |
| repository.name.fl_str_mv | |
| repository_id_str | |
| rights_invalid_str_mv | Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0) |
| spelling | Análisis de superficie basado en puntuaciónGarat Baridon, DiegoPUNTUACIONANALISIS SINTACTICO DE SUPEFICIEAPRENDIZAJE AUTOMATICOCOMBINACION DE METODOS SIMBOLICOS Y ESTADISTICOSA pesar que los símbolos de puntuación son fundamentales en la estructuración del texto, casi ninguna herramienta informática de análisis textual los aprovecha. Varios estudios confirrman la importancia de su tratamiento en el idioma inglés; sin embargo, para el idioma español, es prácticamente inexistente la investigación sobre este tema dentro de la lingüística computacional. El presente trabajo estudia el uso de la puntuación para el análisis de superficie de textos en español, y, como caso particular, se centra en la coma, por ser este el signo que presenta la mayor variedad de usos en la estructuración de texto. Con tal fin, se construye una categorización de las funciones de la coma que se adapte al procesamiento automático. Esto se realiza a partir del estudio de distintas clasificaciones existentes, pero corroborándola contra un corpus de textos periodísticos en español. Finalmente, se construye un analizador sintáctico de superficie combinando métodos estadísticos y simbólicos. Por un lado, se obtiene un evaluador de la función de las comas a través de técnicas de aprendizaje automático. Por otro, se escriben reglas de análisis que aprovechan la clasificación realizada por el evaluador [aprendido], utilizando un formalismo de reglas de reescritura. Se concluye que el tratamiento de la puntuación en el análisis sintáctico también es útil en el español. Además, se observa que la combinación de métodos simbólicos y estadísticos puede potenciar los resultados de ambos enfoquesUR. FI-INCO,2014-11-24T22:36:03Z2014-11-24T22:36:03Z200620141202Tesis de maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersion126 p.application/pdfGARAT BARIDON, D. "Análisis de superficie basado en puntuación". Tesis de maestría, Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación – PEDECIBA, 2006.http://hdl.handle.net/20.500.12008/2940reponame:COLIBRIinstname:Universidad de la Repúblicainstacron:Universidad de la RepúblicaesspaLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad De La República. (Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)info:eu-repo/semantics/openAccessLicencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)oai:colibri.udelar.edu.uy:20.500.12008/29402026-04-14T10:27:50Z |
| spellingShingle | Análisis de superficie basado en puntuación Garat Baridon, Diego PUNTUACION ANALISIS SINTACTICO DE SUPEFICIE APRENDIZAJE AUTOMATICO COMBINACION DE METODOS SIMBOLICOS Y ESTADISTICOS |
| status_str | acceptedVersion |
| title | Análisis de superficie basado en puntuación |
| title_full | Análisis de superficie basado en puntuación |
| title_fullStr | Análisis de superficie basado en puntuación |
| title_full_unstemmed | Análisis de superficie basado en puntuación |
| title_short | Análisis de superficie basado en puntuación |
| title_sort | Análisis de superficie basado en puntuación |
| topic | PUNTUACION ANALISIS SINTACTICO DE SUPEFICIE APRENDIZAJE AUTOMATICO COMBINACION DE METODOS SIMBOLICOS Y ESTADISTICOS |
| url | http://hdl.handle.net/20.500.12008/2940 |