Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras

En esta tesis se realiza el reconocimiento y la clasificación de expresiones temporales en español sin incluir otra información explícita del dominio que los datos de entrenamiento. El enfoque propuesto consiste en modelos de redes neuronales artificiales que toman como entrada representaciones vect...

Full description

Saved in:
Bibliographic Details
Main Author: Etcheverry, Mathias (author)
Format: masterThesis
Language:Spanish
Published: 2016
Subjects:
Online Access:https://hdl.handle.net/20.500.12008/33367
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1868890175102255104
author Etcheverry, Mathias
author_browse Etcheverry, Mathias
author_facet Etcheverry, Mathias
author_role author
collection COLIBRI
dc.contributor.none.fl_str_mv Etcheverry Mathias, Universidad de la República (Uruguay). Facultad de Ingeniería.
dc.creator.none.fl_str_mv Etcheverry, Mathias
dc.date.none.fl_str_mv 2016
2022-08-29T12:10:53Z
2022-08-29T12:10:53Z
dc.format.none.fl_str_mv 84 p.
application/pdf
dc.identifier.none.fl_str_mv Etcheverry, M. Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras [en línea] Tesis de maestría. Montevideo : Udelar. FI. INCO : PEDECIBA. Área Informática, 2016.
1688-2792
https://hdl.handle.net/20.500.12008/33367
dc.language.none.fl_str_mv es
spa
dc.publisher.none.fl_str_mv Udelar. FI.
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
dc.source.none.fl_str_mv reponame:COLIBRI
instname:Universidad de la República
instacron:Universidad de la República
dc.subject.none.fl_str_mv Expresiones temporales
Redes neuronales artificiales
Semántica distribucional
dc.title.none.fl_str_mv Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras
dc.type.none.fl_str_mv Tesis de maestría
info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/acceptedVersion
description En esta tesis se realiza el reconocimiento y la clasificación de expresiones temporales en español sin incluir otra información explícita del dominio que los datos de entrenamiento. El enfoque propuesto consiste en modelos de redes neuronales artificiales que toman como entrada representaciones vectoriales de las palabras. Estas representaciones están construidas en base a la distribución de los contextos en los que ocurren y los modelos son entrenados utilizando textos anotados con la información temporal que se pretende aprender. Por un lado, se estudia si las representaciones vectoriales, construidas de forma no supervisada, junto con los modelos neuronales, permiten realizar un buen uso de los datos supervisados, prescindiendo de la necesidad de considerar otros mecanismos de generalización, como son las clases de palabras, habitualmente utilizadas en esta problemática. Por otra parte, se observa que las representaciones de los términos temporales codifican conocimiento del dominio de la temporalidad, en particular información del orden y de la granularidad de las entidades. Por ejemplo, es posible reconstruir el orden de los días de la semana a partir de las representaciones. Debido a la falta de recursos para el español al momento de iniciar esta tesis, se entrenan y evalúan representaciones vectoriales de la Wikipedia en español usando el método GloVe. Se adaptan tests de validación existentes del inglés para evaluar las representaciones, obteniéndose resultados interesantes. Para el reconocimiento y la clasificación se consideran modelos feedforward y long-short term memories bidireccionales. Se evalúan los resultados en una partición del conjunto de entrenamiento de Tempeval 2013, obteniendo valores de 79.2% de medida F para la detección exacta y 86.1% en el caso donde se admiten corrimientos de hasta una palabra en la expresión detectada. Debido a la no disponibilidad de los datos de evaluación no es posible realizar una comparación adecuada con otros sistemas. Finalmente, se entrenan modelos para el inglés, cuyas definiciones están orientados por las lecciones aprendidas del trabajo realizado para el español. En estos experimentos, se obtuvieron resultados de 79.1% para la detección de expresiones, resultado que está 4 puntos por debajo del estado del arte para el inglés (Lee et al., 2014).
eu_rights_str_mv openAccess
format masterThesis
id anni_b8884ddc00a3ceb1d3fe1c18e41b07eb
identifier_str_mv Etcheverry, M. Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras [en línea] Tesis de maestría. Montevideo : Udelar. FI. INCO : PEDECIBA. Área Informática, 2016.
1688-2792
instacron_str Universidad de la República
institution Universidad de la República
instname_str Universidad de la República
language spa
language_invalid_str_mv es
network_acronym_str anni
network_name_str oai-lr-anni
oai_identifier_str oai:colibri.udelar.edu.uy:20.500.12008/33367
publishDate 2016
publishDateSort 2016
publisher.none.fl_str_mv Udelar. FI.
reponame_str COLIBRI
repository.mail.fl_str_mv
repository.name.fl_str_mv
repository_id_str
rights_invalid_str_mv Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
spelling Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabrasEtcheverry, MathiasExpresiones temporalesRedes neuronales artificialesSemántica distribucionalEn esta tesis se realiza el reconocimiento y la clasificación de expresiones temporales en español sin incluir otra información explícita del dominio que los datos de entrenamiento. El enfoque propuesto consiste en modelos de redes neuronales artificiales que toman como entrada representaciones vectoriales de las palabras. Estas representaciones están construidas en base a la distribución de los contextos en los que ocurren y los modelos son entrenados utilizando textos anotados con la información temporal que se pretende aprender. Por un lado, se estudia si las representaciones vectoriales, construidas de forma no supervisada, junto con los modelos neuronales, permiten realizar un buen uso de los datos supervisados, prescindiendo de la necesidad de considerar otros mecanismos de generalización, como son las clases de palabras, habitualmente utilizadas en esta problemática. Por otra parte, se observa que las representaciones de los términos temporales codifican conocimiento del dominio de la temporalidad, en particular información del orden y de la granularidad de las entidades. Por ejemplo, es posible reconstruir el orden de los días de la semana a partir de las representaciones. Debido a la falta de recursos para el español al momento de iniciar esta tesis, se entrenan y evalúan representaciones vectoriales de la Wikipedia en español usando el método GloVe. Se adaptan tests de validación existentes del inglés para evaluar las representaciones, obteniéndose resultados interesantes. Para el reconocimiento y la clasificación se consideran modelos feedforward y long-short term memories bidireccionales. Se evalúan los resultados en una partición del conjunto de entrenamiento de Tempeval 2013, obteniendo valores de 79.2% de medida F para la detección exacta y 86.1% en el caso donde se admiten corrimientos de hasta una palabra en la expresión detectada. Debido a la no disponibilidad de los datos de evaluación no es posible realizar una comparación adecuada con otros sistemas. Finalmente, se entrenan modelos para el inglés, cuyas definiciones están orientados por las lecciones aprendidas del trabajo realizado para el español. En estos experimentos, se obtuvieron resultados de 79.1% para la detección de expresiones, resultado que está 4 puntos por debajo del estado del arte para el inglés (Lee et al., 2014).Udelar. FI.Etcheverry Mathias, Universidad de la República (Uruguay). Facultad de Ingeniería.2022-08-29T12:10:53Z2022-08-29T12:10:53Z2016Tesis de maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersion84 p.application/pdfEtcheverry, M. Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras [en línea] Tesis de maestría. Montevideo : Udelar. FI. INCO : PEDECIBA. Área Informática, 2016.1688-2792https://hdl.handle.net/20.500.12008/33367reponame:COLIBRIinstname:Universidad de la Repúblicainstacron:Universidad de la RepúblicaesspaLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)info:eu-repo/semantics/openAccessLicencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)oai:colibri.udelar.edu.uy:20.500.12008/333672026-04-14T10:27:56Z
spellingShingle Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras
Etcheverry, Mathias
Expresiones temporales
Redes neuronales artificiales
Semántica distribucional
status_str acceptedVersion
title Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras
title_full Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras
title_fullStr Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras
title_full_unstemmed Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras
title_short Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras
title_sort Tratamiento de expresiones temporales con redes neuronales artificiales y representaciones distribuidas de las palabras
topic Expresiones temporales
Redes neuronales artificiales
Semántica distribucional
url https://hdl.handle.net/20.500.12008/33367