Model selection techniques & Sparse Markov Chains

Este trabajo trata sobre problemas de selección de modelo. El capítulo 0 plantea un estudio general de estos problemas estadísticos. Dados un proceso estocástico y una familia de clases de modelos, con cada clase determinada por un parámetro de estructura y cada modelo dentro de una clase descrito p...

Full description

Saved in:

Bibliographic Details
Main Author:	Fraiman, Nicolás (author)
Format:	masterThesis
Language:	Spanish
Published:	2008
Subjects:	MODELOS DE ÁRBOLES DISPERSOS CONSISTENCIA ÁRBOL DE CONTEXTOS MÍNIMO LARGO DE DESCRIPCIÓN CADENAS DE ALCANCE VARIABLE
Online Access:	http://hdl.handle.net/20.500.12008/5454
Tags:	Add Tag No Tags, Be the first to tag this record!

_version_	1868890033915691008
author	Fraiman, Nicolás
author_browse	Fraiman, Nicolás
author_facet	Fraiman, Nicolás
author_role	author
collection	COLIBRI
dc.contributor.none.fl_str_mv	Fraiman Nicol ás, Universidad de la República (Uruguay). Facultad de Ciencias. Centro de Matemática.
dc.creator.none.fl_str_mv	Fraiman, Nicolás
dc.date.none.fl_str_mv	2008 2016-02-15T14:47:59Z 2016-02-15T14:47:59Z
dc.format.none.fl_str_mv	111 p. aplication/pdf
dc.identifier.none.fl_str_mv	FRAIMAN, N. " Model selection techniques & Sparse Markov Chains". Tesis de maestría. Montevideo : UR. FC-CMAT, 2008. http://hdl.handle.net/20.500.12008/5454
dc.language.none.fl_str_mv	es spa
dc.publisher.none.fl_str_mv	UR. FC-CMAT
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)
dc.source.none.fl_str_mv	reponame:COLIBRI instname:Universidad de la República instacron:Universidad de la República
dc.subject.none.fl_str_mv	MODELOS DE ÁRBOLES DISPERSOS CONSISTENCIA ÁRBOL DE CONTEXTOS MÍNIMO LARGO DE DESCRIPCIÓN CADENAS DE ALCANCE VARIABLE
dc.title.none.fl_str_mv	Model selection techniques & Sparse Markov Chains
dc.type.none.fl_str_mv	Tesis de maestría info:eu-repo/semantics/masterThesis info:eu-repo/semantics/acceptedVersion
description	Este trabajo trata sobre problemas de selección de modelo. El capítulo 0 plantea un estudio general de estos problemas estadísticos. Dados un proceso estocástico y una familia de clases de modelos, con cada clase determinada por un parámetro de estructura y cada modelo dentro de una clase descrito por un vector de parámetros en un espacio cuya dimensión depende de la estructura. Supongamos que dada una realización del proceso podemos estimar el vector de parámetros si la estructura es conocida. La tarea es estimar esta última. Trabajamos usando el concepto de criterio de información, el parámetro de estructura es estimado mediante minimizar un valor asignado a cada clase de modelos. Los criterios más utilizados son el Criterio de Información Bayesiano (BIC) y el principio del mínimo largo de descripción (MDL). El BIC consiste de dos términos: menos el logaritmo de la máxima verosimilitud, esto mide la bondad de ajuste; y la mitad del número de parámetros libres por el logaritmo del tamaño muestral, esto penaliza modelos muy complejos. En el capítulo 2, incluimos algunos resultados recientes en estimación de cadenas de Markov de alcance variable (VLMC), los cuales nos ayudarán a entender más en profundidad el problema planteado. Basados en Csiszar y Talata (2006) extendemos el concepto de árbol de contextos para procesos ergódicos arbitrarios y demostramos que los principios BIC y MDL dan estimadores fuertemente consistentes del árbol de contextos. En el capítulo 3 presentamos una nueva e ingeniosa representación de los modelos Markovianos: los modelos de árbol de contexto disperso (stms), una generalización de las cadenas de alcance variable, donde permitimos juntar conjuntos más generales de estados con distribuciones similares, y preservamos la útil estructura combinatoria de los árboles de contextos. El tema principal del trabajo es estudiar un método para estimar la estructura en esta clase de modelos parsimoniosos. Mostraremos resultados de consistencia para estimadores basados en el principio MDL, el objetivo es encontrar el menor árbol que determina las probabilidades de transición. Finalmente, en el capítulo 4 describimos brevemente algunas aplicaciones en Biología y Teoría de la Información. Ilustramos cómo estas técnicas pueden ser utilizadas para clasificar familias de proteínas. Además mostramos como se pueden utilizar para comprimir imágenes bitonales, dando lugar a un método de compresión sin pérdida que mejora la performance de los métodos basados en árboles de contexto, y de varios algoritmos populares de compresión.
eu_rights_str_mv	openAccess
format	masterThesis
id	anni_4a3fd079d80dff0e157492d36746fee2
identifier_str_mv	FRAIMAN, N. " Model selection techniques & Sparse Markov Chains". Tesis de maestría. Montevideo : UR. FC-CMAT, 2008.
instacron_str	Universidad de la República
institution	Universidad de la República
instname_str	Universidad de la República
language	spa
language_invalid_str_mv	es
network_acronym_str	anni
network_name_str	oai-lr-anni
oai_identifier_str	oai:colibri.udelar.edu.uy:20.500.12008/5454
publishDate	2008
publishDateSort	2008
publisher.none.fl_str_mv	UR. FC-CMAT
reponame_str	COLIBRI
repository.mail.fl_str_mv
repository.name.fl_str_mv
repository_id_str
rights_invalid_str_mv	Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)
spelling	Model selection techniques & Sparse Markov ChainsFraiman, NicolásMODELOS DE ÁRBOLES DISPERSOSCONSISTENCIAÁRBOL DE CONTEXTOSMÍNIMO LARGO DE DESCRIPCIÓNCADENAS DE ALCANCE VARIABLEEste trabajo trata sobre problemas de selección de modelo. El capítulo 0 plantea un estudio general de estos problemas estadísticos. Dados un proceso estocástico y una familia de clases de modelos, con cada clase determinada por un parámetro de estructura y cada modelo dentro de una clase descrito por un vector de parámetros en un espacio cuya dimensión depende de la estructura. Supongamos que dada una realización del proceso podemos estimar el vector de parámetros si la estructura es conocida. La tarea es estimar esta última. Trabajamos usando el concepto de criterio de información, el parámetro de estructura es estimado mediante minimizar un valor asignado a cada clase de modelos. Los criterios más utilizados son el Criterio de Información Bayesiano (BIC) y el principio del mínimo largo de descripción (MDL). El BIC consiste de dos términos: menos el logaritmo de la máxima verosimilitud, esto mide la bondad de ajuste; y la mitad del número de parámetros libres por el logaritmo del tamaño muestral, esto penaliza modelos muy complejos. En el capítulo 2, incluimos algunos resultados recientes en estimación de cadenas de Markov de alcance variable (VLMC), los cuales nos ayudarán a entender más en profundidad el problema planteado. Basados en Csiszar y Talata (2006) extendemos el concepto de árbol de contextos para procesos ergódicos arbitrarios y demostramos que los principios BIC y MDL dan estimadores fuertemente consistentes del árbol de contextos. En el capítulo 3 presentamos una nueva e ingeniosa representación de los modelos Markovianos: los modelos de árbol de contexto disperso (stms), una generalización de las cadenas de alcance variable, donde permitimos juntar conjuntos más generales de estados con distribuciones similares, y preservamos la útil estructura combinatoria de los árboles de contextos. El tema principal del trabajo es estudiar un método para estimar la estructura en esta clase de modelos parsimoniosos. Mostraremos resultados de consistencia para estimadores basados en el principio MDL, el objetivo es encontrar el menor árbol que determina las probabilidades de transición. Finalmente, en el capítulo 4 describimos brevemente algunas aplicaciones en Biología y Teoría de la Información. Ilustramos cómo estas técnicas pueden ser utilizadas para clasificar familias de proteínas. Además mostramos como se pueden utilizar para comprimir imágenes bitonales, dando lugar a un método de compresión sin pérdida que mejora la performance de los métodos basados en árboles de contexto, y de varios algoritmos populares de compresión.UR. FC-CMATFraiman Nicol ás, Universidad de la República (Uruguay). Facultad de Ciencias. Centro de Matemática.2016-02-15T14:47:59Z2016-02-15T14:47:59Z2008Tesis de maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersion111 p.aplication/pdfFRAIMAN, N. " Model selection techniques & Sparse Markov Chains". Tesis de maestría. Montevideo : UR. FC-CMAT, 2008.http://hdl.handle.net/20.500.12008/5454reponame:COLIBRIinstname:Universidad de la Repúblicainstacron:Universidad de la RepúblicaesspaLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)info:eu-repo/semantics/openAccessLicencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)oai:colibri.udelar.edu.uy:20.500.12008/54542026-04-14T10:11:17Z
spellingShingle	Model selection techniques & Sparse Markov Chains Fraiman, Nicolás MODELOS DE ÁRBOLES DISPERSOS CONSISTENCIA ÁRBOL DE CONTEXTOS MÍNIMO LARGO DE DESCRIPCIÓN CADENAS DE ALCANCE VARIABLE
status_str	acceptedVersion
title	Model selection techniques & Sparse Markov Chains
title_full	Model selection techniques & Sparse Markov Chains
title_fullStr	Model selection techniques & Sparse Markov Chains
title_full_unstemmed	Model selection techniques & Sparse Markov Chains
title_short	Model selection techniques & Sparse Markov Chains
title_sort	Model selection techniques & Sparse Markov Chains
topic	MODELOS DE ÁRBOLES DISPERSOS CONSISTENCIA ÁRBOL DE CONTEXTOS MÍNIMO LARGO DE DESCRIPCIÓN CADENAS DE ALCANCE VARIABLE
url	http://hdl.handle.net/20.500.12008/5454

Model selection techniques & Sparse Markov Chains

Similar Items