Implementación de clasificadores jerárquicos multiclase para la predicción de función de genes a partir de su ubicación en el genoma

El reciente desarrollo tecnológico está generando datos genómicos mucho más rápido que nuestra capacidad de analizarlos. Es imprescindible, en este contexto, implementar herramientas que permitan reducir el tiempo y el costo necesario para determinar las funciones de los genes experimentalmente, dad...

Full description

Saved in:
Bibliographic Details
Main Author: Silvera, Diego (author)
Format: masterThesis
Language:Spanish
Published: 2022
Subjects:
Online Access:https://hdl.handle.net/20.500.12008/34602
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:El reciente desarrollo tecnológico está generando datos genómicos mucho más rápido que nuestra capacidad de analizarlos. Es imprescindible, en este contexto, implementar herramientas que permitan reducir el tiempo y el costo necesario para determinar las funciones de los genes experimentalmente, dado que para la mayoría de los genes aún se desconoce su función. Para aliviar este problema, en las últimas décadas se han desarrollado varios métodos de predicción de funciones de genes. Algunos se basan en alineamientos de secuencia con proteínas para las cuales su función se ha establecido experimentalmente [Clark and Radivojac, 2011, Martin et al., 2004, Engelhardt et al., 2005], y otros explotan otros tipos de datos: estructuras de proteínas [Pal and Eisenberg, 2005,Pazos and Sternberg, 2004], niveles de expresión de genes [Huttenhower et al., 2006], perfiles temporales de transcripción [Pazos Obregón et al., 2015], interacciones macromoleculares [Letovsky and Kasif, 2003, Nabieva et al., 2005], o una combinación de varios tipos de ellos. A pesar de que se sabe que los genes con la misma función se agrupan de diferentes maneras en el genoma, y que su posición en el mismo no es independiente de su función biológica, el potencial de la posición de un gen dentro del genoma como variable predictora de la función permanece poco explorado en organismos eucariotas. En este trabajo se implementa un modelo para predecir funciones de genes, utilizando datos generados a partir de su posición en el genoma y de funciones conocidas, en cinco organismos modelo. Los resultados obtenidos indican que, para algunos organismos y ontologías, la posición de un gen predice mejor su función que la secuencia.