Anotación funcional de genes en kinetoplástidos mediante búsqueda de homología remota basada en estructura
Los kinetoplástidos pertenecen al supergrupo Discoba, un linaje eucariota de divergencia temprana. Aunque la cantidad de datos genómicos sobre estos parásitos ha aumentado de manera notable, asignar funciones génicas mediante métodos de homología basados únicamente en secuencias sigue siendo un reto...
Saved in:
| Main Author: | |
|---|---|
| Format: | doctoralThesis |
| Language: | Spanish |
| Published: |
2025
|
| Subjects: | |
| Online Access: | https://hdl.handle.net/20.500.12008/52878 |
| Tags: |
No Tags, Be the first to tag this record!
|
| Summary: | Los kinetoplástidos pertenecen al supergrupo Discoba, un linaje eucariota de divergencia temprana. Aunque la cantidad de datos genómicos sobre estos parásitos ha aumentado de manera notable, asignar funciones génicas mediante métodos de homología basados únicamente en secuencias sigue siendo un reto. Recientemente, se han logrado avances importantes en la predicción in silico de estructuras proteicas y en el desarrollo de algoritmos capaces de comparar de forma rápida y precisa grandes volúmenes de estructuras. En este trabajo, diseñamos y aplicamos un flujo de trabajo de búsqueda de homología basado en la comparación de estructuras proteicas (ASC, Annotation by Structural Comparisons) para transferir información biológica a todas las proteínas de kinetoplástidos disponibles en TriTrypDB, la base de datos de referencia para este grupo. Gracias a nuestro pipeline, pudimos asignar similitudes estructurales a una fracción sustancial de las proteínas estudiadas, enriqueciendo las anotaciones existentes mediante la transferencia de información. Además, identificamos homólogos estructurales para representativos de 6 700 proteínas no caracterizadas en 33 especies de kinetoplástidos, proteínas que no podían anotarse usando las herramientas y bases de datos de homología de secuencia convencionales. De este modo, nuestro enfoque permitió inferir información biológica potencial para un gran número de proteínas. Entre ellas, detectamos homólogos estructurales de proteínas eucariotas omnipresentes que resultan difíciles de reconocer en los genomas de kinetoplástidos mediante los métodos de anotación genómica estándar. Los resultados de este trabajo, agrupados bajo el nombre KASC (Kinetoplastid Annotation by Structural Comparison), están disponibles de forma abierta para la comunidad en kasc.fcien.edu.uy, a través de una interfaz amigable que permite la inspección visual de los datos de manera individual por gen. |
|---|