Gestión de volúmenes masivos de datos genéticos y análisis de la influencia de su interacción en el desarrollo de cáncer

Palazuelos Calderón, Camilo

Gestión de volúmenes masivos de datos genéticos y análisis de la influencia de su interacción en el desarrollo de cáncer

Palazuelos Calderón, Camilo

Dirigida por:

Francisco Javier Llorca Díaz Director/a
Marta Elena Zorrilla Pantaleón Director/a

Universidad de defensa: Universidad de Cantabria

Fecha de defensa: 28 de junio de 2019

Tribunal:

Ernestina Menasalvas Presidente/a
Domingo Gómez Pérez Secretario/a
Ana Almaraz Gómez Vocal

Tipo: Tesis

Teseo: 595616 DIALNET TESEO editor

Resumen

La llegada de los estudios de asociación del genoma completo revolucionó el campo de la genética a partir de la primera década del siglo XXI: de analizar decenas de variantes genéticas, se pasó a analizar millones. Con todo, lo habitual en los resultados arrojados es que, para enfermedades comunes, el efecto que tiene una variante sobre una característica física, un síntoma o una enfermedad sea pequeño y, aun sumando las contribuciones de todas las variantes, no se consigan explicar todos los casos de individuos en que aparece la característica en cuestión. Los modelos o patrones en las asociaciones entre una variante genética y una enfermedad y entre una interacción de variantes genéticas y una enfermedad, a pesar de la información que proporcionan, se han ignorado en casi todos los estudios de asociación del genoma completo. En esta tesis doctoral, se propuso el estudio de estos modelos o patrones en interacciones de variantes genéticas para explicar parte de esa variación cuyo origen sigue sin desvelarse. Aunque no todas las variantes genéticas, ni mucho menos todas sus interacciones, presentan un modelo o patrón en su relación con la enfermedad, nuestra hipótesis de partida era que no son tan reducidas en número como parece, por lo que su estudio podía dar lugar a la generación de hipótesis biológicas susceptibles de ser comprobadas experimentalmente. Para demostrar esta hipótesis, (i) se desarrolló un marco de trabajo que permitió evaluar y comparar los niveles de adecuación e incertidumbre de distintos patrones a volúmenes masivos de variables que analizar simultáneamente; (ii) se diseñó e implementó una prueba estadística en el marco de trabajo anterior que permitió decidir qué modelo genético le correspondía —si es que le correspondía alguno— a variantes genéticas e interacciones de estas; y (iii) se confeccionó un protocolo de construcción de redes de interacciones con que se analizaron los datos del estudio MCC-Spain. El método de análisis propuesto supone una contribución novedosa que permite generar hipótesis biológicas relacionadas con los cinco tipos de cáncer estudiados y su asociación con la variación genética y sus interacciones. En tres de estos cinco tipos de cáncer, se han encontrado asociaciones interacción-enfermedad que han podido refrendarse con descubrimientos científicos de los últimos 5 años, lo que pone de manifiesto tanto la viabilidad del método como su potencial para revelar información oculta en las redes de interacciones de variantes genéticas que conducen a la aparición de enfermedades comunes.