Genetic association analysis of complex diseases through information theoretic metrics and linear pleiotropy

Tesis doctoral de Helena Brunel

Esta tesis combina métodos lineales y no lineales con el fin de identificar variantes genéticas responsables de rasgos complejos. en primer lugar, se han propuesto dos estrategias de asociación de one-locus. La primera consiste en definir y caracterizar una prueba de asociación no lineal basada en la medida de información mutua, y teniendo en cuenta la estructura genética de la población. Para ello, se han utilizado los datos del gaw17 y, dado que corresponden a datos simulados cuya solución es conocida, este estudio ha servido para caracterizar el rendimiento de la prueba de asociación no lineal en comparación con los métodos lineales estándar. La metodología propuesta ha recuperado los resultados obtenidos usando métodos lineales y además ha identificado un snp relacionado con la enfermedad. En términos de rendimiento, ambos métodos han mostrado cifras similares de precisión en clasificación (auc). la segunda alternativa consiste en un estudio exploratorio sobre la relación entre la variabilidad de secuencias entre especies y la asociación con la enfermedad, para diferentes regiones genómicas. Se han comparado dos conjuntos de snps, uno formado por snps previamente asociados con enfermedades y el otro formado por snps neutros. Ambos han sido estratificados según la región genómica de los snps, característica que pudo influenciar su conservación entre especies. Se ha observado que para la mayoría de regiones genómicas, los snps asociados a enfermedades tienden a estar significativamente menos variables entre especies que los snps neutros. en segundo lugar, se ha propuesto una metodología no lineal novedosa para asociación genética multiloci, con el objetivo de detectar la asociación entre combinaciones de varios snps y fenotipos complejos. El método propuesto, denominado miss, se ha basado en la significación estadística de la información mutua. Esta aproximación se ha comparado con el mlr (multiple linear regression), un método estándar para asociación genética multiloci. Ambos se han aplicado como criterio de relevancia en un algoritmo flotante de selección de características multi- solución (mssffs), propuesto en el contexto de asociación multiloci. También se han comparado con mecpm, un algoritmo para la búsqueda predictiva de interacciones multilocales con un criterio de máxima entropía. Los tres métodos se han aplicado a los snps del gen f7 y los niveles de fvii en sangre con los datos del proyecto gait. El método propuesto (miss) ha mejorado los resultados obtenidos con los otros métodos, detectando nuevas interacciones entre snps. Los resultados están en concordancia con resultados funcionales encontrados en la literatura donde los snps candidatos fueron descritos como elementos funcionales relacionados con el fenotipo. en tercer lugar, se ha propuesto un entorno metodológico lineal para el análisis simultáneo de múltiples fenotipos. La metodología consiste en construir nuevas variables fenotípicas, denominadas metafenotipos, que capturen la actividad conjunta de un grupo de fenotipos que actúen en cascada en una determinada ruta metabólica. Estas nuevas variables se han usado en los posteriores análisis de asociación con el fin de identificar elementos genéticos relacionados con el proceso biológico subyacente, en su conjunto. Como implementación práctica, la metodología se ha aplicado a los datos del proyecto gait, para identificar marcadores genéticos relacionados con el proceso de la coagulación en su totalidad. Tres modelos matemáticos se han usado para la definición de los metafenotipos, un modelo pca y dos modelos ica. Usando esta aproximación novedosa, se han identificado asociaciones previamente reportadas y se han propuesto nuevos candidatos con un posible efecto global sobre la cascada de la coagulación como conjunto.

 

Datos académicos de la tesis doctoral «Genetic association analysis of complex diseases through information theoretic metrics and linear pleiotropy«

  • Título de la tesis:  Genetic association analysis of complex diseases through information theoretic metrics and linear pleiotropy
  • Autor:  Helena Brunel
  • Universidad:  Politécnica de catalunya
  • Fecha de lectura de la tesis:  14/11/2013

 

Dirección y tribunal

  • Director de la tesis
    • Alexandre Perera Lluna
  • Tribunal
    • Presidente del tribunal: xavier Correig blanchar
    • sonia López moreno (vocal)
    • (vocal)
    • (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio