Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Muestra agrupado basado en GWAS: Una alternativa rentable para la Identificación colorrectal y cáncer de próstata de riesgo variantes en el polaco Population

PLOS ONE: Muestra agrupado basado en GWAS: Una alternativa rentable para la Identificación colorrectal y cáncer de próstata de riesgo variantes en el polaco Population


Extracto

Antecedentes

El cáncer de próstata (CaP) y colorrectal cáncer (CRC) son los tipos de cáncer más comúnmente diagnosticado y causas relacionadas con el cáncer de muerte en Polonia. Hasta la fecha, numerosos polimorfismos de nucleótido único (SNP) asociados con la susceptibilidad a ambos tipos de cáncer han sido identificados, pero su efecto sobre el riesgo de la enfermedad pueden diferir entre las poblaciones.

Métodos

Para identificar nuevos SNPs asociados con CaP y del CCR en la población polaca, un estudio de asociación de genoma completo (GWAS) se realizó utilizando pools de muestras de ADN de Affymetrix todo el genoma Humanos matrices SNP 6.0. Un total de 135 pacientes con CaP y 270 hombres sanos (PCA sub-estudio) y 525 pacientes con adenoma (AD), 630 pacientes con CCR y 690 controles (AD /CRC sub-estudio) fueron incluidos en el análisis. distribuciones de frecuencia de los alelos se compararon con pruebas ty chi
2-pruebas. Sólo aquellos SNPs asociados significativamente con un SNP proxy (
p Hotel & lt; 0,001; distancia de 100 kb; r
2 & gt; 0,7) fueron seleccionados. selección de marcadores GWAS se llevó a cabo utilizando PLINK. El estudio se repitió usando cohortes prolongados de pacientes y controles. También se examinó la asociación con CaP ya se ha informado y variantes de susceptibilidad CRC. Los pacientes individuales se genotipo utilizando TaqMan SNP genotipificación ensayos.

Resultados

El GWAS seleccionó seis y 24 nuevos candidatos SNPs asociados con el CP y la susceptibilidad CRC, respectivamente. En el estudio de replicación, 17 de estas asociaciones fueron confirmados como aditivo significativo en el modelo de herencia. Siete de ellos permanecieron significativas después de la corrección de múltiples pruebas de hipótesis. Además, se han identificado 17 variantes de riesgo previamente reportados, cinco de los cuales permanecieron significativas después de la corrección.

Conclusión

agrupado-ADN GWAS permitió la identificación de nuevos loci de susceptibilidad para la CRC en la población polaca. Anteriormente informaron CRC y PCA variantes de predisposición También se identificaron, la validación de la naturaleza global de sus asociaciones. Se necesitan más estudios de replicación independientes para confirmar la significación de los loci de susceptibilidad candidato recién descubierto

Visto:. Gaj P, N Maryan, Hennig EE, Ledwon JK, Paziewska A, Majewska A, et al. GWAS basado en muestras (2012) agrupado: Una alternativa rentable para la Identificación colorrectal y cáncer de próstata de riesgo variantes en la población polaca. PLoS ONE 7 (4): e35307. doi: 10.1371 /journal.pone.0035307

Editor: Kin Lau Mang, la Universidad China de Hong Kong, Hong Kong

Recibido: 19 de diciembre de 2011; Aceptado: March 13, 2012; Publicado: 19 Abril 2012

Derechos de Autor © 2012 Gaj et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este trabajo el apoyo de una /I /2007/01 subvención del Ministerio de Educación polaco Ciencia y Superior (http://www.nauka.gov.pl/home/) PBZ-MNiSW-05. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

los cánceres son trastornos muy heterogéneos, poligénicas que surgen en un proceso de múltiples etapas que implica la selección de clones celulares sucesivas, y el resultado de factores ambientales específicos genética, así como. En el primer caso, ambas mutaciones de alta penetrancia y polimorfismos de baja penetrancia pueden determinar los mecanismos de defensa y de adaptación del paciente contra la exposición a los factores cancerígenos, la determinación de la susceptibilidad a esta enfermedad. Sin embargo, el efecto de los factores determinantes de riesgo comunes de baja penetrancia es pequeño cuando está en forma aislada, lo que aumenta la susceptibilidad sólo a través del efecto acumulativo asociado con la aparición de múltiples variantes de riesgo [1].

La asociación entre la frecuencia de los alelos y la susceptibilidad a la enfermedad se puede estudiar, centrándose en las variantes seleccionadas de forma individual o, en cambio, en la posición de más de un millón variantes de ADN, el uso de polimorfismo de nucleótido único (SNP) la tecnología de microarrays. plataformas de microarrays utilizados por los estudios de asociación de genoma completo (GWAS) representan una tecnología relativamente madura que permite escanear todo el genoma para detectar posibles asociaciones con la enfermedad sin conocimiento previo de su cargo o función biológica. En teoría, como consecuencia de desequilibrio de ligamiento (LD) entre los SNPs en un locus dado, una alta proporción de toda la diversidad podría ser capturado por genotipo un subconjunto relativamente pequeño de marcadores (los SNPs llamada de marcado) [2] - [5 ].

hasta la fecha, más de 1.000 loci de susceptibilidad, por lo general de efecto pequeño o modesto y exactitud de bajo a moderadamente alto, han sido identificados por los GWAS [6]. Sin embargo, cada uno de estos estudios, incluyendo más de 50 GWAS realizó con los pacientes de cáncer, identificado sólo unos pocos variantes de riesgo cuando se analizan por separado. Por otra parte, no han sido replicados muchos estudios [7], [8]. Las dificultades en la identificación de factores de riesgo genéticos asociados a enfermedades heterogéneas y poligénicas, como los cánceres esporádicos, pueden explicarse por las limitaciones de la metodología. plataformas de gama SNP disponibles comercialmente se han optimizado para el estudio de enfermedades o rasgos basado en la suposición de que las enfermedades comunes estarían asociados con variantes comunes [9]. Desde loci con un tamaño alto efecto se han eliminado de manera eficiente de la población humana por la selección natural, la identificación de un locus de susceptibilidad polimórfico común fuertemente asociada con una enfermedad, con odds ratio (OR) durante 2 [10], es poco probable. A pesar de que la identificación de SNPs de baja frecuencia menor alelo (MA) han mejorado con el uso de chips de última generación, y la densidad de la sonda más altas permitido el estudio de las variantes con un bajo grado de heterocigosidad, la detección de variantes raras sigue estando muy exigente en términos de potencia estadística [7], [8], [11] - [14].

el cáncer de próstata (CaP) y el cáncer colorrectal (CCR) son los tipos más comunes de cáncer en la población polaca, y la principal causa de morbilidad y mortalidad [15] relacionada con el cáncer. La mayoría de los CRCs son esporádicos, y sólo una pequeña proporción se produce en el curso de altamente penetrantes síndromes hereditarios, tales como el síndrome de Lynch, poliposis adenomatosa familiar y otros síndromes de poliposis mediadas por mutaciones de la línea germinal raras en el gen de desajuste de reparación del ADN y en la poliposis adenomatosa coli (
APC
) de genes [16]. PCa predisposición mediada por mutaciones raras en algunos genes candidatos, como el
BRCA2
, también explican menos de 10% del riesgo familiar relativo [17]. Por lo tanto, es posible que una proporción sustancial del riesgo de cáncer hereditario se explica por una combinación de variantes de baja penetrancia comunes de efectos modestos. Por ejemplo, la variación genética en 14 y 21 loci de susceptibilidad independiente, validado en poblaciones no relacionadas, puede explicar aproximadamente el 8% y el 13,5% del riesgo de desarrollar CCR heredabilidad y CP, respectivamente [16], [18]. Estos resultados muestran, sin embargo, que la mayor variación hereditaria asociada con el riesgo de desarrollar cualquier tipo de cáncer que queda por determinar.

Un análisis exhaustivo de las variantes que confieren susceptibilidad genética a la CRC y PCA basado en GWAS no se ha llevado a cabo en la población polaca todavía. Una de las principales causas de esta falta de estudios es el alto costo de la tecnología de microarrays SNP, sobre todo teniendo en cuenta que los nuevos loci identificados por GWAS se han asociado con los tamaños del efecto cada vez más pequeños, exigiendo un aumento en la potencia estadística (es decir, tamaño de la muestra) de GWAS. Un enfoque alternativo usando muestras de ADN agrupadas se ha desarrollado [19]. A pesar de que el uso no estándar de SNP arrays hace que sea necesario tomar precauciones adicionales en cuenta [19], [20], este enfoque reduce sustancialmente los costos de investigación. Es importante tener en cuenta, sin embargo, que una variación técnica más altos asociados con el enfoque de la agrupación de ADN puede enmascarar las asociaciones más débiles. Por lo tanto, los investigadores tienen a los intercambios entre exactitud de la predicción de riesgo genético y el costo de su investigación.

En este estudio, se describe un GWAS basado en muestras de ADN agrupado como una alternativa rentable para identificar variantes genéticas de efecto moderado asociado con el CRC y el CaP en la población polaca. Las muestras de ADN reunidas se procesan utilizando la tecnología de microarrays, y GWAS se empleó como un enfoque de filtrado de la variación genética. La validación técnica de los resultados GWAS y los estudios de replicación en muestras individuales de ADN se realizó utilizando la tecnología mucho más barato genotipado basado en la PCR.

Materiales y Métodos

Ética Declaración

Todo los pacientes incluidos y sujetos control fueron polacas caucásicos reclutados a partir de dos poblaciones urbanas, Varsovia y Szczecin. El estudio fue aprobado por el comité de ética local (Centro Médico para la Educación de Postgrado y el Centro de Cáncer, Varsovia, Polonia), y todos los participantes proporcionaron su consentimiento informado por escrito. El protocolo de estudio se ajusta a las directrices éticas de la Declaración de Helsinki 1975

Temas estudiados

cohortes GWAS comprendidas:. (1. AD /CRC sub-estudio) a 525 pacientes (270 hembras y 255 varones) con diagnóstico de adenomas colorrectales (AD), 630 pacientes (240 hembras y 390 varones) con diagnóstico de CCR y 705 individuos sanos (420 hembras y 285 machos), y (2. CaP sub-estudio) 285 varones diagnosticados de CaP y 285 hombres sanos

cohortes más grandes de casos y controles se inscribieron en un estudio de replicación, incluyendo:. (1. AD /CRC sub-estudio) 945 (509 hembras y 436 machos) los pacientes con EA, 889 (352 hembras y 537 machos) de los pacientes con CCR y 2188 (1542 hembras y 646 machos) individuos sanos, y (2. CaP sub-estudio) 447 pacientes con CP y 800 controles de hombres sanos. La edad media al diagnóstico de la EA, el CRC y el CP fue de 60 años (rango: 36-85), 64 años (rango: 29-89) y 67 años (rango: 42-83 años), respectivamente. Los tamaños de muestra y la distribución por edades de cada grupo se muestran en la Tabla 1.

GWAS de Allelotyping

El ADN genómico fue extraído a partir tratada con EDTA utilizando el QIAamp DNA Mini Kit de sangre total (Qiagen , Alemania), siguiendo el protocolo del fabricante. Antes de la puesta en común, se midieron las concentraciones de la muestra de ADN en función de su intensidad de fluorescencia utilizando Quant-iT ™ PicoGreen dsDNA Kit (Invitrogen, Reino Unido). Para determinar la calidad del ADN con precisión, la relación de absorbancia /280 nm 260 nm de cada muestra también se midió utilizando un espectrofotómetro NanoDrop 1000 (Thermo Fisher Scientific Inc., EE.UU.), y las muestras se corrieron en un gel de agarosa al 1% para determinar la integridad del ADN visualmente.

Las muestras de ADN que pasaron las pruebas de control de calidad se combinaron mezclando concentraciones equimolares de acuerdo con el diagnóstico del paciente para obtener pools de muestras de ADN de 15. muestras de ADN reunidas se llevaron luego a una concentración final de 50 ng /l en tampón Tris-EDTA (pH = 8), con concentraciones de Tris y EDTA no superiores a 10 mM y 0,1 mM, respectivamente. En el TDA /CRC sub-estudio, un total de 35, 42 y 47 conjuntos de ADN se prepararon para la EA, el CRC y controles, respectivamente, mientras que en el CaP sub-estudio, un total de 19 y 19 conjuntos de ADN tanto para CaP y controles, respectivamente. Para reducir la influencia de la variación experimental, piscinas de ADN se subdividieron en repeticiones técnicas triples y se ensayaron de forma independiente, utilizando microarrays de separadas, en la matriz de Affymetrix Genome-Wide SNP humano 6.0. experimentos de genotipado de microarrays y la extracción de la sonda establecer la intensidad de señal se realizaron con ATLAS Biolabs GmbH (Berlín, Alemania).

Genotipo del individuo

Para la validación técnica de los hallazgos GWAS y para el estudio de replicación, pacientes individuales fueron genotipo utilizando TaqMan SNP genotipificación ensayos (Life Technologies, EE.UU.), SensiMix ™ II kit de sondas (Bioline Ltd, Reino Unido), y un sistema de 7900HT real-Time PCR (Life Technologies, EE.UU.).

los análisis estadísticos - allelotyping GWAS

la intensidad de cada SNP se calculó como la señal de alelo relativa (RAS) para cada microarray, tal que: RAS = a /(a ​​+ B), donde a y B son la sonda establecer valores de intensidad de los alelos a y B, respectivamente, de acuerdo con la codificación de Affymetrix [21], [22]. La intensidad de A y B se obtuvo de la algoritmo Affymetrix Birdseed v2. Los valores medios de RAS se calcularon para cada lado de la piscina de ADN para dar cuenta de las tres repeticiones técnicos. Antes de realizar las pruebas de asociación, se realizó un análisis de componentes principales (PCA) para todas las matrices basadas en los valores de RAS. Piscinas identificadas como valores extremos mediante el trazado de los dos primeros componentes principales fueron excluidos de los nuevos análisis.

Para detectar diferencias significativas en la frecuencia de los alelos entre el CP y el grupo control se utilizó una combinación de dos enfoques estadísticos. En primer lugar, las diferencias entre los grupos en RAS se probaron mediante pruebas t de Student para tener en cuenta la variación RAS entre los grupos que representan a cada grupo [23]. En segundo lugar, la media de los valores RAS de todas las matrices en el grupo de pacientes y de control se calculan y se ensayaron diferencias significativas en la frecuencia de los alelos usando un
2-test χ con un grado de libertad [24]. Dado que esta prueba compara las frecuencias alélicas de medias entre los grupos sin tener en cuenta la alta complejidad técnica del enfoque allelotyping, que podría conducir a un mayor número de resultados positivos falsos y negativos falsos. Por el contrario, las pruebas t podría ser demasiado sensible para detectar diferencias entre los grupos si la variación técnica entre piscinas es baja. Por lo tanto, las diferencias en la frecuencia de los alelos pueden ser demasiado pequeños para ser validado por genotipo individual. Por tanto, un enfoque estadístico combinado proporciona un medio más preciso para detectar si existen diferencias significativas en comparación con cada prueba por sí sola
.
SNPs candidatos para cada genotipo fueron seleccionados mediante la combinación de los resultados tanto de la t-test y χ
2-prueba, utilizando el algoritmo de agrupamiento en el software v1.06 PLINK (http://pngu.mgh.harvard.edu/purcell/plink) [25]. Los loci para los que había un SNP (
p
& lt; 0,001) y al menos un SNP correlacionado proxy (r
2 & gt; 0,7) dentro de una región de 100 kb (
p
& lt; 0,001, χ
2-test) se consideraron como resultados positivos. Proxy SNPs se determina con base en los datos obtenidos a partir de LD 4100 sujetos de raza caucásica con genotipo individual de West-Pomerania en la cohorte SHIP, utilizando el SNP serie de Affymetrix Human 6.0 [26], [27]

Los análisis estadísticos -. Genotipo individual

validación técnica de los SNPs candidatos seleccionados por el GWAS agrupado-ADN se realizó mediante la determinación del genotipo individual de las mismas cohortes experimentales. datos TaqMan de genotipificación se sometió primero a los procedimientos de control de calidad, incluyendo umbrales de máxima missingness individual para cada uno de los SNPs & lt; 0,05, máximo missingness genotipo para cada uno de los individuos y lt; 0,05 y el desequilibrio & lt Hardy-Weinberg; 0,001 para el grupo control . asociaciones candidatos GWAS se validaron utilizando la alélica χ
2-test (software v1.07 PLINK). SNPs con
p-valores
& lt; 0,01 fueron elegibles para otros análisis. Los altos niveles de concordancia en las diferencias de frecuencia de alelos entre los grupos de casos y controles validó la precisión del proceso de selección GWAS, incluyendo la construcción de la piscina equimolar y el enfoque estadístico para la selección de las asociaciones candidato SNP.

SNPs derivados de GWAS validadas y SNPs literatura-seleccionados (Tabla S1) fueron analizados por genotipo individual en el AD extendida, cohortes de CRC y PCA (Tabla 1). Se utilizó el modelo de regresión logística binomial, con el paquete R, para investigar las asociaciones en el contexto del modelo aditivo acción génica para todos los sujetos incluidos en el estudio. Un análisis de regresión logística también se realizó para pacientes con CaP para determinar si cualquiera de los SNPs ensayados se asoció con temprana (& lt; 65 años de edad) PCa inicio. Benjamini-Hochberg corrección se utilizó para comparaciones múltiples.

La heterogeneidad entre las poblaciones de estudio se evaluó con el
I

2 y
p-valor de
Q de Cochran estadística. Para los metanálisis, valores con intervalos de confianza del 95% (IC) se calcularon utilizando agrupados-O
meta función Red de STATA versión 11. Su importancia se evaluó mediante la prueba de Z y
p Hotel & lt; 0,05 fue considerado significativo.

resultados

allelotyping-ADN en común GWAS y validación de ADN individual de los hallazgos GWAS

el GWAS se llevó a cabo utilizando muestras agrupado 15-DNA y la Affymetrix SNP de genoma completo humano matriz 6.0. Los siguientes valores atípicos, identificados por los resultados del ACP, fueron excluidos de los nuevos análisis: 1) una agrupación que representa a 15 sujetos de control masculinos en el TDA /CRC sub-estudio y 2) 10 piscinas que representan a 150 pacientes con CaP y una piscina que representa 15 controles, en el sub-estudio CaP. Una razón por la que muchos de piscinas de pacientes con CaP tuvieron que ser rechazados de la consideración adicional no está claro. Sólo se puede especular con que cierta variabilidad preanalítica, tales como cambios discretos en la calidad del ADN y /o DNA microarrays de hibridación podría afectar a los resultados finales de los experimentos allelotyping.

El combinado-ADN reveló GWAS 44 SNPs candidatos ya sea asociado con AD, el CRC o el CP, de los cuales dos se repitieron en dos comparaciones no relacionados. Teniendo en cuenta las frecuencias de población SNP de 0,2-0,5, nuestra AD /CRC GWAS alcanzó una potencia que van desde 98,6% a 99,8% y del 43% al 64% para detectar el tamaño del efecto de OR = 2,0 y 1,5, respectivamente, a α = 1E-03 , según se estimó de acuerdo con Dupont et al. [28] (Figura S1).

A continuación, los seleccionados SNPs-GWAS fueron validados por el genotipado de muestras de ADN individuales utilizando TaqMan SNP genotipificación ensayos. Cinco candidato SNPs (rs2557030, rs2557227, rs2574608, rs2755895, rs7583683) se excluyeron del análisis estadístico más debido a las desviaciones significativas (
p Hotel & lt; 0,001) del equilibrio de Hardy-Weinberg detectado en el grupo control sano. Aunque TaqMan frecuencias MA genotipado derivados desvió ligeramente de los valores RAS para MA obtenidos en el experimento de microarrays, hubo un acuerdo en el sentido de las diferencias (OR) en las frecuencias de los alelos de cada caso y controla grupos como se muestra por la alélica χ
2-test (con
p Hotel & lt; 0,01) para 30 de los 39 SNPs candidatos: 24 asociada con la AD o CRC (un SNP, rs6702619, se identificó en dos comparaciones separadas) y seis SNPs asociados con CaP (Tabla 2).

estudio de replicación de SNPs seleccionados-GWAS

la Tabla 1 muestra los datos demográficos de los sujetos incluidos en el estudio de replicación. Cuando se utilizó una regresión logística para determinar la importancia de la asociación entre los 30 SNPs seleccionados-GWAS, utilizando caso o control como la variable dependiente y apropiadamente codificado genotipos TaqMan como variables independientes, 17 SNPs fueron significativamente (
p
& lt; 0,05) asociado con AD o CRC en aditivo modelo de herencia (Tabla 3). Siete de los SNPs se mantuvo significativamente asociada después del ajuste de múltiples ensayos. La AA de las tres variantes se asoció con una mayor susceptibilidad CRC, mientras que para cuatro variantes MA se asoció con un menor riesgo. Cuando las frecuencias alélicas entre los casos y los controles fueron evaluados con la χ
2-prueba corregida
p-valor
, se observaron diferencias significativas para los 13 SNPs (Tabla 3).

la evidencia estadística de heterogeneidad entre las frecuencias alélicas entre los grupos de estudio de validación y la replicación se evaluó mediante la prueba Q de
p-valor
. De los 30 SNPs seleccionados-GWAS, 14 reveló heterogeneidad general baja (
p Hotel & gt; 0,1). Entre ellos, las asociaciones significativas en cohortes de estudio de replicación fueron aparentemente más frecuentes, independientemente de la estadística que se usa para determinar la significación de la asociación (Tabla 3). La falta de heterogeneidad puede ser considerada como un criterio de la replicación creíble [29]

Seis de los SNPs asociados significativamente fueron localizados dentro de las regiones génicas intrónicas:.
BTBD9 gratis (proteína que contiene el dominio de CEL /POZ 9),
FAM108C1 gratis (abhydrolase dominio que contienen proteínas),
PRKCA gratis (proteína quinasa C α; PKCa),
ADAMTS19 gratis (una desintegrina y metaloproteinasa con motivos de trombospondina, elemento 19),
BMP6 gratis (proteína morfogenética ósea 6) y
ARHGAP6 gratis (Rho proteína activadora de GTPasa 6) (Tabla 3).

estudio de replicación de la literatura seleccionada SNPs

Treinta y cuatro y nueve SNPs adicionales, previamente demostrado estar asociada con CRC [16], [30] - [45] y PCA [46] - [62] riesgo en varias poblaciones (Tabla S1), respectivamente, también fueron seleccionados para los estudios de replicación llevados a cabo usando los mismos grupos extendidos de casos y controles (Tabla 1). Un SNP (rs6983267 en 8q24.21) era común para ambas localizaciones tumorales. Un SNP (rs10411210) fue excluido del análisis adicionales basándose en el resultado de la prueba de equilibrio de Hardy-Weinberg (
p
& lt; 0,001). Otros cuatro SNP (rs36053993, rs2243250, rs2032582 y rs1057911) también fueron excluidos de la regresión logística, ya que demostraron al menos un LD parcial con otros SNPs en la misma región. Por lo tanto, se asignaron con marcado SNPs, basado en la relación individual más bajo de un SNP missingness y el resultado de la prueba de Hardy-Weinberg menos significativo para los grupos de control.

La asociación de 14 variantes de literatura seleccionada con AD o CRC y cuatro variantes literatura seleccionada con CaP fue confirmada (
p Hotel & lt; 0,05) en el modelo aditivo de la herencia (Tabla 4). La asociación de los SNP rs6983267 se confirmó comunes tanto para el AD y grupos de pacientes con CaP. Sorprendentemente, rs1800894 SNP (
IL10
) se asoció en la dirección opuesta con EA y la susceptibilidad CRC (Tabla 4). El MA de las 10 variantes restantes se asoció con un mayor riesgo y seis variantes con un menor riesgo de CaP, CDN y /o AD. De estos 17 variantes, cinco (rs1800894, rs16892766, rs6983267, rs1859962 y rs4939827) se mantuvo significativa después de la corrección para comparaciones múltiples. Cuando las frecuencias alélicas entre los casos y los controles fueron evaluados con la χ
2-prueba corregida
p-valor
, se observaron diferencias significativas en 11 comparaciones independientes durante siete SNPs (Tabla 4).


Para validar la naturaleza global de estas asociaciones, entre-conjunto de datos se probó la heterogeneidad. En el metanálisis se incluyeron tres SNPs asociados con el CRC y cuatro SNPs asociados con la susceptibilidad CaP en nuestro estudio de replicación para el que se han encontrado asociaciones con el mismo fenotipo en al menos otros cuatro estudios. Un modelo de efectos aleatorios se utilizó para calcular los valores o agrupados. Como se muestra en la Tabla 5, la falta de heterogeneidad demostrable (Q
p-valor
de menos de 0,1) se observó en todos los conjuntos de datos que representan a tres de los siete SNPs, y todos-RUP agrupados fueron significativas (
p
. & lt; 0,001) guía empresas
para comprobar si alguna de las variantes estudiadas se asoció a una edad temprana aparición del CP, se realizó un análisis de regresión logística incluyendo sólo los casos, con un indicador binario para la edad (debajo o por encima de 65 años de edad, codificadas como 1 y 0, respectivamente) en el diagnóstico de CaP y los SNPs estudiados como variables independientes. Hubo 171 pacientes diagnosticados a los 65 años o antes, y 247 pacientes mayores de 65 años dos SNPs se asociaron significativamente con la edad al momento del diagnóstico de CaP (Tabla S2): rs1934636 y rs6983267. El primero, un SNP seleccionado por el GWAS, fue más frecuente en el grupo de pacientes de mayor edad (OR = 0,6, IC 95%: 0,39 a 0,93,
p =
2.18E-02), teniendo en cuenta el modelo de acción gen dominante . Por el contrario, la variante rs6983267 se asoció con una menor edad del paciente en el análisis estratificado por edad; OR = 1,40, IC del 95%: 1,01 a 1,95,
p =
4.44E-02).

Discusión

agrupado utilidad GWAS basada en el ADN

en general se acepta que los GWAS bien diseñado debería llevarse a cabo con grupos de al menos 1.000 pacientes y 1.000 controles, a pesar de que los niveles apropiados de poder estadístico para detectar si existen asociaciones genéticas (a
p Hotel & lt; 5E-08) a menudo se relacionan con mayores tamaños del efecto [14]. Estos umbrales de importancia GWAS son el resultado de la necesidad de corregir para comparaciones múltiples y están dirigidas a reducir al mínimo el número de resultados falsos positivos [8]. Sin embargo, los criterios estadísticos excesivamente restrictivas pueden, a su vez, producir resultados falsos negativos [11] - [13]. De hecho, esas asociaciones significativas de la repetición de estudios independientes no se clasificaron en los primeros 1.000 SNPs en el GWAS inicial [46]. Por lo tanto, el uso de criterios estrictos pueden impedir la detección de asociaciones sutiles y dar cuenta de la heredabilidad faltante [14]. También se reconoce que existe cierto nivel de heterogeneidad en los resultados GWAS, que pueden surgir debido a los diferentes antecedentes genéticos (estratificación de la población) de las poblaciones geográficamente distintas [41], [63], [64], o debido a la polarización introducido por los efectos de mezcla de población [65], [66]. Aunque pocos loci de susceptibilidad CRC (como 8q24.21, 8q23.3 o 18q21.1) se han replicado en varios estudios [41], es sintomático que algunas de las asociaciones identificadas reflejan las diferencias entre las poblaciones de tumor subsitio , la edad del /EA de inicio, el sexo o el estado de fumar CRC dentro de los grupos estudiados [41]. Por lo tanto, los grandes estudios de cohortes pueden ignorar algunas variantes de riesgo de la subpoblación específica, por lo que el genotipado de todo el genoma deben ser también llevado a cabo en cohortes más pequeñas. Por el contrario, los estudios con tamaños de muestra más bajos suelen revelar una fracción más pequeña de la herencia de una enfermedad compleja al no detectar las asociaciones que no alcanzan significación estadística [7].

Dado que los resultados finales GWAS dependen de muchos factores, cada uno asociado a una etapa diferente del procedimiento experimental, el análisis y la interpretación son a menudo un desafío. Es esencial darse cuenta de que los resultados reflejan GWAS, en el mejor, las diferencias en el material genético de los casos y controles que se utilizan para el análisis. Aunque esto puede parecer obvio, destaca una de las condiciones fundamentales necesarias para una exitosa GWAS. Por lo tanto, se deben emplear los criterios diagnósticos precisos para obtener grupos homogéneos, como una distribución no aleatoria de individuos con rasgos que se rigen por fuertes determinantes genéticos, como mutaciones de un solo gen, sesga fuertemente el resultado final GWAS.

A pesar de que nuestra agrupado basado en el ADN GWAS representan estudios con una muestra pequeña, se identificaron 30 SNPs excesivamente significativamente en los grupos estudiados (Tabla 2), los cuales fueron validados por TaqMan genotipo de las muestras de ADN individuales. Los estudios de replicación seleccionaron 17 candidatos variantes de riesgo asociados con el CRC, teniendo en cuenta el modelo aditivo de la herencia (Tabla 3). Estas asociaciones no se había informado anteriormente. Siete de ellos permanecieron significativas después de la corrección de múltiples pruebas de hipótesis.

A pesar de que no todos los seleccionados SNPs-GWAS susceptibilidad tendrá una asociación funcional directa con un fenotipo de cáncer, un cuidadoso análisis de los resultados mostró que GWAS los SNPs localizados en regiones intrónicas o en los bloques de LD con genes cercanos tienen un potencial de influir en el desarrollo del cáncer (Tabla 3). , varios genes de susceptibilidad candidato notables (
PRKCA
,
BMP6
,
ADAMTS19
,
ARHGAP6
,
FUT9 /8
,
FAM108C1
,
CHL1
,
BTBD9
y
WDR52
) están involucrados en los procesos de disposición del citoesqueleto de actina, adhesión celular y la motilidad celular, que son importantes para la invasión del cáncer y la metástasis.

el rs3803820 situado en el
PRKCA
gen (17q24.2) fue seleccionado en el sub-estudio CRC, mostrando OR = 1,27 (
p
= 2.24E-02). Otro candidato SNP rs13192135, que mostró un fuerte efecto de tamaño OR = 0,47 (
p =
1.07E-02) en el grupo masculino CRC, se encuentra en 6p24.3 en la región intrónica de la
BMP6
gen. Del mismo modo, fuerte asociación tanto con AD y el riesgo de CCR, de la variante rs4939827 conocida de
SMAD7
gen se indicó en el presente estudio (Tabla 4). Esto está de acuerdo con varios estudios previos que muestran asociación de la variación genética en los genes relacionados con la vía BMP /Smad con el riesgo de CCR [32], [33], [67].

El SNP rs9848984 en 3p26.3 , aguas abajo a la estrecha homólogo de L1 (
CHL1
) de genes, se encuentra en el bloque de LD que implica el extremo 3 'del gen. CHL1 está implicada en el crecimiento del cáncer y en la metástasis de diferentes cánceres humanos, incluyendo de colon y de mama [68]. La observación de que tanto los niveles de ARNm y de proteína de ARHGAP6 fueron elevados en los tejidos y líneas celulares de CRC sugiere que puede servir como un biomarcador para el desarrollo y la progresión de CRC [69]. Del mismo modo, un alto nivel de metaloproteasa
se observó ADAMTS19
expresión en varios tejidos tumorales y líneas celulares [70]. A su vez, se demostró que la actividad FAM108C1 para predecir el desarrollo de metástasis a distancia [71].

El SNP rs2799652 se encontró en la región promotora del alfa- (1,3) -fucosyltransferase (
FUT9
) de genes, responsable de la biosíntesis del antígeno Lewis X, un antígeno asociado al cáncer expresa preferentemente en los pólipos de colon premalignas [72]. FUT8, a su vez, es responsable de la modulación de la función E-cadherina [73]. Estudios anteriores demostraron que
FUT8
y E-cadherina niveles de expresión fueron significativamente mayores en las muestras de CRC primaria y que la adhesión célula-célula E-cadherina núcleo fucosilación mejorado en el carcinoma de colon [74]. Tanto
FUT9
y aguas abajo de
FUT8
variaciones genéticas demostraron ser asociado con el riesgo de CCR en este estudio (Tabla 3). Curiosamente, nuestro estudio reveló también la replicación asociación entre la variación de la secuencia intrónica (rs9929218) en el gen de la E-cadherina (
CDH1
) y el riesgo de EA, especialmente en los varones (Tabla 4).

replicado asociaciones previamente comunicados entre cuatro CaP y variantes de riesgo /CRC 14 AD en nuestras cohortes basado en Polonia. Cuatro SNP (rs1859962, rs7931342, rs1447295 y rs6983267) fueron ampliamente reportados como variantes de riesgo de CaP en caucásicos, africanos o las poblaciones de Asia [46], [48] - [51], [55] - [58], y se puede considerar mundial marcadores de susceptibilidad CaP. En el caso de CRC, se informó de 11 loci de susceptibilidad a menudo en estudios previos [41]. Siete de estos loci fueron reproducidas en el presente estudio: 8q23.3, 8q24.21, 11q23.1, 15q13.3, 16q22.1, 18q21.1, 20p12.3. En un estudio de cohortes con sede en Suecia, cinco de la misma 11 loci mostraron una significativa O [42]. La falta de confirmación de 11q23.1 loci, 16q22.1 y 20p12.3 en el estudio sueco puede haber resultado de su asociación con el riesgo de cáncer en los hombres en su mayoría, a diferencia de la mujer, y /o porque están asociados con AD en lugar de CRC riesgo, tal como se indica por nuestros resultados (Tabla 4).

Curiosamente, el análisis estratificado reveló que la asociación de rs4939827 (18q21.1) de variante se limita sólo a las mujeres (OR = 0,6; IC del 95%: 0,42 hasta 0,88

El conocimiento de la salud

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]