Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Análisis Descubrimiento de TCGA revelan los datos de Asociación entre la línea germinal Genotipo y la supervivencia en cáncer de ovario pacientes

PLOS ONE: Análisis Descubrimiento de TCGA revelan los datos de Asociación entre la línea germinal Genotipo y la supervivencia en cáncer de ovario pacientes


Extracto

Antecedentes

El cáncer de ovario sigue siendo una carga importante para la salud pública, con la tasa de mortalidad más alta de todos los cánceres ginecológicos. Esto es atribuible a la última etapa en la que se diagnostica la mayoría de los cánceres de ovario, junto con la respuesta de baja y variable de tumores avanzados a las quimioterapias estándar. Hasta la fecha, los predictores clínicamente útiles de la respuesta al tratamiento siguen careciendo. La identificación de los determinantes genéticos de supervivencia del cáncer de ovario y la respuesta al tratamiento es crucial para el desarrollo de biomarcadores pronósticos y terapias personalizadas que pueden mejorar los resultados para los pacientes en etapa tardía que constituyen la mayoría de los casos.

Métodos

para identificar las variaciones genéticas constitucionales que contribuyen a la mortalidad del cáncer de ovario, hemos investigado sistemáticamente asociaciones entre los polimorfismos de la línea germinal y la supervivencia del cáncer de ovario utilizando los datos del proyecto Atlas del Genoma del cáncer (TCGA). El uso de riesgos proporcionales de Cox de regresión etapa estratificado, se examinaron 650.000 SNP loci para la asociación con la supervivencia. Estamos, además, examinamos si la asociación de SNPs significativas con la supervivencia fue modificada por alteraciones somáticas.

Resultados

polimorfismos rs4934282 en la línea germinal (AGAP11 /C10orf116) y rs1857623 (DNAH14) se asociaron con ajustado etapa la supervivencia (= 1.12e-07 y 1.80e-07, FDR = 1.2e-04 y 2.4e-04, respectivamente). Un tercer SNP, rs4869 (C10orf116), fue identificado además como significativa en los datos de secuenciación del exoma; es casi perfecta en LD con rs4934282. Las asociaciones con la supervivencia siguieron siendo significativas cuando se producen alteraciones somáticas.

Conclusiones

análisis de descubrimiento de datos TCGA revela variaciones genéticas en la línea germinal que pueden desempeñar un papel en la supervivencia del cáncer de ovario, incluso en los casos en etapa tardía. Los loci importantes se encuentran cerca de genes previamente reportados como tener una posible relación con la respuesta de platino y taxol. Debido a que la variante de alelos en los loci significativos son comunes (frecuencias de alelos rs4934282 A /C = 0,54 /0,46, respectivamente; rs1857623 A /alelos G = 0,55 /0,45, respectivamente) y germinal variantes pueden ensayarse de forma no invasiva, nuestros resultados proporcionan objetivos potenciales para una mayor exploración como biomarcadores pronósticos y terapias individualizadas

Visto:. Braun R, R Finney, Yan C, Chen QR, Hu y, Edmonson M, et al. (2013) Análisis Descubrimiento de TCGA datos revelan Asociación entre la línea germinal Genotipo y la supervivencia en cáncer de ovario pacientes. PLoS ONE 8 (3): e55037. doi: 10.1371 /journal.pone.0055037

Editor: Amanda Ewart Toland, Ohio State University Medical Center, Estados Unidos de América

Recibido: 9 de noviembre de 2011; Aceptado 21 de diciembre de 2012; Publicado: 21 Marzo, 2013

Este es un artículo de acceso abierto, libre de todos los derechos de autor, y puede ser reproducido libremente, distribuir, transmitir, modificar, construir, o de otra forma utilizado por cualquier persona para cualquier propósito legal. El trabajo está disponible bajo la advocación de dominio público Creative Commons CC0

Financiación:. Los autores son apoyados por el Programa de Investigación Intramural del Instituto Nacional del Cáncer, United States National Institutes of Health, Bethesda, MD. No hubo fuentes externas de financiación para este estudio. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

el cáncer de ovario representa aproximadamente el tres por ciento de todos los cánceres en las mujeres y es la quinta causa principal de muerte por cáncer en las mujeres en los Estados Unidos, con una tasa de incidencia ajustada por edad de 12,8 por cada 100.000 mujeres por año y la tasa de mortalidad de 8,6 por cada 100.000 mujeres por año (2003-2007) [1]. De los cánceres ginecológicos, cáncer de ovario tiene la mortalidad más alta, con una tasa global de supervivencia a cinco años del 43,7% para las mujeres blancas y 34,9% para las mujeres negras [1]. Las estadísticas de supervivencia pobres son atribuibles a la última etapa en la que se les diagnostica cáncer de ovario debido a su carácter asintomático: mientras que los tumores en estadio I tienen una tasa de supervivencia relativa de 92,4%, que cuenta sólo para el 15% de los diagnósticos de cáncer de ovario; por el contrario, estadio III y IV de los cánceres tienen tasas de supervivencia de 34% y 18%, respectivamente, y juntos representan el 65,4% de los diagnósticos [1]. La respuesta a la quimioterapia estándar (platino junto con taxano) es muy variable [2], [3], y tiende a ser pobre para los casos avanzados [2]. La comprensión de los determinantes genéticos de supervivencia del cáncer de ovario y la respuesta al tratamiento puede mejorar estas estadísticas, en particular para la etapa III y IV pacientes que constituyen la mayoría de los casos. En particular, la identificación de variaciones que predicen la respuesta a la quimioterapia permite la posibilidad de administrar las terapias alternativas que pueden mejorar los resultados.

Los estudios anteriores han examinado el papel de la variación genética en la susceptibilidad del cáncer de ovario, la progresión, la respuesta al tratamiento y la supervivencia . Se ha demostrado que las mutaciones BRCA1 /2 de la línea germinal contribuyen al 10-15% de los casos también se ha demostrado [4], y el análisis de datos del proyecto Atlas del Genoma del Cáncer (TCGA [5]) que esa mutación BRCA1 /2 de la línea germinal, somática mutaciones y promotor de la metilación del efecto de supervivencia de cáncer de ovario [5]. Además, los estudios de genes candidatos han mostrado que los polimorfismos en MDM2, junto con el estado TP53 y SULF1, están asociados con la supervivencia del cáncer de ovario [6] - [8]. Recientemente, Huang y colaboradores informaron de una variación genética se asocia con la citotoxicidad carboplatino in vitro e in vivo [3], un hallazgo que puede explicar la capacidad de respuesta diferencial a la terapia estándar cáncer de ovario basado en platino. Los mismos autores posteriores mostraron que el locus identificado regula miRNAs que contribuyen a la sensibilidad de platino, lo que sugiere un mecanismo de acción [9].

Hasta la fecha, sin embargo, un marcador genómico clínicamente útil de la supervivencia del cáncer de ovario sigue siendo difícil de alcanzar. No se encontró el SNP platino asociado investigado por Huang que se asociaron significativamente con la supervivencia en una cohorte de validación [3]. Del mismo modo, Bolton y colaboradores identificaron con éxito varios loci asociados con la susceptibilidad al cáncer de ovario, pero aquellos que encontraron inicialmente para ser asociado con la supervivencia no alcanzó significación en el conjunto de validación [10], aunque se espera que los futuros estudios de esta cohorte se resultar en asociaciones establecidas con el resultado clínico [10]. Mientras que la expresión de genes tumor Firmas predictivo de la respuesta al tratamiento y la recaída se ha informado (por ejemplo, [11], [12]), su utilidad clínica es limitada por el coste, la invasividad y la variabilidad inherente a la evaluación de la expresión de genes tumor. Del mismo modo, recientemente se han reportado cambios de número de copias somáticas en ciertos genes para influir en la supervivencia [13], pero la utilidad de medir la CNV como una prueba de pronóstico es igualmente limitado.

El proyecto Atlas del Genoma del Cáncer (TCGA [5] ) proporciona un conjunto de datos genómicos y clínicos en los que las asociaciones entre la genética y la supervivencia se pueden explorar a fondo. A continuación, se realiza un análisis de todo el genoma para investigar sistemáticamente las asociaciones entre los
línea germinal
variación genética y la supervivencia global en pacientes TCGA diagnosticado con cáncer de ovario (cystadenocarcinoma serosa) [14]. Los pacientes tenían una distribución de la edad y la etapa típica de cáncer de ovario, como se muestra en la Tabla 1. Utilizando el clínico y Affymetrix SNP6.0 ( "SNP6") genotipo de datos, hemos identificado dos loci polimorfismo de nucleótido único (SNP) en el que el genotipo de la línea germinal es predictivo de la supervivencia global en pacientes con cáncer de ovario. Las asociaciones siguen siendo significativas después de ajustar por etapa, y están asociados con la supervivencia incluso entre pacientes en estadio III. Esto sugiere que la variación genética constitucional puede desempeñar un papel en la respuesta al tratamiento y proporciona una posible vía para una prueba de biomarcador pronóstico no invasiva.

Resultados

A continuación, se presenta la asociación entre SNPs de la línea germinal y supervivencia de los pacientes con cáncer de ovario a partir de datos del TCGA. Los datos filtrados comprendían un total de 662,521 SNPs ensayadas en 489 muestras de cáncer de ovario clínicamente anotado, con distribuciones estadio y la edad tal como se indica en la Tabla 1. Cada uno de los 662,521 SNPs que satisfacen los criterios de filtración fueron probados para la asociación con el uso de la supervivencia de Cox de regresión de riesgos proporcionales de ajustar para la etapa utilizando un modelo no aditivo. Dos SNPs, rs4934282 (A /C) en el gen AGAP11 (previamente asociado con C10orf116) y rs1857623 (A /G) aguas arriba de DNAH14, mostraron una asociación estadísticamente significativa univariante con la supervivencia global del cáncer de ovario, que se resumen en la Tabla 2. Una parcela de los-valores obtenidos se indican en la figura 1. Tenemos, además, calculamos los ratios por alelo de riesgo para estos SNPs utilizando un modelo aditivo, obteniendo HR = 0,599 (= 1.28e-08) para el alelo en rs4934282 y HR = 1,425 (= 1.70e-05) para el alelo en rs1857623. Cabe señalar que, debido al tamaño pequeño de la muestra, la potencia para detectar un SNP con MAF = 0,45 (ya que estos son) con = 1e-06 es 32% de HR = 0,6 y 3,5% para HR = 1,4; por tanto, es probable que otros SNPs con tamaños del efecto similares pueden haberse perdido por casualidad en este análisis
.
solar cuantil-cuantil de los valores observados para las pruebas de coeficiente de riesgo de los modelos de Cox etapa ajustados frente a la distribución esperada de valores bajo hipótesis nulas independientes. Los puntos por encima de la línea indican valores que son más importantes de lo esperado; una gran desviación sistemática de esta línea sería indicativa de la población subestructura conducir los resultados. Los dos SNPs identificados como significativos, rs4934282 y rs1857623, se sitúan muy por encima de la red y fuera de la pequeña desviación sistemática.

Para ilustrar el efecto de rs4934282 (AGAP11 /C10orf116) y rs1857623 (DNAH14 ) el genotipo de la línea germinal en la supervivencia entre los pacientes con estadio tumoral similares, de Kaplan-Meier parcelas para la etapa III 372 pacientes se presentan en las figuras 2 y 3. en particular, el genotipo CC en rs4934282 en AGAP11 /C10orf116 confiere un efecto protector, casi el doble de la mediana el tiempo de supervivencia por encima del grupo de genotipo AA. Además, los pacientes con CC homocigóticos en rs4934282 tienen una tasa de supervivencia a cinco años del 45%, frente a 34% en general para la Etapa III, los pacientes [1].

gráficos de supervivencia de Kaplan-Meier para los pacientes en estadio III, estratificados por el genotipo de la línea germinal en rs4934282 (AGAP11): AA, negro; AC, azul; CC, rojo. Los intervalos de confianza se muestran como una región sombreada alrededor de cada curva de Kaplan-Meier. observaciones censuradas se denotan con las señales verticales. Las líneas horizontales y verticales discontinuas marcan% de supervivencia de 50 y cinco años (1825 días), respectivamente

de Kaplan-Meier parcelas de supervivencia para pacientes en estadio III, estratificados por genotipo en la línea germinal (rs1857623): DNAH14. AA, negro; AG, azul; GG, de color rojo. Los intervalos de confianza se muestran como una región sombreada alrededor de cada curva de Kaplan-Meier. observaciones censuradas se denotan con las señales verticales. Las líneas horizontales y verticales discontinuas marcan el 50% de supervivencia a cinco años (1825 días), respectivamente.

Para investigar más la variación en las regiones genómicas que rodean a estos SNPs, hemos examinado exoma /datos de secuenciación de captura (por 375 los pacientes con datos disponibles de la línea germinal) en 100 Kbp ventanas centradas sobre los dos SNPs identificados como significativos en los datos SNP6, chr10 específicamente: 88.672.456 a 88.772.455 y chr1: 223081228 a 223.181.227. Durante diez muestras con los datos disponibles de todo el genoma, hemos sido capaces de comparar la rs4934282 y rs1857623 intrónica Affymetrix SNP6.0 Las llamadas a los de la secuenciación de todo el genoma, lo que confirma la validez de las llamadas SNP6. De los SNPs 29 exoma /captura analizadas (véase la Tabla 3) en las 375 muestras, sólo rs4869 en C10orf116 siguieron siendo significativas después de ajustar por las múltiples hipótesis (FDR = 9.89e-03). rs4869 se encuentra p.e. aguas arriba de rs4934282 y está en desequilibrio de ligamiento casi perfecta con rs4934282 (A /C en rs4934282 correlacionar con C /T en rs4869, respectivamente). rs4869 codifica una mutación sinónima en C10orf116 (Ile68Ile). También se investigó si los alelos variantes en cualquiera de estos loci 29 dieron lugar a alteraciones en proteínas no sinónimas nocivos; sólo cinco SNPs tenían variaciones alélicas mal sentido, ninguno de los cuales se prevé que ser nocivo (Tabla 4).

Finalmente, se utilizaron los datos derivados de las muestras tumorales normales emparejados para evaluar si el fuerte efecto del genotipo de la línea germinal en la supervivencia fue mediado significativamente o moderada por el aumento de la expresión del gen del tumor o pérdida del número de copias en el tumor, o por la pérdida de heterocigosidad (ver S1 File) para probar la hipótesis de que el efecto del genotipo de la línea germinal en el cáncer de ovario supervivencia se vería influenciada por los acontecimientos somáticos. No se encontró asociación significativa de la expresión de genes del tumor, copiar la variación del número, o la pérdida de heterozigosidad en estas regiones con la supervivencia (ver S1 Archivo). Más bien, el gran efecto del genotipo de la línea germinal en los loci en la supervivencia del paciente es independiente de estos cambios somáticos, y parece sugerir que la variación genética constitucional en estas regiones juega un papel en la respuesta al tratamiento.

Discusión

estudios recientes han demostrado que las variantes genéticas comunes están asociados con el riesgo de cáncer de ovario [15], [16]. Sin embargo, sigue siendo difícil de predecir la supervivencia del cáncer de ovario independiente del estadio; hallazgos clínicos actuales muestran que la respuesta tumoral y la resistencia a los medicamentos extrema in vitro no son buenos predictores de la supervivencia del cáncer de ovario [17], [18]. En nuestro estudio, hemos probado exhaustivamente los SNPs ensayadas en los datos TCGA SNP6.0 para la asociación con la supervivencia, y, además, analizado todo el genoma y SNPs exoma /captura en las regiones genómicas que rodean los SNPs SNP6.0 significativos. Se identificaron tres SNPs en dos regiones genómicas que tuvieron una asociación estadísticamente significativa con la supervivencia. Como se muestra en la Tabla 2, los cocientes de riesgos para los alelos menores homocigotos de alcanzar o superar al doble en los modelos de riesgo proporcional de Cox etapa estratificado, y los tamaños por alelo-efecto para estos SNPs utilizando un modelo de genotipo aditivo etapa estratificado fueron HR = 0,599 y HR = 1,425 para rs4934282 y rs1857623, respectivamente. Curiosamente, ninguna de las variaciones somáticas que examinamos (la expresión de genes del tumor, copiar la variación del número, y la pérdida de heterozigosidad) se asociaron, ya sea con el genotipo de la línea germinal en estos loci o con la supervivencia, a pesar de una hipótesis plausible que los cambios somáticas en el tumor podrían tener una efecto sobre la supervivencia de asociación genotipo. Más bien, estos SNPs son fuertemente predictivos de la supervivencia independiente de los cambios somáticos que ya habían ocurrido en el tumor (ver S1 Archivo).

Dos de los SNPs supervivencia asociada están situadas en una región 2.200 pares de bases en el cromosoma 10 ( rs4934282 en chr10: 88732476 y rs4869 en chr10: 88730312) y están en LD casi perfecta en estos datos. Esta región genómica se asocia con C10orf116 (chr10: 88.727.949 a 88.730.672) y AGAP11 (chr10: 88.730.498-88769960), que se solapan; la importancia biológica de la variación sondeado por rs4934282 y rs4869 puede estar asociada con cualquiera de los dos. AGAP11 es un miembro de la repetición de anquirina y la proteína activadora de GTPasa dominio Arf GTPasa de la familia de genes [19]. C10orf116 (también referido como APM2) es una proteína de función desconocida que es homóloga a la cadena media de complejo de la proteína clatrina asociado de mamíferos y está implicado en el transporte vesicular en la levadura. La región genómica que contiene rs4934282 y rs4869 se muestra en la Figura 4.

La descripción detallada de la región genómica del cromosoma 10 que contiene rs4934282 (SNP segundo desde la derecha) y rs4869 (en verde). Tenga en cuenta la superposición entre AGAP11 y C10orf116.

Si bien existe poca evidencia previa que une AGAP11 a la susceptibilidad al cáncer, la supervivencia o la respuesta al tratamiento, existe alguna evidencia para el papel de C10orf116. expresión C10orf116 /APM2 ha sido implicado en otros cánceres ginecológicos; por ejemplo, se ha demostrado que diferenciar fuertemente entre las subclases de tumores de mama BRCA1 asociada ESR1-positivos y ESR1-negativos [20] y se ha encontrado para ser downregulated en el cáncer de utering en un número de estudios [21]. Más recientemente, C10orf116 se ha demostrado que presentan expresión diferencial en diferentes grados patológicos de carcinoma de ovario [22] y en la respuesta del cáncer de mama a la quimioterapia [23], [24].

Más importante aún, no existe desde líneas de células que apuntan a C10orf116 como un mediador de la resistencia a cisplatino. El cáncer de ovario se ha tratado con compuestos de platino durante muchos años [25], [26], con cisplatino y carboplatino (que tiene un perfil de toxicidad más acceptible) como una terapia estándar para la etapa III cánceres de ovario de nuevo diagnóstico [26], [27 ]. Sin embargo, mientras que muchos de los pacientes responden al tratamiento inicial, las tasas de supervivencia de cinco años siguen siendo pobres (34% en total para la fase III [1]). APM2 (C10orf1116) se ha demostrado para promover la resistencia a cisplatino cuando se sobreexpresa en líneas celulares HCT116 que eran sensibles a la quimioterapia y la radiación [28], lo que sugiere un posible mecanismo por el cual rs4869 y rs4934282 influir en la supervivencia. El silenciamiento de APM2 por shRNA se muestra para mejorar los efectos citotóxicos del cisplatino sobre xenoinjertos de tumores que crecen en ratones CD-1 desnudos. Además, APM2 se encontró que se sobreexpresa en células de cáncer gástrico resistentes a cisplatino, pero no en células de cáncer gástrico resistentes a 5-FU o doxorrubicina [29]. Más recientemente, se ha descubierto que rs1649942, un SNP localizado 5 Mb aguas arriba de rs4934282 /rs4869, tenía una modesta asociación con carboplatino citotoxicidad inducida y la supervivencia de pacientes con cáncer de ovario después de la quimioterapia basada en carboplatino [3]. A pesar de que este SNP no alcanzó significación en su análisis de validación de la fase 2 (y del mismo modo no significativo en nuestro estudio), que se suma al conjunto de evidencias que implican a esta región genómica en la sensibilidad al platino.

El tercer significativa SNP rs1857623, , se encuentra en una región intergénica en el cromosoma 1, 53 Kb aguas arriba de DNAH14 y 136 Kb aguas abajo de CNIH3. DNAH14 pertenece a la familia de cadena pesada de dineína, un motor de proteínas que se une a los microtúbulos y camina a lo largo de los microtúbulos del citoesqueleto [30]. El mecanismo por el cual la variación en DNAH14 puede afectar la supervivencia es menos claro. Una posible vía para futuros estudios es su papel potencial en el contexto de la terapia taxol: DNAH14 contiene el tallo de unión a microtúbulos de motor dineína (pfam12777 en Ubicación: 2910 a 3244 de la proteína de referencia NP_001364.1), y se ha demostrado que el taxol Se liga microtúbulos [28]. DNAH14 también se ha encontrado para ser regulados diferencialmente en respuesta a la terapia de taxano en cáncer gástrico [31] y la terapia de la doxorubicina en células endometriales [32].

Estos hallazgos sugieren que las variaciones genéticas constitucionales que en estas regiones pueden desempeñar un papel en la supervivencia del cáncer de ovario, incluso en los casos en etapa tardía. Sin embargo, hay que señalar que los resultados presentados aquí constituyen un análisis basado en el descubrimiento de que no incluía una cohorte de validación. Como tales, los resultados pueden ser falsos positivos falsos, y requieren confirmación en estudios de seguimiento. Si validado, estos SNPs pueden tener importante potencial clínico como biomarcadores de pronóstico ya que el genotipo de la línea germinal se puede ensayar de forma no invasiva y porque los alelos variantes en los loci significativos son comunes (frecuencias para los alelos rs4934282 A /C = 0,54 /0,46, respectivamente; rs1857623 A /alelos G = 0,55 /0,45, respectvely; equiparable al alelo frecuencias para la población caucásica en CEPH HapMap [33]). Los loci significativos se encuentran en genes previamente identificados como teniendo una posible relación con la respuesta a la quimioterapia, lo que sugiere que su asociación con la supervivencia puede ser debido a su influencia en la respuesta al tratamiento. Nuestro estudio sugiere posibles objetivos para las pruebas prognositic y terapias individualizadas, y proporciona una base para la investigación de seguimiento.

Materiales y Métodos

Datos

Los datos fueron recolectados por el TCGA proyecto como se describe en otra parte [14]. Seguimiento de los tiempos, el estado vital, el estadio del tumor, y el genotipo de datos de la línea germinal se obtuvieron del proyecto TCGA [14] a través del portal de datos en 06/03/2011.

SNP6 genotipos.

genotipo llamadas para las sondas de SNP 906,600 ensayados usando la plataforma Affymetrix todo el genoma SNP6.0 y procesados ​​usando alpiste se obtuvieron de TCGA. Se retiraron muestras que no pasaron el control de calidad TCGA (por el número de copia de archivos de datos de muestra Relación Formato TCGA). Un total de 496 pacientes cystadenocarcinoma seroso de ovario tenía tiempo de supervivencia y el genotipo de datos de la línea germinal (normal, ya sea de sangre o adyacente tumorales). genotipo llamadas se codificaron como 0, 1 o 2 de acuerdo con el número de alelos variantes y se filtran de acuerdo con un umbral de confianza Birdseed de 0,05.

Los datos de genotipo fueron objeto de criterios adicionales de control de calidad de filtración de la siguiente manera. Se excluyeron los SNPs con tarifas de llamadas o frecuencias de alelos menores, al igual que los SNPs fuera del equilibrio Hardy Weinberg con. Se excluyeron todas las muestras con un tipo de referencia por debajo del 80%. Identidad por estado se calcula utilizando el paquete R GenABEL, y se retiraron muestras estrechamente relacionados con SII. El SNP y los criterios de filtración de muestra se aplicaron de forma iterativa hasta que todas las muestras y SNPs cumplen los umbrales establecidos. En total, 489 muestras y 662,521 SNPs pasado se mantuvieron en el análisis.

El estadio tumoral.

subcategorías Escenario se unieron a los efectos de este análisis en resumidas categorías etapas que pueden alcanzar cuatro clasificaciones de la etapa (es decir, , Etapa IA, IB, IC fueron tratados en la fase I, etc.). El número de muestras en cada categoría etapa se da en la Tabla 1.

Datos Exoma /captura.

La siguiente generación exoma /datos de secuenciación de captura también se recuperaron para 375 pacientes con datos disponibles de la línea germinal. El análisis se restringió a 100 Kbp ventanas centradas sobre los dos SNPs identificados como significativos en los datos SNP6, chr10 específicamente: 88.672.456 a 88.772.455 y chr1: 223.081.228 hasta 223.181.227. descripciones gráficas de estas regiones genómicas se proporcionan en las Figuras 5 y 6.

Imagen de cgwb.nci.nih.gov de pistas seleccionadas para construir genoma NCBI36 (hg18) para la región que rodea dos variaciones de la línea germinal asociado con la supervivencia en cáncer de ovario en la región C10orf116 /AGAP11 en el cromosoma 10. las pistas son una pista a medida que muestra los rs4869 SNP rs4934282 y, RefSeq gen, ARNm, y empalmados EST mapability.

imagen de cgwb.nci.nih .gov de pistas seleccionadas para construir genoma NCBI36 (hg18) para la región que rodea a una variación de la línea germinal asociadas con la supervivencia en el cáncer de ovario aguas arriba de DNAH14 en el cromosoma 1. las pistas son una pista a medida que muestra los SNP rs1857623, RefSeq gen, ARNm empalmados EST y mapability.

Binary Sequence Alignment /Map archivos (BAM) fueron descargados de dbGaP, utilizando para cada muestra el mayor archivo de BAM normales disponibles. El "mpileup" y "bcftools" características de SAMtools [34] se utilizaron para generar la información de la variante llamada, con llamar a los criterios de la siguiente manera: si la cobertura en una muestra dada para un locus determinado era inferior al umbral de cobertura (véase el párrafo siguiente ), no se hizo ninguna llamada; De lo contrario, si no es de referencia de frecuencia alelo fue de menos de 10%, la llamada fue "referencia homocigotos;" si la frecuencia no es de referencia fue mayor que 90%, la llamada fue "nonreference homocigotos;" si era entre 10% y 90 %, la llamada era "heterocigoto".

para establecer el umbral de la cobertura de los datos exoma /captura, se compararon las llamadas exoma /captura a las llamadas genotipo SNP6 línea germinal para 41 SNPs etiqueta situados en estas regiones. El tratamiento de la SNP6 llama como el estándar de oro para la exactitud, definimos la "tasa de falta de coincidencia" que es el número de llamadas para exoma /captura de datos y SNP6 diferir, dividido por el número total de llamadas exoma /captura hechas a esa profundidad cobertura. A medida que aumenta el umbral de cobertura y los datos del exoma /captura se vuelve más fiable, disminuye la velocidad de desajuste, pero menos llamadas exoma /captura se pueden hacer. Hemos variado el umbral de cobertura de 5 a 30, la selección de la cobertura más baja que produjo una tasa de falta de coincidencia más pequeño que 0,05. La cobertura óptima fue de 9 (con una tasa de falta de coincidencia de 0.045)

Hemos considerado un lugar que ha de ser de carácter informativo (es decir, tener suficiente variación) si al menos 20 muestras tenían una llamada de línea germinal heterocigotos en ese umbral de cobertura.; estos criterios de rendimiento del 29 SNPs informativos totales en las 100 regiones que rodean Kbp rs4934282 y rs1857623, que se muestran en la Tabla 3, que hemos considerado en el análisis.

El análisis de supervivencia

El análisis de supervivencia se realizó en R [35] utilizando el paquete de "supervivencia" [36]. Para cada SNP representados en los datos, Cox de riesgos proporcionales de regresión se utiliza para modelar la supervivencia como una función del genotipo. Debido a la asociación significativa con la supervivencia de la etapa, todos los modelos fueron estratificados por el escenario. genotipo llamadas fueron tratados como variables categóricas con 0 como el grupo de referencia para evitar la imposición de linealidad en el número de alelos variantes. Cada modelo produjo dos cocientes de riesgos por SNP (una para el genotipo = 1 con respecto al genotipo = 0 y otro para el genotipo = 2 w.r.t. genotipo = 0). La importancia de la asociación se evaluó mediante el logaritmo del rango (Partitura) prueba [37]. Una prueba de residuos de Schoenfeld se utilizó para comprobar si se cumplía el supuesto de proporcionalidad; sólo modelos con fueron considerados válidos. 639,510 SNPs analizados cumplen el supuesto de proporcionalidad.

Debido al gran número de SNPs implica un gran número de hipótesis que se prueba, se hicieron varios ajustes a los valores de prueba. Esto se hizo de dos maneras. Se presenta tanto la tasa de falsos descubrimiento [38] () para los valores obtenidos para las pruebas paramétricas descritas anteriormente. Además, nos informan de los valores obtenidos mediante permutación 600.000 resamplings independientes de los datos. pruebas de permutación, mientras que computacionalmente intensivas, se considera que el control más fuerte y más apropiado de las tasas de error de tipo I en todo el genoma estudios [39] - [41]

Para investigar la existencia y el efecto de cualquier estratificación de la población. se utilizó el paquete GenABEL R [42] para examinar subestructura población. El factor de inflación genómico se estimó en, lo que indica que la población subestructura, si está presente, no debe tener ningún efecto apreciable sobre los resultados. El uso de un conjunto seleccionado de forma aleatoria de 12.000 pares (LD) SNP independientes con MAF, la población subestructura se examinó mediante análisis de componentes principales. gráficos por parejas de los cuatro primeros componentes se proporcionan en el archivo S2. Ajustamos los modelos de dos maneras: mediante los primeros cuatro PC, y el uso de asignaciones de racimo identificados a partir de la PCA utilizando el paquete R mclust [43]. Como era de esperar sobre la base de, no se observaron cambios apreciables en los resultados del modelo de Cox (datos no mostrados). Los resultados que aquí se presentan, por tanto, no están ajustados de población subestructura

análisis de datos de secuenciación

Se compararon los genotipos en los loci SNP6 significativa. (Chr10: 88722456 y chr1: 223131228) para los de conjunto- los datos de secuenciación del genoma de 10 muestras disponibles; los 10 se correspondía con la SNP6 llama a los SNPs significativos, el apoyo a las llamadas genotipo SNP6.

En los dos SNPs que muestran asociación significativa con la supervivencia en los datos SNP6, que investigarse más a las regiones genómicas que rodean el uso de todo el genoma y combinado exoma /captura de datos de secuenciación. Se investigaron 29 SNPs en los alrededores de las regiones genómicas rs4934282 y rs1857623 que se muestran en la Tabla 3 y elegidas como se ha descrito anteriormente. Cox modelos de riesgos proporcionales de etapas estratificado A continuación, se construyen para los genotipos de la línea germinal como se describe anteriormente. Debe tenerse en cuenta ni tampoco rs4934282 rs1857623 se incluyeron debido a los datos del exoma /captura insuficientes (rs4934282 está en una región intrónica y por lo tanto no se ensayó en el exoma de datos /captura; rs1857623 tenían ninguna llamada en la mayoría de las muestras) guía
debe tenerse en cuenta que no todas las regiones genómicas que contribuyen a estos datos tienen secuencias únicas. Para evaluar esto, se utilizaron los criterios "mapability" como se aplica en CGWB [44]: para cada locus en cuestión, consideramos una ventana de 75 pares de bases deslizante que contiene ese locus y el intento para que coincidan con otras regiones en el genoma; el locus se marca como único si, para cada posición de la ventana deslizante, la secuencia solamente se asigna a la ubicación de la ventana y ninguna otra región genómica. Loci para los cuales algunas (o todas) las posiciones de la ventana deslizante contienen secuencias que se asignan a varias regiones genómicas se marcan con una daga en la Tabla 3, que indica que las lecturas que contribuye a las llamadas en ese locus pueden ser inespecíficos.

Predicción de sustituciones de aminoácidos

Hemos examinado los SNPs en la Tabla 3 para sustituciones mis-sensoriales utilizando el programa ANNOVAR [45] y predijo su impacto funcional de las secuencias de proteínas con Logre y filtrar. Logre es el de la relación de HMMER-valores para el ajuste a un dominio PFAM motivo de dos secuencias de aminoácidos que difieren por una sustitución de aminoácidos. Una puntuación Logre cuyo valor absoluto es mayor que o igual a 1 indica que la alteración de aminoácidos es probable que afecte proteína [46]. SIFT es una herramienta basada en la homología de secuencia que ordena intolerante a partir de las sustituciones de aminoácidos tolerante y predice las sustituciones de aminoácidos deletéreos. valores SIFT se predicen para ser deletéreos [47]. De los SNPs se consideran por encima de cinco SNPs mis-sensoriales fueron identificados: tres en MMRN2 (rs3750823, rs4934281, rs34587013), uno en SNCG (rs9864), y uno en AGAP11 (rs2641563). Sin embargo, no hay evidencia de que estos cambios de aminoácidos tienen un impacto funcional en las proteínas (Tabla 4).

Análisis de las variaciones somáticas

Para probar la hipótesis de que los cambios somáticos pueden tener un aditivo o efecto sobre la asociación entre el genotipo de la línea germinal y la supervivencia del cáncer ovárico moderar, se utilizaron los datos del TCGA derivados de pares de muestras tumorales para evaluar si la expresión de genes del tumor, la ganancia o pérdida de número de copias en el tumor, o la pérdida de heterocigosidad se asociaron significativamente con la supervivencia. Una descripción completa de los métodos y los resultados de este análisis se da en la S1 de archivos. Ninguna de estas covariables adicionales fueron significativas.

Apoyo a la Información
Archivo S1.
métodos y resultados de análisis de las variaciones somáticas.
doi: 10.1371 /journal.pone.0055037.s001 gratis (PDF)
S2 Archivo.
Métodos y resultados de análisis de población subestructura.
doi: 10.1371 /journal.pone.0055037.s002 gratis (PDF)

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]