Extracto
Las variantes genéticas localizadas dentro de la 12p13.33 /
RAD52 locus
han sido asociado con carcinoma de células escamosas de pulmón (LUSC). Aquí, dentro de 5.947 cánceres UADT y 7.789 controles de 9 estudios diferentes, encontramos rs10849605, una variante intrónica común en
RAD52
, para ser también asociado con el tracto digestivo superior (UADT) casos de carcinoma de células escamosas (OR = 1,09 , IC del 95%: 1.04-1.15, p = 6x10
-4). Estamos, además, identificaron rs10849605 como un
RAD52 cis
-eQTL inUADT (p = 1x10
-3) y LUSC (p = 9x10
tumores -4), con el /alelo de riesgo correlacionado con LUSC UADT aumento de
RAD52
niveles de expresión. El 12p13.33 locus, que abarca rs10849605 /
RAD52
, fue identificada como una amplificación del número de copias de coordinación somática significativo en UADT (n = 374, q-valor = 0,075) y LUSC (n = 464, valor de q = 0,007), los tumores y se correlacionó con mayor
RAD52
los niveles de expresión del tumor (p = 6x10
-48 y p = 3x10
-29 en UADT y LUSC, respectivamente). En combinación, estos resultados implican aumentaron
RAD52
expresión en tanto la susceptibilidad genética y la tumorigénesis de los tumores UADT y LUSC
Visto:. Delahaye-Sourdeix H, J Oliver, Timofeeva MN, Gaborieau V, Johansson M, Chabrier A, et al. (2015) La 12p13.33 /
RAD52
Locus y susceptibilidad genética al cáncer de células escamosas de Alta aerodigestivo Tracto. PLoS ONE 10 (3): e0117639. doi: 10.1371 /journal.pone.0117639
Editor Académico: Amanda Ewart Toland, Ohio State University Medical Center, Estados Unidos |
Recibido: 16 Julio, 2014; Aceptado: December 29, 2014; Publicado: 20 Marzo 2015
Derechos de Autor © 2015 Delahaye-Sourdeix et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Disponibilidad de datos: Todos los datos relevantes están dentro del apoyo de sus archivos de información en papel y
Financiación:. los fondos para el estudio de coordinación, la genotipificación de los estudios de replicación y análisis estadístico fue proporcionado por los Institutos nacionales de Salud (R01 CA092039 05 /05S1) y el Instituto Nacional de Investigación Dental y Craneofacial (1R03DE020116). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
tracto aerodigestivo superior (UADT) cánceres, que comprende de la cavidad oral, laringe y el esófago, son la cuarta causa más común de muerte por cáncer en todo el mundo [1]. Mientras que el consumo de tabaco y alcohol son los principales factores de riesgo La cánceres UADT [2], la susceptibilidad genética se ha planteado la hipótesis de que desempeñar un papel en la patogénesis de esta enfermedad [3,4].
La exposición al tabaco y alcohol conduce al daño celular y de ADN alteraciones que, en ausencia de reparación adecuada, pueden causar la desregulación del ciclo celular y el desarrollo del cáncer [5,6]. La recombinación homóloga (HR) es una manera importante por el cual las células reparan las lesiones del ADN [7,8]. El
RAD52
gen está implicado en el proceso de reparación de ADN recombinación homóloga [9] por mediación de RAD51, un gen HR central que forma un filamento de nucleoproteína helicoidal que participan en la búsqueda de homología y el capítulo de emparejamiento [10].
los estudios de asociación del genoma de ancho (GWAS) han implicado la variante genética rs10849605 en 12p13.33, el locus que abarca
RAD52
en el genoma humano, que se asocia con una modesta, pero estadísticamente significativo, el aumento riesgo de cáncer de pulmón [11,12]. Parece ser más relevantes para el carcinoma de células escamosas de pulmón (LUSC) y los cánceres de pulmón de células, pero con poca evidencia dentro de los adenocarcinomas de pulmón (LUAD) [11,12]. Aunque los mecanismos moleculares que contribuyen a la iniciación y progresión son aún poco conocidos, carcinomas de células escamosas (SCC) de diferentes sitios anatómicos comparten muchas características fenotípicas y moleculares entre sí [13]. El objetivo del presente estudio fue investigar
RAD52
en el contexto de la susceptibilidad genética a la SCC de la UADT, para explorar cómo podría ser mediada esta asociación y examinar los eventos de mutación somática en el
RAD52
12p13.33 locus.
Materiales y Métodos
Los sujetos del estudio
Un total de 9 estudios de casos y controles de cáncer UADT participaron en nuestro estudio un total de 5.947 casos de cáncer de UADT y 7.789 controles. diseños de los estudios y las características de la población se han descrito en más detalles anteriormente [3,14,15] y se describen brevemente en la Tabla 1. En la mayoría de los estudios, los sujetos de control fueron emparejados a los casos relativos a la edad, sexo y factores adicionales (por ejemplo, , sitio de estudio y en el hospital). escrito el consentimiento informado se obtuvo de todos los sujetos de estudio, y las investigaciones fueron aprobados por las juntas de revisión institucional en cada centro de estudio. El análisis se limitó a los carcinomas de células escamosas.
Genotipado
El rs10849605 se genotipo utilizando matrices Illumina perla o TaqMan genotipo (C__1244798_10, Applied Biosystems, Carlsbad, CA) a la IARC como se describe en otra parte [3]. El rendimiento de los ensayos TaqMan fue validado por muestras de re-genotipado del genotipo conocido (por ejemplo HapMap). La distribución de los genotipos fue de acuerdo con lo esperado por Hardy-Weinberg en cada país /estudio. Todos los genotipos posterior logró una tasa de concordancia duplicado estudio interno de & gt;. 99%
El Atlas del Genoma del Cáncer de datos
accedimos a la cabeza y el carcinoma de células escamosas del cuello (HNSC), de pulmón de células escamosas carcinoma (LUSC) y adenocarcinoma de pulmón (LUAD) componentes de los datos del TCGA (TCGA Número del Proyecto#3230 y#2731). Estos datos son accesibles a través de la dbGaP a través de la TGCA (https://tcga-data.nci.nih.gov/tcga/). Los datos se descargan ya sea desde https://cghub.ucsc.edu/para la secuenciación del exoma o directamente desde https://tcga-data.nci.nih.gov/tcga/de los datos de secuenciación de ARN, metilación y genotipo.
secuenciación exoma.
accedimos TCGA secuenciación del exoma "nivel 1" (sin procesar) los datos para 363 y 459 personas HNSC LUSC TCGA y completado el análisis bioinformático de los datos de la secuencia utilizando Picard, GATK, MuTect y somática Indel detector (Métodos a en S1 File). Posteriormente se utilizó en las casas tuberías de bioinformática (Métodos A en S1 Archivo) para determinar la más alta calidad llamadas variantes. mutaciones puntuales somáticas eran variantes funcionales exonic definidos, ya sea como truncar, impactando de empalme o variantes missense predijeron como nocivo por SIFT /POLYPHEN2 [16,17].
Copia Número de Variación.
Las muestras se hibridó usando la matriz humana 6.0 SNP plataforma de genoma completo en la plataforma de análisis del genoma del Instituto Broad. Se recuperaron los datos de nivel 3 del TCGA de 374 HNSC, 464 y 476 individuos LUSC LUAD contienen registro normalizado
2 ratios de la intensidad de fluorescencia entre el objetivo de la muestra y una muestra de referencia. Sólo se incluyeron en nuestros análisis individuos para los cuales se dispone tanto del tumor y las correspondientes llamadas normales. Para un segmento, hemos considerado de registro
2 (relación) & lt; -0,5 A ser una indicación de una pérdida, y un registro
2 (relación) & gt; 0,5 para indicar una ganancia. Los segmentos con registro
2 (ratio) entre -0.5 y 0.5 no se retuvieron como alteraciones del número de copias somáticas. La anotación se realizó la adición de los genes contenidos en cada uno de los segmentos restantes utilizando las bases de datos EnsEMBL [18].
secuenciación de ARN.
secuenciación de ARN (ARN-ss) los datos TCGA fue recuperado el "nivel 3 "datos para 263 HNSC, 223 y 125 individuos LUSC LUAD. La normalización de estos datos se detalla en la sección de métodos estadísticos.
La metilación. Se analizó
Los datos TCGA metilación en el ensayo Illumina Infinium HumanMethylation 450K BeadChip. Hemos accedido a los datos de metilación TCGA "nivel 2" de 263 HNSC, 223 y 125 individuos LUSC LUAD. Se estimó el nivel metilado de cada sitio CpG mediante el cálculo del valor M (log
2 (relación de sondas metilados y no metilados)) usando el nivel 2 TCGA de datos [19]. La metilación de datos de nivel 2 ya tiene antecedentes corregido.
rs10849605 genotipos del TCGA.
rs10849605 se encuentra dentro de la región 5 'de
RAD52 Opiniones y no estaba cubierto por la secuenciación del exoma. Por lo tanto derivamos los genotipos de 263 HNSC, 223 y 125 individuos LUSC LUAD utilizando los datos de Affymetrix SNP 6,0 matriz TCGA
Métodos estadísticos
Asociación análisis..
La asociación entre las variantes y el cáncer UADT riesgo se estimó mediante odds ratio (OR) y los intervalos de confianza del 95% (IC) por alelo bajo el modelo log-aditivo y el genotipo derivado de regresión logística incondicional multivariante, el sexo y el estudio específico del país de origen incluida en el modelo como covariables (Tabla S1). La heterogeneidad de las RUP se evaluó mediante la prueba Q de Cochran. Los análisis estadísticos se realizaron con SAS versión 9.3 (SAS Institute, Cary, NC, EE.UU.).
Para controlar la potencial heterogeneidad étnica entre los casos y controles, se realizó un análisis de componentes principales utilizando el paquete EIGENSTRAT del EIGENSOFT 5.0 de software [20] utilizando 12.898 marcadores en desequilibrio de ligamiento baja [21]. Utilizamos las que resultan estadísticamente significativas 12 eigen vectores (como se define por las estadísticas Tracy-Widom) en el análisis de sensibilidad (Tabla A en S1 Archivo).
eQTL análisis.
La asociación entre rs10849605 el genotipo de la línea germinal y
RAD52
tumoral niveles de expresión (eQTL) fue probado en 263 HNSC, 223 y 125 LUSC LUAD utilizando un modelo lineal. Se ha observado en varias ocasiones que los tumores adquieren alteraciones somáticas, que también pueden influir en la expresión génica, en particular copiar los cambios de número y la metilación del ADN [22-24]. Por lo tanto hemos probado el efecto eQTL de rs10849605 en
RAD52
expresión tumoral con modelos lineales ajustados y no ajustados como se describe en la Tabla B en S1 Archivo. Estos análisis estadísticos se realizaron utilizando el software estadístico R (La Fundación de R estadística, http://www.R-project.org).
Con el fin de controlar el impacto de la heterogeneidad de la población, inferimos población estructura del 263 HNSC, 223 125 casos LUAD TCGA con el software estructura [25] utilizando Hapmap versión#23 como población de referencia [26] LUSC y y restringió analiza la eQTL al 215 HNSC, 192 113 casos LUAD LUSC y prevé que ser de ascendencia europea (CEU & gt; 0,8). En estos, se realizó, además, un análisis de componentes principales similar a la GWAS. Los vectores eigen significativos resultantes (como se define por las estadísticas Tracy-Widom) se utilizaron en el análisis de sensibilidad eQTL (Tabla C en S1 Archivo).
Copiar número de análisis-logís-.
Se utilizó una públicamente método disponible, llamado Genómica identificación de objetivos significativos en cáncer (logís-) [27,28], versión 2.0 para encontrar las regiones amplificadas o eliminados de manera significativa utilizando TCGA copiar datos numéricos. El algoritmo logís- calcula los valores de p para cada marcador mediante la comparación de la puntuación en cada locus a una distribución de puntuación de fondo generada por permutación aleatoria de los lugares marcadores en cada muestra. Luego se corrigen los valores de p para múltiples pruebas de hipótesis utilizando el método de Benjamini-Hochberg falso descubrimiento (FDR). Por lo tanto, las puntuaciones de logís- representan niveles de significación y se expresan como valores de q (significativas por debajo de 0,25).
normalización de secuenciación de ARN.
Nivel 3 ARN datos de secuenciación de tumores que se accede desde el TCGA ya estaba normalizado a la kilobase por millón lee estándar (RPKM) que corrige para la longitud de las especies y leer la profundidad [29], pero no para la diversidad de la población de ARN. Para controlar esto aplicamos TMM (media recortada de valores M) la normalización [30] a los datos RPKM. Esto posiblemente implica una pérdida de eficiencia estadística relativa a la aplicación de TMM a los datos en bruto, ya que la ponderación de precisión en TMM ya no funcionará. Sin embargo no debe añadir ningún sesgo y la pérdida de eficiencia será pequeña si la densidad de lectura está cerca de uniforme. Utilizamos las implementaciones en el paquete bordeadora de BioConductor [31] y la función voom del paquete Bioconductor limma [32]. La expresión normal de los datos que está disponible sólo para unos pocos casos, no fue posible llevar a cabo cualquier análisis de la expresión diferencial.
Resultados
Germinal rs10849605 variación genética y la susceptibilidad a cáncer UADT
Estamos genotipo rs10849605 en 5.947 casos de cáncer de UADT y 7.789 individuos de control de 9 estudios. Frecuencia del alelo menor de rs10849605 varió algo por el país, con el alelo de riesgo (C) siendo más frecuente en los países de Europa y América Latina que en Asia (51% y 49% frente a un 40%, respectivamente).
observado en el carcinoma de células escamosas del pulmón, el alelo C se asoció con un aumento moderado en el riesgo de cáncer UADT (Fig. 1, p = 6x10
-4), con la razón de posibilidades (OR) para tener un alelo de riesgo adicional siendo (IC del 95%: 1.4 a 1.15) 1.09. La asociación apareció relativamente consistente a través de la región geográfica (Fig. 1), y no parece sensible a la estructura de la población críptico dentro de 1.791 casos y 2.531 controles de los que se dispone para inferir la ascendencia genética (Tabla A en S1 de archivos) de datos del genoma de ancho. La asociación también era coherente dentro de los subsitios de cáncer UADT y consumo de tabaco. Sin embargo, fue más prominente en las que se consume alcohol en comparación con los no bebedores (p_het 0,03) (Fig. 1). Hubo poca evidencia para sugerir esta variante alterado los patrones de consumo de tabaco y alcohol (p = 0,53 yp = 0,40, respectivamente, paquete /año y de etanol /día tomada como una variable continua).
Los cuadrados representan RUP, tamaño del cuadrado representa la inversa de la varianza de las RUP de registro, las líneas horizontales representan 95% IC. La línea vertical continua indica OR = 1 y la línea vertical discontinua el OR general bajo el modelo log-aditivo. p_het es el valor de p para la heterogeneidad entre los diferentes subgrupos. I2 es el% de la variación observada en los subgrupos (I2 negativo se establece en 0).
Integrado
In silico-
mapeo fino del locus 12p13.33
a continuación realizamos
in silico-
análisis de la variante rs10849605 y el
RAD52 locus
/12p13.33 en los cánceres de cabeza y cuello y pulmón genómicamente caracterizados por el Atlas del Genoma del cáncer (TCGA) .
Expresión locus de rasgos cuantitativos (eQTL) de rs10849605 en HNSC y LUSC
rs10849605 se encuentra cerca del supuesto promotor 5 'de la
RAD52
gen, por lo tanto, la hipótesis de que este, o una variante de proxy correlacionada, podría influir
RAD52
la expresión génica. Se realizó un locus de expresión de rasgos cuantitativos (eQTL) análisis entre rs10849605 y
RAD52
niveles de expresión en HNSC (n = 263), a partir de datos donde tanto RNAseq de los tumores y genotipado habían sido llevadas a cabo por TCGA dentro de la misma los individuos. rs10849605 se asoció significativamente con
RAD52
los niveles de expresión génica en HNSC (Fig. 2, n = 263, p = 9x10
-4), lo que sugiere que rs10849605 es un
cis
-eQTL locus de
RAD52
. El alelo C de rs10849605, asociado con el riesgo de HNSC, se correlacionó con un aumento de
RAD52
niveles de expresión (Fig. 2). La asociación no fue sensible o bien a ajustes por eventos somáticos (número de copias o estado de metilación que pueden influir en el análisis eQTL en los tumores [22]), HNSC subtipo (laringe /hipofaringe, cavidad oral, orofaringe) o estructura de la población (los cuadros B y C en S1 File). Un efecto comparable se observó en LUSC (Fig. 2, n = 223, p = 8x10
-4), pero no se observó asociación eQTL claro en adenocarcinoma de pulmón (LUAD, Fig. 2, n = 125, p = 0,75) . Aunque estadísticamente significativa, la eQTL para rs10849605 representaba sólo una pequeña proporción de la varianza (aproximadamente 4%) en
RAD52
expresión en tumores y HNSC LUSC, una observación en línea con el riesgo genético relativamente modesto observado con esta variante
.
Boxplots que muestra el efecto del genotipo para el SNP
RAD52
rs10849605 en
RAD52
los niveles de expresión del tumor en HNSC, LUSC y LUAD. El alelo de riesgo (C) aumenta significativamente
RAD52
niveles de expresión (p = 9x10
-4 y 8x10
-4, respectivamente) en ambos tipos de cáncer escamosas pero no en adenocarcinoma de pulmón (p = 0,75). En contraste, no hubo evidencia de asociación entre los niveles de rs10849605 y la expresión de otros genes en la región 12p13.33 (cuadro D S1 Archivo).
alteraciones somáticas en RAD52 /12p13.33 en Jefe y cuello Carcinoma espinocelular (HNSC) y LUSC
(mutaciones puntuales
Dentro de mutaciones somáticas retirados del mercado a partir de muestras de secuenciación del exoma-tumorales normales pareadas de 305 y 243 HNSC LUSC,
RAD52
rara vez se mutados somáticamente y inserciones supresiones), con sólo el 2 HNSC (0,60% de los tumores) y uno LUSC (0,40% de los tumores) pacientes portadores de una variante de cambio de sentido somática, y sin la inserción o deleción somática observado.
Por el contrario, se analizó la TCGA copia número variación somática (CNV) de datos de 374 HNSC, 464 y 476 LUSC tumores LUAD y se encontró que el lugar era una región 12p13.33 frecuente de aumento de número de copias en HNSC (7,2% de los casos) y LUSC (11,2% de los casos ). Se observó el aumento de número de copia 12p13.33 en una menor proporción de tumores LUAD (3,9% de los casos) (Fig. 3). Hubo una diferencia significativa en las frecuencias de copia somáticas número de ganancia entre SCC y LUAD (p = 3x10
-5). Además, se utilizó GISTIC2 programa estadístico para determinar la importancia relativa de la ganancia 12p13.33 en comparación con la tasa de fondo de los cambios de número de copias en todo el genoma [27,28] utilizando los datos de número de copia somática TCGA. La región 12p13.33 fue identificado por GISTIC2 como la amplificación focal significativa en HNSC y LUSC (q-valor = 0,075 y 0,007, respectivamente), pero no en LUAD (Figura A en S1 Archivo).
Las personas recibieron la orden por la agrupación sin supervisión basado en
RAD52
niveles de expresión. Mapa de calor representa los valores normalizados RPKM escaladas con mayores niveles de expresión representadas en los niveles de expresión de color rojo e inferior en azul. Las personas que llevan un número de copias ganancia (log
2 (relación) & gt; 0,5) de
¿Cuáles son RAD52 resaltado en verde (color amarillo claro de otra manera).
RAD52
portadores de ganancia parecen tener el mismo patrón de alta expresión y agruparse. Particularmente en LUAD uno de los portadores 3 de ganancia tiene la más alta
RAD52
nivel de expresión.
Presencia de número de copias ganancia somática también se correlaciona con una mayor
RAD52 expresión
los niveles, tanto en HNSC y tumores LUSC, (p = 6x10
-48 y 3x10
-29, respectivamente) (Fig. 3), con el número de copias en este lugar que representa una gran proporción de la varianza en
niveles de expresión RAD52
tumorales (57% en HNSC y el 45% en LUSC). Como era de esperar, los niveles de expresión de genes se correlacionaron con el número de copias de genes en otros 12p13.33 (11 de 26). Sin embargo, rs10849605 parecía influir en rs10849605 única
RAD52
niveles de expresión (Tabla D en S1 Archivo).
Discusión
Nuestro estudio ha identificado que se asocia con el cáncer UADT (p = 6x10
-4). Si bien la naturaleza modesta de esta asociación limita nuestra capacidad para detectar la heterogeneidad entre los sustratos, la asociación fue relativamente consistente a través de los diversos entornos etiológicos de Europa, Japón, América Latina y sub-continental de Asia (donde mascar tabaco es un importante factor de riesgo de cáncer de UADT ). Observamos que los diferentes patrones de LD, o críptica estructura de la población, donde no hemos podido controlar, podrían influir en los resultados. Sin embargo, nuestros resultados son consistentes con la observación de que rs10849605 (o variantes correlacionada con él) también se han asociado con el cáncer de pulmón, y en particular de los carcinomas de células escamosas de pulmón. Como se encuentra en el cáncer de pulmón [12], el alelo C de la variante rs10849605 susceptibilidad se asoció con un mayor riesgo modesto de UADT.
rs10849605 se encuentra en el cromosoma 12p13.33, un locus que contiene el
RAD52
gen.
RAD52
función celular es ADN de doble filamento romper la reparación por recombinación homóloga, que interactúan con los genes de reparación del ADN múltiple relacionadas dentro de esta función y, por tanto, un gen candidato plausible para explicar esta asociación [33]. Sin embargo, no podemos excluir la posibilidad de un gen de susceptibilidad alternativo a
RAD52
debido al desequilibrio de ligamiento. Por ello, utilizó un
In silico-
análisis integrador mediante la expresión TCGA, genotipo y los datos de alteración somática de multa mapa este locus de susceptibilidad. 12p13.33 era una región de ganancia significativa el número de copias somática en HNSC y LUSC, lo que sugiere que la amplificación somática de 12p13.33 es un evento molecular importante en un subconjunto de tumores. Sin embargo, la región amplificada 3MBp contenía múltiples genes, además de
RAD52
. Es importante destacar que, rs10849605 fue un eQTL en HNSC y LUSC para
RAD52
única, lo que sugiere
RAD52
como el gen controlador candidato más probable para tanto la susceptibilidad genética y la tumorigénesis en este locus. A modo de eQTL, la rs10849605 UADT y el riesgo asociado LUSC alelo (alelo C) se correlacionó con un aumento de
RAD52
niveles de expresión. Esa mayor
RAD52
expresión aparece involucrados en acontecimientos tanto la susceptibilidad genética y somáticas en UADT y LUSC puede indicar que la actividad RAD52 está permitiendo que las células tumorales tienen suficiente integridad del genoma para evitar la apoptosis, un rasgo que puede ser particularmente importante dentro de la genotóxico entorno creado por el humo del tabaco y el consumo de alcohol. Cabe destacar que tanto el eQTL y ganancias somáticas se observaron en HNSC y LUSC, pero no LUAD, en consonancia con la susceptibilidad genética del cáncer de pulmón [11,12], lo que refuerza la importancia de este locus en el SCC.
Un papel clave de
RAD52
es proporcionar células con un nivel de redundancia en la reparación del ADN [34].
RAD52
por lo tanto, es particularmente importante en las células deficientes en la vía BRCA1 BRCA2-PALB2, proporcionando un mecanismo alternativo para la reparación del ADN [35,36]. la inhibición selectiva de
RAD52 Hoteles en
BRCA2
células deficientes resultados en la inestabilidad genómica y la inhibición del crecimiento celular, lo que lleva a la sugerencia de
RAD52
como una posible diana terapéutica utilizando enfoques letalidad sintética [37]. Nuestros resultados enlazan
RAD52
mayor expresión de genes a UADT y LUSC, junto con nuestro reciente observación de que un truncar rara
BRCA2
variante genética, rs11571833 (K3326X) se asocia con un riesgo 2,5 veces mayor de escamosas el carcinoma microcítico de pulmón y UADT [38,39], sugiere que tales enfoques de terapia dirigida puede valer la pena investigar en los tumores UADT y LUSC.
Apoyo a la Información
S1 archivo. Métodos A.
Figura A, picos de amplificación identificado en todo el genoma por GISTIC2 en HNSC, LUSC y LUAD. Los logís--resultados se muestran en la parte superior y los valores de q en la parte inferior. La línea se dibuja importancia al valor de q = 0,25 y el locus aumentaría significativamente son anotados en el lado derecho de cada parcela. El 12p13.33 región amplificada se enmarca y se indica con una flecha. Tabla A, el análisis de sensibilidad estratificación de la población. Modelo 1 es la regresión logística análisis de asociación original, ajustado por sexo y el estudio específico del país de origen. Modelo 2 ajusta más para estratificación de la población incluyendo los 12 eigen vectores significativos (como se define por las estadísticas Tracy-Widom) como covariables en la regresión logística. Tabla B, eQTL análisis utilizando modelos lineales ajustados y no ajustados para medir el impacto del genotipo rs10849605 en
RAD52
los niveles de expresión del tumor. El modelo mide el efecto del alelo T de protección para rs10849605. Número de individuos que se tienen en cuenta en el modelo, las estimaciones beta y valor de p se indican para los tres tipos diferentes de cáncer y el uso de los siguientes modelos lineales: 1) no ajustadas, cómo el genotipo influye en la expresión génica. 2) Para el cáncer de HNSC, el subtipo (cavidad oral, laringe /hipofaringe o la orofaringe) se utiliza como la covariable. 3)
RAD52
número de copias somáticas se utiliza como covariable. 4) Dado que estamos interesados aquí en la influencia de los determinantes somáticas en un aumento de la expresión y porque metilación se correlaciona inversamente con la expresión (sitios hypermethylated la tendencia a disminuir la expresión cuando los sitios hypomethylated inducen aumento de la expresión), se seleccionaron 8 de los 24 sitios CpG para ser hypomethylated (como se define por un M-valor negativo en todos los individuos en todos nuestros 3 sitios diferentes de cáncer). De estos 8, sólo se cg15612927 se asoció significativamente con la expresión de
RAD52 Hoteles en los 3 tipos de cáncer (p-value & lt; 0,05). Por lo tanto los niveles de metilación de tumor cg15612927 se utilizó como covariable. 5) El modelo inicial se ajusta para los tres alteraciones somáticas (subtipo para HNSC, el número de copias somáticas y los niveles de metilación). Tabla C, eQTL análisis de sensibilidad. El modelo lineal mide el efecto del genotipo rs10849605 en RAD52 los niveles de expresión del tumor. La primera línea presenta los resultados en todos los casos TCGA nos visitada. La segunda línea restringe el análisis de casos TCGA prevé que sea de origen europeo. La última línea muestra los resultados del mismo modelo lineal, sino ajustada por los vectores eigen estadísticamente significativas, como se define por Tracy-Widom (5 para HNSC y LUSC, 8 para LUAD). Tabla D, 12p13.33 número de copias en comparación con la expresión y análisis eQTL en HNSC y LUSC. el análisis de asociación entre el número de copias y de los niveles de expresión de cada gen dado en la región 12p13.33 (lado izquierdo de la tabla, "NA" si no hay datos disponibles de expresión o CNV). Para las asociaciones significativas solamente, se realizó un análisis eQTL para comprobar cómo el genotipo influencia rs10849605 cada dados los niveles de expresión de genes (lado derecho de la tabla). Los resultados más significativos se destacan en verde (corrección de Bonferroni para múltiples pruebas)
doi:. 10.1371 /journal.pone.0117639.s001 gratis (DOCX)
S1 tabla. Estudiar las exposiciones epidemiológicos y los datos genéticos
doi:. 10.1371 /journal.pone.0117639.s002 gratis (XLSX)
Reconocimientos
Los autores agradecen a todos los participantes que tomaron parte en esta investigación y los proveedores de fondos y el apoyo y el personal técnico que hicieron posible este estudio. También reconocemos y damos gracias a la iniciativa del Genoma del Cáncer Atlas cuyos datos contribuido en gran medida a este estudio.