Extracto
Antecedentes
Cientos de genes con metilación del ADN diferencial de los promotores se han identificado varios tipos de cáncer. Sin embargo, la reproducibilidad de los descubrimientos de metilación del ADN diferenciales para el cáncer y la relación entre la metilación del ADN y la expresión aberrante de genes no se han analizado sistemáticamente.
Metodología /Principales conclusiones
Uso de datos de la matriz de siete tipos de tipos de cáncer, que primero evaluaron los efectos de lotes experimentales de detección diferencial metilación del ADN. En segundo lugar, se compararon las direcciones de los cambios de metilación del ADN detectado a partir de diferentes conjuntos de datos para el mismo tipo de cáncer. En tercer lugar, se evaluó la concordancia entre los cambios de metilación y de expresión génica. Por último, se compararon los cambios de metilación del ADN en diferentes tipos de cáncer. Para un cáncer dado, las direcciones de los cambios de metilación y de expresión detectados a partir de diferentes conjuntos de datos, con exclusión de los efectos potenciales de proceso por lotes, fueron altamente consistente. En diferentes tipos de cáncer, la hipermetilación del ADN se correlacionó altamente inversamente con la baja regulación de la expresión génica, mientras que la hipometilación sólo débilmente correlacionado con la sobre regulación de los genes. Por último, encontramos que los genes comúnmente hypomethylated en diferentes tipos de cáncer realizados principalmente funciones asociadas con la inflamación crónica, tales como 'queratinización "," quimiotaxis "y" respuesta inmune ".
Conclusiones
Efectos de la hornada se podrían afectar en gran medida el descubrimiento de biomarcadores de metilación del ADN. Para un cáncer particular, tanto diferencial metilación del ADN y la expresión de genes se pueden detectar de forma reproducible a partir de los diferentes estudios sin efectos lotes. Mientras que la hipermetilación del ADN está ligado de manera significativa a la baja regulación de genes, la hipometilación se correlaciona débilmente con el gen y sobre regulación es probable que estar relacionado con la inflamación crónica
Visto:. Yao C, H Li, Shen X, Él Z, L Él, Guo Z (2012) reproducibilidad y concordancia de las diferencias de metilación del ADN y la expresión génica en cáncer. PLoS ONE 7 (1): e29686. doi: 10.1371 /journal.pone.0029686
Editor: Abdelilah Aboussekhra, King Faisal Specialist Hospital de & amp; Centro de Investigación, Arabia Saudita
Recibido: 22 Agosto, 2011; Aceptado: 1 de diciembre de 2011; Publicado: enero 3, 2012
Derechos de Autor © 2012 Yao et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por la Fundación Nacional de Ciencias Naturales de China (concesión no: 30370388, 81071646, 91029717, URL: http://www.nsfc.gov.cn/Portal0/default152.htm), Excelente Fundación Juvenil de la provincia de Heilongjiang (concesión no . JC200808, URL: http://jj.hljkj.cn/qn/) y la Fundación de Ciencias Naturales de la provincia de Heilongjiang de China (subvención: QC2010012, URL: http://jj.hljkj.cn/zr/). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
arrays de metilación se han utilizado para identificar cientos de genes con la metilación del ADN diferencial de sus promotores en varios tipos de cánceres [1], [2], [3], [4], en lo sucesivo como genes DM , proporcionando conocimientos sobre la biología del cáncer y los biomarcadores útiles para predecir la evolución del cáncer y objetivos de medicamentos [5]. Sin embargo, diversos factores biológicos y técnicos pueden afectar el descubrimiento de biomarcadores de cánceres humanos. En particular, los efectos de lote, que podrían introducirse mediante el uso de muestras de diferentes lotes experimentales (tales como la preparación de muestras en diferentes momentos, con diferentes protocolos, en diferentes lotes de chips o diferentes plataformas de microarrays), pueden producir sistemáticas diferencias no biológicos entre los diferentes grupos de las muestras [6], [7], [8], [9]. Por lo tanto, un reto de importancia fundamental para la validación de biomarcadores es evaluar la reproducibilidad de descubrimiento de genes DM a través de diferentes estudios para un determinado tipo de cáncer [10], [11], [12]. Este problema no ha sido abordado plenamente hasta ahora. Una vez que los genes DM se identifican de manera reproducible para un determinado tipo de cáncer, una tarea importante es definir su papel en el desarrollo del cáncer. Es ampliamente aceptado que la metilación del promotor aberrante es una causa significativa de la expresión de genes alterados en el cáncer [13]. Sin embargo, varios estudios recientes han cuestionado la correlación inversa entre la metilación y los cambios de expresión [14], [15]. Por lo tanto, la relación entre los cambios en la metilación del ADN y la expresión de genes en el cáncer todavía tiene que ser evaluado de forma sistemática.
La base de datos del Genoma del Cáncer Atlas (TCGA) [16] proporciona cientos de perfiles de metilación para varios tipos de cáncer. Para un determinado tipo de cáncer, las muestras se recogen de diferentes laboratorios y tratados en diferentes lotes experimentales debido a las complicaciones prácticas, como la limitación de la tecnología. En este trabajo, basado en los perfiles de metilación durante nueve tipos de cáncer recogidos en la base de datos TCGA [16], puso de manifiesto que los datos incorrectamente integrando de diferentes lotes experimentales para extraer los genes DM podría ser engañosa. Después de excluir a los conjuntos de datos con efectos potenciales lotes, hemos demostrado que el cambio de estados de metilación (hipermetilación o hipometilación de genes) de MS en muestras de cáncer en comparación con las muestras normales puede ser altamente reproducible detectada a partir de diferentes conjuntos de datos para un cáncer. Se observó una tendencia similar para los cambios de expresión de genes en cánceres basados en los datos disponibles de la base de datos Gene Expression Omnibus [17]. Luego, basándose en los genes DM y DE reproducibles para cada tipo de cáncer, se determinó que la hipermetilación del promotor es muy inversamente correlacionada con el gen abajo-expresión, mientras que la hipometilación está correlacionada sólo débilmente con la sobre expresión de genes con grandes cambios de expresión. Por fin, se encontró que los genes hypomethylated perturban principalmente funciones directamente relacionadas con la inflamación crónica, como '' quimiotaxis y funciones '' la respuesta inmune.
Materiales y Métodos
Fuente de datos
la expresión y metilación conjuntos de datos que se describen en la Tabla 1 y la Tabla 2 fueron descargados de la base de datos [16] GEO [17] y TCGA, respectivamente. Los perfiles de expresión de genes en bruto se normalizaron mediante el robusto análisis multi-array (RMA) algoritmo [18]. Se utilizaron los datos de nivel 2 definidos en la base de datos TCGA, que ofrece T (metilado) y los valores de M (metilado) para cada sonda. Los valores beta de las sondas se calcularon por M /(T + M + 100) [19]. Los ID de sonda se asignan a los identificadores de genes con la mesa de anotación para cada plataforma.
Análisis de los efectos de lote
Los efectos hornada se podrían generar para muestras de diferentes lotes experimentales o centros de acopio en la base de datos TCGA [16]. Para los datos de la metilación del TCGA, que computa un F-estadística para probar la correlación entre los niveles de metilación sondas '(valores Beta) y sus lotes experimentales o laboratorios de recogida. Los
P valores
se ajustaron por el procedimiento de Bonferroni-Hochberg con la tasa de falso descubrimiento (FDR) & lt; 0,05 [20] y las sondas se consideraron significativos susceptibles a los efectos de lotes [9]. Para evaluar el efecto de los lotes experimentales sobre la detección de genes DM, también comparamos genes DM seleccionados de entre los conjuntos de datos comprometedoras muestras de tumores de diferentes lotes y un grupo dado de muestras normales de un lote para un tipo de cáncer particular.
Selección de DM genes y los genes dE
para cada conjunto de datos, se seleccionaron los genes DM con la prueba t [19] y se utiliza el procedimiento Benjamini-Hochberg para controlar el FDR en un nivel determinado [20]. Los genes DM con medios más grandes de los niveles de metilación en las muestras de cáncer que en las muestras normales se definieron como genes hipermetilados; de otro modo, los genes DM se definieron como genes hypomethylated.
expresados diferencialmente (DE) genes fueron seleccionados utilizando la SAM (análisis de la importancia de microarray) algoritmo [21]. Los genes con valores de p ajustados inferior a 0,05 se definen como los genes expresados diferencialmente (DE).
Análisis de la reproducibilidad de los genes y los genes DE DM
A continuación, se evaluó la reproducibilidad de la detección de genes mediante el análisis de marcos alemanes la superposición de las listas de genes DM selecciona a partir de dos conjuntos de datos para cada cáncer. Si k genes son compartidos por la lista 1 de longitud L
1 y la lista 2 de longitud L
2, entonces el POG (porcentaje de superposición de genes) Puntuación obtenida a partir de la lista 1 (o lista 2) a la lista 2 (o lista 1) es POG
12 = k /L
1 (o POG
21 = k /L
2). A continuación, se evaluó la consistencia de las direcciones de metilación (hipermetilación o hipometilación) de los genes k compartidos por las listas 1 y 2 a través de los dos conjuntos de datos. El mismo análisis se realizó en las listas de genes DE seleccionados de entre dos conjuntos de datos de expresión para cada cáncer.
La concordancia entre la metilación del ADN y la expresión genética cambia
Si la expresión de un hypermethylated (o hypomethylated) fue significativamente regulado por gen (o regulada up-), se consideró que el cambio de metilación para ser concordantes con el cambio en la expresión génica. Definimos la tasa de concordancia entre la hipermetilación del ADN y el gen de baja regulación como el porcentaje de reguladas por los genes entre los genes con expresión diferencial hypermethylated. El
P
valor fue calculado por el modelo hipergeométrica [10], [11], [12]. Del mismo modo, la tasa de concordancia entre la hipometilación del ADN y el gen de la regulación se define como el porcentaje de genes regulados entre los genes con expresión diferencial hypomethylated.
Función enriquecimiento de los genes DM
Uso de Elim software, detectamos ontología de genes (GO) términos enriquecidos con genes DM [22]. Los
P valores
se ajustaron por el procedimiento de Bonferroni-Hochberg con un FDR. & Lt; 0,05 [20]
Resultados
efectos de lote en la detección de genes DM
en primer lugar, evaluamos los efectos de los lotes experimentales del nivel de metilación para cada sonda en las muestras tumorales de los dos lotes por separado para nueve tipos de cáncer recogidos en la base de datos TCGA (ver Tabla 1) utilizando el estadístico F con una tasa de falso descubrimiento ( FDR) & lt; 0,05 [20] (ver
Métodos
). Como se muestra en la Fig. 1a, aproximadamente el 30% de las sondas, en promedio, fueron significativamente susceptibles a los efectos de lote para los nueve tipos de cáncer cuando las muestras procedían de diferentes laboratorios y diferentes lotes. Y aproximadamente 20% sondas fueron todavía significativamente susceptible cuando restringido muestras del mismo laboratorio pero tratado en diferentes lotes (Fig. 1B). Sin embargo, sólo alrededor de 7,7% sondas fueron significativamente más susceptibles cuando las muestras procedían de los mismos lotes (Fig. 1C). Especialmente, como se muestra en la Fig. 1d, las muestras tumorales de dos lotes (batch lote 9 y 12) para cystadenocarcinoma seroso de ovario podría ser agrupados juntos perfectamente de acuerdo a lote por el algoritmo de agrupamiento jerárquico utilizando las distancias euclidianas de los valores beta que entre las muestras
.
( a) diferentes lotes y diferentes laboratorios; (B) el mismo laboratorio, pero diferentes lotes; (C) del mismo lote pero diferentes laboratorios; (D) la agrupación jerárquica las muestras tumorales de cystadenocarcinoma seroso de ovario en el lote 9 y el lote 12. Para un tipo de cáncer denotado en el eje x en el gráfico a, b o c, un diagrama de caja en el eje y representa el porcentaje de sondas significativamente susceptible a diferentes condiciones de proceso por lotes. El porcentaje toma valor que oscila entre 0 (sin sonda susceptibles) a 1 (100% sondas susceptibles). Cada caja se extiende desde la bisagra inferior (definido como el percentil 25) de la bisagra superior (el 75 por ciento) y la mediana se muestra como una línea a través de la caja.
Los resultados anteriores indican que la integración muestras de tumores de diferentes lotes para detectar genes DM puede llevar a equívocos. De hecho, como resultado de los efectos de proceso por lotes, el cambio de los estados de metilación de genes DM en las muestras de cáncer en comparación con las muestras normales podría ser muy inconsistente cuando se comparan muestras de tumores de diferentes lotes con el mismo grupo de controles normales (ver Fig. 2) . Por ejemplo, al comparar muestras de tumores de lote 9 y el lote 15 para cystadenocarcinoma seroso de ovario con el mismo grupo de muestras normales (lote 27), respectivamente, la consistencia de la variación de los estados de metilación de los genes DM comunes fue sólo 23,5%. Por lo tanto, la mayor parte de la metilación diferencial observado fue en todos los lotes en lugar de a través de grupos biológicos, que conduce a resultados muy irreproducibles.
Para cada tipo de cáncer denotado en el eje x, un diagrama de caja en el eje Y representa el coherencia puntuación define como la proporción de genes DM con estados de metilación consistentes entre todos superposición de genes DM comúnmente detectado en ambos de los dos grupos (véase la sección "Métodos"). La puntuación de consistencia toma valor que oscila entre 0 (no hay estados coherentes) al 1 (100% estados coherentes). Cada caja se extiende desde la bisagra inferior (definido como el percentil 25) de la bisagra superior (el 75 por ciento) y la mediana se muestra como una línea a través de la caja.
La reproducibilidad de la detección de genes DM
para evitar posibles efectos de lote y el sesgo que pueden ser establecidos por las diferentes edades de los pacientes, sólo se analizaron los perfiles de los cinco tipos de cáncer para cada uno de los cuales tumor agrupan por parejas y muestras normales de los mismos pacientes recogidos por el mismo laboratorio y se mide en el mismo lote experimental estaban disponibles (véase la Tabla 2). Para cada tipo de cáncer, se utilizaron los dos lotes más grandes como conjuntos de datos independientes y se detectaron los genes DM con la prueba t en el FDR & lt; 0,05 [20]. A continuación, se evaluó la consistencia de las dos listas de genes DM detectado por separado de los dos conjuntos de datos (lotes) mediante el cálculo del porcentaje de superposición de genes (POG) entre las dos listas de genes DM [10] (ver
Métodos
). Para cada cáncer, la mayoría de los genes de DM en la lista más corta se incluyeron en la lista más larga, como se refleja en las POG
12 puntuaciones se muestran en la Tabla 3. Más de 99% de los genes DM detectados en ambos conjuntos de datos fueron consistentes en el cambio de la metilación estados de los dos conjuntos de datos. Por ejemplo, 3778 y 3966 genes DM se identificaron por separado en los dos conjuntos de datos (K78 y K100, respectivamente) para carcinoma renal de células claras del riñón (cáncer de riñón), con un solapamiento de 3443 genes. Sorprendentemente, todos los 3443 genes mostraron el mismo cambio de estados de metilación a través de los dos conjuntos de datos, significativamente más de lo esperado por azar (modelo de Bernoulli
P Hotel & lt; 2,2 x 10
-16)
.
una gran fracción de los genes detectados DM en un conjunto de datos no fue determinante para ser significativo en otro conjunto de datos para cada tipo de cáncer, como se refleja en las POG
21 puntuaciones se muestran en la Tabla 3. sin embargo, nuestro análisis mostró que la mayoría de los genes de DM que se detectaron exclusivamente en un conjunto de datos también mostraron el mismo cambio de los estados de metilación en otro conjunto de datos para el mismo tipo de cáncer, revelando que las señales biológicas efectivas de estos genes DM también existieron en el otro conjunto de datos. Por ejemplo, para el cáncer de riñón, 514 (98,2%) de los 523 genes detectados a ser significativo únicamente en el conjunto de datos más grande (K100) mostraron el mismo cambio de los estados de metilación en el conjunto de datos más pequeña (K78), que era muy poco probable que suceda por oportunidad (Bernoulli
P Hotel & lt; 2,2 x 10
-16). Por lo tanto, los relativamente bajos POG
21 puntuaciones podrían reflejar un reducido poder estadístico para detectar genes de DM en el conjunto de datos más pequeña, junto con un estricto control de FDR [10], [23].
También analizamos una conjunto de datos independiente para el cáncer de colon disponible de la base de datos GEO [17]. Con FDR & lt; 0,05, 2601 y 4001 genes DM fueron identificados en el conjunto de datos C22 (de TCGA) y el conjunto de datos C44 (de GEO), respectivamente. Estas dos listas de genes compartidos DM 2421 genes, entre los cuales 2.419 (99,9%) mostraron los mismos cambios de estados de metilación a través de los dos conjuntos de datos (modelo de Bernoulli
P Hotel & lt; 2,2 x 10
-16). Entre los otros 1582 genes que fueron significativas en el conjunto de datos más grande C44 pero no en el más pequeño conjunto de datos C22, 1502 (94,9%) mostraron el mismo cambio de estados de metilación en el conjunto de datos más pequeña, mucho más de lo esperado por azar (modelo de Bernoulli
P Hotel & lt; 2,2 x 10
-16). La alta consistencia de la variación de los estados de metilación de los genes DM a través de diferentes conjuntos de datos para el mismo cáncer indicó que los genes de DM en el cáncer podría ser detectado de manera reproducible en los datos de metilación de alto rendimiento.
Reproducibilidad de la detección de genes DE
los datos del TCGA son también problemático para los datos de expresión ya que sólo una muestra normal se midieron en la expresión para cada cáncer, lo que hace que la comparación entre el tumor y las muestras normales no fiable. Por lo tanto, se seleccionaron los datos de expresión de tipo de cáncer emparejado de base de datos de GEO [17]. Durante nueve cánceres analizados anteriormente, hemos sido capaces de encontrar dos conjuntos de datos de expresión génica para los tres tipos de cáncer (ver Tabla 2). Para cada uno de estos tres tipos de cáncer, utilizando SAM [21] con el FDR & lt; 0,01, se seleccionaron dos listas de genes expresados diferencialmente (DE) de los dos conjuntos de datos y encontramos que la mayoría de los genes DE en la lista más corta fueron incluidos en la lista más larga , como se refleja en las POG
12 puntuaciones se muestran en la Tabla 4. Además, más del 94,5% de los genes dE detectados en los dos conjuntos de datos para cada cáncer fueron consistentes en la dirección de regulación (arriba o abajo) a través de los dos conjuntos de datos , que era muy poco probable que ocurra por azar (Tabla 4, el modelo de Bernoulli
P Hotel & lt; 2,2 x 10
-16). Además, la mayoría de los genes DE detectado únicamente en un conjunto de datos mostraron las mismas direcciones de regulación en otro conjunto de datos para el mismo tipo de cáncer, revelando que las señales biológicas efectivas de estos genes DE existían en el conjunto de datos más tarde. Por ejemplo, para el cáncer de colon, 6.056 (94,5%) de los 6420 genes detectados a ser significativo únicamente en el conjunto de datos más grande (c64) mostraron la misma dirección de regulación del conjunto de datos más pequeña (c23), que es muy poco probable que ocurra por azar ( modelo de Bernoulli
P Hotel & lt; 2,2 x 10
-16) guía empresas
los análisis anteriores se basaron en datos normalizados por el algoritmo de RMA, que supone que la mayoría de los genes. no se expresan diferencialmente en una enfermedad [24]. Se realizó el mismo análisis utilizando el conjunto menos variante (LVS) algoritmo [25], que se basa menos en este supuesto, y los resultados fueron similares.
Concordancia entre la metilación diferencial y la expresión diferencial
los resultados anteriores indicaron que los cambios de metilación y de expresión podría ser detectado de manera reproducible a través de diferentes conjuntos de datos para un cáncer particular. Cabe destacar que, aunque los datos de microarrays de expresión de diferentes fuentes, en lugar de los propios datos de TCGA, el altamente consistencia de cambio expresión a través de dos conjuntos de datos de la misma cáncer indican las direcciones de regulación de genes fueron reproducibles y fiables para el tipo específico de cáncer. Por lo tanto, en base a los genes DM y DE reproducibles del mismo tipo de cáncer, se examinó la influencia del gen promotor de la metilación sobre la expresión génica. En pocas palabras, si un gen hypermethylated (o hypomethylated) encontrado por los datos de metilación fue significativamente las reguladas (o hasta reguladas) en los datos de expresión, hemos considerado que la metilación del ADN fue concordante con su cambio de expresión. La tasa de concordancia se midió el porcentaje de genes hypermethylated (o hypomethylated) concordante con el gen baja regulación (o regulación).
Se evaluó la concordancia entre la metilación diferencial y de expresión en dos niveles. En primer lugar, se evaluó la concordancia entre la metilación diferencial y la expresión diferencial de los genes. Como se muestra en la Tabla 5, 91,6%, 86,6% y 88,2% de los genes hypermethylated se redujeron regulado en el colon, riñón y pulmón, respectivamente, lo que indica que la hipermetilación se correlaciona significativamente con la baja regulación de los genes (hipergeométrica prueba
P Hotel & lt; 1,0 x 10
-5 para los tres tipos de cáncer). Por ejemplo, en el cáncer de colon, 98 de los 107 genes hypermethylated se redujeron regulado en muestras de cáncer en comparación con los controles normales (hipergeométrica prueba
P
= 7,8 × 10
-9). A continuación, nos centramos en la concordancia entre la metilación con un gran cambio en el nivel de metilación y de expresión con gran factor de cambio (FC) entre muestras tumorales y normales. Cuando nos centramos en los genes DM con al menos 0,15 Δβ (diferencia de los niveles medios de metilación entre el tumor y las muestras normales), las tasas de concordancia aumentó a 96,1%, 96,2% y 91,3% para los de colon, de riñón y de pulmón, respectivamente. Del mismo modo, cuando nos centramos en los genes DE reproducibles con al menos un cambio de 2 veces (FC), las tasas de concordancia para los tres tipos de cáncer eran todos por encima de 90%. Sin embargo, la relación entre la hipometilación de genes y la sobre regulación de la expresión génica es bastante difícil de alcanzar. Las tasas de concordancia fueron 50,3%, 39,4% y 62,5% para los de colon, de riñón y de pulmón, respectivamente. Para el cáncer de pulmón solamente, la hipometilación mostró una correlación inversa significativa con el gen de la regulación (hipergeométrica prueba
P
= 4,2 × 10
-6). Cuando nos centramos en los genes DM con al menos 0,15 o 0,3 Δβ, la hipometilación se correlacionó significativamente con la sobre regulación de la expresión génica sólo en el cáncer de pulmón. Cuando se examinaron los genes DE con al menos un cambio de 2 veces, las tasas de concordancia aumentó a 58,5% y 61,7% para los de colon y riñón, respectivamente, y se convirtieron significativa (prueba hipergeométrica
P
= 2,7 × 10
-7 y 5,4 × 10
-4, respectivamente). En particular, las tasas de concordancia fueron de aproximadamente 60%, incluso después de la FC de corte para los tres tipos de cáncer. Estos resultados sugieren que la hipometilación puede afectar parcialmente la sobre regulación de la expresión génica con grandes cambios veces
funciones de los genes y los genes hypermethylated hypomethylated
El uso de software Elim con FDR. & Lt; 0,05 [22 ], detectamos los términos de GO enriquecido de manera significativa con los genes hypermethylated reproducible identificados en los dos conjuntos de datos para cada cáncer. Para el cáncer de colon, encontramos 58 términos significativos, los cuales estaban asociados con los procesos biológicos básicos como la transcripción, la adhesión celular y la señalización (cuadro complementario S1 para los términos detallados). Para el cáncer de riñón, se encontraron 14 términos significativos, entre los cuales 11 fueron incluidos en los términos significativos para el cáncer de colon, lo que sugiere que los genes hypermethylated en estos dos tipos de cáncer tienden a estar involucrados en funciones similares. Sin embargo, no se encontró GO plazo significativo para el cáncer de pulmón con FDR & lt; 0,05. Mediante la comparación de los 10 términos superior con el más pequeño
valores de P Opiniones de los tres tipos de cáncer, se encontró que 4 términos eran compartidos por los cánceres de colon y riñón, y ni el cáncer Compartimos un plazo con cáncer de pulmón. Estos resultados indican que el patrón de la hipermetilación del cáncer de pulmón puede ser diferente de las de los cánceres de colon y riñón
Con FDR. & Lt; 0,05, encontramos 14, 29 y 2 GO términos enriquecidos con genes hypomethylated de colon, riñón y los cánceres de pulmón, respectivamente (Tabla Suplementaria S2). La mayor parte de estos términos importantes estaban relacionados con la respuesta inmune. Una comparación de las listas de los 10 mejores términos con los más pequeños
valores de P Opiniones de los tres tipos de cáncer mostró que compartían tres términos: 'queratinización', 'respuesta de defensa de la bacteria', y 'la respuesta de defensa celular'. Estamos, además, a prueba la función de los genes hypomethylated de carcinoma de células escamosas de pulmón y de estómago datos de adenocarcinoma. Estos genes también fueron enriquecidos en 'queratinización "y" respuesta de defensa de la bacteria' (S3 Tabla Suplementaria). En concreto, in'keratinization ', se encontró que 12 genes que codifican proteínas de queratina KAP asociado (Tabla 6) se hypomethylated en los cinco tipos de cánceres. En particular, estos 12 genes CAP también se incluyeron en los 16 genes que se encuentran KAP para mostrar hipometilación diferencial pronunciada en el cáncer de vejiga [26]. Estas evidencias juntos sugieren que los genes KAP se podrían utilizar como biomarcadores para múltiples tipos de cáncer. Por último, una comparación de dos de los tres tipos de cáncer reveló que los genes DM detectado únicamente en un determinado tipo de cáncer eran más propensos a ser hypermethylated que los genes DM detectado dos tipos de cáncer (prueba de ji cuadrado
P Hotel & lt; 0,001 para la comparación de las proporciones de genes hipermetilados). Por ejemplo, 635 (43,5%) de los 1411 genes DM detectado en el cáncer de colon, pero no en el cáncer de pulmón fueron hypermethylated, mientras que sólo 42 (16,5%) de los 254 genes DM detectados en ambos tipos de cáncer fueron hypermethylated. Por otra parte, 168 de los 189 genes DM compartidos por los tres tipos de cáncer fueron hypomethylated y enriquecidos en 'queratinización', 'quimiotaxis', y 'funciones de respuesta inmune' (ver
Discusión
).
Discusión
La detección de metilación aberrante del ADN en el cáncer puede producir importantes biomarcadores para predecir la evolución del cáncer y blancos de la droga. Sin embargo, dificultades en diseños experimentales y los datos defectuosos análisis, tales como la integración de incorrectamente lotes de datos TCGA, pueden producir biomarcadores poco fiables [9]. Cabe destacar que la mayoría de los estudios que utilizan los datos TCGA, incluyendo muchos de ellos publicados en revistas de alto perfil [16], [27], [28], [29], no se consideran los efectos potenciales de lotes, lo que sería probable que los resultados sean erróneos asociados con los lotes en lugar de los resultados biológicos. Por ejemplo, Houtan et al. [27] muestras de tumores de glioblastoma integrados de varios lotes y identificado un subconjunto distinto de muestras que muestran la hipermetilación concertada, que podría haber sido correlacionada con sus lotes experimentales de manera similar a los datos mostrados en el mapa de agrupamiento en la Fig. 1d. Por lo tanto, sugerimos que las conclusiones basadas en muestras integradas deben ser reevaluados al considerar los posibles efectos de lote. Nuestros resultados sugieren fuertemente que, un experimento debe ser diseñado para evitar el efecto de proceso por lotes mediante la distribución igualmente posibles sustitutos experimentales entre los grupos biológicos y utilizando suficientes muestras para cada grupo [9].
Nuestros resultados mostraron que los genes DM detectados desde diferentes conjuntos de datos para el mismo tipo de cáncer, sin contar con los lotes, fueron consistentes en la metilación en todos los conjuntos de datos, similar a la observación de que los genes dE detectar a partir de diversos estudios de microarrays muestran una consistente arriba o hacia abajo patrón de expresión [10], [30], [31] . Por lo tanto, las señales de los estados de metilación de genes en el cáncer de DM se pueden detectar de manera fiable en matrices de metilación. Notablemente, 36 de los 47 genes hipermetilación de cáncer de colon documentados en la base de datos Methycancer [32] se encontró que eran genes DM en nuestros datos de cáncer de colon, entre los cuales 34 fueron también hypermethylated (S4 tabla). Los biomarcadores de metilación reproducibles en diferentes cohortes de pacientes podrían proporcionar información valiosa para la búsqueda de biomarcadores pronósticos y objetivos de medicamentos para el cáncer.
Por otra parte, se encontró que, para un determinado tipo de cáncer, muchos genes DM detectado en un conjunto de datos puede no ser significativo en otro conjunto de datos debido a la falta de alimentación de la detección de genes en muestras pequeñas DM, junto con estricto control de FDR [10], [30], [33]. La reducción de la energía podría conducir a la selección de los genes más importantes como biomarcadores para un cáncer a ser muy inestable a través de diferentes estudios [34]. Para evaluar la reproducibilidad de los genes descubiertos DM más significativos de diferentes estudios para un cáncer particular, podríamos tener en cuenta la relación funcional en lugar de simplemente contar los solapamientos [11], [35].
Para la función de los genes DM, nuestros resultados mostraron hipermetilación de promotores de genes se asoció significativamente a la baja regulación de la expresión génica en el cáncer y afecta a los procesos biológicos básicos, como el crecimiento de señalización y celular, similar a lo que se ha observado para el envejecimiento humano [36]. Por el contrario, la hipometilación sólo débilmente correlacionado con el gen de la regulación, lo que indica que otros factores como la hipermetilación del cuerpo de genes [37] y de la copia de amplificación [38] pueden contribuir más a la sobre regulación de la expresión génica. Encontramos que los genes hypomethylated para diferentes tipos de cáncer fueron similares en funciones directamente relacionadas con la inflamación crónica, tales como "quimiotaxis" y "respuesta inmune". Las quimioquinas juegan un papel importante en la regulación de la inflamación progreso [39], y la deficiencia inmune puede resultar en inflamación crónica [39]. Esta inflamación crónica puede inducir hipometilación global, que puede causar la inestabilidad cromosómica y aumentar las mutaciones del genoma y luego aumentar el riesgo de cáncer [40]
.
Además, nuestros resultados mostraron que los genes DM detectados en un tipo específico de cáncer eran más propensos a ser hypermethylated que los genes DM detectado en varios tipos de cáncer. Sin embargo, la definición de biomarcadores específicos del tipo de cáncer es difícil, ya que diferentes estudios para un determinado tipo de cáncer a menudo descubren diferentes genes DM. El uso de los genes específicos de tejido recogidas por Xiong et al. [41], encontramos que los genes expresados preferentemente en un tejido específico se enriquecieron con genes diferencialmente metiladas en el tipo de cáncer correspondiente (prueba hipergeométrica
P
& lt; 0,001 para los tres tipos de cáncer), pero estos genes no lo hicieron DM mostrar ninguna preferencia hacia la hipermetilación o hipometilación. Teniendo en cuenta que la exactitud de los genes específicos de tejido "" depende en gran medida del nivel de expresión del transcrito correspondiente [42], que podría ser más fiable para definir los genes "específicos de tejido" por sus patrones de metilación [43]. En el trabajo futuro, tenemos la intención de estudiar los genes específicos del tipo de cáncer DM, teniendo en cuenta las indicaciones de metilación de genes opuestos DM detectado para los diferentes tipos de cáncer.
Apoyo a la Información sobre Table S1.
GO términos enriquecido de manera significativa con los genes hipermetilación separado para los cánceres de pulmón de colon, riñón y
doi:. 10.1371 /journal.pone.0029686.s001 gratis (XLS)
Tabla S2.
GO términos enriquecido de manera significativa con los genes Hipometilación separado para los cánceres de pulmón de colon, riñón y
doi:. 10.1371 /journal.pone.0029686.s002 gratis (XLS) sobre Table S3.
GO términos enriquecido de manera significativa con los genes Hipometilación por separado para carcinoma de células escamosas y el adenocarcinoma de pulmón de estómago
doi:. 10.1371 /journal.pone.0029686.s003 gratis (XLS) sobre Table S4.
cambios de metilación y de expresión de los genes en la base de datos MethyCancer
doi: 10.1371. /journal.pone.0029686.s004 gratis (XLS)
Reconocimientos
Agradecemos a Jinfeng Zou y Guini Hong disscussions de votos, y el consorcio TCGA para proporcionar las bases de datos.