Extracto
Hemos investigado el papel del número de copias del tumor (CN) -altered genoma (CN-AG) en la carcinogénesis del cáncer cervical (CC), especialmente su efecto sobre la expresión de genes, procesos biológicos y la supervivencia del paciente. Cincuenta y nueve por el virus del papiloma humano 16 (HPV16) CC-positivos fueron investigados con microarrays-31 para el mapeo CN-AG y 55 para la expresión génica global, con 27 CC en común. La supervivencia a cinco años se investigó en 55 pacientes. Supresiones y amplificaciones & gt; 2,5 Mb se definen como alteraciones NC. El CN-AG% variaba desde el 0 a la de 32,2% (media = 8,1 ± 8,9). Los tumores se clasificaron como bajo (media = 0,5 ± 0,6, n = 11), medio (media = 5,4 ± 2,4, n = 10), o alto (media = 19,2 ± 6,6, n = 10) CN. El mayor% CN-AG se encuentra en el 3T, lo que contribuyó un promedio de 55% de todas las alteraciones NC. De todo el genoma, sólo el 5,3% de los genes alterados-CN fueron desregulados directamente por la dosis de genes. En contraste, la tasa en el 3T totalmente duplicada fue dos veces mayor. La amplificación de 3q explicó el 23,2% de los genes desregulados en los tumores enteros (r
2 = 0,232, p = 0,006; análisis de la varianza), incluidos los genes localizados en los cromosomas 3q y otros. Un total de 862 genes fueron desregulados exclusivamente en tumores de alto NC, pero sólo el 22,9% era CN alterada. Esto sugiere que los genes restantes no están desreguladas directamente por la dosis de genes, sino por mecanismos inducida
en trans
por genes alterados-CN. Anafase de la promoción de complejos /cyclosome (APC /C) proteolisis dependiente de proteasoma, la glucólisis y la apoptosis se upregulated, mientras que la adhesión celular y la angiogénesis se downregulated exclusivamente en tumores de alto NC. El alto% CN-AG y el perfil de expresión de genes upregulated de la proteolisis del proteasoma APC /C-dependientes se asociaron con la supervivencia de los pacientes pobres (p & lt; 0,05, prueba de log-rank). Junto con la glucólisis, que se asociaron de forma lineal con FIGO etapa (r & gt; 0,38, p & lt; 0,01, Spearman test). Por lo tanto, la inhibición de la proteolisis del proteasoma APC /C-dependiente y la glucólisis podría ser útil para el tratamiento de CC. Sin embargo, si son indispensables para el crecimiento tumoral queda por demostrar
Visto:. Medina-Martínez I, V Barrón, Romano-Bassaure E, E-Torres Juárez, Guardado-Estrada M, Espinosa AM, et al . (2014) Impacto del gen Dosificación en la expresión génica, los procesos biológicos y supervivencia en el cáncer de cuello uterino: Un genoma completo de seguimiento del estudio. PLoS ONE 9 (5): e97842. doi: 10.1371 /journal.pone.0097842
Editor: Robert D. Burk, Albert Einstein College of Medicine, Estados Unidos de América
Recibido: 6 de diciembre de 2013; Aceptado: April 25, 2014; Publicado: 30-may 2014
Derechos de Autor © 2014 Medina-Martínez et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo con el apoyo del Consejo Nacional de Ciencia y Tecnología (CONACYT, www.conacyt.mx), conceden números 8135 /A1, 24341 (JB), 80680 (SK) y 133.273 (a FF) y la Universidad Nacional de México ( www.unam.mx), otorgar SDI.PTID.05.2 número (JB). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
el cáncer cervical (CC) es el segundo cáncer más común en las mujeres en todo el mundo, que afecta a 500.000 personas cada año; es la causa principal de muerte por cáncer entre las mujeres en los países en desarrollo [1]. Las oncoproteínas virales E6 y E7 de los virus del papiloma humano de alto riesgo (VPH) juegan un papel importante en la carcinogénesis. Inhiben diversas dianas celulares, incluyendo el p53 proteínas supresoras de tumores y pRb, interrumpen procesos celulares claves, tales como el control de la apoptosis y el ciclo celular y conducen a la inestabilidad genómica y el desarrollo neoplásico [2]. A pesar de los daños causados por estas proteínas oncoviral, CC es una complicación poco frecuente de la infección viral; la mayoría de las infecciones son transitorias y no evolucionan en las lesiones neoplásicas. En promedio, 12-15 años pueden pasar antes de una infección persistente por VPH conduce a CC a través de las etapas premalignas de lesiones neoplásicas intraepitelial cervical [3]. Estos hallazgos sugieren que la infección por VPH sí sola no causa la enfermedad y que otros factores, tales como genes de acogida anormales, están asociados con el desarrollo de cáncer invasivo.
desequilibrios genómicos pueden contribuir a la expresión desregulada de oncogenes y supresores de tumor genes en las células cancerosas, y la acumulación de tales genes alterados se ha correlacionado con la progresión del tumor [4]. Varios número de copias (CN) regiones -altered (CNA) se han identificado en CC a través del análisis del genoma del tumor utilizando métodos tales como la hibridación genómica comparativa, hibridación in situ fluorescente, y microarrays (MAS). Las ganancias de 3q [5] - [11] y 5p [5], [12] - [15] son las alteraciones cromosómicas más frecuentes en los países candidatos, y también se han descrito en otros tumores sólidos [16] - [18]. El consenso región más pequeña de amplificación de 3q en los mapas de CC cromosómica 3q26-27 cytobands [6] - [10], [19], lo que sugiere que los genes tales como
TERC
[20], [21],
PIK3CA
[22], y
ECT2
[23], que son considerados los oncogenes candidatos para CC, pueden estar implicados en la carcinogénesis cervical. La medida en que estas alteraciones cromosómicas recurrentes son relevantes para el desarrollo del tumor sigue siendo en gran parte desconocido. Por otro lado, la amplificación completa de 5p está bien documentado en muestras de tumores y líneas celulares [12], [23] - [25]. Algunos genes amplificados en esta región y propusieron participar en CC, como
SKP2
,
de TERT,
TRIO
,
RNASEN
, y
PRKAA1
, se sobreexpresa en muestras de tumores [15] y líneas celulares [12], [24].
La contribución de las alteraciones de la NC de la carcinogénesis cervical es sin resolver debido a la falta de todo el genoma de correlación entre CNA y la expresión de genes [23], incluso en los brazos cromosómicos completamente amplificados como 3q o 5p [23] - [24], [26] - [27]. En un estudio previo, se investigó si la CNA en las líneas celulares Calo, CaSki, HeLa y SiHa se asocian con cambios en la expresión de genes [23]. De todo el genoma, sólo un pequeño porcentaje de los genes localizados en CNA (15,6%) o regiones recurrentes mínimos (18,8%) fueron desregulados. Sin embargo, estos porcentajes eran, como máximo, 4% mayor que en el grupo de genes sin alteraciones NC (14,8%). Estos datos sugieren que sólo aproximadamente el 4% de los genes alterados-CN general están desreguladas directamente por la dosis de genes en líneas celulares de CC-derivado. Incluso en segmentos genómicos confirmados a ser amplificada por completo, como 3q y 5p, el porcentaje de genes desregulados no siempre se incrementa. En el caso de 5p, el porcentaje de genes desregulados aumentó hasta un 33% en las líneas celulares 4. Aunque 3q se amplificó casi en su totalidad en Calo (93,5%) y HeLa (87,2%), la proporción de genes desregulados sólo aumentó aproximadamente 2 veces en HeLa (23,4%) pero no en Calo (12,7%) en comparación con la de CaSki ( 13,9%) y SiHa (9,4%), que mostró sólo la amplificación parcial de 3q [23]. Curiosamente, no se sobreexpresa todos los genes desregulados desde duplicada 5p y 3q. En cambio, aproximadamente el 20% de los genes desregulado en 5p y más de 50% de los genes desregulados en 3q se downregulated. Por lo tanto, los factores distintos de la dosis de genes, como los mecanismos epigenéticos, pueden influir en la expresión de genes dentro de segmentos del genoma completo amplificados. No hay estudios que examinaron la correlación global entre la expresión génica y alteraciones CN de CC.
En este estudio, hemos explorado 59 CC HPV16-positivas con microarrays-31 para el mapeo CN-AG y 55 para génica global expresión, con 27 CC en común. Se investigaron en todo el genoma, en un nivel del gen por gen, la proporción de genes alterados-CN que están desregulados y la extensión de la transcriptoma alterada total en la CC que está desregulado directa o indirectamente por la dosificación del gen. También investigamos los procesos biológicos en la carcinogénesis cervical que están vinculados con los genes desregulados por la dosis de genes y la influencia de la dosis de genes en la supervivencia global del paciente
Resultados
Tumor general de Análisis Genómico:. Identificación de los cromosomas , regiones y genes alterados en CN
Un total de 673 CNA mayor de 2,5 Mb fueron identificados con base en el análisis con el GeneChip Human Mapping 500 K (500 K) microarrays: 446 227 supresiones y amplificaciones. Estas regiones fueron validados con un segundo microarrays de alta densidad (CytoScan HD2.7) en 15 de los 31 tumores examinados con el 500 K microarrays. La coincidencia promedio entre los 2 arrays era 79,3%, pero aumentó linealmente desde 70% en el CNA de 2,5 a 3 Mb a 93,4% en CNA mayor de 10 Mb (r = 0,93, p & lt; 0,001, correlación de Spearman; Figura S1) . De hecho, cuando se compararon los brazos cromosómicos completos, la correlación entre los 2 microarrays estaba cerca de 100% (Figura 1). En promedio, los tumores tenían 22 ± 19 CNA (rango 0-65). Desde el tamaño del genoma haploide (3.000 Mb), se calculó el porcentaje de genoma alterado-CN (CN-AG) para cada tumor. Los porcentajes variaron ampliamente entre los tumores de 0% a 32,2% (media = 8,1 ± 8,9%) y seguían una distribución no paramétrica (Figura 2, Tabla 1). Los tumores se dividieron en 3 grupos de acuerdo a% CN-AG: bajo (media = 0,5 ± 0,6, n = 11), medio (media = 5,4 ± 2,4, n = 10), y alto (media = 19,2 ± 6,6, n = 10. La figura 2B, cuadros grises). A sólo 5 brazos cromosómicos% tenían un promedio CN-AG superior al de la media del genoma y alcanzaron significación estadística (p & lt; 0,05, chi-cuadrado, marcado con un asterisco en la figura 3A). Cuatro de estos brazos mostraron obtenidas mayormente genoma (3q, 5p, Xp, Xq), y sólo 3p mostró un genoma principalmente eliminado. El porcentaje más alto se encontró en 3q (44,3%), seguido muy por debajo por Xq (26,8%), Xp (22,4%), y 5p (21,2%; véase la Figura 3A). Sólo CN-alteraciones en los cromosomas 3q, Xp y 5p mostraron una correlación lineal con las alteraciones globales en el genoma (r = 0,88, p & lt; 0,0001, análisis de la varianza). Estos 3 cromosomas pueden explicar el 76% de la variación en CN (R2 ajustado = 0,76), con clasificación 3q en la parte superior y que representa el 55% de todas las alteraciones NC en el genoma del tumor [regresión lineal múltiple (MLR)].
señales de intensidad de polimorfismos de nucleótido único (SNP) o sondas no polimórficos se expresan como log
2 ratios de los cromosomas 3, 4 y 5 del tumor R496 exploró usando el 500 K microarray (panel superior) y HD 2.7 microarrays (panel inferior). En ambos paneles, el eje y representa un registro
2 escala de razón -1,5 a 1,5, y el eje x muestra el ideograma de los cromosomas exploradas con posiciones del genoma. La línea horizontal que cruza el punto y = 0 corresponde a 2 copias. La densidad media de las posiciones exploradas es más de 5 veces mayor en el microarray HD 2.7 que en el 500 K microarrays (ver materiales y métodos).
El panel A muestra las gráficas de caja con la distribución de los tumores (n = 31) de acuerdo con el porcentaje del total, eliminado o amplificado genoma alterado-CN (CN-AG). El panel B muestra la distribución de los tumores, agrupados como bajo (n = 11), media (n = 10), y alto (n = 10) de acuerdo con el porcentaje de global y 3q CN-AG. Las líneas horizontales dentro de las cajas representan la mediana (sólido) y media (de puntos), y los bigotes representan el valor mínimo y máximo dentro del rango de 1,56 intercuartil desde el extremo de la caja. Los valores fuera de este rango están representados por círculos negros. La disminución de la frecuencia acumulada de recurrentes genes alterados-CN, como aumentar el número de tumores que compartían el mismo gen alterado, se muestra para todo el genoma (Grupo C) o para los cromosomas con un peso significativo alta% CN-AG (Grupo D) . genes combinados son aquellos que se han eliminado en algunos y amplificado en otros tumores.
El lado izquierdo muestra el genoma explorado (Mb) en cada brazo del cromosoma que se exploró con el microarray 500 K en 31 tumores. El lado derecho muestra el número de genes en cada brazo explorado con el gen humano 1.0 ST microarrays en 27 de los tumores en los que se examinó CN. Cada barra representa el porcentaje de CN-AG (izquierda) o genes desregulados (derecha) del brazo cromosómico se indica en el medio. Las barras rojas indican las ganancias o sobreexpresión y barras azules representan pérdidas o subexpresión. La línea de puntos representa el porcentaje medio de lo global CN-AG (8,1%; izquierda) o el porcentaje de genes desregulados (9,5%; derecha) en el genoma del tumor. Los brazos están marcados con asteriscos tenían una proporción media de CN-AG o porcentaje de genes desregulados superior y estadísticamente significativa en comparación con los números que se encuentran en el genoma completo del tumor (p & lt; 0,05, chi-cuadrado) guía empresas
para identificar los genes con alteraciones de la NC, que se suman CNA con genes humanos de acuerdo a la posición en el genoma. El número de genes alterados varió de 0 a 10.666 (media = 2.754 genes; véase la Tabla 1) entre los tumores y se correlacionó positivamente con la CN-AG% (r = 0,99, p & lt; 0,0001, la correlación de Pearson). La mayoría de los genes alterados-CN no fueron compartidas entre los tumores. La frecuencia acumulada de recurrentes genes alterados-CN disminuyó drásticamente cuando el número de tumores que comparte el mismo gen alterado aumentó (Figura 2C). De hecho, ningún gen se altera en los 31 tumores exploradas, y sólo 3 genes (
RPL21P39
,
NLGN1
,
GM2AP1
) se vio alterada en 20 tumores. Los genes 3q fueron el -hasta más recurrente de 10 tumores muestran alteración de casi el 100% de la genes- explorado, y la curva de 3q se desplazan a la derecha 6 tumores de la curva más próximo de los otros cromosomas (véase la figura 2D). Un total de 264 genes con alteraciones recurrentes, todos de 3q, en 16 (51,6%) o más tumores.
Nos seleccionaron 7 de los genes más recurrentes se encuentran en 3q (
CLDN1
,
ECT2
,
NAALADL2
,
NLGN1
,
PLOD2
,
PLSCR1
, y
PLSCR4
) para ser validado con una técnica de reacción en cadena de la polimerasa cuantitativa en tiempo real (qPCR) en los 31 tumores y 17 controles. Todos los genes mostraron una correlación positiva significativa (r & gt; 0,6, p & lt; 0,0001, de correlación de Pearson) entre la intensidad media (relación log2) de SNPs identificados con el microarray en el CNA, en el que los genes estaban localizados en cada tumor, y el número de copias calculados con qPCR (datos no mostrados). Cuando se comparó el número de copias calculados con qPCR entre los grupos, el CN promedio de los 7 genes explorados fue significativamente mayor en tumores que tenían alteraciones que en aquellos sin alteraciones en estos genes 3q (p & lt; 0,05, prueba t; Figura 4A) .
el panel superior muestra el número de copias promedio de 7 genes (
CLDN1
,
ECT2
,
NAALADL2
,
NLGN1
,
PLOD2
,
PLSCR1
, y
PLSCR4
) situado en el 3T explorado con qPCR en los controles (linfocitos) y los tumores con 2 o 3-4 ejemplares identificados con el 500 K microarrays. Bigotes de cada barra representan el error estándar de la media. La línea roja punteada muestra el valor de 2,5 copias calculada con qPCR (ver materiales y métodos). El panel inferior muestra la correlación de la expresión génica de los genes (8
MCM2
,
PLOD2
,
PLSCR1
,
SMC4
,
ECT2
,
NLGN1
,
RFC4
, y
CLDN1
) situado en el 3T explorado en 27 tumores y 6 controles tanto con el HG 1.0 microarrays ST y técnicas de QRT-PCR . Iniciar
2 valores de las señales de intensidad normalizados obtenidos con el microarray (valores promedio robusto multichip) y QRT-PCR se representaron. La línea de tendencia (línea de color negro), el coeficiente de correlación (r), y el valor de p se calcularon con la prueba de correlación de Pearson.
Análisis de la Expresión Génica Global
La cantidad de ARN mensajero (ARNm ) transcrito a partir de 21.034 genes se exploró el uso de la micromatriz HG 1.0ST en 27 de los 31 tumores examinados con el 500 K microarrays y en 17 controles normales del epitelio cervical (Figura 5, Tabla 1 y Tabla 2). Se identificaron 2.006 genes alterados (9,5%), el 57,6% y el 42,4% downregulated upregulated (Tabla S1). Cuando los 2 adenocarcinomas (ACC; R075 y R189 en la Tabla 1) y el carcinoma de células adenoescamosa; fueron excluidos (ASCC R298 en la Tabla 1) a partir de los análisis, encontramos un número similar de genes y la concordancia del 95% con la lista de alterado genes. Por lo tanto, para mantener el tamaño de la muestra se incluyen los 27 CC.
La figura muestra el flujo de trabajo de análisis de los casos 59 CC explorados en este estudio. Todas las muestras fueron HPV16 CC positivo y se investigaron con microarrays-31 para el mapeo CN-AG y 55 para la expresión génica global, con 27 CC en común. Estos 27 CC se utilizaron para el análisis de la expresión génica global y la correlación entre la CN-AG y la expresión génica. Para el análisis de agrupación jerárquica, se incluyeron los perfiles de expresión de las muestras de CC 55. La supervivencia a cinco años se investigó en 55 pacientes, 51 exploraron para la expresión génica y 28 para las alteraciones NC, con 24 CC en común. Vea la sección de materiales y métodos para los detalles de los procedimientos.
La frecuencia de los genes desregulados se calculó el cromosoma. De los 42 brazos exploradas, sólo el 5 (3q, 4q, 6p, 15q, y Xq) mostraron un porcentaje más elevado y estadísticamente significativo de genes desregulados en comparación con el porcentaje total (9,5%; marcado con un asterisco en la Figura 3B). Los cromosomas que mostraron el mayor porcentaje eran 6p (16,0%, p & lt; 0,001) y 3q (15,9%, p & lt; 0,001), seguido de 4q (15,6%, p & lt; 0,001), Xq (13,0%, p & lt; 0,02), y 15q (12,9%, p & lt; 0,04); prueba de chi-cuadrado para todas las comparaciones. genes regulados positivamente predominaron en el 3T y 6p, mientras que los genes regulados negativamente fueron más prevalentes en el 4T, 15q, y Xq (véase la Figura 3B).
Se evaluó la expresión de 28 genes seleccionados para la validación de una técnica de QRT-PCR en 27 muestras de CC y 6 controles (Tabla S2). Se encontró una correlación positiva significativa (media r = 0,74, p & lt; 0,05; correlación de Pearson) entre los valores logarítmicos (log2) de los datos obtenidos con QRT-PCR y el microarray en 27 de los 28 genes explorados (96,4%). La Figura 4B muestra la correlación de los valores de intensidad (log2) obtenidos con los 2 métodos para 8 genes localizados en 3q. Estos datos indicaron que la expresión los valores calculados con la micromatriz eran bastante precisos porque hasta el 96,4% de los genes validados tenía una correlación significativa.
Para identificar los procesos biológicos asociados a los 2.006 genes expresados de manera diferente, se utilizó la base de datos para anotación, y Visualización, y una herramienta integrada de Discovery (DAVID; http://david.abcc.ncifcrf.gov/). En comparación con la base de datos del genoma humano, los 5 grupos más enriquecidos con los valores de p más bajos en rigurosidad media eran ciclo celular incluyendo la mitosis, los procesos metabólicos de ADN, incluyendo la reparación del ADN, la segregación de cromosomas, la organización del citoesqueleto, y los procesos de desarrollo (Tabla 3). Curiosamente, en el más alto rigor, donde se espera que los genes más estrechamente asociados en cada grupo, los grupos que incluyen la mitosis se clasificaron primero, tercero, quinto y (procesos biológicos en cursiva en la Tabla 3).
La grupo total de genes desregulados también se analizó con Pathway Analysis Ingenuity software (IPA), y los resultados globales fueron muy similares a los obtenidos con la herramienta DAVID (datos no mostrados). De las 89 vías canónicas que IPA identificó como alterado (p & lt; 0,05, prueba exacta de Fisher), aquellos involucrados en el ciclo celular y reparar el ADN clasificado en la parte superior de la lista (Figura 6A): perfil
espectáculos Panel A. los 25 principales vías canónicas identificados en el conjunto de 2.006 genes desregulados en el conjunto de tumores. El panel B muestra los 25 principales vías canónicas identificados en el conjunto de 862 genes desregulados exclusivamente en tumores de alto NC. Las vías canónicas fueron identificados con el software Ingenuity Pathway Analysis. El -log (valor p) y la relación se calcularon comparando el número de genes que pertenecen a la vía presente en los conjuntos de datos con la base de datos del genoma humano. El valor de p se calculó utilizando el chi-cuadrado o la prueba exacta de Fisher, según el caso, y valores de (valor p) -log superior a 1,3 (línea roja) corresponden a un valor de p & lt; 0,05. La vía canónica de señalización del factor inducible por hipoxia (HIF1α) fue estadísticamente significativa en los genes desregulados en el sistema entero (puesto 43) y en el alto-CN conjunto de tumores (26 lugar).
Correlación entre los cambios en CN y la expresión génica
Un simple análisis de la figura 3 sugiere que no existe una correlación clara entre la expresión génica y CNA. Por ejemplo, de los 5 cromosomas con el mayor porcentaje de CN-AG, sólo 2 (3q, Xq) mostró un aumento significativo en el porcentaje de genes desregulados. Por otra parte, los otros 3 cromosomas que muestran un aumento significativo en los genes desregulados (4q, 6p, 15q) carecía de un alto porcentaje de CN-AG, incluso 6p y 15q tenía un porcentaje muy por debajo de la media global. Aunque los genes sobreexpresados predominan en la mayoría de los cromosomas con un alto porcentaje de las ganancias, estos cromosomas también tienen una alta proporción de genes regulados negativamente, y en algunos, como Xq, predomina la proporción de genes regulados negativamente (Figura 3). Por otro lado, los cromosomas que muestra predominantemente deleciones (3p, 4p) también tenía un porcentaje de genes upregulated, aunque el porcentaje de genes downregulated predominó.
Para comprender más a fondo la relación entre la alteración CN y la expresión génica, Las variables analizadas fueron gen por gen en cada tumor. El estado de expresión (downregulated, upregulated, o sin modificar) para cada gen explorado (n = 21.034) fue identificado en cada tumor usando los valores de corte (ver Materiales y métodos). El estado CN de cada uno de estos genes también fue identificado en cada tumor. El número de genes con y sin cambios en la CN y la expresión génica se muestra para cada tumor en la Tabla 1. El número medio de los genes alterados-CN fue 1.673, y el número promedio de 2 genes de copia era 19.362 (véase la Tabla 1). En promedio, 2.010 (9,6%) los genes fueron desregulados en los tumores, de los cuales 241 fueron alterados CN y 1.769 tenido 2 copias. Estos datos significan que, en promedio, sólo el 14,4% (241 /1.673) de los genes alterados-CN y el 9,1% (1.769 /19.362) de 2 genes de copia fueron desregulados. La diferencia entre los 2 subgrupos fue sólo 5,3% (p & lt; 0.00001, chi-cuadrado) y corresponde a la fracción media de genes con alteraciones NC que pueden ser desregulados directamente por la dosis de genes. Cabe destacar que sólo el 69% de los genes amplificados y desregulados se sobreexpresa; el resto se downregulated. Además, sólo el 82% de los genes desregulados eliminados y se downregulated; el resto se sobreexpresa (datos no mostrados). Estos resultados concuerdan con las observaciones a nivel de cromosomas.
Para investigar si existe una tendencia lineal entre la expresión génica y la cantidad de CN alteración (CN-AG), se analizó la correlación entre las 2 variables, incluyendo el individuo los datos para todos los tumores estudiados. Como se esperaba, el número total de genes desregulados aumentó con% CN-AG (calculado a partir de la Tabla 1, r = 0,5, p = 0,007, correlación de Pearson; Figura 7). De acuerdo con la ecuación en la figura 7 (y = 32x + 1734), en un tumor con 0% CN-AG (x = 0), el número de genes desregulados es de aproximadamente 1.734 y se desregulado por mecanismos distintos de la dosis génica. Por el contrario, el tumor con el más alto% CN-AG (R365 = 32,2%, véase la Tabla 1) tendrá un adicional de 1.034 genes desregulados (total = 2.768). Este número es muy cercano al número observado de los genes desregulados (ver Tabla 1) y contó con la fracción de los genes desregulados que pueden estar desregulados directamente por la dosis de genes. En este caso extremo, el número corresponde a 37,4% de todos los genes desregulados (1,034 /2,768). En el conjunto de los tumores, sólo el 12% (241 /2.010) de los genes desregulados en promedio eran CN alterada (calculada a partir de la Tabla 1). Sólo CN-alteraciones en el 3T mostraron una regresión lineal clara con la expresión global de genes (r = 0,51, p = 0,006, análisis de varianza), y que explican el 23,2% (r ajustada
2 = 0,232, MLR) de todos los cambios en las la expresión génica.
se muestra la evolución del número de genes desregulados con mayor% CN-AG en el conjunto de los 21.034 genes explorados. La línea representa la tendencia de correlación lineal para el conjunto de datos. También se muestra la ecuación de la recta, el coeficiente de correlación, y el valor p calculado con el test de correlación de Pearson.
Identificación de genes desregulados y procesos biológicos asociados a los cambios en el gen Dosis
a) los genes desregulados en los tumores de bajo y alto-CN.
Para identificar los genes expresados diferencialmente en los tumores con porcentajes bajos y altos de alteraciones CN (véase la figura 2B, cuadros grises), comparamos cada grupo de los tumores con el grupo de control (n = 17) usando el método SAM. De los 21.034 genes explorados, 1.757 (8,4%) fueron desregulados en los tumores con alta CN, pero sólo 1.104 genes (5,2%) fueron desregulados en los tumores con baja CN. Curiosamente, 895 (81,1%) de los genes desregulados en el grupo-CN baja también fueron desregulados en el grupo de alto CN. La diferencia en el número de genes desregulados entre el grupo de alto CN y los genes comunes (n = 862) correspondieron a la fracción de los genes desregulados por la dosis de genes en el grupo de alto CN (49,1%).
Sorprendentemente, sólo el 9,2% de los genes desregulados exclusivamente en tumores de alto-CN (79 de 862) fueron amplificados (n = 76) o se elimina (n = 3) en 6 o más tumores. El resto de genes fueron alterados en CN 4-5 (n = 118), 1-3 (n = 370), o no (N = 295) tumores (Tabla S3). En base a estos cálculos, conservadora asumido que en este grupo de genes asociados exclusivamente con tumores de alto-CN (n = 862), la dosis de genes tiene una influencia directa sobre la expresión génica en, como máximo, 22,9% de estos genes (CN alterada en ≥ 4 tumores). El resto de genes (CN alterado en tumores ≤ 3, n = 665) no serían desregulados directamente por la dosis de genes, sino por otros mecanismos, quizás influenciados
en trans fotos: por algunos genes alterados-CN.
b) identificación de los procesos biológicos asociados con tumores de alto y bajo CN
.
se utilizó la herramienta de DAVID para identificar los procesos biológicos enriquecidos en el subconjunto de genes comunes (n = 895) y los desregulado exclusivamente en alto -CN (n = 862) y de bajo CN (n = 209), los tumores. Los grupos de procesos biológicos que se encuentran en el conjunto de genes comunes fueron muy similares a los enriquecido en todo el conjunto de los tumores (Tabla 3 vs. Tabla S4). Sin embargo, algunos procesos biológicos importantes enriquecidos en todo el conjunto de tumores, tales como la angiogénesis, la regulación de la adhesión celular y la anafase de la promoción de complejos /cyclosome (APC /C) proteasoma dependiente de proceso catabólico proteína ubiquitina-dependiente (ver Tabla 3) no fueron enriquecidos en el subconjunto de genes compartidos por ambos grupos. Curiosamente, estos 3 procesos fueron enriquecidos en los tumores de alto NC; por otra parte, que ocupa el primer lugar entre los procesos biológicos (Tabla 4). Otros grupos enriquecidos exclusivamente en el grupo de alto CN, pero no identificados en el subconjunto de genes comunes se incluye la glucólisis, que ocupa el segundo lugar, la apoptosis, y el transporte del ARNm (véase la Tabla 4). Estos datos sugieren que estos procesos están estrechamente vinculadas a la dosis génica. Los procesos de la organización del citoesqueleto, ciclo celular, y el empaquetamiento del ADN, aunque no exclusiva, también fueron enriquecidos en el grupo de genes asociados con tumores de alto CN, lo que sugiere que algunos genes implicados en estos procesos pueden ser desregulados por la dosificación del gen. Todos estos procesos biológicos, excepto la adhesión celular y la angiogénesis, se asociaron con genes sobreexpresados. Curiosamente, en el más alto rigor, los procesos de APC proceso de proteína /C-dependiente proteasomal dependiente de ubiquitina catabólico clasifican primero, seguido de la glucólisis y el empaquetamiento del ADN (procesos biológicos en cursiva en la Tabla 4). Notoriamente, la mayoría de los genes implicados en los procesos biológicos asociados con tumores de alto NC no fueron CN alterada (Figura 8). Por otro lado, sólo 2 grupos fueron enriquecidos en el subconjunto de genes desregulados exclusivamente en tumores de bajo NC: la diferenciación celular y el procesamiento y presentación de antígeno peptídico a través de clase principal complejo de histocompatibilidad I (datos no mostrados). Esto sugiere que la mayoría de los genes implicados en estos procesos están desreguladas 2 a través de mecanismos distintos de la dosis génica.
Se muestran los números de 2-copia o genes alterados-CN en ≤3 tumores (barras verdes) y CN -altered genes en tumores ≥ 4 (barras azules) entre los procesos biológicos enriquecidos en el subconjunto de genes desregulados exclusivamente en tumores de alto NC.
Para investigar si los perfiles de expresión génica de la procesos biológicos asociados con tumores de alto NC permiten la segregación de los tumores, ya sea por CN o por procesos biológicos a sí mismos, se realizó un agrupamiento jerárquico no supervisado para clasificar 55 tumores estudiaron con el HG 1.0 ST microarrays (Tabla 2), incluyendo los 27 tumores exploradas para análisis CN, y 17 controles sanos de cuello uterino. Sólo los perfiles de expresión de la glucólisis y el proceso catabólico proteína proteasomal APC dependiente segregados claramente los tumores en los grupos con los perfiles de expresión específicos (Figura 9). En el análisis de la glucólisis, el dendrograma mostró 3 ramas principales: 1 con un fuerte perfil regulada al alza, otro con una combinación de arriba débil y las señales de regulación a la baja, y una tercera con un fuerte perfil de regulación a la baja. Estos resultados muestran la heterogeneidad en la firma de genes de este proceso biológico en todo el conjunto de muestras. La mayoría de los tumores (81,8%) agrupados de manera uniforme en las 2 primeras ramas, y una minoría agrupada en la tercera rama (18,2%). Por el contrario, todos menos 3 controles se agruparon en la tercera rama. En particular, los tumores de alto NC se agruparon en el fuerte (60%) y se combinaron (40%) perfiles regulados positivamente, mientras que los tumores de bajo NC agrupados principalmente en la regulados a la baja (50%) y combinado (30%) perfiles (p = 0,028 , prueba exacta de Fisher; Figura 9A)
Sin Supervisión análisis de agrupamiento jerárquico de 55 CC y 17 muestras de epitelio cervical sanos utilizando los valores de expresión de los genes desregulados de la glucólisis (panel A) y el complejo /cyclosome promotor de la anafase. (APC /C) dependiente de proteína proteasomal proceso catabólico (panel B) obtenido con el HG 1,0 ST microarray. Cada fila representa un gen y cada columna representa una muestra. Las muestras nombre comienza con la letra "R" son los CC y con una "C" son los controles; CC que terminan en 1, 2 o 3 pertenecen a bajos, grupos CN-alto o medio, respectivamente, mientras que los que terminan sin número no fueron exploradas por CN. La longitud y la subdivisión de las ramas representan las relaciones entre las muestras basadas en la intensidad de la expresión génica. a. segundo. a. segundo. a.