Extracto
Una firma la expresión génica asociada a la etapa de genes expresados de forma coordinada, incluyendo el factor de transcripción Slug (SNAI2) y otros marcadores de la transición epitelio-mesenquimal (EMT) se ha encontrado presente en las muestras del gen a disposición del público expresión de datos en múltiples tipos de cáncer, incluyendo el cáncer no epiteliales. Los niveles de expresión de los genes co-expresaron varían en un continuo y coordinan de manera a través de las muestras, que van desde la ausencia de expresión a la fuerte co-expresión de todos los genes. Estos datos sugieren que las células tumorales pueden pasar a través de un proceso de EMT-como de transición mesenquimales en diversos grados. Aquí nos muestran que, en el glioblastoma multiforme (GBM), esta firma se asocia con tiempo hasta la recurrencia después del tratamiento inicial. Mediante el análisis de los datos de Genoma del Cáncer Atlas (TCGA), se encontró que los pacientes con GBM que respondieron al tratamiento y que tenían mucho tiempo hasta la recurrencia tenido niveles bajos de la firma en sus muestras de tumores (
P
= 3 × 10
-7). También se encontró que la firma está fuertemente correlacionada en gliomas con el CD44 marcador de células madre putativa, y es altamente enriquecido entre los genes expresados diferencialmente en glioblastomas vs. inferiores gliomas de grado. Nuestros resultados sugieren que la larga demora antes de la recurrencia del tumor se asocia con la ausencia de la firma mesenquimal, aumentando la posibilidad de que la inhibición de esta transición podría mejorar la duración de la terapia en pacientes con glioma
Visto:. Cheng WY, Kandel JJ, Yamashiro DJ, Canoll P, Anastassiou D (2012) Una firma la expresión de múltiples genes del cáncer mesenquimal transición se asocia con tiempo prolongado hasta la recurrencia en glioblastoma. PLoS ONE 7 (4): e34705. doi: 10.1371 /journal.pone.0034705
Editor: Jeffrey K. Harrison, Universidad de Florida, Estados Unidos de América
Recibido: December 2, 2011; Aceptado: March 6, 2012; Publicado: 6 Abril 2012
Derechos de Autor © 2012 Cheng et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Esta investigación fue financiado con ingresos de los derechos de patente del inventor de la Universidad de Columbia. La patente no está relacionada con la investigación descrita en el documento. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
una etapa asociada a la expresión de genes firma multi-cáncer se ha identificado recientemente [1], que consta de un conjunto de genes que se sobreexpresan coordinadamente sólo en las muestras de cáncer que han superado una etapa particular específica para cada tipo de cáncer . La tabla 1 contiene una lista de los 64 genes correspondientes a las 100 mejores conjuntos de la sonda (tal como se presenta en [1]) de la firma. La firma contiene numerosos transición epitelio-mesenquimal (EMT) marcadores [2], [3], [4], tales como el factor de transcripción EMT-inducir Slug (SNAI2), así como COL5A2, FAP, POSTN, COL1A2, COL3A1, FBN1, TNFAIP6, MMP2, GREM1, BGN, CDH11, SPOCK1, DCN, COPZ2, thy1, PCOLCE, PRRX1, PDGFRB, SPARC, INHBA, COL6A2, FN1, ACTA2. Sin embargo, la firma también está presente incluso en algunos tipos de cáncer no epiteliales, tales como neuroblastoma y sarcoma de Ewing. En cada conjunto de datos, el nivel de expresión de los genes co-expresaron varía de manera continua a través de las muestras. En un experimento reciente también confirmamos que la mayoría de los genes de la firma, incluyendo α-SMA, se expresan en algunas células de cáncer humano xenoinjertados mismos
in vivo
, pero no en las células de ratón de acogida [5]. Estos resultados indican que las células cancerosas pueden pasar a través de un proceso de transición mesenquimales en diversos grados que varían de la falta total de expresión a la fuerte co-expresión de los genes de la firma, y por lo tanto las vías subyacentes correspondientes se activan dentro de las células cancerosas, en combinación con otras vías en el microambiente tumoral proporcionar interacciones contextuales.
el nivel medio de expresión de estos 64 genes puede ser pensado como el nivel de expresión de un MetaGene en representación de la firma, a la que nos referimos como la "mesenquimales MetaGene transición ". La hipótesis de que este valor está asociado con los datos clínicos en el glioblastoma multiforme (GBM) para los cuales no es ricos tales datos disponibles en el Atlas del Genoma del cáncer (TCGA). Se encontró que efectivamente se ha producido una fuerte asociación de la MetaGene con el fenotipo "Días hasta la recurrencia del tumor", definido como el período de tiempo desde el tratamiento inicial hasta la fecha del diagnóstico o el reconocimiento de la presencia y naturaleza de la devolución de los signos y síntomas de del cáncer después de un período de mejoría. Los pacientes que no experimentaron mejoría después de la terapia tienen una entrada de "nulo" en el campo correspondiente.
Métodos
Para el análisis estadístico se utilizó la suma de rangos de los pacientes con largo tiempo hasta la recurrencia después de la clasificación los pacientes en términos de la MetaGene mesenquimal. Para evaluar la significación estadística, se calculó el
P valor
de su definición utilizando la función de distribución empírica. Además, se realizó la regresión de Cox entre los días hasta la recurrencia del tumor y el nivel de expresión de la firma.
También realizó una regresión de Cox en los días de la recurrencia del tumor, utilizando tanto los valores de expresión de la MetaGene mesenquimal y la cuatro subtipos de glioblastoma como covariables.
resultados
la figura 1 muestra un diagrama de dispersión en el que se representa cada una de las 99 muestras para las que los "Días hasta la recidiva tumoral de" fenotipo tiene una entrada no nulo por un punto que indica el nivel de expresión del MetaGene transición mesenquimal y el número de días de recurrencia del tumor. La cifra revela que, dentro del grupo de pacientes que experimentaron una mejoría después de la terapia, los ocho pacientes cuyos tumores recurrido más de tres años después de la terapia tienen valores muy bajos de la expresión de la MetaGene. La figura 2 muestra un mapa de calor de los 64 genes, donde las muestras se clasifican en función de la expresión de la MetaGene y los ocho pacientes para los que el tiempo hasta la recurrencia fue más de tres años están resaltados en verde. La suma de rangos de estos ocho pacientes es 1 + 2 + 6 + 7 + 9 + 11 + 16 + 18 = 70. La suma de rangos es especialmente adecuado como una medida de este aspecto observada particular de la asociación de los "Días de tumor recurrencia "fenotipo con la expresión de un gen, en el que se requiere la ausencia de la expresión génica para excepcionalmente largo tiempo hasta la recurrencia. La probabilidad de la suma de rangos de ser ≤70 debido a la fatalidad se estima como la frecuencia relativa de estos hechos al azar después de permutar los fenotipos diez millones de veces y volver a calcular la suma de rangos, que concluye que
P
= 3 × 10
-7, que es también la probabilidad de encontrar que la suma de ocho números distintos elegido al azar entre 1 y 99 es menor o igual a 70.
Cada punto en el gráfico de dispersión representa uno de los 99 pacientes para los que los "Días de la recidiva tumoral de" fenotipo tiene una entrada que no sea nulo. El eje horizontal mide el promedio de las RMA-normalizaron los niveles de expresión de los 64 genes que se muestran en la Tabla 1. El eje vertical mide los días hasta la recidiva tumoral y la línea de puntos horizontal se dibuja en el punto de corte de 3 años.
las 99 muestras se clasifican en función del nivel medio de expresión de los genes se muestran en la Tabla 1. los ocho pacientes para los que el tiempo hasta la recurrencia fue más de tres años han sido resaltados en verde en la parte 1
er, 2
ª, 6
º, 7
º, 9
ª, 11
ª, 16
º y 18
ª posición, dando como resultado la suma de rangos de 70 .
también separamos todo el conjunto de 545 muestras de tumores en dos grupos de igual tamaño, que contiene altas frente a los bajos niveles de la MetaGene mesenquimal. Dentro de las 99 muestras que contienen un "Días que la recidiva tumoral de" campo, había 48 "nivel bajo" y 51 muestras de "alto nivel". Se realizó la regresión de Cox entre días a la recurrencia del tumor y el nivel de expresión de la firma. La figura 3 contiene las correspondientes curvas de supervivencia de Kaplan-Meier que resulta en una asociación ve claramente con la significación estadística de p = 0,0054 usando una prueba de ji cuadrado.
Las muestras tumorales 545 se dividieron en dos grupos de igual tamaño en función de sus niveles de la MetaGene mesenquimal. Se muestran las curvas de Kaplan-Meier para las muestras correspondientes con entradas en los "Días hasta la recidiva tumoral de" campo.
A continuación, utilizamos la suma de rangos de métrica para identificar que, entre los genes individuales 64 de la Tabla 1 que define la MetaGene tiene la mejor puntuación, esperando que algunos de ellos tendría suma de rangos inferiores a 70. Sorprendentemente, la mejor puntuación fue gen COL5A1 con rango suma igual a 78 seguido de COL6A2 con rango suma igual a 82. En otras palabras, la puntuación de la MetaGene es significativamente mejor que la de cualquiera de sus genes de componentes individuales. Aún más sorprendente es que después de hacer una búsqueda exhaustiva entre todos los 12.042 genes, el gen ocupa el primer lugar (EFEMP2) tenía rango suma igual a 75, aún peor que eso (70) de la MetaGene. Estos resultados sugieren que la firma identificada en [1] comprende una colección sinérgica de genes correspondientes a un mecanismo biológico de transición mesenquimal, que, cuando ausente, se asocia con mayor período de tiempo para la recurrencia del tumor en GBM.
Tabla la figura 2 muestra una lista de las 30 principales genes individuales en función de su rango suma de los "Días hasta la recidiva tumoral de" fenotipo. Nueve de estos 30 genes, destacados en la Tabla 2, se encuentran entre los 64 genes de la Tabla 1, lo que demuestra el enriquecimiento fuerte (
P
= 3 × 10
-14) de los marcadores de EMT en esta colección imparcial de los genes asociados con el fenotipo.
Si bien todos los casos en el conjunto de datos TCGA han sido diagnosticados de glioblastoma, la recurrencia tardía en estos ocho casos es más una característica de los gliomas de bajo grado. Por lo tanto, se investigó si menores gliomas de grado también se caracterizan por niveles más bajos de la firma mediante el análisis del NCI repositorio para Molecular cerebro Neoplasia de datos (Rembrandt) conjunto de datos, que incluye la expresión de genes tanto de glioblastoma, así como varios tipos de gliomas de grado más bajo. Tabla 3 demuestra que, efectivamente, existe una fuerte enriquecimiento (siete de los 64 genes en el cuadro 1 se encuentran entre los 30 mejor clasificado de genes expresados diferencialmente,
P
= 10
-13). Además, se encontró una fuerte correlación entre los niveles de expresión de la MetaGene y la madre de cáncer CD44 (marcador de células
P
= 5 × 10
-56 basada en el ajuste de correlación de Pearson para la distribución t). La figura 4 muestra el diagrama de dispersión correspondiente. Estudios recientes han demostrado que los altos niveles de CD44 se expresan en células madre cancerosas aisladas a partir de varios tipos diferentes de tumores [6], aunque este concepto se encuentra todavía en evolución, y CD44 también se expresa en una variedad de otros tipos de células. CD44 se ha encontrado en una población de células enriquecida en células madre glioma [7]. También se expresa ampliamente en el glioblastoma, y el aumento de los niveles están asociados con la progresión del glioma y resistencia a la terapia [8].
Cada punto en el gráfico de dispersión representa una muestra glioma del NCI Repositorio Molecular cerebro Neoplasia de datos ( Rembrandt) conjunto de datos. Los puntos son codificados por color rojo para los glioblastomas y azul para los gliomas de bajo grado. Los niveles de expresión de ARN son normalizada.
El análisis de datos de expresión génica ha dado lugar a la clasificación en diversos subtipos de los glioblastomas [9], [10], también presente en los gliomas de grado inferior [11], con características distintas, cada una de las cuales se caracteriza por la presencia de genes particulares. Curiosamente, se encontró CD44 enriquecido en los subtipos mesenquimales en todos estos casos. La característica de nuestros resultados actuales, sin embargo, es que la firma mesenquimales transición usado en este documento refleja un proceso biológico aplicable a múltiples tipos de cáncer, ya que se deriva del análisis de su presencia en muchos tipos de cáncer diferentes [1], en lugar de utilizar la clasificación métodos en muestras de glioma solo para identificar subtipos. Por otra parte, la asociación con el fenotipo se encuentra en la ausencia, en lugar de la presencia, de la firma.
Para confirmar que la asociación observada con los "Días hasta la recidiva tumoral de" fenotipo está más relacionada con la presencia de la firma mesenquimales transición, en lugar de la clasificación en un subtipo mesenquimales, se realizó multivariable de regresión de Cox en día para la recurrencia del tumor, utilizando tanto los valores de expresión de la MetaGene transición mesenquimal y los cuatro subtipos [9] como covariables. La variable subtipo es una variable categórica con cuatro tipos (mesenquimales, Clásica, neuronales y proneurales). Para inferir las muestras cuyos subtipos no se les dio en el documento original, se realizó una imputación vecino más cercano de diez basado en los genes de la firma de los cuatro subtipos como se da en [9]. El resultado muestra que la variable expresión MetaGene mesenquimal es el único importante de covarianza (con
P = 0,049
), mientras que el resto de las variables categóricas no pasó el nivel de significación de 0,05 (el mínimo era de 0.160 para el subtipo mesenquimal), lo que demuestra que los "Días de la recidiva tumoral de" fenotipo se asoció significativamente más con la firma mesenquimal. Los resultados de la regresión de Cox se muestran en la Tabla 4.
Para comparar más directamente la firma mesenquimal con la del subtipo mesenquimales de [9], hemos creado un MetaGene para este último de manera que podamos evaluar su asociación con los "Días hasta la recidiva tumoral de" fenotipo medido por la suma de rangos. Esto fue creada usando la lista de genes como se describe en la información complementaria del documento, disponible en http://tcga-data.nci.nih.gov/docs/publications/gbm_exp. Específicamente, en el archivo de datos asociado que contiene los valores de expresión y llamadas de subtipo para las muestras Core TCGA utilizando los datos escalados unificadas, hay 216 genes etiquetados como mesenquimales. Estos genes se clasificaron en función de su poder para representar el fenotipo mesenquimal, como se determina por las diferencias entre componente mesenquimal centroide de cada gen y el componente centroide de los subtipos restantes, que también puede ser considerado como el cambio en el registro de pliegue entre la media del gen valor en el subtipo mesenquimales y media del gen general [12] (como se cita en el archivo de datos que contiene la lista de genes ClaNC840 y centroides). Sobre la base de esa clasificación, hemos elegido la parte superior 64, de manera que los tamaños de las dos metagenes al ser comparados son idénticos. El valor de la suma de rangos era 142 (que habría sido 151 si el uso de los 216 genes). Esto debe compararse con el valor correspondiente de 70 de la MetaGene transición mesenquimal y con las otras entradas de los genes individuales en la Tabla 2. Estos resultados confirman además que la asociación observada con días a la recurrencia del tumor se debe a la multi-cáncer firma transición mesenquimal , que tiene la propiedad notable que el MetaGene correspondiente tiene menor rango suma que cualquier gen individual.
Discusión
Debido a que los gliomas no son cánceres epiteliales, y la firma también se ha encontrado en otros cánceres epiteliales , tales como neuroblastoma y sarcoma de Ewing, la firma representa un proceso biológico más general de transición mesenquimal, aplicable a todos los cánceres sólidos que probamos. De hecho, cuando el conjunto de genes de la Tabla 1 son la entrada para el conjunto de genes de enriquecimiento de análisis (GSEA) [13] en contra de la base de datos de firmas moleculares (MSigDB), hay muchos resultados con
P
valor exactamente igual a " cero ", que corresponde a los genes expresados en las muestras de etapas superiores de muchos tipos de cáncer, tales como la nasofaringe, cabeza y cuello, urotelial, linfomas, etc. tales tipos de cáncer no habían participado en ningún modo en la derivación de la firma. Esta notable validación de la firma por apuntando a todas las clases de tipos de cáncer en MSigDB sugiere que la firma puede reflejar un mecanismo biológico universal de transición mesenquimales presente en la etapa invasiva de todos los cánceres sólidos, incluyendo glioblastoma. El análisis de conjuntos de datos relacionados sugiere que hay múltiples vías afectadas que comprenden un mecanismo biológico particularmente complejo que aparece para reactivar los programas de desarrollo embrionario. En efecto, al analizar la firma de 64 genes contra MSigDB ontología de genes proceso biológico conjuntos de datos, los cinco mejores resultados estaban relacionados con el desarrollo (esquelético, órgano, del organismo multicelular, sistema, estructura anatómica). El destacado GO componente celular era la matriz extracelular y el prominente GO función molecular fue de unión a colágeno.
Se ha sugerido recientemente que "stemness" en las células tumorales (que se caracteriza por la capacidad tanto de auto-renovación, así como generar descendientes diferenciadas) pueden estar interconectados íntimamente con el paso a través de un EMT. Por ejemplo, se encontró que la EMT en algunos modelos para generar células con propiedades de células madre [14], [15], [16], [17], [18]. En particular, se ha demostrado que las células madre como aislados de cáncer de mama humano co-expresar altos niveles de CD44 y altos niveles de marcadores mesenquimales, incluyendo Slug [14]. Además, la inducción de EMT en células epiteliales mamarias humanas inmortalizadas conduce a altos niveles de expresión de CD44 en las células mesenquimales-como [14]. La resistencia a fármacos también se ha relacionado con la presencia de células madre del cáncer [16], [18], [19], [20], que apoya la idea de que las células madre del cáncer pueden ser responsables de la recurrencia después de la intervención terapéutica. Por lo tanto, y dada la fuerte correlación de la firma transición mesenquimales con CD44, una posible explicación para la ausencia de la firma transición mesenquimales en pacientes con excepcionalmente largo tiempo hasta la recurrencia puede ser debido a una correspondiente falta de stemness en las células cancerosas de estos pacientes por lo que es menos probable que el cáncer vuelva a ocurrir después del tratamiento. Una alternativa para explicar la asociación observada puede ser proporcionada por la transformación hacia un fenotipo más mesenquimales [21].
A pesar de que hay varios factores que inducen la transcripción de la EMT [22], algunos de los cuales también se encuentran regulados al alza en ocasiones la firma mesenquimales transición caracterizado por los genes en la Tabla 1, Slug es el único encontrado upregulated consistente. También fue el único factor de transcripción aumentada en nuestros xenoinjertos experimentales [5]. Slug también ha sido recientemente encontrado para ser asociado con la invasividad en glioma [23], en consonancia con los resultados presentados aquí. Por otra parte, cuando nos clasificamos todos los genes en términos de su correlación (utilizando la medida de información mutua [24]) de su expresión con la de Slug en las 99 muestras que hemos analizado aquí, encontramos que, sorprendentemente, los ocho mejores entradas ( COL6A3, COL3A1, LUM, COL5A1, COL1A2, COL6A2, COL1A1, PCOLCE) fueron todos los genes incluidos en ambas tablas 1, así como la Tabla 2, más el apoyo a la hipótesis de que Slug podría ser un regulador maestro del mecanismo biológico responsable de la firma. Se encontró recientemente [25], sin embargo, que la sobreexpresión inducida de la torsión factor de transcripción en glioblastoma conduce a un aumento de invasión y la expresión de varios de los genes en la Tabla 1, incluyendo Slug, lo que sugiere que la torcedura puede jugar un papel causal para la transición mesenquimal en el glioblastoma
La misma firma también fue encontrado para ser predictivos de la terapia neoadyuvante en el cáncer de mama -. ver, por ejemplo, la disposición 6 de [1], en el que 7 de las 8 muestras de la agrupación en el lado izquierdo del mapa de calor (con niveles bajos de la firma) tuvieron buena respuesta al tratamiento, mientras que 12 de 14 muestras en el segundo grupo ( con altos niveles de la firma) fueron resistentes.
las observaciones que (a) todos los pacientes con GBM con excepcionalmente largo tiempo hasta la recurrencia tenían niveles extremadamente bajos de la firma gen mesenquimal, y (b) la firma mesenquimal está fuertemente enriquecido entre los genes underexpressed en gliomas de grado más bajo en comparación con glioblastomas, sugieren que la orientación del mecanismo biológico subyacente podría suministrar un enfoque novedoso para el tratamiento adyuvante de gliomas. Además, la capacidad de identificar con precisión los componentes de la firma genética ofrece oportunidades únicas para la identificación de objetivos potenciales para dicho tratamiento.
Reconocimientos
Se expresa reconocimiento al Prof. Tian Zheng del Departamento de Estadística de la Universidad de Columbia útil para los debates.