Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Meta-Análisis de la expresión génica firmas Definición de la transición epitelial a mesenquimal durante cáncer Progression

PLOS ONE: Meta-Análisis de la expresión génica firmas Definición de la transición epitelial a mesenquimal durante cáncer Progression


Extracto

La transición epitelial a mesenquimal (EMT) representa un evento crucial durante la progresión y diseminación del cáncer. EMT es la conversión de las células de carcinoma epitelial de un a un fenotipo mesenquimal que asocia con una motilidad celular superior, así como una mayor quimiorresistencia y stemness cáncer. En particular, la EMT ha sido cada vez más reconocido como un evento temprano de la metástasis. Se han realizado numerosos estudios de expresión génica (GES) para obtener las firmas del transcriptoma y genes marcadores para entender los mecanismos de regulación de EMT subyacentes. Sin embargo, ninguna meta-análisis teniendo en cuenta la multitud de GES de la EMT se ha realizado para elaborar integral los genes fundamentales en este proceso. Aquí mostramos el meta-análisis de 18 GES independientes y publicados de la EMT que se centraron en diferentes tipos de células y modalidades de tratamiento. Análisis computacional reveló agrupación de GES de acuerdo con el tipo de tratamiento en lugar de tipo de célula. GES de la EMT inducida a través de factor de crecimiento transformante-β y el tratamiento del factor de necrosis tumoral α cedido grupos definidos de manera uniforme mientras GES de modelos con la inducción de EMT alternativa agrupado de una manera más compleja. Además, hemos identificado los genes regulados negativamente hacia arriba y que fueron compartidos entre la multitud de GES. Esta lista de genes marcadores de EMT núcleo incluye también conocidos, así como nuevos genes hasta ahora no descritas en este proceso. Por otra parte, varios genes de la lista de genes EMT núcleos significativamente correlacionados con deterioro de la respuesta patológica completa en pacientes con cáncer de mama. En conclusión, este meta-análisis proporciona un estudio completo de firmas de expresión disponibles EMT y muestra una comprensión fundamental de los mecanismos que gobiernan la progresión del carcinoma de

Visto:. Gröger CJ, Grubinger M, Waldhör T, Vierlinger K, Mikulits W (2012) Meta-Análisis de la expresión génica firmas Definición de la transición epitelial a mesenquimal durante la progresión del cáncer. PLoS ONE 7 (12): e51136. doi: 10.1371 /journal.pone.0051136

Editor: Olivier de Wever, Universidad de Gante, Bélgica

Recibido: 28 Junio, 2012; Aceptado: 29 de octubre de 2012; Publicado: December 10, 2012

Derechos de Autor © 2012 Gröger et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este trabajo fue apoyado por la Unión Europea, FP7 Health Research, proyecto número SALUD-F4-2008-202047. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

La transición epitelial a mesenquimal (EMT) ha sido descrita originalmente como un proceso esencial de la embriogénesis metazoos [1]. En la última década, EMT se ha realizado como un evento crítico en la progresión del carcinoma como células tumorales epiteliales adquieren un fenotipo mesenquimal que les permite desprenden del tumor primario y para invaden el tejido local [2]. En general, las células epiteliales polarizadas están organizados por uniones célula-célula y célula-complejos de anclaje para formar superficies apical y basolateral. En contraste, las células mesenquimales forma conformada irregularmente estructuras en ausencia de adherencias apretados para las células vecinas y reducen el contacto celular al sustrato. Las células mesenquimales tienen una forma alargada en comparación con el epitelio y muestran una polaridad anterior-posterior que permite el aumento de la migración a través de fuerzas de adhesión reducidos. Mientras que las células epiteliales invaden colectivamente en grupos, células mesenquimales muestran el movimiento de células individuales que les permite difundir a granel a partir de células [3]. Además, un EMT parcial se presentan diferentes niveles de expresión de E-cadherina se ha observado que aún podría dar lugar a la invasión celular colectiva [4].

EMT se ha clasificado en tres subtipos [5]. Se requiere el tipo 1 de EMT para la embriogénesis para proporcionar la gastrulación y la formación de las células de la cresta neural que se diferencian en varios tipos de células, sin propagación sistémica. Tipo 2 EMT participa en la regeneración de tejidos y fibrosis de diferentes órganos tales como el riñón, hígado, pulmón y el intestino que conduce a la acumulación de tejido conectivo. Tipo 3 EMT asociados con un aumento en la malignidad de las células de carcinoma. células epiteliales neoplásicas inducidos a someterse a EMT son frecuentemente localizados en el frente invasivo del tumor primario e inician la cascada de difusión de células tumorales por la invasión celular local que es seguido por la entrada en la vasculatura. En particular, la EMT representa un proceso transitorio y reversible que puede conducir a un mesenquimales del epitelio de transición (MET) tras la colonización metastásica [5],. Los ciclos de EMT y MET se supone estar involucrado en la formación de metástasis en sitios distales [3]. Sin embargo, la base molecular de los cambios en la plasticidad del epitelio de la EMT y MET es todavía una cuestión abierta y su papel en pacientes con cáncer es un tema de debate. moléculas de señalización e inductores de tipo 3 EMT confieren la resistencia de las células cancerosas a la apoptosis y la senescencia inducida por oncogenes, así como la quimiorresistencia [6]. Hallazgos recientes indican que la EMT proporciona células mesenquimales con características de células madre que permiten a las células de carcinoma de generar metástasis en sitios secundarios [3]. Estas células madre de cáncer, también denominado cáncer de iniciar las células, la cuota de características fenotípicas y funcionales con células embrionarias migratorias que exhiben un fenotipo mesenquimal [6].

Profiling del transcriptoma utilizando microarrays ha sido ampliamente utilizado para elucidar los patrones de expresión durante EMT en diferentes condiciones que revelaron nuevos biomarcadores y mecanismos moleculares de los estudios primarios. Un metaanálisis generalmente describe la combinación de un gran número de estudios de diferentes muestras y tejidos o la comparación de los datos propios con los datos publicados [7], [8]. Los recientes progresos en el establecimiento de la expresión génica de datos permite identificar nuevos marcadores y mecanismos pertinentes que fueron subestimados en los estudios individuales, pero surgieron de un meta-análisis. Por ahora, una plétora de estudios de expresión génica (GES) que cubre una amplia variedad de tipos de células sometidos a EMT junto con diversos modos de inducción están disponibles. Sin embargo, hasta donde sabemos, ningún metanálisis tratar con estos estudios de EMT se ha realizado hasta el momento.

Los cambios en un sistema biológico requiere una alteración concertada de los conjuntos de expresión génica. Las herramientas de análisis bioinformáticos de enriquecimiento investigan conjuntos de expresión génica de tales cambios. Estas herramientas examinan la sobrerrepresentación de los conjuntos de genes en comparación con todo el genoma, mapa una lista de entrada de los genes a categorías biológicas en las bases de datos en línea y evaluar estadísticamente la sobrerrepresentación de genes para cada categoría biológica o anotación como Kyoto Enciclopedia de genes y genomas (KEGG ) y las vías de ontología de genes (GO) [9]. El uso de varias herramientas de enriquecimiento individuales de la misma lista de entrada y la consideración de categorías sólo enriquecidos constantemente se han notificado a ser una estrategia muy prometedora [10], [11].

Nos recogió datos de 18 estudios publicados y GES independientes de la EMT y las listas de genes extraídos de los genes regulados negativamente de manera significativa hacia arriba y para el análisis de conglomerados. Este enfoque reveló agrupaciones de genes de acuerdo con las modalidades de tratamiento en lugar de tipo de célula. Posteriormente, se extrajeron una lista de EMT-núcleo que consta de 130 genes con genes símbolos oficiales y los nombres de los cuales se procedió a investigar por análisis de enriquecimiento con varias herramientas de enriquecimiento individuales. En particular, los genes seleccionados de la lista de EMT-core significativamente correlacionados con deterioro de la respuesta patológica completa (PCR) en pacientes con cáncer de mama. Este análisis propone que la lista de genes EMT-core es relevante para el reconocimiento de los mecanismos moleculares de la EMT. Además, el análisis de conglomerados muestra nuevos conocimientos sobre las relaciones de los procesos de EMT a través de diferentes tipos de células y modos de inducción.

Resultados

Recogida de datos de los estudios de expresión génica (GES)

Para evaluar las similitudes entre GES publicados y definir una lista de genes del núcleo de la EMT humana, se analizaron 18 GES independientes de la EMT. Estos 18 GES independientes y publicados consistieron en 24 conjuntos de datos en total (Tabla 1). Varios autores informaron cinética de EMT de diferentes tipos de células o los efectos dependientes de la dosis de los inductores de EMT dentro de los estudios individuales. Sin embargo, según lo informado por los autores, se ha seleccionado sólo el punto de prueba en particular que muestra el efecto más fuerte o fenotipo EMT. Takahashi
et al.
Publicó dos GES relacionados, de los cuales uno estaba formado por dos conjuntos de datos, dando como resultado tres conjuntos de datos de un estudio independiente [12]. Taube
et al.
Informó 5 conjuntos de datos publicados el plazo de un GES con los patrones de expresión similares y diferentes modos de EMT de inducción [13]. Los datos procesados ​​(datos normalizados y, en general logarithmized) fueron descargados de la expresión de genes de Omnibus (GEO) y bases de datos ArrayExpress (AE) y anotados con BioConductor y NetAffx. Numerosos GES, disponible en GEO y AE, fueron excluidos ya que o bien no proporcionaron datos procesados ​​o no contienen repeticiones o no han sido publicados. Debido a la variedad de formatos de microarrays, así como diferentes métodos de normalización y filtrado utilizados en la literatura, hemos utilizado transformadas en lugar de los datos brutos con el fin de mantener los criterios de calidad aplicados por los autores durante el pre-procesamiento de datos. -Student de dos colas
t-test
se utilizó para calcular los valores de p. Es significativo que los genes fueron seleccionados hacia arriba y regulación a la baja de conocer a un cambio veces mayor que 2 o inferior a 0,5 y un valor de p inferior a 0,05.

análisis de conglomerados GES

Hemos generado una matriz que contiene los símbolos de genes a través de las GES analizadas (n = 14,113) que se reportan todos de forma única. Es significativo que los genes regulados negativamente hacia arriba y cada uno de GES se transfirieron a la matriz de acuerdo con su tipo de regulación. upregulated genes fueron marcadas con 1, downregulated genes con genes -1 y no regulados diferencialmente con 0 (Tabla S1). Esta distribución de datos consistió en 88,22% genes no regulados diferencialmente y 11,78% arriba o genes downregulated y es significativamente diferente a una distribución binomial con los parámetros (p & lt; 0,0001). Con el fin de determinar un punto de corte para el número de GES compartir un gen particular utilizado para el análisis cluster, se analizaron la función de distribución binomial proporcionado por R, así como los resultados de agrupación jerárquica preliminares de cada opción de corte (datos no mostrados). A partir de esto, decidimos investigar la agrupación de los genes compartidos entre al menos 10 conjuntos de datos (n = 365; p & lt; 0,0001; Figura 1). Además, este análisis mostró grupos de GES de acuerdo con el modo de EMT estímulo en lugar de tipo de células (Figura 2A). Curiosamente, una agrupación más rigurosa de genes compartidos entre por lo menos 14 de los conjuntos de datos analizados GES proporcionado agrupaciones similares, a pesar del hecho de que esta lista contiene sólo 41 genes (Figura 2B y Figura S1).

Los genes compartidos entre en menos 10 de los 24 conjuntos de datos se utilizaron para Manhattan agrupación jerárquica. El tipo de regulación dentro de un estudio en particular fue visualizado a través de mapa de calor. Columnas: genes compartidos entre al menos 10 conjuntos de datos (n = 365); filas: GES analizados (24 conjuntos de datos en total); verdes: downregulated genes; rojo: upregulated genes; negro: los genes no regulados. GSE Gene Expression Omnibus (GEO) récord de la serie; E.TABM: ArrayExpress (AE) récord de la serie; TGF, factor de crecimiento transformante; TNF, factor de necrosis tumoral.

El tipo de célula y la modalidad de tratamiento de la EMT fue anotado y la agrupación revelaron acuerdo con el modo de inducción de la EMT. La agrupación persistió cuando se utilizaron genes compartidos entre al menos 14 GES conjuntos de datos para el análisis. (A) La agrupación jerárquica de los 365 genes compartidos entre al menos 10 conjuntos de datos. (B) La agrupación jerárquica de 41 genes compartidos entre al menos 14 conjuntos de datos. La leyenda indica el tipo de célula y la modalidad de tratamiento (panel derecho). *, vectores factor de transcripción: Runx2, Six1, Caracol, Twist and goosecoid. GSE Gene Expression Omnibus (GEO) récord de la serie; E.TABM: ArrayExpress (AE) récord de la serie; TGF, factor de crecimiento transformante; TNF, factor de necrosis tumoral.

Generación de la EMT-core lista de genes

Con base en el análisis de conglomerados del GES, que tuvo como objetivo definir una lista de genes significativa EMT-núcleo que describe la mayoría de los genes implicados a través de los GES analizados. El análisis de agrupamiento de los genes compartidos entre al menos 10 conjuntos de datos contenía 365 genes (Tabla S2). Sin embargo, no muestra si un gen es hasta downregulated-o a través de diferentes GES. Por lo tanto, la lista se filtró para mantener sólo los genes que eran ya sea hacia arriba o downregulated en al menos 10 de los conjuntos de datos GES. La lista resultante contenía 130 genes, 67 de subida y 63 están regulados a la baja (Tabla 2 y la Tabla S3). Esta selección de genes podría ser clasificado en cinco categorías ((i) la adhesión celular y la migración, (ii) el desarrollo, la diferenciación y la proliferación celular, (iii) la angiogénesis y la curación de heridas, (iv) metabolismo, (v) otros o no clasificados) según el análisis de enriquecimiento individual como se describe a continuación. Varios genes estaban también presentes en más de una de esas categorías (Tabla S3). En conclusión, esta lista de genes TEM-núcleo resultante contiene 130 genes que se derivan de una multitud de tipos de células y métodos de iniciación de la EMT.

consistentemente enriquecida KEGG vía IR y análisis de expresión del gen de la EMT-core lista de amigos
a fin de analizar la lista de EMT-núcleo que consta de 130 genes, se llevó a cabo un riguroso análisis de enriquecimiento único combinado con estrictos criterios de selección. En primer lugar, una vía KEGG enriquecido o GO plazo tuvo que contener al menos 5 genes de la lista de entrada y un valor de p inferior a 0,05 se consideren significativos. Una enumeración de los términos y las vías enriquecido significativamente se muestra en la Tabla 3. En segundo lugar, una vía KEGG enriquecido significativamente o GO plazo tenía que ser observado en al menos 4 de cada 5 herramientas bioinformáticas utilizados. En tercer lugar, una vía KEGG enriquecido constantemente o GO plazo tuvo que ser identificados tanto en la lista de genes TEM-núcleo y la lista de 365 genes. Utilizando estos criterios, se obtuvieron 6 KEGG vías, 20 ir procesos biológicos y moleculares 15 ir funciones enriquecidas constantemente en ambas listas (Tabla 4). Los KEGG vías consistían en la vía, guía de axones, la adhesión focal, la interacción de los receptores de ECM, la regulación del citoesqueleto de actina y las vías de señalización MAPK en el cáncer. Los procesos biológicos GO podrían agruparse en procesos implicados en el desarrollo de tejidos, cicatrización de heridas, la migración celular o la proliferación celular. Las funciones moleculares GO consistieron de ECM y componentes del citoesqueleto, inhibidores de peptidasa y la unión de colágeno, factores de crecimiento, la heparina y la integrina. Como era de esperar, la lista con los 365 genes que comprenden todas las vías enriquecido significativamente e ir términos de la lista de 130 genes TEM-núcleo a excepción de 2 GO procesos biológicos (ECM organización y desarrollo de los pulmones). Varios más vías KEGG, GO procesos biológicos y moleculares funciones podrían ser identificados en la lista con 365 genes (Tabla 3 y 4). Todas estas vías, procesos biológicos y funciones moleculares son bien conocidos por estar involucrados en EMT [5], [14] - [16], y por lo tanto confirmar la integridad de nuestra lista de genes EMT-núcleo. Además, tanto la lista de EMT-núcleo y la lista con los 365 genes que muestran proporciones comparables de enriquecimiento de GO KEGG vías y procesos biológicos (Figura 3), así como las funciones moleculares GO (Figura S2). Por lo tanto, la lista que contiene 365 genes se puede considerar como una mejora de la lista de EMT-núcleo por contener genes adicionales que podrían tener un papel ambiguo en EMT. En resumen, nuestra lista de EMT-core de 130 genes y su mejoramiento que contiene 365 genes que muestran un fuerte enriquecimiento de los procesos de EMT-relevantes.

La relación de enriquecimiento es el número de genes observados dividido por el número de genes que se espera para una determinado plazo o vía. relaciones de enriquecimiento se obtuvieron de WebGestalt o calculados con datos de FatiGO. GO, ontología de genes; BP, proceso biológico; KEGG, la enciclopedia de Kyoto de genes y genomas.

Relevancia clínica de la EMT-core lista de genes

La lista de genes TEM-núcleo contiene varios genes con todavía papeles no identificados en la progresión del cáncer y /o EMT. El objetivo fue investigar la relevancia clínica de esta selección de genes. Por lo tanto, se correlacionó su expresión con la supervivencia global de los pacientes que sufren de carcinomas de pulmón de células escamosas (SCC) [17] y la respuesta patológica completa (PCR) de pacientes con cáncer de mama [18]. A partir de los genes downregulated de la lista de genes EMT-core, baja expresión FXYD3 mostró una tendencia a la mala supervivencia global de los pacientes con SCC (p = 0,17) y baja expresión de LAD1 (p = 0,00074), SLC7A5 (p = 0,0093) y SLPI ( p = 0,043) correlacionó significativamente con una peor por pCR de los pacientes con cáncer de mama. A partir de los genes regulados positivamente de la lista de genes EMT-core, la expresión de alto PTX3 tiende a la mala supervivencia global de los pacientes con SCC (p = 0,16) y una alta expresión de NID2 (p = 0,0091), SPOCK1 (p = 0,038) y SULF1 (p = 0,00029) correlacionaron significativamente con una alteración de pCR de los pacientes con cáncer de mama. Estas correlaciones demuestran que la comparación de diferentes conjuntos de datos es una herramienta poderosa para identificar nuevos genes diana relevantes que no se desprenden de los estudios individuales.

Discusión

Durante la última década, un número considerable de GES que se ocupan de la EMT han ido acumulando en la literatura. Estos cubren una variedad de tipos de células que muestran EMT e incluyen diferentes modos de inducción de la EMT. Hasta ahora, estos recursos sólo se han utilizado en parte para comparar los resultados individuales con los de la literatura [8], [19], [20]. Por lo que sabemos, se ha hecho ningún intento de investigar la mayoría de los GES independientes de la EMT por sus relaciones entre sí. Aunque somos conscientes de que los datos de expresión génica de la EMT no están completos, se analizó la GES disponibles en la actualidad para generar una lista de EMT-básico de los genes alterados con mayor frecuencia durante el proceso de EMT, como se muestra en el diagrama de flujo (Figura S3).

el análisis de agrupamiento de genes compartidos entre al menos 10 GES conjuntos de datos reveló grupos de GES con el mismo tipo o un tratamiento similar. El GES en el que EMT fue inducida por TNF-α, ya sea solo o en combinación con TGF-β, por el TGF-β solo o por los diferentes factores de transcripción agrupados constantemente juntos. Estas agrupaciones persistieron cuando se utilizaron los genes compartidos entre al menos 14 conjuntos de datos para el análisis de conglomerados. Una clara agrupación de los diferentes tipos de inducción de la EMT, sin embargo, sólo habría sido posible si existe un número suficiente de GES en cada uno de estos métodos de iniciación de la EMT. Desde varias modalidades de tratamiento solamente se representan una vez en la literatura, tales clúster GES a su tipo de tratamiento más relacionada.

Un grupo predominantemente surgió de GES de EMT inducida por TGF-β, que consistía en 13 conjuntos de datos. Curiosamente, el grupo incluye la expresión exógena de Six1 (Micalizzi
et al
; GSE23655; [20]) que se ha demostrado para mejorar la señalización de TGF-β promotor de tumores, y Runx2 (Baniwal
et al
; GSE24261; [21]) que actúa aguas abajo de TGF-β de señalización [22] - [25]. Por lo tanto, esto apoya la agrupación de estos estudios, junto con otras personas que utilizan el TGF-β como iniciador de la EMT. El estudio de van Zijl
et al
(GSE26391; [26]). Describió el análisis de células de carcinoma epitelial y mesenquimal hepatocelulares derivados del mismo paciente tumor. La agrupación de este estudio, junto con otros estudios con EMT inducida por TGF-β sugiere una implicación de la señalización de TGF-β durante el establecimiento de la línea de células mesenquimales.

El grupo de GES con TNF-α como EMT inductor que figura el estudio por Takahashi
et al.
el que se analizó la línea celular ARPE19 tratadas con TNF-α por sí sola (GSE15205_TNFa), TNF-a, junto con el TGF-β (GSE12548) o TGF-β sola (GSE15205_TGFb) con el fin de inducir la EMT [12]. Los dos conjuntos de datos con tratamiento con TNF-α forman un grupo coherente. Sin embargo, el tercer conjunto de datos que se obtuvo a partir del tratamiento exclusivo con TGF-β agrupado a otros GES describen iniciación EMT por el TGF-β. . Por lo tanto, estos datos sugieren un impacto más fuerte del estímulo EMT en la agrupación más que el tipo de célula

Un grupo consistía principalmente de los conjuntos de datos de Taube
y col gratis (GSE24202;. [13 ]) informó que la inducción de la EMT en las células HMLE utilizando la sobreexpresión de Twist, Caracol, goosecoid y TGF-β, así como la caída de la e-cadherina. En consonancia con los datos reportados por Taube
et al
, los conjuntos de datos de Snail- y EMT inducida por la torcedura eran los más similares dentro de este grupo. Este hallazgo es concordante con el hecho de que Twist es un objetivo directo de Snail [27]. El elevado número de conjuntos de datos en este estudio podría conducir a una representación excesiva en el análisis de conglomerados. Por otra parte, el uso de la misma línea celular, así como factores de transcripción con objetivos similares, como Twist and caracol podría dar lugar a un alto grado de similitud dentro de los conjuntos de datos de este estudio en particular.

El grupo que consta de Ke
y col gratis (e-TABM-949; [28]). que utilizó el cultivo de alta densidad celular de las células EPT2 y Ohashi
y col gratis (GSE27424; [29]). que describe un NOTCH3 knock-down en células EPC2 muestra un bajo nivel de relación con otros grupos debido a los tipos singulares de la inducción de EMT. Parece probable que, por un lado estas GES forman un grupo debido a la falta de relación con los demás grupos. Por otro lado, también podría sugerir una relación de sus tipos de iniciación EMT también.

Hemos encontrado una variedad de marcadores conocidos de EMT regulados positivamente en nuestra lista de genes EMT-core como CDH2, CDH11 , COL1A1, COL3A1, FBLN5, FN1, HAS2, LOX, la MMP-2, PLAT, SERPINE1, VIM, WNT5A y ZEB1 [15], [30], [31]. genes Además, hemos detectado Downregulated reportados a reducirse en la EMT como ANK3, CDH1, CXADR, PRSS8 y SYK [15], [32] - [34], varios marcadores de células epiteliales downregulated como EPCAM, JUP, KRT15, ​​KRT17, OCLN, PKP2 y PPL, [5], [15] y una serie de supresores de tumores tales como downregulated KLK10, MTUS1, OAS1 y SERPINB1 [35] - [38]. En conjunto, estos genes proporcionan una verificación sólida de nuestra lista de genes TEM-núcleo. Además de esos genes que confirman la integridad de nuestra lista de genes, sin embargo, los genes con funciones desconocidas, así como una relación desconocida o poco claro para el cáncer y /o EMT surgieron los cuales son nuevos candidatos para una mayor investigación. genes regulados positivamente incluyen la MAP 1B, NID2, PTX3, SPOCK1, SULF1, TAGLN y TMEM158 mientras que los genes regulados a la baja comprendidas ABLIM1, LAD1, FAM169A, FXYD3, SLC7A5, SLPI, TMEM30B y TPD52L1.

Dos meta-análisis de la EMT en mama se han reportado cáncer teniendo en cuenta las diferentes líneas celulares o tipos de inducción de la EMT. Estos han identificado genes listas EMT-core con 200 y 251 genes [13], [39], sin embargo, la coincidencia con sólo aproximadamente el 10%. Nuestra lista de EMT-núcleo que contiene 130 genes que muestran un pobre solapamiento del 7% con la lista de Choi
et al.
[39], sino una superposición del 55% con Taube
et al.
[ ,,,0],13]. Tanto las listas de Choi
et al.
Y Taube
et al.
Contiene identificadores (IDs) no asignados como identificadores de array, etiquetas de secuencias expresadas y los ID locus. Se utilizó la vía de análisis consistentemente enriquecido para investigar más a fondo estas listas de genes. En particular, nuestra lista de EMT-núcleo está representada KEGG vías más enriquecidos y GO términos de las listas de genes de Choi
et al. Opiniones y Taube
et al.
(Tabla 3 y 4). Al reducir la rigurosidad del análisis de dos genes dentro de una categoría enriquecido, el enriquecimiento de la lista de Choi
et al.
No mejoraron mientras que casi todas las vías KEGG y GO términos enriquecidas en nuestra lista de EMT núcleos podría ser observado en la lista de Taube
et al.
(datos no mostrados, Tabla 4).

la lista de EMT-núcleo contiene varios genes con funciones y relaciones con el cáncer y /o EMT desconocidos. Hemos sido capaces de demostrar que FXYD3 y PTX3 expresión se asocia con una pobre supervivencia de los pacientes en general en pacientes de SCC y LAD1, SLC7A5, SLPI, NID2, SPOCK1 y SULF1 correlacionaron significativamente con una alteración de PCR en pacientes con cáncer de mama. FXYD3 se ha demostrado estar involucrados en la proliferación de células tumorales y ser downregulated por el TGF-β de señalización [40], [41]. PTX3 se ha informado de que un biomarcador de cáncer de pulmón [42]. NID2 ha demostrado ser elevados durante forbol 12-miristato-13 inducida por la invasión-acetato de varias líneas de células tumorales humanas y como un potencial marcador biológico del tumor [43], [44]. SPOCK1 se ha informado a participar en la unión neuronal y la activación de metaloproteinasas de matriz [45], [46]. SULF1 se ha demostrado que es un biomarcador potencial para el cáncer gástrico que puede ser inducida por el TGF-β1 [47], [48]. LAD1 es un adaptador de proteínas que participan en ERK5 y las vías de JNK [49]. SLPI ha informado de actuar anti-tumorigénico de ciertos tumores, así como para promover la migración y la invasión en otros [50] - [52]. Por lo tanto, estos genes parecen ser candidatos prometedores para una investigación adicional. Tomados en conjunto, proponemos que la lista de EMT-core de 130 genes es altamente relevante para la EMT y el análisis de agrupamiento representa un panorama útil sobre las relaciones de los disponibles en la actualidad GES de la EMT.

Materiales y Métodos

recogida y anotación de datos

microarrays de datos procesados ​​fueron descargados de los sitios web de GEO (disponible: http://www.ncbi.nlm.nih.gov/geo/) y AE (disponible: http: //www.ebi.ac.uk/arrayexpress/) mediante el uso de "EMT" como palabra clave para GES publicados hasta febrero de 2012. Los GES descargados fueron anotados para recuperar los símbolos oficiales de genes, EntrezID y nombres de genes usando BioConductor 2.9 (disponible: http: //www.bioconductor.org/; visitada: 2012 de enero 02) [53] y la herramienta en línea NetAffx (disponible: http://www.affymetrix.com/analysis/index.affx; visitada: 2012 25 de junio). BioConductor se utilizó en el entorno R [54]. los datos anotados se importó a MS-Excel 2010 y log2 transformado. Posteriormente, doblar los cambios y los valores de p utilizando
t-test
se calcularon de Student bilateral. Significativamente se seleccionaron genes arriba y downregulated y separadas una de otra cuando se muestra un cambio veces mayor que 2 o por debajo de 0,5 y un valor de p por debajo de 0,05. upregulated genes fueron ordenados de mayor a menor factor de cambio. A la inversa, los genes regulados negativamente estaban dispuestas de menor a mayor cambio veces. Los duplicados fueron retirados después. los símbolos de genes se han utilizado para su posterior análisis y serán referido a los genes.

El análisis de conglomerados

Los genes regulados negativamente hacia arriba y de cada estudio se resumieron, ordenados y se eliminaron los duplicados para obtener una lista de todos los genes se informó de forma única en todos los estudios. upregulated genes fueron marcadas con 1 y los genes regulados negativamente se marcaron con -1. Los genes que no fueron desregulados significativamente dentro de un GES y los genes que resultaron ser a la vez hacia arriba y downregulated dentro de un estudio fueron etiquetados con 0. La distribución del número observado de los genes regulados negativamente hacia arriba y se puso a prueba en contra de una distribución binomial con parámetro p = 11,78% por medio de una prueba de chi-cuadrado. Se calcularon las posibilidades de dibujo cada opción de corte para el análisis de conglomerados (& gt; 1, & gt; 2, & gt; 3, y así sucesivamente) por casualidad con la función de distribución binomial proporcionado por R (probabilidad = 11,78%). Las posibilidades para dibujar cada opción de corte por casualidad se compararon con los análisis de clúster preliminar de cada opción de corte con el fin de determinar un punto de corte adecuado. La agrupación se realizó en BioConductor 2.9 incrustado en I 2.14.1 (64 bits) con el gdata paquetes [55], gplots [56] y heatmap.plus [57] mediante la agrupación jerárquica mapa de calor con la función de la distancia de Manhattan.

consistentemente enriquecimiento de KEGG vías e ir términos

Las listas de genes fueron analizados utilizando cinco herramientas bioinformáticas de enriquecimiento diferentes. Una visión global de los instrumentos utilizados y sus características se muestra en la Tabla S4. Las herramientas FatiGO y GENECODIS se utilizaron en la plataforma Babelomics 4 [58], que proporciona acceso a los dos programas a la vez. Los criterios de selección de las vías enriquecido significativamente eran un p-valor o FDR por debajo de 0,05 y un mínimo de 5 genes de la lista de entrada dentro de una categoría enriquecido. Por otra parte, los términos de GO enriquecido constantemente y KEGG vías fueron identificados en al menos 4 de los 5 programas tanto en la lista de genes TEM-núcleo y la lista de 365 genes. relaciones de enriquecimiento (número de genes observados dividido por el número de genes que se espera para un GO KEGG o categoría) se han obtenido por WebGestalt, o, alternativamente, se han calculado como se describe por Zhang
et al. Vaya con los datos de FatiGO [59].

Correlación de la lista de EMT-core con los datos clínicos

microarrays y datos clínicos para los pacientes con carcinomas de pulmón de células escamosas (n = 130) reportados por Raponi
et al.
[17] con la adhesión GDS2373 fueron descargados de GEO. . microarrays de datos y clínicos para los pacientes con cáncer de mama (n = 133) reportados por Hess
et al
[18] fueron descargados de la página web de MD Anderson Cancer Center (disponible: http://bioinformatics.mdanderson.org/pubdata.html; visitada 2012 Sep 07). Los pacientes se dividieron en grupos que expresan altos y bajos para los genes seleccionados dentro de la lista de EMT-núcleo. Los valores de p se calcularon utilizando de Student bilateral
t-test
. El análisis de supervivencia para los datos de Raponi
et al.
se realizó con la prueba de chi-cuadrado de la igualdad mediante el paquete de supervivencia en R [60]. Los valores de p inferiores a 0,05 se consideraron significativos.

Apoyo a la Información
Figura S1. El análisis de conglomerados Red de genes compartidos entre por lo menos 14 GES conjuntos de datos muestra las agrupaciones persistentes e inconfundibles.
doi: 10.1371 /journal.pone.0051136.s001 gratis (PDF)
figura S2. Francia El 130 genes lista de EMT-núcleo y los 365 genes lista de pruebas de enriquecimiento proporciones comparables de funciones moleculares GO.
doi: 10.1371 /journal.pone.0051136.s002 gratis (PDF)
Figura S3.
Diagrama de flujo que representa la generación de la lista de genes TEM-núcleo.
doi: 10.1371 /journal.pone.0051136.s003 gratis (PDF) sobre Table S1.
matriz que contiene los genes regulados negativamente de manera significativa hacia arriba y a través de los conjuntos de datos analizados GES
doi:. 10.1371 /journal.pone.0051136.s004 gratis (XLS)
Tabla S2. List de 365 genes regulados significativamente en al menos 10 conjuntos de datos GES
doi:. 10.1371 /journal.pone.0051136.s005 gratis (DOC) sobre Table S3.
EMT núcleos lista de genes de 130 genes regulados negativamente por incremento o compartida entre al menos 10 conjuntos de datos GES
doi:. 10.1371 /journal.pone.0051136.s006 gratis (DOC) sobre Table S4.
herramientas de enriquecimiento utilizados en este estudio y sus propiedades
doi: 10.1371. /journal.pone.0051136.s007 gratis (DOC)

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]