Extracto
Los estudios recientes han demostrado la contribución de miRNAs a la patogénesis del cáncer. El cáncer de próstata es el cáncer más comúnmente diagnosticado en los hombres. A diferencia de otros tipos principales de cáncer, no solo gen ha sido identificado como mutado en la mayoría de los tumores de próstata. Esto implica que el perfil de expresión de genes, incluyendo los miRNAs no codificantes, puede variar sustancialmente a través de casos individuales de este tipo de cáncer. La variabilidad dentro de la clase hace posible la reconstrucción o inferir específica de la enfermedad de correlación miARN-mRNA y redes modulares de regulación utilizando microarrays de datos de alta dimensión de muestras de tumores de próstata. Además, dado que los miRNAs y genes supresores de tumores son generalmente tejido específico, módulos miARN-mRNA podrían potencialmente difieren entre el cáncer de próstata primario (PPC) y el cáncer de próstata metastásico (MPC). En esta revisión se realizó un
in silico
análisis para explorar los módulos de red correlación miARN-mRNA en los dos subtipos de tumores. Nuestro análisis identificó 5 pares de módulos miARN-mRNA (MP) para PPC y MPC, respectivamente. Cada MP incluye un módulo de conexión positiva (correlación) y un módulo de conexión negativa (correlación). El número de miRNAs o ARNm (genes) en cada módulo varía de 2 a 8 o de 6 a 622. Los módulos descubiertos para PPC son más informativos que los de MPC en términos de los conocimientos biológicos implicados. En particular, un módulo de conexión negativa en el PPC encaja bien con la teoría de la regulación post-transcripcional de los genes miARN mediada popularmente reconocido. Es decir, las secuencias 3'UTR de los ARNm implicados (~620) se enriquecen con los motivos del sitio de destino de los 7 miRNAs modulares, tiene-miR-106b, -191, -19b, -92a, -92b, -93, y -141. Sobre 330 GO términos y KEGG vías, incluyendo la vía de señalización de TGF-beta que mantiene la homeostasis del tejido y desempeña un papel crucial en la supresión de la proliferación de células cancerosas, están excesivamente representados (adj.p & lt; 0,05) en la lista de genes modular. Estos módulos computacionalmente identificados proporcionan evidencia biológica notable por la interferencia de miRNAs en el desarrollo de los cánceres de próstata y garantiza un seguimiento adicional en estudios de laboratorio independientes
Visto:. Zhang W, A Edwards, Ventilador W, Flemington EK, Zhang K (2012) Correlación de la red Módulos miARN-mRNA en el cáncer de próstata humano y las diferencias entre los subtipos de tumores primarios y metastásicos. PLoS ONE 7 (6): e40130. doi: 10.1371 /journal.pone.0040130
Editor: Lorenzo Chiariotti, Università di Napoli Federico II, Italia |
Recibido: 19 Marzo, 2012; Aceptado: 1 de junio de 2012; Publicado: 29 Junio 2012
Derechos de Autor © 2012 Zhang et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Informó de Investigación en esta publicación fue apoyada por los Institutos nacionales de Salud subvenciones (NIGMS P20GM103424, CNRR-RCMI 5G12RR026260-03), un premio Louisiana BOR (LEQSF (2008-11) -RD-a-32), una subvención del Departamento de Ejército (W911NF -12-1-0066) y una subvención de la NSF (EPS-1006891). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:. Aunque el Dr. Wei Fan está afiliada con IBM T. J. Watson Research, esto no altera la adhesión de los autores a todas las políticas de PLoS ONE en los datos y materiales de uso compartido.
Introducción
Los microARN (miRNA) son cortos (~
22nt
), no codificante ARN derivados de precursores de tallo bucle genoma codificado. A medida que los reguladores cruciales post-transcripcional de la expresión de genes en metazoos, miRNAs se unen principalmente a las secuencias UTR 3 'del ARN mensajero (ARNm), por lo general resulta en la represión de traducción o degradación de ARNm [1], [2]. Se estima que ~ 30% de los genes codificantes de proteínas humanas están regulados por miRNAs, donde cada miARN puede dirigirse a aproximadamente 200 transcripciones y más de un miARN puede converger en un único ARNm objetivo [2], [3]. Numerosos estudios han demostrado que se expresa de manera aberrante miARN
s
pueden contribuir a las enfermedades humanas, incluyendo el cáncer [4], [5], [6], [7], [8], [9]. Sin embargo, estos pequeños RNAs no podía ser el "cáncer-drivers" [10] en la mayoría de los casos de cáncer debido a las evidencias de sus mutaciones en células Sematic son todavía relativamente poco frecuentes [11], [12]. Esto indica que miRNAs sí mismos puede ser regulada por otras moléculas tales como factores de transcripción [13] y, a su vez, en cooperación juegan un papel en la progresión de la enfermedad mediante la amplificación o reducir el impacto de las aberraciones que se producen en los proto-oncogenes y genes supresores de tumores. Se ha reconocido que la interferencia de miRNAs con la tumorigénesis es bastante complicado y necesita ser examinado por los enfoques de la biología de sistemas basados en la red.
Hasta la fecha, una serie de algoritmos han sido desarrollados para inferir módulos miARN-mRNA o redes modulares utilizando la información de todo el genoma de la transcripción y la secuencia de afinidad [14], [15], [16], [17]. A pesar de los diversos diseños de algoritmos computacionales y complejidades, los esquemas de flujo de estos métodos son bastante explícitas y las definiciones de un módulo de miARN-mRNA llevan características similares. Un módulo fundamental consiste generalmente en un conjunto de genes que codifican proteínas co-expresada y un miARN que se correlaciona significativamente con estos genes en el nivel de expresión, o es un predictor superior (entre otros reguladores) para los árboles de clasificación ARNm de establecimiento de determinados por el de las muestras biológicas /"condiciones" [18], [19], [20]. Tal tipo de uno-a-muchos de módulo puede ser refinado en un módulo de regulación miARN-mRNA canónica, donde las expresiones de miRNAs y mRNAs están en relación inversa, y existen los motivos de secuencias complementarias de semillas los miRNAs 'en la 3'UTRs de los genes diana (ARNm). Dos o varios módulos de uno a muchos más se pueden combinar en un módulo de muchos a muchos mediante la identificación de sus intersecciones [16].
El cáncer de próstata es el cáncer más comúnmente diagnosticado y la segunda líder causa de mortalidad por cáncer en los hombres estadounidenses. Cada año, más de 200.000 nuevos casos son diagnosticados y más de 30.000 varones adultos mueren a causa de esta enfermedad [21]. desenlace fatal a menudo se produce cuando la infiltración local del tumor se ha diseminado más allá de la glándula de la próstata y metástasis a los ganglios linfáticos y otros órganos. A diferencia de otros tipos principales de tipos de cáncer, la etiología genética del cáncer de próstata es bastante complejo y heterogéneo. No sola mutación gen ha sido identificado en la mayoría de los tumores de próstata [12], [22], [23]. Esto implica que el perfil de expresión de genes, incluyendo miRNAs no codificantes, puede variar sustancialmente a través de casos individuales en diferentes etapas o subtipos de cáncer de próstata. La variabilidad dentro de la clase, es decir, la variabilidad debido principalmente a las diferencias intrínsecas en mecanismo genético molecular entre los individuos muestreados de la misma clase, hace que sea posible reconstruir o inferir la enfermedad de las redes de regulación (modulares) correlación específica y el uso de los datos de alta dimensión de microarrays de las muestras de tumor de próstata. En particular, porque miRNAs y genes supresores de tumores son generalmente tejidos específicos [23], [24], los módulos de los genes miARN-mRNA potencialmente difieren entre el cáncer de próstata primario (PPC) y el cáncer de próstata metastásico (MPC). por tanto, nuestro estudio inicia a partir de esta percepción y centrada en el
in silico
identificación y comparación de los módulos de los genes miARN-mRNA en el PPC y MPC. Una amplia base de datos recientemente publicado [12] nos proporcionó la información necesaria para una investigación de este tipo de bioinformática. Los resultados obtenidos proporcionan información biológica notable en la interferencia de miRNAs en el desarrollo de los cánceres de próstata. La Figura 1 resume el esquema de nuestro flujo de estudio, y se describen los detalles de cada paso en las secciones de Resultados y Método.
Antes de la descomposición, los coeficientes de correlación de Pearson se transformaron con el método r-z de Fisher. A1 /B1 /C1: los resultados obtenidos a partir del cáncer de próstata primario muestras (PPC). A2 /B2 /C2: los resultados obtenidos de las muestras de cáncer de próstata metastásico (MPC). A3 /B3 /C3:. Los resultados obtenidos a partir de una estructura de datos aleatorio generado por el intercambio de la matriz PPC
Rojo: el 1% superior correlaciones positivas. Amarillo: el 1% superior correlaciones negativas. Naranja:. Seudo o correlaciones no considerados
Rojo: el 1% superior correlaciones positivas. Amarillo: el 1% superior correlaciones negativas. Naranja:. Seudo o correlaciones no considerados
Resultados y Discusión
Análisis SVD de miARN-mRNA interacción Casilleros
Antes de inferir los módulos de red miARN-mRNA para PPC y MPC, tratamos de obtener una comprensión general de las diferencias entre estas dos matrices de correlación calculados a partir de los niveles de expresión de miRNA /ARNm de las muestras de tumores primarios y metastásicos, respectivamente (véase la sección Método para más detalles). Sin embargo, debido a la enorme cantidad de posibles genes miARN-mRNA relaciones reguladores o co-expresó y la interacción complicada entre ellos, junto con los ruidos introducidos en el proceso de muestreo y medición, la comparación del par de los elementos de matriz correspondientes era demasiado trivial para llegar una conclusion. Hemos eludido este obstáculo mediante el empleo de un método novedoso. Más específicamente, se trataron cada matriz de correlación como un pseudo conjunto de datos con las filas (ARNm) como "observaciones" y las columnas (miRNAs) como "características", y caracterizado por la realización de SVD análisis (descomposición en valores singulares) [25], [ ,,,0],26], [27], [28]. Teniendo en cuenta los valores de los coeficientes de correlación estaban en el rango de [-1, 1], transformamos las entradas de la matriz utilizando el método de Fisher rz antes de la descomposición por lo que los resultados pueden ser explicados por la teoría estadística estándar.
los valores de p ordinarias se ajustaron con el método de BH.
La sub-red se extrajo de módulos
módulo P-5-ne (ps)
. Todas las conexiones a excepción de los relacionados con E2F5 son negativos. Señal + indica que existe al menos un motivo miARN-meta-sitio en la secuencia de la UTR 3 'del ARNm conectado (gen).
. Los genes que tienen conexiones negativas con los miRNAs en la red modular están sombreados de rojo. CDKN1A gen (aunque no en la lista de genes módulo) también se tiñe de rojo debido a las correlaciones negativas significativas (p & lt; 0,001) con hsa-miR-93, -106b y -200C en el nivel de expresión. Los genes E2F5, MYC (CMYC) y CDK4, lo que demuestra un patrón aparente de correlaciones positivas con la transcripción de los miRNAs modulares (Figura 9), están sombreadas de color amarillo.
El número presentado en cada celda es la p -valor de la correlación para el correspondiente miARN y el ARNm (gen).
Este análisis dio lugar a dos conclusiones interesantes. En primer lugar, tanto para matrices de correlación y MPC PPC, el factor latente líder puede explicar más de la mitad de la varianza en los datos (Figura 2-A1, -A2), y las puntuaciones (en el primer vector singular izquierdo) a través de los genes (Figura 2- B1, -B2) muestran una distribución de dos picos claros. En segundo lugar, la matriz de PPC difiere de la matriz de MPC por un segundo factor latente sustancial que explica ~ 20% de la varianza y tiene una puntuación asimétrica (en el segundo vector singular izquierdo) de distribución (figura 2-C1), que se desvía de la simétrica contraparte para MPC (Figura 2-C2). La fuerza de este análisis se pone de relieve por el hecho de que los patrones observados no están presentes en un conjunto de datos aleatorios establecidos como se muestra en la figura 2-A3, -B3 y C3, donde se llevó a cabo el análisis SVD en una matriz generada por revolver las filas y columnas de la matriz de PPC. Mientras que las implicaciones biológicas deben ser investigados posteriormente, estos resultados preliminarmente confirmaron nuestra hipótesis inicial de que la interferencia dinámica de miRNAs en estos dos tipos de cáncer de próstata puede ser diferente y vale la pena una exploración más profunda.
Vale la pena señalar que, en la preparación de la Figura 2, se utilizó la información de 58 miRNAs cáncer recogidos en [7]. Sin embargo, los resultados presentados a cabo en gran medida cuando el análisis SVD se llevó a cabo en la totalidad de los conjuntos de datos (matrices). Además, reconocemos que las diferencias entre el PPC y el MPC puede ser determinada por un conjunto básico de miRNAs. Esta percepción se basa en un análisis adicional que mostró que los patrones demostrados en la figura 2 también se llevan a cabo en las submatrices con sólo los miRNAs supresores de tumores, pero no en las sub-matrices que contienen los miRNAs oncogén exclusivamente. Vamos a seguir investigando este problema en futuras investigaciones.
miARN-mRNA módulos en diferentes subtipos de cáncer de próstata
Dos miARN-mRNA redes (PN y MN) fueron generados por un método basado en la correlación para PPC y MPC, respectivamente. Con el fin de centrar el análisis en los miRNAs relacionados con el cáncer, las dimensiones del PN y MN se redujeron aún más tal como se presenta en la sección Método. Con las redes condensados como entradas, los principales módulos de miARN-mRNA relacionados con el cáncer se identificaron mediante un algoritmo basado en el análisis de agrupamiento. Dentro de un módulo individual, cada miARN o ARNm tiene al menos dos conexiones con los ARNm correspondientes modulares o miRNAs
.
Como se resume en la Tabla 1, Figura 3 y la Figura 4, se identificaron 5 miARN-mRNA pares de módulos (MPs ) para el PPC y MPC, respectivamente. Cada MP incluye un módulo de conexión positiva (correlación) y un módulo de conexión negativa (correlación). El número de miRNAs o ARNm (genes) en cada módulo varía de 2 a 8 o de 6 a 622. La mayoría de los módulos contienen el factor de transcripción de ADN de unión específica de la secuencia (TF) genes [29] que puede tener papeles como los mediadores para las conexiones miARN-mRNA. Los dos miembros (como
p-modu-1-ps
y
p-modu-1-ne Hoteles en PPC) de cada MP contienen los mismos miRNAs pero diferentes ARNm. Dos módulos de parlamentarios distintos (como
p-modu-1-ps
y
p-modu-2-PS Hoteles en PPC) consisten en diferentes miRNAs y variada (o parcialmente solapada) ARNm conjuntos. Dentro de un módulo de conexión negativa o positiva (con "
-ps
" o "
-ne
" extensión en el IDS), las correlaciones de los miRNAs y mRNAs involucradas en los niveles de expresión son consistentemente positivo o negativo. Independientemente del tipo de conexión, el ARNm establecer en cada módulo imita en gran medida un grupo de genes co-expresada. Además de los cuatro módulos de los dos parlamentarios (
p-modu-3-PS gratis (
-ne
) y
-m modu-4-ps gratis (
-ne
)) en la que la mayoría de los miRNAs pertenecen a la familia let-7, los módulos para MPC casi no se superponen con los módulos para la PPC en términos de los miRNAs implicadas (Tabla 1) y genes codificantes de proteínas (Tabla S1). conocimientos avanzados con respecto a las diferencias entre el PPC y el MPC se pueden inferir además por un escrutinio de las implicaciones biológicas de los módulos identificados.
Aquí hay que señalar que los módulos identificados no son necesariamente los módulos de regulación canónicas en el cual todas las conexiones entre miRNAs y genes están determinadas por las relaciones causales regulador diana [30]. De hecho, debido al problema no resuelto en reconocer con precisión los genes miARN sitios objetivo [2], es difícil identificar un módulo de regulación canónica no trivial y exacta. No obstante, podemos esperar encontrar un módulo de regulación menos estrictas, llamado en lo sucesivo módulo de regulación "semi-canónica", en donde la relación potencialmente determinada por el mecanismo de degradación de ARNm mediada por miRNA es predominante entre las conexiones miARN-mRNA. Sobre la base de esta teoría ampliamente aceptada, los módulos de regulación semi-canónicas, si existe, debe ser uno de los módulos de conexión negativo, y luego se puede determinar mediante el análisis objetivo de planta de enriquecimiento. Hicimos esta exploración mediante el establecimiento de la matriz de afinidad secuencia de los genes miARN-mRNA y la realización de la prueba exacta de Fisher (véase la sección Método). Como resultado, se encontró que los
p-modu-5-ne
, un módulo identificado por el PPC, era el único módulo semi-canónica, donde las secuencias 3'UTR de los involucrados 622 ARNm se enriquecieron significativamente (p & lt ; 1.0E-4) con los motivos del sitio de destino de los 7 miRNAs modulares (HSA-miR-106b, -200C, -19b, -92a, -92b, -93 y -141) (Figura 5). Este módulo, por lo tanto, representa la diferencia más significativa entre el PPC y MPC en términos de las correlaciones observadas miARN-mRNA. Se sugiere que la regulación post-transcripcional mediada por los miRNAs cáncer documentados contribuyen directamente a la variabilidad de la expresión de los genes codificantes de proteínas a través de las muestras tumorales para PPC, pero no para MPC.
Las implicaciones de los módulos identificados necesitan que se infiere más a través de las anotaciones funcionales de los genes modulares, ya que existe un gran interés biomédico en la aclaración de las relaciones entre la actividad de miRNAs modulares, como reguladores o biomarcadores, y la variabilidad de los procesos biológicos específicos. Utilizando la base de datos de David [31], se encontró que más de 330 GO términos y KEGG vías, incluyendo la vía de señalización de TGF-beta, se sobre-representado (BH adj.p & lt; 0,05) con los 622 genes del módulo semi-canónica
p-modu-5-ne
. Los genes dentro de otros módulos individuales también demostraron la similitud funcional significativa. Por ejemplo,
m-modu-4-ne
, un módulo de conexión negativa descubierto para MPC, se enriqueció con los genes en el IR: 0007186~G-proteína acoplado a la proteína vía de señalización (BH = adj.p 1.14E-40). Tabla S2 resume los resultados del análisis funcional de enriquecimiento de los genes modulares.
También se examinaron las diferencias entre estos dos subtipos de cáncer de próstata mediante el estudio del perfil distributivo de las vías KEGG sobrerrepresentados en el conjunto de genes modular individual. Como se muestra en la Figura 6, el módulo
p-modu-4-ps
para PPC es único entre los módulos identificados en relación con las funciones de los genes modulares. Alrededor de dos docenas de las vías, como la diabetes mellitus tipo I, están sobrerrepresentados en su lista de genes y la mayoría de ellos están relacionados con proceso de la enfermedad y /o la respuesta inmune. Tres miRNAs (HSA-miR-146a, -150 y -223) están incluidos en este módulo. La participación de miR-146a en la respuesta inmune ha sido ampliamente investigada. [32] mostró que miR-146a es un modulador de la IL-2 y la muerte celular inducida por activación de los linfocitos. [33] informó de que media un circuito inflamatoria en la enfermedad de Alzheimer y destacó células del cerebro humano. Otro estudio [34] también demostró que HSV-1 infección en las células del cerebro humano puede inducir la expresión de miR-146a. Aparentemente, estos resultados no sólo indican que miR-146a tiene un papel funcional en la respuesta inmune como un factor regulador, pero también sugieren que su actividad dinámica (expresión), en algunos contextos específicos, sólo puede servir como el pasajero de la enfermedad y /o procesos inmunológicos [10]. Este es exactamente el mensaje principal transmitido por el módulo
p-modu-4-ps
donde las correlaciones positivas entre los miRNAs modulares y los genes no pudieron ser explicados simplemente por un mecanismo regulador de la diana.
los receptores olfativos (OR) se expresan no sólo en las neuronas sensoriales del epitelio olfativo, sino también en varios otros tejidos en sus funciones potenciales son en gran parte desconocidos. En una publicación reciente, los autores informaron que la activación de un receptor olfativo (PSGR) inhibe la proliferación de células de cáncer de próstata [35]. Los resultados de nuestro análisis muestran que la transducción olfativa (vía) es excesivamente representados en la lista de genes de 4 módulos principales (
m-modu-2-ne
,
m-modu-3-ne
,
m-modu-4-ne
,
-m modu-5-ne
) en MPC (Figura 6). El miRNAs implicadas incluyen hsa-miR-200a /-200b, hsa-miR-15a /26a /29c, hsa-miR-7a /-7E /-7f /-98, y hsa-miR-107 /-26b. A pesar de que el miARN situado en
p-modu-3-PS (-ne)
coincidían en gran medida con el de
m-modu-4-ne
, no hay ningún módulo en el PPC tiene una relación funcional con conducción olfativo. Por lo tanto, se especula que la activación de PSGR y la asociación (directa o indirecta) con miRNAs solamente se limita a MPC.
-quinasa de adhesión focal (FAK) es un mediador importante para la señalización del factor de crecimiento, la proliferación celular , la supervivencia celular y la migración celular. Los modelos de ratón han mostrado que la expresión de FAK se aumenta en tumores humanos [36]. Un estudio reciente demostró que la adhesión focal controla la progresión del cáncer de próstata [37]. En este estudio, se encontró que los miRNAs interfieren en la transducción de la señalización de FAK, por tanto, pueden tener un papel en el desarrollo del cáncer. Como se muestra en la Figura 6, la adhesión focal (junto con 6 KEGG vías relacionadas tales como la interacción de ECM-receptor) es excesivamente representados en las listas de genes de 3 módulos principales identificadas para PPC (
p-modu-1-ps
,
p-modu-2-PS
,
p-modu-5-ne
). Frente a los casos de transducción olfativa para MPC, la asociación de mediante un algoritmo de agrupamiento jerárquico de señalización con miRNAs FAK parece limitarse a PPC. Estos hallazgos indican que hay otra diferencia importante entre los dos subtipos de cáncer. investigación experimental sobre esta cuestión podría ser prometedora para el diagnóstico de cáncer de próstata.
Interferencia Potencial de miRNAs en TGF-beta vía de señalización
El factor de crecimiento transformante beta (
TGF
-
beta
) mantiene la homeostasis del tejido y desempeña un papel crucial en la supresión de la proliferación de las células del cáncer [23], [38]. Como se mencionó anteriormente, la vía de señalización de TGF-beta es excesivamente representados en el conjunto de genes (ARNm) del módulo de regulación semi-canónica,
p-modu-5-ne
. De los 622 genes modulares, una docena de ellos codifican proteínas en la vía. Estos 12 genes demuestran 56-negativos conexiones con los 7 miRNAs modulares, y casi un tercio de las conexiones son compatibles con las posibles relaciones regulador objetivo que determine la información de secuencia de afinidad (Figura 7). Sobre la base de este hallazgo y las teorías que se describen en [23] (páginas 198-224), hemos generado un modelo hipotético (Figura 8) para mostrar la interferencia de los miRNAs modulares con la señalización de TGF-beta y la proliferación de las células cancerosas. En la Figura 8, los genes correlacionados negativamente con los miRNAs en la red modular están resaltados en rojo. CDKN1A gen también está marcado en rojo debido a sus correlaciones negativas significativas (p & lt; 0,001) con hsa-miR-93, -106b y -200C en el nivel de expresión. Los genes E2F5, CMYC (MYC) y CDK4 muestran un patrón aparente de correlaciones positivas con la transcripción de los miRNAs modulares y están resaltados en amarillo. Las relaciones presentadas en la Figura 8 sugieren que los miRNAs modulares interfieren con el proceso de la enfermedad del cáncer de próstata primario por un mecanismo oncogénico en las muestras de PPC medidos. Más específicamente, la expresión de esos miRNAs regula la intensidad inversamente transcripción de dos genes GF-beta, TGFBR1 y TGFBR2, y un gen de supresión de cáncer SMAD3. Entonces, a través de la activación o inactivación de la /Smad4 complejo Smad2-3 /E2F, este efecto se refleja en los niveles de expresión de CDKN1A y CMYC, y finalmente influye en la inhibición de la detención del ciclo celular y la proliferación celular.
Expresión la variabilidad de miRNAs en el módulo
p-modu-5-ne
Como se ha comentado anteriormente, en
p-modu-5-ne
, los miRNAs identificados regula directamente la transcripción intensidades de los ARNm modulares en las muestras de PPC. A este respecto, es importante para elucidar la etiología de la variabilidad biológica (a través de muestras de tumor) de los niveles de expresión de genes miARN que determinan las conexiones miARN-mRNA. En primer lugar, hemos observado que la mayoría de los miRNAs identificados, incluyendo hsa-miR-19b, -92a, -93 y -106b, han informado que los objetivos de los factores de transcripción de la familia E2F [13], [39]. Mientras tanto, también observamos las conexiones positivas entre estos miRNAs y E2F5 en los niveles de expresión (Figuras 8 y 9). Por lo tanto, existía la posibilidad de que la variabilidad biológica de los miRNAs se debió a la regulación por E2F5. Sin embargo, este mecanismo tiene que investigarse más a fondo ya que la imagen real de la regulación y /o mutación del propio gen TF todavía no está claro. A continuación, pregunta si los niveles de expresión de los genes miARN modulares estaban relacionados con la progresión del cáncer de próstata. Para investigar esta cuestión, se agruparon las 98 muestras PPC en los niveles de expresión de los miRNAs 7 modulares mediante un algoritmo de agrupamiento jerárquico y comparamos los resultados con las clases basadas en la puntuación de Gleason. No se encontró asociación entre las dos particiones. Por último, hemos propuesto y puesto a prueba la hipótesis de que la variabilidad biológica de los miRNAs se obtuvo de la regulación de los genes codificantes de proteínas (incluyendo los genes del cáncer) en el que las mutaciones se produjeron esporádicamente en muestras de tumores individuales. La agrupación de análisis, en primer lugar, generamos dos particiones de las 98 muestras de PPC, basados respectivamente en los niveles de expresión de todos los 7 miRNAs módulo y las intensidades de transcripción de 34 posibles genes del cáncer de conducción en las muestras tumorales como se muestra en la figura-1 de [12]. A continuación, mediante una prueba de Chi-cuadrado, encontramos la asociación entre las dos particiones era muy significativa (p & lt; 0,001)., Lo que indica nuestra hipótesis se confirma de esta manera
Materiales y Métodos
Establece datos
los datos de microarrays fue publicado en la Expresión génica Omnibus (GEO, una base de datos compatible con MIAME) repositorio con el número de acceso GSE21032 [12], [40]. Entre las 218 muestras biológicas incluidas en el super-series, 98 tumores primarios, 13 tumores metastásicos y 28 muestras de tejido de próstata normales (N = 139) tienen ambos miARN ARNm y los perfiles de expresión. rigurosos criterios se han aplicado en la selección de los tumores para el análisis genómico [12]. Los perfiles de expresión génica (ARNm) se midieron con Affymetrix Human exón 1,0 ST Array [sonda conjunto (exón) version], y las imágenes se cuantificaron utilizando el software GeneChip operativo (GCOS) versión 1.4. Los datos primarios fueron procesados por el aroma de Affymetrix. Se llevaron a cabo el ajuste de fondo de RMA estándar y cuantil normalización. Las expresiones de los genes miARN se midieron en la plataforma de Agilent-019118 Humano miARN microarrays 2.0 G4470B, y las imágenes se cuantificaron utilizando Agilent extracción de características de la versión 9.5. Los datos se normalizaron con entre-array normalización de estabilización de la varianza (VSN) después de excluir los microARN no está presente en más del 80% de las muestras perfiladas. En este estudio, los datos de ARNm (el archivo descargado Matrix Series) se ha simplificado el procedimiento siguiendo. En primer lugar, hemos adaptado los valores de expresión de genes que originalmente centrados en Affymatrix_Exon_Gene_IDs (Affy_IDs) a los símbolos oficiales de genes mediante el cálculo de la media para un gen con dos o múltiples Affy_IDs. En segundo lugar, los valores de la expresión de genes adaptados se transformaron en escala log2. Por último, se han filtrado los genes que carecen de la variabilidad de expresión a través de las matrices 139. Con un punto de corte de un doble cambio de la intensidad máxima expresión al mínimo una, ~ 5730 genes pasado el filtro. Por lo tanto, los conjuntos de datos finales miARN contiene 5730 genes y 377 miRNAs. Si bien la información de las 28 muestras de tejido normal fue considerada en el pre-procesamiento de datos para diluir el potencial de ruido en los experimentos de microarrays, nos centramos en las muestras de PPC y MPC en el siguiente análisis SVD y la identificación del módulo de miARN-mRNA.
Cálculo de miARN-mRNA matrices de correlación
Se utilizó un método de cálculo intensivo para estimar la correlación entre la expresión de los genes miARN y un ARNm. El cálculo de correlación de Pearson se repitió 1000 veces. En cada ejecución, 80% de las muestras de PPC o MPC seleccionados al azar estaban involucrados. La estimación final se obtuvo un promedio de los resultados sobre los 1000 repeticiones.
Generación de Redes de correlación miARN-mRNA
respectivamente generado dos redes de correlación miARN-mRNA, PN y MN, para el PPC y MPC por discretización de las matrices de correlación de expresión con 5730 genes (ARNm) como filas y 377 miRNAs como columnas. Más específicamente, nos llena de ambas matrices con 1 para el 1% de las correlaciones positivas miARN-mRNA, -1 para el 1% de las correlaciones negativas, y 0 para el resto de las entradas. Por lo tanto, un elemento distinto de cero representa una correlación positiva o negativa para un par de miARN y mRNA. Una correlación definida de tal manera corresponde a una conexión de miARN-mRNA con el valor de p & lt BH ajustado; 0,008 (o & lt; 0,065) para PPC (o MPC)
La identificación de los genes miARN-mRNA Módulos
Tanto las matrices de correlación discretized se condensaron mediante la exclusión de la falta de relaciones miRNAs grabadas con cánceres y los genes de ninguna conexión con los miRNAs relacionados con el cáncer. Es decir, se excluyeron las columnas correspondientes a los miRNAs no incluidos en la lista documentada en [7] fueron retirados en primer lugar, y luego las filas (genes) que no contenían al menos dos entradas distintas de cero. El PN MN condensada y por lo tanto contienen 58 columnas, y 1792 y 1340 filas, respectivamente. Con las matrices de red refinados como entradas, dos mapas de calor se generaron, respectivamente, para el PPC y MPC aplicando la función "
heatmap.2
" en los "gplots" R paquete. La disposición de miRNAs y mRNAs en los mapas de calor se basa en un análisis de agrupamiento jerárquico de dos vías con
Manhattan
distancia y
sala
método que los argumentos. Tomando como ejemplo el PPC (Figura 3), se identificaron los módulos miARN-mRNA a través de los tres pasos siguientes. (1) Basado en el dendrograma y los patrones de conexión miARN-mRNA se muestran en el mapa de calor, cinco subconjuntos modulares de miRNA (clusters) se determinó visualmente. (2) Para cada uno de los subconjuntos de genes miARN, las conexiones positivas o negativas con mRNAs se recogieron en un par de matrices de topología 2-columna, respectivamente. (3) Un par de módulos de miARN-mRNA se identificó a partir de las salidas de la etapa (2) después de dejar caer los ARNm con una sola conexión (positivo o negativo). Las cifras de las redes modulares fueron producidos por Cytoscape 2.8.1 [41].
Sitio de destino Enriquecimiento de prueba
El uso de un programa de I-propiedad de laboratorio con el núcleo es el
matchPattern
() en el Bioconductor
Biostrings
[42], [43], hemos identificado los 7 y 8-mer-mer miARN motivos objetivo sitio en las secuencias 3 'UTR (recuperados de HG-18) de los genes medidos en los microarrays de datos empleadas. A continuación, la matriz de afinidad secuencia de los genes miARN-mRNA binario (A) se generó en una forma tal que un elemento (A
ij) de valor 1 indica la existencia de motivo (s) sitio diana para la j
TH miARN en secuencia de la UTR 3 'del i
º ARNm. Para un miARN, la significación estadística del nivel de enriquecimiento sitio de destino en la lista de los genes correlacionados modulares se midió mediante la prueba exacta de Fisher en referencia al nivel de todo el conjunto de genes.
Apoyo a la Información
Tabla S1. Francia El resumen de los módulos de correlación de red miARN-mRNA.
doi: 10.1371 /journal.pone.0040130.s001 gratis (TXT)
Tabla S2.