Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: miRConnect: Identificación de genes efectores de miRNAs y miARN familias en células de cáncer

PLOS ONE: miRConnect: Identificación de genes efectores de miRNAs y miARN familias en células de cáncer


Extracto

micro (MI) ARN son pequeños ARN no codificantes que regulan negativamente la expresión de la mayoría de los ARNm. Son potentes reguladores de diversas etapas de diferenciación, y se espera que la expresión de genes que, o bien negativa o positivamente correlaciona con miRNAs expresado para contener información sobre el estado biológico de la célula y, por lo tanto, de la función de los miRNAs expresadas. Hemos comparado la gran cantidad de datos de la matriz de genes disponibles en el sistema en estado estacionario de las líneas celulares NCI60 a dos conjuntos de datos diferentes que contienen información sobre la expresión de 583 miRNAs individuales. Además, hemos generado conjuntos de datos personalizados que contienen información de la expresión de 54 genes miARN familias que comparten el mismo partido semilla. Hemos desarrollado una nueva estrategia para la correlación de miRNAs con genes individuales en base a una correlación sumada coeficiente de Pearson (SPCC) que imita un
in silico
experimento de valoración. Al centrarse en los genes que se correlacionan con la expresión de miRNAs sin necesidad de ser blanco directo de miRNAs, hemos agrupado miRNAs en diferentes grupos funcionales. Esto ha dado como resultado la identificación de tres nuevos miRNAs que están vinculados a la transición epitelio-mesenquimal (EMT), además de los reguladores conocidos de la EMT
miR-200
familia miARN. Además, un análisis de firmas de genes asociados con la actividad EMT, c-MYC, y la expresión de gen de la proteína ribosomal nos permitió asignar diferentes actividades de cada uno de los grupos funcionales de miRNAs. Están disponibles todos los datos de correlación a través de una interfaz web que permite a los investigadores a identificar los genes cuya expresión se correlaciona con la expresión de miRNAs individuales o familias enteras miARN. miRConnect.org ayudará en la identificación de vías reguladas por miRNAs sin necesidad de conocimientos específicos de los genes miARN objetivos

Visto:. Hua Y, Duan S, Murmann AE, Larsen N, J Kjems, Lund AH, et al. (2011) miRConnect: Identificación de genes efectores de miRNAs y miARN familias en las células cancerosas. PLoS ONE 6 (10): e26521. doi: 10.1371 /journal.pone.0026521

Editor: Zhang Lin, de la Universidad de Pennsylvania School of Medicine, Estados Unidos de América

Recibido: 16 Septiembre, 2011; Aceptado: September 28, 2011; Publicado: 26 Octubre 2011

Derechos de Autor © 2011 Hua et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Estos autores no tienen el apoyo o la financiación para reportar

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

Micro (mi) ARN son pequeñas, 19- 22 nucleótidos de longitud, los ARN no codificantes que regulan la expresión de genes en su mayoría por la orientación de la 3'UTR de los ARNm resultantes en la traducción reducida de proteínas o la degradación de los mRNAs. miRNAs son reguladores fundamentales de la diferenciación celular y los procesos de desarrollo. También han sido reconocidos a ser de gran importancia en la formación y progresión del cáncer [1]. Recientemente se demostró que casi todos los genes humanos están bajo el control de miRNAs [2]. Sin embargo, debido a los miRNAs regulan la expresión de cientos de genes diana [3], y muchos genes están dirigidos por múltiples miRNAs [4], la asignación de funciones biológicas a los miRNAs o familias miARN ha sido una tarea difícil.

miRNAs contienen en su extremo 5 'un corto tramo de 6-8 nucleótidos complementarios a la coincidencia de semillas en el ARNm diana. Esta complementariedad es accesible al análisis computacional y múltiples algoritmos se han desarrollado para predecir los genes miARN objetivos [5]. Sin embargo, objetivo predicciones realizadas con estos algoritmos no son lo suficientemente precisos para deducir la función biológica de miRNAs exclusivamente sobre la base de las listas de objetivos previsto. la validación de dianas se realiza generalmente por cualquiera de miRNAs que sobreexpresan o mediante la inhibición de su función, seguido de la medición de los cambios en el mRNA o los niveles de proteína en células transfectadas [2], [6]. Sin embargo, tanto la sobreexpresión y la inhibición de miRNAs tienen advertencias [7] y no está claro si los cambios observados en el nivel de ARNm y proteínas son el resultado de la regulación directa por miRNAs o son el resultado de cambios aguas abajo de los genes blanco-miARN.

recientemente, hemos utilizado las células NCI60 [8], un panel de 60 líneas celulares de cáncer mantenidas en el NCI, para identificar y validar las conexiones entre miRNAs y sus objetivos. Unperturbed puntos de datos de matriz en los niveles de expresión de cientos de miRNAs y más de cien mil sondas de genes en múltiples plataformas de gama hacen que las células NCI60 un sistema único para identificar las conexiones pertinentes de cáncer entre miRNAs y genes regulados por miRNAs. Utilizando el sistema de NCI60 hemos validado previamente
HMGA2
y
IMP1
como objetivos de la
let-7
familia de miRNAs [9], [10]. Además, hemos identificado los miembros de la
miR-200
familia y validado dos de unión E-cuadro de factores de transcripción,
ZEB1
y
ZEB2
como objetivos [11]. Más recientemente, se validó la tirosina fosfatasa
FAP1
como un
miR-200
objetivo [12]. Estos ejemplos demuestran la potencia de los datos NCI60 establece para conectar miRNAs con sus objetivos. Sin embargo, la identificación de los genes miARN objetivos individuales y sin un contexto celular o el conocimiento de todos los objetivos para un miARN hace que sea difícil conectar miRNAs con la biología o la patología. Nuestros estudios de
let-7
y
miR-200 en las células
NCI60 también permiten la predicción y la confirmación de la función biológica de estos miRNAs.
Let-7
resultó ser un marcador de las células cancerosas diferenciadas [9], [13], y
miR-200
fue identificado como un potente marcador y regulador del epitelio- -mesenchymal transición (EMT) [11], [14].

la mayoría de nuestros hallazgos se hicieron mediante la comparación de los genes miARN y los niveles de expresión de ARNm, que en ese momento era sorprendente, teniendo en cuenta que los miRNAs en células de mamífero se creía que eran sobre todo actuar por silenciamiento de traslación sin afectar los niveles de expresión de ARNm. Sin embargo, también se ha demostrado que la abundancia de ARNm de la mayoría de los genes diana era un poco afectada por miRNAs [15], [16]. Aunque todavía hay controversia sobre la forma predominante por el cual los miRNAs regulan la expresión de genes [17], un estudio reciente sugiere que, para un número considerable de determinados genes por miRNAs, la desestabilización del ARNm es el principal mecanismo de la represión de proteínas por miRNAs [18] , una observación que hace que los datos NCI60 ARNm /miARN establece una valiosa herramienta para el estudio de los genes miARN función en las células cancerosas.

transfección de células, ya sea con inhibidores de miRNAs o miARN lo general resulta en cambios en la abundancia de un gran número de ARNm. Curiosamente, los ARNm que están reguladas negativamente por miRNAs se encuentran, así como un gran número de mRNAs que se correlacionan positivamente con la expresión de los genes miARN. se han considerado generalmente Estos cambios en los niveles de mRNA que es causada por genes coregulated con miRNAs o ser eventos secundarios. De hecho, es probable que la mayoría de los genes cuya expresión responde a los cambios en la expresión de miRNAs no son objetivos directos de los genes miARN
per se
, pero son efectores biológicos relevantes a la función de los genes miARN. Especialmente cuando se detectó con el sistema en estado estacionario de las células NCI60, estos genes efectores biológicos pueden contener información importante con respecto a la función endógena de miRNAs. Esto fue más evidente para los
miR-200
. Un pequeño cambio en
miR-200
expresión (aproximadamente 2 veces) dio lugar a un cambio moderado en los niveles de mRNA de sus objetivos
ZEB1
y
ZEB2 gratis (alrededor de 5-7 fold), lo que resultó en un cambio masivo en el
E-cadherina
/
la vimentina
proporción (más de 8 órdenes de magnitud) [11]. La enorme correlación positiva entre la expresión de
miR-200
y el
E-cadherina
/
La vimentina
relación nos permitió asignar la función de "regulador epitelial" a la familia miR-200, incluso antes de que habíamos identificado
ZEB1
y
ZEB2
como objetivos. Animados por este análisis, hemos utilizado ahora el sistema NCI60 para identificar correladores secundarias de miRNAs (que pueden ser miles, como en el caso de la EMT [19]) en un análisis de todo el genoma, ya que pueden contener información importante sobre la actividad biológica estado de una célula.

Hemos desarrollado un nuevo método para agrupar familias de miRNAs o miARN según sus correlacionadores biológicos en lugar de sus objetivos previsto o su colocalización cromosómica o su expresión específica de tejido. miRNAs se agruparon en grupos funcionales distintos de acuerdo con la expresión de sus genes efectores biológicos. Hemos validado la actividad de uno de estos grupos, que contiene todos los miembros de la
miR-200
familia, en la regulación de la naturaleza epitelial de las células. Esto dio como resultado la identificación de tres nuevos miRNAs,
miR-7
,
miR-203
y
miR-375
, para funcionar en el mantenimiento del epitelio. Además, se han identificado grupos de cáncer relevante miRNAs que son o bien la promoción del crecimiento o supresora del crecimiento en la naturaleza basado en la correlación de su expresión con la expresión de cualquiera de las proteínas o genes ribosomales
c-MYC
ha regulado. Hemos creado una interfaz basada en la web, miRConnect.org, que proporciona una herramienta robusta y fácil de usar para los investigadores a identificar nuevas conexiones entre miRNAs o los genes miARN familias y grupos de genes que son marcadores de diferentes estados biológicos.

resultados

Generación de correlaciones entre miARN y la expresión génica

con el fin de explorar las actividades biológicas de los genes miARN que estableció por primera vez las correlaciones entre la expresión de miRNAs y genes. Hicimos uso de varios conjuntos de datos disponibles para las células NCI60 (líneas celulares) 59: 1) el perfil de expresión de 208 miRNAs humanos cuantificados por PCR en tiempo real (la "Q" conjunto de datos) [20]; 2) cuatro conjuntos de datos de perfiles de expresión de genes humanos (Stanford, GENELOGIC_U95, GENELOGIC_U133 y Novartis) disponibles en el servidor NCI Developmental Therapeutics Program (DTP). En el conjunto de datos Q, 136 miRNAs se definieron como se expresa en niveles detectables (según la evaluación de PCR en tiempo real) en al menos 30 de 59 líneas celulares (Tabla S1). Las células NCI60 representan 9 tipos diferentes de cáncer. El punto de corte de 30 líneas celulares fue elegido para incluir por lo menos la mitad de las líneas celulares, y para asegurar que por lo menos cuatro diferentes orígenes tisulares fueron representados. Una ventaja del sistema de NCI60 es la capacidad de combinar los genes miARN expresión endógena individuo de una manera representada mediante la correlación de la expresión de genes con la expresión de una familia entera miRNA (es decir, los 9 let-7 actividades representadas en el conjunto de datos Q). Las 136 miRNAs contenían los miembros de 24 familias de semillas (miRNAs que comparten la misma secuencia de semillas con más de un miembro de la familia, el cuadro S2). Además, debido a su función de superposición predicho, se generó una familia de encargo adicional de todos los miembros de la familia miR-200; miR-200 se divide en dos familias diferentes de semillas, miR-141 /200a y miR-200 AC /429, que se distingue por una sola diferencia de nucleótidos en el centro de la secuencia de semillas [11], [14].

La más común y la estrategia para explorar las asociaciones de genes miARN-bien definidos es el Coeficiente de Correlación de Pearson (PCC) [21], [22]. Mientras que el PCC es una herramienta poderosa para detectar correlaciones, tiene limitaciones. Por ejemplo, PCC da la misma importancia a cada muestra a medir (por ejemplo, una línea celular, un tejido específico o una muestra de paciente). No diferencia entre las muestras con alta expresión y aquellos con baja expresión. Esto puede conducir a una distorsión del análisis de correlación, debido a que: 1) el nivel de expresión de miRNAs contiene información importante sobre normativas; y 2) es más probable que existan en muestras que contienen genes de baja expresión de ruido. Por lo tanto, pensamos en una manera de superar algunas de estas limitaciones. Una solución sería asignar diferentes pesos a niveles altos y bajos de expresión. Sin embargo, debido a que el cálculo de PCC no es un proceso lineal, no es práctico añadir pesos directamente a cada muestra. En lugar de ello, se encontró que la ponderación en el nivel de la selección de la muestra a ser más práctico desde CCP de diferentes conjuntos de datos de la línea de células se podrían añadir y el modelado correspondiente serían de nuevo lineal. Sobre la base de esta consideración, hemos desarrollado un nuevo método, el "resumió PCC" (SPCC). Un estándar de PCC (directo) (DPCC), el SPCC y un SPCC aleatorio (rsPCC) se aplicaron para generar correlaciones entre la expresión de miRNAs y genes, para probar la reproducibilidad de las correlaciones y explorar la biología particular de cómo miRNAs trabajo.

(d) PCC

En este método se realizó un análisis directo estándar COMPARAR [23], que produce PCC, para identificar los ARNm que se correlacionaron con la expresión de cada uno de los 136 miRNAs. En este y en todos los posteriores análisis COMPARAR establecimos 30 como el número mínimo de líneas celulares detectables. Para normalizar la variación de detección entre sondas incluidos respectivamente en los cuatro plataformas de gama de genes, los CCP se promediaron para cada gen. Este método dio un valor PCC para cada mRNA que significativamente correlacionada con la expresión de un miARN.

sumada (s) PCC

En este método (ilustrado en la Figura S1) se modificó el proceso de cálculo de miARN-mRNA correlación mediante la suma de una serie de valores de PCC que imitan una "valoración" de miRNA mediante la clasificación de líneas celulares de acuerdo con su expresión de miRNAs. Para cada par de miARN-mRNA, hemos ordenado miARN expresión en 59 líneas celulares de mayor a menor, y se seleccionaron las 30 líneas celulares superiores como la condición inicial, debido a que estas 30 líneas celulares representaron la mitad superior de todas las líneas celulares y se incluyen células de al menos 4 orígenes diferentes de tejidos. Se realizó un análisis COMPARE para estas líneas celulares (30 modelo 30). A continuación, la línea celular con rango N ° 31 estaba incluido y se repitió el análisis COMPARE para estas líneas celulares (31 modelo 31). Se realizaron análisis repetidos COMPARAR hasta que todas las líneas de células 59 se incluyeron de manera incremental, y un total de 30 valores de PCC se generaron (patrón de 30 a 59 patrón). No hicimos uso de una ventana deslizante de un tamaño fijo (del 1 al 30, de 2 a 31, ..., 30 a 59), ya que siempre quisimos incluir las líneas celulares con la más alta expresión de los genes miARN esperando tener el mayor efecto en el blanco /genes efectoras en estas líneas celulares. Este método aditivo asigna pesos de una manera gradiente (o titulación) en base a los niveles de expresión de los genes miARN. Las 30 líneas de células con la expresión más alta siempre se incluyeron en cada COMPARAR cálculo y mayores pesos asignados, ya que esperábamos los mayores efectos sobre los genes diana /efectoras de estas líneas celulares. Las sumas de PCC se promediaron para cada gen entre las plataformas de gama de cuatro genes.

aleatorios sumadas (RS) PCC

Con el fin de probar la estabilidad y la reproducibilidad del método de SPCC, que diseñó un estudio aleatorizado de de SPCC como un control interno. La única diferencia entre este método y el método de SPCC fue que las líneas celulares fueron ordenados de manera aleatoria. Para cada par de miARN-mRNA, la clasificación aleatorio se repitió 10 veces y se promediaron los 10 rsPCCs.

El método SPCC detecta con precisión ambos genes efectores aguas abajo y predijo que correlacionan con los objetivos de miRNAs

Es conocen a partir de múltiples estudios que a pesar de la alteración de los niveles de expresión de los genes miARN en células de cáncer provoca tanto hacia arriba como hacia abajo regulación de los genes, los miRNAs trabajan predominantemente a través de la regulación negativa de genes efectores aguas abajo [15], [16]. Con el fin de probar esta observación con nuestros métodos, se calcularon los valores de la relación de log2 todos negativos vs. todas las correlaciones positivas para 136 miRNAs, respectivamente, con los tres métodos (DPCC, SPCC y rsPCC). Una comparación de la distribución de 136 valores de la relación demostró que las correlaciones negativas superaron significativamente los positivos en el análisis SPCC pero no en los otros dos análisis (Figura 1A). La relación de log2 con el método SPCC cambió de manera significativa a la derecha en comparación con el método de DPCC. Un mayor número de miRNAs en el método SPCC tenía negativos genes que correlacionan, que fue anulada por el ruido aleatorio en el método DPCC (el valor de la mediana fue de aproximadamente cero). La curva acumulativa de rsPCC fue similar a la de la DPCC, pero fue significativamente diferente de la de SPCC. Esto demuestra que el método de SPCC fue más eficaz en la detección de correlaciones negativas que sea la DPCC o el método rsPCC.

(A) parcela acumulado de log2 ratio del número de genes que correlacionan negativamente frente positivamente para 136 miRNAs calculado con el métodos DPCC, SPCC y rsPCC, respectivamente. El eje X indica los valores de la relación de log2 136 miRNAs en función de su clasificación de menor a mayor, y el eje Y representa la fracción acumulada de 136 miRNAs. Las diferencias en las curvas acumulativas fueron medidos por una cara: Prueba de Kolmogorov-Smirnov. (B) La comparación de los tres métodos para identificar el TargetScan más probable conservado predijo objetivos en el genoma humano (un total de 33.535 predijo eventos de orientación). objetivo predicciones fueron clasificados según la puntuación total contexto de mayor a menor. De forma incremental desde la parte superior 50 de la tapa 500 pares de genes miARN con las más altas puntuaciones totales de contexto, los valores de la relación de los números negativos vs. correlación positivos se calcularon y se representaron para los tres métodos.

A continuación se buscó comparar la eficiencia de los tres métodos en la detección de objetivos previsto. Elegimos TargetScan, un algoritmo de predicción objetivo ampliamente utilizado, para armar una lista de todos los pares de genes miARN-humanos que involucran a los 136 miRNAs. La lista fue ordenadas según la puntuación total de contexto (definido por TargetScan para los objetivos conservadas) de mayor a menor (Tabla S3). A continuación, de forma incremental desde la parte superior 50 de la tapa 500 pares de genes miARN, las proporciones de los números negativos vs. correlación positivos se calcularon y se representaron. Sólo con el método SPCC, esta relación aumenta junto con el aumento de la puntuación total contexto (Figura 1B). Por lo tanto, los resultados para todas las correlaciones y las correlaciones con respecto a los objetivos previstos tanto sugieren que el método SPCC un desempeño significativamente mejor en el plano teórico que sea la DPCC o el método rsPCC.

El método SPCC detecta con precisión la expresión de miRNAs que están relacionados con los genes huéspedes individuales, así como a grupos de
HOX genes


Además del nivel teórico, era necesario poner a prueba la capacidad del método para identificar los genes miARN SPCC /gen conexiones que se han establecido en los sistemas biológicos conocidos. Por lo tanto, hemos hecho uso de ambos genes del huésped y homeobox (
HOX
) genes que tienen enlaces bien caracterizados a la expresión de determinados miRNAs.

Muchas miRNAs están codificados en los genes que comparten el edificio (genes del huésped ) y compartir los promotores con ellos. La expresión de estos miRNAs es impulsada por los promotores de sus genes del huésped, y las correlaciones positivas entre la expresión de miRNAs y sus genes del huésped se ha informado [22], [24]. Mediante la utilización de esta información, se analizaron la frecuencia con la co-transcripción de miRNAs y sus genes del huésped podría dar lugar a correlaciones positivas en los conjuntos de datos NCI60. De los 136 miRNAs, 65 están codificados en los genes del huésped (Figura 2). Tanto en el SPCC y DPCC analiza el número de correlaciones positivas entre los genes del huésped y sus miRNAs co-localizados lejos con números de las correlaciones negativas (Figura 2A y 2B). En contraste, el análisis con el método rsPCC resultó en una distribución aleatoria de las correlaciones positivas y negativas (datos no mostrados). Los resultados de los métodos SPCC /DPCC eran comparables, lo que sugiere que la reproducibilidad de los conjuntos de datos NCI60 fue alta y el método SPCC para identificar correlaciones era tan bueno como el método DPCC en el caso de genes del huésped individuales.

(
Un
) y SPCC (
B)
valores dPCCs se dan para los 73 pares de genes miARN /anfitrionas representadas en los datos establecidos Q y conjuntos de datos de expresión génica que se produjeron con al menos una de las métodos. El nuevo análisis de los datos mediante la comparación de SPCC /30 con los valores DPCC con un corte de 0,2 reveló que los dos métodos no difieren en su capacidad para predecir los genes del hospedador (ya sea mediante la prueba t pareada o prueba de Wilcoxon pareada).


a continuación, hemos querido determinar si el método de SPCC tendrá un mejor rendimiento que el método de identificación específica DPCC en co-transcripción. Nos aprovechamos de la
HOX
genes como un sistema único de cuatro grupos de genes, cada uno contiene al menos un intergénica de los genes miARN.
HOX
genes regulan el desarrollo embrionario y en los mamíferos que se agrupan en 4 grupos (

HOXA-D) incluyendo 9 a 11 genes [22], [24]. La mayoría de los genes HOX se correlacionaron positivamente con miRNAs co-localizados (cajas de color rojo en la figura 3A). Curiosamente, el
HOXA
,
HoxC
, y
HOXD
cúmulos albergan un gen miRNA cada uno y el
HoxB
contiene dos (Figura 3A). En primer lugar, calculamos dPCCs y sPCCs entre los cuatro miRNAs (
miR-10a
,
-10b
,
-196a
,
-196b
), que están codificados dentro de los grupos Hox, y todos los genes humanos. Hemos observado que en el método de SPCC, en 3 de
4 Red de los racimos un gen HOX adyacente a la miRNAs co-localizada tenía la más alta correlación positiva con estos miRNAs de ~18,000 genes humanos (
MIR -196b
/
Hoxa9
,
miR-196a
/
HOXC10
y
miR-10b
/
HOXD8
; cajas de color rojo en negrita en la figura 3A). Sin embargo, en el método DPCC, esto sólo era cierto para los dos grupos (
miR-196b
/
HOXA10
y
miR-196a
/
HOXC10
) (datos no mostrados). Para cada uno de los 136 miRNAs, se calcularon los valores de SPCC con genes en el 4
HOX
grupos de genes. Los sPCCs de todos los
se añadieron HOX
genes dentro de un grupo y los miRNAs se clasifican de acuerdo a la SPCC acumulativa para cada
HOX
cluster (Figura S2). Sorprendentemente, para cada grupo había un miARN que más claramente correlacionada con la expresión de los
HOX
genes en ese grupo (columna roja en la Figura S2), y en cada caso fue el miARN codificado dentro de ese clúster. Para comparar aún más el rendimiento de los métodos SPCC y DPCC que trazan los acumulativos SPCC y DPCC puntuaciones para cada
HOX
grupo de genes en comparación con los miRNAs que correlacionan (Figura 3B y 3C). El SPCC acumulativo y DPCC de la correlación negativa
HOX
genes también se han mostrado pero fueron insignificantes. También se incluyeron
miR-99a /99b
y
miR-100
en este análisis debido a que comparten una amplia similitud con
miR-10a
y
miR-10b
[25]. Una vez más, la SPCC obtenido mejores resultados que el método de detección de la correcta DPCC
HOX
grupo de genes para cada miARN correlacionar contra una señal de fondo mínima de otros grupos.

(
Un
) Estructura de los cuatro
HOX
grupos de genes de mamífero con la ubicación de los miRNAs alojados.
se detectaron genes HOX
en caja en rojo como una correlación positiva con el miARN acogido por el método de SPCC. Para cada grupo
HOX
gen más fuertemente correlacionada con el miARN que se encuentra en ese grupo se encajona en negrita roja. (
B Opiniones) sPCCs de todo individuo
HOX
genes en cada grupo fueron acumulados y se representó frente a los miembros del
miR-10
/
miR-196
familia y
miR-99a
,
-99b
y
-100
. (
C
) Igual que
B Opiniones pero generaron utilizando el método DPCC.

En resumen, estos datos demuestran que el sistema en estado estacionario del ARNm y NCI60 miARN datos es útil en la detección de conexiones biológicamente significativas entre miRNAs y sus genes del huésped. El método SPCC, que fue diseñado para imitar un experimento de valoración miRNA, era superior al método DPCC en dos ensayos (correlación negativa con mRNAs expresados ​​y
HOX
correlación grupo de genes) que se utiliza para la caracterización de nuestro enfoque. El método de SPCC fue, por lo tanto, utilizar en los análisis posteriores.

miRConnect.org, una interfaz web de búsqueda para explorar las conexiones entre miRNAs y sus genes efectores biológicos

Como introducido anteriormente, además de genes diana reales, los genes que no se prevé que sea miARN objetivos, así como el gran número de los dos genes que correlacionan positivamente y negativamente pueden contener información importante con respecto a la condición de miARN niveles de expresión celular, lo que puede dar una idea de las actividades biológicas de miRNAs. Todos los que correlacionan negativamente y positivamente los genes de los 136 miRNA y las 25 familias miARN determinados tanto con el DPCC y el método de SPCC en el conjunto de datos Q, así como la información sobre cuántos de ellos son objetivos predijo por TargetScan 5.0, se pueden encontrar bajo miRConnect-Q en una interfaz web de búsqueda: miRConnect.org (o miRConnect.net)

la agrupación de los miRNAs basado en la superposición de sus genes que correlacionan

Nuestros datos sugieren que el uso de los conjuntos de datos NCI60 y el método de SPCC podría ser útil para detectar conexiones biológicamente relevantes entre miRNAs y sus genes efectores aguas abajo, lo que podría proporcionar nuevos conocimientos sobre las actividades biológicas de miRNAs. Hemos sostenido que los genes, ya sea negativa o positivamente correlacionadas con un miARN específicos serán igualmente importante, ya que cada conjunto puede contener marcadores de un estado biológico regulado en direcciones opuestas. Por ejemplo,
E-cadherina
y
La vimentina
, que se correlaciona positiva y negativamente con la expresión de la
miR-200
familia, respectivamente (
CDH1
y
VIM
en la Tabla 1), tanto en el punto de función relacionada EMT-de
miR-200
. Por lo tanto, sugerimos que las correlaciones negativas o positivas pueden definir independientemente un estado biológico específico de un miARN o un grupo de miRNAs.

Con el fin de probar esta hipótesis, se seleccionó la parte superior y la parte superior 2000 positivo 2000 correlaciones negativas y los genes correspondientes para cada uno de 136 miRNAs, y realizaron un agrupamiento jerárquico para agrupar los 136 miRNAs. Elegimos 2000 como un punto de corte porque este número cubrió aproximadamente el 10% de todos los genes, lo que debería dar lugar a la eliminación de la mayor parte del ruido de fondo. La agrupación, que se basa en las comparaciones por pares representa la intersección de los genes que se correlacionan significativamente en su expresión con la expresión de dos miRNAs diferentes (Figura 4 y la Figura S3). Cuando se evaluaron correlacionan positivamente genes, un número de miRNAs cercanos entre sí (Figura 4). Del mismo modo muchas de las mismas miRNAs agrupados juntos cuando se utilizaron correlacionan negativamente genes (Figura S3). Aunque numerosos mecanismos pueden ser responsables de esta agrupación, nos referiremos a ellas como "grupos funcionales".

Los miRNAs se dividieron en 13 grupos funcionales (I-XIII). Se da información para cada miARN en la expresión específica de tejido, co-localización genómica, y la familia de la semilla. en línea de puntos:. umbral del 12,5% de los grupos que se eligió a los 13 grupos definidos

Curiosamente, los 5 miembros de la
miR-200
familia estaban estrechamente agrupadas, en consonancia con su actividad biológica similar (grupo I en la Figura 4 y VI clúster en la figura S3). Además de
miR-200
, un número de otros miRNAs estructuralmente relacionadas formaron grupos funcionales de acuerdo a los números comunes de sus genes efectores. Varias familias de semillas, tales como
miR-181abc
,
miR-19ab
,
miR-221/222
,
miR-103/107 y

miR-135ab
, se agruparon juntas firmemente. Por el contrario, los miembros de otras familias de semillas se encuentran dispersos a través de diferentes grupos funcionales (por ejemplo, el
let-7
o el
miR-30
familia). Este fenómeno sugiere que la agrupación de miRNAs se basa en parte en, pero no se limita a las secuencias de genes miARN semillas.

La agrupación de miRNAs en este análisis se debió en parte al hecho de que algunos miembros de la familia son parte de la misma transcripcional unidad. miRNAs que la cuota de co-localización cromosómica y también se encuentra en los mismos grupos funcionales incluidas las unidades de transcripción de
miR-106b /93/25
,
miR-17~92
,
MIR -194-2/192
,
miR-183~182
,
miR-99b /let-7e /125a
,
miR-206 /133b
.

en algunos casos, los genes miARN agrupación se basa en el partido ni semillas ni la localización genómica. Por ejemplo, los miembros tanto de la
miR-141 /200a
y
miR-200 AC /429
familias de semillas fueron agrupados juntos a pesar de que comprenden dos grupos de genes en los cromosomas separados (grupo I, " grupo de genes "la columna en la Figura 4).

Las líneas celulares NCI60 representan 9 cánceres humanos diferentes. Para determinar si la agrupación de miRNAs observado fue en parte debido a la expresión específica de tejido de cualquiera de miRNAs o ARNm, hemos identificado miRNAs que se expresa preferentemente en cualquiera de los 9 tipos de cáncer humano (Tabla S4, el cuadro S5). Se encontraron algunas correlaciones con tejido de origen. Por ejemplo, ambos grupos I (incluyendo
miR-200
familia y
miR-194
) y XI (incluyendo el
miR-30
familia) contenía la mayor parte de los miRNAs que se enriquecen en células de cáncer de colon (Figura 4). células de cáncer de colon pueden tener una más epitelial-como característica que la mayoría de otras líneas celulares de cáncer.

En resumen, estos datos sugieren que mientras que las secuencias de semillas común, cromosómica co-localización, y expresión específica de tejido probable afectaron a la co- expresión de miRNAs con ciertos genes y por lo tanto su agrupación, muchos miRNAs se agruparon por otras razones. Un factor importante que determina la agrupación podría ser la función biológica de los genes miARN, ya que la agrupación se basa en la intersección de conjuntos de genes que se correlacionan positivamente de manera significativa con dos miRNAs pareadas. Por ejemplo,
miR-200
,
-203
,
-375
y
-7
, que se agrupan en la Figura 4 y la Figura S3 , no tienen la misma secuencia de semillas, colocalización genómica o de expresión específica en el tejido mismo. La razón para que se agrupan parece ser que comparten la función biológica similar en la regulación de la EMT.

La identificación de los genes miARN familias que participan en la regulación del crecimiento celular


c-MYC
no sólo es un regulador general de los genes miARN función y expresión, sino también en sí, regulados por miRNAs [26], [27]. Para determinar si miRNAs de agrupación de acuerdo con la identidad de correlación de genes capaz de detectar la conexión entre miRNAs y
c-MYC
, hemos utilizado las listas de genes que están regulados al alza o bien (460 genes) o downregulated (211 genes) por
c-MYC gratis (obtenido a partir de http://www.myc-cancer-gene.org/) y se determina cuántos de ellos fueron ya sea positiva o negativamente correlacionada con la expresión de cada uno de los 136 miRNAs. El resultado se visualiza en la Figura 5. La importancia de enriquecimiento de correlación de genes se determinó mediante la realización de una prueba de suma de rangos de Wilcoxon. El nivel de significación se indica mediante cajas con diferentes colores. Es evidente que ciertos grupos de miRNAs fueron positivamente, y otros se correlacionaron negativamente con cualquiera de
c-MYC
ha inducido o
c-MYC
Genes reprimidos.

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]