Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: inferir las redes reguladoras perturbado microARN en Cáncer Usando jerárquica de genes co-expresión Signatures

PLOS ONE: inferir las redes reguladoras perturbado microARN en Cáncer Usando jerárquica de genes co-expresión Signatures


Extracto

Los microARN (miRNA), una clase de pequeños ARNs reguladores endógenos, juegan un papel importante en muchos procesos biológicos y fisiológicos . Las perturbaciones de algunos miRNAs, que generalmente se denominan como onco-microARN (onco-MIR), se asociaron significativamente con múltiples etapas del cáncer. Aunque cientos de miRNAs se han descubierto, las redes reguladoras de genes miARN perturbadas y sus funciones son aún poco conocidos en el cáncer. El análisis de los patrones de expresión de los genes miARN genes diana es una estrategia muy útil para inferir las redes miARN perturbadas. Sin embargo, debido a la complejidad del transcriptoma del cáncer, los métodos actuales a menudo se encuentran con baja sensibilidad y reportan pocos candidatos onco-Mir. Aquí, hemos desarrollado un nuevo método, llamado miRHiC (análisis de enriquecimiento de los genes miARN objetivos en jerárquicos firmas de genes co-expresión), para inferir las redes reguladoras de genes miARN perturbado mediante el uso de las firmas jerárquicas co-expresión en grandes conjuntos de datos de expresión génica del cáncer. El método puede inferir candidatos onco-Mir y sus redes de destino que sólo están vinculados a los sub-grupos de los genes expresados ​​diferencialmente en escamas finas de la jerarquía de la co-expresión. En dos conjuntos de datos reales de cáncer de pulmón y el cáncer hepatocelular, miRHiC descubierto varios conocidos onco-MIR y sus genes diana (tales como el miR-26, miR-29, miR-124, miR-125 y miR-200) y se detectaron muchos nuevos candidatos (como miR-149, que se infiere en ambos tipos de cánceres). El uso de firmas jerárquicas de genes co-expresión, miRHiC puede aumentar en gran medida la sensibilidad para inferir las redes de regulación perturbados miARN en el cáncer. Todos los scripts de Perl de miRHiC y los documentos detallados están disponibles gratuitamente en la web en http://bioinfo.au.tsinghua.edu.cn/member/jgu/miRHiC/

Visto:. Gu J, Z Xuan (2013) Inferencia de los perturbados microARN redes reguladoras en cáncer utilizando jerárquicas Gene Firmas co-expresión. PLoS ONE 8 (11): e81032. doi: 10.1371 /journal.pone.0081032

Editor: Joaquín Dopazo, Centro de Investigación Príncipe Felipe, España |
Recibido: 29 de mayo de 2013; Aceptado: 9 Octubre 2013; Publicado: noviembre 20, 2013

Derechos de Autor © 2013 Gu, Xuan. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este trabajo está apoyado por el Programa Nacional de Investigación básica China [2012CB316503], Fundación Nacional de Ciencias Naturales de China [61005040, 61370035], Instituto Nacional de Salud [U01 ES017166] y el Laboratorio Nacional de Tsinghua para la Fundación de la Cruz-disciplina de Ciencia y Tecnología de la Información. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

Los microARN (miRNA) son una clase de pequeños RNAs ($ ~ $ 22 nt) de regulación, que juegan un papel importante en muchos procesos biológicos y fisiológicos esenciales, tales como el desarrollo embrionario, la progresión del cáncer y la respuesta inmune. Cerca de 1.400 miRNAs se han identificado en humanos y más del 30% de los genes codificantes de proteínas conocidas son potencialmente regulados por miRNAs conservadas evolutivos [1], [2]. Las perturbaciones de algunos miRNAs, generalmente llamados como onco-microARN (onco-MIR, incluyendo tanto los miRNAs supresores de tumores oncogénicos y en este estudio), se ha informado de que se asociaron significativamente con múltiples etapas del cáncer. Pero hasta ahora, sólo unos pocos de los cientos de miRNAs están vinculados a los complejos procesos celulares dis-regulada en el cáncer. Hay una gran necesidad de inferir las redes perturbadas miARN reguladores y sus funciones en el cáncer [3].

Para inferir la red de regulación miARN perturbado, una estrategia popular es analizar miARN enriquecimiento conjunto de genes diana en el gen expresado diferencialmente firmas. Esto incluye muchos métodos desarrollados, como el análisis conjunto de genes por hiper-geométricos de prueba (HG-test o prueba exacta de Fisher); GSEA (conjunto de genes de enriquecimiento de análisis) [4], [5]; FAME (asignación funcional de miRNAs a través de enriquecimiento) [6]; y miRBridge [7], que asume que los enriquecimientos conjunto de genes diana reflejan las perturbaciones de sus puntos fuertes de regulación aguas arriba de los genes miARN. Sin embargo, debido a la complejidad del transcriptoma del cáncer, estos métodos por lo general muestran una baja sensibilidad de inferir candidatos onco-Mir (en este caso, la "sensibilidad" significa sobre todo el número de candidatos onco-miR inferidos debajo de un nivel de significación estadística dada).

el cáncer es un proceso de varias etapas y mezclado, que generalmente incluye muchos sub-procesos organizados jerárquicamente regulados en múltiples escalas [8]. Las regulaciones miARN también muestran la propiedad de multi-escala [9]: unos miRNAs, que ayudan a determinar los tipos de células o estados celulares, reprimir cientos de expresiones de genes objetivo para mantener tipo de célula o estado celular perfiles de expresión específicos, como miR-124 en el cerebro y miR-1, miR-133 en el músculo [10], [11], [12]; Sin embargo, muchos otros miRNAs sólo se pueden regular algunos procesos específicos apuntando a un pequeño grupo de genes estrechamente relacionados. El primer tipo de candidato onco-MIR se puede identificar fácilmente mediante el análisis del enriquecimiento de sus genes diana en el conjunto de los genes expresados ​​diferencialmente, pero estas últimas suelen ignorarse por métodos existentes debido a la insuficiencia de los enriquecimientos de genes diana en el expresados ​​diferencialmente los genes o en las firmas co-expresión utilizando puntos de corte de similitud predefinidos.

en este estudio, se propuso una nueva estrategia para inferir la perturbadas sus redes reguladoras onco-MIR y. Esta estrategia tiene la consideración de la multi-escala y jerárquicamente organizado estructuras reguladoras en los genes expresados ​​diferencialmente utilizando la información genética co-expresión, y precisa las escalas en la jerarquía de genes co-expresión de analizar el conjunto de genes diana de enriquecimiento de miARN. Nuestro método, denominado como miRHiC (análisis de enriquecimiento de los genes miARN objetivos en jerárquicos firmas de genes co-expresión), se puede inferir las redes reguladoras de genes miARN perturbadas en el cáncer mediante el análisis de los enriquecimientos de miARN conjuntos de genes diana en las firmas jerárquicas de genes co-expresión. Estas firmas de genes fueron establecidos por jerárquica agrupación de genes co-expresión, de una forma común para separar las señales mezcladas en los perfiles de expresión de genes en diferentes niveles de correlación. En miRHiC, el conjunto de genes miARN objetivo no está obligado a ser enriquecido en el conjunto de los genes expresados ​​diferencialmente, pero dentro de cualquier firma en la multa escala de la jerarquía de genes co-expresión. Además de la mayor sensibilidad para inferir los candidatos onco-Mir, otra de las ventajas de considerar la información genética co-expresión es reducir los ruidos de inferir los correspondientes genes diana perturbadas: los "dispersos" genes expresados ​​diferencialmente con poca similitud patrón de expresión de otros genes , que son más propensos a ser miARN objetivos "falsas" debido a los ruidos de expresión [13], están excluidos durante el análisis. En dos grandes conjuntos de datos de expresión génica del cáncer, miRHiC identificó con éxito varios muchos nuevos candidatos conocidos onco-MIR y también inferidos.

Materiales y Métodos

genes miARN

miRNAs y sus genes diana (los miRNAs de la misma familia se combinan como un solo artículo) fueron extraídos de la base de datos TargetScan (v6.2) [1], [2]. Un gen se consideró como un objetivo de un miARN, si el gen contiene al menos un sitio de unión a miRNA predicho conservada en su extremo 3 'UTR. Y la puntuación contexto resumida (una puntuación negativa medir miARN-objetivo fuerza la regulación o la confianza, proporcionada por TargetScan) se registró para cada par de miRNA-objetivo. Entonces, nos Discretized las puntuaciones contexto en el
K
niveles: todos los pares de genes miARN objetivo fueron ordenados de acuerdo a su contexto puntuaciones en orden (los pares clasificados en la parte superior tienen la fuerza regulación más bajo) y la disminución de la puntuación de discretizada el par miARN-objetivo con rango
r
se definió como:
s
= 1+
b
[
rK
/
N
]. Significa que las primeras /em>
pares miARN objetivo 1 tienen más baja puntuación de 1, mientras que el último 1 /
K
pares tienen mayor puntuación 1+
b gratis (
K
-1). De acuerdo con la Ref. [6],
K
se fija como 5 y
b
como 3 en este estudio.

Los miARN de control conjuntos de genes diana fueron generados por grafo bipartito permutación aleatoria en base de los pares de los genes miARN-diana con la misma puntuación discretized pero manteniendo los tamaños de todos los conjuntos de genes diana. Este tipo de estrictas permutación procedimiento de control puede generar los conjuntos de genes miARN objetivo que conservan las propiedades estadísticas mucho mejores que la asignación al azar y sin restricción [6].

datos de expresión génica del cáncer

Probamos en miRHiC dos grandes conjuntos de datos de expresión génica del cáncer descargados de la base de datos NCBI GEO: 1) el cáncer de pulmón conjunto de datos (LUC), GSE19804 incluyendo 60 muestras de cáncer y para-cancerosas pareadas; y 2) el cáncer hepatocelular (HCC) de datos, GSE22058 incluyendo 96 muestras de cáncer y para-cancerosas pareadas. Para evitar los ruidos en los genes expresados ​​humilde, sólo mantuvimos los genes cuya expresión los valores de rango en la parte superior de 10.000 en al menos el 30% de las muestras en cada conjunto de datos. A continuación, los genes expresados ​​diferencialmente se identificaron con valor de p & lt; 0,0001 mediante la prueba t (los valores de p fueron múltiples pruebas de corrección ajustado por BH). Se identificaron 3.397 y 5.699 genes expresados ​​diferencialmente para Luc y HCC conjuntos de datos, respectivamente

miRHiC:. Enriquecimiento de análisis de genes miARN objetivos en jerárquica firmas co-expresión
se propuso
miRHiC para inferir la perturbada miARN las redes de regulación en el cáncer mediante la incorporación de la información de la co-expresión organizada jerárquicamente de los genes expresados ​​diferencialmente: en primer lugar, las firmas jerárquicas de genes co-expresión se establecieron mediante la agrupación de los genes expresados ​​diferencialmente sobre la base de las correlaciones de pares de genes co-expresión; entonces el conjunto de genes diana de enriquecimiento de miARN se analizó a través de las firmas jerárquicas co-expresión; y, finalmente, se utilizó una prueba de permutación para estimar la significación estadística de enriquecimiento (Figura 1)

En el primer paso, los genes expresados ​​diferencialmente se agruparon como firmas gen jerárquica co-expresión.; a continuación, se encontró el enriquecimiento más significativo del conjunto de genes los genes miARN objetivo a través de las firmas jerárquicas; y, por último, se utilizó una prueba de permutación para estimar el valor de p empírico del enriquecimiento.

1) Obtener las firmas jerárquicas de genes co-expresión.

En primer lugar, jerárquico de vinculación promedio la agrupación se implementa para agrupar los genes expresados ​​diferencialmente en función de sus pairwise correlaciones co-expresión. Para reducir los ruidos causados ​​por los genes poco correlacionados, la agrupación jerárquica se detiene si la correlación de genes co-expresión es demasiado baja: se utilizó la correlación con la puntuación z 0,52 como punto de corte en este estudio (sobre valor de p 0,3; Z- puntuación de cualquier nivel de correlación dado se calcula utilizando la transformación de Fisher). Este corte muestra algunas influencias sobre los resultados: para el conjunto de datos LUC, cuando el punto de corte de puntuación z cambió de 0,3 a la 0,9 a paso 0.1, la agrupación jerárquica se detuvo casi en el mismo lugar. A continuación, se extrajeron las firmas de genes co-expresión (grupos de genes estable co-expresión) a diferentes escalas de correlación recorriendo la jerarquía de la co-expresión de hoja en la raíz (la correlación está disminuyendo y el tamaño de las firmas está aumentando cuando se atraviesa la jerarquía de hoja de raíz). Los detalles del algoritmo de extracción de firma se dan en el manual del usuario a través de página web miRHiC.

2) Analizar los enriquecimientos conjunto de genes miARN objetivo en las firmas jerárquicas de genes co-expresión.

Para el em
j-ésimo
gen co-expresión de la firma en la jerarquía, podemos encontrar los genes solapados entre la firma (indicados como
S
j
) y el
i Network - º miARN conjunto de genes objetivo (denotado como
T
i
), y luego calcular la puntuación de enriquecimiento prima sumando las puntuaciones TargetScan discretizados (ver los detalles de la discretización puntuación en el apartado anterior) del solapado genes para
i-ésimo
miARN:

El valor de p
p
ij Opiniones de este enriquecimiento se estimó mediante el examen de las puntuaciones de enriquecimiento
ES
ij gratis (
r
) de 10.000 de control al azar conjuntos de genes miARN objetivo con ajuste de tamaño:



Después de conseguir el enriquecimiento en todas las firmas de genes jerárquica co-expresión (
j
= 1, 2, ...), el
P
-score
P
i
para el
i-ésimo
miARN fue calculado como el p-valor del enriquecimiento más significativo:.

el
P
-score se utilizó para medir el enriquecimiento de genes miARN objetivo a través de toda la jerarquía de genes co-expresión

3) Calcular la significación estadística de la
P-score
enriquecimientos basa.

el
P
-score es el mínimo de un conjunto de valores de p, por lo no se distribuye uniformemente a lo largo 0~1 (con prioridad a 0). No se puede utilizar directamente para medir la significación estadística de enriquecimiento. Una vez más, se utilizó el test de permutación para estimar la significación estadística de la P-Resultado: los P-score
P
i
(
r
) de control de 10.000 genes miARN objetivo tamaño de concordancia conjuntos se calcularon de acuerdo a los pasos anteriores; y el valor de p empíricos
p
i
para el P-score
P
I
se calculó como:

El empírica p-valor
p
i
se utilizó para medir la significación estadística de miARN gen diana conjunto de enriquecimiento en la totalidad del gen firmas co-expresión jerárquicos. Para corregir la prueba múltiple, fdrtool se utilizó para calcular el
q
-valores de acuerdo a los valores de p empíricos [14].

Las comparaciones con otros métodos

miRHiC era en comparación con el conjunto de genes de enriquecimiento de análisis (GSEA) y el análisis conjunto de genes mediante la prueba de la hiper-geométricos (HG-test). GSEA es un método ampliamente utilizado para inferir los conjuntos de genes perturbado mediante la adopción de los valores continuos y la información de rango de expresiones de genes diferenciales [5]. Al comparar miRHiC con GSEA, se utilizaron las veces los cambios de expresiones de genes entre el cáncer y las muestras normales en GSEA y el mismo método de permutación conjunto de genes miARN objetivo se utilizó para calcular los valores de p empíricos.

GSEA y HG prueba de uso diferentes modelos computacionales para medir el enriquecimiento conjunto de genes con miRHiC. Para probar directamente la ventaja de utilizar la información genética co-expresión jerárquica, hemos utilizado los genes expresados ​​diferencialmente como la única firma y corrimos miRHiC en él. Para la presentación clara, hemos llamado a este enfoque como (análisis de enriquecimiento de los genes miARN objetivos en los genes expresados ​​diferencialmente) miRDeG.

A excepción de la agrupación jerárquica,
k-means clustering
es otro algoritmo utilizado comúnmente para generar gen firmas co-expresión. El algoritmo puede particionar todos los genes expresados ​​diferencialmente en
k
agrupaciones no superpuestas. A diferencia de la agrupación jerárquica,
k-means
es difícil excluir a los genes poco correlacionados mediante el establecimiento de un umbral. En la comparación, se utilizó
k-means
(
k
se establece en 5 o 10) para obtener los genes co-expresión de firmas. Corremos el mismo procedimiento para analizar los enriquecimientos miARN en las firmas generadas con diferentes
k
. Hemos llamado a este enfoque como miRKM (miRKM5 y miRKM10) en la sección de abajo.

Resultados

La estimación de los valores de p empíricos sin sesgo por miRHiC

Para demostrar que miRHiC no tenía el problema de la sobre-estimar las significancias estadísticas, hemos generado 100 conjuntos de genes diana de referencia de tamaño de concordancia para cada miARN, y se ha calculado la distribución de los valores de p empíricos por sus enriquecimientos en el gen jerárquica firmas co-expresión utilizando miRHiC . Si miRHiC no tiene tendencia para estimar los valores de p empíricos, los valores de p de estos miARN de control conjuntos de genes diana deben ser distribuidos de manera uniforme entre 0~1. Como era de esperar, los resultados mostraron que los valores de p empíricos se distribuyen de manera uniforme (Figura 2). Otro posible sesgo que afecta empírica p-valor es causada por diferentes tamaños de conjuntos de genes miARN objetivo: algunos miRNAs tener más de 1.000 genes diana, mientras que algunos sólo tienen menos de 50 genes diana. Se calculó la correlación de Spearman entre los tamaños y los correspondientes valores de p empíricos de los conjuntos de genes. La correlación es -0,015 (p-valor de esta correlación & gt; 0,05), lo que sugiere que los valores de p empíricos no se ven afectados por los tamaños de los conjuntos de genes. Sobre la base de estos análisis, podemos concluir que miRHiC no tiene tendencia para estimar los valores de p empíricos.

Inferencia de las redes reguladoras de genes miARN perturbadas en el cáncer

miRHiC podemos inferir onco-MIR y sus destinatarios perturbado redes de regulación mediante el análisis de la serie de genes diana de enriquecimiento de miARN en jerárquicos firmas de genes co-expresión en el cáncer. En las dos a gran escala de expresión génica de datos de cáncer de pulmón (LUC) y el cáncer hepatocelular (HCC), miRHiC inferirse 9 y 8 perturbado miRNAs o onco-miRs, respectivamente, con valor de q & lt; 0,1. En virtud de la misma ley de corte q-valor, los tres métodos de comparación, GSEA, HG-test y miRDeG no dedujo ningún candidato. Aunque miRKM inferir algunos candidatos (por LUC conjunto de datos, miRKM5 /10 inferidos 3/4 candidatos, y para el CHC conjunto de datos, miRKM5 /10 inferidos 6/3 candidatos), estos números son aún menos de miRHiC y la mayoría de las inferencias miRKM están cubiertos por miRHiC. Los detalles resultados se proporcionan en la Tabla S1. Entre los 17 inferencias de miRHiC, 9 están apoyados por pruebas funcionales directos en la literatura (LUC: miR-26, miR-29, miR-125, miR-130, miR-145 y miR-200; HCC: miR-21, MIR -124 y miR-125). Estos resultados indican que miRHiC puede mejorar en gran medida la sensibilidad de inferencias onco-miR (Tabla 1). Teniendo en cuenta la heterogeneidad del transcriptoma del cáncer, remuestreo bootstrap se llevó a cabo para comprobar la estabilidad de las inferencias. Para LUC, 6 de los 9 candidatos pueden deducirse varias veces en más de 50% experimentos de remuestreo (miR-125, miR-149, miR-340 y miR-200 se infieren de manera estable en más de 80% experimentos). Para el CHC, 5 de 8 candidatos pueden repetirse inferido (miR-125 y miR-149 se infieren de manera estable en más de 60% experimentos).

Al observar las firmas específicas de la onco inferido -miRs, nos pareció que tienen diferentes niveles de genes co-expresión en las jerarquías (Figura 3). Las funciones asociadas a estas firmas (los términos de GO enriquecidas de las firmas fueron anotados por herramienta web DAVID [15]) están significativamente relacionados con diferentes distintivos de cáncer, incluyendo el ciclo celular, la reducción de la oxidación, respuesta inmune, la reparación del ADN, la adhesión celular y la vasculatura desarrollo (Tabla 2). Estos resultados indican que muchos miRNAs están ligados al cáncer a través de diferentes programas de regulación sub. Por ejemplo, el miR-200 es conocido como un importante regulador de la angiogénesis (un niño término de "desarrollo vascular"). Hay varios genes diana validados experimentales de angiogénesis, incluyendo ZEB1 y KDR [16], [17], [18], existente en el inferido perturbado miR-200 en las redes de regulación LUC conjunto de datos. MiR-200 se puede regular el cambio angiogénico en el cáncer de pulmón a través de estos genes diana. En el cáncer hepatocelular, el miR-21 se predijo para regular "respuesta inmune" por la orientación CD69, STAT3, CCL20 y SMAD7, en el que STAT3 y SMAD7 son moléculas de señalización importantes para la respuesta inmune.

A) es para el cáncer de pulmón y B) para el cáncer hepatocelular. Los nodos círculo representan las firmas de genes co-expresión (ClusterID: Size). Los nodos de diamantes representan los inferidos onco-MIR. Los números en los bordes representan los tamaños de los genes miARN se superponen con las correspondientes firmas de genes co-expresión.

perturbado miR-149 sub-redes compartidas por los dos tipos de cánceres

Los onco-MIR inferidos en múltiples tipos de cáncer pueden desempeñar un papel más importante en la iniciación y el desarrollo del cáncer. Dos miRNAs, miR-125 y miR-149 se infiere por miRHiC en ambos tipos de cánceres. Para el inferido perturbado miR-125 redes de regulación, sólo hay tres objetivos comunes (CDK16, TOMM40 y KIAA1522), lo que sugiere que el miR-125 puede regular diferentes vías en los dos tipos de cánceres. Mientras que para el miR-149, sus redes de regulación perturbados muestran objetivo significativa superposición con una sub-red compartida que incluye 14 objetivos comunes. Y las 14 metas son sistemáticamente sobre-expresa en tejidos de cáncer (Figura 4).

Los cambios veces diario de transformar los medios de los genes diana compartidos también se muestran en la siguiente tabla.

miR-149 es un mamífero conservadas miARN. Algunos estudios muestran que los polimorfismos genéticos miR-149 se asocian con el riesgo de cáncer [19], [20]. Su expresión es epigenética silenciada por ADN hiper-metilación en el cáncer colorrectal [21]. Pero los miR-149 redes reguladoras son aún poco conocidos en el cáncer. Las redes perturbadas inferidos proporcionan información importante de miR-149 regulaciones: la mayor parte de los objetivos de alta confianza (con puntuaciones altas TargetScan) en la sub-red compartida están relacionados con algunos procesos biológicos esenciales, tales como SRPK1 (/factor de empalme ricos en arginina serina quinasa 1) y CCT3 (chaperonina que contiene TCP1, subunidad 3). SRPK1 codifica una proteína quinasa de serina /arginina específico para el SR (dominio de serina /ricos en arginina) la familia de factores de empalme. SRPK1 está regulada positivamente en el cáncer de pulmón y muchos otros tipos de cáncer [22], [23]. CCT3 es una subunidad de una proteína chaperona molecular (chaperonina que contiene el complejo TCP1) ayudar veces actina /tubulina y que puede regular positivamente ciclo celular [24], [25]. También se informa de CCT3 sobre-expresión que estar relacionado con el cáncer de colon [26] y el cáncer de hígado [27]. Por lo tanto, el miR-149 puede funcionar como un supresor del cáncer mediante la orientación de estos oncogenes.

Discusión

El análisis de miARN gen diana conjunto de enriquecimiento en los genes expresados ​​diferencialmente de perfiles de expresión génica a gran escala puede avanzar en gran medida nuestra comprensión de las regulaciones miARN perturbado. Sin embargo, debido a la complejidad del transcriptoma del cáncer, es difícil inferir los reglamentos miARN perturbados por simple análisis objetivo de genes miARN establecer el enriquecimiento en el conjunto de genes expresados ​​diferencialmente. En este estudio, hemos desarrollado miRHiC para inferir las redes reguladoras de genes miARN perturbadas en el cáncer mediante la incorporación de la información de la co-expresión de genes jerárquica dentro del gen diana análisis conjunto de enriquecimiento de miARN. Los resultados mostraron que miRHiC tiene una sensibilidad mucho mayor para las inferencias que los métodos usados ​​comúnmente, tales como HG-test, y GSEA miRDeG (FAME), de los cuales no todos utilizan la información genética co-expresión jerárquica. Más del 50% de los onco-MIR inferidos tienen apoyos extensos de la literatura y los genes co-expresiones firmas se dirigen estos miRNAs están significativamente relacionados con varias características del cáncer. Estudios recientes también muestran que el gen co-expresiones pueden proporcionar información importante para identificar los "reales" los genes diana de miRNAs en el proceso biológico correspondiente [13], [28], lo que sugiere que los genes diana se superponen con los enriquecidos firmas co-expresión son más propensos a los objetivos reales en el cáncer. Aunque miRHiC mejoró la sensibilidad para inferir el objetivo de sus redes perturbadas onco-MIR, y se conocen unas pocas onco-MIR, como miR-126 en el cáncer de pulmón y miR-122 en el carcinoma hepatocelular, se perdieron. Estos casos perdidos sugieren que otros modelos computacionales necesitan ser desarrollados para identificar la onco-MIR cuyas redes de regulación no puede ser explicado por los enriquecimientos gen diana en la expresión génica firmas diferenciales.

Las longitudes de 3'-UTR son fuertemente correlacionado con el número de miRNAs específicos y las puntuaciones de contexto. Las firmas enriquecidos pueden estar sesgados de manera significativa a los que tienen más largas 3'-UTR. Cuando se utiliza la prueba hiper-geometría para analizar los enriquecimientos de conjuntos de genes miARN objetivo, hemos encontrado que las firmas se dirigen los miRNAs inferidos tienen mucho más tiempo promedio de longitudes de 3'-UTR. Sin embargo, como FAME [6], miRHiC utiliza el método bipartito basado en gráficos de permutación, lo que puede reducir en gran medida este sesgo: las longitudes medias de 3'-UTR de los genes en las firmas dirigidas por los onco-MIR son inferidos 1314 nt y 1449 nt para los conjuntos de datos Luc y HCC, respectivamente, no más de estas longitudes de los genes expresados ​​diferencialmente (1424 nt y 1470 nt, respectivamente).

miRHiC proporciona una estrategia general para analizar las regulaciones miARN utilizando firmas jerárquicas . Diferentes métodos de agrupamiento jerárquico se pueden utilizar para obtener las firmas jerárquicas de genes co-expresión. Además del gen co-expresión, las interacciones funcionales y normativos entre los genes (como las interacciones proteína-proteína, los reglamentos de la transcripción y la literatura co-ocurrencias) aún se pueden integrar para establecer las firmas de genes jerárquicos. Vamos a probar continuamente la estrategia miRHiC utilizando diferentes tipos de implementaciones.

Para obtener mejores conjuntos de control de los conjuntos de genes miARN, miRHiC utiliza la permutación basado en el gráfico bipartito. Pero este método de permutación es mucho tiempo. Además, la carga computacional es elevado para el cálculo de los valores de p empíricos de una manera anidada a través de las firmas jerárquicas de genes co-expresión. Tenemos la intención de desarrollar el algoritmo más rápido para reducir los cálculos redundantes para estimar los valores de p en el futuro.

Apoyo a la Información sobre Table S1. Empresas El resultados detallados de miRHiC, GSEA, HG-test, miRDeG y miRKM
doi:. 10.1371 /journal.pone.0081032.s001 gratis (XLSX)

Reconocimientos

agradecemos al Dr. Xiaotu Ma y el profesor Li Yanda a largas deliberaciones. Agradecemos a Rui Fu Chao Él y para el desarrollo y validación de software.

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]