Extracto
Estudios recientes han revelado que un pequeño ARN no codificante, microRNA (miRNA) regula a la baja sus objetivos de mRNA. Este efecto es considerado como un importante papel en diversos procesos biológicos. Muchos estudios se han dedicado a la predicción de las interacciones de los genes miARN objetivo. Estos estudios indican que las interacciones pueden ser sólo funcional en algunos tejidos específicos, que dependen de las características de un miARN. No hay métodos sistemáticos se han establecido en la literatura para investigar la correlación entre las interacciones miARN objetivo y la especificidad de tejido a través de los datos de microarrays. En este estudio, se propone un método para investigar los tejidos de interacción con apoyo miARN objetivo, que se basa en validada experimentalmente interacciones miARN objetivo. Los resultados de especificidad tisular por este método son, de acuerdo con los resultados experimentales en la literatura.
disponibilidad y aplicación
Nuestros resultados del análisis están disponibles en http://tsmti.mbc.nctu.edu . .tw /y http://www.stat.nctu.edu.tw/hwang/tsmti.html
Visto: Hsieh WJ, Lin FM, Huang HD, Wang H (2014) La investigación de microRNA Target Los tejidos de interacción-Apoyado en el cáncer humano basado en los tejidos y Target miARN perfiles de expresión génica. PLoS ONE 9 (4): e95697. doi: 10.1371 /journal.pone.0095697
Editor: Yan Xu, el Instituto Perinatal, Centro de Niños de Cincinnati Medical Hospital y la Universidad de Cincinnati, Estados Unidos de América
Recibido: 15 Noviembre 2013 ; Aceptado: March 28, 2014; Publicado: 22 de abril 2014
Derechos de Autor © 2014 Hsieh et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Los autores le gustaría dar las gracias al Consejo Nacional de Ciencias de la República de China para apoyar financieramente esta investigación bajo el Contrato No. NSC 98-2311-B-009-004-MY3, NSC 99-2627-B-009-003, 101-2311 NSC -B-009-003-MY3, NSC 100-2627-B-009-002, 101 a 2118 NSC-M-009-006-MY2, NSC 101-2811-M-009 a 064 y 102 a 2911 NSC-I -009-101. Este trabajo fue apoyado en parte por el Centro Internacional de UST-UCSD de la excelencia en la ingeniería avanzada Bio-patrocinado por el Programa I-Rice Consejo Nacional de Ciencia de Taiwán bajo el número de concesión: 101-2911 NSC-I-009-101, y Veteranos Hospitales Generales y el Sistema de la Universidad de Taiwán Programa de Investigación (VGHUST) mixta de acuerdo con número de concesión: VGHUST101-G5-1-1 y VGHUST103-G5-1-2. Este trabajo también fue apoyado en parte por el Ministerio de Educación y la ATU Centro Nacional de Ciencias teóricas. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
microARN es un ARN no codificante corta que es de aproximadamente 22 nt, que suprime la expresión de los genes a través de la supresión de la traducción o la degradación del ARNm mediante la unión a las regiones 3 'no traducidas (3'UTR). El descubrimiento de la primera miRNA de Caenorhabditis elegans en 1993 inspiró una gran variedad de estudios miARN [1]. En la actualidad, aproximadamente 21.264 miRNAs se han descubierto en muchas especies.
Para estudiar la regulación entre los miRNAs y genes, genes miARN sitios objetivo son generalmente predecirse mediante herramientas de predicción de genes miARN objetivo. Muchas herramientas de predicción de destino computacionales, tales como Miranda [2], TargetScanS [3] - [5] y RNAhybrid [6], se han desarrollado. Además, también se han aplicado varios métodos estadísticos para construir una red de asociaciones entre los miRNAs y sus ARNm diana [7] - [10]. Por lo general, herramientas de predicción de genes miARN objetivo predicen muchos sitios diana potenciales. Para reducir el número de sitios objetivo de falsos positivos, predijo genes miARN sitios objetivo debe ser confirmado por los experimentos. En general, las interacciones miARN objetivo (MTI) pueden ser confirmados por ensayos de reportero, Western blot, los experimentos de microarrays, pSILAC o QRT-PCR. Por otra parte, muchas bases de datos, tales como miRTarBase [11], TarBase [12], [13 miRecords] y miR2Disease [14], han sido diseñados para almacenar validada experimentalmente MTI. En particular, la (versión 2.1) de base de datos miRTarBase ha recogido aproximadamente 3.500 MTI manualmente comisariada validada experimentalmente, incluyendo 657 miRNAs y 2.297 genes diana entre 17 especies de 985 artículos de investigación [11]. La base de datos TarBase 5.0 ha almacenado aproximadamente 514 MTI que se extrae de 203 documentos [12]. La base de datos miRecord, que incluye 1.529 interacciones experimentales, se compone de miRNAs validada experimentalmente y predijo MTI [13]. La base de datos miR2Disease está dirigido a almacenar validada experimentalmente MTI, que están liberalizados en varias enfermedades humanas [14]. Entre estas bases de datos, miRTarBase ofrece MTI más actualizada que las otras bases de datos.
Es importante destacar que, miRNAs se ha observado que ser específica de tejido en muchos estudios. Por ejemplo, miR-122 sólo puede ser detectada en los tejidos del hígado y es indetectable en todos los otros tejidos [15]; la expresión de miR-122 en el carcinoma hepatocelular es relativamente menor que en la salud del hígado [16]; miR-1 y miR-143 se expresan preferentemente en los tejidos del corazón y de colon, respectivamente [15], [17]; miR-126 es un miARN-endotelial específico que regula la integridad vascular y la angiogénesis [18]; miR-195 y miR-200c se expresan específicamente en los tejidos del pulmón [19]. Además, algunos miRNAs son biomarcadores para la detección de cánceres, como el miR-221, -100, -21 y -125b en cáncer de páncreas [20].
A pesar de que muchos investigadores han indicado que muchos miRNAs tienen específico de tejido la expresión [15] - [20], no hay métodos sistemáticos se han establecido en la literatura para investigar las correlaciones altamente negativas entre un miARN y sus genes diana en un grupo de tejidos específicos a través de los datos de microarrays. El análisis de la correlación de las expresiones entre miRNAs y mRNAs es uno de los métodos que se ha aplicado para aumentar la confianza de los genes miARN sitios objetivo predichos [21] - [28]. En este estudio, hemos desarrollado un método estadístico para determinar los tejidos de interacción con apoyo microARN-diana (MTI tejidos apoyado por) basado en validada experimentalmente interacciones miARN objetivo. Los tejidos que reciben apoyo del MTI de un miARN es un grupo de tejidos que este miARN y sus objetivos se expresan en estos tejidos.
El principal objetivo de este estudio es investigar los tejidos apoyados por el MTI que se basan en validada experimentalmente interacciones miARN objetivo presentes en la base de datos miRTarBase. En http://tsmti.mbc.nctu.edu.tw, se describe brevemente cómo se aplica el método propuesto para identificar los tejidos que reciben apoyo del MTI. Los resultados de los análisis principales y los materiales incluidos en este trabajo se presentan en este sitio web.
Materiales y Métodos
La concepción del procedimiento propuesto se muestra brevemente en la Figura 1. Utilizamos conjuntos de datos [29 ] para ilustrar nuestros métodos. Este conjunto de datos incluye los perfiles de expresión de miRNAs y los perfiles de expresión de ARNm para 89 muestras de 11 órganos de tumor o tejidos normales. Las muestras de 11 órganos se resumen en la Tabla 1, incluyendo 68 los tejidos tumorales y 21 tejidos normales. Los perfiles de expresión de ARNm que fueron publicados en 2005 constan de dos plataformas de microarrays, GPL80 y GPL98, que representan 16.063 genes a través de 89 tejidos [29]. Debido a que los niveles de expresión de ARNm parciales faltan, solamente 12.766 de estos genes se utilizan en nuestros estudios. Los perfiles de expresión de los genes miARN (GSE2564) se componen de los datos de expresión de miRNAs 288 249 a través de los tejidos [29]. Después de la eliminación de datos duplicados y redundantes, sólo utilizamos los datos para 163 miARN a través de 89 tejidos. Con los datos de un miARN, tenemos la intención de investigar los tejidos apoyados por el MTI para determinar si el miARN es funcional a través de estos tejidos basados en validada experimentalmente MTI. Como se mencionó en la introducción, la base de datos miRTarBase es más informativo que otras bases de datos. Aplicamos la versión 2.1 de base de datos miRTarBase [11] para obtener experimentalmente validado MTI, que se puede acceder en "http://mirtarbase.mbc.nctu.edu.tw/cache/download /2.1/miRTarBase_MTI.xls". De acuerdo con los miRNAs que fueron registrados en GSE2564, seleccionamos 743 validada experimentalmente MTI y analizamos las correlaciones entre miARN y ARNm de perfiles de expresión a través de diferentes conjuntos de tejido.
validada experimentalmente MTI compartir los mismos genes miARN fueron seleccionados de la base de datos miRTarBase . Las correlaciones de MTI a través de una combinación de tejidos, los cuales fueron seleccionados por nuestro método, son fuertemente negativa.
Antes de analizar los datos de expresión, primero normalizar los datos de expresión de genes miARN y ARNm a través de 89 tejidos. El método de pre-procesamiento de datos se proporciona en los datos suplementarios. Algunos de los datos resultados de pre-procesamiento se presentan en las figuras S1 y S2 S1 en Archivo. Después de la pre-procesamiento de datos, los 23 principales miRNAs con un número de destino que es mayor o igual a 10 y con una serie de tejidos con niveles de expresión que eran mayores que 7,25 se seleccionan y se enumeran en la Tabla 2. El nivel de expresión de 7,25 es el punto de corte que se utilizó en Huang
et al.
(2007) [7]. En la Tabla 2, cuatro miRNAs, hsa-miR-122, hsa-miR-124, hsa-miR-155 y HSA-miR-133a, se ignoran porque no hay suficientes muestras para estos miRNAs que podrían ser utilizados para el análisis. Por lo tanto, analizamos 19 miRNAs en este estudio.
Antes de introducir el método, en primer lugar describir la motivación para proponer el método. Estudios anteriores han demostrado que los miRNAs regulan por disminución de sus objetivos [16], [30], lo que resulta en una correlación negativa de las expresiones microarrays entre un miARN y sus interacciones diana. Sin embargo, la Figura S1 en File S1 revela que los valores absolutos de la mayoría de las correlaciones de la miRNAs y sus interacciones de destino a través de los 89 tejidos no son significativamente grande. Nosotros, por lo tanto, concluimos que la baja regulación de un miARN se produce en algunos tejidos.
Para un miARN, encontramos en primer lugar las interacciones asociadas a través del conjunto de datos de microarrays y la base de datos miRTarBase y luego calculamos las correlaciones entre los miRNAs y sus objetivos. Por lo tanto, un miARN se asocia con un conjunto de correlación, que incluye las correlaciones entre este miARN y sus objetivos. Debido a que hay más de una interacción con la diana que está asociada con un miARN, nuestro objetivo es integrar varios coeficientes de correlación entre este miARN y sus objetivos para encontrar tejidos apoyados por el MTI. Por lo tanto, para determinar los tejidos apoyados por el MTI de este miARN, se propone utilizar un criterio que se basa en los dos factores en la correlación establece: (i) el coeficiente de correlación promedio y (ii) la proporción de los coeficientes de correlación negativos. Debido a la baja regulación de los genes miARN a su interacción con la diana, para un conjunto de verdaderos tejidos apoyados por el MTI de un miARN, esperamos que la expresión de datos entre este miARN y sus interacciones diana serían altamente correlacionados negativamente. Por lo tanto, esperamos que los verdaderos tejidos apoyados por el MTI deben satisfacer la hipótesis de que los coeficientes de correlación promedio son fuertemente negativa y que la proporción de los coeficientes de correlación negativos es grande.
Para describir el método propuesto, primero introducimos algunos notaciones. Denotamos los 89 tejidos como los 19 y los miRNAs como. El valor de la expresión de un miARN y un ARNm a través de los 89 tejidos se denota como y. Dejado denotar la interacción con la diana número (ARNm) que corresponde a este miARN de la base de datos miRTarBase.
Dejar,, ser un conjunto de tejidos de los 89 tejidos, donde es el tamaño del conjunto de la muestra A. El coeficiente de correlación del miARN
m
y el ARNm
y
a través de un conjunto de muestras
un
se define aswhere y significan los medios de y
y
través de los tejidos en el conjunto, respectivamente.
Dejado denotar los coeficientes de correlación de este miARN y sus interacciones a través de los tejidos diana en conjunto, y dejar que denotan el promedio de estos coeficientes de correlación en el conjunto del tejido. Además, dejar que sea el número de valor negativo de los coeficientes de correlación. A continuación, se define el coeficiente de correlación proporción negativa.
En el miARN, el objetivo de este estudio es encontrar un tejido fijado de tal manera que es muy negativa. Además, debido a que hay coeficientes de correlación para este ARNm, debemos exigir que la proporción de los coeficientes de correlación negativa entre estos coeficientes de correlación es superior a un umbral. Es decir, tenemos la intención de encontrar un tejido situado de tal modo que es pequeño. Por lo tanto, proponemos el uso de la función de pérdida. (1) para seleccionar un conjunto de tejidos, de tal manera que el mínimo de la función de pérdida se produce en, donde
a
es una constante entre 0 y 1, es decir,
(2) En la función de pérdida (1),
a
se utiliza para ajustar los pesos de y. Para encontrar que satisface la condición (2), es difícil de calcular directamente el valor para todos los conjuntos de. Para un conjunto de elementos, hay combinaciones. Debido a que el rango de valores es de 2 a 89, hay un total de selecciones ofpossible de un conjunto. La complejidad de cálculo es demasiado alto para obtener la verdadera. Debido a la combinación total posible es demasiado grande, podemos relajar un poco la condición (2) ser (3) en la que S es un conjunto de
O
, que se limita a tener elementos en lugar de elementos, donde. En el siguiente análisis, se selecciona para ser. Para seleccionar un valor adecuado, habíamos probado muchos valores diferentes y encontró que el tejido seleccionado de utilizar es casi lo mismo con los tejidos seleccionados del uso de muchos casos. Por lo tanto, adoptamos en este análisis.
Cuando se toman muestras de tejido conjuntos, un método heurístico o un método de fuerza bruta se pueden adoptar. Si confía en tejidos altamente apoyados por el MTI para un miARN están disponibles en la literatura u otros recursos, nos sugieren la elección directa conjuntos de tejidos que incluyen estos tejidos en la aplicación del algoritmo, que puede podar el espacio de búsqueda. De lo contrario, se sugiere la toma de muestras de fuerza bruta para evitar la obtención de resultados no objetivas. Dado que el tamaño de la muestra es sugerido, no es mucho tiempo en la aplicación del algoritmo cuando utilizamos el método de muestreo de fuerza bruta.
Las etapas de la búsqueda de la virtud de la condición (3) se presenta en el siguiente algoritmo . Antes que precede al algoritmo, debemos especificar la constante en la condición (1).
Para evaluar el desempeño de nuestro algoritmo propuesto, adoptamos una prueba de permutación y una análisis de la agregación [31] para mostrar la superioridad de la propuesta algoritmo. Ambos métodos se describen en los datos suplementarios. Algunos resultados de la comparación se presentan en la Figura S3 en Archivo S1 y el cuadro S1 S1 en el archivo. Los resultados de los dos métodos sostienen nuestro algoritmo propuesto como un método eficaz para seleccionar válidos tejidos apoyados por el MTI de un miARN
2.1 Algoritmos
Algoritmo para la predicción del tejido:.. La pérdida de correlación algoritmo de función
Supongamos que un miARN
m
tiene MTI
Paso 1:. seleccionar aleatoriamente un conjunto
O
con los tejidos
Paso 2:. Calcular las correlaciones entre este miARN y los ARNm a través de los tejidos en
O
. A continuación, calcular la media de estas correlaciones, y la proporción de correlaciones negativas, España
Paso 3:. Utilice los valores y calcular (1)
Paso 4:. Repita los pasos 1-3 veces. Obtenemos los valores
Paso 5:. Ver el valor mínimo de los valores, decimos. Anote el conjunto del tejido, por ejemplo, correspondiente a este valor, es decir
Paso 6:. Repita los pasos 1-5 para diferentes para obtener valores diferentes. Encontrar el valor mínimo de estos s, por ejemplo. A continuación, el conjunto del tejido correspondiente a este valor son los tejidos que reciben apoyo del MTI establecidos
.
Además de considerar sólo las correlaciones de las expresiones entre miRNAs y mRNAs, el número de copias de ADN y promotor de la metilación en el locus del gen mRNA sobre la expresión de ARNm puede influir en la asociación de la expresión de los genes miARN-mRNA. Hemos proporcionado R códigos que incluyen los otros factores en la función de pérdida. Los lectores pueden acceder a los códigos R en http://tsmti.mbc.nctu.edu.tw/lossfunction2.txt.
Debido a que el algoritmo se basa en la función de pérdida (1) para evaluar el desempeño de la correlación, llamamos a este algoritmo el algoritmo de función de pérdida de correlación. Los pasos de nuestro algoritmo se describen en el diagrama de flujo en la Figura 2.
En la práctica, para un miARN y sus objetivos, no estamos seguros de la cantidad de tejidos debe ser seleccionado. En primer lugar, comenzamos seleccionando 3 tejidos de todos los tejidos, pero no selecciona un tejido debido a la correlación entre un miARN y sus objetivos a través de un tejido no se puede calcular. Para encontrar el número óptimo de tejido diferentes miRNAs, seleccionamos el número de tejido de 3 a 15.
En la Figura 3, se ilustra la pérdida de valores de la función de cada uno de los genes miARN y sus objetivos a través de 5, 8 tejidos tejidos , 11 tejidos y tejidos 15, respectivamente. A partir de los resultados del cálculo, encontramos que el valor de la función de pérdida a través de más de 15 tejidos es mayor que el valor de la función de pérdida a través de menos de 15 tejidos. Por lo tanto, no consideramos el caso con el número de tejido que es mayor de 15, y sólo elegimos 3 a 15 números de tejidos para encontrar el número óptimo de tejido. Los resultados indican que el número óptimo de tejido que se deriva por el algoritmo depende de los miRNAs.
En este trabajo se presenta principalmente cuando los resultados. Hemos usado otros valores como en la función de pérdida para seleccionar los tejidos. Los resultados para son similares a aquellos para. Debido a que se utiliza para ajustar el peso entre la media de las correlaciones y la proporción de correlaciones positivas 1-, y somos más preocupación la proporción de correlaciones positivas, ponemos más peso en el segundo período. En este estudio, los resultados utilizando conducen a buenos resultados. Por lo tanto, es un valor sugerido en el uso de este algoritmo. Para otras aplicaciones reales de este algoritmo, los lectores pueden utilizar datos de entrenamiento para obtener un valor adecuado.
Además, para hacer un análisis más objetivo en la selección de los tejidos que reciben apoyo del MTI, en lugar de seleccionar un tejido situado entre conjuntos de tejidos para a 15 que minimiza la función de pérdida (1), se propone un método para clasificar a los tejidos por los dos pasos siguientes. El primer paso es encontrar los 13 conjuntos de tejidos que minimizan la pérdida de la función que corresponde a un 15, respectivamente. El segundo paso es clasificar los tejidos aparecido en estos 13 conjuntos de tejidos de acuerdo con sus números de ocurrencia entre los 13 conjuntos de tejidos. El tejido con la frecuencia de ocurrencia más ocupa el primer lugar y así sucesivamente. Los resultados de la clasificación se presentan en la Tabla 3, que puede proporcionar información sobre el significado de los tejidos que reciben apoyo del MTI.
Resultados
Con el algoritmo, se obtienen tejidos apoyados por el MTI para 19 miRNAs que se enumeran en la Tabla 2. en lo que sigue, se utilizan hsa-miR-17 como un ejemplo para describir el resultado del análisis. La Figura 4 presenta las parcelas para la función de densidad de correlación y el mapa de calor de hsa-miR-17. La figura 4 (a) muestra el diagrama de densidad de las correlaciones (línea continua) de los 743 MTI validada experimentalmente a través de los 89 tejidos y la trama densidad de correlaciones (línea discontinua) entre hsa-miR-17 y sus objetivos a través de la parte superior 6 MTI- tejidos compatibles. La línea continua es simétrica y centralizada a cero; Sin embargo, la línea de puntos es derecho asimétricos. Al parecer, la trama de densidad derecho asimétricos de las correlaciones entre hsa-miR-17 y sus objetivos a través de los 6 mejores tejidos apoyados por el MTI muestra que la mayoría de las correlaciones son negativas, lo cual está de acuerdo con el comportamiento de degradación entre un miARN y sus objetivos. Por el contrario, el hecho de que las correlaciones de los 743 MTI validada experimentalmente a través de los 89 tejidos están cerca de cero indica que el comportamiento de regulación a la baja de un miARN con sus objetivos sólo se muestra a través de los tejidos apoyados por el MTI.
a . La comparación de las densidades de correlación para todos 743 validada experimentalmente MTI (línea continua) y hsa-miR-17 con 24 objetivos a través de los 6 mejores tejidos apoyados por el MTI (línea discontinua). segundo. Los perfiles de expresión de HSA-miR-17 y 24 objetivos a través de los 6 mejores tejidos apoyados por el MTI. Las correlaciones entre el perfil de expresión de HSA-miR-17 y los perfiles de los genes diana fueron anotados al lado del símbolo de genes. Verde representa una baja expresión y el rojo representa la alta expresión de los genes y los tejidos correspondientes.
La figura 4 (b) es un ejemplo que muestra que los perfiles de expresión de la mayoría de hsa-miR-17 genes diana tienen una correlación negativa con el perfil de expresión de HSA-miR-17. En la Figura 4 (b), se presentan los perfiles de expresión de genes hsa-miR-17 y 24 de destino a través de los 6 mejores tejidos apoyados por el MTI. La correlación entre los perfiles de expresión de HSA-miR-17 y cada gen diana se anota al lado del símbolo de genes en la Figura 4 (b). La mayoría de los perfiles de expresión de HSA-miR-17 genes diana están correlacionados negativamente con el perfil de expresión de HSA-miR-17. Los perfiles de expresión de la HSA-miR-17 gen diana TGFBR2 se correlaciona positivamente con el perfil de expresión de los genes miARN. Aunque se ha validado experimentalmente que estos genes diana puede ser inhibida por hsa-miR-17, TGFBR2 no lo es. La razón de la correlación positiva entre hsa-miR-17 y estos genes podría ser que estos genes están regulados por otros factores reguladores fuertes. Para apoyar nuestra sospecha, reexaminemos los estudios de regulación hsa-miR-17 en TGFBR2, lo que muestra que la expresión TGFBR2 no se pudo detectar a causa de la inestabilidad y de microsatélites-mutaciones [32] - [34].
Además, los gráficos de densidad de correlación de otros 18 miRNAs y sus objetivos (a) http://tsmti.mbc.nctu.edu.tw revelan resultados similares a la de hsa-miR-17. Por ejemplo, el algoritmo propuesto busca a 5 principales tejidos específicos de hsa-miR-21, que tiene el mayor número de destino (43 dianas) entre los miRNAs que han sido considerados en este estudio. Además, también encontramos los 8 mejores tejidos apoyados por el MTI para hsa-let-7a y sus objetivos. Tanto de los gráficos de densidad de correlación a través de los tejidos que reciben apoyo del MTI son-sesgada a la derecha y son mayores que las parcelas a través de los 89 tejidos. Además de los resultados de la densidad de correlación, se observa que el número tejido seleccionado depende de la miRNA. En la sección de Métodos, se muestra que el número óptimo de tejido, que se deriva por el algoritmo, depende de los miRNAs. Debido al espacio limitado, que sólo proporcionan la elaboración en el ejemplo de miR-17 en detalles. Para otros miRNAs, calculamos la correlación promedio entre un miARN y sus objetivos a través de los 89 tejidos y correlación promedio entre un miARN y sus objetivos a través de los tejidos que reciben apoyo del MTI seleccionados. Luego se utiliza el valor de la segunda correlación promedio menos la primera correlación promedio como una métrica para cuantificar la mejora de la calidad. Los resultados se presentan en la Tabla 2. Los valores son rango -0,32 a -0,68. El valor de miR-17 es -0,536. Revela que la correlación promedio entre un miARN y sus objetivos a través de los tejidos que reciben apoyo del MTI seleccionados son más fuertemente correlacionada negativamente a la correlación promedio entre un miARN y sus objetivos a través de los 89 tejidos.
Debido a que la apoyaron MTI-top 6 tejidos que han sido seleccionados para hsa-miR-17 incluyen tejidos tumorales, que pueden ser consultadas con los niveles de expresión extremos, que se extienden las 6 mejores tejidos apoyados por el MTI a otros tejidos con el mismo órgano que las 6 mejores tejidos apoyados por el MTI. Los 6 mejores tejidos apoyados por el MTI para hsa-miR-17 incluyen tejidos tumorales y tejidos normales. Los tejidos tumorales se componen de tejidos de la próstata, de mama y de útero. Los tejidos normales se componen de tejidos de mama y de útero. El número de tejidos se extiende a 24 porque el número total de tejidos de la próstata, tumor de mama tejidos tumorales /normales y los tejidos tumorales de útero /normal es 24. Aquí, de nuevo examinar los niveles de expresión de 24 tejidos de hsa-miR-17. Sólo 19 niveles de expresión son más grandes que 7,25. Un tejido se elimina si su nivel de expresión de los genes miARN que se corresponde con el tejido es de menos de 7,25, que es el punto de corte que se utilizó en Huang et al. [7]. La figura 5 muestra el diagrama de densidad de correlación (línea discontinua verde) por los resultados prolongados. La comparación de la figura 4 (a) con la Figura 5, añadimos una línea discontinua verde en la figura 5, que es el diagrama de densidad correlación de HSA-mir-17 y sus objetivos a través de los 19 tejidos extendidos. La línea verde discontinua es siempre entre la línea de color negro sólido y la línea roja punteada. El resultado revela claramente que el análisis que se basa en 6 tejidos apoyados por el MTI conduce a los mejores resultados, seguido por los tejidos extendidas, que son mejores que el análisis que se basa en 89 tejidos
.
Comparación de correlación densidades para los 743 validada experimentalmente MTI a través de los 89 tejidos (línea continua negro), hsa-miR-17 con 24 objetivos a través de los 6 mejores tejidos apoyados por el MTI (línea roja punteada), hsa-miR-17 con 24 dianas en 19 extendido tejidos (línea discontinua verde) y hsa-miR-17 con 95 predijo objetivos a través de los 6 mejores tejidos apoyados por el MTI (línea azul punteada).
además, también investigamos la predicción de destino que se basa en los tejidos seleccionados. Mediante la búsqueda de la 8mero conservadas y sitios 7mer que coincide con la región de semillas de cada miARN de la herramienta de predicción TargetScanS [3] - [5], tenemos 95 objetivos predijo de hsa-miR-17 de nuestro conjunto de datos, que se basan en la top 6 tejidos apoyados por el MTI. La línea discontinua azul en la Figura 5 es la densidad de correlación de hsa-miR-17 y 95 objetivos predijo a través de las 6 mejores tejidos apoyados por el MTI. Aunque una pequeña parte de las correlaciones son correlaciones positivas, la mayoría de las correlaciones son más negativo que en todos los 89 tejidos. Sin embargo, la densidad de correlación de hsa-miR-17 y 95 predijo objetivos a través de los 6 mejores tejidos apoyados por el MTI (azul línea discontinua) no tiene un mejor rendimiento que el obtenido utilizando 24 MTI validada experimentalmente a través de las 6 mejores tejidos apoyados por el MTI (línea discontinua roja) y la obtenida utilizando 24 MTI validada experimentalmente a través de 19 tejidos extendidos (línea discontinua verde). La adopción de objetivos predijo 95 de hsa-miR-17 a través de los 6 mejores tejidos apoyados por el MTI aún pueden mejorar las correlaciones que no están cerca de cero. Por el caso prolongado y el caso se predijo, se concluye que el algoritmo propuesto es confiable para la selección de los tejidos que reciben apoyo del MTI.
Discusión
Nuestro enfoque se centra en el descubrimiento de los tejidos que reciben apoyo del MTI para una miARN basa en los genes diana validada experimentalmente. Sin embargo, nos encontramos con algunos ARNm no están regulados hacia abajo por su miARN validada experimentalmente. Se describen varias razones posibles. En primer lugar, la expresión de ARNm puede ser regulado por varios factores, incluyendo el número de copias de ADN, regulación transcripcional y post-transcripcional regulación. Dado que nuestro sistema selecciona un grupo de diferentes tejidos, la capacidad de represión miARN podría ser más pequeño que otros mecanismos de regulación en parte de los tejidos seleccionados. En segundo lugar, algunos miRNAs no sólo regulan por disminución de sus genes diana, sino también hasta de regular su objetivo genes [35]. miRTarBase no incluye ninguna información sobre una miARN la expresión o regula a la baja sus genes diana. Se supone que el miARN en miRTarBase puede -regulate solamente por sus genes diana. Sin embargo, muchos miRNAs se ha informado que los miRNAs pueden regular por incremento de sus genes diana [35] - [38]. Por ejemplo, el registro de MIRT004506 en miRTarBase es que el miR-466l hasta regula la IL-10 a través de la unión de la UA-región rica en 3'UTR [36]. Por lo tanto, algunos fenómenos arriba-regulación se descubren a partir de los gráficos de densidad de correlación a través de los tejidos apoyados por el MTI.
A partir de los gráficos de densidad de correlación a través de los tejidos que reciben apoyo del MTI en la Tabla 2, nos encontramos con que varios MTI son validados experimentalmente una correlación positiva con los perfiles de expresión de genes miARN. En primer lugar, el miR-145 se correlaciona positivamente con la IRS1 gen diana con una correlación de 0,55. Un informe anterior muestra que el miR-145 se puede regular a la baja el nivel de proteínas de IRS1 pero no puede regular a la baja del ARNm de IRS1 [39]. Por lo tanto, no se observa la correlación negativa entre el miR-145 y IRS1. Por otra parte, algunas líneas celulares, tales como BCT-20, no expresan IRS1. Por lo tanto, la baja regulación de IRS1 por miR-145 no puede ser observada [40]. El segundo MTI no se correlacionó negativamente es el miR-1 y SERP1. El estudio, que hace examinar la interacción entre el miR-1 y SERP1, muestra que la baja regulación de SERP1 por MIR-1 no es significativa [41]. La base de datos miRTarBase podría grabar muchas MTI validada experimentalmente cuyos genes diana son significativamente las reguladas por los miRNAs correspondientes. Es difícil determinar la razón de algunos MTI validada experimentalmente correlacionado positivamente, tales como el MTI validada experimentalmente entre miR-1 y FOXP1. Se requieren experimentos más avanzados para explorar estos MTI.
Figura 6 (a) es una ilustración ampliada de la figura 4. Recopilamos los perfiles de expresión, los cuales se tomaron muestras de los mismos órganos que se muestran en la Figura 4. Se observa correlaciones más conflictivos en MTI validada experimentalmente. En primer lugar, la correlación entre la expresión de CDKN1A y hsa-miR-17 es de 0,23, y la correlación entre la expresión de RUNX1 y hsa-miR-17 es 0,04. Estudios anteriores han revelado que CDKN1A y RUNX1 están regulados por múltiples miRNAs [42], [43]. Debido a nuestro enfoque, que sólo se observa un miARN y sus correspondientes genes diana, la expresión de CDKN1A y RUNX1 no podía simplemente una correlación negativa con la expresión de HSA-miR-17. Dos estudios muestran que el conflicto hsa-miR-17 puede o no puede inhibir la traducción de PTEN. Olive et al. (2009) concluyeron que PTEN podría ser reprimida por el miR-19, pero no por hsa-miR-17, en el linfoma de células B [44]. El experimento que fue reportado por Trompeter et al. (2007) muestra que PTEN se reprime de manera significativa por hsa-miR-17 en células HEK293T y células de riñón de [45]. NCOA3 (AIB1) no se correlaciona con la expresión de HSA-miR-17. Las correlaciones de expresión son negativos en los tejidos de mama y están de acuerdo con el estudio que demostró que NCOA3 es el regulado por hsa-miR-17 [46]. Sin embargo, estas interacciones no están correlacionados negativamente con el resto de los tejidos. Este fenómeno indica que la interacción de los genes miARN objetivo es apoyado por el MTI específica de tejido y revela que nuestro enfoque podría incluir tejidos cuya validada experimentalmente MTI no son funcionales. Debido a que la región de la semilla de miR-17, miR-106a y miR-20a son idénticos, la correlación de expresión de HSA-miR-17 y sus genes diana puede verse afectado por otros miRNAs. Por lo tanto, nuestro enfoque puede determinar qué genes diana son predominantemente regulado por hsa-miR-17 y busque los tejidos no MTI-apoyo.
a. Los perfiles de expresión de HSA-miR-17 y las 24 dianas en 19 tejidos extendidos. Las correlaciones entre los perfiles de expresión de HSA-miR-17 y los genes diana fueron anotados al lado de los símbolos de genes. segundo. Figura S1. a. segundo. Figura S2. Figura S3.