Extracto
Los microARN (miRNA) son pequeños RNAs reguladores que actúan mediante el bloqueo de la traducción y el aumento de la degradación de las transcripciones de destino. MiRNAs desempeñan un papel fundamental en muchos procesos biológicos, incluyendo el desarrollo y la diferenciación y muchos estudios han demostrado que los grandes cambios en los niveles de miARN se producen en el cáncer. Desde miRNAs degradan mensajes objetivo, hemos utilizado esta propiedad para desarrollar un nuevo método de cálculo destinado a la determinación de la actividad biológica real de miRNAs utilizando variaciones en la expresión génica. Utilizando el método descrito aquí, se cuantificó la actividad de los genes miARN en el carcinoma de tiroides y cáncer de mama papilar, y encontramos una señal fuerte y distintiva de aumento de la actividad de los genes miARN mundial, incrustado en las mediciones de la expresión de genes relacionados. Curiosamente, encontramos que en estos dos tipos de cáncer, la actividad de los genes miARN se incrementa en todo el mundo, y se asocia con una regulación a la baja global del miARN genes diana. Este downreguation de miARN genes regulados es particularmente notable para los genes que llevan varios sitios diana para miRNAs. Entre los genes miARN-reprimido, encontramos un enriquecimiento significativo de supresores tumorales conocidos, lo que sugiere que el aumento de la actividad de los genes miARN era en efecto tumorigénico
Visto:. Un Israel, Sharan R, E Ruppin, Galun E (2009) aumentó MicroARN Actividad en los cánceres humanos. PLoS ONE 4 (6): e6045. doi: 10.1371 /journal.pone.0006045
Editor: Joseph Alan Bauer, Fundación de Investigación Bauer, Estados Unidos de América
Recibido: 9 Febrero 2009; Aceptado: 26-may de 2009; Publicado: 25 Junio 2009
Derechos de Autor © 2009 Israel et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. AI es apoyado por una beca de la Fundación Erich et Regine Loewenthal. EG es apoyado por el Ministerio de Ciencia de Israel, a través de una subvención al Centro Nacional de Terapia Génica El conocimiento y la CE concede a través LSHB-CT-2004 a 512.034 (Molęda), LSHB-CT-2008-223317 (LIV-ES), y LSHB -CT-2005-018961 (INTHER). EG también es apoyado por becas de la Blum, el Harold Grinspoon, el apoyo Barbara Fox Miller, el Horowitz y las fundaciones Wolfson. RS y ER son apoyados por una beca de investigación del Ministerio de Ciencia y Tecnología, Israel. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
Los microARN son moléculas de ARN no codificantes de aproximadamente 22 nucleótidos que se emparejan con los ARN mensajeros (ARNm) que llevan una secuencia complementaria de una sola cadena [1]. Los microARNs se unen para apuntar mRNAs dentro del complejo silenciamiento inducido por ARN (RISC), que contiene un miembro de la familia de proteínas Argonaute. Esta unión impide la traducción y acelera la degradación de los mRNAs específicos [2]. En los últimos años, miRNAs han demostrado desempeñar un papel clave en la regulación de la expresión génica, y no hay evidencia de que miRNAs están involucrados en los procesos biológicos centrales, incluyendo el desarrollo, la organogénesis, la diferenciación de tejidos, el ciclo celular y el metabolismo [3 ] - [5]. Sorprendentemente, la expresión espacial y temporal de miRNAs es característico de los tejidos y las etapas de desarrollo, y varios estudios han demostrado un vínculo entre miRNAs expresa en tipos de tejidos particulares y regulación de los genes específicos de tejidos [6].
Los cambios en la miARN expresión se ha demostrado que se producen en el cáncer [7] Sin embargo, la naturaleza y el impacto de la mayor parte de estos cambios siguen sin estar claros. En particular, existen resultados contradictorios sobre la cuestión de si los niveles de miARN se disminución o aumento en el cáncer a nivel mundial. madura miRNAs se ha demostrado en algunos estudios que se redujeron en el cáncer [8], mientras que otros estudios han detectado la regulación positiva de miRNAs en muchos tumores [9]. Una posible explicación para estos resultados divergentes puede haber diferencias entre los tipos de tumores, tejidos analizados, o incluso técnicas de medición. Otra explicación es que el putativo desregulación que miRNAs se someten en el cáncer es un proceso complejo. Es decir, el resultado de la regulación de los genes miARN en la expresión de genes es dependiente no sólo de los niveles de los miRNAs, sino también en muchos otros factores que median la influencia de miRNAs en sus genes diana, tales como componentes del complejo RISC. En consecuencia, la disponibilidad de estos factores marcadamente podría modular la influencia general del efecto miRNAs en sus genes diana, y, como resultado, proporcionar información adicional sobre los niveles de miRNAs sí mismos. Tales variaciones globales de la actividad de los genes miARN son sugeridos por estudios que han demostrado que la Argonaute2 (
EIF2C2
) gen, que se incorpora en el complejo RISC, con frecuencia se duplica en los tumores [10]. Dado que este gen no está directamente implicado en la biogénesis de miRNA, se podría esperar que cuando se duplica este gen, la degradación de los genes miARN genes diana aumentaría, sin aumento asociado de los niveles de miARN. Por esta razón, se intentó determinar el efecto global de miRNAs en sus genes diana, su
actividad biológica
, y hemos diseñado un método para medir este efecto directamente de los correspondientes niveles de expresión del gen diana.
Nuestro método, llamado mirabel (actividad microARN basado en los niveles de expresión), se basa en la observación de que son conocidos miRNAs para acelerar la degradación de sus transcripciones de destino, y que esta actividad deja una firma en los niveles de mRNA de sus genes diana. Una disminución en los niveles de expresión de mRNAs que llevan un sitio de unión para una especie miARN pueda detectarse tras la transfección con los miRNAs afines [11]. Además, varios estudios han demostrado una correlación clara entre miRNAs que son altamente expresado en un tejido dado y la regulación a la baja de sus objetivo transcripciones [6], [12], [13]. Por lo tanto, un cambio de la expresión del conjunto de genes blanco de un miARN en una muestra es una indicación de que la actividad biológica de una especie correspondientes cambios miARN en esta muestra.
El enfoque MIRABELLE se basa en el principio de que el gen los niveles de expresión reflejan el efecto regulador de los módulos de orden superior, y por lo tanto, se podría evaluar el impacto de estos módulos, mediante la observación de los cambios de la transcripción [14], [15]. En particular, los informes recientes han demostrado que la variación en la actividad de miRNAs puede ser detectado mediante la comparación de los niveles de miARN genes diana a través de diversos tejidos [16], [17]. Nuestro método, aunque similar en su concepto, se aparta de los enfoques publicados anteriormente en que está diseñado para capturar rasgos característicos de la regulación de los genes miARN en las transcripciones de ARNm.
Es un hecho ampliamente aceptado que miARN unión está determinada principalmente por la 3 ' región no traducida (UTR) de mRNAs. La presencia de un 7-mer complementario a una semilla miRNA (nucleótidos 2-8) en el 3 'UTR de un gen es un factor clave de reconocimiento miRNA; y varios algoritmos, tales como TargetScan [18], [19], han logrado identificar asociaciones miARN-genes mediante la identificación de los genes cuidadosamente con secuencias conservadas correspondientes a patrones de reconocimiento MIR. Sin embargo, una asociación establecida entre un miARN como un gen diana no implica que todas las transcripciones producidas a partir de este gen estarían sujetos a la regulación de los genes miARN. Alrededor de la mitad de los genes humanos puede sufrir de poliadenilación en varios sitios, ni ser objeto de splicing alternativo influir en sus últimos exones [20], [21] y por tanto producen transcripciones que difieren en sus secuencias 3 'UTR. Entre los ARNm transcritos a partir de tales loci, sólo aquellos que llevan la secuencia reconocida miARN entre el codón de parada y la cola poli A se verían afectados por la regulación de los genes miARN. Esta propiedad, notablemente diferencia a efectos de regulación de la transcripción de los genes miARN que ocurre en el sitio promotor del gen, y que afecta a todas las isoformas del gen. Utilizamos esta propiedad para diseñar un método que evaluar específicamente el efecto de la regulación de los genes miARN.
Este enfoque se hace posible por el hecho de que algunas plataformas de microarrays, como Affymetrix, medir la abundancia de transcripción utilizando varias secuencias tomadas de la 3 'final del gen. Affymetrix datos de expresión génica se resume en la sonda fija, y hay varios conjuntos de sonda disponibles para la mayoría de los genes. Algunos de estos sonda de conjuntos son indicadores fiables de la actividad de los genes miARN, lo que significa que detectan secuencias que sólo pudieran aparecer en las isoformas de un gen que incluyen un sitio de unión para un miARN dado: todas las transcripciones detectadas por estos sonda de conjuntos habría afectado por un cambio en la actividad de una determinada miRNA. El primer paso de nuestro análisis fue identificar por lo tanto estos sonda de conjuntos y los miRNAs para los que detectan la actividad. Hicimos esto mediante la asignación de la secuencia de las sondas, y la determinación de su posición en el gen en relación a los genes miARN sitios objetivo predicha para el gen.
Mirabelle utiliza la expresión los valores medidos por estos sonda de conjuntos para calcular una puntuación de la actividad biológica de cada semilla miARN. Básicamente, se toma como entrada un conjunto de datos de expresión génica y la compara, en cada muestra, los niveles de expresión de sonda de conjuntos que son indicadores fiables de la actividad de una semilla de miARN dado "miR-semilla", con los niveles de expresión de otros sonda de conjuntos presentes en la matriz, que sirven de referencia. La salida de Mirabelle es una "matriz de miR actividad", proporcionando las puntuaciones de actividad para cada familia miARN (identificado por la secuencia de semillas), y cada muestra. Por convención, se dan las puntuaciones positivas cuando los objetivos para una regulación a la baja de visualización familia miARN, lo que indica que la actividad biológica de los miRNAs afines se incrementa en la muestra, mientras que los valores negativos se obtienen para la regulación al alza de los objetivos, lo que sugiere una disminución de la actividad.
Métodos
herramienta de Mirabelle
Mirabelle toma como entrada un conjunto de datos de expresión y produce una matriz de actividades de miR-semilla, dando para cada muestra en el conjunto de datos, los resultados de la actividad calculan para cada uno de los genes miARN para los que existen especies predicciones. se obtienen valores positivos cuando los objetivos para un determinado miR-semilla pantalla más regulación a la baja de la referencia, lo que indica que la actividad de esta miR-semilla se incrementa en la muestra, mientras que los valores negativos se obtienen para la regulación positiva de objetivos, lo que sugiere una disminución de la actividad. Esta herramienta está escrito en Perl.
miR-semillas actividad puntuación de cálculo
Mirabelle primera normaliza los niveles de expresión de genes reportados en el conjunto de datos de entrada usando los valores Z, para corregir la diferente sensibilidad de la sonda : establece, y la disparidad entre el nivel promedio de transcripciones presentes en el tejido. A continuación, se utiliza el estadístico t para calcular las puntuaciones de actividad, comparando, en cada muestra, las puntuaciones Z de la sonda de conjuntos que son fiables detectores de miR-semilla dada, con las puntuaciones Z de otras sonda fija. Se utilizó el de dos colas, muestra de dos t-estadística, con una varianza desigual (dos muestras estadístico t de Welch). En un conjunto de datos de expresión génica en orden aleatorio, la varianza de esta estadística es 1, y su distribución es normal cuando se basa en al menos 20 detectores sonda fija.
miARN objetivos predicciones
En este estudio , se utilizó TargetScan 4.0 predicciones (julio de 2007) de los genes miARN objetivos [18], [19]. TargetScan 4.0 utiliza tanto para la conservación evolutiva, y los determinantes de contexto específicos para predecir los genes miARN objetivos. TargetScan 4.0 predicciones están disponibles por cerca de 158 diferentes semillas conservadas miARN, representante de alrededor de 450 maduras miRNAs en el ser humano. Entre estos miR-semillas, cuatro fueron detectados fiablemente por menos de 20 sonda fija en el microarray, y fueron, por tanto, excluidos de los análisis.
Asignación de sonda de conjuntos de miR-semillas
en Affymetrix microarrays de expresión génica, es común tener varias sonda de conjuntos para el mismo gen, cada uno que reconocen una secuencia diferente. De acuerdo con la ubicación de las secuencias reconocidas por la sonda fija, es posible determinar si una sonda conjunto dado sólo detecta isoformas que llevan a un sitio diana de miR-semilla, o también isoformas que pueden estar exentos del sitio diana de miR-semilla . Sonda de conjuntos de detección exclusivamente transcripciones que llevan un objetivo de miR-semillas son más fuertemente afectados por la regulación de los genes miARN de sonda de conjuntos que detectan una región del gen compartido por las transcripciones que no llevan la secuencia diana de miR. Por lo tanto, un paso previo a nuestro análisis fue asignar a cada sonda-set disponibles en el microarray una lista de miR-semillas que afectarán a todas las isoformas detectados por la sonda-set. Se utilizó la siguiente regla para asignar sonda de conjuntos de miR-semillas: cuando la secuencia correspondiente a un miR-semilla dada está directamente reconocido por una sonda-set o se encuentra aguas arriba de las secuencias detectadas por la sonda-set en el gen y en el mismo exón, consideramos que esta sonda-set para ser un indicador fiable de la actividad para este miR-semilla. Sin embargo, si la secuencia correspondiente a este miR-semilla se encuentra aguas abajo de las secuencias reconocidas por la sonda-set, la sonda-set podría detectar ARNm cortos que no contienen un miARN sitios objetivo, y no asignarlo al MIR -semilla. Se realizó este mapeo utilizando la base de datos del genoma UCSC navegador [22], la acumulación humana 17 (http://genome.ucsc.edu). Hemos descargado las predicciones TargetScan de la página web (http://www.targetscan.org) y les asigna a la UCSC genoma; hemos utilizado la tabla "knownGene" para las localizaciones cromosómicas de mapeo a los genes; se utilizó el "affyU133Plus2" y "tablas" affyU133 para encontrar la localización de secuencias reconocidas por la sonda de conjuntos en los genes (Texto S1).
conjuntos de datos analizados
Pappilary carcinoma de tiroides y cáncer de mama conjuntos de datos fueron recuperados de la base de datos de GEO [23], la adhesión de base de datos GSE3467, GSE3744, y ArrayExpress [24], e-MEXP-882. Se utilizaron los valores de expresión normalizada de la base de datos. Cuando se disponía de datos en bruto, que lo descargamos, y renormalizadas usando GCRMA, RMA y 5,0 MAS paquetes de Bioconductor [25]. predicciones Mirabelle y el enriquecimiento de los objetivos de regulación a la baja no se vieron afectados significativamente por el algoritmo de normalización utilizado. validación de los experimentos de transfección con microRNAs y antagomirs fueron recuperados de la base de datos GEO, GDS1858 adhesión, GDS2657, y GSE3425.
TF enriquecimiento análisis
sitios (BS) para TF Se determinó la unión mediante el escaneo de la promotores de todas sonda de conjuntos presentes en los microarrays de Affymetrix para los partidos con TRANSFAC matrices, como se describe en [26]. En cada promotor, se escanearon los 500 pares de bases (pb) inmediatamente antes de los sitios de inicio de transcripción, de acuerdo con el hecho de que TFBS más activos aparecen cerca del sitio de inicio de la transcripción [27]. La distribución hipergeométrica se utilizó para evaluar el enriquecimiento entre el fondo conjunto de sonda fija y un conjunto de muestras.
GO anotaciones
Hemos utilizado las anotaciones GO proceso biológico para la matriz U133Plus2 desde el sitio web de Affymetrix ( http://www.affymetrix.com).
Estadísticas
Se utilizaron los dos colas, muestra de dos t-test con igualdad de varianza con el fin de identificar a los MIR-semillas que muestran la más desviaciones significativas en los tumores en comparación con los tejidos normales, y calificada como estos MIR de acuerdo con esta prueba. Esta prueba se realizó en Excel. Se realizó una muestra de Kolmogorov-Smirnov (KS) prueba para evaluar la normalidad de la distribución de la actividad puntuaciones de miR calculadas por Mirabelle en el conjunto de datos, y de dos muestras pruebas KS para la comparación de las distribuciones de actividad puntuaciones de miR computados a partir de la original y una al azar conjunto de datos arrastrando los pies. Las pruebas KS y los histogramas asociados se realizaron en Matlab 7 (Mathworks). Las pruebas de enriquecimiento se realizaron utilizando la función de distribución acumulativa hipergeométrica en Matlab.
El enriquecimiento de los genes regulados negativamente al aumentar el número de sitios diana de miR (Tabla 1)
Para el conjunto dado de MIR -semillas, hemos realizado pruebas de enriquecimiento de forma iterativa para cada
i
entre 0 y el número máximo de sitios de destino, de la siguiente manera. El tamaño de la población total (N) fue el número de sonda de conjuntos informativos que tienen al menos
I
sitios diana para el conjunto considerado de miR-semillas, el número de sonda de conjuntos de informes regulación a la baja se cuenta como éxitos (m ). Hemos probado para el enriquecimiento de la regulación a la baja en la muestra de la sonda de conjuntos de detección de al menos
i + 1
sitios diana para estos miR-semillas.
El enriquecimiento de GO anotaciones (Tabla S6)
Se utilizó la distribución hiper-geométricos para identificar las anotaciones más significativamente enriquecido en la muestra de 9542 sonda de conjuntos asociados a los 77 miR-semillas, con respecto a la población de todas sonda fija en la matriz (a). 5069 de estos objetivos de miR se downregulated de manera efectiva en los tumores. En el segundo análisis, se identificaron las anotaciones más significativamente enriquecido en la muestra de 5069 downregulated sonda fija, con respecto a la población de los objetivos previsto 9542 (B).
Resultados
Validación método de la Mirabelle
primer lugar, validado el método Mirabelle en los tejidos donde la abundancia de un miARN particular, se ha aumentado de forma experimental. Lim et al. [11] transfectaron células HeLa con el miR-124, miR-1 y miR-373, y midió la expresión génica después de 12 y 24 horas. Wang et al. [28] transfectaron células HepG2 con miR-124 y la expresión génica se mide a diferentes intervalos de tiempo. Sometimos los datos de expresión génica para el análisis de Mirabelle, que calcula la actividad de miR-semilla para cada muestra. En las muestras que fueron transfectadas con microARN, nuestra herramienta identificó correctamente incrementos muy significativos en la actividad micro ARN, específicamente para las semillas MIR-MIR-124, miR-1 y miR-373, en los experimentos correspondientes (Texto S1). Con el fin de garantizar que Mirabelle es adecuado para la detección de cambios en la actividad de los genes miARN se producen
in vivo
, se analizaron los datos de expresión génica generados en el experimento de Krützfeldt et al., Donde el miR-122 fue silenciada por inyección sistémica de un antagomir [29]. Encontramos que nuestra herramienta identificó correctamente la disminución significativa de la actividad de miR-122 acaecidas después del tratamiento con el antagomir (Texto S1).
actividad MicroARN inferencia al papilar de tiroides humano carcinoma
carcinoma papilar de tiroides (PTC) es un tumor maligno que da cuenta de ~ 80% de los cánceres de tiroides humanos. Dos estudios independientes han informado de alteraciones específicas de los niveles de miRNA en PTC. Por consiguiente, era interesante para cuantificar la actividad biológica de miRNAs en PTC utilizando la herramienta de Mirabelle y comparar los resultados con los cambios en los niveles de expresión de los genes miARN reportados en estos dos estudios.
He et al. [30] midieron los niveles de miARN en muestras de tejido de 15 pacientes con CPT utilizando microarrays miARN. Al mismo tiempo, también se utilizan microarrays de Affymetrix para determinar la expresión de genes en nueve tumores (T-PTC) y nueve tejidos circundantes emparejados (N-PTC). Se analizaron los datos de expresión génica utilizando Mirabelle para inferir una matriz de actividades de miR-semilla (Tabla S1). Como se desprende de esta tabla, las puntuaciones de actividad de miR-semillas fueron sustancialmente más elevados en los tumores que en los tejidos normales, lo que sugiere que los tumores de PTC se caracterizan por una intensificación de la actividad de los genes miARN. De hecho, el índice de actividad de miARN mediana de tumores es mayor que la puntuación media en la actividad normal de las muestras para el 97% de los MIR-semillas. Para determinar los MIR-semillas para las que el aumento de la actividad es la más pronunciada en los tumores, se utilizó la prueba t de dos muestras para comparar las puntuaciones de actividad obtenidos de muestras normales y tumorales (Tabla S2). He et al., Informó de que miR-146, miR-221, miR-222 y miR-21, muestra la sobreexpresión más dramática en los tumores con niveles de 19 a 4 veces mayor en los tumores que en el tejido adyacente. El t-test aplicado a nuestras puntuaciones de actividad (usando sólo el subconjunto de las semillas que fueron utilizados por He y col., En su conjunto microARN) se ha identificado con éxito los 3 miR-semillas pertenecientes a estos 4 microRNAs entre los seis más significativo
p-valores
(de un total de 65 diferentes semillas). Por lo tanto, en el caso de PTC, los mejores miR-semillas identificadas por su actividad biológica coinciden con los mejores miRNAs sobreexpresados.
El partido entre nuestras predicciones y las mediciones biológicas no es incidental y como se muestra a continuación, los resultados de una señal muy fuerte presente en la expresión génica. Las puntuaciones de la actividad calculadas por la herramienta Mirabelle se basan en estadísticas t, y en ausencia de una regulación común de estos genes, estas estadísticas siguen una distribución normal. La figura 1A muestra la distribución de las puntuaciones de la actividad de miR-semilla en tejidos normales y tumorales. Se puede observar que la actividad de las puntuaciones son significativamente mayor en tumores que en los tejidos normales (
p
& lt; 10
-125 por una prueba de Kolmogorov-Smirnov (KS)). Como control, se calculó hipotéticos resultados de la actividad en el mismo conjunto de datos después de barajar al azar de las sonda fija (fig. 1B). En este último caso, la prueba de KS no detecta una diferencia significativa entre la distribución de las puntuaciones de la actividad en el tumor y los tejidos normales, como era de esperar.
(A) Histograma que muestra la distribución de las puntuaciones de actividad de miR-semilla calculado para tumor (rojo) y muestras normales (cian) en el conjunto de datos papilar carcinoma de tiroides. Actividad de miRNAs es globalmente mayor en los tejidos tumorales en relación con los tejidos normales. La prueba de KS rechaza la hipótesis de igualdad de las distribuciones de las puntuaciones de la actividad en el tumor y en tejidos normales, con un valor de p P≈10
-126. La normalidad de las puntuaciones de actividad es rechazada con P & lt; 10
-300. (B) Para demostrar que la desviación entre las puntuaciones calculadas para los tejidos normales y tumorales no se debe a nuestro método de cálculo de las puntuaciones de la actividad, que computa estas puntuaciones a partir de una permutación aleatoria de las sonda de conjuntos del conjunto de datos de PTC. Tanto para los tejidos normales y tumorales, las puntuaciones de actividad siguen aproximadamente una distribución normal, como se esperaba para un estadístico t. No hay ninguna desviación observable entre el tumor y los tejidos normales, y la prueba de KS no rechaza la igualdad de las dos distribuciones. (C) Histograma que muestra la distribución de las puntuaciones de actividad de semillas miR-calculadas para el tumor (rojo) y muestras normales (cian) en el conjunto de datos de cáncer de mama. actividad Mirna es significativamente mayor en los tejidos tumorales en relación con los tejidos normales. La prueba de KS rechaza la hipótesis de igualdad de las distribuciones de las puntuaciones de la actividad en el tumor y en tejidos normales, con un p-valor de P & lt; 10
-298. (D) Histograma que muestra la distribución de las puntuaciones de actividad de miR-semilla de una permutación aleatoria de las sonda de conjuntos del conjunto de datos de mama.
Inferencia de la actividad microARN en cáncer de mama
Después de haber encontrado que la actividad de microARN se incrementa a nivel mundial en el carcinoma papilar de tiroides, se procedió a investigar la actividad de los genes miARN en el cáncer de mama, que es el segundo tipo más común de cáncer, y un objeto de extensos estudios sobre la expresión génica, con algunos conjuntos de datos muy valiosos disponibles en repositorios públicos . Richardson et al., Publicó un estudio de la expresión génica en el cáncer de mama [31], que se basa en un conjunto de datos que incluía siete muestras normales de tejido y 40 tumores de mama, entre los cuales 18 fueron cánceres basal-como (BLC), un poco diferenciado y forma muy agresiva de cáncer. La matriz de la actividad inferida para este conjunto de datos aparece en la Tabla S3. Como se demuestra en la Figura 1C, el nivel de actividad biológica de los genes miARN en muestras de tumores es aquí también significativamente más alta que en las muestras normales; la prueba de KS muestra que las puntuaciones de actividad en muestras tumorales y normales tienen una distribución distinta (
p Hotel & lt; 10
-298). La comparación de las puntuaciones de la actividad en el cáncer y la mediana de las muestras de tejido normal, todos menos cuatro de miR-semillas parecen tener una mayor actividad en el cáncer que en el tejido normal. Incluso después de la elección de un restrictiva de corte de
p Hotel & lt; 3 · 10
4 (correspondiente a un nivel de significancia de 0.05 después de una corrección de Bonferroni para múltiples pruebas), encontramos que el 77 (de la 150) miR-semillas tienen una actividad significativa en el aumento de los tumores (Tabla S4). En total, los microARN correspondientes a estos 77 miR-semillas son predichas por TargetScan para regular alrededor de 6.000 genes. El aumento de la actividad de los genes miARN observado de hecho se refleja en una marcada disminución en la expresión de estos genes diana. De los 9.542 sonda de conjuntos asociados con transcripciones regulado por una de estas 77 miR-semillas, 5.069 (53,1%) tienen expresión promedio más bajo en los tumores (es decir, los correspondientes genes diana son downregulated) que en el tejido normal, en comparación con el 41,6% del total de los 40.539 sonda fija en la matriz (
p Hotel & lt; 10
-147 por una prueba hipergeométrica, Figura 1)
para proporcionar apoyo adicional para nuestra conclusión de que los microARN. son la principal causa de la regulación a la baja masiva de estos genes, se analizó el alcance de la regulación a la baja de destino gen como una función del número de sitios de unión asociados para los MIR-semillas. Esta investigación ha sido motivada por las observaciones previas que sugieren que la degradación del ARNm después de la unión de los genes miARN es más eficiente para las transcripciones que llevan múltiples sitios objetivo de miRNAs [32] - [34]. La Tabla 1 resume las tendencias de expresión observados para la sonda de conjuntos que se asignan a las 77 miR-semillas que muestran el aumento más significativo de la actividad en los tumores. Como se mencionó anteriormente, 9.542 sonda de conjuntos detectan las transcripciones que tienen al menos un sitio de unión para miR-semillas, 53,1% de ellos presentan regulación a la baja en los tumores. Cuando se tiene en cuenta los 6.574 sonda de conjuntos de detección de transcripciones que presenten al menos 2 sitios objetivo, el porcentaje aumenta al 54,4% (p & lt; 1,3 · 10
-4 mediante una prueba hipergeométrica), y continúa aumentando de sonda de conjuntos de detección transcripciones que llevan más sitios de unión para miARN, alcanzando aproximadamente el 70% de los 228 sonda fija detectar transcripciones con más de 15 sitios de destino. Es notable que a pesar de que MIRABELLE algoritmo no utilizó el número de genes miARN sitios en sus puntuaciones de cálculos de actividad de unión se calcula a partir de sonda de conjuntos identificados como indicadores de un miR-semilla, independientemente del número de sitios de unión que pueden llevar el miRNAs que se identificó como una actividad de someterse a un cambio significativo, muestran un efecto dosis-respuesta clara. Por lo tanto, el aumento gradual de la proporción de genes downregulated con el número de sitios diana proporciona un fuerte apoyo a la idea de que la disminución de expresión de los genes diana es de hecho debido a la mayor actividad de los genes miARN
.
Dado que muchos genes están regulados por varias especies miARN, deseamos asegurar que la regulación a la baja mundial detectada de miARN genes diana no se debió al aumento en tan sólo unas pocas especies específicas de miRNAs (que comparten genes diana con la otra especie miARN) fuera de este conjunto de 77 MIR activa -semillas. Con este fin, se realizó la prueba de enriquecimiento hipergeométrica se ha descrito anteriormente (es decir ,. prueba para el enriquecimiento de los reguladas por los genes entre sonda de conjuntos que detectan objetivos de al menos un miR-semilla en el conjunto examinado) de manera iterativa. En la primera iteración, se analizó el enriquecimiento hipergeométrica obtenido al considerar los patrones de expresión de los objetivos de sólo la primera de miR-semilla. En la segunda iteración, se analizó el enriquecimiento hipergeométrica obtenido al considerar los patrones de expresión de los objetivos de la primera y segunda miR-semillas, y así sucesivamente. Sorprendentemente, se obtuvo la mejor puntuación al considerar los objetivos de los primeros 74 miR-semillas, que confirma que, en efecto, la casi totalidad de las 77 especies miARN biológicamente activos originales contribuir a la regulación a la baja expresión observada. Para asegurar que estos resultados no se debían a las características específicas de los datos analizados, se investigó otros conjuntos de datos de cáncer de mama, tales como E-MEXP-882 [35], y los procesa con diferentes esquemas de normalización (GC-RMA, MAS5.0) . Utilizando la prueba hipergeométrica, encontramos una regulación a la baja de manera similar significativa de miARN genes diana (81 biológicamente activos miR-semillas, p & lt; 10
-134 prueba de enriquecimiento hipergeométrica), fomentar el fortalecimiento de la hipótesis de que la regulación a la baja mundial de los genes miARN orientados observó en cáncer de mama no es específico de un estudio en particular.
una causa potencial de la regulación a la baja observada de microRNA genes diana podría ser la acción de factores de transcripción (TFS) que co-regular los genes [36]. La búsqueda de sitios de unión TF conocidos en las regiones promotoras de las transcripciones de destino de cada uno de los 77 miR-semillas, encontramos un enriquecimiento significativo (
p Hotel & lt; 0,05) para 82 TFS (Métodos). sitios de unión para estos TFS se encontraron en el 30% de las sonda de conjuntos presentes en la matriz. Después de excluir todas las transcripciones con supuestos sitios de unión para aquellos TFS, todavía observamos un p-valor muy significativo para el enriquecimiento de los genes regulados negativamente entre los genes miARN objetivos (p & lt; 10
-96).
A continuación, se establece para listar los genes que han predicho los sitios blancos de los miR-77 semillas y por lo tanto se espera que sean afectados por el aumento de la actividad de los genes miARN (cuadro S5). Nos funcionalmente los caracterizó utilizando la ontología de genes (GO) anotación, y buscamos el enriquecimiento estadístico de anotaciones específicas (Tabla S6). Este análisis muestra que varios procesos biológicos fueron representados entre los objetivos de genes de estos miRNAs: regulación de la transcripción, el desarrollo y la diferenciación, la ubiquitina ciclo, la transducción de señales, el transporte y la supresión de tumores (sinónimo categoría: regulación de la progresión a través del ciclo celular) (FDR
p Hotel & lt; 10
-9). Como hemos visto antes, la mayoría de estos genes se muestran disminución de los valores de expresión en los tumores, pero no todos. Buscamos anotaciones funcionales que podrían caracterizar la sonda de conjuntos que fueron regulados a la baja en los tumores, en comparación con los otros objetivos previsto que no fueron regulados a la baja eficacia. Se encontró que la detención del ciclo celular fue la anotación más enriquecido significativamente (FDR
p Hotel & lt; 2 · 10
-2), lo que sugiere que los genes regulados-miARN que causan la detención del ciclo celular están de hecho en downregulated tumores.
Dado que la eficiencia del silenciamiento génico por microRNAs mejora con el número de sitios objetivo, buscamos los genes que llevan el mayor número de sitios diana para nuestros miR-77 semillas. Esto corresponde a la parte superior de la Tabla S5. De acuerdo con los mejores identificado GO anotaciones, encontramos genes que regulan la transcripción de genes:
CPEB4 gratis (elemento de poliadenilación citoplasmática de unión 4), que codifica una proteína que se cree para controlar la traducción de poliadenilación inducida en el desarrollo temprano, tiene el número más alto de sitios de destino (38), y está regulados a la baja. Otros dos miembros de la familia CPEB,
CPEB2
y
CPEB3
, también aparecen en la lista alta con 26 y 25 puntos diana, respectivamente, y también están regulados a la baja;
DDX3X gratis (polipéptido caja DEAD 3, ligada al cromosoma X), una helicasa de ARN, cuenta con 33 sitios de destino, y sus sonda de conjuntos asociados también informar regulación a la baja (p = 0,002, 0,00001);