Extracto
Antecedentes
Los microARN (miRNA) son pequeños RNAs que reconocen y regulan ARNm genes diana. Varias líneas de evidencia indican que son reguladores clave de numerosas funciones críticas en el desarrollo y la enfermedad, incluyendo el cáncer. Sin embargo, definir el lugar y la función de miRNAs en complejas redes reguladoras no es sencillo. Los enfoques de sistemas, como la inferencia de un módulo de red de datos de expresión, pueden ayudar a lograr este objetivo.
Metodología /Principales conclusiones
Durante la última década, se ha avanzado mucho en el desarrollo del módulo de red robustos y potentes algoritmos de inferencia. En este estudio, analizamos y evaluamos experimentalmente una red módulo inferirse tanto de los datos de expresión de mRNA de los genes miARN y, utilizando nuestro algoritmo de inferencia módulo de red recientemente desarrollado sobre la base de técnicas de optimización probabilísticos. Se demuestra que varios miRNAs se predicen como reguladores estadísticamente significativas para los diferentes módulos de genes fuertemente co-expresó. Un análisis detallado de tres de esos módulos demuestra que la asignación específica de miRNAs es funcionalmente coherente y apoyado por la literatura. Se diseñó además un conjunto de experimentos para comprobar la asignación de miR-200a como el regulador de la parte superior de un pequeño módulo de nueve genes. Los resultados sugieren fuertemente que el miR-200a es la regulación de los genes a través del módulo ZEB1 factor de transcripción. Curiosamente, este módulo es más probable que participan en la homeostasis del epitelio y su desregulación podría contribuir al proceso maligno en las células cancerosas.
Conclusiones /Importancia
Nuestros resultados muestran que un robusto módulo de análisis de red de expresión los datos pueden proporcionar nuevos conocimientos sobre la función de los genes miARN en los procesos celulares importantes. Tal enfoque computacional, a partir de los datos de expresión por sí sola, puede ser útil en el proceso de identificación de la función de miRNAs por los módulos de genes co-expresados en los que juegan un papel regulador que sugiere. Como se muestra en este estudio, estos módulos pueden ser probados experimentalmente para investigar más a fondo y refinar la función de los genes miARN en la red de regulación
Visto:. Capó E, M Tatari, Joshi A, Michoel T, K Marchal , Berx G, et al. (2010) Módulo de red de inferencia a partir de un gen del cáncer de Expresión conjunto de datos Identifica microARN Módulos Regulados. PLoS ONE 5 (4): e10162. doi: 10.1371 /journal.pone.0010162
Editor: Simon Rogers, Universidad de Glasgow, Reino Unido
Recibido: 15 de diciembre de 2009; Aceptado: March 22, 2010; Publicado: 14 de abril 2010
Derechos de Autor © 2010 del capo et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo el apoyo de un wetenschap en Technologie (TVN) subvención puerta Innovatie para el proyecto (SBO) Bioframe strategisch BasisOnderzoek y por un poste (IUAP) subvención para el proyecto BioMaGNet (atracción Interuniversitario Bioinformática y Modelización:. de los genomas a Redes, ref p6 /25). Los donantes no tenía papel en el diseño del estudio, DataCollection y análisis, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
Los microARN (miRNA) son pequeños RNAs reguladores endógenos, presentes en una amplia variedad de organismos eucariotas. Ellos se incorporan en un silenciamiento de ARN inducida complejo (RISC) que se une a los sitios de complementariedad variable en ARN mensajero diana, provocando su degradación y /o la represión de su traducción [1]. La evidencia de la participación de miRNAs en el crecimiento celular, la diferenciación celular y el cáncer está acumulando. Casi la mitad del mapa miRNAs humanos anotada dentro de las regiones cromosómicas frágiles, que son áreas asociadas con diversos tipos de cánceres humanos. La evidencia reciente indica que miRNAs, así como los factores que participan en la biogénesis de miRNA pueden funcionar como supresores de tumores y /o oncogenes [2]. De acuerdo con la última versión del repositorio miRBase [3], hay & gt; 700 secuencias madura miARN humanos identificados con el apoyo experimental, mientras que algunos estudios computacionales ampliar esta lista para más de 1.000 [3], lo que equivale más o menos el número de factores de transcripción [4] . estudios computacionales y experimentales también han predicho que entre el 30% y el 100% de los genes de codificación de proteínas humanas podría estar bajo la regulación post-transcripcional de miRNAs [5], [6]. No es difícil ver que, incluso tomando los valores más conservadores, la red de regulación inducida por un gran número de reguladores y los objetivos de este tipo es potencialmente muy grande. Por otra parte, los miRNAs no actúan de forma aislada, sino que son parte de una red de regulación compleja, que involucra factores de transcripción, los transductores de señal y otros tipos de moléculas reguladoras [7]. La reconstrucción y el análisis de dichas redes de regulación es, pues, un reto complejo, pero cruciales para hacer frente.
Existen
Varios algoritmos para inferir las redes de regulación de los datos de expresión [8], [9], [10]. Uno de los métodos más poderosos, sobre todo para los organismos eucariotas, asume una estructura modular de la red subyacente regulador en los que un grupo de genes co-expresados está regulado por un conjunto común de los reguladores (también conocido como el programa de regulación) [10]. El programa regulador utiliza los niveles de expresión del conjunto de los reguladores para predecir la expresión media condición dependiente de los genes co-expresó. Por lo tanto, los módulos se componen de grupos de genes co-expresaron conjuntamente con sus reguladores asociados. Como regulador puede estar asociado con más de un módulo, el conjunto forma una red módulo. Recientemente hemos desarrollado un novedoso algoritmo que se extiende el concepto de red módulo original de Segal y compañeros de trabajo [10] mediante el uso de técnicas de optimización probabilísticos que permiten la priorización de los grupos estadísticamente más significativos de co-expresó genes y sus reguladores candidatos [11], [12]. La ventaja principal de este algoritmo es que extrae más soluciones representativas del centroide-como de un conjunto de posibles modelos estadísticos, con el fin de evitar las soluciones óptimas. Para ello, en varios conjuntos de datos biológicos, hemos demostrado que este enfoque genera módulos más coherentes, y que los reguladores asignados sistemáticamente a un módulo están más a menudo con el apoyo de fuentes externas de datos [11], [12].
en este estudio, hemos adaptado nuestro algoritmo de red módulo de tomar como entrada un conjunto de datos heterogéneos tanto de los datos de expresión de ARN mensajero (ARNm) de miRNA y medido en las mismas muestras. Múltiples miRNAs se asignan como reguladores de alta puntuación candidatos para varios módulos, junto con los factores de transcripción conocidos o transductores de señal. Un análisis detallado de tres módulos donde miRNAs se seleccionan como reguladores de alta puntuación muestra que esta asignación es muy coherente con la función de módulo y también es apoyada por diversas fuentes externas de datos. También hemos validado uno de esos módulos experimentalmente, que muestra que la sobre expresión o inhibición de los genes miARN asignado como un regulador cambia significativamente la expresión de una selección de genes del módulo, lo que confirma la inferencia del algoritmo. Esos resultados corroboran módulo de red de inferencia como un enfoque sólido y útil para hacerse una idea más precisa en función de miRNA.
Resultados
Inferencia de un módulo de red micro ARN a partir de datos de expresión
La LeMone algoritmo, a partir de una matriz de datos de expresión y una lista de candidatos reguladores, producirá una red módulo, compuesto por módulos de co-expresó genes reguladores y sus asociados. El algoritmo también se clustering las condiciones (columnas) para cada conjunto de genes co-expresados, creando agrupaciones de condición. La lista de los reguladores para un módulo dado se ordena en función de su puntuación individual. Esta puntuación sólo se tiene en cuenta la expresión diferencial del regulador a través de los diferentes clusters de condiciones diferentes, y no su valor absoluto. De esta manera podemos evaluar y comparar de ARNm y reguladores miARN candidatos, utilizando los niveles de expresión de cada clase de reguladores simultáneamente. Como entrada para el algoritmo, se utilizó un conjunto de datos compuesta por los datos de expresión medidos en 89 tumores y muestras de tejido normal (en representación de 11 clases de tumores), tanto para 11.833 ARN mensajeros y 124 miRNAs [13]. A diferencia de los intentos anteriores [14], [15], [16], nuestro enfoque para la integración de los miRNAs en la red no se basa en miARN predicción de destino, o una mezcla entre la predicción de destino y datos de expresión, sino que se basa únicamente en los datos de expresión. El algoritmo genera un conjunto de 76 firmemente co-expresó grupos de genes, lo que corresponde a un total de 2.987 genes. Se calculó el enriquecimiento de GO para todos los módulos [17] y han encontrado un total de 44 grupos que tienen al menos una categoría GO enriquecido (p & lt; 0,05), para un total de 589 categorías enriquecido (la lista completa de módulos y sus categorías GO es disponible como S2 tabla). Para la asignación de los reguladores, hemos compilado una lista de 1.841 reguladores candidatos en base a sus anotación GO (ya sean factores de transcripción o transductores de señal), además de la lista de 124 miRNAs. Después de la asignación de los reguladores tomamos un corte estrictas que corresponde a los mejores 2% interacciones reguladoras previstos más significativos (Figura 1), la obtención de un conjunto final de 294 reguladores únicos (la lista completa de los genes de los módulos y los reguladores está disponible en el cuadro S1). Dentro de este conjunto, se seleccionaron diez miRNAs como reguladores para un total de siete módulos (Tabla 1). Con el fin de evaluar la validez y la pertinencia de la red módulo inferido, que aquí presentamos un análisis detallado de tres módulos, con un énfasis en las características típicas de los módulos de regulación mediada por miRNA. Se seleccionaron aquellos módulos en función de su interés intrínseco, la coherencia funcional y el elevado número de referencias de la literatura discutiendo su supuesta función.
Los histogramas representan la distribución de los asignados al azar (verde) y verdadero (amarillo) Los reguladores de las puntuaciones para la módulo de red. La flecha de los reguladores al azar representa la puntuación máxima para los reguladores asignados al azar con el valor indicado entre paréntesis. La flecha de los verdaderos reguladores representa el valor de punto de corte, con el valor en bruto se indica entre paréntesis.
miR-133 y miR-145 se asignan como reguladores de un módulo suave actomiosina del músculo
módulo 29 es un pequeño módulo compuesto por cuatro genes y cinco reguladores asignados (Figura 2a). Los GO categorías más representadas de este módulo están vinculados a suavizar el desarrollo muscular y la estructura actomyosin (Figura 2a y la tabla S2). MYH11 codifica un miembro de la familia de la cadena pesada de la miosina del músculo liso. Actg2 es una proteína actina gamma 2 se encuentra en los tejidos entéricos. Los otros dos genes en el módulo (MYLK y cnn1) son bien conocidos reguladores de la interacción actina-miosina. MYLK es la quinasa de cadena ligera de la miosina, una quinasa dependiente de calcio dedicado que fosforila un sitio específico en la cadena ligera reguladora de la miosina, la mejora de su actividad. MYLK es ubicua en todos los tejidos adultos con las cantidades más altas que se encuentran en los tejidos de músculo liso [18]. Cnn1 (calponin) es una proteína de unión de calcio que inhibe la actividad ATPasa de la miosina en el músculo liso. El regulador superior (PPP1R12B) seleccionado para este módulo es una subunidad de la miosina fosfatasa. La fosfatasa de miosina es también un conocido regulador de núcleo de la vía de actomiosina, la inhibición de la actividad de la miosina [18]. El segundo regulador candidato de alto puntaje es un miARN, MIR-133, mientras que el tercer regulador es el TGF-beta-22 clon de miembro de 1 gen (TSC22D1) estimulado, que codifica una proteína de dominio de cremallera de leucina, un miembro de la vía TGF-beta1 que está implicado en la regulación de la transcripción. Los últimos son los reguladores ANGPTL2, un factor de crecimiento endotelial vascular, y otro miARN, MIR-145.
valores de expresión de genes están codificados por colores, que van desde el azul oscuro (bajos niveles de expresión) a amarillo brillante (altos niveles de expresión) . En cada figura, las columnas representan una muestra diferente. La barra de un código de colores en la parte inferior del gráfico representa el origen del tejido (véase la leyenda), mientras que los cuadrados grises justo por debajo indican si el tejido de la muestra fue normal (gris claro) o tumor (gris oscuro). Los reguladores candidatos están clasificadas por la disminución de valor de puntuación (de arriba a abajo). Las muestras se agrupan en las hojas de los valores de expresión homogéneos, de acuerdo con los árboles jerárquicos indicados en la parte superior de cada figura. Las cajas de naranja en la derecha de la figura indican categorías GO excesivamente (p≤0.05).
Los dos seleccionados miRNAs como reguladores para este módulo muestran claramente un patrón de expresión fuertemente correlacionada positivamente con los genes del módulo ( Figura 2a). Como la mayoría de miRNAs se han caracterizado los reguladores la medida en que negativos de la expresión génica, esto sugiere una regulación indirecta entre los miRNAs y módulo de 29 genes. Estudios recientes revelan varios genes candidatos probables que podrían actuar como reguladores intermedios entre los miRNAs y módulo de 29 genes. MiR-133, seleccionado como el segundo mejor regulador de este módulo (Figura 2a), ha sido recientemente demostrado ser un regulador clave para el desarrollo del esqueleto muscular y la hipertrofia del músculo cardíaco [19], [20]. En esos estudios, el miR-133 se ha demostrado que regulan directamente el factor de transcripción SRF. SRF es reconocido como un factor de vital importancia para las actividades del citoesqueleto y de células contráctiles normales y todos los módulos de 29 genes (
MYH11
,
cnn1
,
actg2
,
MYLK
) son conocidos por ser blanco directo de SRF [21]. Estos resultados apoyan la hipótesis de la literatura de un enlace de regulación indirecta entre miR-133a y el módulo 29 genes a través de la SRF. La mayoría de los estudios sobre la actividad SRF han caracterizado hasta ahora este factor como un activador transcripcional [21], pero algunos resultados también sugieren que la SRF podría actuar como un represor transcripcional de sus objetivos de genes [22], [23], [24]. SRF represión de genes mediada no está claro, pero podría implicar la contratación por SRF de silenciadores transcripcionales [23], [24]. Si la hipótesis de que la SRF está reprimiendo la transcripción del módulo de 29 genes, entonces el proceso de reglamentación de miR-133 - SRF - Módulo de 29 genes puede explicar la correlación de genes expresión positiva que se observa en la Figura 2a. Los otros miRNA seleccionados como un regulador, miR-145 se muestran recientemente a ser un importante regulador de destino de las células del músculo liso [25]. Este estudio [25] también muestra que miR-145 es la activación de uno de sus objetivos directos, el miocardina (Myocd), que es un factor de transcripción conocido para activar la expresión de genes del músculo liso mediante la interacción con SRF [26]. Así también tenemos una cadena de regulación de miR-145 - Myocd - Módulo de 29 genes que pueden explicar el patrón de expresión se observa en la Figura 2a. Ni SRF ni Myocd se asignan como reguladores o agrupados juntos con el otro módulo de 29 genes. Desafortunadamente, el gen miocardina no estaba presente en los microarrays utilizados para producir los conjuntos de datos [13]. El perfil del factor de transcripción SRF parece correlacionarse mal con la expresión de los genes del módulo 29 en nuestra base de datos (Data archivo S1), que explica por qué este gen no podría ser seleccionado como un regulador. Hay varias razones que podrían explicar por qué el perfil es divergente, al igual que las modificaciones posteriores a la traducción o el hecho de que los miRNAs actúan a nivel post-transcripcional, evitando posiblemente el efecto regulador para ser detectado (mediante la represión de la traducción).
MIR -142s están asignados como reguladores de la respuesta inmune de un módulo
módulo 18 se compone de seis genes (Figura 2b), de los cuales cinco inmunoglobulinas correspondientes codifican ya sea a la cadena pesada (IGHG4, IGHA2, IGHA1) o al cadena ligera (IGKV1-5, IGLV3-21), mientras que IGLL1 es la cadena ligera de alquiler, un componente crítico del complejo receptor de células pre-B. No es sorprendente, encontramos la categoría de respuesta inmune GO excesivamente representados para este módulo (Figura 2b y tabla S2). Se conocen todos los genes del módulo que se expresa principalmente en las células B en desarrollo y maduras, revelando un módulo coherente [27]. Se seleccionaron nueve reguladores de alta puntuación para este módulo. El principal regulador es un gen homeobox, Hoxc5. El gen HMGA1 es seleccionado como el segundo mejor regulador para este módulo. proteínas de alta movilidad de grupo (HMGA) regulan la actividad de una amplia variedad de genes por el cambio de la conformación del ADN de sus genes diana. HMGA1 es conocido para co-activar la transcripción en las células B y para ser importante para el desarrollo de las células B [28]. El tercer y cuarto reguladores candidatos son dos miRNAs procesados desde el mismo precursor, el miR-142-5p y miR-142-3p. El gen HLA-DRB1 pertenece a los parálogos de la cadena beta de HLA de clase II. Se sabe que juega un papel central en el sistema inmunológico mediante la presentación de péptidos derivados de proteínas extracelulares [29]. CCL5 es una citoquina quimiotáctica de jugar un papel activo en el reclutamiento de leucocitos a los sitios de la inflamación [30]. AXL es una tirosina quinasa receptor que está transformando en fibroblastos y células hematopoyéticas, y está implicado en el desarrollo mesenquimales [31]. CXCL14 es un pequeño citoquina que pertenece a la familia de quimioquinas CXC. Este gen es quimiotáctica para los monocitos y puede activar estas células en presencia de un mediador inflamatorio [32]. CXCL14 expresión se reduce o se ausente de la mayoría de las células del cáncer [33]. Este módulo está probablemente relacionado con una respuesta inmune provocada por varios estados tumorales. Tales respuestas inmunes pro-tumorales persistentes son conocidos para potenciar el desarrollo del tumor primario y la progresión maligna.
miR-142s se expresan preferentemente en los tejidos hematopoyéticos y su expresión está regulada durante la hematopoyesis, lo que sugiere un papel en la diferenciación de células del sistema inmune [34 ]. El TCF12 factor de transcripción se prevé como un objetivo para el miR-142-3p [35]. En un estudio anterior, se demostró que una dosis combinada de los factores de E2A, E2-2 y TCF12 que se requiere para el desarrollo normal de células B. Más precisamente, TCF12 es importante para la generación de números normales de pro-células B [36]. Debido a que el módulo 18 genes se expresan en el desarrollo de las células B, la regulación de TCF12 por miR-142-3p podría ser importante para este proceso. Además, hemos encontrado motivos conservados de unión para TCF12 para la mayoría de los módulos 18 genes (archivo de datos S1), lo que indica que este factor de transcripción podría ser importante para su regulación. Al igual que para el módulo 29 y SRF, el perfil de expresión de TCF12 es altamente divergente de los perfiles de expresión de los genes del módulo 18, que explica por qué este gen no ha sido seleccionada como módulo o gen regulador (datos no mostrados).
Mir 200a es un regulador clave de un módulo que participan en la homeostasis del epitelio
módulo 25 se compone de nueve genes (Figura 2c). SCNN1A (también conocido como ENaC) es la subunidad alfa del canal de sodio epitelial sensible a amilorida, expresa en muchos tejidos epiteliales [37]. PRSS8 (prostasina) es un tripsinógeno que regula la actividad del canal de sodio epitelial [38]. FDXY3 es una pequeña proteína de membrana que está altamente transcrito en tejidos tales como el útero, estómago y colon, y puede funcionar como un regulador del canal de Na /K [39]. TACSTD1, el transductor de señal de calcio asociado a tumor 1, funciona como una molécula de adhesión celular independiente del calcio [40]. Otros genes como ATAD4 o TMEM63A son proteínas transmembrana de función desconocida. Rab25 es una pequeña proteína de unión a GTP. RAB proteínas han estado implicados en la regulación del tráfico de vesículas [41]. El regulador de la parte superior del módulo es de miR-200a. En cuanto a los otros reguladores, PPP1R1B es una fosfoproteína regulada por dopamina y cAMP, y es un inhibidor de la proteína fosfatasa 1. Además de su papel bien conocido en el sistema nervioso central, que es altamente expresado en una variedad de tejidos epiteliales donde podría jugar un papel en la señalización epitelial y la tumorigénesis [42]. GPR30 es un trans-membrana de la proteína G del receptor de estrógeno junto [43], mientras que PTGER3 es una proteína G de prostaglandina E2 receptor acoplado a que está implicada en diversos procesos fisiológicos y fue demostrado que afectan a las concentraciones intracelulares de Ca ++ y AMPc [43]. ZNF157 es una proteína con dedos de zinc de función desconocida, mientras que GNB3 y GNG5 son proteínas G subunidades implicadas en la transducción de señales. A partir de las funciones de estos genes, se puede concluir que la mayor parte del módulo 25 genes reguladores y es probable que participan en la homeostasis del epitelio, aunque no se encontró ninguna categoría particular GO enriquecido para este módulo. También cabe señalar que varios de esos genes están relacionados con la progresión del tumor [40], [41], [44].
miR-200a, que fue seleccionado como el mejor candidato para el regulador del módulo 25, es un miembro de una familia de cinco miARN miRNAs estrechamente relacionados (miR-200a, miR-200b, miR-200c, miR-141 y miR-429). Publicaciones recientes muestran una expresión epitelial específica de miR-200a y miR-200b [45], [46]. Se diseñó un conjunto de experimentos para validar el papel de miR-200a como un regulador de la expresión de genes en el módulo 25. miR-200a se introdujo en una línea celular de cáncer de mama epitelial diferenciado de humano MDA-MB-231, conocido por expresan niveles bajos de manera aberrante miR-200a. La expresión de seis genes (
Rab25
,
IRF6, SCNN1A, PRSS8, ATAD4
,
TACSTD1
) de los nueve que pertenece al módulo 25 se controló mediante RT-qPCR ( Figura 3). Sin excepción, los seis genes controlados muestran una clara regulación en la expresión exógena de miR-200a (Figura 3a). El experimento inverso, la inhibición de algunos miembros de la familia miR-200 (miR-200a, b, c) en las células MDA-MB-231 utilizando antagomirs, dio lugar a la significativa baja regulación de cuatro de cada cinco genes probados, (
SCNN1A
no es significativamente regulada hacia abajo,
ATAD4
no se expresa en condiciones normales en esta línea celular) (Figura 3b). Estos resultados muestran claramente que miR-200a es un regulador central de módulo 25, más probablemente con otros miembros de la familia de miR-200.
(a) análisis cuantitativa en tiempo real PCR (RT qPCR) de la expresión de módulo 25 genes
Rab25
,
IRF6, SCNN1A
,
PRSS8
,
ATAD4 y TACSTD1
y sobre la sobre-expresión de miR-200a en MDA- MD-231 células (media ± desviación estándar). El eje y representa el valor de la expresión del ARNm relativa. miR-1 se utilizó como control (Ctrl), ya que no se conoce para dirigir cualquiera de los genes controlados (B) Análisis de RT qPCR de la expresión relativa de los genes
Rab25
,
IRF6
,
SCNN1A
,
PRSS8
y
TACSTD1
en MDA-MB-231 células infiltradas con miR-200a, b, c antagomirs. El eje y representa el valor de la expresión del ARNm relativa (media ± desviación estándar). MIR-1 se utilizó como control (Ctrl) (c) análisis de RT PCR cuantitativa de los niveles relativos de expresión de 25 genes módulo
Rab25, IRF6, SCNN1A, PRSS8, ATAD4, TACSTD1, TMEM63A
y
FXYD3 Hoteles en MDA-MB-231 células, donde
ZEB1
es derribado. La primera barplot (negro) muestra la represión efectiva de los
ZEB1
niveles tras la transfección con el
ZEB1
siRNA. Par = cultivo celular parental, Mock = transfección simulada, si-ZEB1 = transfección con el ZEB1 siRNA.
En este módulo, se observa de nuevo un patrón clara correlación positiva entre el miR-200a y el módulo genes de expresión, lo que sugiere un circuito de regulación indirecta entre miR-200a y el módulo de 25 genes (Figura 2C y la Figura 3a y 3b). Recientes trabajos experimentales mostraron que miembros de la familia miR-200 se dirigen directamente a los factores de la transcripción y ZEB1 ZEB2 [47], [48], [49]. Estos factores de transcripción son conocidos como los principales represores de la transcripción de la diferenciación del epitelio orquestar la transición epitelio mesenquimal (EMT) [50]. EMT es un proceso que conduce las células epiteliales de un fenotipo polarizado a un fenotipo muy móviles, no polarizado mesenquimales y se sabe que se producen en los tumores epiteliales que dan lugar a células de cáncer altamente malignas. Los factores de transcripción ZEB han sido relacionados funcionalmente a los miembros de la familia miR-200 a través de un circuito de retroalimentación negativa doble, promoviendo así la EMT y la invasión del cáncer [47], [51], [52]. Nos encontramos conservamos ZEB motivos de unión para varios módulo de 25 genes (archivo de datos S1), lo que sugiere que los factores de ZEB podrían ser los reguladores intermedios entre miR-200 y del módulo 25 genes. Para probar esta hipótesis, se ha reducido regulado el factor de transcripción ZEB1 en las células MDA-MD-231 con un siRNA, mientras que el control de la expresión de 25 genes ocho módulos (Figura 3c). Todos los genes muestran un fuerte patrón de regulación, con la excepción del gen Rab25 (Figura 3c). Estos resultados demuestran que el factor ZEB1 es esencial para la regulación de los módulos 25 genes. Tomados en conjunto, nuestros resultados experimentales (Figura 3) indican claramente la existencia de una cadena de regulación entre el miR-200 y del módulo 25 genes a través del factor de transcripción ZEB1 (Figura 4). Dado que tanto el miR-200 y ZEB1 juegan un papel importante en la EMT [47], [48], [49], [51], [52] Se postula que el módulo 25 de la represión podría contribuir al proceso de EMT maligno en las células cancerosas.
miR-200 genes reprimen factores ZEB, que a su vez reprimen la expresión de 25 genes módulo. La luz amarilla indica genes asignados como reguladores, la luz verde indica que los genes del módulo mientras que la luz naranja indica genes no asignados como reguladores, pero con el apoyo de la literatura (regulación indirecta). Este modelo de regulación admite la correlación positiva de los patrones de expresión entre los MIR-200a y el módulo de 25 genes.
Discusión
MiRNAs han surgido muy recientemente como un nuevo e importante capa de la regulación. La mayoría de los estudios realizados hasta ahora se han centrado en la identificación y en la detección de sus objetivos. Varios estudios experimentales han demostrado que al menos algunas de ellas desempeñan un papel clave en diversas vías de desarrollo y celulares. La integración de los miRNAs en las redes de regulación, por tanto, es de fundamental importancia e idealmente debe hacerse teniendo en cuenta los otros tipos de moléculas reguladoras. Hasta ahora, pocos estudios han propuesto una estrategia computacional para inferir las redes módulo mediadas miARN [14], [15], [16]. Estos se basan principalmente en los genes miARN predicción de destino, o en una combinación de predicción de destino y los datos de expresión. Hemos aplicado un algoritmo de inferencia módulo de red robusta e imparcial a un conjunto de datos de expresión relacionada con el cáncer de ambos mRNAs y miRNAs. En nuestro enfoque, miRNAs se consideraron como reguladores candidatos, junto con otros tipos de reguladores, como factores de transcripción y transductores de señal. Incluso después de aplicar una ley de corte estricto, varios miRNAs se conservan tan alta puntuación, estadísticamente significativos reguladores candidatos para los diversos módulos. A través de un análisis en profundidad de las tres de esos módulos, se demostró que la asignación de miRNAs específicos como reguladores es apoyada por diversas fuentes externas y es funcionalmente coherente. Además, pudimos demostrar experimentalmente que un miARN, asignado como el mejor regulador, es de hecho un regulador clave de la expresión de genes de módulos. El número de miRNAs asignados en este estudio (10) podría parecer más bien modesto, pero este número tiene que ser evaluado con respecto al número total de miRNAs para los que se midió la expresión en las muestras (124). La relación asignado por número total de miRNAs es igual a 8%, mientras que el mismo valor de la relación es 15% para los factores de transcripción Conjuntos más transductores de señal (284/1841). Los dos valores de la relación son comparables, por lo que podemos esperar razonablemente que un mayor número de miRNAs asignados cuando un aumento de la cobertura del paisaje expresión miRNome estará disponible.
Sin embargo, al igual que con otros métodos similares, la atención tiene que ser tomado para la interpretación del modelo de regulación inferido. En particular, la correlación de la expresión génica podría no siempre indican una interacción directa. De hecho, para los tres módulos que hemos investigado en detalle, se ha encontrado una vía de regulación indirecta entre el regulador y los genes de módulos. Además, ninguno de esos genes reguladores indirectos fueron asignados por el algoritmo en el programa de regulación o incluso agrupado junto con los genes de los módulos. Como pudimos mostrar para el módulo 29 y el factor de transcripción SRF, la razón es porque los reguladores indirecta perfil de expresión difieren significativamente de las de los genes de los módulos. Varias razones pueden explicar esta divergencia, por ejemplo, la regulación podría suceder a nivel post-transcripcional, o podría ser el resultado de modificaciones posteriores a la traducción. reguladores indirectos podrían estar, por supuesto, complican la interpretación de los resultados, sino que son de esperar, sobre todo en los organismos eucariotas superiores donde se espera que las redes de regulación a ser más complejos [53].
En conjunto, nuestros resultados muestran que la novela se puede derivar de un sólido análisis de la red del módulo de miARN y ARNm de datos de expresión y apoyan la opinión de que al menos algunos miRNAs tienen un papel regulador clave en los procesos celulares importantes. Nuestro enfoque tiene también la ventaja de proporcionar una visión directa de las modificaciones post-transcripcional a través de la integración de los miRNAs, en donde la expresión del ARNm por sí sola puede no ser suficiente para revelar la existencia de interacciones reguladoras. Los tres módulos para los que hemos hecho un análisis detallado en este estudio tienen cada uno un conjunto coherente de los genes, que participan en el mismo proceso y la función. Por otra parte, mediante la conexión de miRNAs a módulos coherentes, creemos que este enfoque puede ayudar a dilucidar la función de los genes miARN y podría conducir de manera eficiente el trabajo experimental hacia la identificación de los componentes clave de la reglamentación en diversos procesos. Con la rápida proliferación de diversas técnicas para medir con alta precisión los niveles de expresión de cientos de miRNAs, y la disponibilidad simultánea de los datos de expresión de ARNm, que será de gran atractivo para aplicar estrategias de cálculo como el que describimos aquí para ampliar nuestros conocimientos en las redes globales de regulación.
Materiales y Métodos
conjuntos de datos de expresión
Se utilizó un normalizaron los datos de expresión del cáncer establecidos publicados anteriormente [13]. Se realizó etapas de filtrado adicionales para mejorar la calidad del conjunto de datos de entrada. Probesets sin identificadores de genes Ensembl conocidos fueron descartados, así como secuencias de genes miARN que no fueron anotados como miRNAs humanos en la versión más reciente miRBase [3]. La matriz de datos final contenía 11.833 genes y 124 miRNAs, para lo cual se midió la expresión a través de 89 muestras correspondientes a 11 clases diferentes de tumores.
Módulo de red de inferencia
Se utilizó el algoritmo LeMone para inferir la red módulo [11], [12], [54]. En un primer paso, el algoritmo es la búsqueda de una partición de genes en grupos de genes co-expresó. En un segundo paso, el algoritmo define un programa de regulación (un conjunto de genes reguladores) para cada clúster.