Integral
Extracto
Una tubería integradora novela se presenta para el descubrimiento de las regiones potenciales de cáncer de susceptibilidad (PCSRs) mediante el cálculo del número de de genes alterados en cada región cromosómica, utilizando microarrays de expresión conjuntos de datos de diferentes tipos de cáncer humano (HC). Nuestro enfoque novedoso comprende principalmente la predicción PCSRs seguido de la identificación de genes clave en estas regiones para obtener posibles regiones que albergan nuevas variantes asociadas con el cáncer. Además de encontrar nuevas variantes causales del cáncer, otra de las ventajas en la predicción de tales regiones de riesgo es el estudio simultáneo de diferentes tipos de variantes genómicas en línea con el enfoque en regiones cromosómicas específicas. El uso de este gasoducto se extrajeron los números de las regiones con muy alterados los niveles de expresión en condición de cáncer. las redes de regulación también se construyeron para los diferentes tipos de cáncer después de la identificación de ARNm alterado y microRNAs. Curiosamente, los resultados mostraron que GAPDH, LIFR, ZEB2, miR-21, miR-30a, miR-141 y miR-200c, situados todos ellos en PCSRs, son factores alterados comunes en las redes construidas. Encontramos una serie de grupos de mRNAs y miRNAs alterados en PCSRs predichos (
por ejemplo
.12p13.31) y sus reguladores comunes, incluyendo KLF4 y SOX10. predicción a gran escala de las regiones de riesgo a partir de datos del transcriptoma puede abrir una ventana en el estudio exhaustivo de los factores de riesgo del cáncer y otras enfermedades humanas
Visto:. Alisoltani A, Fallahi H, Ebrahimi M, M Ebrahimi, Ebrahimie E ( 2014) la predicción de posibles regiones del cáncer-riesgo Basándose en transcriptoma de datos: Hacia una visión integral. PLoS ONE 9 (5): e96320. doi: 10.1371 /journal.pone.0096320
Editor: William B. Coleman, Universidad de Carolina del Norte Facultad de Medicina, Estados Unidos de América
Recibido: 23 Enero, 2014; Aceptado: April 7, 2014; Publicado: 5 Mayo 2014
Derechos de Autor © 2014 Alisoltani et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Los autores no tienen el apoyo o la financiación para reportar
Conflicto de intereses:.. los autores han declarado que no existen intereses en competencia
Introducción
la alteración en mRNAs y miRNAs expresión y el papel importante de un gran número de estas moléculas se han estudiado en la iniciación, progresión y metástasis de muchos tipos de cáncer [1], [2], [3] _ENREF_1. Los cambios en la metilación del ADN y factor de transcripción (TF) la regulación, la variación del número de copias genómicas (CNV) [4], polimorfismo de un solo nucleótido (SNP) [5] y de microsatélites alternancia [6], así como otras aberraciones cromosómicas se caracterizan como los principales mecanismos de expresión alternancia en diferentes cánceres humanos (HCS).
diferentes métodos que incluyen el genoma estudios de asociación de ancho (GWAS) han identificado un gran número de variantes asociada para diferentes tipos de cáncer [7], [8], [9]. Por ejemplo, se encontró que las variantes comunes en la región 19p13 estar asociado con el cáncer de ovario [10], las VNC en 6q13 y cinco loci de riesgos en 21q21.3, 5p13.1, 21q22.3, 22q13.32 y 10q26.11 estaban directamente vinculados para cáncer de páncreas [4], [11]. Además, nuevos loci de riesgos en 10q25.2, 6q22.2 y 6p21.32 se asocia con el cáncer de pulmón [12], y varios loci de riesgos en 9q31.2, 19q13.4 y 8q24, se mostró a ser asociado con el cáncer de próstata [ ,,,0],13], [14], [15].
Sin embargo, los retos en GWAS están encontrando variantes causales y los efectos funcionales, así como la interrelación de estas variantes en el cáncer. Mientras que los estudios genéticos previos de cáncer han predicho un gran número de variantes asociadas con el cáncer [8], [9], [10], [15], [16], la identificación de variantes causales es obstáculo importante, debido a que las variantes genéticas causales conocidos son en su mayoría situados dentro de las regiones no codificantes o localizados a diferentes distancias físicas a partir del gen que influyen en [17]. Además, la estructura de modelos lineales empleados en GWAS menudo sólo considera un SNP a la vez y hace caso omiso de los efectos de los otros SNPs genotipo [5]. Por lo tanto, la progresión puede ser arduo de asociación estadística obtenida a través de GWAS a la causalidad inferida y las consecuencias funcionales para el cáncer. Otro reto en la genómica investigaciones a gran escala es que algunas de estas variantes, incluyendo los microsatélites han sido menos estudiados en comparación con los otros tipos (SNP) y la CNV. Además, muchos de estos estudios se centran en un tipo de variaciones genómicas en el cáncer; en consecuencia, el impacto de otros factores involucrados se descuidan.
El procedimiento común empleada en los estudios anteriores es la detección de variantes causales y la búsqueda de efectos funcionales de estas variantes, tales como asociación de variantes con loci de rasgos cuantitativos de expresión (eQTLs) [17]. Sin embargo, hay también una estrategia inversa comprende la predicción de posibles regiones de riesgo de cáncer compartidos a través de diferentes tipos de cáncer en base a los datos de expresión del transcriptoma y luego la búsqueda de variantes causales. La identificación de estas regiones ayuda en el descubrimiento de nuevas variantes así como el estudio simultáneo de diferentes factores que afectan a la expresión génica mediante la limitación de las evaluaciones a la región cromosómica específica. Aquí, hemos desarrollado una tubería que estaba compuesto de predicción PCSRs mediante el cálculo de los cambios en la transcripción de expresión bajo el cáncer para cada región cromosómica. También se extrajeron los ARNm comunes alterados y microRNAs utilizando microarrays y etiquetas de secuencias expresadas (EST) de datos siguientes mediante el análisis de redes para conseguir más puntos de vista sobre los PCSRs predichos. El uso de este oleoducto, que predijo regiones potenciales de riesgo que interactúan con el racimo de objetivos (ARNm, los miRNAs y /o TFS) que pongan de relieve los posibles-candidatos para futuros estudios de asociación del genoma.
Resultados
La expresión génica datos de varios tipos de cáncer se volvieron a analizar y los resultados se combinaron para predecir regiones comunes riesgo de cáncer. Otro objetivo de este estudio fue obtener una idea de interrelación entre PCSRs y mRNAs alterados, miRNAs y sus reguladores comunes. Una visión general del flujo de trabajo se muestra en la Figura 1.
Comprende el análisis de datos de expresión de diferentes tipos de cáncer humanos como el de mama, colorrectal, endometrial, gástrico, de hígado, de pulmón, de ovario, de páncreas, de próstata, testicular, de la vejiga, el intestino neuroendocrino, de cuello uterino y cáncer renal, así como el glioblastoma. Este análisis primario seguido de la extracción de genes alterados, contar las regiones cromosómicas de genes alterados y predicción de las regiones de riesgo basada en la frecuencia región.
Los resultados de los análisis de la expresión del transcrito para cada conjunto de datos incluyendo el cáncer de mama, colorrectal, endometrial, gástrico, de hígado, de pulmón, de ovario, de páncreas, de próstata, testicular, de vejiga, intestino neuroendocrino, cánceres de cuello uterino y renal, así como glioblastoma se presentan en la Tabla S1. Estos genes miARN y extraídos fueron utilizadas para su posterior análisis como se indica a continuación.
Predicción Regiones Cáncer-La susceptibilidad potenciales con los datos de microarrays de diferentes tipos de cáncer
El porcentaje de participación región se calculó para cada cromosoma (CHR) a partir de datos de microarrays (con umbral de cambios de 2 veces) de 11 HC. Los detalles del procedimiento se describen en materiales y métodos. Para cada cromosoma, cinco regiones que cubren la mayor frecuencia de los genes alterados se registraron como PCSRs potenciales (Tabla 1). Los resultados mostraron que entre estas PCSRs, dos regiones contienen el mayor número de genes sobre-expresados; chr1p31.2 (27,27%) y chr13q13.2 (20.45%) (Tabla 1, columnas 3 a 7). Mientras que en el caso de los genes expresados hacia abajo, el porcentaje más alto se registró en las regiones situadas en chr13q13 (15,53%) y 4q34.2 (15,15%).
Para probar la fiabilidad de los PCSRs predichos , el porcentaje de participación en el cáncer de región se calculó con diferente umbral, donde se identificaron las frecuencias de las primeras 200 probesets con más cambios veces para cada región (Tabla S2). Mientras, un gran número de estas regiones incluyendo 1q31.3, 2p25.2,3q25.2, 12p13.31 y 22q12.1 compartida en ambos umbrales (Tabla 1 y Tabla S2), algunas regiones se registraron como PCSR para una sola de estos umbrales. Por ejemplo 1p32.2 y 2q22.3 fueron identificados para el umbral de cambios de 2 veces, mientras que, 1p22.3 y 2p12 se registraron para los cambios veces más altos (Tabla 1 y Tabla S2).
Porcentaje del cromosoma también se calculó la participación de 11 HC, para identificar qué cromosoma (s) es más involucrados en los cambios de transcripción de expresión (Tabla S3). Los resultados mostraron que CHR4 está albergando el mayor número de genes alterados en el cáncer (con exclusión de próstata y cánceres gástricos) (Tabla S3). Por el contrario, chry tiene el menor número de genes expresados en el cáncer. Un resumen de la participación cromosómica de 11 HC muestra diferencias significativas, como se indica mediante la prueba de Chi-cuadrado General. Cuatro primeros cromosomas que albergan los genes más expresados abajo eran chrs 4, 5, 13 y X, mientras que en el caso de los genes sobre-expresados se registraron las cifras más altas de alteración de chrs 1, 7, 8 y 12 (Figura S1).
ARNm alterados compartidos a través de diferentes tipos de cáncer
ARNm expresados diferencialmente con los mayores cambios veces en al menos 6 HC fueron seleccionados como los ARNm alterados comunes (Tabla 2 y Tabla 3). Estos ARNm alterados comunes fueron clasificados en tres grupos diferentes de expresión. Clase I mostró sobre-expresión en la mayoría de tipos de cáncer, tales como la tubulina alfa 1b (TUBA1B) y deshidrogenasa de gliceraldehido-3-fosfato (GAPDH) (Tabla 2), clase II representada por la expresión en la mayoría de los HC tales como aspartoacilasa (ASPA) y quimiocinas (CXC motivo) ligando 12 (CXCL12) (Tabla 2), mientras que los restos (Clase III) mostró una mezcla de patrones de expresión en diferentes tipos de cáncer como el de la proteína quinasa (dependiente de cAMP, catalítica) inhibidor de beta (PKIB) ( Tabla 3).
Curiosamente, varios de los ARNm alterados comunes se encuentran en los PCSRs predichos (columna 3 de la Tabla 2 y Tabla 3). Por ejemplo, GAPDH en 12p13.31 (como PCSR predicho) mostró un exceso de expresión en todos los HC (Tabla 2). CKS2 (chr9q22.2), CEP55 (chr10q23.33), UHRF1 (chr19p13.3), RRM2 (chr2p25.1), AURKA (chr20q13.2), FLJ39632 (chr14q11.2), FAM83D (chr20q11.23), Nek2 (chr1q32.3) y MAD2L (chr4q27) se encuentran todos en PCSRs y mostraron sobreexpresión en las 9, 8, 10, 9, 8, 9, 9, 8 y 9 tipos de cáncer, respectivamente (Tabla 2 y la Tabla 3 ). Por el contrario, DCN (chr12q21.33), LIFR (chr5p13.1), ABCA8 (chr17q24.2), C7 (chr5p13.1) y ZEB2 (chr2q22.3) en PCSRs predichos se redujeron expresa en 9, 7, 8 , 8 y 8 tipos de cáncer, respectivamente (Tabla 2 y Tabla 3). El resto de los genes alterados en PCSRs exhibido tanto hacia abajo y de expresión de los patrones (Tabla 3).
MiRNAs alterados compartidos a través de diferentes tipos de cáncer
Existen varios tipos de miRNAs (como miR-93, mir -182, MIR-196b y MIR-1274b) mostraron sobreexpresión de mayoría de los cánceres (Tabla 3). Un número de miRNAs (como miR-30a y miR-30c-2) se redujeron expresa en diversas HC, mientras que muchos otros miRNAs mostró un patrón mixto de expresión (Tabla 4).
las localizaciones cromosómicas se determinaron para miRNAs alterados comunes. Curiosamente, miRNAs situados en la misma región mostraron co-expresión en algunos tipos de cáncer, tales como un grupo en 19q13.41 (incluyendo mir-99b y -125a). Este cluster (19q13.41) se había reducido expresa en cuello de útero, de próstata y cáncer renal. Por el contrario, el mismo grupo se sobre-expresa en cáncer de vejiga. Se observó otra agrupación co-expresada en 12p13.31 (MIR-MIR-141and 200c), que mostró un exceso de expresión en los cánceres de ovario, de próstata y vejiga, y por el contrario, que se redujeron expresado en el cáncer renal (Tabla 4). El resto de grupos de co-expresaron fueron listadas para las regiones en 6q13 (incluyendo MIR-MIR-30a y 30c-2), Xp11.23 (incluyendo miR-362, miR-500, miR-501, miR-502 y miR-532 ), 14q32.2 (incluyendo miR-134, miR-379 y miR-382), 14q32.31 (incluyendo miR-127, miR-432 y miR-770), 9q22.32 (incluyendo let-7d, mir-23b y miR-27b) y 7q22.1 (incluyendo miR-93 y miR-106b) (Tabla 3). Cinco de los nueve grupos miARN co-expresaron los enumerados anteriormente se encuentran en PCSRs predichos incluyendo 6q13, 12p13.31, 14q32.2, 19q13.41 y Xq26.2 (Tabla 4).
La interacción dentro y entre Común mRNAs y miRNAs alterados revela el análisis de la red
cuatro redes independientes fueron construidos incluyendo una red de ARNm alterados comunes (con 409 entidades y las relaciones 1288) (Figura S2), una red de ARNm alterados comunes ubicadas en los diferentes predicho PCSRs (con 383 entidades y 1121 las relaciones) (Figura S3), una red de miRNAs alterados comunes (con 322 entidades y 1041 las relaciones) (Figura S4) y una red de miRNAs alterados comunes ubicadas en los diferentes PCSRs (with123 entidades y 409 las relaciones ) (Figura S5). Además, una red combinada fue construido por integración de mRNAs alterados y datos miRNAs, que tiene 667 entidades y relaciones 2482 (Figura S6). Varios tipo de factores de transcripción, proteínas quinasas, moléculas pequeñas, mRNAs y miRNAs servir ya sea como reguladores validados o putativos en estas redes. Los detalles adicionales de cada red, incluyendo el número de genes importados y los procesos biológicos que se presentan en la Tabla S4.
Se identificaron las redes con los procesos biológicos similares, como el proceso celular, la regulación biológica, los procesos metabólicos, procesos del organismo multicelular, y el proceso de desarrollo respuesta al estímulo (Tabla S4 columna 5). Estos procesos compartidos implican la existencia de los genes miARN y comunes a través de diferentes redes construidas como se indica en la Tabla S5. Por ejemplo, homeobox de unión de zinc dedo caja E 2 (ZEB2), DEAD (Asp-Glu-Ala-Asp) Caja helicasa 5 (ddx5) y leucemia receptor alfa del factor inhibidor (LIFR) fueron compartidos entre ambas redes construidas de ARNm alterados comunes y miRNAs (Tabla S5). Entre los miRNAs alterados comunes, miR-21, miR-30a, miR-141 y miR-200c fueron compartidos a través de todas las cuatro redes construidas (Tabla S5).
La subred más frecuente observada en estas redes se centró en ddx5 (Figura 2). Esta subred comprende 5 entidades incluyendo ddx5, mir-20b, MIR-21, miR-141 y miR-182. Ddx5 está regulada negativamente por miR-20b y miR-141, mientras que la propia ddx5 regula miR-21 y miR-182. Abajo-expresión de ddx5 se observó en 7 tipos de HC, mientras que, mir-20b, MIR-21, miR-141 y miR-182 sobre-expresada en 3, 5, 3 y 4 HC, respectivamente (Tabla 3 y la Tabla 4 ). Se sugiere la interrelación negativa entre ddx5 y estas cuatro miRNAs.
Red está incluyendo miR-21, miR-182, -mir20b y miR-141. La red se construyó usando el software de estudio vía 9. La red fue montado sobre la base de la bioinformática y la literatura, combinado con la interpretación biológica de los datos de microarrays y grupos funcionales de ontología de genes enriquecidos. Rojo: las entidades sobre-regulada en la mayoría de los cánceres. Azul: entidades reducido regulado en la mayoría de los cánceres. representa reguladas negativo.
Otra subred se construyó sobre la base de miR-141, miR-200c, y GAPDH, que todas ellas situadas en PCSRs previstos en 12p13.31 (Figura 3). Esta red se compone de 17 entidades y 29 relaciones (Figura 3). Se observaron trece abajo objetivos de miR-141, miR-200c, y GAPDH. Por ejemplo, miR-141 y miR-200c, que estaban sobreexpresados en 3 HC (como se muestra en la Figura púrpura 3), tienen efectos sobre miARN ZEB2 (con los pies en la expresión de los HC 7). Curiosamente, estos ARN alterado incluyendo miR-141, miR-200c y GAPDH (en 12p13.31) y también ZEB2 (en 2q22.3) están ubicados en PCSRs predichos. En el caso de los nodos de aguas arriba, TP53 y MYC se observaron como reguladores corriente arriba de miR-200c y GAPDH (Figura 3). TP53 es positivo regulador común para ambas mir-200c y GAPDH, pero sólo se está regulando MYC GPADH (Figura 3).
Red se construyó usando el software de estudio vía 9. Más corto algoritmo de ruta se aplicó para la construcción de la red. La red fue montado sobre la base de la bioinformática y la literatura, combinado con la interpretación biológica de los datos de microarrays y grupos funcionales de ontología de genes enriquecidos. Púrpura: entidades sobre-regulada en la mayoría de los cánceres azules: las entidades reguladas por la mayoría de los cánceres. O-vértice representan TFS, representa positiva regulada, y representa negativa regulada.
Promotor análisis de los ARNm alterado y MiRNAs a través de diferentes tipos de cáncer
Los promotores de la sobre-expresada y abajo mRNAs y miRNAs expresadas se analizaron de forma individual a través de diferentes tipos de cáncer. Una lista de los factores de transcripción común para cada conjunto de abajo-expresados y sobreexpresados ARNm se proporcionan en las Tablas S6 y S7, respectivamente. Entre 18 TFS predicho comunes para los ARNm sobre-expresados, se encontró Kruppel Como Factor 4 (KLF4) situado en PCSRs estar abajo-expresados en 7 tipos de cánceres (Tabla S6). Si bien, de un total de 13 reguladores comunes predicho para los ARNm expresado hacia abajo, 6 reguladores se encuentran en PCSRs. Entre estos 6 reguladores receptor huérfano relacionados con RAR A (RORA) se redujo-8 se expresa en tipos de cánceres (Excepto que glioblastoma con sobre-expresión y ninguna expresión significativa en la próstata y gástrico) (Tabla S7).
reguladores comunes también se prevé para clúster de miRNAs alterados en la misma región (Tabla S8). Por ejemplo, GATA2, GATA3, ETS1, MZF1_1-4, SOX10, YY1, ZNF354C y SPI1 estaba previsto para miRNAs situados en clúster en Xp11.23 (Tabla S8). En total, 22 reguladores comunes se prevé para diferentes grupos de miRNAs los cuales ocho de ellos se encuentran en PCSRs incluyendo YY1, SPIB, SOX10, NFIC, NR4A2, FOXD1, NFATc2 y HOXA5 (Tabla S9). Curiosamente, GATA2 estaba prevista para ambos ARNm expresado abajo-miRNAs y alterados.
Discusión
Una tubería efectiva fue desarrollado para predecir PCSRs utilizando microarrays de datos de diferentes estudios sobre el cáncer. Dos umbrales diferentes se aplicaron para predecir PCSRs incluyendo probsets con cambios de al menos 2 veces y los 200 primeros probsets con los mayores cambios veces. La mayoría de los PCSRs previstos sobre cada cromosoma eran similares en ambos umbrales aplicados, que confirman la fiabilidad de estos PCSRs.
Además de esta confirmación, basado en revisión de la literatura encontramos la presencia de varias variantes importante asociada al cáncer en nuestros PCSRs predichos. Estas variantes se ha informado anteriormente para pancreático [4], [11] (6q13, 21q21.3, 5p13.1, 21q22.3 y 22q13.32), de pulmón [12] (6p21.32), de próstata [13], [14], [15] (9q31.2, 19q13.4, 8q24 y 17q21-q22), de ovario [10] (19p13), de mama [18] (8q24, 12p13 y 20q13) y el cáncer de colon [19] (11q23 , 8q24 y 18q21). Nuestros hallazgos de acuerdo con estos estudios identificados región 8q24 como una región de riesgo en variedad de HC [8], [14], [19], [20], [21], lo que demuestra la implicación de algunas de las regiones de riesgo en varios tipos de cánceres en lugar de un cáncer específico. Por otra parte, algunos de los PCSRs previstos en este estudio fueron reportados en otros tipos de enfermedades humanas, incluyendo el virus del herpes simple tipo 1 [22] (21q), el síndrome de ovario poliquístico [23] (9q33.3), la diabetes tipo 1 y la artritis reumatoide [ ,,,0],24] (ambos situados en 18p11). Esta similitud podría indicar la eficacia de nuestro enfoque en la predicción de las regiones de riesgo asociados con diferentes enfermedades humanas además del cáncer.
También se encontró que ocho cromosomas albergan los genes más alterados en diferentes tipos de cáncer, incluyendo los cromosomas 1, 4, 5, 7, 8, 12, 13 y X. Curiosamente, los cromosomas 1, 4 y 13 también se registraron como los cromosomas con el mayor porcentaje de PCSRs predichos, lo que sugiere la importancia del papel de estos cromosomas en la biología del cáncer. Basado en estos resultados y los que ya se ha informado en los cromosomas anormalidad [7], [25], [26], [27], se puede concluir que nuestra línea es capaz de predecir las regiones de riesgo, así como los cromosomas de riesgo en una variedad de enfermedades incluyendo el cáncer. Este gasoducto también se puede aplicar a las de crecimiento rápido (pero sigue siendo el número de limitados) conjuntos de datos de RNA-seq en futuros estudios.
El análisis de redes indica que ddx5, LIFR, ZEB2, miR-21, miR-27b, MIR -30, miR-141, miR-182 y miR-200c se comparten a través de diferentes redes construidas, acusando a su papel fundamental en la biología del cáncer y la progresión, que se ha informado anteriormente [28], [29], [30]. Por ejemplo, el potencial utilidad clínica de ddx5 y sus asociados (miRNAs miR-21 y miR-182) se sugieren como diana terapéutica en el cáncer de mama [29], [31]. Además, la aplicación clínica de los diferentes miRNAs en el cáncer, como let-7, miR-21 y miR-122 se discuten en reciente estudio de Nana-Sinkam y Croce [28].
Debido a que los miRNAs no funcionan de manera aislada [28], se analizó el conjunto de miRNAs en mismas regiones para entender la contribución relativa de varios miRNAs en lugar de miARN individual. Co-expresión de diferentes genes miARN implica la presencia de reguladores de la transcripción comunes y /o variantes causales comunes para estas regiones. También se ha informado previamente de que los módulos comunes sobre los promotores pueden causar la co-expresión de los genes [32].
Hemos encontrado que diferentes reguladores comunes para mRNAs y miRNAs alterados, incluyendo, KLF4 (en 9q31.2) y RORA (15q22.2) estaban en las PCSRs predichos. Estos dos TFS mediar un conjunto de genes del ciclo celular y exposiciones ambas funciones supresoras de tumores oncogénicos y [33], [34]. Curiosamente, se observó abajo-expresión de miR-30c-2 (en 6q13), así como sobre-expresión de GATA3 a través de diferentes tipos de HC en este estudio, que confirman la regulación de los MIR-30c-2 a través de GATA3. Bockhorn y collogues demostrado recientemente que el miR-30c está regulado transcripcionalmente con GATA3 [35].
Presencia de otro nivel de interrelación entre las regiones de riesgo de cáncer se sugirió, en donde los ARNm y sus reguladores comunes a diferentes interactúan entre PCSRs otros, así como sus objetivos. La subred centrado en ddx5 con total de 5 nodos y 4 relaciones (Figura 2) y la subred de GAPDH, miR-141 y miR-200c confirmen dichas interacciones (Figura 3). En estas subredes, diferentes ARN se encuentran en PCSRs incluyendo GAPDH, ZEB2, mir-20b, MIR-21, miR-141 y miR-200c de soporte de los efectos importantes de estos ARN y sus regiones en el cáncer.
Subred centrada en ddx5 se comparte a través de redes construidas para los ARNm alterados y miRNAs en diferentes tipos de cáncer. Ddx5 RNA helicasa (también conocido como p68) está involucrado en el metabolismo del RNA y sirve como un co-transcripcional regulador y ha sido reportado como regulador de miR-182 en el cáncer de mama [29]. asociación significativa ha sido también reportada entre rs1991401 ddx5 (OP = 7,90 × 10-5) y malignas del tumor periférico vaina del nervio [36]. Nuestros resultados mostraron que hasta la regulación de miR-20b y miR-141 regula hacia abajo ddx5.
Segunda subred (Figura 3) contenía GAPDH, miR-141 y miR-200c que se encuentra en 12p13.31 como PCSRs predichos . Se observó amplificación de 12p13 región en cáncer de mama [37], linfomas de células T y la leucemia linfocítica [38], [39], haciendo que la sobre expresión de GAPDH, miR-141 y -200C. aguas arriba reguladores pueden involucrar en la regulación de estos ARN y un efecto positivo se ha informado de TP53 se encuentra en la región aguas arriba de GAPDH [40]. Además, Yoshihara et al [41] informó de algunos CNV cáncer de ovario única esporádicos en 12p13.31. En general, estos informes en combinación con nuestro
In silico resultados
indicar el papel crucial de 12p13.31 en HC.
Curiosamente, algunos otros ARN comunes entre los cánceres en este informe, se observan en estudios previos de tumores y otras enfermedades [16], [42]. Por ejemplo, la presencia de sinónimo SNP (rs12948217) que afectan el sitio de empalme potenciadores exonic cerca ASPA ha informado para la enfermedad neurodegenerativa [43]. La pérdida de las regiones incluidas 14q32.2 (ubicación de miR-127, miR-432 y miR-770) y 14q32.31 (MIR-134, miR-379 y miR-382) fueron reportados en estudios previos de cáncer renal y osteosarcoma [16], [44]. En nuestro estudio, mirRNAs encuentran en 14q32.2 y 14q32.31 mostraron abajo-expresión en varios tipos de cáncer, lo que implica abajo-expresión de miRNAs siguientes pérdida de cromosomas en estas regiones.
En conclusión, predijo PCSRs en el presente estudio abre nueva vía en estudios de asociación del genoma para encontrar diferentes tipos de variantes del cáncer-causales. Desde múltiples variaciones acumuladas en un gen o un grupo de genes pueden contribuir al fenotipo, el estudio de diferentes tipos de variaciones o mecanismos de regulación durante un gen, o grupo de genes región específica puede ser una herramienta útil para mejorar la detección de la asociación. Los ARN alterado comunes identificados en PCSRs en nuestras redes construidas tienen un gran potencial para ser utilizado para la búsqueda de SNPs asociados, CNV y /o SSR cerca de estos genes. Además, estos resultados sugieren el potencial de la nueva terapia de cáncer (en vez de basada en los genes) a base de regulador con el fin de restaurar el clúster interrumpido de ARNm y /o miRNAs. En general, nuestra tubería puede ser utilizado con eficacia para predecir las regiones de riesgo de cáncer y cromosomas riesgo de cáncer.
Métodos
Análisis de los datos de expresión
p>
La pantalla digital diferencial (DDD) de la herramienta (http://www.ncbi.nlm.nih.gov/UniGene/ddd.cgi) se utilizó para detectar los genes relacionados con el cáncer en diferentes HC. EST bibliotecas seleccionadas para las comparaciones DDD de diferentes tejidos (vs cáncer de lo normal) se enumeran en la Tabla S11. Los Grupos A y B fueron asignados para las bibliotecas normales y cancerosas en cada cáncer, respectivamente. La salida proporciona un valor numérico en cada grupo que denota la fracción de secuencias dentro de la piscina que asigna a la UniGene cluster. éxitos estadísticamente significativas (prueba exacta de Fisher) que muestran & gt; se compilaron diferencias de 10 veces, y se creó una base de datos preliminar. Doblez diferencias se calcularon utilizando la relación de la agrupación B /grupo A, de acuerdo al método descrito previamente [45].
Entre probsets con los cambios veces más altos, los ARNm alterados comunes y miRNAs (por lo menos en 6 de cada 11 HC) se extrajeron usando herramientas DDD junto con microarrays de datos. Estos ARN alterado después comunes utilizados para las construcciones de la red.
Detección de Cáncer-compartidos susceptibilidad regiones
El número de genes expresados diferencialmente fueron contados para cada región (como la frecuencia de la región) utilizando un filtro en house script en python desarrollado (script en python, está disponible en script S1). La frecuencia de la región implicada en la expresión se calculó para probsets con los cambios, al menos, 2-simétricas veces (Tabla S12) y 200 primeros probsets con los cambios veces más altas (Tabla S13). A continuación para cada región, el porcentaje de participación de la región en probsets expresados diferencialmente en los 11 tipos de HC se calculó utilizando ecuaciones siguientes: donde por es la frecuencia de la región para sobreexpresados probsets (suma de 11 HC), n es el número de cánceres (en este caso es 11) y FTP es la frecuencia de la región para probsets totales (Tabla S14 y S15) .¿Dónde FDR es la frecuencia de la región para probsets expresado abajo-(suma de 11 HC), n es el número de cánceres (en este caso es 11 ) y FTP es la frecuencia de región para probsets totales (Tabla S14 y S15). . Finalmente, se seleccionaron cinco regiones con el índice más alto como posibles zonas de riesgo de cáncer para cada cromosoma
Además, el porcentaje de participación en el cromosoma probsets expresados diferencialmente un total de 11 HC se calculó utilizando ecuaciones siguientes: ¿Dónde está FOC la frecuencia del cromosoma para sobreexpresados probsets (suma de 11 HCS), n es el número de cánceres (aquí es 11) y FCTP es la frecuencia del cromosoma para probsets totales (Tabla S16) .¿Dónde FDC es la frecuencia del cromosoma para down-expresada (suma de 11 HC), n es el número de tipos de cáncer (en este caso es 11) y FCTP es la frecuencia del cromosoma para probsets totales (Tabla S16). Por otra parte, los porcentajes de participación de cada cromosoma cáncer (Tabla S17) se calcularon utilizando la fracción de la frecuencia para el cromosoma probsets alterados en la frecuencia de cromosomas para probsets totales (Tabla S17). Las diferencias de los cromosomas se investigaron basan en general test de chi cuadrado.
Construcción de Redes de ARNm alterados comunes y MiRNAs
Pathway Studio 9 software (Ariadna Genómica, Rockville, MD) se utilizó para construir redes diferentes. Pathway Studio utiliza la base de datos RESNET Mamífero, que es una vía completa y base de datos de interacción molecular [46]. Esta base de datos incluye nuevos alias para los genes humanos, miRNAs y entradas de otros mamíferos. El algoritmo del camino más corto se utilizó para construir cuatro redes diferentes en función de los ARNm y miRNAs [47] alterados. Cinco redes se construyeron en los ARN alterado comunes, incluyendo la red de ARNm comúnmente alterados, la red de ARNm comúnmente alterados en PCSRs, la red de miRNAs comúnmente alterados, la red de miRNAs comúnmente alterados en PCSRs y la red integradora de los ARNm alterados comunes y miRNAs. El proceso biológico de cada red se identificó utilizando la suite DAVID (http://david.abcc.ncifcrf.gov/tools.jsp) de herramientas bioinformáticas. DAVID recursos bioinformáticos se compone de un sistema integrado de la base de conocimientos analíticos y herramientas biológicas destinadas a la extracción sistemática significado biológico de las grandes listas de genes /proteínas [48].
Promotor análisis de ARN alterados
Promotor análisis se llevó a cabo para ARNm co-expresó a través de diferentes tipos de cáncer utilizando pscan [49]. Los factores de transcripción (TFS) se predijo en las regiones promotoras (-1 kb a 0) de los ARNm utilizando la base de datos Jaspar (TFS con valor de p & lt; se seleccionaron 0,1). En el caso de miRNAs, reguladores comunes se prevé para miRNAs alterados en una misma región utilizando herramienta web Jaspar (http://jaspar.genereg.net/). TFS se predijo en las regiones promotoras putativas (-3 kb a 1 kb) de microARN con el umbral de puntuación de perfil relativa al menos el 99%. Expresión de TFS predicho se determinó utilizando los datos de transcripción de expresión-microarray de 11 diferentes tipos de cáncer incluyendo cáncer de mama, colorrectal, endometrial, gástrico, de hígado, de pulmón, de ovario, de páncreas, de próstata, testicular, de vejiga, neuroendocrino intestino, cervical y cáncer renal, así como glioblastoma .
Apoyo a la Información
Figura S1.
Porcentaje de participación en la expresión génica del cromosoma
doi:. 10.1371 /journal.pone.0096320.s001 gratis (PDF)
figura S2.