Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Análisis Integral de ARN normal largo intergénicas no codificantes en la próstata Cancer

PLOS ONE: Análisis Integral de ARN normal largo intergénicas no codificantes en la próstata Cancer


Extracto

Recientemente, un gran número de tejidos humanos normales se han perfilado para los ARN no codificantes y más de catorce mil larga no intergénica ARN -coding (lincRNAs) se encuentran expresados ​​en tejidos humanos normales. Todavía no se han establecido los roles funcionales de estos lincRNAs normales (nlincRNAs) en la regulación de los genes de codificación de proteínas en la biología normal y la enfermedad. Aquí, hemos perfilado dos conjuntos de datos de RNA-seq incluyendo cáncer y emparejaron los tejidos no neoplásicos de 12 personas de diversa demografía para ambos genes de codificación y nlincRNAs. Encontramos 130 nlincRNAs regulados de manera significativa en el cáncer, con 127 regulados en la misma dirección en los dos conjuntos de datos. Curiosamente, según Illumina Body Mapa, un número significativo de estos nlincRNAs muestran expresión nula línea de base en los tejidos normales de la próstata pero son específicos de otros tejidos tales como tiroides, riñón, hígado y testículos. Un número de la nlincRNAs regulados loci compartir con codificación de los genes, que pueden ser co-regulados o en sentido opuesto regulado en todas las muestras de cáncer estudiados aquí. Por ejemplo, en todas las muestras de cáncer de i) la nlincRNA, TCONS_00029157, y un factor supresor de tumores vecino, SIK1, son a la vez hacia abajo regulada; ii) varios nlincRNAs-tiroideos específica en la zona de la TPO-gen específico de la tiroides, son a la vez hasta reguladas; y iii) la TCONS_00010581, una isoforma de HEIH, es el regulado mientras que el gen EZH2 vecino es hasta reguladas en el cáncer. Varios nlincRNAs de un locus cromosómico asociado cáncer de próstata, 8q24, están regulados en el cáncer junto con otros genes asociados con cáncer de próstata conocido incluyendo PCAT-1, PVT1, y PCAT-92. Observamos que hay un sesgo significativo hacia la regulación de nlincRNAs con tan alto como 118 de 127 hasta reguladas en el cáncer, a pesar de que la regulación de los genes que codifican está sesgada hacia la baja regulación. Teniendo en cuenta que todos los asociados con el cáncer lincRNAs reportados (clincRNAs) están sesgadas hacia la regulación, llegamos a la conclusión de que este sesgo puede ser funcionalmente relevante

Visto:. Bawa P, S Zackaria, Verma M, S Gupta, Srivatsan R, Chaudhary B, et al. (2015) Análisis Integral del ARN normal largo intergénicas no codificantes en el cáncer de próstata. PLoS ONE 10 (5): e0122143. doi: 10.1371 /journal.pone.0122143

Editor Académico: Xia Li, de la Universidad Médica de Harbin, China

Recibido: 13 Noviembre 2014; Aceptado: 10 Febrero 2015; Publicado: May 1, 2015

Derechos de Autor © 2015 Bawa et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Disponibilidad de datos: Todos los datos relevantes están dentro del apoyo de sus archivos de información en papel y

Financiación:. Este estudio fue financiado por el Departamento de Biotecnología del Gobierno de la India; Departamento de Tecnología de la Información, Gobierno de la India; DST-puño, Gobierno de la India; y el Departamento de Tecnología de la Información, Gobierno de Karnataka. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

la promesa del Proyecto del Genoma humano era entregar cientos de miles de proteínas para su uso como dianas farmacológicas. Sin embargo, para sorpresa de todos, los esfuerzos de anotación a gran escala por parte de grandes consorcios, como el proyecto ENCODE [1], decenas de miles de dianas de medicamentos de un tipo diferente entregados; ARN no codificante. Ahora se sabe que la mayoría del genoma humano se transcribe a pesar de que sólo una pequeña fracción se traduce en proteínas. Ahora se entiende que un gran número de los ARN no codificante, tanto a largo y corto, juegan un papel crítico en la compleja regulación de la relativamente pequeña cantidad de proteínas que son esenciales para la vida de codificación.

De los diversos tipos de los ARN no codificantes, ARN largos no codificantes intergénicas (lincRNA) son atractivos debido a que pueden ser fácilmente descubiertos con alta confianza de conjuntos de datos de RNA-seq existentes y correlacionados con información de la expresión génica del mismo conjunto de datos utilizando herramientas bioinformáticas existentes. Más recientemente, decenas de miles de lincRNAs han sido descubiertos a partir de conjuntos de datos de RNA-seq de diversos tejidos humanos normales, aquí se hace referencia a nlincRNAs, tales como la iluminación mapa de Administración [2]. Todavía no se han establecido los roles funcionales de estos nlincRNAs.

A pesar de que lincRNAs son nuevos en la biología del cáncer y sus mecanismos moleculares aún en su infancia, varios artículos de revisión ya han aparecido en la literatura recoge los avances en este área hasta la fecha [3] [4]. De los aproximadamente 60 + lincRNAs que han demostrado estar asociado con varios tipos de cáncer, la mayoría de ellos están regulados en el cáncer [3] [4] y sólo unos pocos lincRNAs se demuestra que son las reguladas en muestras de cáncer incluyendo GAS5 [5] y MEG3 [6].

Los informes recientes que vinculan los niveles de expresión de lincRNA con cáncer ofrecen una excelente oportunidad para establecer papel funcional de lincRNAs en la regulación de la expresión génica. Uno de la búsqueda más exhaustiva para lincRNAs asociados con el cáncer de próstata incluyen, la identificación de 121 lincRNAs, llamados PCATS (cáncer de próstata asociados transcripciones) descubiertos de 102 enfermedades tejidos de la próstata estratificados y líneas celulares [7]. De estos, se muestra PCAT-1 inhibición con siRNA para reducir la proliferación de celllines que expresan altos niveles de PCAT-1. Desde la publicación de este informe, PCAT-1 sobreexpresión se ha demostrado que es un biomarcador de cáncer colorrectal [8]. Más recientemente, lincRNAs a partir de datos de RNA-seq de un gran número de muestras de cáncer de pulmón desde el repositorio público ha sido utilizado para identificar el cáncer de pulmón 111 lincRNAs asociado, llamados LCALs [9]. El sesgo de lincRNAs hacia la regulación en el cáncer requiere de interrogatorios.

Es tentador concluir que la tendencia hacia la sobre regulación de lincRNAs en el cáncer, en los esfuerzos a gran escala antes citada, mayo resultados de la práctica de descubrir lincRNAs de muestras de cáncer. Aquí, nuestro objetivo ha sido realizar un análisis integrador de ambos codificación y nlincRNAs no codificantes (lincRNAs descubiertos a partir de tejidos humanos normales) a través de múltiples conjuntos de datos de RNA-seq con respecto al cáncer de próstata desde el repositorio público tanto a la dirección de este sesgo y descubrir nuevos corregulación de los genes y nlincRNAs.

Materiales y Métodos

Conjuntos de datos utilizados

Hemos utilizado dos conjuntos de datos de RNA-seq de NCBI repositorio público generado por dos grupos independientes con identificadores de adhesión de SRP002628 y ERP000550. Como se muestra en la Tabla 1, 5 pares-tumorales normales de SRP002628 y 7 de ERP000550 conjuntos de datos se consideran en este estudio, ya sea porque los pares correspondientes no estaban disponibles para algunos individuos o la profundidad de secuenciación no eran compatibles para obtener buenas estadísticas. Estos dos conjuntos de datos son de dos diversos grupos demográficos. Por ejemplo, los pacientes seleccionados para generar datos dentro de la ERP000550 adhesión son de origen chino y, a pesar de la demografía de los pacientes en el conjunto de datos SRP002628 no se conoce, es seguro asumir que los individuos considerados para generar datos dentro de la SRP002628 adhesión no son chinos . La tabla 1 muestra la profundidad, los ID de adhesión individuales y los porcentajes de asignación para cada muestra en estos conjuntos de datos.

Para los perfiles de conocidos y nuevos lincRNAs utilizamos GENCODE (http://www.gencodegenes.org/) y lincRNA-catálogo (http://www.broadinstitute.org/genome_bio/human_lincrnas/?q=lincRNA_catalog). También para el análisis de la expresión génica se ha utilizado el explorador de tablas a partir de la URL https://genome.ucsc.edu/cgi-bin/hgTables para hg19 con pista como genes RefSeq y formato de salida como CAMA.

En la línea de base expresión del gen de codificación de datos que hemos utilizado tanto e-MTAB-513 con 16 y e-MTAB-1733 con 27 tejidos humanos normales a partir de expresión Atlas bajo ArrayExpress. En este estudio hemos utilizado un valor FPKM de menos de 0,5 para realizar llamadas de línea de base y el valor nulo FPKM de más de 100 llamarlos específica de tejido.

Método utilizado para calcular la expresión del transcrito

conjuntos de datos seleccionados fueron asignadas a genoma de referencia hg19 usando Bowtie [10] con el porcentaje mapeadas muestran en la Tabla 1. para las lecturas bajo la SRP002628 la adhesión de toda la longitud de las lecturas, que es 36mer, fueron asignadas. Sin embargo, para leer bajo ERP000550 25 bases fueron recortados de ambos extremos de las lecturas de la longitud 90 que conduce a la cartografía de 40mers desde el centro. La herramienta de coverageBed BEDTools se utiliza para extraer un número determinado por la transcripción por muestra usando los archivos de anotación y lincRNA-catálogo mencionados en el apartado anterior. Estos archivos Conteo de individuos se recopilaron en una tabla con filas que representan transcripciones.

computación expresión diferencial

Para el cálculo de la expresión diferencial se seleccionaron dos paquetes R basados ​​en recuento ampliamente utilizados, bordeadora [11] y DESeq [12]. Aunque estos dos métodos son muy similares que difieren en el uso de la dispersión. La bordeadora paquete utiliza solo factor de dispersión común en contraposición a una estimación de la varianza flexible utilizado por el DESeq paquete. La distinción importante de bordeadora es que es anti-conservador de genes expresados ​​bajo y más conservador para los genes altamente expresados. En tanto que, el modelo de dispersión flexible utilizado por DESeq permite una menor sesgo en la selección de los genes sobre la base de sus niveles de expresión. Este DESeq camino y bordeadora se complementan entre sí en la selección de genes expresados ​​diferencialmente. En otras palabras bordeadora es más sensible a los valores atípicos donde como DESeq es menos sensible a los valores atípicos, pero proporciona resultados sin prejuicios a través del rango dinámico [13].

DESeq y bordeadora tanto acepta un archivo recuento cotejada como entrada y producen una sola p -valor log factor de cambio por transcripción por el conjunto de datos que representa el estado general de la expresión diferencial de las transcripciones en el archivo de anotación entre dos estados dados, tumor y los tejidos no neoplásicos emparejados. Para obtener transcripciones específicos de cáncer que son estadísticamente significativa se utilizó un p-valor de corte de menos de 0,05 y un ABS (registro de cambios a la base 2 veces) superior a 1,0 para los genes y mayor que 0,59 para nlincRNAs codificación. La variación en los criterios de filtrado elegidos para el cambio veces es reflejar los niveles relativamente bajos de expresión en comparación con nlincRNA codificación de los genes descritos en la literatura [2].

La agrupación heatmap

Para la generación de mapas de calor que utilizó la correlación de Pearson y Coeficiente de dendrogramas que utiliza la distancia euclidiana usando 'pheatmap' y 'funciones' de hclust paquete estadístico R, respectivamente. Con el fin de producir mapas de calor para las muestras a través de conjuntos de datos normalización adicional que se requería para dar cuenta de la variación en la dispersión en los niveles de expresión de genes entre los conjuntos de datos procedentes de diferentes protocolos de preparación de muestras utilizadas por diferentes investigadores. Aunque los valores se calculan RPKM para normalizar los niveles de expresión a través de muestras, esta normalización es suficiente para explicar la variación en el protocolo de preparación de la muestra. Normalizar por filas, lo que representa transcripciones, entre los conjuntos de datos dividiéndolos por fila media se utiliza para manejar la dispersión diferencial entre los dos conjuntos de datos derivados de la variación en los protocolos de preparación de muestras. Este enfoque ya ha sido implementado en el paquete DESeq para las muestras dentro de un determinado conjunto de datos [12].

Validación de los conjuntos de datos

Para demostrar que los dos conjuntos de datos seleccionados son adecuados para el perfil de los ARN no codificantes , los niveles de expresión de lincRNAs conocidos, que se presentan como implicado en el cáncer, se han perfilado a través de los dos conjuntos de datos de RNA-Seq seleccionados para este estudio. Hemos identificado que varios de cáncer de próstata lincRNAs asociados están reguladas de forma específica del tumor tanto en estos conjuntos de datos. Por ejemplo, PCAT-1, un lincRNA cáncer de próstata asociado desde el locus del gen-desierto en el cromosoma 8q24 es significativamente hasta reguladas en todas las muestras tumorales de ambos conjuntos de datos en comparación con los tejidos no neoplásicas adyacentes. Varios otros próstata y otros lincRNAs específicos de cáncer, tales como PVT1, PCA3, CCAT-1 PCAT-92, PCAT-114, PCAT-120, PCAT-19, PCAT-27, PCAT38, PCAT-39, PCAT-43, PCAT -59, PCAT-72, PCAT-80, y PCAT-83 son también resultaron ser hasta reguladas en ambos conjuntos de datos de una manera específica del cáncer. Estos hallazgos, no sólo certifica el uso de estos dos conjuntos de datos de perfiles de nlincRNA pero proporcionan una validación adicional para estos lincRNAs de nuevo cuño en el cáncer de próstata.

Gene Red

red de genes en este manuscrito es creada por GeneMANIA, un paquete bajo Cytoscape [14].

resultados y Discusión

codificación de los genes de perfiles

perfiles de expresión génica de los dos conjuntos de datos de RNA-seq, SRP002628 [15] y ERP000550 [16], se realizaron mediante dos paquetes de análisis estadístico comúnmente usados ​​R, bordeadora [11] y DESeq [12]. Los genes con valores de p de menos de 0,05 y absolutos cambios veces log (base 2) mayor que 1,0 se utilizan para hacer una llamada de que un gen está regulada en cáncer de próstata. Convergiendo número de genes regulados significativamente en cada etapa de la tubería de análisis se presenta en la figura 1. El uso de bordeadora, 4449 y 5034 transcripciones se encuentran regulados diferencialmente entre los dos conjuntos de datos, y SRP002628 ERP000550 respectivamente. De estos, 1358 transcripciones que representan 786 genes regulados se encuentran comúnmente entre los dos conjuntos de datos con 302 genes regulados y 455 genes regulados hacia abajo en el cáncer. Curiosamente, sólo 29 genes mostraron patrón de expresión opuesta en los dos conjuntos de datos. Del mismo modo, se identifican utilizando el paquete DESeq 2942 y 4260 transcripciones como diferencialmente regulada en el cáncer de próstata a partir de los dos conjuntos de datos, y SRP002628 ERP000550 respectivamente. Los 881 transcripciones comunes representan 497 genes, que están reguladas en el cáncer de próstata con 180 genes actualizaciones y 313 genes regulados hacia abajo. Una vez más, sólo 4 genes muestran la regulación opuesta en los dos conjuntos de datos basado en la tubería DESeq.

La lista de genes expresados ​​diferencialmente (DEGs) a partir de los dos conjuntos de datos utilizando los dos métodos, bordeadora y DESeq, aparece en la Tabla S1, que contiene 366 genes que codifican con 117 y 249 arriba las reguladas en el cáncer de próstata. Curiosamente, a excepción de un solo gen, todos están regulados en la misma dirección en ambos conjuntos de datos de cáncer (Fig 2). En la figura 2, también se muestra que los valores RPKM normalizado de fila-sabia de los dos conjuntos de datos para todos los 366 DEGs, racimos todo el 12 cáncer y 12 muestras normales en dos clados. También se muestran en la figura 2, son la agrupación de cinco muestras adicionales de la ERR000550 adhesión, no se utiliza en la extracción de la firma, en los respectivos clados.

estudios de genes de enriquecimiento de los 366 genes sugiere la inactivación de los genes en ambos 17q21 y 19q13 loci, que están reportados como tanto la susceptibilidad al cáncer de próstata loci [17], [18], [19]. Fig 3 muestra la red de genes para loci 17q21 y 19q13. Curiosamente, los genes inactivados en 17q21, incluyendo KRT15, ​​ITGA, AOC3, HOXB3, Rnd2, SGCA, WFKKN2, ARHGAP27, NGF, y NOG, están implicados en la interacción célula-célula, la reorganización del citoesqueleto, extra-celular de matriz y muerte celular; falta de lo que podría convencer a la transformación del epitelio mesenquimal y la migración.

Perfiles nlincRNAs

Un total de catorce mil trescientos cincuenta y tres (14.353) lincRNAs, referido aquí como nlincRNAs, se ha informado que se expresa en diversos tejidos humanos normales [2]. Fuera de estos, hay 9.600 nlincRNAs que muestran muy baja evidencia de transcripción en la próstata normal y tan bajas como 196 nlincRNAs son reportados como específica a los tejidos de la próstata.

Como se muestra en la figura 1, utilizando bordeadora, 1140 (773 y 367 el regulado) y 1702 (1258 arriba y hacia abajo reguladas 444) nlincRNAs se encuentran regulados diferencialmente entre los dos conjuntos de datos, y SRP002628 ERP000550, respectivamente. De estos, 316 nlincRNAs (252 y 42) están regulados por frecuencia en el cáncer de próstata en ambos conjuntos de datos. Un análisis similar utilizando tubería DESeq dio lugar a 576 (383 y 193 hacia abajo) y 988 (867 y 121 hacia abajo) nlincRNAs regulados en el cáncer de próstata en ambos conjuntos de datos, y SRP002628 ERP000550, respectivamente. El número de nlincRNAs comúnmente regulados diferencialmente en ambos conjuntos de datos utilizando el paquete DESeq es de 135 con 124 hacia arriba y hacia abajo 9-regulada en el cáncer.

El número de nlincRNAs que se encuentran regulados diferencialmente en el cáncer en ambos conjuntos de datos utilizando tanto bordeadora y métodos DESeq, es de 130 a 118 arriba, abajo 9 y tan bajas como 3 opuesta regulado. La figura 4 muestra el mapa de calor de los 127 nlincRNAs, enumerados en la Tabla S2, que son regulados diferencialmente en el cáncer. Con la excepción de C13_5, uno de la muestra de cáncer de SRP002628 adhesión, los 127 nlincRNAs permiten la agrupación de todo el cáncer y muestras normales en los respectivos clados. Utilizando el análisis de componentes principales, que se muestra en la figura 4, se confirma que es más normal C13_5 similar.

De los 127 nlincRNAs regulados diferencialmente, 58 tienen expresión basal nula en el tejido normal de próstata de acuerdo tanto los esfuerzos internos y el informe del Instituto Broad [2]. De estos nlincRNAs, muchos son prueba específica y un número de ellos son de la tiroides-específica. Como se muestra en la Tabla S2, perfiles de estos nlincRNAs de próstata líneas celulares de conjunto de datos de RNA-seq por los identificadores de adhesión de SRP004637 [7], revelan que 12 de los 58 visualización de expresiones significativa en una o más de las tres celllines próstata. Esta tendencia se observa en el cáncer de próstata asociado genes de codificación tales como EZH2 [20], que es diferencialmente regulados hasta en muestras de cáncer de ambos conjuntos de datos muestran la línea de base expresión nula en la próstata. Además, como se muestra en S3 Tabla, muchos informaron de cáncer de próstata lincRNAs asociado, como PCAT-1, PCA3, PCAT-92, PCAT-114, PCAT-120-PCAT-27, PCAT-38, PCAT43, PCAT72, y PCAT-80 [7], que también son diferencialmente regulados hasta en cáncer en ambos conjuntos de datos, no tiene nlincRNAs superpuestos de acuerdo pistas UCSC.

Hay muchos nlincRNAs del cromosoma 8q24 locus, que se enumeran en la Tabla 2, que se expresan en la normalidad tejidos humanos. Mientras que un número de exones compartir nlincRNAs con lincRNAs conocidos, tales como PVT1 y CCAT1, varios otros incluyendo TCONS_00014535 (BC042052, CASC11), TCONS_00015171 (BC106081), TCONS_00015167 (PCAT2), TCONS_00015170 y TCONS_00015168 (JX003871), TCONS_00015498, TCONS_00015165 y TCONS_00015166 se nuevos nlincRNAs que son diferencialmente regulados hasta en el cáncer de próstata en al menos uno de los dos conjuntos de datos utilizados en este estudio. Una vez más, muchos de ellos son específicos de los testículos y el hígado y no se expresan en la próstata normal.

Co-regulación de los genes vecinos y lincRNAs

Como se muestra en la Figura 5, 15 diferencialmente nlincRNAs regulados de los 127 son cerca de 12 genes regulados diferencialmente en diferentes cromosomas. Tabla 3 proporciona significado de nlincRNAs y su gen de codificación respectivo. Por ejemplo, el nlincRNA, TCONS_00029157, y un conocido factor supresor de tumores, SIK1, son tanto las reguladas en todas las muestras de cáncer. SIK1 expresión reducida se correlaciona con mal pronóstico en dos grandes conjuntos de datos de cáncer de mama humano y está vinculada con la anoikis dependientes de p53 que pueden tenerse en tumerogenesis [21].

El-tiroides específica gen TPO es hasta reguladas en el cáncer de próstata, junto con unos pocos nlincRNAs-tiroideos específica, TCONS_00004663-4666 y TCONS_00004668-4669. TPO es uno de los genes conocidos por estar asociados con el estrés oxidativo. Se ha demostrado que epitelial lente factor de crecimiento derivado p75 (LEDGF) en PC3, los resultados en el cambio en la expresión de TPO [22]. Este cambio es probable que desempeñe un papel protector contra el estrés oxidativo y los fármacos quimioterapéuticos.

TCONS_00010581, una isoforma de HEIH, que se sabe que es hasta reguladas en el carcinoma hepatocelular [23], se encuentra en la proximidad de la gen EZH2 del complejo polycomb-2 [24] el gen EZH2 también se encuentra regulada hasta en todas las muestras de cáncer en comparación con los tejidos no tumorales adyacentes en ambos conjuntos de datos.

Un nlincRNA prueba específica, TCON_00025002, es en el barrio de la TOX3 gen en el cromosoma 16, que son a la vez hasta reguladas de forma específica por cáncer en nuestro estudio. TOX3 es una proteína de alta caja de la motilidad grupo involucrado en la mediación de la transcripción dependiente de calcio. TOX3 asigna a la conocida locus de susceptibilidad al cáncer de mama triple negativo; una mutación en este locus en implicado en el desarrollo del cáncer de mama [25]. A SNP en el gen TOX3 también está implicado en páncreas [26] y el cáncer de pulmón [27].

nlincRNAs específico de la próstata, y TCONS_00017728 TCONS_00010086, se encuentra que son en la proximidad de GATA3 y ADAMTS19 genes respectivamente. Los cuatro, incluyendo el nlincRNAs y los genes, están regulados hacia abajo de una manera específica del cáncer en este estudio. GATA3 es un importante factor de transcripción que se sabe están implicados en la regulación de andrógenos de gen PSA [28]. Un patrón de metilación global en el cáncer de próstata independiente de andrógenos sensible y andrógenos muestra una diferencia significativa en el patrón de metilación en GATA3 bajo estas dos condiciones [29]. biopsias de tumores y varias líneas celulares de cáncer tienen mostrarán altos niveles de expresión de ADAMTS19 en osteosarcomas [30].

Unos nlincRNAs específicas del hígado, TCONS_00014531, TCONS_00015169 y TCONS_000015171, son todos hasta reguladas en el cáncer de próstata en este estudio junto con la POU5F1 pseudogene vecina, que está adyacente a MYC locus en el principal locus de susceptibilidad al cáncer de próstata en 8q24 [31]. Otra TCONS_00016903 específica del hígado se yuxtapone al gen EGFL7, tanto registra como las reguladas en nuestro análisis. Contrariamente a nuestros resultados EGFL7 se ha demostrado que tienen una expresión elevada en diversos tipos de cáncer incluyendo cáncer de pulmón, cáncer de mama, cáncer de próstata y carcinoma hepatocelular [32]. Sin embargo, ha habido un informe de un microARN, miR-126, que se encuentra dentro del intrón del EGFL7, que se muestra que las reguladas en líneas celulares de cáncer de vejiga y en la primaria y los tumores de próstata [33].

Entre las más interesantes nlincRNAs, TCONS_00028940, en el barrio del gen TMPRSS2, es altamente expresado diferencialmente en todas las muestras de cáncer estudiados aquí. La fusión del gen TMPRSS2-ERG es uno de los reordenamientos cromosómicos más ampliamente distribuidos en los carcinomas [34], aunque la TMPRSS2 gen no se expresa de una manera específica del cáncer en muestras estudiadas aquí Encontramos que este nlincRNA muestra la expresión significativa en VCAP y no en PC3 y LNCaP.

Conclusión

Recientemente, más de catorce mil lincRNAs se han descubierto desde gran número de tejidos humanos normales, lo que sugiere que estos lincRNAs normales (nlincRNAs) juegan un papel en la biología normal, . Cabe la hipótesis de que los genes nlincRNAs con funciones reguladoras en condiciones normales pueden ser en realidad las reguladas en el cáncer. Con este fin, aquí hemos tratado de tener dos conjuntos de datos de RNA-seq generados independientemente del demográficamente diversa cohorte para perfilar tanto los genes de proteínas y nlincRNAs codificación. Hemos identificado 127 nlincRNAs que no están reguladas solamente de manera significativa en las muestras de cáncer de ambos conjuntos de datos, pero podrían utilizarse para agrupar los datos de las muestras, no se utilizan en este estudio, por el contexto de la enfermedad. Contrariamente a nuestra hipótesis, los perfiles de codificación de los genes y nlincRNAs sugiere que la mayoría de los nlincRNAs están reguladas en el cáncer a pesar de que 2 veces más genes de codificación de proteínas se redujeron reguladas en el cáncer. Esto, junto con la activación de muchos genes no codificantes en 8q24 y la inactivación de muchos genes que codifican en 17q21 y 19q13 loci sugeriría sistemas de activación nivel de muchos nlincRNAs durante el cáncer.

Hemos encontrado que una serie de genes que codifican y nlincRNAs específicas a otros tejidos con el valor inicial nula expresión en el tejido de la próstata son hasta reguladas en el cáncer de próstata. Tal vez estos genes y nlincRNAs son responsables de la pérdida de identidad celular que conduce a tumerogenesis. A nuestro entender este es el primer intento al perfil nlincRNAs junto con los genes de codificación en el cáncer. Creemos que el enfoque utilizado aquí para la caracterización funcional de nlincRNAs permitirá a los investigadores para avanzar en la comprensión del papel de nlincRNAs en la biología normal y la enfermedad, en general.

Apoyo a la Información sobre Table S1. Los genes regulados diferencialmente en muestras de cáncer de ambos conjuntos de datos identificados con las dos tuberías de análisis DESeq y bordeadora.
Columnas 2-5 da los p-valores medios y doble cambio obtenido de DESeq y bordeadora de tuberías, tanto para SRP002628 y ERP000550.
Doi : 10.1371 /journal.pone.0122143.s001 gratis (XLS)
Tabla S2. Listas de p-valor y la tapa de cambio para todas las nlincRNAs regulados diferencialmente en ambos conjuntos de datos mediante ambos métodos.
La tabla enumera los genes vecinos, junto con su respectivo valor de py veces de cambio en los dos conjuntos de datos. Tres últimas columnas muestran los valores para estos RPKM lincRNAs en tres celllines próstata
doi:. 10.1371 /journal.pone.0122143.s002 gratis (XLS) sobre Table S3. Listas valor p log factor de cambio para lincRNAs conocidos que son regulados diferencialmente en ambos conjuntos de datos junto con el estado de la transcripción de la coincidencia con nlincRNAs en el navegador UCSC
doi:. 10.1371 /journal.pone.0122143.s003
(XLS)

Reconocimientos

los autores desean agradecer el Departamento de Biotecnología, Nueva Delhi, India para el apoyo a la SS a través de la Ramalingaswamy Fellowship (Ref no: BT /DRH /35/02 /17/2009). Los autores también reconocen el Departamento de Tecnología de la Información, Gobierno de la India, por su apoyo al instituto bajo el 'Centro de Excelencia para la Capacitación e Investigación Bioinformática'. Los autores desean reconocer DST-puño, Gobierno de la India y el Departamento de Tecnología de la Información, Gobierno de Karnataka, para la concesión de infraestructura a iBáb.

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]