Extracto
ARNs no codificantes largas (lncRNAs) regular la expresión génica actuando con microRNAs (miRNAs). Sin embargo, los papeles de lncRNA específica del cáncer y su ARN endógenos competitivos relacionados (CERNA) de red en el carcinoma hepatocelular (HCC) no se entienden completamente. Se analizaron los perfiles lncRNA en 372 pacientes con HCC, incluyendo 372 tumoral y 48 tejidos hepáticos no tumorales adyacentes, a partir del Genoma del Cáncer Atlas (TCGA) y ómnibus NCBI GEO (GSE65485). Se identificaron lncRNAs específicos de cáncer (o lncRNAs relacionados HCC) y se correlacionaron con las características clínicas. Sobre la base de la bioinformática generados a partir de miRcode, base estelar, y miRTarBase, hemos construido una red lncRNA-miARN-mRNA (red de Cerna) en el CHC. Encontramos lncRNAs específicos de cáncer en 177 HCC (doble cambio ≥ 1,5, P & lt; 0,01), 41 de ellos fueron también expresaron discriminadamente con el género, la raza, el grado del tumor, el estadio tumoral AJCC, y el sistema de estadificación TNM de la AJCC. Se encontraron seis lncRNAs (CECR7, LINC00346, MAPKAPK5-AS1, LOC338651, FLJ90757, y LOC283663) que se asociaron significativamente con la supervivencia global (OS, log-rank P & lt; 0,05). En conjunto, nuestros resultados mostraron los patrones de expresión lncRNA y una red compleja Cerna en el CHC, e identificaron una red específica del cáncer Cerna complejo, que incluye 14 lncRNAs y 17 miRNAs en HCC
Visto:. Zhang J, Fan D, Jian Z, Chen GG, Lai PBS (2015) específica del cáncer a largo RNAs no codificantes Mostrar diferenciales patrones de expresión y Competencia endógeno ARN potencial en el carcinoma hepatocelular. PLoS ONE 10 (10): e0141042. doi: 10.1371 /journal.pone.0141042
Editor: Xin-Yuan Guan, la Universidad de Hong Kong, China
Recibido: 6 Agosto, 2015; Aceptado: 2 Octubre 2015; Publicado: 22 Octubre 2015
Derechos de Autor © 2015 Zhang et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Disponibilidad de datos: Todos los datos relevantes están dentro del apoyo de sus archivos de información en papel y
Financiación:. Este estudio fue apoyado por el Fondo de Investigación Especializada para el Programa de Doctorado de Educación Superior y destinó subvenciones para la investigación Régimen Común de Investigación de Subvenciones Consejo (Nº M-CUHK406 /13) y la Fundación Nacional de Ciencias Naturales de China (Nº 81472339). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
ARNs no codificantes son moléculas de ARN que no codifican para proteínas. Se pueden dividir en varios subtipos incluidos los largos ARN no codificante (lncRNA), microRNA (miRNA), ARN ribosómico (ARNr), ARN pequeño nucleolar (snoRNA), y ARN de transferencia según HUGO Comité de Gene Nomenclatura (HGNC) (http: //www.genenames.org).
Después de la identificación de lncRNA en enfermedades de malignidad, un creciente número de estudios sobre las funciones biológicas de lncRNAs han llevado a cabo en varios tipos de cáncer, incluyendo HCC [1], escamosas de esófago carcinoma de células [2], el cáncer [3] colorrectal, carcinoma de células renales [4] y el cáncer de próstata [5]. La expresión anormal de lncRNAs través de interacciones con miRNAs o mRNAs está implicado en la regulación de la progresión tumoral y tumorales comportamientos biológicos en HCC [6-8]. Los lncRNAs específicos de cáncer también pueden afectar la invasión y la metástasis de carcinoma hepatocelular [9].
En 2011, Salmena
et al
. presentado una hipótesis que compiten endógeno ARN (cerna), que unificó el transcriptoma y formó una red ARN regulador de [10]. La idea principal es que todos los tipos de transcritos de ARN se comunican entre sí al competir por la unión a sitios de unión de los genes miARN-compartidos ( "elementos de respuesta miRNA" o "MRE"). existe este tipo de ARN competencia diafonía entre los ARN mensajeros que codifican proteínas y ARN no codificantes, tales como lncRNA, pseudogenes y ARNs circulares [11]. Por otra parte, las esponjas miARN artificiales también pueden participar en esta red para regular la expresión de genes [12].
Zhu et al. informado de que el perfil de expresión lncRNA de HCC por el análisis de microarrays de tres pacientes con HCC [13]. Sin embargo, hay una falta de estudios con una muestra grande escala y alta a través de los métodos de detección de los patrones de expresión de lncRNA específica del cáncer en el CHC, y se desconoce si lncRNAs se correlacionan con la supervivencia global, sexo, u otras características clínicas o si el aberrante expresión de lncRNAs en HCC tiene ningún potencial Cerna. Recientemente, los datos de secuenciación de ARN a partir del proyecto del Genoma del Cáncer Atlas (TCGA) o GEO proporcionan al público datos lncRNA, miRNA y de ARNm para el CHC. Para hacer frente a las cuestiones antes mencionadas, hemos explorado lncRNAs en HCC utilizando conjuntos de datos de TCGA y GEO. Estos dos conjuntos de datos incluyen los resultados de la secuencia de ARN de un total de 372 tejidos tumorales HCC y 48 muestras de tejido hepático no tumorales adyacentes. A lo mejor de nuestro conocimiento, este estudio es el primero en hacer uso de la base de datos de secuenciación a gran escala para investigar los patrones de expresión específicos de cáncer y lncRNA red Cerna en el CHC. Este nuevo enfoque de la predicción lncRNA específica del cáncer y de la red Cerna puede ayudar a comprender la función de lncRNAs en el CHC.
Métodos
Pacientes y muestras
Un total de 360 pacientes con CHC fueron recuperados desde el portal de datos TCGA. Los criterios de exclusión se establecieron de la siguiente manera: 1) diagnóstico histológico no es HCC; 2) muestras sin datos completados para el análisis; y 3) la supervivencia global de más de 2000 días. En general, se incluyeron un total de 322 pacientes con CHC en nuestro estudio. Entre estos 322 pacientes con HCC, los tejidos hepáticos no tumorales adyacentes fueron recuperados de 43 sujetos. Este estudio cumple con las normas de publicación proporcionadas por TCGA (http://cancergenome.nih.gov/publications/publicationguidelines). Otro conjunto de datos GEO (GSE65485) ha sido descargado de GEO (http://www.ncbi.nlm.nih.gov/geo/) que incluía 50 HCC tejidos y los tejidos del hígado 5 no tumorales adyacentes. A medida que los datos se obtuvieron a partir TCGA y GEO, no se requiere además la aprobación por un comité de ética.
procesión ARN datos de secuencia y análisis computacional
Los datos de expresión de ARN (nivel 3) de la correspondiente pacientes (tejidos no tumorales adyacentes del tumor y /o) fueron descargados de portal de datos TCGA (hasta 24 Feb de 2015) como. Los perfiles de expresión de ARNm lncRNA y se generaron a partir de prima secuenciación de ARN se lee a través de gasoductos de post-procesamiento RNASeqV2 y demostraron como RSEM (RNA-Seq por expectativa de maximización) datos de recuento normalizados. El perfil de expresión de los genes miARN se realizó utilizando las plataformas de secuenciación de los genes miARN Illumina HiSeq 2000 (Illumina Inc, USA) y demostró como se lee por millón de miARN (RPM) mapeados de datos. Debido a que los datos de perfil de expresión de ARNm, lncRNA, y miARN ya se normalizaron por TCGA, No hay más normalizaciones se aplicaron a estos datos. El conjunto de datos GEO también se genera a partir de la plataforma Illumina HiSeq 2000 y normalizada como FPKM (fragmentos por kilo bases de los exones de mapeado por millón lee) de datos. El lncRNA análisis se realizaron utilizando BRB-ArrayTools (versión 4.4), desarrollado por el Dr. Richard Simon y el equipo de desarrollo BRB-ArrayTools [14].
Construcción de la red Cerna y Pathway Analysis Keeg
La construcción de la red Cerna incluye tres etapas: (i) específica del cáncer de filtración lncRNA: lncRNAs específicos de cáncer con absoluta veces el cambio ≥ 3.0 (ya sea hacia arriba o hacia abajo-regulación-regulación) y P & lt; 0,05 se mantuvieron. Para mejorar la fiabilidad de los datos, lncRNAs específicos de cáncer no se han anotado por GENCODE (http://www.gencodegenes.org/) fueron descartados; (Ii) las interacciones lncRNA-miARN fueron predichas por miRcode (http://www.mircode.org/) y la base estelar v2.0 (http://starbase.sysu.edu.cn/); (Iii) los ARNm dirigidos por miRNAs con soporte experimental fueron recuperados de miRTarBase (http://mirtarbase.mbc.nctu.edu.tw/). Para mejorar aún más la robusta de esta red Cerna, el coeficiente máximo de información (MIC) algoritmo y estadísticas máximos basados en la información de exploración no paramétrico (la mía) se utilizaron en los datos del TCGA establecidas para filtrar los par-wised relaciones [15]. Un gráfico de la red se construyó y se visualizó utilizando Cytoscape v3.0 [16]. Los genes que codifican implicados en la red Cerna fueron ingresados en la base de datos para anotación, y Visualización Integrada y Descubrimiento (DAVID) [17] para el análisis Keeg vía de enriquecimiento.
El análisis estadístico
Los datos se presentan como media SD ±. Las diferencias entre los grupos se evaluaron mediante la prueba t de dos muestras y el nivel de significación se fijó como 0,001 por defecto para controlar la tasa de falso descubrimiento (FDR). El univariado de Cox de riesgos proporcionales de regresión se llevó a cabo para averiguar las lncRNAs correlacionados con la supervivencia global [18]. valor de p inferior a 0,05 se consideró como estadística, a menos que se indique específicamente. Los análisis estadísticos se realizaron por BRB-R ArrayTools o lenguaje [19].
Resultados
lncRNAs específicos de cáncer en HCC
Se identificaron 604 lncRNAs a partir de datos del TCGA fijan y 357 lncRNAs de GSE65485. Para cualquier sola lncRNA, que apareció en los datos del TCGA establecidos o ambos conjuntos de datos del TCGA y GEO. Se encontró que 177 lncRNAs y 37 lncRNAs fueron expresados diferencialmente entre HCC tejidos y tejidos no tumorales adyacentes en TCGA conjunto de datos y conjunto de datos GEO (absoluta veces el cambio ≥ 1,5, P & lt; 0,01, Tabla S1), respectivamente. Para mejorar aún más la fiabilidad de los datos, se seleccionaron 28 lncRNAs incluido en GENCODE y estas lncRNAs tenido un absoluto cambio veces ≥ 3.0 ya sea de datos GEO establecidos para construir la red Cerna [20] o TCGA. Por último, 28 lncRNAs (18 hasta reguladas; 10 hacia abajo-regulado). Se seleccionaron para la red cerna (Tabla 1)
Esta tabla muestra lncRNAs específicos de cáncer el 28 de construcción de la red Cerna con absoluta veces el cambio ≥ 3,0, P & lt; 0,01 y se incluyen en GENCODE.
Las correlaciones entre lncRNAs cáncer específica y las características clínicas
Las 177 lncRNAs de la sección anterior se analizaron más de acuerdo con las características clínicas incluyendo el género, la raza, el tumor grado, AJCC TNM sistema de estadificación, AJCC estadio patológico, la invasión vascular, nuevo evento del tumor, estado del tumor, y la edad al momento del diagnóstico en TCGA y /o conjuntos de datos GEO. Hubo en total 41 lncRNAs específicos de cáncer, los niveles de los cuales también fueron significativamente diferentes en comparaciones de características clínicas (P & lt; 0,001, Tabla 2). Cinco lncRNAs (LINC01554, LOC255167, A1BG-AS1, LINC00526, y MIR22HG) fueron expresados diferencialmente en tres o cuatro comparaciones de características clínicas.
Esta tabla muestra lncRNA específica del cáncer 41 que también se expresa de forma diferente en comparaciones de características clínicas.
a continuación, para identificar los potenciales lncRNAs con características de pronóstico, se encontró que los niveles de 177 lncRNAs en los datos del TCGA establecidos fueron perfilada mediante el modelo de regresión de riesgos proporcionales de Cox univariante y seis lncRNAs que se asociaron significativamente con la supervivencia global (log-rank P & lt; 0,05). Entre los seis lncRNAs significativos, tres lncRNA (CECR7, LINC00346, y MAPKAPK5-AS1) se asociaron negativamente con el sistema operativo, mientras que los tres restantes (LOC338651, FLJ90757, y LOC283663) se correlacionaron positivamente con OS (figura 1).
(eje horizontal: tiempo de supervivencia global: días, eje vertical: función de supervivencia).
miARN objetivo lncRNAs predichos por miRcode y STARBASE
Nuestro estudio previo ha encontrado 207 HCC- miRNAs asociados que son expresados diferencialmente entre los tejidos HCC y tejidos no tumorales adyacentes [21]. Se seleccionaron 33 miRNAs de 207 miRNAs HCC-asociado en conjunto actual de datos TCGA (absoluta veces el cambio ≥ 3,0, P & lt; 0,001, Tabla S2). Aquí, nos centramos en si estos miRNAs apuntarían por encima de 28 lncRNAs específicos de cáncer. En la red Cerna, miRNAs interactuar con lncRNAs través MRE, de este modo, buscaron MRE potenciales en lncRNAs utilizando miRcode [22] y la base estelar v2.0 [23]. Los resultados mostraron que 17 de los 33 miRNAs específicos de cáncer pueden interactuar con 15 de 28 lncRNAs específicos de cáncer (Tabla 3).
miR-199A-1 y miR-199A-2 fueron considera como una sola miARN en nuestro estudio
miARN objetivos previstos por miRTarBase
para establecer la red lncRNA-miARN-mRNA (red de Cerna), el siguiente paso fue buscar ARNm blanco de los miRNAs. Sobre la base de los miRNAs que se describen en la Tabla 3, se realizaron búsquedas miARN-mRNA específicos con pruebas experimentales utilizando miRTarBase [24]. Los resultados identificaron 17 miRNAs incluyendo miR-10B, el miR-135A-1, miR-139, miR-182, miR-183, miR-184, miR-195, miR-199A-1/2, el miR-214, miR 33B, 34C-MIR, MIR-375, miR-376C, miR-383, miR-424, miR-93 y miR-96 (Tabla 4). Cada miARN-mRNA par ha sido validada experimentalmente por al menos dos de los siguientes métodos incluyendo reportero de ensayo, western blot, PCR cuantitativa, microarrays, pSILAC (pulsada etiquetado de isótopos estables con aminoácidos en cultivo celular) o NGS (CLIP-ss o degradoma-ss ). De acuerdo con la base de datos allOnco (http://www.bushmanlab.org/links/genelists), la mayor parte de sus objetivos son los genes asociados con el cáncer tales como SIRT1, VEGFA, RASA1, RAF1, PTEN, MAPK9, MAPK8, MAPK1, MYC, MYB, KRAS, JAK2, IGF1R, IDH2, FOXO3, FoxO1, E2F3, E2F1, MAPK14, CDKN2A, CDKN1A, CDK6, CD44, CCNF, CCNE1, CCND3, CCND2, RUNX2, BCL2, CCND1, APC, AKT2, AKT1, ABCA1, etc.
construcción de la red Cerna y vía Keeg análisis
a partir de los datos anteriores (Tablas 3 y 4), se construyó una red lncRNA-miARN-mRNA Cerna. Para obtener resultados más sólidos, se utilizó el coeficiente máximo de información (MIC) algoritmo para detectar las relaciones de par wised en base a los niveles de expresión de la lncRNA, miARN, y el ARNm en el conjunto de datos TCGA (MIC & gt; 0,15 y MIC-p
2 & gt; 0,15, consulte Métodos). 14 y 17 lncRNAs miRNAs estaban involucrados en la red Cerna propuesto (Figura 2).
Con el fin de comprender las vías de señalización implicadas en la red Cerna, los ARNm se analizaron mediante la base de datos DAVID. De acuerdo con el número de genes implicados, encontrarás una lista de los 15 mejores KEGG vías en nuestro estudio (Tabla 5). Diez vías relacionadas con el cáncer, como senderos en el cáncer, cáncer de páncreas, melanoma, cáncer de próstata, leucemia mieloide crónica, cáncer colorrectal, el glioma, el cáncer de pulmón de células pequeñas, cáncer de vejiga y cáncer de pulmón de células no pequeñas, se enriquecieron con el ARNm, otro también se enriquecieron 5 vías no relacionadas con el cáncer como la vía de señalización MAPK, de adhesión focal, el ciclo celular, la neurotrofina vía de señalización, vía de señalización del receptor de células T.
el valor de p fue corregido para múltiples pruebas de hipótesis utilizando el Benjamini- método de Hochberg (por favor, consulte también la Tabla S3) guía empresas
Discusión
Recientemente, lncRNAs han surgido como abundantes reguladores de la fisiología celular en el CHC y sus funciones pueden variar [25, 26] . Sólo unos pocos estudios han tratado de revelar los perfiles de expresión lncRNA en el CHC mediante microarrays con docenas de o incluso más pequeño tamaño de la muestra [13]. coexpression red lncRNA y mRNA fue construido por expresado anormalmente lncRNA y ARNm [13]. Unos pocos estudios interacciones entre los genes miARN y lncRNAs [27, 28] o ARNm y lncRNA [29] describen en el CHC, cuyos resultados indicaron que lncRNAs puede funcionar como una parte de la red Cerna, pero dicha red Cerna está todavía poco explorados. En el presente estudio, hemos identificado lncRNAs específicos de tumores en el CHC y se investigaron sus distribuciones en diferentes características clínicas y sus asociaciones con la supervivencia global sobre la base de perfiles de ARN de genoma completo de 372 tejidos HCC y 48 tejidos hepáticos no tumorales adyacentes. Por otra parte, hemos construido una red Cerna con lncRNAs específicos de cáncer y miRNAs que proporciona un sistema de puntos de vista biológicos de las interacciones lncRNA-miARN-mRNA.
Sobre la base de la próxima generación de datos de secuencias de ARN de TCGA y GEO, se encontró que 177 lncRNAs específicos de cáncer fueron expresados diferencialmente en los tejidos tumorales HCC y tejidos hepáticos no tumorales adyacentes. Entonces, que reveló que lncRNAs específicos 41 cáncer también se expresaron de manera anormal en diferentes grupos de características patológicas clínicas tales como el género, la raza, el grado del tumor, el sistema de clasificación AJCC TNM, el estadio patológico AJCC, invasión vascular, nuevo evento del tumor, estado del tumor, y la edad al momento del diagnóstico. Entre los lncRNAs que diferencialmente expresados en tres o cuatro grupos, MIR22HG se informó a ser un indicador de las respuestas de estrés químicas en las células madre pluripotentes inducidas por el hombre [30]. Llegamos a la conclusión de que la expresión de algunos lncRNAs no se distribuye por igual en ciertas situaciones. Los estudios futuros en este campo deben estar adecuadamente diseñados para hacer frente a este hecho. Anteriores estudios informaron disparidad sexual de HCC incidencia [31], la diferencialmente expresado lncRNA entre hembra y macho encontrado en este estudio puede contribuir a este fenómeno. Sin embargo, estos lncRNAs distribuidas de manera desigual no pueden estar asociados significativamente con la supervivencia global.
Con respecto a las asociaciones entre lncRNAs específicos del cáncer y la supervivencia de los pacientes, se encontró que seis lncRNAs estaban relacionados con la supervivencia global HCC. Entre los tres lncRNAs arriesgadas, CECR7 es un lncRNA candidato para el síndrome del ojo de gato [32]. Las funciones de los otros dos arriesgado y tres nuevos lncRNAs de protección aún no están claros. También se observa que cinco de estos seis lncRNAs (CECR7, LINC00346, LOC338651, FLJ90757, y LOC283663) no fueron expresadas diferencialmente en cualquier comparación característica clínica. Por lo tanto, lncRNAs que no expresan diferencialmente en comparaciones de características clínicas pueden ser correlacionados con la supervivencia global, mientras que lncRNAs que expresan diferencialmente en comparaciones de características clínicas pueden no ser necesarios para ser asociado con la supervivencia global.
Creemos que puede haber algunas conversaciones cruzadas entre lncRNA, miARN ARNm y en el progreso de HCC. Se aplicaron varias medidas para aumentar la exactitud de la predicción de red Cerna. En primer lugar, sólo se incluyeron los lncRNAs específicos de cáncer y miRNAs que tanto han absoluta veces el cambio ≥ 3,0 y fue anotado por GENCODE. En segundo lugar, las relaciones entre lncRNA y miARN y miARN y el ARNm fueron predichas por solo experimentos algoritmos soportados o bases de datos tales como miRcode, base estelar y miRTarBase. Estas dos medidas se aseguraron de que las relaciones identificadas ocurrirían no sólo
In silico situaciones
sino también por evidencias experimentales apoyado.
Para mejorar aún más el rendimiento de nuestra predicción, el coeficiente máximo de información (MIC )) estadísticas máximos basados en la información de exploración no paramétrico (el mío algoritmo y se utilizan para filtrar las relaciones de par wised basado en lncRNA-miARN-mRNA correlaciones de expresión. En el análisis general de red de genes co-expresión, de correlación de Pearson es una medida para la regresión lineal, pero es muy sensible a los valores atípicos. MIC y la mía son capaces de examinar y caracterizar todas las relaciones potencialmente interesantes en un conjunto de datos complejos [33].
La red Cerna construimos saca a la luz una red de regulación Cerna desconocida en el CHC. En esta red Cerna recién identificados, muchos oncogenes y supresores tumorales participan en el desarrollo y tratamientos HCC. Un estudio reciente identificó también que las interacciones lncRNA-miARN-mRNA se mantuvieron activos y podrían actuar como posibles biomarcadores de pronóstico en el cáncer [34].
En conclusión, nuestro estudio ha encontrado los lncRNAs específicos de cáncer en HCC utilizando cientos de candidatos lncRNAs y muestras a gran escala, y den a conocer patrón de expresión anormal de lncRNAs específicos de cáncer con diferentes características clínicas. Es importante destacar que hemos construido una red Cerna proponer un nuevo enfoque de investigación lncRNA en el CHC. Nuestros hallazgos sugieren que lncRNAs específicos de cáncer en el CHC pueden participar en una red compleja Cerna.
Apoyo a la Información sobre Table S1. 177 y 37 lncRNAs expresados diferencialmente entre los tejidos HCC y tejidos no tumorales adyacentes en los datos del TCGA fijan y conjunto de datos GEO
doi:. 10.1371 /journal.pone.0141042.s001 gratis (XLS)
Tabla S2. 33 miRNAs HCC-asociado entre HCC tejidos y tejidos no tumorales adyacentes en el conjunto de datos TCGA
doi: 10.1371. /Journal.pone.0141042.s002 gratis (XLS) sobre Table S3. Todas las vías Keeg enriquecido por los genes codificantes implicadas en la red cerna (P & lt; 0,05) guía doi: 10.1371 /journal.pone.0141042.s003 gratis (XLS)
. p> agradecemos al Sr. Rocky Ho por su asistencia técnica. Los resultados publicados o mostrados aquí están en todo o en parte sobre la base de los datos generados por la Red de Investigación TCGA: http://cancergenome.nih.gov/. Este estudio fue apoyado por SRFDP y RGC ERG Común de Investigación (No: M-CUHK406 /13). Y la Fundación Nacional de Ciencias Naturales de China (No.81472339)