Extracto
ARNs no codificantes largas (lncRNAs) están emergiendo como potentes reguladores de la fisiología celular, y la reciente Los estudios ponen de relieve su papel en el desarrollo de tumores. Sin embargo, aunque ya establecidos supresores de los oncogenes que codifican proteínas y tumorales suelen mostrar patrones llamativos de ADN focal número de copias alteración en los tumores, se evidencia similar en gran medida carece de lncRNAs. Aquí, se presenta en un análisis genómico de GENCODE lncRNAs en alto grado adenocarcinoma seroso de ovario, basado en el Atlas del Genoma del Cáncer (TCGA) perfiles moleculares. Usando datos genómica número de copias y la secuenciación del transcriptoma cobertura profunda, derivamos el número de copias y la expresión de datos duales para 10.419 lncRNAs a través de 407 tumores primarios. Describimos correlaciones globales entre lncRNA número de copias y de expresión, y de asociación establecida subtipos de expresión con firmas lncRNA distintas. Por regiones que examinan del cambio en el número de copias focal que carecen de objetivos codificantes de proteínas, hemos identificado un lncRNA intergénicas en el cromosoma 1,
OVAL de
, que muestra la amplificación genómica de coordinación estrecha en un subgrupo de tumores. Si bien débilmente expresado en la mayoría de los tumores, la amplificación focal coincidió con
OVAL de
activación transcripcional fuerte. Proyección de otros 16 tipos de cáncer reveló patrones similares en los carcinomas de endometrio serosas. Esto demuestra que lncRNAs intergénicas pueden ser dirigidos específicamente por la amplificación del número de copias somáticas, indican la afectación funcional en la iniciación o progresión del tumor. Nuestro análisis proporciona hipótesis comprobables y allana el camino para un mayor estudio de lncRNAs basado en TCGA y otras a gran escala genómica del cáncer conjuntos de datos
Visto:. Akrami R, Jacobsen A, Hoell J, N Schultz, Sander C, Larsson e (2013) Análisis integral de largo ARN en cáncer de ovario no codificante revela patrones globales y específicas de amplificación de ADN. PLoS ONE 8 (11): e80306. doi: 10.1371 /journal.pone.0080306
Editor: C. Aedin Culhane, Escuela de Salud Pública de Harvard, Estados Unidos de América
Recibido: 13 Junio, 2013; Aceptado: 1 de octubre de 2013; Publicado: 12 Noviembre 2013
Derechos de Autor © 2013 Akrami et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por subvenciones del Consejo Sueco de Investigación médica; la Sociedad Sueca del Cáncer; La Fundación Sueca para la Investigación Estratégica; la Fundación Assar Gabrielsson; la Fundación Magnus Bergvall; la fundación Åke Wiberg; y la Fundación Lars Hierta Memorial. Los fondos para AJ, NS, y CS fue proporcionada por el Instituto Nacional del Cáncer de Estados Unidos como parte de la concesión TCGA Genoma Centro de Análisis de Datos (NCI-U24CA143840 y NCI-R21CA135870) y por una Contra el Cáncer Dream Team Investigación traslacional Grant, un Programa de la Fundación de la Industria Entretenimiento (SU2C-AACR-DT0209). Los cálculos se realizan en parte en los recursos de computación de alto rendimiento proporcionados por Infraestructura Nacional Sueco para la Informática (SNIC) a través de Uppsala Centro Multidisciplinario de Ciencias de la Computación Avanzada (UPPMAX) bajo b2012108 proyecto. Los resultados publicados aquí son en su totalidad o en parte sobre la base de los datos generados por el proyecto piloto del Genoma del Cáncer Atlas establecido por el Instituto Nacional del Cáncer y el Instituto Nacional de Investigación del Genoma Humano (NHGRI). Información sobre el TCGA y los investigadores e instituciones que constituyen la red de investigación TCGA se puede encontrar en "http://cancergenome.nih.gov". Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
recientes estudios de transcriptómica en mamíferos han puesto de manifiesto una abundancia de ARN no codificantes largos (lncRNAs) que yacen intercalan con los genes de codificación de manera compleja [1-3]. transcripciones lncRNA normalmente tienen propiedades similares a ARNm, tales como estructuras de genes multiexonic y las colas de poli (A), pero carecen de la capacidad aparente de codificación de proteína. Aunque los ejemplos tempranos funcionales (por ejemplo,
H19
[4] y
XIST
[5]) se describió por primera vez hace más de 20 años, lncRNAs están surgiendo ahora como reguladores generalizadas de la fisiología celular con diversas funciones tanto en el núcleo y el citoplasma, incluyendo el reclutamiento de histona modificadores de complejos a la cromatina, regulación de la transcripción y corte y empalme, y el control de la traducción del ARNm.
Varios estudios recientes sugieren que lncRNAs puede tener papeles importantes en la oncogénesis [6 , 7]. Por ejemplo,
HOTAIR
expresión es alta en los tumores de cáncer de mama metastásico, y sus bloques de inhibición de la metástasis en modelos de roedores [8],
MALAT1
expresión se correlaciona con metástasis y la supervivencia en el cáncer de pulmón [9] , y la secuenciación del transcriptoma de poliA + (RNA-seq) recientemente identificado
PCAT-1
como un promotor del crecimiento lncRNA en el cáncer de próstata [10]. Sin embargo, es notable que los datos genéticos proporcionados se refiere por tanto lejos principalmente a alteraciones en la expresión génica. La transformación maligna requiere la activación genética de los oncogenes que promueven el crecimiento y la inactivación de los supresores de tumores, y esto se ve facilitado en los tumores por la inestabilidad genómica, la variabilidad genética adquirida, y la expansión clonal [11]. En grandes conjuntos de datos de genómica del cáncer, tales como los producidos por el consorcio Atlas del Genoma del Cáncer (TCGA), los genes del cáncer importantes, por tanto, se revelan a través de llamativos patrones recurrentes de alteración a nivel de ADN, incluyendo la amplificación del número de copias focal y su eliminación [12,13]. Sin embargo, mientras que lncRNAs y los genes de codificación debe, en principio, ser susceptibles a la activación o desactivación a través de mecanismos similares, existe hasta el momento poca evidencia de que lncRNAs están destinados específicamente por alteraciones del número de copias en el cáncer de forma independiente de los genes que codifican proximales (recientemente revisados en 6,14 ).
Estamos aquí, se realizó un análisis genómico a gran escala de lncRNAs en el carcinoma de alto grado seroso de ovario (HGS-OvCa), una de las principales causas de muerte por cáncer entre las mujeres en los Estados Unidos [15], sobre la base de perfiles moleculares de alto rendimiento generados dentro TCGA [12]. Hemos basado nuestro análisis en el catálogo exhaustivo GENCODE lncRNA, que ha sido objeto de una amplia caracterización y el manual de curación [16,17], mientras que el uso de un enfoque imparcial anotación en su caso. en consecuencia, nos centramos en lncRNAs con expresión reproducible en conjuntos de datos independientes, en base a la suposición de que lncRNAs cáncer pertinente deben, similares a los genes de codificación, tienen funciones importantes también en las células normales. Utilizando los datos de RNA-seq cobertura profundas y de alta resolución de DNA arrays número de copias, derivamos los perfiles del número de copias simultáneas y los datos de expresión de & gt; 10.000 genes GENCODE lncRNA a través de 407 tumores primarios (datos disponibles en www.larssonlab.org/tcga- lncRNAs). Investigamos la relación global entre el número de copias de ADN y la expresión lncRNA, y evaluamos lncRNAs en relación con los subtipos de expresión establecidos en HGS-OvCa. Por otra parte, si nos dirigimos a lncRNAs puede ser afectado específicamente focal alteración número de copias en el cáncer.
Resultados y Discusión
Las características moleculares de los tumores lncRNAs en 407
Hemos utilizado los métodos GENCODE [17] anotación como marco principal para investigar los patrones de lncRNA-número de copias alteración y expresión a través de 407 tumores en estadio II-IV-HGS-Ovča [12]. Se encontró que el subconjunto GENCODE lncRNA [16], que abarca 10.419 genes lncRNA anotados manualmente (versión 11, la Figura 1A), mostró un alto grado de poliadenilación como se determina por secuenciación normal de ARN de tejido (RNA-seq) de datos (Figura 1B). los datos del número de copias de las matrices de hibridación genómica comparada (CGH) estaba disponible para 486 tumores primarios, y la gran mayoría de GENCODE lncRNAs (97%) como era de esperar residían en las regiones cubiertas. A continuación procesó un total de 25,7 mil millones de pares de lectura GENCODE-mapeado de polyA + RNA-seq (en promedio 63,1 millones por muestra) para derivar los perfiles de expresión para todos lncRNAs GENCODE en 407 de estos tumores (Figura 1C). Sólo 225 millones de pares de lectura asignan a lncRNA loci (en promedio 553.000 por muestra), haciendo hincapié en la necesidad de una alta cobertura de secuencia para cuantificar con precisión lncRNAs.
A, la abundancia relativa de las categorías de genes en la anotación GENCODE 11 (único loci ). B, el estado de poliadenilación del lncRNAs, determinado por polyA + vs. ARN total-seq partir de una mezcla de 16 tejidos. C, expresión lncRNA de perfiles utilizando polyA + RNA-seq a través de 407 tumores. En total, 25,7 millones de pares de lectura asignados de forma única, que abarca & gt; 3 terabases, se contaron en los genes GENCODE. La tabla muestra la profundidad de secuenciación por el tumor, basado en todo planeado-GENCODE lee o subconjuntos lncRNA. D, Distribuciones de lncRNA y los niveles de expresión de genes de codificación (máximo RPKM en todos los tumores). RPKM, lee por kilobase por millón lecturas. E, histogramas de las correlaciones entre el número de copias de ADN y ARN nivel (basado en 407 tumores con datos duales). Panel izquierdo: lncRNAs generales (panel izquierdo,
n
= 10.066), que muestra las correlaciones más bajas en comparación con los genes de codificación. Panel derecho: la mejora de las correlaciones cuando se consideran los genes expresados en RPKM & gt; 3 (19% superior lncRNAs,
n
= 1920) que también fueron amplificados o suprimirse en & gt; 15 muestras (panel de la derecha,
n
= 125) guía empresas
la comparación de longitud normalizada (de tipo RPKM [18]) Los valores de expresión entre codificación y genes lncRNAs confirmó que lncRNAs se expresaron en niveles sustancialmente más bajos (Figura 1D), de acuerdo con informes anteriores de una amplia variedad de fuentes celulares [1 16,19]. Mientras que el 87% de los genes de codificación mostró un nivel RPKM & gt; 1 en al menos un tumor, sólo el 36% de lncRNAs alcanza este nivel de expresión. correlaciones entre el genoma de toda amplitud el número de copias de ADN y los niveles de ARN fueron menores en comparación con lncRNAs codificación de los genes, pero esta diferencia se redujo si se consideran únicamente abundante y frecuentemente alterado el número de copias de genes (Figura 1E). Un análisis complementario basado en vectores Affymetrix exón 1.0ST, que puede interrogar a un subconjunto de lncRNAs, arrojó resultados similares (481 muestras, en la Figura S1 S1 Archivo).
lncRNAs asociados con subtipos de expresión
análisis previo de codificación de la expresión génica en HGS-OvCa identificado cuatro subtipos robustas, que se denominan "inmunorreactiva ',' diferenciada ',' proliferativa" y "mesenquimales" en función de su contenido de genes [12,20]. Los subtipos se muestran más estar asociados con alteraciones específicas genómicas, donde el grupo proliferativa tiene una menor frecuencia de
MYC
amplificación y
RB1
eliminación, mientras que el grupo inmunorreactivo tiene una mayor frecuencia de
MECOM
amplificación. Hemos probado aquí si subtipos establecidos en HGS-OvCa también tienen distintos patrones de expresión lncRNA.
Los tumores con el subtipo disponibles, los datos clínicos y de expresión se repartieron aleatoriamente en dos grupos (
n = 200 cada uno
), la retención de un medio para la validación posterior. Se identificaron 455 lncRNAs que fueron inducidos o reprimidos específicamente en uno de los cuatro subtipos en relación con muestras restantes (Figura 2A, como se detalla en Métodos). Estos patrones de expresión fueron claramente mantienen en el conjunto de validación, lo que confirma que las asociaciones de subtipo eran no aleatoria (Figura 2B). Además, la expresión de subtipo de un tumor se podría predecir sobre la base de lncRNAs subtipo asociado utilizando un clasificador sencillo (Métodos) en la mayoría (77%) de los tumores (Figura 2B).
A, 455 lncRNAs mostraron una mayor o reducción de la expresión en uno de los cuatro subtipos de expresión previamente definidas (200 tumores aleatorias, izquierda). Estos lncRNAs mantuvieron sus patrones de expresión de subtipo selectivo en 200 tumores independientes, y el subtipo no podrían predecirse en base a su expresión en el 77% de precisión (derecha). B, El mismo análisis basado en un subconjunto lncRNA intergénica (
n
= 152, 73% de precisión, izquierda). ascendente cercano y vecinos que codifican proteínas aguas abajo de estos lncRNAs (278 genes únicos) carecían de fuertes patrones de expresión de los subtipos específicos y su firma combinada fue menos informativo del subtipo (51% de precisión, derecha).
análisis antisentido se solapan lncRNA puede mostrar fuertes correlaciones positivas con sus anfitriones de codificación [16], basado en la motivación lncRNAs intergénicas solos. Por ello, investigó un subconjunto de 152 lncRNAs con localización intergénica, y encontramos sus patrones de expresión a ser similar a la serie completa de los datos de validación (Figura 2 B, Tabla S1 S1 en el archivo, el 73% de precisión). Aunque la codificación de genes vecino de los 152 lncRNAs todavía estaban moderadamente predictivo de subtipo (51%), que mostraron patrones de expresión considerablemente más débiles-subtipo específico (Figura 2B). En particular, entre lncRNAs intergénicas inducidas en el subtipo mesenquimales eran
MIAT
/Gomafu, un objetivo conocido y co-activador de Oct4 con un papel en la pluripotencia de células madre [21].
NEAT1
y
UCA1
fueron reprimidos en el subtipo proliferativa:
NEAT1
es esencial para la estructura de paraspeckles nucleares [22] y se ha demostrado ser upregulated en el cáncer de ovario [23], mientras que
UCA1
es un regulador conocido de crecimiento celular en el carcinoma de vejiga [24]. Estamos, además, evaluó los niveles lncRNA en relación con la supervivencia del paciente, pero no encontramos asociaciones reproducibles. Nuestros resultados muestran que los subtipos de expresión en HGS-OvCa, definieron originalmente basado en la codificación de la expresión génica, están asociados cada uno con distintas firmas de expresión lncRNA, y se especula que estos lncRNAs podrían contribuir a la reprogramación transcripcional o actuar de los circuitos celulares que se alteran en estos tipos de tumores.
lncRNAs en las regiones del centro de coordinación alteración número de copias
genomas tumorales son mosaicos de aberraciones cromosómicas, de los cuales algunos están en la selección para activar o inactivar los oncogenes o supresores tumorales específicos. En las grandes cohortes de pacientes, por lo tanto, determinados genes individuales se pueden deducir a través de patrones de recurrencia, en particular, cuando las regiones alteradas son estrechas (focal) [25]. El algoritmo logís-, cuando se aplica al número de copias de datos de cáncer de ovario TCGA, identificó varias regiones del focal-número de copias alteración recurrente [12]. Muchos de éstos abarcan los genes del cáncer conocidos, pero en algunos casos los objetivos aún bien definidos. La hipótesis de que podría ser lncRNAs conductores de algunos de estos eventos, y por lo tanto exhibió regiones focales estrechas de solapamientos con lncRNAs.
Hubo 35 estrecho (superposición con un máximo de 5 codificación de genes) las ampliaciones o supresiones que fueron significativas en el una tasa de falsos descubrimiento (residual
q
) de 0,05 (Figura 3A, el cuadro S2 S1 en el archivo). Muchos se superponen con los proto-oncogenes establecidos, tales como
CCNE1
y
MYC
, y el
RB1
,
NF1
y
PTEN
supresores de tumor, pero lncRNAs también estaban presentes junto con genes de codificación en varios casos (Figura 3A). Aunque la selección de número de copias alteración en estos loci en principio, podría ser explicado por lncRNAs, ya sea solos o en combinación con sus vecinos de codificación [26], nos hemos centrado en cambio en dos picos de actividad que carecían de los genes codificantes de proteínas: una amplificación en 1q25 y una deleción en el cromosoma 4q34 (indicado con * en la Figura 3A). La región suprimida estaba en un gran espacio intergénica ~ 1 Mb de
ODZ3
; un gen descubierto recientemente en la mira de L1 retrotransposition en el cáncer colorrectal [27] y sean eliminados en el neuroblastoma [28]. Mientras que los segmentos eliminados en HGS-OvCa fueron claramente separados de los
ODZ3 Opiniones y abarcaron dos genes lncRNA anotados (Figura S2A en Archivo S1), éstos carecían de expresión relevante (& lt; 5 mapeados lee en & gt; 99% de los tumores) y no puso de manifiesto otros candidatos mediante la investigación de la cobertura de lectura ARN-ss en la región (datos no mostrados). El análisis adicional sugiere que las deleciones pueden ser dirigidos indirectamente a
ODZ3
través de la interrupción de ADN regulador asociado (Figura S2B en File S1), y la región no se caracterizó adicionalmente
.
A, y lncRNAs genes en regiones estrechas de amplificación recurrente o eliminación identificados por logís- de codificación (
q Hotel & lt; 0,05) en 486 tumores HGS-Ovča. se muestran los valores del gen de 35 picos de actividad reducidos con un máximo de 5 genes que codifican la superposición. los genes del cáncer conocidos y objetivos inequívocos de codificación se indican. *, Regiones investigadas en más detalle. B, vista detallada de la
ACBD6 CD -
Xpr1
región intergénica (región AXI, línea punteada) en un ~ 1 Mb contexto genómico. El pico central AXI se centra en
RP11-522D2.1 /OVAL de
, un lncRNA no caracterizada en chr1q25. El sombreado rojo muestra los perfiles del número de copias de los tumores individuales. C, tumores ordenado por
OVAL de
expresión.
OVAL de
ARN (eje y) era en su mayor baja o indetectable, pero se indujo en los casos de manera focal amplificados (como se define en Métodos). D, Ni
ACBD6
ni
Xpr1
fueron inducidos en particular mediante la amplificación de la región focal AXI.
OVAL de
ARN fue baja también en los casos en términos generales amplificados. ND, no detectado. E, media densidad lectura RNA-seq en la región AXI (línea de puntos) para los tumores con marcada AXI amplificación focal (
n
= 10) en comparación con los tumores restante (recuentos de lectura normalizada por 1.000 segmento nt). F, el análisis mostró que GSEA determinado experimentalmente P53 genes regulados son inducidas en los tumores
OVAL de manera focal
amplificado.
amplificación somática focal de OVAL de lncRNA
A continuación se investigó la 1q25 amplificación, que fue adquirida de manera focal en 16/407 pacientes (3,9%), y se centra en una región intergénica 128 kb entre el
ACBD6
y
Xpr1
genes (de ahora en adelante la región AXI). La región AXI carece de genes codificadores de proteínas, pero contiene un único gen lncRNA anotada,
RP11-522D2.1
, cerca de su centro (Figura 3B). Este lncRNA, que aquí llamamos
ÓVALO gratis (adenocarcinoma de ovario amplificado lncRNA), coincide estrechamente con el pico central identificado por logís-, y se coloca 55 kb y 65 kb de los vecinos de codificación que codifican proteínas más cercanas. En particular, los segmentos cromosómicos amplificados eran a menudo pequeñas (50 a 100 kb) y abarcan la plena
OVAL de
gen, mientras que estar limitado a la región AXI o se extiende sólo parcialmente en los genes vecinos (Figura 3B).
Dado que el patrón de amplificación de ADN focal señaló
OVAL de
como el gen alteración de conducción en esta región, el próximo investigó si esto fue apoyado por el patrón de expresión de
OVAL de
en el tumores.
OVAL de
expresión fue baja o ausente en tanto trompa de Falopio normal (Figura S3 en S1 de archivos) y en la mayoría de los tumores, incluyendo la mayoría de los casos con amplificación 1q ancho. Sin embargo, la amplificación focal de la
OVAL de
locus coincidió notablemente con
OVAL de
activación transcripcional (Figura 3C).
OVAL de
ARN fue en promedio 46 veces mayor en los casos focales en comparación con las muestras restantes (
P
= 3.5e-8, Wilcoxon rango suma de prueba), y
OVAL de
puesto 74º de todos los lncRNAs GENCODE siempre con la máxima expresión en todos los tumores (Tabla S3 S1 en el archivo). Se obtuvieron resultados similares utilizando datos Exon 1.0ST basadas en hibridación (Figura S4 en Archivo S1).
A pesar de que la amplificación focal región AXI no parecía dirigirse directamente a los genes codificantes de flanqueo, éstas podrían todavía ser afectados indirectamente en el nivel de expresión génica. Esto sería compatible con sus secuencias reguladoras ser modificadas o
OVAL de
tener un
cis-regulador
papel en el control de su transcripción. Sin embargo, ni
ACBD6
ni
Xpr1
fueron inducidos en particular en los casos de manera focal amplificados (Figura 3D). Además, estos genes no se describen anteriormente como alterados en el cáncer, apoyando además que
OVAL de
está dirigido de manera independiente en la región intergénica AXI.
Investigación de la cobertura de lectura ARN-ss en la región AXI revelado que
OVAL de
fue el principal locus expresado en tumores focalmente amplificados, mientras que las muestras restantes mostraron baja actividad transcripcional en esta región (Figura 3E). Aunque se observó la transcripción adicional fuera de la
OVAL de
locus, sobre todo en la región aguas arriba (Figura 3E), estas señales no fueron consistentes entre los tumores individuales (Figura S5 en S1 Archivo). El examen de los datos disponibles en el Genbank reveló sólo unas pocas secuencias EST singulares de la región AXI de distancia del centro focal, mientras que
RP11-522D2
.
1 | /
OVAL de
era el apoyo de 12 ESTs empalmados y 6 secuencias de ADNc. Una supuesta Y-ARN (previstas a partir familias RFAM), cerca del borde región AXI 50 kb desde el pico de actividad, no fue apoyada por la evidencia de cDNA /EST o ARN-ss en los tumores o tejidos normales (datos no mostrados). Llegamos a la conclusión de que ambos HGS-Ovča perfiles de expresión tumoral y disponibles cDNA /EST pruebas apuntan a
OVAL de
como la unidad principal de forma estable en la región transcrita AXI amplificado.
El análisis conjunto de genes de enriquecimiento (GSEA) revelaron que los objetivos previamente definidos de P53 (TANG_SENESCENCE_TP53_TARGETS_DN) fueron significativamente elevados en
OVAL de
tumores amplificados (Figura 3F). Si bien esto indica que
OVAL de
activación puede coincidir con la actividad de p53 alterada,
TP53
estado de la mutación y los niveles de mRNA fueron similares en ambos grupos. Los genes que codifican las proteínas contráctiles relacionados con los músculos (STRUCTURAL_CONSTITUENT_OF_MUSCLE) fueron enriquecidos entre los reprimida en
OVAL de
tumores amplificados.
Caracterización molecular de OVAL de
Después de haber establecido
ÓVALO
como un objetivo probable en la región AXI, que caracteriza adicionalmente este gen en términos de la estructura del gen y la expresión de tejido normal. El gen
OVAL de
contiene tres exones anotado que dan lugar a un ARN de 1489 nt no codificante predicha, donde la gran tercera exón contribuye la mayor parte de la secuencia. Esta estructura fue apoyada por múltiples secuencias de GenBank mRNA (Figura 4A) y ESTs empalmados, así como RNA-seq partir de líneas celulares tales como Gm12878 (datos no mostrados). Muchos de los
OVAL
EST y ARNm se originó a partir de células de melanoma humano, y por lo tanto la transcripción fue identificado en una pantalla de bioinformática reciente de tecnologías ecológicas públicos específicos de melanoma [29].
OVAL de
también fue mapeado en una reciente encuesta de lncRNAs intergénicas humanos [19], y similar a nuestro propio análisis de los datos de RNA-seq tejido normal, este estudio identificó una isoforma primera alternativa exón (Figura 4A) no se admite por los datos de expresión tumoral. Aunque se observaron patrones de empalme adicionales posibles en los tumores, éstos mostraron una expresión débil e inconsistente a través de muestras (datos no mostrados).
A,
OVAL de
locus en el cromosoma 1. GenBank ARNm, la transcripción conservada sitios de unión al factor (TFBS) predijeron por la UCSC Brower, y otras características se indican. B, perfil de expresión de tejido normal de
ÓVALO gratis (ARN-ss). expresión del corazón fue confirmada por PCR de transcripción inversa. PC3, línea celular de cáncer de próstata humano; Corazón, aurícula del corazón; A7, la línea celular de melanoma humano C,
OVAL de
y sus vecinos tienen perfiles de expresión de codificación dispares. D, subcelular de ARN-ss del 7 agruparon líneas celulares (Gm12878, HeLaS3, HepG2, Huvec, H1hesc, Nhek y K562) muestra predominante localización citoplasmática.
Conservación evolutiva, basada en una alineación múltiple de mamífero genómico , era bajo en general, pero las regiones específicas en el último exón demostró conservación elevada (Figura 4A). La base de datos de sitios diana miRcode microRNA putativos en lncRNAs [30] reveló una miR-30 sitio conservado, presente en la mayoría de los primates y mamíferos, en uno de estos parches. Aunque la secuencia madura es principalmente no repetitivo, RepeatMasker [31] identificado THE1A-int LTR y elementos LINE derivado L2b, así como una posible secuencia snRNA U2 en el último exón (Figura 4A). Sin embargo, no se encontraron coincidencias con snARNs u otras estructuras conocidas en RFAM [32], y
tanto, es improbable OVAL de
para funcionar como un precursor para un ARN estructural clásica.
lncRNAs han sido previamente definido sobre la base de las puntuaciones de frecuencia de sustitución de codón y la falta de un marco de lectura abierto (ORF) más grande que 100 aminoácidos [1]. Además de ser clasificado como no codificante por la tubería GENCODE, la madura
OVAL de
secuencia era no codificante de acuerdo con el algoritmo de CPC [33] y el uso de PhyloCSF [34] sobre la base de un alineamiento de los mamíferos. ORFs en
ÓVALO in todos carecen de la secuencia Kozak consenso y no más de 98 aminoácidos son. Un reciente análisis conjunto de masas en tándem datos de espectrometría y secuencias GENCODE lncRNA, incluyendo
RP11522-D2
.
1 | /
OVAL de
, identificado sólo un único partido lncRNA si se excluye misannotated casos, el apoyo a una falta general de capacidad de codificación de estas transcripciones [35]. Es importante destacar que ninguna homología con ninguna secuencia de la proteína conocida fue revelada por el análisis BLASTx. por tanto, una función de codificación parece improbable, y llegamos a la conclusión de que
OVAL de
ha probablemente representa un
de buena fe
lncRNA.
ARN-ss a partir de tejidos humanos normales mostró que
ÓVALO
se expresa selectivamente en el músculo cardiaco, y esto fue confirmado por PCR de transcripción inversa (Figura 4B). Dos putativo factor de 2 conservada miocitos potenciador (MEF2) sitios, situados cerca de la alternativa primera exón (Figura 4A), unión puede conducir la expresión en el tejido muscular, ya que tanto el músculo cardíaco y células humanas de mioblastos de músculo esquelético (HSMM) exclusivamente expresar esta alternativa isoforma (datos no mostrados). El
OVAL de
patrón de expresión es marcadamente diferente de sus vecinos de codificación (Figura 4C), y su localización subcelular fue predominantemente citoplasmática (Figura 4D). Esto habla más en contra de un
cis-regulador
función de genes cercanos, y es coherente con nuestra conclusión de que
OVAL de
amplificación no influyó notablemente su expresión (Figura 4D). En resumen,
OVAL de
parece tener una función no codificante citoplasmática que es independiente de sus vecinos codificantes de proteínas.
amplificación ovales en carcinomas de endometrio serosas
A continuación se investigó si
OVAL de
amplificación es única para el cáncer de ovario, y los perfiles del número de copias considerados a partir de 16 cánceres TCGA adicionales, que varían en tamaño de 57 a 825 tumores. Curiosamente, se observó amplificación de baja frecuencia central de la
OVAL de
locus también en el carcinoma endometrioide cuerpo uterino, mientras que no hay ninguna señal obvia focal se observó en los cánceres restantes (Figura S6 en S1 Archivo). Una inspección más detallada reveló que el pico central de nuevo coincidió estrechamente con el
OVAL de
gen (Figura 5A).
A, Baja frecuencia de amplificación focal de la
OVAL de
locus en el cáncer de endometrio , pero no en otros tipos de cáncer TCGA 16 (véase la Figura S6 en S1 archivo). B, 56% de los casos de manera focal amplificados eran del subtipo seroso, comparado con el 21% del total (
P
= 0,025, prueba exacta de Fisher). C,
OVAL de
RNA se indujo fuertemente en un subconjunto de tumores, y esto coincidía con la amplificación de la región focal AXI. ND, no detectado. D, la densidad media de lectura de ARN-ss en la región AXI para los tumores con amplificación focal indicada (
n
= 4) en comparación con los tumores restantes (recuento de lectura normalizada por 1000 nt segmento). E, igual que en el cáncer de ovario, el análisis reveló GSEA inducción de p53 objetivos en los tumores
OVAL de
amplificado.
Una fracción de los tumores endometriales se clasifican como serosa o serosa similar. Estos tienen un gran parecido morfológico a su homólogo de ovario [36], y también son genéticamente similares al cáncer de ovario [37]. En consecuencia, se observó que los tumores del subtipo seroso eran & gt; 4 veces más probabilidades de llevar a
OVAL de
amplificación focal en comparación con los tumores no serosas (5/91 versus 4/331,
P
= 0,025, Figura 5B). Al igual que en el cáncer de ovario, la amplificación focal de la región AXI se asoció con fuerte aumento de la expresión de
ÓVALO gratis (Figura 5C), y la cobertura de lectura ARN-ss mostró que
OVAL de
fue transcrito a la unidad principal en la región (Figura 5D). GSEA análisis reveló que los genes P53 regula determinados experimentalmente se upregulated en
OVAL de
muestras amplificadas, replicando los resultados previos de cáncer de ovario (Figura 5E). Tomados en conjunto, los resultados de cáncer de ovario y de endometrio sugieren que se selecciona
OVAL de amplificación para
específicamente en los tumores serosos independientemente de la localización del tumor.
Conclusiones
lncRNAs han sido previamente ensayadas en materiales clínicos utilizando la secuenciación de próxima generación, incluyendo un estudio reciente de 64 carcinomas y sarcomas utilizando el extremo 3 'de secuenciación [38], y la secuenciación del transcriptoma de 102 tejidos de la próstata y líneas celulares [10]. Además, lncRNAs se perfila en los tejidos normales y cancerosas basado en 272 SAGE bibliotecas públicas [39]. El presente análisis es el primero en hacer uso de TCGA RNA-seq al perfil lncRNAs en el cáncer, y para facilitar la investigación futura que hacemos perfiles moleculares lncRNA para los tumores del TCGA disponible en www.larssonlab.org/tcga-lncrnas.
Sólo hay pruebas limitadas para somática focal número de copias alteración de lncRNAs en el cáncer, y describe los casos se trata lncRNAs que son co-alterados con genes del cáncer de codificación proximales. Dos lncRNAs en el
LSAMP
locus supresor de tumores en el cromosoma 3q13,
OC285194
y
BC040587
, fueron con frecuencia de manera focal eliminado en el osteosarcoma, a menudo junto con
LSAMP
[26]. Estos lncRNAs se coexpresan con
LSAMP
, y los tres genes pueden funcionalmente interconectados. La
PVT1
locus en 8q24, lo que da lugar a una variedad de los ARN no codificantes empalmados, a menudo se co-amplificado con el cercano
MYC
oncogén [40,41]. Sin embargo, con el tiempo se ha hecho evidente que
PVT1
codifica varios microRNAs, y por lo tanto su función principal podría ser la de un precursor de microARN [42,43].
En el caso de
RP11 /522D2.1 /OVAL de
, varias observaciones independientes designar como un objetivo independiente de la amplificación génica somática. Se encuentra en el centro de un segmento del IGS mediante estrecho que carece de otros genes anotados, y el pico central estrechamente coincide con el gen
OVAL de
. la cobertura de RNA-seq lectura, así como ADNc disponibles y EST pruebas, no pudieron revelar otros candidatos creíbles en la región. Focal, pero no amplia, amplificación coincidió con una fuerte inducción de
OVAL de
ARN.
OVAL de
no fue co-expresada con sus vecinos de codificación, ninguno de los cuales están previamente asociados con el cáncer y el más cercano está a más de 50 kb de distancia, y
OVAL de
amplificación no alteró notablemente su expresión . Esto, en combinación con una localización predominantemente citoplasmática, habla en contra de
OVAL de
tener un
cis-regulador
papel de los genes vecinos. La replicación de estos patrones en el cáncer de endometrio serosa refuerza la hipótesis.
amplificación focal de la región AXI es relativamente poco frecuente (3,9%), y las ganancias de amplitud generalmente bajos. Sin embargo, HGS-OvCa se caracteriza por una gran diversidad mutacional, con una relativa falta de alteraciones de conducción frecuentes individuales, y la frecuencia es comparable a alteraciones funcionales conocidos, tales como BRCA1 y BRCA2 mutación somática (3,5% y 3,2%, respectivamente [44]) .