Extracto
RNU2 existe en dos formas funcionales (RNU2-1 y RNU2-2) distinguibles por la presencia de un único motivo de 4 bases. La investigación detallada de los conjuntos de datos obtenidos a partir de secuenciación profunda de cinco tumores primarios de pulmón humano reveló que ambas formas expresan a un ritmo elevado un fragmento 19-22nt (miR-U2-1 y -2) de su región 3 'y contiene las 4 bases de adorno . secuenciación profunda de piscinas independientes de muestras de suero de donantes sanos y pacientes con cáncer de pulmón reveló que miR-U2-1 y -2 se procesan penetrante en el tejido pulmonar por medio de divisiones endonucleolytic y de forma estable exportan a la sangre. Entonces, los experimentos de microarrays de hibridación de muestras normales /tumorales emparejados revelaron un significativo exceso de expresión de miR-U2-1 en 14 de 18 tumores primarios de pulmón. Posteriormente, QRT-PCR de miR-U2-1 utilizando suero de 62 pacientes con cáncer de pulmón y 96 diferentes controles demostraron que sus niveles de expresión de identificar a los pacientes con cáncer de pulmón con una sensibilidad de 79% y 80% de especificidad. expresión miR-U2-1 correlaciona con la presencia o ausencia de cáncer de pulmón en pacientes con enfermedad pulmonar obstructiva crónica (EPOC), otras enfermedades del pulmón - no cáncer, y en controles sanos. Estos datos sugieren que RNU2-1 es un nuevo ncRNA bi-funcional que produce un fragmento 19-22nt que puede ser útil en la detección de cáncer de pulmón no invasiva en pacientes de alto riesgo
Visto:. Mazières J, C Catherinne , Delfour O, S Gouin, Rouquette I, Delisle MB, et al. (2013) Tratamiento alternativo de la Pequeña U2 ARN nuclear produce un Fragmento 19-22nt pertinente para la detección de células no pequeñas de cáncer de pulmón en suero humano. PLoS ONE 8 (3): e60134. doi: 10.1371 /journal.pone.0060134
Editor: Liang Hu-Qu, Universidad de Sun Yat-sen, China
Recibido: 23 Noviembre 2012; Aceptado: February 21, 2013; Publicado: 20 Marzo 2013
Derechos de Autor © 2013 Mazières et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este programa , más en particular la extracción de sangre, el apoyo de una beca del Consejo regional de Midi-Pyrénées. Los donantes no tenía papel en el diseño del estudio, análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:. Los autores declaran que no tienen intereses en competencia. La afiliación de varios autores para Cepheid Compañía no altera la adhesión de los autores a todas las políticas de PLoS ONE.
Introducción
La exploración del ARN no codificante de proteínas (ncRNA) en transcriptoma células y tejidos humanos durante mucho tiempo ha sido enfocado en perfiles de microARN. La aparición de las tecnologías de secuenciación de próxima generación de alto rendimiento (NGS) ha permitido la identificación de nuevos tipos de ncRNAs y allanó el camino para el estudio de sus asociaciones funcionales [1]. La mayoría de las nuevas especies de NcRNA están ahora descubierto usando NGS se acerca [2] - [5]. Puesto que se cree que ncRNAs funcionales a ser protegidos de la degradación en virtud de su asociación con proteínas y embalajes en partículas, y por lo tanto son estables, NGS ofrece la ventaja única de ser capaz de detectar la expresión simultánea de miles de pequeños transcritos de ARN funcionales en una sola tipo de tejido, revelando un nuevo nivel de complejidad en la producción de pequeños ncRNAs en las células humanas, los tejidos y órganos en diversas condiciones fisiológicas [2], [4], [8]. La muy alta sensibilidad de los métodos de NGS también ha permitido el descubrimiento de 'isomirs' no detectadas previamente producidas por mecanismos de edición post-transcripcional, de un solo nucleótido no molde 3 'adenosina o adiciones de uracilo que sirve como un ejemplo [6], [7]. Por otra parte, se ha demostrado recientemente que una sola ncRNA puede generar diferentes productos no simplemente a través de la degradación de azar, sino a través de la sintonización específica de las múltiples etapas de procesamiento que implican Dicer [9] u otras enzimas [10], [11]. Tal procesamiento alternativo ncRNA podría explicar cómo un único transcrito primario ncRNA podría favorecer más de una función, análogo al corte y empalme alternativo de los transcritos de pre-ARNm. Por lo tanto, la creciente colección de ncRNAs bifuncional está ofreciendo una nueva visión de la biología humana como se ve a través del lente de NGS
.
Estas clases recién descubiertos de pequeños ARN producido por ncRNAs con otra cuota función de algunas características en común con microARN. En la actualidad existe una amplia evidencia de que varios tRNAs producen derivados ARNt-ARNs pequeños reguladoras (smRNAs) [9], [11] - [13]. ARN pequeños abundantes 18-22 nt de longitud, se procesan de ambos extremos 5 'y 3' del ARNt maduros, así como de las regiones del remolque 3 'de pre-ARNt. La madura 3 'población (también denominado tipo I) se encontró que era dependiente de Dicer y complejado con Argonautes 1-4. En contraste, la población de remolque la pre-tRNA 3 '(Tipo II) es Dicer independiente y aparentemente implica la acción de la RNasa Z. Además, se encontró que los ARN de tipo II a ser complejado con Argonautes 3 y 4 y en un grado mucho menor a Argonautes 1 y 2 [13]. Concentrado en nucleolos, varios snoRNAs función en el procesamiento de ARN ribosómicos (ARNr) durante la biosíntesis de la subunidad de ribosoma y el montaje. Sin embargo la mayoría de ellos sirve como guía para la modificación enzimática de rRNAs objetivo y ARNsn U6 spliceosomal en los nucleótidos seleccionados por ARN: interacciones ARN antisentido [14], [15]. SnoRNAs se clasifican en dos grupos, los /caja D snoRNAs C que catalizan 2 'O ribosa metilación [16], y los snoRNAs la casilla H /ACA que introducen modificaciones pseudouridine [17]. bioinformática recientes analizan las bibliotecas de ARN pequeños han sugerido la existencia de smRNAs derivados de algunos de los snoRNAs tras su procesamiento [18] - [21]. H /ACA y C de la caja /D derivado ncRNAs utilizan vías biogénesis divergentes, dependiendo del tipo de precursor snoRNA siendo procesada [21] - [23]. derivados de ACA H /ncRNAs son predominantemente 20 a 24 nt de longitud y se originan desde el extremo 3 '. Su producción es independiente de Drosha, pero requiere la acción de Dicer [18]. En contraste, la C /D derivado ncRNAs son o bien 17 a 19 nt o & gt; 27 nt de longitud y predominantemente se originan a partir del extremo 5 '[21]. La gran variedad de sus estructuras secundarias, sugiere procesamiento independiente Dicer basado en la actividad endonucleasa de Ago2 similares de procesamiento de pre-miR-451 [24]. Varios ejemplos de smRNAs derivados de ARNt o snoRNA precursores ya se han demostrado tener posibles funciones biológicas [9], [11], [27], [28].
Short lee también se producen a partir de una amplia variedad de otros tipos de ncRNAs estructurados como 7SL, 5S, Y1 e Y3 [25]. Los ARN de bóveda que están implicados en la resistencia a múltiples fármacos y el transporte intracelular en los seres humanos han sido recientemente demostrado para producir un grupo de ~ 23-nt ARN en una etapa de procesamiento Drosha-independiente, sino mediada por Dicer [26]. Una de la bóveda-deriva ncRNAs se une a las proteínas Argonaute y media la escisión de ARNm, que mimicing principales características de micro-ARN-como.
Todos estos ejemplos sugieren que el procesamiento alternativo de ncRNAs puede representar un importante mecanismo por el cual se logra la diversidad funcional para ncRNAs, y además implica que la nueva capa de la influencia y el control regulatorio impuesto por ncRNAs en la expresión génica puede ser fundamental para la biología. Uno sólo puede imaginar el impacto potencial de smRNAs derivado de ncRNAs con otra función en la expresión de los intermediarios metabólicos en diferentes estados fisiológicos, así como la influencia de los principales mediadores de la transducción de señales en los estados fisiopatológicos alterados, tales como el cáncer.
a diferencia de snoRNAs y tRNAs, se conoce poco acerca de ARNsn que son componentes del complejo spliceosome, dirigiendo la eliminación precisa de secuencias intrónicas de pre-ARNm [29]. Sin embargo, recientes experimentos NGS sugirieron que snARNs spliceosomal U1, U2, U6 y U12 se acumulan pequeñas secuencias de ARN [25], mientras que la inmunoprecipitación con proteínas Argonaute permitió la identificación de fragmentos de ARN con destino Ago-de U1, U2 y U12 [30]. Más recientemente, se demostró que un fragmento de RNU2-1 sobreexpresado en los cánceres de páncreas y colorrectal en relación con el tejido normal de esos órganos [31]. Para entender mejor si la expresión de fragmentos pequeños ncRNA resultantes de procesamiento alternativo están asociados con la presencia de la enfermedad, que mide los niveles de los fragmentos producidos por la U2 snRNA por varias metodologías en el tejido pulmonar y el suero de los pacientes con cáncer de pulmón, y ellos en comparación con los niveles RNU2 en el suero de pacientes con riesgo de cáncer de pulmón (pacientes con EPOC), así como los sujetos de control sanos normales. RNU2 es uno de los ncRNAs más altamente expresado y que se expresa preferentemente en el tejido pulmonar [32]. NGS se combinan, los experimentos de hibridación de microarrays y QRT-PCR, se realizó un análisis detallado de smRNAs RNU2 derivadas de tumores primarios de pulmón, emparejado tejido pulmonar normal adyacente de los mismos pacientes, y las muestras de suero de pacientes con cáncer de pulmón y los sujetos control sanos, así como controles con otras enfermedades pulmonares - no cancerosas. Los resultados sugieren que miR-U2, un producto 19-22nt de procesamiento alternativo RNU2, permite la discriminación de pacientes con cáncer de pulmón de aquellos con EPOC pero no el cáncer, y plantea la posibilidad de que las mediciones a base de suero de los niveles de miR-U2 podrían ser utilizado como una herramienta de detección no invasiva y rentable, pronto para seleccionar a los pacientes para una evaluación adicional con diagnóstico avanzadas de imagen como la tomografía computarizada espiral.
Materiales y Métodos
Las muestras Colección
Las muestras de tejido y muestras de suero se recogieron en el hospital y el hospital Rangueil Larrey, Toulouse, Francia. escrito el consentimiento informado se obtuvo de todos los individuos antes de su inscripción en este estudio, y el estudio fue aprobado por las juntas de revisión institucionales apropiadas. Todos los registros fueron convertidos en datos anónimos para proteger la confidencialidad individual. Se recogieron datos clínicos para cada individuo en el momento de tejido o extracción de sangre. El estadio clínico se determinó de acuerdo con el 7
ª Asociación Internacional para el Estudio del Cáncer de Pulmón sistema [33] puesta en escena. Durante ocho pacientes de los dieciocho que fueron operados de cáncer de pulmón, tumor primario sincronizado y muestras de tejidos normales distales fueron recogidos. La sangre de los pacientes de cáncer de pulmón se recogió en el momento del diagnóstico, pero antes de la resección del tumor o ningún tratamiento específico. Se recogieron cinco ml de sangre de cada individuo en tubos SST e inmediatamente procesadas. Los tubos se mezclaron mediante un par de inversiones, y luego poner a temperatura ambiente durante 30 min para la coagulación. Los tubos se centrifugaron a continuación (1,000 g a 4 ° C) durante 10 min. Finalmente, la fracción de suero se dividió en alícuotas en tubos de 1 ml y se almacenó inmediatamente a -80 ° C hasta el momento de uso. 45 muestras de control sanos también se adquirieron de Asterand y se procesan de una manera idéntica. Hemos organizado esta cohorte en cinco grupos. Tres grupos de control contienen individuos sin cáncer de pulmón: 1) sólo las personas sin ningún síntoma de la enfermedad en el momento de la extracción de sangre. Pueden ser considerados individuos "sanos". 2) pacientes con una enfermedad pulmonar que no es EPOC. Este grupo está compuesto principalmente por personas que sufren de asma, bronquitis e infecciones pulmonares. 3) pacientes con EPOC sin evidencia de cáncer de pulmón en el momento de la extracción de sangre. Los pacientes con un cáncer de pulmón se dividieron en dos grupos: 1) todos los pacientes con cáncer de pulmón sin ningún tipo de síntomas de la EPOC, y 2) los pacientes que padecen tanto un cáncer de pulmón y la EPOC
Extracción-Purificación de ARN
.
se extrajo ARN de 0,5 ml de suero utilizando el mini kit Qiagen miRNeasy, de acuerdo con las instrucciones del fabricante. Se añadió una espiga-en el control (Cel-miR-39) después del primer paso de desnaturalización.
archivado o recién se congelaron muestras de tejido se homogeneizaron por el mortero y una maja en TRIzol® de reactivos Life Technologies (Carlsbad, CA ) y el ARN se extrajo de nuevo de acuerdo con el protocolo del fabricante. La fracción pequeña de ARN fue extraído utilizando el flash PÁGINA fraccionador (Ambion). Todas las muestras de microARN se diluyeron en agua libre de RNasa y se almacenaron a -80 ° C.
secuenciación profunda y tratamiento de datos
Se llevaron a cabo la preparación de la biblioteca y la secuencia de experimentos utilizando ARN purificado a partir de muestras de tejido o suero por Fasteris (Suiza). En resumen, fragmentos de ARN (16 a 30 nt o 25 a 50 nt) se purificaron en gel seguido de la ligadura de ARN de una sola hebra 3 'y 5' adaptadores. Una etapa de purificación en gel de acrilamida se realizó antes de la transcripción inversa y la amplificación por PCR para generar la biblioteca de plantillas colonia ADN. ADNc se purificaron en gel y la biblioteca se cuantificó antes de la dilución a 10 nM. Las bibliotecas de ADNc diluidos fueron secuenciados utilizando la tecnología Illumina HiSeq. La secuencia de lecturas fueron procesados por una combinación de algoritmos bioinformáticos y curación manual para eliminar los adaptadores 'y 3' 5 (Tabla S7). Sólo las lecturas de 19nt largo o más después de la extracción del adaptador fueron seleccionadas para su análisis. El 5 'y 3' desajustes fueron recortados hasta que encaje perfecto, lee partido. Lee de las diferentes bibliotecas se normalizaron usando el número total de lecturas en cada biblioteca y se expresó como lecturas por millón (RPM) con el fin de comparar los niveles de expresión relativos. Sólo lee con un partido único en el genoma humano se utilizaron (NCBI construir 37). Por lo tanto, lee mapeo para genes funcionales RNU2 mapa a ninguna otra localización genómica. No se les permitió desajustes internos. Para una mayor confianza, sólo el ARN con un mínimo de cinco RPM fueron considerados para analizar más a fondo.
Los experimentos de hibridación microarrays
Nexterion (Schott) portaobjetos de vidrio microarrays se utilizaron como soporte sólido para el microarray. Costumbre en casa diseñado oligonucleótidos fueron vistos en su superficie. El etiquetado de los microARN se adaptó de Castoldi et al. 2006 [34]. La fracción microARN marcado se hibrida con las manchas arrays utilizando la estación de Descubrimiento de hibridación (Ventana, Tucson, AZ). Las matrices fueron escaneados utilizando el escáner Axon (Molecular Devices, Sunnyvale, CA) y se recogieron datos utilizando GenePix software. Seis en casa diseñada espiga-en los controles internos fueron utilizados para normalizar los datos. Estos controles de ARN sintéticos se añadieron a la fracción de ARN total antes de la hibridación. Todas las secuencias para los que la intensidad de la mancha fue mayor que la intensidad de fondo local de media más de 1,5 veces su desviación estándar se clasificaron como microRNAs expresadas. normalización estadística de los datos se realizó mediante el cálculo de la relación de registro
2, donde el registro de relación 2 = señal de intensidad media
de los puntos duplicados /intensidad mediana de todos los controles internos para el bloque. La normalización se realizó por bloque para evitar el etiquetado no homogénea (Tabla S4). Microarray datos fueron analizados utilizando el paquete R Bioconductor [35]. La expresión relativa de cada uno de microARN se calculó utilizando la 2
-ΔΔCT método [36]. El "MeV 4.8.1" (MultiExperimentViewer) [37] se utilizó para el análisis de agrupación jerárquica, donde los seleccionados miRNAs se agruparon utilizando la distancia euclídea.
QRT-PCR de la expresión de miR-U2
Expresión niveles de miR-U2-1 se evaluaron mediante qRT-PCR usando el Exiqon encargo LNA
TM cebadores (Exiqon, Vedbaek, Dinamarca) según las instrucciones del fabricante. Aunque los cebadores fueron diseñados para detectar la isoforma UGGAUUUUUGGAGCAGGGAG los cebadores Exiqon permiten la detección de las otras isoformas (Tablas S5 y S6). Los experimentos se realizaron por triplicado. Debido a la falta de limpieza de suero pequeños ncRNAs, que normalizó la concentración microRNA al volumen inicial de suero (500 l). Un control de espiga-en exógena (Cel-miR-39) también se utilizó con el fin de comprobar la solidez de los resultados. Se calculó la matriz de valores de Ct para cada muestra sustrayendo el valor del número de ciclo umbral (Ct) para MIR-U2 desde el valor Ct de Cel-miR-39. Se utilizó un análisis unidireccional de la varianza (ANOVA) para el análisis estadístico comparando las poblaciones de la muestra y los grupos de control. El área bajo la curva (AUC) se calculó para las curvas de operador receptor (ROC). Los resultados determinaron utilizando la normalización al-miR-39-Cel pico y se normaliza al volumen de suero se compararon.
Resultados y Discusión
tumores primarios de pulmón altamente expresan una NcRNA 19-22nt transformados a base de RNU2
El genoma humano codifica dos genes de ARNsn U2 funcionales, RNU2-1 y RNU2-2 que se encuentra en 17q21.31 y 11q12.3, respectivamente. La organización genómica de los dos genes RNU2 difiere radicalmente. RNU2-2 está presente en una sola copia, mientras que RNU2-1 está organizado en un grupo de 6 a ~ 30 copias repetidas en tándem que abarcan de 30 a 150 kb. Cada unidad de repetición es de 6,1 kb de longitud, contiene un único gen RNU2-1 y es altamente conservadas con otras unidades de repetición. Aunque RNU2-1 difiere en el número de copias de genes de un individuo a otro, las matrices se heredan de forma estable, sin perjuicio de la compensación de dosis y transcritas a una tasa inusualmente alta. Con el fin de descubrir si los pequeños ncRNAs pueden ser procesados de manera efectiva a partir de los dos genes RNU2 funcionales y para delinear tales productos precisamente, la secuencia del ARN pequeño transcriptoma de cinco tumores primarios cáncer de pulmón humanos, así como tres grupos de muestras de suero, uno de donantes sanos y dos de los pacientes de cáncer de pulmón (Tabla 1). La secuenciación de muestras relacionadas en paralelo reduce al mínimo la tasa de falso descubrimiento de ncRNAs. ncRNAs que son verdaderamente expresó sobre-sería de esperar que se encuentran en múltiples muestras independientes. En un primer paso, estudiamos las operaciones de lectura secuencial de siete bibliotecas preparadas a partir de tumores primarios, cinco corta tamaño (16-30nt) y dos de largo tamaño (25-50nt) directamente sobre la secuencia de ARN de los genes funcionales RNU2. El locus en el cromosoma 17 RNU2-1 en realidad estaba retirado de la asamblea del genoma humano desde la versión Build 37 (NCBI anotación Información Gene ID: 6066, modificada el 20 de abril de 2012). La gran mayoría de las lecturas de las cinco bibliotecas de tamaño cortas asigna a una ubicación única entre las posiciones 93 y 114 de RNU2-1 (Fig. 1a-b). Los rangos de más altamente expresado lee desde 19 a 22nt de longitud. Este fragmento de ARN se denomina miR-U2-1. Sorprendentemente, la secuenciación de ARN pequeño de los tres grupos de muestras de suero demostró que miR-U2-1 está presente en la circulación de la sangre en los dos pacientes con cáncer pulmonar y sujetos sanos, revelando su penetrante expresión (Fig. 1C-d). Estos datos sugieren que miR-U2-1 se exporta activamente en lugar de pasivamente libera en la circulación. Sólo se ha detectado en efecto un subconjunto de miRNAs fuera de las células [38] - [41]., Por lo que el miR-U2-1 puede representar un miembro adicional de esta clase
Pequeño lee detectado en tumores primarios (a) y las muestras de suero (C). Largo lee detectado en tumores primarios (e). El código de color muestra el número de normalizado lee detectó en cada biblioteca. La línea roja localiza miR-U2. El número de lecturas de acuerdo a su tamaño se da en (b) para los tumores primarios, en (d) de las muestras de suero.
Entre la población de lecturas presentes en los tumores primarios como así como en el suero, se observó una acumulación de fragmentos de ARN a partir de la posición "a-94" o "a-95" y que termina en la posición "G-113" o "a-114" (Fig. 2). Este número limitado de extremo 5 'y 3' lee corresponde a una población definida y pequeño de variantes o isomirs, una característica común de microRNAs. En conjunto, estos isomirs miR-U2-1 representan más del 75% de las lecturas a juego exclusivamente a esta región de RNU2-1. Sus niveles de expresión están en el rango de microRNAs canónicos como miR16, miR-17, miR-200a o miR-451 (Tabla S1). Esta acumulación significativa de un fragmento de ARN única y bien escinde de RNU2-1 representa una clara evidencia a favor de la hipótesis de que los eventos de procesamiento específicas producen un nuevo ncRNA funcional, miR-U2-1, en lugar de la explicación alternativa, que estos son los productos aleatorios de la degradación del ARN. Estos resultados indican además que miR-U2-1 está protegido contra la digestión endo- y exo-nucleolítica RNasa en virtud de los envases en partículas de nucleoproteína complejos. miR-U2-1 también puede ser envuelto en pequeñas partículas membranosas (exosomas, microvesículas, cuerpos apoptóticos) antes de la exportación a la circulación. La mayoría de los microARN detectables en el suero de hecho se concentra en los exosomas [42], aunque algunos simplemente pueden estar asociados con las proteínas [43]. En conjunto, esto sugiere que los eventos de procesamiento que producen miR-U2-1 representan procesos biológicos esenciales en humanos.
(A) indica leído detecta la secuencia de cada uno y el número normalizado de cada lectura se da para cada tumor muestra. (B) El número total de cada tipo de lectura se muestra como un histograma. Histogramas (c) y (d) muestran el número de lecturas en las diversas aperturas 5 'y 3' de miR-U2 respectivamente.
Las secuencias de los genes RNU2-1 y RNU2-2 (187 nt) son altamente conservados. Las diferencias entre ellos se limitan a dos mutaciones puntuales situadas en el extremo 3 '(posiciones 170 y 187) y a una mutación 4-base situada en las posiciones 108 a 111 (Fig. S1). Sorprendentemente, RNU2-2 expresa también la misma región con un tamaño idéntico (Fig. S2). El mayor número de lecturas detectada para miR-U2-1 en comparación con miR-U2-2 es consistente con un mayor número de copias genómicas del RNU2-1. Afortunadamente, la diferencia de 4 bases (GCAG y AAUA en RNU2-1 y RNU2-2 respectivamente) para distinguir los dos genes de U2 se encuentra dentro de las secuencias de miR-U2, que permite la discriminación de los dos productos. Este polimorfismo no parecen tener ningún efecto perceptible sobre el procesamiento, lo que sugiere mecanismos similares para la biogénesis de miR-U2-1 y miR-U2-2. Sin embargo, las diferencias en la secuencia entre miR-U2-1 y miR-U2-2 siempre son representativas de la diversificación funcional adicional, tal vez facilitar un ajuste fino de la función reguladora a través de selección o proteína diana diferencial de los factores de unión.
El uso de NGS tecnología no está exenta de dificultades. Está bien establecido que los pequeños ARN pueden ser inadvertidamente cruzada asignada a la región genómica incorrecta. RNU2 genes son una familia compleja que comprende más de 50 pseudogenes que hace que los errores de configuración cruzada claramente posible. Recientemente se ha informado de que dos inmunoprecipitadas Argonaute asociada a pequeños RNAs de 23nt y 30NT fueron asignadas a dos pseudogenes U2 diferentes [30], a las posiciones 168-187 de la pseudogene U2 codificadas por el cromosoma 6 y a las posiciones 95-125 de la U2 pseudogene codificado por el cromosoma 10, respectivamente. Estos dos fragmentos de un mapa del ARN U2-1 funcional con una identidad del 100%. Habíamos señalado anteriormente que el locus en el cromosoma 17 RNU2-1 en realidad estaba retirado de la Asamblea Secuencia del Genoma Humano Build 37 (NCBI anotación Información Gene ID: 6066, actualice 20-Abril-2012), y esta es la explicación más probable que se por qué estos fragmentos de ARN asignadas a estos pseudogenes más que el propio gen RNU2 funcional. Del mismo modo, dos microARN cortas (19 nt), MIR-MIR-1246 y 1290, partido de miR-U2-1 con una identidad del 100% y una falta de coincidencia, respectivamente [44]. Mapping lee de nuestros cinco bibliotecas cortas a los respectivos precursores de estos dos microRNAs [45] reveló inequívocamente que los dos precursores putativos de miR-1246 y miR-1290 son el resultado de falso-mapping. Los dos microRNAs maduros propuestas son versiones de miR-U2-1 realidad truncados. Esto se confirmó indirectamente para miR-1246, cuando los intentos para secuenciar su precursor en el mismo tejido en el que se detectó no miR-1246, lo que sugiere que el supuesto precursor no existe [46]. Este resultado fue confirmado recientemente de forma independiente [31]. En cuanto a miR-1290 hay dos posibles ubicaciones genómicas que podrían codificar (Fig. S3), sin embargo, en nuestros experimentos se detecta en el mismo nivel que el ruido de fondo asociado con la secuencia de errores (Tabla S2). Llegamos a la conclusión de estos datos que todos los resultados relacionados con el miR-1246 y miR-1290 pueden ser asignados a miR-U2.
Una doble función de los genes RNU2
Los resultados experimentales discutidos hasta ahora sugerir una doble función para el RNU2-1 y RNU2-2 snARNs. Sus 5 'dominio contiene el sitio de sucursal ARNm implicados en mRNA de empalme, mientras que sus extremos 3' del dominio codifica miR-U2 que contiene el sitio de unión de Sm y podrían estar involucrados en la regulación de la expresión génica. Esta partición funcional de RNU2 se correlaciona con las diferencias observadas en las características estructurales que existen en la molécula (Fig. 3). La porción 5 'contiene un número impresionante de modificaciones post-transcripcional incluyendo 14 pseudouridylations y 10 nucleótidos metilados [47] - [49]. En contraste, no hay modificaciones se identifican aguas abajo de la posición 90 de RNU2, y este dominio contiene más extensa estructura secundaria, en particular cuando se incluye la secuencia de precursor. Estas diferencias estructurales sorprendentes están probablemente relacionados con las respectivas funciones diferenciales de las dos mitades de RNU2. Aunque el 5 'del dominio es suficiente para inducir mRNA splicing in vitro [50] - [52], no hay pruebas, ya sea por la literatura o de nuestros NGS experimentos que cualquier parte de la región 5' de RNU2 acumulan en las células. Esto sugiere un mecanismo de procesamiento alternativo que produce el RNU2 de tamaño completo, por una parte, y miR-U2 en el otro.
El plegamiento de estructura secundaria del precursor RNU2 se muestra. ubicaciones Psi son de [49]. nucleótidos metilados se indican con el símbolo "
m". Nucleótidos corresponden azul y verde con la secuencia de miR-U2-1. Las letras verdes se localizan las cuatro mutaciones de nucleótidos entre miR-U2-1 y miR-U2-2. letras rojas y negro muestran RNU2 y secuencias RNU2-precursoras específicas, respectivamente. flechas azules del 5 'y 3' del isomirs miR-U2. La flecha roja indica el extremo 3 'del RNU2. Las dos puntas de flecha negras señalan en los dos sitios de escisión internos identificados en este trabajo.
Con el fin de comprender mejor el mecanismo de miR-U2 empalme, hemos secuenciado dos bibliotecas de ADNc para ncRNAs más largo que el miR-U2 (25-50nt de largo) con el fin de identificar posibles intermedios (Tabla 1). El número de largo lee mapeo para RNU2 es considerablemente más baja que la observada en las bibliotecas de ADNc de tamaño pequeño, lo que sugiere que el compuesto intermedio de la maduración se degrada rápidamente o recortado para producir la final maduro microRNA. El examen de la distribución de lecturas (medida en RPM) a lo largo de la secuencia de pre-RNU2, observamos dos picos que corresponden a dos fragmentos más pequeños que se acumulan (Fig. 1e). Como era de esperar, uno mapas de pico a la madura miR-U2, mientras que sorprendentemente el segundo mapas al extremo 3 'de la RNU2 madura, una región que no produzca un NcRNA estable ya que no observamos en nuestros resultados de la secuenciación del corto bibliotecas -sized. Este fragmento RNU2 corresponde exactamente al fragmento 30NT-largo Ago1 [30] de unión. Esto sugiere que la degradación del extremo 3 'de RNU2 se ve impedida por la unión de Ago transitoria, pero debido a la protección que ofrece Hace 1 es temporal, no da lugar a un producto ncRNA estable. Alternativamente, este producto puede ser degradado en los tejidos del pulmón debido a la ausencia de factores adicionales, pero podría expresarse en otros tipos celulares o tejidos. La disminución del número de lecturas de ambos lados de los dos picos refleja una degradación de los compuestos intermedios de maduración por el recorte de los mecanismos de ambos extremos, mientras que el valle entre ellos localiza la posición de un sitio de escisión endonucleolítica (endo 3 ') en la proximidad de la posición 145 dentro del vástago IV (Fig. 1E y Fig. 3). Por el contrario, la mitad 5 'no contiene ningún fragmento protegido de la degradación. Sin embargo, un segundo sitio de escisión endonucleolitic (endo 5 ') parece estar ubicado entre las posiciones 70 y 80 dentro del vástago IIb.
Teniendo en cuenta las diferentes vías de procesamiento potenciales para RNU2, el primer paso implica muy probablemente el extremo 3' la escisión en la posición 187. se puede encontrar ninguna lectura coincide con el precursor específica esperada, lo que indica un evento temprano y rápido. Esta primera etapa implica una base de pelado entre la secuencia específica precursor (posiciones 190-200) y las posiciones 100 a 110 de RNU2 que es una característica estructural clave requerida para guiar el procesamiento del extremo 3 '[53]. Sorprendentemente, este apareamiento de bases se produce con la región de miR-U2 y delimita con precisión las dos mitades estructural y funcionalmente distintos de RNU2 (Fig. 3). Luego, en ausencia de Ago1 de unión, la unión de la proteína Sm, probablemente en combinación con otros factores como U2A 'y U2B ", podría estabilizar la RNU2 longitud completa. En contraste, el Ago1 unión a secuencias de miR-U2 podría inducir un cambio a la vía de divisiones endonucleolytic que escinde en las posiciones 70-80 y 145, respectivamente. Se conocen varios sitios pequeños y adyacentes de unión a ARN para Ago1 para facilitar las interacciones cooperativas que estabilizan la unión Argonaute [54]. Desde Ago1 no tiene actividad enzimática, una RNasa debe ser reclutado para la maduración de miR-U2, al igual que el miR-como ncRNAs producido a partir de snoRNAs y ARNt. Por último, este precursor transitoria se recorta rápidamente de ambos extremos para dar el maduro miR-U2.
El exclusivo de unión de miR-U2 a Ago1 [30], a diferencia de la mayoría de microRNAs canónicas que también se unen Ago2 [ ,,,0],55], sugiere un papel diferente para el miR-U2. Aunque la preponderancia de los datos indica que microRNAs regular la expresión génica en el citoplasma y P-cuerpos, las cuatro proteínas Argonaute y un número de microRNAs se han descubierto recientemente en el núcleo de las células humanas. El transporte de pequeños ARN en complejo con Ago proteínas en el núcleo depende de Importin-8 [56]. Este mecanismo sugiere su posible interacción con la cromatina y abre la alternativa muy interesante de su participación directa en que afecta a procesos nucleares como de empalme o de la transcripción por la orientación regiones promotoras de genes. Curiosamente, varios estudios recientes revelaron la segregación funcional entre Ago1 y Ago2 [57], así como una distribución diferencial en el núcleo en respuesta a promotor de orientación por siRNA durante silenciamiento génico transcripcional [58] lo que sugiere que las proteínas Hace mediar la localización nuclear de los pequeños ARN . Además de definir la actividad biológica de los pequeños RNAs, Ago proteínas también pueden definir la longitud de microRNAs maduros [59].
Esto nos permite considerar la posibilidad de que el miR-U2 podría jugar un papel epigenéticos en el ADN en el que podría actuar como un regulador de la expresión de grandes regiones cromosómicas. En efecto, se sabe que muchos promotores de genes supresores de tumores muestran mayores niveles de metilación, lo que sugiere una posible relación con el riesgo de cáncer. miR-U2 podría, por ejemplo participar en la orientación de la metilación de citosina, un proceso que se sabe que es sensible a los estímulos ambientales.