Extracto
Antecedentes
Los microARN (miRNA) son los ARN no codificantes cortos que regulan la diferenciación y el desarrollo en muchos organismos y juegan un papel importante en el cáncer.
Metodología /Principales conclusiones
el uso de una base de datos pública de los sitios de inserción retrovirales mapeadas de varios modelos de ratón de cáncer demostramos que las inserciones retrovirales derivados de MLV se enriquecen en las proximidades de ratón miARN loci. inserciones en clúster de regiones asociadas con el cáncer (común sitios de integración, la CEI) tienen una mayor asociación con miRNAs que las inserciones no agrupados. Diez loci asociados miARN-CIS que contiene 22 miRNAs se encuentran dentro de los 10 kb de la CEI inserciones conocidas. Sólo un locus miARN-CIS asociado superpone un gen codificante de proteínas RefSeq y seis loci se encuentran más de 10 kb a partir de cualquier gen RefSeq. miRNAs asociados con el SIA en promedio están más conservadas en los vertebrados que miRNAs asociados con inserciones fuera de la CEI y sus homólogos humanos también se encuentran en las regiones perturbadas en el cáncer. Además se muestra que los genes miARN se enriquecen en torno promotor y /o terminador regiones de los genes RefSeq tanto en ratones y humanos.
Conclusiones /Importancia
Ofrecemos una lista de diez miARN loci potencialmente implicados en el desarrollo de cáncer de la sangre o los tumores cerebrales. Existe soporte experimental independiente de otros estudios para la participación de miRNAs de loci de los genes miARN, al menos, tres asociadas con el SIA en el desarrollo del cáncer
Visto:. Makunin IV, faisán M, C Simons, Mattick JS (2007) Orthologous MicroARN Los genes se encuentran en genómicas asociadas con el cáncer Regiones en humanos y ratón. PLoS ONE 2 (11): E1133. doi: 10.1371 /journal.pone.0001133
Editor Académico: Christopher Arendt, Sanofi-Aventis, Estados Unidos de América
Recibido: 26 Julio, 2007; Aceptado: 15 Octubre 2007; Publicado: 7 Noviembre 2007
Derechos de Autor © 2007 Makunin et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por el Consejo de Investigación australiano. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
Los microARN (miRNA) son moléculas cortas de ARN, $ ~ $ 22 nucleótidos de longitud, con capacidad para realizar las funciones de regulación. En particular, los miRNAs puede suprimir la traducción realizada por el emparejamiento no perfecta de 3 'UTR y /o causar la degradación del ARNm en el caso de una combinación perfecta entre el miARN y el objetivo ARNm [1]. Parece que miRNAs no tienen ninguna actividad catalítica, sino más bien actúan como guías específicas de secuencia para complejos de proteínas asociadas que son responsables para la supresión de la traducción o degradación de ARNm [2]. El número de miRNAs conocidas está creciendo rápidamente, y cientos de miRNAs verificadas son anotados en el ser humano, el ratón y otros organismos (miRBase, http://microrna.sanger.ac.uk).
Una serie de observaciones apuntan a una relación entre miRNAs y el cáncer, lo cual no es sorprendente, dado su papel central en muchos procesos celulares y de desarrollo (para una revisión ver [3] - [5]). También se ha demostrado que un gran número de miRNAs humanos y de ratón que se encuentra en las regiones asociadas con el cáncer [6], [7]. La expresión de varios miRNAs se altera en el cáncer y los genes miARN perfiles se puede utilizar para la clasificación del cáncer precisa [8]. La expresión ectópica de la
mir-17-19b
clúster acelera la formación de tumores en ratones y en consecuencia se ha clasificado como un potencial oncogen [9].
retrovirus, tales como el virus de la leucemia murina (MLV ), pueden causar la formación de tumores en mamíferos. inserciones proviral pueden activar proto-oncogenes o dar lugar a la inactivación de genes supresores de tumores en la proximidad de los sitios de inserción. sitios de integración retroviral pueden ser determinados en animales con cáncer utilizando PCR inversa o técnicas similares, y se asigna a la secuencia del genoma. Regiones que albergan múltiples sitios de inserción en estrecha proximidad entre sí son los candidatos más obvios para la causa del desarrollo del cáncer y, a menudo se denominan sitios de integración comunes (CISS). En general, los candidatos para los genes supresores de tumores o proto-oncogenes se seleccionan a partir de genes codificadores de proteínas basadas en la proximidad de la CISS.
Numerosas pantallas de todo el genoma se han llevado a cabo en el ratón para identificar genes implicados en la carcinogénesis, especialmente tumores hematopoyéticos [10] - [18]. Los datos obtenidos de varias pantallas en diferentes modelos de cáncer (incluyendo estudios con ratones modificados genéticamente) se ha compilado en la base de datos retroviral Tagged gen del cáncer (RTCGD, http://rtcgd.ncifcrf.gov) [19], que también proporciona anotaciones para la UCSC genoma navegador [20]. En el RTCGD, la CISS se definen como regiones que contienen dos insertos situados a menos de 20 kb, 3 insertos dentro de 50 kb, y cuatro o más insertos dentro de 100 kb en el mismo modelo de cáncer (véase la sección de preguntas frecuentes del RTCGD en http: //rtcgd. ncifcrf.gov) (para más detalles véase [17]).
sin embargo, algunos IIC no se asignan cerca de cualquier secuencia de codificación de la proteína conocida o anotado. Se ha demostrado que las inserciones de los retrovirus en las proximidades de la
formación MIR-17-92
miARN polycistron causa del tumor y aumentar la expresión de los genes miARN, lo que indica que la mutagénesis retroviral puede ser una herramienta potente para el descubrimiento de miRNAs oncogénicos [21] , [22]. Teniendo en cuenta el papel regulador emergente de microRNAs en la diferenciación celular y el cáncer se analizó la asociación entre los sitios de integración retroviral disponibles al público y conocido miARN loci en el genoma del ratón. Se encontró que los loci de los genes miARN se enriquecen de manera significativa en las proximidades de IIC que sugiere que algunos de estos miARN loci también pueden ser considerados como candidatos proto-oncogenes o genes supresores de tumores.
Resultados
murino asociado con los loci de los genes miARN sitios de integración retroviral común
Se analizaron co-localización entre el ratón miRNAs y sitios de integración retroviral determinados a partir de ratones que desarrollaron cáncer. Para este análisis se utilizaron los 363 miRNAs del registro miARN (http://microrna.sanger.ac.uk) que se han mapeado en 381 lugares dentro de la fracción bien ensamblada-del genoma del ratón (cuatro miRNAs asignan a más de una ubicación). Las ubicaciones corresponden a las posiciones genómicas de las secuencias de precursores miARN. Se utilizó la base de datos que contiene RTCGD 2373 sitios de integración retroviral dentro de los sitios de integración comunes (inserciones CIS) y 3119 sitios de integración retroviral corresponde a un área de IIC (inserciones fuera de la CEI). Se excluyeron de nuestros sitios de integración de análisis de dormir transposones de belleza debido a inserciones fuera de la CEI de la Bella Durmiente son repartidos de manera no aleatoria entre los cromosomas: los cromosomas 1, 4, 6 y 15 del puerto más de la mitad de los sitios de integración bella durmiente fuera de la CEI.
el uso de una réplica local de la UCSC genoma navegador, se encontró que los insertos de la CEI se encuentran dentro de 5 kb de 17 miRNAs murinos y dentro de los 10 kb de 22 miRNAs. Ejemplos de co-localización entre miRNAs e insertos de la CEI se muestran en la Fig. 1 y una lista completa de los miRNAs asociados con el SIA se da en la Tabla 1. Además el aumento de la distancia (más allá de 10 kb) no dio lugar a un aumento significativo del número de miRNA asociados con inserciones de la CEI (Fig. 2) que indica que la asociación entre miRNAs y los insertos de la CEI es máxima en las distancias cortas.
Cada panel representa a 20 kb de ADN genómico. triángulos azules indican los sitios de integración retroviral, garrapatas rojas representan miRNAs, cajas negras y las líneas muestran la posición de las transcripciones empalmados. (A) chr11: 87,562,001-87,582,000. (B) CHRX: 48,977,001-48,997,000. (C) chr14: 113,914,001-113,934,000. mm8 genoma de montaje.
Los diamantes azules representan el número de miRNAs situados en la cantidad indicada, o menos de insertos de la CEI, y los diamantes rojos corresponden a miRNAs situados en la cantidad indicada, o menos de inserciones fuera de la CEI. La línea de tendencia para los miRNAs asociados con inserciones fuera de la CEI se muestra como la línea roja punteada.
Se utilizó una simulación bootstrap para estimar la significación estadística de la co-localización entre los sitios de integración retroviral y miRNAs (ver Materiales y Métodos). Debido a que algunos miRNAs son agrupados en el genoma y por lo tanto, distribuidos de manera no uniforme, agrupamos miRNAs en loci mediante la adición de 5, 10, 20 o 30 kb a cada lado de la ubicación de los genes miARN y la combinación de las zonas de solapamiento. Esta agrupación es necesario mantener miRNAs agrupados y repetidos en tándem como unidades individuales (loci) durante el procedimiento de arranque. Regiones de los mismos tamaños se colocaron al azar en el genoma del ratón y se contaron los casos de solapamiento con los sitios de integración retroviral. El número de loci de los genes miARN que se encuentra a 10 kb o menos de los insertos de la CEI es de aproximadamente 5,5 veces mayor que la observada para loci colocado al azar, y se estima la probabilidad de obtener un número tan por casualidad, ya 1,7 × 10
-5. El enriquecimiento disminuye con la longitud de los loci de los genes miARN, y la probabilidad de obtener un solapamiento similar entre miARN loci y los insertos de la CEI por casualidad es mayor para distancias más largas (Tabla 2). Los datos de rutina de carga indican que la asociación más fuerte entre miARN loci y se inserta la CEI es en las distancias cortas, de hasta 10 kb. De acuerdo con esto, el número de inserciones retrovirales CEI cerca de miRNAs es también altamente enriquecido en las distancias cortas, y el enriquecimiento disminuye con la distancia.
inserciones fuera de la CEI se enriquecen en las proximidades de miARN loci
Se analizó la co-localización entre miRNAs e inserciones retrovirales corresponde a un área de la CISS. Estas inserciones fuera de la CEI son sitios de integración retroviral no agrupados obtenidos en las pantallas de cáncer. Su papel (si existe) en la tumorigénesis es poco clara y por lo que estos insertos están generalmente omitidos de análisis. Baja saturación en algunas pantallas de cáncer sugiere que algunos insertos de fuera de la CEI pueden estar situados en regiones implicadas en la tumorigénesis, pero por otro lado, es posible especular que algunos son subproductos de la pantalla cáncer
.
el número de miARN situado a una distancia dada desde fuera de la CEI inserta aumenta proporcionalmente a la distancia entre el miARN y de inserción fuera de la CEI (R
2 = 0,9396), mientras que el número de miRNAs asociados con inserciones de la CEI no muestra tales una fuerte dependencia lineal (Fig. 2) (R
2 = 0,7831). La asociación de miARN con inserciones de la CEI se describe mejor por una línea de tendencia logarítmica con R
2 = 0,945 (ver Materiales y Métodos). La simulación bootstrap mostró un enriquecimiento significativo para miARN loci asociados con inserciones fuera de la CEI, especialmente para distancias de menos de 5 kb (Tabla 3). El número de sitios de integración retroviral fuera de la CEI en el entorno de miRNAs tiene un enriquecimiento ligeramente mayor que el enriquecimiento para los genes miARN loci. Un examen detallado de los genes miARN loci asociados con inserciones fuera de la CEI reveló varios loci con dos insertos independientes fuera de la CEI situados muy cerca uno del otro. Por ejemplo, entre 13 miARN loci (16 miRNAs) con inserciones de fuera de la CEI dentro de 10 kb, diez loci tener un único inserto, y tres loci tener dos insertos. Estos insertos estrechamente ubicados fueron aisladas de diferentes modelos de cáncer, por lo que estas inserciones se clasifican como no-CIS. Se analizó la distribución de las distancias entre las inserciones fuera de la CEI en el genoma. Hay un aumento significativo en el número de insertos de fuera de la CEI situados dentro de 3 kb de uno al otro, mientras que el número de inserciones fuera de la CEI a distancias más largas es más o menos uniforme cuando se mide en 1 contenedores kb. Un total de 332 de 3119 inserciones fuera de la CISS se encuentran dentro de 3 kb de uno al otro.
Hemos eliminado todas las inserciones fuera de la CEI situados dentro de 3 kb de uno al otro y repetimos el análisis de arranque. Sin embargo, incluso este conjunto de datos muestra el enriquecimiento de aproximadamente el doble de miARN loci asociados con inserciones fuera de la CEI separadas por 3 kb o más (Tabla 4). El enriquecimiento es similar para todas las distancias analizadas pero la asociación a distancias más largas es estadísticamente más significativo.
En base a este análisis de arranque llegamos a la conclusión de que los loci de los genes miARN muestran la asociación más fuerte con inserciones de la CEI a distancias cortas (menos de 10 kb ). A distancias de menos de 10 kb del miARN loci de enriquecimiento de superposición con inserciones de la CEI es dos veces mayor que el enriquecimiento de los genes miARN loci superposición con inserciones fuera de la CEI. A distancias más largas, por ejemplo, 30 kb, loci de genes miARN muestran una asociación similar tanto con la CEI y fuera de la CEI insertos.
loci microARN son enriquecidos en todo comienza y termina de genes que codifican proteínas
se sabe que la integración de los virus de la leucemia murina y vectores derivados de MLV se produce preferentemente alrededor de regiones promotoras [23]. De hecho, de 3119 sitios fuera de la CEI retrovirales a partir de la base de datos RTCGD, 1.190 (38%) se encuentran dentro de 5 kb de los sitios de inicio de transcripción de los genes anotados RefSeq (ocupando ~6.8% del genoma). Esto representa más de enriquecimiento de 5 veces, más que el enriquecimiento de las inserciones fuera de la CEI alrededor de miARN loci (Tablas 3 y 4). Fuera de 2373 inserciones de la CEI, 989 (42%) se encuentra dentro de los 5 kb de los sitios de inicio de transcripción de los genes RefSeq anotado.
Se analizó la distribución de los genes miARN loci en el genoma del ratón con respecto a los genes RefSeq. Fuera de 381 ubicaciones miARN, 155 (41%) RefSeq genes de superposición, que ocupan el 32% del genoma del ratón. Entre estos, 22 (6%) miRNAs superponen exones (2% del genoma), y 133 (35%) se encuentran en intrones (30% del genoma). Sorprendentemente, se encontró que los miRNAs se enriquecen cerca del comienzo o el final de los genes: 69 (18%) y 72 (19%) miRNAs se encuentran dentro de 5 kb de inicio de la transcripción de genes o de gama sitios RefSeq, respectivamente (~2.6 y ~2.8 veces el enriquecimiento). En total, 105 (51%) miARN sitios se encuentran dentro de 5 kb o bien desde el principio, al final o ambos (& gt; enriquecimiento 3 veces). Por otra parte, miRNAs muestran ligeramente más alto enriquecimiento en regiones en las que los sitios de inicio de genes se separan de los sitios de gama de genes por menos de 10 kb (datos no mostrados).
microARN asociados con inserciones fuera de la CEI tienden a estar cerca de promotores de RefSeq genes mientras que los miRNAs asociados con el SIA tienden a ser más distante de los promotores. Por ejemplo, 13 miARN loci (16 miRNAs) tiene inserciones fuera de la CEI mapeadas dentro de 10 kb. De estos, 9 loci (69%) se encuentran dentro de los 10 kb de RefSeq aperturas de genes, mientras que de los 10 loci asociados miARN-SIA sólo 4 están a menos de 10 kb de RefSeq aperturas de genes. Seis loci asociados miARN-CIS que contiene 17 miRNAs se encuentran más de 10 kb lejos de los promotores de los genes RefSeq, lo que indica que la asociación observada entre miRNAs y IIC no se explica por la co-localización de los genes miARN cerca. Una tendencia similar se observa para los genes miARN loci 5k (miRNAs dentro de 5 kb el uno del otro): de los 10 loci miARN 5k con la no-CIS RIS dentro de 5 kb (Tabla 3), 7 de solapamiento de genes RefSeq aperturas. Fuera de 7 miARN loci 5k con RIS CIS dentro de 5k (Tabla 2), 3 superposición de genes RefSeq aperturas.
Curiosamente, miRNAs humanos también se enriquecen alrededor de los sitios de inicio de transcripción o al final de los genes RefSeq. Hay 543 miRNAs anotado en el genoma humano asignada a 474 lugares únicos precursores miARN. Fuera de estos 474 sitios miARN 108 (23%) se encuentran dentro de los 5 kb de RefSeq inicio de la transcripción de genes y /o sitios de enriquecimiento de extremo (2,2 veces). Hemos fusionado estos 474 sitios en 311 miARN loci 5k mediante la adición de 5 kb a cada lado del precursor y luego creamos la unión de base-pares (OR) de ubicaciones. Fuera de 311 miARN loci 5k 92 (30%) se superponen ya sea de inicio de transcripción o sitios de extremo de RefSeq genes, o ambos. Estos 92 loci contienen 110 (23%) los genes miARN precursores. Parece que el miARN loci en las proximidades de los sitios de inicio de transcripción o de fin contengan menos precursores miARN miARN loci que se encuentra más lejos de genes (1.2 y 1.7 precursores miARN por loci, respectivamente).
miRNAs CEI-asociado y se conservan sus ortólogos humanos se encuentran en regiones asociadas con el cáncer
miRNAs asociados con el SIA tienen algunas características comunes. La mayoría (21 de 22) de la CEI-miRNAs asociados se encuentran fuera de RefSeq genes codificadores de proteínas. La excepción,
mir-135 bis-1