Extracto
somática transposón mutagénesis en ratones es una estrategia eficaz para investigar los mecanismos genéticos de la tumorigénesis. La identificación de la conducción tumorales transposón inserciones requiere tradicionalmente la generación de grandes cohortes tumorales para obtener información acerca de los sitios de inserción comunes. Tumor conducción inserciones también se caracterizan por su expansión clonal en el tejido tumoral, un fenómeno que se ve facilitado por el proceso de transformación lenta y evolución de mutagénesis de transposones. Se describe aquí un enfoque mejorado para la detección de inserciones de conducción tumorales que evalúa la expansión clonal de las inserciones mediante la cuantificación de la proporción relativa de la secuencia de lecturas obtenidas en los tumores individuales. Con este fin, hemos desarrollado un protocolo para la secuenciación de sitio de inserción de corte que utiliza acústica de ADN tumoral y secuenciación Illumina. Se analizaron varios tumores sólidos generados por mutagénesis y PiggyBac para cada tumor & gt; 10
6 dice que corresponde a & gt; 10
se obtuvieron 4 puntos de inserción. En cada tumor, de 9 a 25 inserciones se destacaban por su secuencia enriquecido leer frecuencias en comparación con las frecuencias obtenidas de los controles de ADN de la cola. Estas inserciones enriquecidos son posibles inserciones de conducción tumor clonal ampliado, y de este modo identificar los genes del cáncer candidatos. Los genes del cáncer candidato de nuestro estudio que comprenden muchos genes del cáncer establecidos, sino también nuevos genes candidatos como Mastermind-comparables1 (
Mamld1
) y delta Diacylglycerolkinase (
Dgkd
). Se demuestra que el análisis de la expansión clonal de secuenciación de alto rendimiento es un enfoque sólido para la identificación de genes del cáncer de candidatos en las pantallas de mutagénesis de inserción en el nivel de los tumores individuales
Visto:. Friedel RH, Friedel CC, Bonfert T, Shi R, R Rad, Soriano P (2013) Análisis de la expansión clonal de transposón inserciones de genes cancerígenos Candidato de alto rendimiento de secuenciación Identifica en una pantalla PiggyBac mutagénesis. PLoS ONE 8 (8): e72338. doi: 10.1371 /journal.pone.0072338
Editor: Andrew C. Wilber, Escuela de Medicina de la Universidad del Sur de Illinois, Estados Unidos de América
Recibido: Marzo 4, 2013; Aceptado: July 8, 2013; Publicado: 5 Agosto 2013
Derechos de Autor © 2013 Friedel et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por HD24875 subvención del Instituto Nacional de Salud infantil y Desarrollo humano de PS, los fondos de desarrollo del Instituto de cáncer Tisch, Mount Sinai School of Medicine, de RF y P. S., y por DFG subvención FR2938 /1-1 a C. F. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
mutagénesis somática por transposones de ADN en ratones investiga la genética subyacente de la tumorigénesis. Los transposones que albergaban el gen de activación o casetes de genes que atrapan puede activar oncogenes o interrumpir supresores de tumores, conduciendo de ese modo el crecimiento del tumor [1]. Además de su papel en el descubrimiento de nuevos genes de cáncer, mutagénesis de transposones también facilita los estudios más detallados sobre los mecanismos genéticos y celulares de la tumorigénesis mediante la utilización de mutaciones fondo de sensibilización y activación transposón tipo específico de células [2]. Dos sistemas de transposones se han utilizado con éxito en las pantallas de cáncer en el ratón: La Bella Durmiente [2-4] y PiggyBac [5,6]. sitios de inserción del transposón se identifican por secuenciación de fragmentos de unión de los extremos de transposones y ADN genómico flanqueante. Tumorales conducir los genes del cáncer candidatos son identificadas por el análisis del sitio de inserción común (CIS), un proceso de mapeo inserciones de múltiples tumores y análisis de los genes que se golpean comúnmente en muestras independientes. análisis CIS ha demostrado ser un enfoque de éxito para la identificación de genes candidatos, sin embargo, se requiere un número considerable de muestras de tumores (50 a 100 en la mayoría de los estudios), y que ofrece muy poca información sobre los patrones de mutación en los tumores individuales.
Una característica importante de la transformación por transposones es la movilización continua dentro y fuera de los sitios de inserción. Este mecanismo facilita la selección positiva y la expansión clonal de las inserciones tumor-conducción durante la evolución del tumor a través de inserciones de pasajeros neutros. la expansión clonal de las inserciones de transposones se puede evaluar mediante el análisis de las proporciones relativas de la secuencia de lecturas obtenida de inserciones en los tumores individuales. Sin embargo, las pantallas tumorales transposón anteriores no han utilizado análisis de la expansión clonal, probablemente debido a las limitaciones en el número de secuencia se lee obtenerse por el enfoque 454 pirosecuenciación utilizado en estos estudios. Además, los protocolos estándar para la preparación de ADN tumor implican fragmentación por digestiones de restricción, que introduce sesgos para inserciones representados por fragmentos de restricción más cortos que se amplifican de manera más eficiente por PCR [7]. Un enfoque alternativo para la fragmentación del ADN, cizallamiento acústico, puede reducir significativamente los sesgos de PCR, ya que cada sitio de inserción está representado por un conjunto de fragmentos con rango de longitud similar [8].
Con el fin de obtener una representación cuantitativa mejorada de sitios de inserción de su secuencia de lectura de los números, se combinaron dos avances técnicos de los informes recientes de secuenciación de Illumina - para obtener & gt; 10
6 lecturas por muestra [7], y el corte acústico para reducir los sesgos de PCR [7,8] - y desarrollado un protocolo de secuenciación de alto rendimiento eficiente de las inserciones de transposones. Hemos aplicado nuestro protocolo para el análisis de once varios tumores sólidos que habíamos generado por mutagénesis con el transposón PiggyBac array ATP1-S2 [5]. Para cada inserción en cada tumor, se calculó una frecuencia de lectura relativa, lo que nos ha permitido identificar entre 9-25 inserciones por tumores representan inserciones de conducción tumorales clonal ampliado. Entre los genes mutados por inserciones clonal ampliado eran numerosos genes del cáncer establecidos, y también varios nuevos genes de cáncer candidato.
Se demuestra aquí mutaciones que la secuenciación de alto rendimiento de bibliotecas sitio de inserción identifica clonal ampliado en tumores individuales. Este enfoque mejorará sustancialmente la calidad de las predicciones de genes del cáncer candidato de pantallas de mutagénesis de inserción, y facilitará la identificación de las redes de mutaciones cooperantes en los tumores individuales.
Resultados
PiggyBac transposón mutagénesis
una pantalla de transposón de mutagénesis se llevó a cabo en ratones que llevan una transposasa de expresión ubicua PiggyBac (ROSA26-pbase) y una matriz PiggyBac transposón transgénicos (ATP1-S2) [5]. La matriz ATP1-S2 contiene 20 copias de la ATP1 transposón, que está equipado con aceptores de corte y empalme para la captura de genes supresores de tumores y un promotor de CAG para la activación de oncogenes. Estos elementos permiten ATP1 para causar tumores sólidos durante la transposición [5]. Hemos generado una cohorte de prueba de 27 ratones que portaban ROSA26-Pbase y ATP1-S2, y un grupo de control de 27 ratones con ATP1-S2 solo. Cohortes fueron años de edad, y mientras que no se observaron tumores en el grupo de control, se observó 11 tumores macroscópicos entre 8 ratones dentro de la cohorte de prueba entre 59 a 85 semanas (figura 1A). Tres animales llevan tumores en dos sitios independientes, y en un caso, el análisis genético de los sitios de inserción indicaron que ambos tumores comparten un origen común (véase más adelante), mientras que todos los otros tumores aparentemente surgieron de forma independiente. Los tipos de tumores comprenden carcinomas de células escamosas de la piel, tumores sólidos de pulmón y el intestino, y el linfoma folicular del bazo. El contenido de células tumorales en las muestras disecadas varió de 30-100%, tal como se evaluó por análisis histopatológico de hematoxilina y eosina secciones teñidas (Figura S1). Se aislaron ADN para el análisis de los sitios de inserción de transposón de los 11 tumores. Para el control de inserciones aleatorias de PiggyBac en tejido no canceroso, hemos aislado también de ADN a partir de 6 puntas de la cola de ratones portadores de tumores.
A) de Kaplan-Meier de supervivencia parcela de cohortes que llevan ya sea matriz PiggyBac solo (ATP1-S2 ) o la matriz de PiggyBac y transposasa constitutiva (ATP1-S2; R26-pbase). Las flechas rojas indican la aparición de tumores. Las marcas denotan animales censurados (sin tumor observado en el momento del sacrificio).
B) Alineaciones de la secuencia genómica Illumina lee terminan en posiciones generadas por cizallamiento acústico. PB3 /PB5, PiggyBac 3 '/5' repetición terminal; SA, aceptor de empalme; P, promotor de CAG.
C) Ejemplo de secuencia asignada lee por los lados PB3 y PB5 de una inserción PiggyBac, vistos en la UCSC genoma navegador. Tenga en cuenta que cizallamiento acústica hace que los puntos de ruptura de ADN al azar a los que se ligan adaptadores Splinkerette, lo que conduce a un patrón de escalera como de la secuencia de alineaciones. Al final constante de alineaciones a la derecha y la izquierda son causados por la lectura secuencia de longitud invariable del sistema de iluminación.
D) Visión general cuantitativa de la secuencia lee, lee mapeado, y sitios de inserción de muestras únicas de la cola y del tumor.
secuenciación de alto rendimiento de las inserciones de transposones
Hemos utilizado Illumina secuenciación de alto rendimiento para lograr una cobertura integral de lectura del transposón inserciones en muestras de tumores individuales. En la mayoría de las pantallas de transposón de mutagénesis anteriores, el ADN del tumor fue digerido por enzimas de restricción, que generan fragmentos de un tamaño constante para las inserciones individuales. Como PCR amplifica fragmentos más cortos de manera más eficiente que los fragmentos más largos, se introduce un sesgo durante la amplificación PCR subsiguiente para inserciones que están representados por fragmentos de restricción cortos [7,8]. Para lograr una representación más proporcional de inserciones, nos fragmentados ADN tumoral mediante la esquila acústica en fragmentos de 200-400 pb tamaño (ver Métodos S1 para un protocolo detallado). De esta manera, las inserciones están representados por el conjunto de fragmentos con rango de tamaño similar. Shearing fue seguido por la reparación a fin de ADN, A-tizón de extremos 3 ', y la ligadura de los adaptadores Splinkerette con 3'-T-voladizo (Figura S2). En reacciones separadas, fragmentos de unión de los extremos 3 'y 5' de la transposón PiggyBac (PB3 y PB5) y luego se amplificaron en dos rondas consecutivas de PCR para generar bibliotecas PB3 y PB5 para cada muestra. Los cebadores de PCR contenían secuencias adaptadoras de terminales para la amplificación en fase sólida y Illumina secuenciación y un código de barras de 6 bases para distinguir muestras en la secuenciación del múltiplex. Preparamos dos grupos de bibliotecas PB3 y PB5, y cada grupo fue secuenciado en un solo carril de un dispositivo de iluminación HiSeq2000 con 100 bases de longitud leen. Secuencia lee se demultiplexa en función de su código de barras y se asigna al genoma de ratón usando el algoritmo de lazo Bow [9].
Alineación de la secuencia se lee en el genoma navegador UCSC confirmó el carácter imparcial de la fragmentación del ADN por cizallamiento acústico. La distribución aleatoria de puntos de ruptura del ADN causado secuencia lee de inserciones de transposones a alinearse en un patrón de escalera como alrededor de la secuencia de TTAA central de la inserción PiggyBac (Figura 1B, C). Para cada muestra, se obtuvo en promedio ~ 5x10
6 de código de barras lee, con números similares para los tumores y los controles de la cola (Figura 1D; Tabla S1).
Acerca de 19,3% de lecturas de muestras de tumores podría deben correlacionarse con el genoma del ratón. Para las muestras de la cola, el 15,3% de lecturas podría ser mapeado. Estas lecturas representan nuevas inserciones del transposón ATP1 fuera de su gama de donantes. Esta proporción moderada de mapeable lecturas se debió principalmente a una fracción alta de esa secuencia lee plásmido contenido de flanqueo transposones inmovilizadas en la matriz de donantes y, por lo tanto, no podía ser asignada. Para determinar la fracción de transposones ATP1 que permanecen en la matriz de donantes ATP1-S2, se realizó un análisis de transferencia Southern de colas de ROSA26-Pbase; ratones ATP1-S2 y encontraron que alrededor del 40% de transposones ATP1-S2 no se movilizaron a partir de la matriz (Figura S3). Esta movilización incompleta de ATP1 puede ser causada por el estado específico en la cromatina in vivo de la matriz ATP1-S2. Como la metilación del ADN en los sitios CpG puede ser inhibitoria a PiggyBac transposición [10], se analizó el estado de metilación de ATP1-S2 por transferencia de Southern con una restricción sensible metilación Digest. se detectó CpG de metilación de la matriz ATP1-S2, proporcionando una posible explicación de la tasa de incorporación moderada (Figura S3). Un factor adicional que reduce nuevas inserciones de transposones es la pérdida de transposones durante la transposición (es decir, la extirpación sin seguir reintegración), y un estudio previo indicó que aproximadamente la mitad de todas las copias ATP1 transposón se pierden durante la actividad transposición [5]. A pesar de la fracción moderada de la secuencia mapeable lee, nuestro protocolo de secuenciación de alto rendimiento nos permitió recuperar un número significativo de lecturas de los objetivos de nuestro estudio con 1x10 ~
6 lecturas asignadas en promedio para las muestras tumorales y ~ 0.7x10
6 lecturas para los controles de la cola (Figura 1D).
cobertura de lectura de inserciones
en total, encontramos 4.210 nuevos sitios de inserción en las muestras tumorales y de la cola combinados que fueron apoyados a una cara y de dos caras por asignaciones de lectura en ambos lados de la inserción PiggyBac transposón (PB3 y PB5). La mayoría de las inserciones, sin embargo, se identificaron por mapeado lee en un solo lado del transposón (314,970 inserciones con lee sólo en PB3 o lado PB5). Curiosamente, la gran mayoría de inserciones en nuestro estudio, en particular aquellos con lecturas asignadas a un solo lado del transposón, está representado por un número reducido de lectura (Figura S4). Una observación similar acerca de la elevada proporción de inserciones raros se ha hecho en un estudio Bella Durmiente [7]. Es concebible que estas inserciones raras escapan de la detección en ambos lados de la transposón debido a su baja abundancia, lo que resulta en la elevada proporción de inserciones cubiertos en un solo lado. Curiosamente, también se observó varias inserciones con un número elevado de lectura que fueron cubiertos en un solo lado (figura S4). Las razones potenciales para la cobertura de un solo lado de lectura en estos casos incluyen flanquean tramos repetitivos o de baja complejidad de ADN que impiden la cartografía, o reordenamientos de ADN pequeños (deleciones, inversiones) causadas por la inserción del transposón. Para el análisis integral, incluimos en nuestro estudio todos los sitios de inserción, la combinación de sitios de inserción con un solo lado y con la secuencia de dos caras leemos cobertura, lo que dio lugar a ~ 2x10
4 transposón inserciones únicas en promedio por muestra (Figura 1D).
PiggyBac muta el genoma de manera uniforme
los datos sobre la distribución cromosómica de las inserciones ATP1 reveló que el transposón ATP1 PiggyBac muta cromosomas uniformemente en proporción a su contenido de AAVV, tanto en los tumores y las colas (Figura 2A) . Este patrón está de acuerdo con los datos anteriores reportados para el patrón de inserción del transposón ATP2 relacionada [5]. La excepción a la distribución proporcional de las inserciones fue el extremo proximal del cromosoma 10, que alberga la matriz de donantes ATP1-S2. Aquí, se observó un enriquecimiento de las inserciones en el intervalo de ~ 2 Mb en el extremo proximal del cromosoma 10 (Figura 2B). Este sesgo es causado probablemente por un efecto de salto local del transposón PiggyBac en la proximidad de la matriz de los donantes, y por lo tanto las inserciones en esta área se excluyeron de un análisis adicional.
A) distribución relativa de los sitios de inserción piggyBac sobre cromosomas , en comparación con la proporción de sitios TTAA en los cromosomas. Nota la sobrerrepresentación del cromosoma 10, que lleva la matriz de donantes transposón. Cromosoma Y, que se compone principalmente de elementos altamente repetitivas, mostró una ligera preferencia por las inserciones piggyBac.
B) Efecto de salto local en el cromosoma 10. Histograma de la densidad de la inserción en el cromosoma 10 revela un sesgo positivo para las inserciones en el extremo proximal (flechas), donde se encuentra la matriz de donantes ATP1-S2
C) Distribución de inserciones piggyBac en regiones genómicas: Promotor. (10 kb aguas arriba del TSS), exones, intrones y regiones intergénicas
.
también comparó la distribución de los sitios de inserción en las regiones de genes (promotor, el exón, intrón) y de las regiones intergénicas. En general, las dos muestras de la cola y tumorales mostraron una distribución de inserciones que se asemejaba a la proporción media de las regiones de genes en el genoma del ratón, aunque se observaron inserciones piggyBac en algo más altos que los números esperados en regiones intergénicas (Figura 2C).
la expansión clonal de las inserciones de transposones
Nuestro análisis de las inserciones de transposones no mostró diferencias sustanciales en los patrones de inserción de transposones piggyBac en muestras de tumores y de la cola en cuanto a la distribución de cromosomas y regiones de genes. A continuación analizaron las diferencias cuantitativas de la secuencia lee los números de inserciones en muestras individuales. La suposición subyacente es que las inserciones clonal ampliado están presentes en la mayoría de las células de una muestra y deben estar representados por números de lectura más altas que las inserciones neutros que sólo están presentes en una fracción más pequeña de la muestra.
Para el ajuste de las variaciones en la secuencia de lectura cobertura de diferentes muestras, primero genera frecuencias de lectura relativas normalizando lado PB3 y PB5 leer los números para el número total de lecturas de la biblioteca de muestra respectiva. Como PB3 y PB5 leen frecuencias se obtuvieron a partir de bibliotecas de PCR preparados de forma independiente, una correlación perfecta entre el PB3 y PB5 leer no podía esperarse frecuencias. No obstante, se observó una correlación robusta entre PB3 y PB5 leer frecuencias para las inserciones piggyBac (Figura S5). Para combinar la información de las frecuencias de lectura de los lados PB3 y PB5 de cada inserción, que a continuación se calculó para cada inserción de la frecuencia media de lectura de su PB3 y PB5 leer frecuencias. Para inserciones que estaban representados por los lee en un solo lado, la frecuencia media es igual a 0,5 de la respectiva frecuencia de un solo lado.
Para un análisis comparativo de las distribuciones de frecuencia de lectura en muestras de tumores y de la cola, que trazan la lectura promedio las frecuencias de todos los sitios de inserción en un diagrama de diagrama de caja (Figura 3). En este diagrama se reveló que más del 99% de las inserciones en los tumores y las colas estaban representados por una pequeña fracción de lecturas con frecuencias de lectura por debajo de 0,1%. Curiosamente, sin embargo, cuando nos centramos en los mejores valores extremos de cada muestra, se observó que las muestras tumorales contenían un pequeño número de valores atípicos con frecuencias de lectura enriquecidos que eran claramente superiores a los valores atípicos más fuertes de muestras de la cola. Estas inserciones de alta frecuencia es probable que sean inserciones clonal ampliado que han sido seleccionados positivamente para durante el crecimiento del tumor.
Caja parcela de frecuencias medias de lectura de transposón inserciones en los tumores y los controles de la cola. Puntos muestran el 1% superior inserciones de cada muestra, clasificados en orden de frecuencias medias de lectura. línea vertical indica la distribución del grupo percentil 2-25%, y las cajas indican la distribución de la parte baja del 75% de las inserciones. Un umbral para los valores extremos (línea punteada horizontal) se calcula promediando las frecuencias de lectura de los 10 mejores inserciones de cada muestra cola.
En ausencia de un método estadístico eficiente para distinguir los verdaderos valores extremos de inserciones enriquecido al azar , decidimos definir expansión clonal por un método de umbral. Hemos utilizado los controles de la cola como una referencia para la distribución de frecuencias de lectura en el tejido no tumoral, y se calculó un umbral para la detección de las demás promediando las 60 frecuencias más altas de las muestras de control de la cola (las 10 primeras frecuencias de cada muestra de la cola). Esto dio lugar a un umbral de 0,37% para nuestro conjunto de datos. Se identificaron entre 9-25 inserciones para cada muestra de tumor por encima del umbral, pero sólo 2-6 inserciones en muestras de tamaño reducido (Tabla S2).
Hemos interrogado aún más la reproducibilidad de los sitios de inserción de clasificación por frecuencia de lectura de una serie de experimentos de control. Nos preguntamos primero si la expansión del sitio de inserción podría variar entre las diferentes partes de una sola masa tumoral (Figura S6). Al comparar las frecuencias de lectura de las microdisecciones de masas tumorales individuales, se observó una coincidencia completa de las inserciones más altamente enriquecido entre las muestras y un partido de más del 50% de las inserciones por encima del umbral global.
A continuación se investigó si ampliado inserciones en los tumores ya podrían estar presentes como inserciones expandido en el tejido precanceroso de la cual surge el tumor. Para este propósito, se compararon las inserciones de transposones en los genes de un tumor de pulmón con las inserciones de tejido pulmonar normal adyacente (Figura S7). Las inserciones tumor más altamente enriquecido no estaban presentes en el tejido normal, lo que confirma la validez de nuestro enfoque para identificar los genes del cáncer candidato. Sin embargo, también se detectaron 2 de 6 inserciones de genes ampliadas del tumor en niveles similares en el tejido pulmonar normal, lo que indica que algunas inserciones clonal ampliado en los tumores se pueden derivar de las inserciones de clones pre-cancerosas.
Finalmente, nos preguntamos si los órganos llevarían a una tasa más alta de fondo expandido inserciones de pre-cáncer que el tejido de la cola, como órganos tienen típicamente una composición más homogénea de los tipos de células que la cola heterogénea (Figura S7). De hecho, encontramos que el ADN de órganos en algunos casos puede contener inserciones más expandidos que el tejido de la cola. El número de inserciones expandido varió de 3 a 23 en los órganos, con un promedio de 11 inserciones expandido por muestra. Como las muestras de tumores de nuestra cohorte realizados en promedio 16.4 inserciones expandido, se estima que, en promedio, 66% (11 /16,4) de las inserciones expandido en los tumores pueden reflejar ampliado inserciones pre-cancerosas. Basándose en estos experimentos de control, se concluye que el análisis de la expansión clonal es un método adecuado para identificar los genes del cáncer de candidatos en los tumores individuales. Sin embargo, una advertencia importante es la presencia de inserciones expandido pre-cancerosas en el tejido tumoral, y la tasa de estas inserciones puede variar ampliamente entre las muestras dependiendo del tipo de tumor y tejido huésped
.
Entre inserciones clonal ampliado en tumores, 56,9% se encontraron en las regiones de genes (promotores, exones e intrones), -a proporción significativamente mayor que el de todas las inserciones piggyBac en los tumores (33,4%; véase la figura 2C) -, y el 43,1% se encuentra en las regiones intergénicas. inserciones clonal ampliado en las regiones intergénicas pueden ejercer de largo alcance cis-efectos sobre los genes vecinos. Sin embargo, como las bases de datos actuales no contienen información sobre el papel oncogénico de las regiones intergénicas, limitamos nuestro análisis más detallado para inserciones de transposón en las regiones de genes.
expansiones clonales identificar genes candidatos cáncer
La expansión clonal análisis de inserciones de transposón en las regiones de genes identificados 88 genes únicos que representan potenciales genes del cáncer candidato (Figura 4A). De acuerdo con esta predicción, se observó varios genes entre nuestros genes candidatos que están implicados en el cáncer. Por ejemplo, nueve de nuestros genes del cáncer candidato también figuraban en la lista gen del cáncer de censo, que comprende 487 genes causalmente relacionados con el cáncer [11], lo que representa un enriquecimiento muy significativa (
Abl2
,
Braf
,
FBXW7
,
Foxp1
,
Ipo11
,
Mllt3
,
Fas
,
PTEN
y
Cf1
; p & lt;. 0,0002, prueba exacta de Fisher)
A) inserciones de genes clonal ampliado en muestras tumorales, según sus frecuencias de lectura media (
f
) . Tres ratones albergaban dos tumores cada (tumor 01 y 08, tumor 05 y 09, y del tumor 04 y 10, respectivamente). Un asterisco azul denota genes presentes en la lista gen del cáncer de censo, una lista de 487 genes causalmente implicado en el cáncer.
Mamdl1 Opiniones y
Dgkd
fueron alcanzados en las muestras tumorales independientes y se destacan en rojo y rosa, respectivamente.
B) Los procesos celulares afectadas por inserciones de genes clonal ampliado. Categorías de procesos se compilan a partir de la información genética funcional a www.omim.org y www.informatics.jax.org.
En nuestro estudio, tres animales de la cohorte realizaron dos tumores cada uno (Figura S1). Curiosamente, dos pares de tumores no mostraron superposición de los genes del cáncer (tumores candidato 01 y 08; los tumores 04 y 10), lo que indica origen independiente de los tumores. Por el contrario, los tumores de 05 (masa sólida tumor en el hígado) y 09 (linfoma folicular) compartido 5 genes del cáncer candidato, lo que indica un origen común. A medida que el hígado es un sitio común de la invasión de la leucemia linfocítica [12], es posible que el tumor de hígado 09 es una masa de tumor metastásico que se deriva de la tumor linfocítica esplénica 05. De nota, el 5 compartían genes del cáncer de candidatos de tumores 05 y 09 (
PTEN, Fas, ESR1, Abl2, Lrp1b
) se obtuvieron de forma independiente en ambos tumores con frecuencias de lectura promedio similares, lo que confirma la solidez de nuestro método de secuenciación para identificar la expansión clonal de las inserciones.
al analizar los genes candidatos para el enriquecimiento significativo de categorías funcionales utilizando el recurso DAVID bioinformática (http://david.abcc.ncifcrf.gov) [13], encontramos un enriquecimiento significativo de proteínas categorías y rutas relacionadas con quinasa (por ejemplo, KEGG : MAPK vía de señalización, p & lt; 0,016; InterPro: proteína quinasa, núcleo, p & lt; 0,016; Benjamini-Hochberg corregida P-valor; Tabla S3). Del mismo modo, cuando se agruparon de forma manual genes candidatos por su proceso celular conocido, se encontró que los genes implicados en la transducción de señales representaban el mayor grupo de genes (Figura 4B). Otros procesos celulares prominentes de genes candidatos fueron apoptosis, remodelación de la cromatina, la transcripción, y el transporte de proteínas /clasificación (Figura 4B). Curiosamente, cuando se mira en los procesos celulares a nivel de los tumores individuales, encontramos que cada tumor tenía una o varias mutaciones en los genes de señalización, y una mezcla de inserciones que afectan a por lo menos otros dos procesos celulares. Este patrón de múltiples procesos mutados para cada tumor está de acuerdo con el concepto de que múltiples alteraciones genéticas en diferentes procesos celulares conducen el crecimiento del tumor [14].
Entre los genes del cáncer candidato definidos por la expansión clonal, dos genes fueron alcanzados de forma independiente en diferentes sitios AAVV en múltiples tumores (con exclusión de los genes compartidos por el tumor 05 y 09, que comparten un origen común): Mastermind-dominio como 1 (
Mamld1
) y delta Diacylglycerolkinase (
Dgkd
). Por lo tanto, estos genes son particularmente fuertes genes del cáncer candidato, tal como se definen doblemente tanto por la expansión clonal de las inserciones en los tumores individuales y ocurrencia independiente como sitios de inserción común en múltiples muestras tumorales. El
Mamld1
gen ha sido mutado por inserciones en los tumores epiteliales de la piel (tumor 01, 02 y 03).
Mamld1
se ha propuesto ser un co-activador de Notch de señalización no canónica [15]. En la piel humana, componentes de señalización Notch se expresan abundantemente, y la desregulación de la señalización de Notch conduce a varios tipos de cánceres de piel [16]. Por lo tanto,
Mamld1
es un nuevo gen de cáncer candidato como un regulador de la señalización de Notch para tumores epiteliales. El
Dgkd
gen se ha encontrado mutado en tumores sólidos 05 (metástasis linfática en el hígado) y 07 (pulmón).
Dgkd
metaboliza 1,2, diacilglicerol (DAG) a ácido fosfatídico (PA). Tanto DAG y PA desempeñan papeles importantes como segundos mensajeros de señales mitogénicas y la modulación de los niveles de
DGK
proteínas se ha propuesto ser un mecanismo potencial en el cáncer [17].
Discusión
Estamos aquí demostrar que el análisis de secuenciación de alto rendimiento de ADN cizallado de los tumores generados transposón proporciona medios para identificar los genes del cáncer candidato por análisis de la expansión clonal. Este enfoque representa una estrategia mejorado para la identificación de genes de cáncer de candidato en pantallas de transposón, y permite por primera vez la identificación de los genes del cáncer candidato a nivel de los tumores individuales.
Cuantificación de la expansión clonal
los protocolos actuales utilizan digestiones de restricción para fragmentar el ADN del tumor, lo que resulta en un sesgo hacia las inserciones que están representados por fragmentos cortos [7] y reduciendo así el aspecto cuantitativo de análisis del número de leer. Se aplicó cizallamiento acústico para la fragmentación del ADN para minimizar las diferencias de tamaño de los fragmentos de sitio de inserción. Esta mejora, en combinación con Illumina secuenciación de alto rendimiento, nos ha permitido obtener una evaluación semicuantitativa de la representación proporcional de las inserciones. Varias observaciones sugieren que nuestro método alcanzó un nivel de exactitud cuantitativa suficiente para identificar inserciones clonal ampliado que definen los genes del cáncer candidato. En primer lugar, la comparación de muestras de tumor y de control reveló un enriquecimiento distinta de inserción lee en muestras de tumores. Segundo, el análisis de los tumores relacionados 05 y 09 mostraron una fuerte correlación de frecuencias de lectura de inserciones clonal ampliado. Por último, los genes mutados por inserciones clonal ampliado comprendidas muchos genes del cáncer bien definidos
.
Sin embargo, una advertencia importante del análisis de la expansión clonal es que los órganos pueden llevar a una serie de inserciones de pre-cancerosa que haya clonal ampliado por casualidad. Como nuestros experimentos de control indican, estas inserciones pueden comprender un promedio de dos tercios de las inserciones clonal ampliado. Por lo tanto, aunque nuestro método es claramente eficaz en la identificación de genes de cáncer de candidatos en tumores individuales, la función de conducir el cáncer de cada gen necesita ser corroborado además por métodos alterantes, tales como el análisis de CIS o ensayos funcionales.
Un factor que puede influir en la velocidad de expansión clonal de inserciones es la actividad de la transposasa PiggyBac. Si la actividad de transposición PiggyBac cesaría durante el tiempo de vida del ratón, esto sería fijar ciertas inserciones, que aparecerían como expansiones clonales en nuestro análisis. Nos ocuparemos de la actividad continua de la transposasa PiggyBac en los tejidos de ratón adulto en futuros estudios de ensayos inmunohistoquímicos.
Varios sesgos en leer la secuencia de la representación en nuestro análisis de la expansión clonal siguen siendo, por ejemplo, los introducidos por diferentes GC contenido de fragmentos durante la amplificación PCR. Otro factor que disminuya la potencia cuantitativa de este método son la posible presencia de tejido estromal no tumoral en las muestras, que diluye las inserciones de conducción tumor clonal ampliado. Además, una advertencia de nuestro método es que la unión no específica del cebador Splinkerette podría dar lugar en algunos casos a una amplificación genómica predominante de los sitios que no son ciertas inserciones de transposones. Se necesitarán nuevos refinamientos técnicos para llevar el análisis de la expansión clonal a un nivel cuantitativo absoluto
secuenciación de alto rendimiento de las inserciones de transposones
Nuestro enfoque de secuenciación cedió & gt;. 10
6 mapeados lee por muestra tumor. Una serie de 10
5 lecturas por muestra había sido propuesto para ser suficiente para revelar todas las inserciones de la Bella Durmiente generada tumores [7].