Extracto
Antecedentes
El cáncer colorrectal (CCR) es, con aproximadamente 1 millón de casos el tercer cáncer más común en todo el mundo. Una amplia investigación está en curso para descifrar los patrones genéticos subyacentes con la esperanza de mejorar el diagnóstico precoz del cáncer y el tratamiento. En este sentido, los recientes avances en las tecnologías de secuenciación de nueva generación ha revolucionado el campo de la genómica del cáncer. Sin embargo, una advertencia de estos estudios sigue siendo la gran cantidad de variaciones genéticas identificadas y su interpretación.
Metodología /Principales conclusiones
A continuación se presenta el primer trabajo sobre todo exoma NGS de los cánceres primarios de colon. Se realizó toda la pirosecuenciación 454 exoma del tumor, así como el tejido normal de colon no afectada adyacente de microsatélites estables (MSS) y microsatélites pacientes (MSI) de cáncer de colon inestables y se identificaron más de 50.000 pequeñas variaciones de nucleótidos para cada tejido. De acuerdo con las predicciones basadas en el SMS y mecanismos patológicos MSI se identificaron ocho veces variaciones no sinónimo más somáticas en cánceres MSI que en el SMS y hemos sido capaces de reproducir el resultado en cuatro CRC adicionales. Nuestros bioinformática enfoque de filtrado reducido la tasa de la mayoría de mutaciones significativas a 359 de MSI y 45 de MSS CRCs con funciones de proteínas alterados predichos. En ambos CRC, MSI y SMS, encontramos mutaciones somáticas en el dominio quinasa intracelular de 1A hueso receptor de proteína morfogenética, BMPR1A, un gen donde las mutaciones en lo que va de la línea germinal se asocian con el síndrome de poliposis juvenil, y muestran que las mutaciones funcionalmente perjudican la función de las proteínas .
Conclusiones /Importancia
Llegamos a la conclusión de que con profunda secuenciación de exomas tumorales uno puede ser capaz de predecir el estado de los microsatélites de CRC y, además, identificar las mutaciones potencialmente clínicamente relevantes.
Visto: Timmermann B, Kerick M, Roehr C, Fischer A, Isau M, Boerno ST, et al. (2010) La mutación somática Perfiles de MSI y SMS cáncer colorrectal identificado por entero Exoma Siguiente Generación de Secuenciación y Análisis de Bioinformática. PLoS ONE 5 (12): e15661. doi: 10.1371 /journal.pone.0015661
Editor: Amanda Ewart Toland, Ohio State University Medical Center, Estados Unidos de América
Recibido: 25 Agosto, 2010; Aceptado: 19 Noviembre 2010; Publicado: December 22, 2010
Derechos de Autor © 2010 Timmermann et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por el Ministerio Federal alemán de Educación e Investigación (01GS08105 "Mutanom," 01GS08111 "intestinal modificadores") y la Sociedad Max Planck. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
el cáncer colorrectal es el tercer cáncer más común con aproximadamente 1 millón de casos en todo el mundo. En las últimas décadas se ha hecho evidente que la CRC evoluciona a través de múltiples vías y que estas vías pueden ser más o menos definidos sobre la base de patrones moleculares tales como la integridad del sistema de reparación de genes (MMR) o los patrones de mutaciones y epigenéticos. La deficiencia en el MMR se refleja en la inestabilidad de microsatélites de ADN (MSI), que también se ha asociado con el resultado del tratamiento, pero que necesita ser validado aún más en los estudios clínicos adicionales [1], [2], [3], [4], [ ,,,0],5], [6].
-alto rendimiento estudios de secuenciación de Sanger en el otro lado han demostrado que la frecuencia de mutación de genes de cáncer de candidatos podría ser mucho mayor de lo esperado, y que la combinación particular de mutaciones podría influir en el inmuebles del tumor [7], [8], [9], [10], [11]. Con el desarrollo de las tecnologías de secuenciación de próxima generación (NGS) el rendimiento de secuenciación ha aumentado dramáticamente y los costos han disminuido. Además, y de especial importancia para el ámbito clínico, NGS se puede aplicar al material fijado con formalina y embebidos en parafina FFPE tejido, así como ADN altamente degradado que se prepara de forma rutinaria en los departamentos de patología o que se encuentran en la antigua ADN [12], [13]. Varios estudios han utilizado tecnologías NGS para la identificación de la mutación subyacente en las enfermedades monogénicas [14], [15]. Sin embargo, sólo un número limitado de estudios reportan en la secuenciación de próxima generación para identificar nuevos genes del cáncer candidato; uno de los primeros estudios examinaron la leucemia mieloide aguda citogenético normal, y los genomas del cáncer de mama [16], [17]. Además, los estudios sobre líneas de melanoma maligno y celulares de cáncer de pulmón de células pequeñas han proporcionado primeros conocimientos sobre las alteraciones genómicas inducidos por la exposición de luz ultravioleta o el humo del tabaco [18], [19].
Para obtener una perspectiva de los genomas de los cánceres colorrectales estables e inestables de microsatélites e identificar los patrones de mutaciones funcionales pertinentes Se utilizó un enfoque de captura de ADN basado en la hibridación toda exoma seguido de 454 secuenciación de próxima generación [20]. La aplicación de la bioinformática análisis rigurosos, que redujo la cantidad de mutaciones somáticas funcionalmente significativas en MSI a 359 y 45 en los cánceres del SMS, destacando así los patrones de mutación específicas dependiendo del estado de los microsatélites. Hemos sido capaces de confirmar nuestros resultados mediante la secuenciación de los exomas de cuatro casos de CCR adicionales (uno de MSI, tres SMS) utilizando una tecnología diferente enriquecimiento y secuenciación. Entre estas mutaciones son BRAF en el cáncer de MSI y KRAS y TP53 en el cáncer de SMS, lo que subraya aún más la validez de nuestro enfoque de selección [21]. Además caracterizaciones funcionales identificaron mutaciones somáticas recurrentes en BMPR1A, una proteína que se ha asociado hasta ahora con el síndrome de poliposis juvenil, un síndrome de predisposición al cáncer.
Resultados
enriquecimiento y la secuencia específica de estrategia de secuenciación
Hemos secuenciado emparejan tejidos de colon normales y tumor a partir de dos pacientes con adenocarcinoma de alto grado del colon (G3), el paciente 1 con un microsatélite inestable y el paciente 2 con un tumor microsatélites estables (Tabla 1, Figura S1). Para la determinación de mutaciones de línea germinal secuenciado además de los tejidos tumorales de cada paciente tejido adyacente no afectada normal de colon. El uso de la secuenciación de Illumina y SNP arrays se determinó que el tumor del paciente 1 es el número de copias estable, mientras que el paciente 2 mostró variaciones que utilizamos para la re-evaluación de las mutaciones identificadas alta rigurosidad (Tabla S3).
Se analizaron los exomas completos de más de 135.000 exones con la secuenciación de lectura única escopeta 454 (Figura 1, Figura S1, S2 Figura, Tabla 2). Para evaluar el efecto de la profundidad de la cobertura de la sensibilidad y especificidad de la detección variante de secuencia, las llamadas genotipo de la matriz de Affymetrix SNP 6.0 se compararon paso a paso a las llamadas posiciones de ácido nucleico y dio como resultado una exactitud de más de 99% (Figura S3) . Además de la matriz de SNP, se utilizó la secuenciación de Sanger para confirmar 23 mutaciones seleccionadas (Tabla S5, la Figura S5).
(A) Diagrama de Venn de los exones capturados de muestras normales y tumorales. Se contaron los exones capturados con al menos una lectura. (B) Representante parcela cobertura de la distribución normalizada. La fracción de los exones de cebo-cubierto en el genoma lograr coberturas igual o más baja que la cobertura normalizada se indica en el eje x. La cobertura media por el exón se dividió por la cobertura media de todos los exones.
Identificación de mutaciones somáticas en las secuencias de codificación para una MSI CRC
Búsqueda de variantes en regiones codificantes encontramos 12.767 y 12.518 pequeñas variaciones nucleares en 6.428 y 6.205 genes, por tumoral y normal, respectivamente. 1.428 de estas variantes para el control y 2,404 para tumores tienen un promedio de heterocigosidad o alelo menor frecuencia inferior al 1% o no se han reportado previamente en dbSNP o el Proyecto 1000 Genomas (Figura 2). Desde indeles (pequeñas inserciones y deleciones) en los sitios homopolymeric son una fuente importante de errores en la secuencia de la plataforma 454 de haber ignorado este tipo de alteración en nuestros análisis.
(A) Representación esquemática del flujo de trabajo de bioinformática detección de SNV. (B) Extracción de mutaciones somáticas funcionalmente relevantes para MSI y SMS cánceres colorrectales. Las variantes se detectaron con la referencia SG Mapper antes de que se filtraron por su localización, la anotación en dbSNP130 o los 1000genomes, somático y deterioro funcional. De dbSNP130 o las variantes con 1000genomes se utilizaron frecuencias superiores a 1%. Para MSI CRC 359 y variantes para el SMS CRC 45 se identificaron con funciones alteradas de proteínas predichas.
Nuestra estrategia de detección variante somática fue diseñado para minimizar los falsos positivos variante somática llama en lugar de determinar cigocidad. Se utilizó un enfoque de dos etapas con dos niveles de exigencia diferentes para detectar variantes en el tumor y los tejidos benignos similares a Pleasance
et al.
[18]. En la primera etapa, las variantes tumorales fueron llamados bajo criterios estrictos, que se determinaron mediante la comparación con los datos de la matriz de genotipificación de SNP. El segundo paso comprobar si la variante del tumor fue de la línea germinal o somática. Para mantener la tasa de falsos negativos en el tejido benigno a menos de 10%, fijamos la cobertura de corte en 5 veces, por debajo del cual no se extrajeron conclusiones acerca de si era una variante de la línea germinal o somática. Si se cumple la cobertura de corte, una única lectura que muestra la misma variante en el tejido tumoral benigna y dio lugar a la categorización de la variante de la línea germinal como
.
Con esta estrategia se identificaron 915 mutaciones no sinónimas somáticas que afecta a 864 genes. La mayoría de las mutaciones somáticas eran mutaciones sin sentido (65%). Sin embargo, muchos (7%) se encuentran dentro de las regiones no traducidas de los genes y por lo tanto puede dar lugar a alteraciones en la expresión o el aumento de la descomposición de las especies de ARNm. Además, aproximadamente el 0,5% de estas mutaciones se encuentran en los sitios de empalme y podría influir en los eventos de corte y empalme, lo que lleva a una estructura de transcriptoma alterado. Además, tres variantes somáticas se identificaron en las regiones de los genes miARN (Tabla S6). Estas mutaciones son de particular interés porque miRNAs han sido implicados como reguladores maestros de la homeostasis tumor. El análisis de los tipos específicos de variaciones de ácidos nucleicos, incluyendo variantes conocidas y desconocidas, mostró esencialmente las tasas esperadas de los intercambios de nucleótidos, según lo determinado por los cálculos usando dbSNP130 (figura S4).
Análisis funcional de las mutaciones de dos puntos MSI cáncer
Dado que no todos los 1.304 mutaciones somáticas es probable que sean patológicamente relevantes, hemos tratado de identificar aquellas que probablemente destruir la función de proteínas altamente conservadas o afectar aminoácidos y por lo tanto podría ser funcionalmente importante. Utilizamos herramientas de clasificación y PolyPhen MutationTaster para predecir las consecuencias funcionales de los cambios de aminoácidos o mutaciones de cambio y se encontró que 359 genes tenían al menos una mutación potencialmente destructiva (Tabla S1) [22], [23]
.
las mutaciones somáticas con potencial destructivo, 309 se encuentran en posiciones altamente conservadas en 44 especies diferentes, incluyendo zarigüeya
(Monodelphis domestica)
, pollo
(Gallus gallus)
y la lamprea
(Petromyzon marinus )
. De éstos, 259 se localizaron en los genes expresados en los dos puntos, de los cuales 47 eran los genes de reparación, los receptores, o quinasa. La visualización de las mutaciones seleccionadas en las estructuras de proteínas indica que estos nucleótidos se encuentran en la superficie de la proteína, resultando potencialmente en las interacciones proteína-proteína interrumpidas.
El Catálogo de mutaciones somáticas en el Cáncer (cósmica) de base de datos es una colección completa de cáncer- mutaciones relacionadas. Aproximadamente el 39% de nuestros genes mutados que ya fueron descritos en esta base de datos, y el 13% se encontraron por Wood
et al
[10]. Al igual que estas bases de datos anteriores, encontramos el
BRAF mutación
p.V600E en el caso de MSI e identificamos
KRAS Opiniones y
TP53
mutaciones en el tumor MSS.
BRAF
mutaciones se encuentran en aproximadamente el 10% de los CCR, predominantemente MSI y del 30 al 35% de todos los pacientes con cánceres colorrectales esporádicos llevar a somática
KRAS Opiniones y
TP53
mutaciones. Estos resultados demuestran una vez más la sensibilidad de nuestra estrategia de clasificación.
paisaje mutacional de un SMS cáncer de colon
Para el cáncer de colon MSS hemos identificado 10.622 pequeñas variaciones nucleares. Después de que los mismos procesos de filtrado como para el cáncer de MSI utilizando la base de datos dbSNP y los datos de los 1000 Proyecto Genomas 1.288 variantes permanecieron que o bien tenían baja prevalencia o eran desconocidos. De éstos, 198 eran somáticas y 45 fueron predichas para alterar la función génica basada en la MutationTaster y PolyPhen cálculos (Figura 2B, el cuadro S2) [22], [23]. En lo que respecta a copiar variaciones en el número cinco de las 45 mutaciones identificadas están situadas dentro de las regiones amplificadas, y, como era de esperar, ninguno en regiones con deleciones. Las proporciones de lee con la secuencia de referencia a la secuencia mutada no son superiores a las proporciones del número de copias zonas estables que soporta el algoritmo SNV-llamando.
A diferencia de 1.304 mutaciones somáticas en el tumor MSI encontramos 198 mutaciones somáticas en el tumor MSS que demuestra que el sistema de MMR defectuoso en MSI tumores da como resultado un aumento significativo en las tasas de mutación en el cáncer colorrectal.
Además, mirando en las intersecciones entre los dos tipos de cáncer que encontramos BMPR1A, WDTC1 (WD y tetratricopeptode repite 1 ) y EHD3 (EH-dominio que contiene 3) mutado en ambos tumores. La selección se basó en el deterioro funcional con alta probabilidad en Polyphen y MutationTaster [22], [23]. Todas las mutaciones se encuentran en la superficie de la proteína y están muy conservadas. Dado que hemos encontrado vías significativas relacionadas con el cáncer asociados únicamente con BMPR1A pero no con WDTC1 o EHD3, y, además, las mutaciones germinales en BMPR1A son un factor de riesgo conocido para el síndrome de poliposis juvenil, elegimos BMPR1A para los ensayos funcionales adicionales (Figura 3, Figura S5) . El uso de ensayos de indicador con el tipo salvaje y las proteínas mutadas BMPR1A hemos sido capaces de demostrar que las proteínas mutadas se ven fuertemente afectados en su función de señalización y que la estimulación con resultados PNM2 en una actividad máxima reducida (Figura 3D).
(A ) diagrama de Venn proporcional. Las fracciones de llamadas SNVS idénticos a los datos del proyecto Genomas y dbSNP130. Sólo los datos de los que se conocía la frecuencia del alelo menor de edad o la heterocigosidad media y por debajo de 1% se utilizaron para la comparación. (B) Distribución de sinónimo, sin sentido, sin sentido y las mutaciones que afectan a los codones de inicio o detención se muestran en relación con todas las mutaciones somáticas. mutaciones (C) BMPR1A p.W487R y p.E502G se encuentran en el dominio de la proteína quinasa de BMPR1A. aminoácidos de referencia están en verde, las formas mutadas se muestran en rojo. La estructura de red en el lado inferior izquierdo indica el dominio de unión a ATP. mutaciones (D) BMPR1A mostrar disminución en Acitivity señalización. Actividad de peso mBMPR1A, mBMPR1A E502G y mBMPR1A W487R se determinó en células C2C12 utilizando un ensayo de gen indicador de luciferasa SMAD-sensible. La actividad de luciferasa inducida se normalizó a Renilla acitivty. La actividad de las células no transfectadas se fijó a 0% y la actividad de peso mBmpr1a se fijó a 100%. Se calcularon las diferencias significativas con una prueba t de dos colas y se marcan como:. * p = 0.05, p≤0.01 **, *** p≤0.001
MSI cánceres colorrectales albergan hasta 8 -fold más de codificación de las mutaciones somáticas que MSS cánceres
Los análisis presentados hasta ahora se han basado en 454 secuenciaciones exoma de un paciente de cáncer colorrectal para cada estado de los microsatélites. Para confirmar aún más que el aumento de la cantidad de mutaciones en los cánceres de codificación de MSI se puede generalizar y no es debido a la tecnología utilizada (enriquecimiento 'array' y la secuencia 454) secuenciado los exomas de cuatro cánceres colorrectales adicionales, cada uno a juego con los tejidos normales. Esta vez hemos utilizado 'en la hibridación en solución' para la captura de ADN seguida de la secuenciación sólido. Después de que los mismos procedimientos de filtrado como se describe para los dos primeros pacientes que determina de nuevo hasta 8 veces las tasas de mutación más altas para el cáncer colorrectal MSI que para los cánceres de SMS (Tabla 3). En este sentido, encontramos 532 SNVS no es sinónimo somáticas en el MSI adicional CRC y sólo el 65, 74 y 76 en los tres casos MSS CRC. Por lo tanto, las diferencias en las tasas de mutación son reproducibles e independiente de la tecnología de secuenciación utilizado.
Discusión
Uso de secuenciación de próxima generación, hemos secuenciado los exomas de pacientes con cáncer de colon del SMS y MSI , con coberturas medios de aproximadamente 20 veces. Se aplicó un algoritmo de clasificación de dos caras para descubrir mutaciones funcionalmente relevantes. Con este enfoque, hemos demostrado por primera vez que un NGS flujo de trabajo de un solo paso matriz de captura es una herramienta poderosa para la profunda caracterización de tumores sólidos y demostrar que los tumores MSI llevan ocho veces las mutaciones relevantes más funcionales que los SMS tumores (Figura 2) .
el impacto funcional de las variaciones somáticas se predijo usando dos algoritmos de predicción funcionales, PolyPhen y MutationTaster, y encontramos 359 mutaciones somáticas para el MSI y 45 para el cáncer de SMS que son altamente probable que cause deterioro funcional [ ,,,0],22], [23]. La heterogeneidad de los genes mutados sugiere que no es un gen específico
per se
pero la vía afectada juega un papel importante para el desarrollo del tumor. En este sentido nos encontramos con un enriquecimiento significativo de mutaciones en las vías relacionadas con el cáncer, como el cáncer, el desarrollo celular y la replicación del ADN, la recombinación y reparación (cuadro S5). Curiosamente, encontramos 50% de las vías enriquecidos más significativos en el cáncer de MSS también vías enriquecidos como de manera significativa para el cáncer de MSI, lo que indica que a pesar de que los cánceres MSI albergan un mayor número de mutaciones ambos tipos de cáncer podría desarrollar a través de mecanismos patológicos que se solapan.
Históricamente, las pruebas de microsatélites en los cánceres colorrectales fue la primera prueba de predicción para la identificación de un desajuste de reparación subyacente (MMR) mutación. Desde hace más de 90% de no asociado a poliposis cáncer colorrectal hereditario (HNPCC) muestran MSI, el estado de los microsatélites se ha convertido en un marcador de diagnóstico común de MMR. Además, las ventajas de supervivencia y las consecuencias terapéuticas se han reportado para los pacientes con tumores MSI [5], [24]. Usando la secuenciación ultraprofundas de una región conservada, UCR41, de Grassi y colegas muestran que esta región tiene tasas de mutación más altas en las muestras de CCHNP que en controles sanos y sugieren que esto podría ser utilizado como ensayo molecular sensible de la inestabilidad genómica [24]. Hemos ampliado sus análisis a exomas enteros y encontró diferencias 8 veces en el número de mutación somática de MSI y SMS cánceres colorrectales. En comparación, un estudio realizado por Greenman
et al.
Que se informaba de la secuenciación de 518 genes de la proteína quinasa en 210 diversos cánceres humanos encontró una de aproximadamente 25 veces más alta tasa de mutación para los cánceres MMR-deficientes [9]. Sin embargo, estos son extrapolaciones y en contraste con nuestro estudio que incluyen tumores de diferente origen y se examinaron todas las mutaciones somáticas independientemente de su relevancia funcional. Con nuestro enfoque de secuenciación también se detectó una somática
MLH3
mutación en el tumor MSI, que, a pesar de que
Mlh3
mutaciones no pertenecen a las mutaciones clásicas MMR en el CCR, podría contribuir a la microsatélite inestabilidad fenotipo [25]. Por otra parte, la combinación de MSI y
BRAF
mutación, según lo detectado por el tumor MSI descrito, se encuentra con mayor frecuencia para la isla de metilación fenotipo (1) CIMP1 tumores CpG que se asocian con
MLH1 promotor
metilaciones [21], [26]. La metilación del promotor a su vez se asocia con mecanismos de silenciamiento génico, que es sugerente como una explicación para el estado de MSI de los tumores. Por otro lado, se ha propuesto que la inestabilidad cromosómica (CIN) y CIMP representan dos mecanismos independientes e inversamente relacionados de inestabilidad [27]. casos CIMP-negativas están asociadas con p53 (71%) y
KRAS gratis (33%) mutaciones, pero rara vez se encuentran con
BRAF
(2%) mutaciones. Dado que hemos encontrado grandes variaciones del número de copias, así como
KRAS
y
TP53
mutaciones en el tumor MSS analizaron este tumor es más probable CIMP-negativos [5], [24].
la estrategia de secuenciación y el análisis que hemos presentado podría ser la base de futuras herramientas de clasificación para el cáncer colorrectal, ya que puede permitir una detección paralela de un aumento de la frecuencia de mutación en los tumores MSI, así como la detección del defecto MMR subyacente. Además, hemos sido capaces de detectar las mutaciones de genes frecuentemente asociados con ciertos subtipos de cánceres colorrectales, tales como
BRAF, KRAS
y
TP53
. Dentro de nuestros genes de alta prioridad, que abarca todos los genes que pasan todos los filtros de selección,
BMPR1A
destaca por ser mutado en ambos casos. La estructura general revela que los aminoácidos mutados están situados en la hélice paquete intracelular C-terminal en el dominio de la proteína quinasa y sugiere que las interacciones proteína-proteína se destruyen [28]. La línea germinal
BMPR1A
mutaciones predisponen al juvenil síndrome de poliposis; Sin embargo, nuestros resultados indican que las mutaciones somáticas también podrían desempeñar un papel importante en el desarrollo del cáncer colorrectal esporádico [29], [30], [31], [32], [33].
Además de estas mutaciones que tienen también identificado varios objetivos mutadas de cáncer de drogas o genes que están asociados con el resultado del tratamiento, incluyendo
BRAF, KRAS, FGFR2
y
mTOR
, lo que podría ayudar a elegir las combinaciones óptimas de drogas. Como tales enfoques re-secuenciación selectiva similares y la bioinformática que filtran las estrategias podría convertirse en un estándar de oro para el tratamiento del cáncer colorrectal adaptado individualmente en el futuro.
Materiales y Métodos
Declaración de Ética
el estudio ha sido aprobado por el Comité ético de la Universidad de Medicina de Graz. Para las nuevas muestras de pacientes han dado su consentimiento informado por escrito. Para las muestras de edad (15 años) sin el consentimiento informado que estaba disponible, por lo tanto, todas las muestras y los datos médicos utilizados en este estudio han sido irreversiblemente anónimos. COLECCIÓN
Presentación del caso y la muestra de tejido
1 paciente tenía un adenocarcinoma de alto grado (G3) del colon proximal, que tuvo lugar pT-3C, pN-0, pM-X, pR-0, microsatélite inestable (Figura 1A). Además, este caso fue seleccionado debido a su estabilidad cromosómica, como se determinó mediante la secuenciación de todo el genoma de próxima generación (NGS) (Figura 1B). El paciente 2 tenía un adenocarcinoma de alto grado (G3) del colon proximal, que tuvo lugar PT-4B, PN-2, PM-X, microsatélite estable.
El tejido humano obtenido durante la cirugía fue congelaron en nitrógeno líquido . Se prepararon secciones criogénicas (3 m de espesor) y se tiñeron con hematoxilina y eosina para evaluar el contenido de las células tumorales. Las disecciones se realizaron bajo el microscopio para conseguir un contenido de células tumorales de & gt; 80%. el aislamiento de ADN se realizó utilizando el Kit QIAamp DNA Mini (Qiagen), de acuerdo con las instrucciones del fabricante.
Whole Exoma ADN Enriquecimiento y Genome Sequencer FLX secuenciación
ADN genómico de ambos tejidos se sometió a todo exoma captura de secuencias utilizando la matriz 2.1M exoma humano Roche /de NimbleGen. Esta matriz se basa en la acumulación 36.3 de la secuencia del genoma humano, y captura las regiones codificantes de genes 16,755 NCBI RefSeq (aproximadamente 180.000 exones de codificación), así como 493 regiones miARN. Tumor y el ADN de tejido normal se sometieron a secuencia exoma toda la captura de acuerdo con el protocolo del fabricante. ADN fue esquilada por nebulización para fragmentar tamaños por debajo de 800 pb, limpiado (Zymo Research) y utilizando ADN polimerasa de T4 y T4 polinucleótido quinasa pulido final. Enlazador adaptadores pSel3 (5 '- CTCGAG AAT TCT GGA TCC TC - 3') y pSel4-P (5 '- Phos /GAG GAT CCA GAA TTC TCG AGT T - 3') se ligaron y selección de tamaño se realizó a través AMPure de Purificación de ADN perlas (Agencourt). La calidad se controla con el sistema Bioanalyzer. LM-PCR se realizó con LMPCR3 cebadores (5 '- GAG CUC AAU UCU GGA UCC UC - 3') antes de que se utilizó la biblioteca para la hibridación a 42 ° C durante 72 h. Los arrays se lavaron dos veces en 47,5 ° C, dos veces a temperatura ambiente y dos veces a 42 ° C con tampones de lavado como se recomienda. ADN genómico unido se eluyó con NaOH 125 mM durante 10 min a temperatura ambiente y se amplificó por LM-PCR usando cebadores LMPCR3. muestras amplificadas capturados fueron sometidas a PCR cuantitativa para medir el enriquecimiento relativo.
El ADN Nimblegen enriquecido se utilizó para construir de una sola hebra Genome Sequencer FLX (454 /Roche) bibliotecas. Después de PCRs emulsión cebadores de secuenciación se hibridaron a la plantilla y las perlas se incubaron con ADN polimerasa Bst, apirasa, y proteína de unión de cadena sencilla. La pirosecuenciación se realizó en una placa picotituladora 70 × 75 mm en 13 carreras de secuenciación separadas. Después del procesamiento de datos en bruto predeterminada, se utilizó un filtro de resecuenciación de corte para aumentar la salida de datos. (Parámetros utilizados: doValleyFilterTrimBack = false, vfBadFlowThreshold = 6, vfLastFlowToTest = 168, errorQscoreWindowTrim = 0,01)
Para la secuenciación se realizó el 13 de Genome Sequencer FLX corre, que produce más de 558 millones de bases y 1,43 millones de lecturas por carrera. . Las lecturas fueron alineados a la referencia del genoma humano, NCBI Build 36 (http://hgdownload.cse.ucsc.edu/goldenPath/hg18/), utilizando GS de referencia Mapper versión 2.0.0.12 (Roche). Los mejores partidos en el genoma se utilizaron como la ubicación de las lecturas con varias coincidencias. Sólo lee única con una longitud mínima de 50 pb se utilizaron para su posterior análisis (ver Tab estadísticas de gestión. 2).
La detección de variantes se realizó con la GS de referencia Mapper versión 2.0.0.12 (Roche). Redundante lecturas se restaron antes llamados variantes. Sólo el HCDiff (altas diferencias de confianza) del software GS Mapper se utilizaron como base de la detección variante [20]. llamamientos HCDiff suponen al menos tres lecturas con la variante con tanto avance y retroceso texto incluido; Como alternativa, los niveles de calidad, en las posiciones variables deben ser mayores de 20 (o más de 30 si un homopolímero de cinco o más bases participa). Como criterios adicionales de calidad que utilizamos solamente las variantes con una cobertura & gt;. 10 × de alta calidad lee
Total Exoma 'en solución' de ADN y la secuencia de enriquecimiento SóLIdAS
Se realizaron Enriquecimientos y preparación de la biblioteca SóLIdAS según el protocolo de enriquecimiento SureSelect Target de Agilent para el sólido sistema de Applied Biosystems. En resumen, todo el ADN genómico fue esquilada y al final reparado. Para la ligadura de adaptador se utilizaron 30x exceso de los adaptadores. selecciones de tamaño para 150-200 pb fragmentos de ADN se llevaron a cabo seguida de una etapa de la mella y la amplificación con polimerasa Platinum (Invitrogen) y Pfu-polimerasa (Fermentas). Para la selección de las bibliotecas híbrido se ajustaron a 500 ng en 3,4 l de volumen y se añaden a las soluciones SureSelect Block. Las hibridaciones se llevaron a cabo durante 24 horas a 65 ° C, los híbridos se extrajeron con 500 ng M-280 Dynabeads de estreptavidina (Invitrogen) y finalmente se eluyó con tampón de elución 50 l. Después de la amplificación con polimerasa Platinum las bibliotecas se cuantificaron por qPCR y concentración de ADN se ajustaron para conseguir una fracción de 10 a 20% de perlas de plantilla monoclonal en la emulsión PCR utilizando en total 0,7 a 1 mil millones de cuentas. el enriquecimiento del grano sucesiva y deposición de 130 millones de cuentas por diapositiva trimestre (quad) fue seguido por 50 carreras bp fragmento estándar. Cada una de las cuatro muestras de pacientes se analizó en un único quad
La cartografía se realizó con el gasoducto alineación Bioscope usando la semilla & amp.; extender algoritmo con una puntuación de penalización -2.0 desajuste. Las variantes de nucleótido único (SNV) se llama con el algoritmo DiBayes integrado en el paquete Bioscope.
variante de nucleótido único (SNV) detección
materiales de tejido fueron genotipados en la matriz de Affymetrix 6,0, de acuerdo con la protocolo del fabricante. las posiciones de matriz con una puntuación de calidad (valor p) & lt; 0,1 se utilizaron para la comparación con los datos de secuenciación. Se utilizaron los datos de secuenciación posiciones si su cobertura superó 3 veces. Esto generó 46.000 y 49.000 puestos de tumor y el tejido benigno, respectivamente, que fueron elegibles para la comparación. Para determinar las tasas de positivos falsos y negativos falsos, hemos creado la matriz de datos de serie y distinguido entre el llamado SNP de referencia y la dependencia llamada en la matriz de datos
.
Para la detección de variantes somáticas, una estrategia bimodal se aplicó con el tumor variantes denominadas bajo criterios estrictos, mientras que las variantes en tejido de control se llaman por medio de criterios menos estrictos: un umbral mínimo de lecturas fue fijado con las variantes de 15% de todas las lecturas en una posición dada en el tumor. Se utilizaron criterios menos estrictos para llamar variantes de tejidos de control con un mínimo de una variante de leer y un corte de cobertura mínima de 5. Para las coberturas por encima de 30 veces una variante de lectura fue aceptada.
capilar secuenciación
confirmación de Seguimiento de SNVS identificados se realizó en un ABI 3730 (Applied Biosystems) instrumento de secuenciación capilar siguiendo los procedimientos estándar.
Determinación de las variaciones del número de copia
la preparación de bibliotecas de lectura individuales y secuenciación se realizado usando la plataforma de secuenciación Solexa (GenomeAnalyzer IIx, Illumina) siguiendo las instrucciones del fabricante. Análisis de Imágenes y llamadas de base se realizaron con Firecrest 1.9.5_14 y 1.9.5_14 Avutarda y lee estaban alineados con el genoma humano (NCBI36) usando Bowtie 0.9.7.1 [34]. análisis del número de copia se realizó en R utilizando el paquete DNAcopy [35]. En resumen, el ADN leer frecuencias se determinaron para contenedores de 50 Kb. La relación de frecuencias log2 de contenedores correspondientes se calculó para el tumor en comparación con el tejido normal. La mediana de los ratios se centró a cero experimento sabia. Log proporciones fueron suavizadas por DNAcopy utilizando los valores por defecto y la copia número variación fue detectado por DNAcopy utilizando un umbral de dos desviaciones estándar.
El genotipado de la matriz de Affymetrix 6.0 se realizó de acuerdo con el protocolo del fabricante. Las regiones de número de copias ganancia y pérdida se determinaron mediante emparejado y análisis usando el modelo oculto de Markov (HMM) del software Partek Genómica Suite (Partek Inc., St. Louis, MO) con ajustes de parámetros por defecto. Para el análisis emparejado, los valores de número de copias se generaron mediante la comparación de los perfiles de tejido benigno tumor y de la misma paciente.
Bioinformática flujo de trabajo
Para cada tejido, las variaciones fueron anotados utilizando los modelos de genes generadas por Ensembl ( Ensembl 54.36, www.ensembl.org). Todas las variaciones fueron asignadas a todos los modelos de transcripción, lo que llevó a varias anotaciones para varios loci. Por ejemplo, una variante puede dar lugar a un cambio de aminoácido en una transcripción y aparecen en la UTR de otro.