Extracto
El glioblastoma (GBM) es un tumor cerebral agresivo, maligna típicamente resulta en la muerte del paciente plazo de un año tras el diagnóstico; y los que sobreviven más allá de este punto generalmente se presentan con la recurrencia del tumor dentro de los dos años (supervivencia a los 5 años es del 5%). La heterogeneidad genética de GBM ha realizado la caracterización molecular de estos tumores un área de gran interés y ha dado lugar a la identificación de subtipos moleculares en GBM. La disponibilidad de plataformas de secuenciación que son a la vez rápido y económico puede favorecer la adopción de la secuenciación del tumor en el entorno clínico, que puede conducir a la identificación de dianas genéticas clínicamente factibles. En este estudio piloto, compuesto por las muestras de tripletes de la sangre normal, tumor primario, y muestras de tumores recurrentes de tres pacientes; se comparó la capacidad de Illumina secuenciación del exoma (ExomeSeq) y el Grupo Oncológico Integral AmpliSeq Ion (CCP) para identificar variantes somáticas en muestras de tumores primarios y recurrentes de pacientes emparejados. Se encontraron trece genes para albergar variantes, la mayoría de los cuales eran exclusivos de los datos ExomeSeq. Sorprendentemente, sólo dos variantes fueron identificados por ambas plataformas y que se encuentran dentro de la
PTCH1 Opiniones y
NF1
genes. Aunque de carácter preliminar, este trabajo pone de manifiesto importantes diferencias en la identificación variante en los datos generados a partir de las dos plataformas. Se necesitan estudios adicionales con tamaños de muestras más grandes para explorar aún más las diferencias entre estas tecnologías y para mejorar nuestra comprensión de la utilidad clínica de las plataformas basadas en paneles en el perfil genómico de tumores cerebrales
Visto:. Virk SM, Gibson RM, Quinones-ME Mateu, Barnholtz-Sloan JS (2015) identificación de las variantes en las primarias y recurrentes glioblastoma utilizando un panel de genes específicos de cáncer y Whole Exoma secuenciación. PLoS ONE 10 (5): e0124178. doi: 10.1371 /journal.pone.0124178
Editor Académico: Javier S. Castresana, Universidad de Navarra, ESPAÑA
Recibido: 7 Febrero, 2015; Aceptado: 19 Febrero 2015; Publicado: May 7, 2015
Derechos de Autor © 2015 Virk et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Disponibilidad de datos: Illumina toda exoma datos de secuenciación está disponible a partir del Genoma del cáncer Atlas: https://tcga-data.nci.nih.gov/tcga. ID de TCGA utilizados en este análisis fueron: TCGA-0957 (UH1), TCGA-1389 (UH2), TCGA-4065 (UH3). Para garantizar el cumplimiento de las directrices para la protección de los datos derivados de los sujetos humanos, los datos de iones AmpliSeq está disponible de los autores a petición y desde el tumor cerebral líder del equipo de Enfermedades Neuro-oncología Ohio Dr. Andrew Sloan:
[email protected] .
Financiación:. Este trabajo fue apoyado por los Institutos nacionales de Salud (www.nih.gov) 5R25CA094186 SMV, Institutos nacionales de Salud, y HHSN261201000057C NIH /NCI 2P30 CA043703-23 ACC
Conflicto de intereses: los autores han declarado que no existen intereses en competencia
Introducción
el glioblastoma (GBM) es el tumor cerebral primario más frecuente en adultos [1].. Aunque se considera un cáncer poco común, con una tasa de incidencia de 2 a 3 casos por cada 100.000 personas en los Estados Unidos, este tumor contribuye de manera desproporcionada a la morbilidad y la mortalidad por cáncer [1, 2]. La terapia estándar actual para pacientes con GBM es la resección quirúrgica del tumor primario seguida de radioterapia y quimioterapia adyuvante (es decir, "Stupp" protocolo) [3]; Sin embargo, a pesar de tratamiento agresivo, GBM se repite en muchos pacientes dentro de los dos años [4]. Debido a esta alta probabilidad de recurrencia, es imperativo que se obtiene un mejor entendimiento de los cambios genéticos y moleculares que se producen después de la resección del tumor primario y el tratamiento. Esta información podría ser vital para el desarrollo de nuevos tratamientos con el potencial de aumentar la supervivencia de los pacientes con GBM
.
Las diferencias genéticas entre los tumores primarios y recurrentes aún no se han caracterizado completamente, lo que ha limitado el desarrollo de eficaces dirigidos terapias para combatir el GBM recurrente [5]. Las mutaciones en genes específicos han demostrado ser frecuente en los casos de GBM [6, 7]. Debido a la heterogeneidad individual conocido inter e intra en GBM [8, 9], se ha hecho un esfuerzo considerable no sólo para identificar los genes mutados individualmente, sino para desarrollar esquemas de clasificación para caracterizar los tumores mediante el subtipo molecular [10, 11]. El objetivo final es utilizar la clasificación de tumores como herramienta de diagnóstico molecular o un indicador pronóstico de supervivencia global, en última instancia conduce al descubrimiento de nuevas estrategias de tratamiento.
Deep (próxima generación) secuenciación está revolucionando nuestra comprensión de los cambios que ocurren somáticas en el genoma del cáncer. Los estudios que comparan varios tipos de tumores están arrojando luz sobre la relación entre ambas mutaciones genéticas y el tipo de cáncer, así como las vías de disregulados que son comunes en los cánceres o específica al subconjunto de tipos de cáncer [12-14]. Aunque la iluminación (iluminación, San Diego, CA) plataforma de secuenciación profunda es el actual líder en la investigación clínica del cáncer [15], otras tecnologías como Ion Torrent (Life Technologies, Carlsbad, CA) [16] son adecuados para los métodos de detección más amplios basados en la reducción del tiempo de secuenciación y el costo por muestra [17]. En este estudio se evaluó la capacidad del comité de Ion AmpliSeq Integral del Cáncer (Life Technologies, Carlsbad, CA) para identificar variantes en muestras por triplicado (sangre emparejado, primario y tumores recurrentes) de tres pacientes con GBM y se compararon los resultados con los datos secuenciación de todo el exoma obtenido utilizando la plataforma Illumina del proyecto Atlas del Genoma del cáncer (TCGA) [18].
Materiales y Métodos
los pacientes del estudio y procesamiento de la muestra
GBM pacientes fueron reclutados prospectivamente parte del curso de tumores cerebrales Ohio estudio (OBTS), un estudio prospectivo de pacientes con tumores cerebrales benignos y malignos primarios de los cuatro principales centros académicos en el estado de Ohio. consentimiento por escrito se recibió de todos los pacientes durante su inscripción en OBTS, que ocurrió antes de la toma de la muestra. Todos los sujetos humanos protocolos y procedimientos fueron aprobados por la Junta de Revisión Institucional de la Universidad de Hospitales del Centro Médico Case, Cleveland, Ohio. muestras de sangre pre-tratamiento, junto con los tejidos tumorales congeladas instantáneamente primarios y recurrentes (muestras triplete) se obtuvieron de tres pacientes adultos. La figura 1 proporciona una visión general de los procedimientos utilizados en este estudio. Los tejidos se congelaron dentro de 15 a 30 minutos después de la resección. Las muestras y la información clínica se recogieron y se archivan de acuerdo con las directrices establecidas por el cáncer Atlas del Genoma [18] y la pureza del tumor fue visitada por el examen histológico por la junta neuropathologist certificado. Dos secciones fueron tomadas de cada muestra de paciente (3 muestras /paciente X 2) y una colección de muestras de tripletes de los tres pacientes se secuenciaron en cada una de las dos plataformas de secuenciación.
secuenciación para las muestras AmpliSeq CCP fue hecho utilizando el chip Ion 318 y la secuenciación del exoma se preformados utilizando el Genoma Analyzer II o HiSeq de 2000, ambos de Illumina.
se extrajo sangre en tubos de ADN PAXgene y se extrajo el ADN utilizando el kit de ADN de sangre PAXgene (Qiagen , Valencia, CA). El ADN total fue aislado de las muestras de tumor de cerebro de SNAP-congelado utilizando el DNA kit de purificación Maxwell 16 (Promega, Madison, WI). ADN se cuantificó usando Nanodrop ND-100 (Thermo Scientific, Waltham, MA) y Qubit 2.0 fluorómetro (Life Technologies, Carlsbad, CA). Las muestras de ADN triplete emparejado al paciente desde tres pacientes fueron secuenciados utilizando (i) la secuenciación del exoma en el Illumina GA-IIX o HiSeq de 2000 [ExomeSeq] (figura 1) como parte del Proyecto del Genoma del Cáncer Atlas como se detalla en [18] y ( ii) el Grupo Especial Ion AmpliSeq Integral del cáncer (Ion AmpliSeq PCC, Life Technologies). Para ello, cuatro piscinas amplicón por muestra abarca 409 genes implicados en el cáncer se cuantificaron (2100 Bioanalyzer ADN 7500, Agilent Technologies), preparados y enriquecidos para la secuenciación del ion Esfera Partículas (ISP) utilizando el Ion OneTouch 200 Plantilla Kit v2 (Life Technologies ) en el OneTouch 2 Sistema Ion ™ (Life Technologies). ISPs con plantilla se cuantificaron (Qubit 2,0, Life Technologies) y se cargan en un ion 318 Chip (Life Technologies) para ser secuenciados en el Ion PGM usando el Ion PGM Secuenciación 200 v2 Kit (Life Technologies). La eficiencia media de carga en la Ion Torrent PGM fue del 88% en los nueve Ion 318 fichas con una media de 5.900.000 lecturas por muestra. Las muestras individuales promedio de más de 5,8 millones de secuencia asignada lee, con una longitud media de lectura de 109 pares de bases. La cobertura media de destino en el Ion Torrent PGM fue 315x y 377x de muestras de sangre y tumorales, respectivamente. En el caso de la secuenciación de todo el exoma TCGA Illumina, la meta de cobertura promedio fue de 121x y 138x de muestras de sangre y tumorales, respectivamente. el procesamiento y la base de la señal de llamada de datos de secuencia generados a partir del Ion Torrent PGM se realizó con Torrent Analysis Suite versión 3.4.2. Alta calidad lee (una puntuación de calidad & gt; 20) a partir de los archivos generados a partir de la FASTQ Ion Torrent PGM Servidor fueron recortados del adaptador, código de barras, y la alineación de secuencias de los cebadores antes de la asamblea del genoma humano 19 de secuencia (Hg19)
Tratamiento de datos e identificación de variantes
Antes de la variante análisis, archivos FASTQ generados a partir de las dos plataformas se sometieron a varios pasos de preprocesamiento. archivos FASTQ fueron alineados con el Consorcio de referencia Genoma Humano construir 37 (Hg19) utilizando el algoritmo de Burroughs-Wheeler de alineación tal como se aplica en el paquete de software v.0.7.2 BWA, lo que resulta en la producción de archivos BAM de la alineados lecturas. Después de la alineación del genoma, se utilizó el kit de herramientas de análisis del genoma v.3.2.2 para realinear lee alrededor de inserción /supresiones y volver a calibrar las puntuaciones de calidad de base de datos para ambos AmpliSeq ExomeSeq y. El ExomeSeq lee se sometieron a duplicar el marcado y la extracción antes de las etapas de recalibración de realineación y la base. BAM archivos se clasifican en orden y coordinar los archivos de índice de BAM se generaron utilizando Picard v.1.119. llamada variante se realizó en Alineados lecturas emparejadas por las muestras de pacientes, es decir, la sangre (normal) frente a tejido tumoral primario o recurrente, utilizando MuTect v.1.1.4 [19] junto con dbSNP 138. Las variantes fueron anotados con v.111214 ANNOVAR (http : //www.openbioinformatics.org/annovar/) y se leen las alineaciones se visualizaron utilizando IGV v2.3.2 (http://www.broadinstitute.org/igv/). el análisis de variantes se restringió a las variantes que ocurren en las regiones exoma.
Resultados
Datos demográficos del paciente y el tratamiento
Entre los tres pacientes incluidos este estudio, la edad media fue de 45 años y la la supervivencia global media fue de 441 días (Tabla 1). Todos menos un paciente era un hombre y todos eran blancos (un paciente también se auto-identifica como hispano). Cada paciente recibió el mismo tratamiento, que consistía en la resección total seguida de temozolomida adyuvante y radiación de haz externo. Además, todos los pacientes fueron sometidos a una segunda cirugía momento de la recidiva. La pureza de las muestras de tumor primario fue mayor que en las muestras de tumores recurrentes, que van desde 80 hasta 90% a 65-75%, respectivamente (Tabla 1).
variantes identificadas por tanto ExomeSeq y AmpliSeq CCP
Dado que las tecnologías de secuenciación toda exoma tienen la capacidad de cubrir todos los genes que codifican dentro del genoma, mientras que cualquier enfoque basado en el panel estará limitada a un subconjunto del genoma de codificación, para hacer la comparación más apropiada entre las dos tecnologías se restringió el análisis para los 409 genes incluidos en el panel AmpliSeq. Además, dado que estábamos más interesados en las variantes dentro de las regiones de codificación, que también se centró en el análisis de variantes dentro de sólo exones. Las variantes fueron identificados en 13 (3%) de los 409 genes analizados en este estudio. La mayoría de las variantes se encontraron en los datos ExomeSeq y sólo dos variantes del gen fueron compartidas entre las dos plataformas (Fig 2).
Los genes que contienen variantes y se muestran las plataformas de secuenciación asociados. La mayoría de las variantes se asociaron con los datos ExomeSeq y hubo un total de 409 genes en el AmpliSeq CCP.
Las variantes encontradas por ambas plataformas se encontraban en los genes
PTCH1 gratis (parcheado 1) y
NF1 gratis (neurofibromina 1). El análisis detallado de la
PTCH1
variante reveló una cobertura similar de la base mutada (Figura 3A), en tanto los datos AmpliSeq y ExomeSeq en 26 y 24 lee, respectivamente; y el panel AmpliSeq tenía un porcentaje más bajo (23% frente al 38%) de lecturas que contiene la base alternativa. La otra variante común se encuentra en el
NF1
gen (Figura 3B) y en este caso las dos plataformas grandes diferencias de opinión en cuanto a la cobertura de lectura de la base mutada. En los datos ExomeSeq, había 38 lee que cubre la base variante y 18 (47%) contenían la variante; mientras que 360 lee en los datos AmpliSeq cubierta de la base y 20% (71 lecturas) contenida la variante.
NF1
era también una de las cuatro variantes identificadas en una muestra de tumor recurrente
(A) Ver muestra palmos CHR9:. 98,209,620-98,209,640 de
PTCH1
; la base es la variante G a una mutación localizada en la base de 98.209.634 tumor primario de UH1 paciente. (B) Ver muestra palmos Chr17: 29,585,500-29,585,530 de
NF1
; variante es G a una mutación localizada en la base de 29.585.518 tumor recurrente de UH3 paciente. La base de la variante se encuentra entre las dos líneas verticales que cruzan las lecturas.
variantes identificadas por ExomeSeq pero no por AmpliSeq CCP
Hubo un total de 10 variantes en ocho genes supuestamente incluido en el AmpliSeq CCP que sólo fueron identificados por el método ExomeSeq. Dos de estos genes eran
PTEN gratis (fosfatasa y homólogo de tensina) y
TP53 gratis (tumor de la proteína p53), ambos de los cuales fueron encontrados en los tumores primarios y recurrentes de UH3 paciente. Ambos de estos genes están frecuentemente mutado en GBM y muchos otros tipos de cáncer. En el tumor primario, el exón que contiene la base mutado en
PTEN
fue ampliamente cubierto por la ExomeSeq lee y la base mutada estaba cubierto en un 26 lee, el 65% de los cuales contenía la variante; sin embargo, el mismo exón estaba cubierto sólo parcialmente por lee de la ninguno AmpliSeq CCP (Fig 4A) de los cuales cubre la base mutada. Del mismo modo, una mutación en el
TP53
gen estaba cubierta por 98 ExomeSeq lee, el 53% contenía la base variante, mientras que no AmpliSeq CCP lee cubierto esta región del exón (Figura 4B). Análisis de la cobertura de lectura de
PTEN
y
TP53
en el tumor recurrente de UH3 paciente encontró un aumento en el número de lecturas que cubre la base variante en comparación con el tumor primario para ambos genes en 68 y 121, respectivamente. En cuanto a la proporción de las lecturas que cubre la base de que también se mutado, hubo una reducción de
PTEN
al 40% y
TP53
, la proporción era prácticamente la misma que en el tumor primario en un 54%. Además, los datos AmpliSeq para el tumor recurrente producen una única lectura que cubre la base mutado en
TP53
, esto lea también contenía la variante.
Los datos AmpliSeq, no causaron lee que cubre el base de variante en la
PTEN
; Sin embargo, una sola no lee muestra en el gráfico hicieron cubrir la base variante en la
TP53
en el tumor recurrente. se muestran los datos de los tumores primarios. (A) Ver muestra palmos chr10: 89,653,700-89,653,900 de
PTEN
; variante es T a G mutación se encuentra en la base de 89.653.783. (B) Vista de
TP53
muestra la región de Chr17: 7,578,400-7,578,600; variante es G a una mutación localizada en la base 7.578.475. La ubicación de la base de la variante se indica mediante la línea vertical que cruza las lecturas.
El
PIK3CG
gen (fosfatidilinositol-4,5-bifosfato-3-quinasa, catalítica de la subunidad gamma) fue el único gen que se encuentra mutado en más de un paciente, específicamente este gen contenía dos variantes diferentes y uno de cada uno estaba presente en los tumores primarios de ambos UH1 y UH3 individuos (Tabla 2). Curiosamente, dos variantes se identificaron en el
gen LLP
(dominio LIM contiene socio translocación preferido en lipoma), tanto en el tumor primario de UH2 paciente (Tabla 2). Estas dos variantes se encuentran en bases adyacentes. El examen de todos los genes AmpliSeq CCP que contenían variantes sólo en datos ExomeSeq revelado el gen
LLP
tener la mayor cobertura con 1388 y 1403 lee que cubre la primera y segunda variante, respectivamente. En ambos casos, el 80% de las lecturas fueron mutados.
variantes identificadas exclusivamente por AmpliSeq CCP
A diferencia de las variantes únicas de los datos ExomeSeq, tres variantes en tres genes diferentes fueron identificados por el AmpliSeq CCP, pero no por la secuenciación de todo exoma (Fig 2 y Tabla 2). Las tres variantes se detectaron en los tumores primarios de dos pacientes (UH1 & amp; UH2), específicamente en el
DPYD
(dihidropirimidina deshidrogenasa),
MCL1
(v-myc mielocitomatosis viral homólogo de oncogén 1, carcinoma de pulmón de deriva) genes [aviar], y
TNK2
(tirosina quinasa, no receptor, 2). Ninguna de las tres variantes únicas de AmpliSeq PCC fueron designados como "cubierta" por el software MuTect, lo que indica el poder menos de 80% para detectar estas variantes alélicas en 0.3 fracción.
Discusión
secuenciación profunda metodologías han revolucionado muchos campos biológicas y biomédicas con cáncer, en particular de diagnóstico y estrategias de tratamiento, siendo uno de los más afectados [20, 21]. Gran esfuerzo se ha colocado en la secuenciación de genomas enteros o exomas enteros para identificar mutaciones asociadas al cáncer críticos que podrían Drive personalizadas y específicas terapias [22]. Por desgracia, aunque el acceso a las tecnologías de secuenciación de profundidad ha aumentado considerablemente durante los últimos años, la continua relativamente alto coste de la secuenciación y la complejidad del análisis ha impulsado el desarrollo de instrumentos y metodologías más asequibles, junto con la simplificación del número de genes de analizar. El Ion AmpliSeq PCC fue desarrollado para secuenciar todo el exón cobertura de 409 genes implicados en el cáncer, es decir, más del 50% del Wellcome Trust Sanger Institute gen del cáncer de censo (http://cancer.sanger.ac.uk/cosmic/census ). En este estudio piloto se utilizó el AmpliSeq PCC a la sangre secuencia ajustada, primaria y tumores recurrentes de tres pacientes con GBM y se compararon los resultados con los datos de secuenciación del exoma obtenidos utilizando la plataforma Illumina del Proyecto del Genoma del Cáncer Atlas (TCGA).
en general, se encontraron unos pocos genes que contienen variantes en este estudio (13 genes) y entre los que, sólo dos variantes fueron identificadas conjuntamente por los dos enfoques de secuenciación (ExomeSeq y AmpliSeq CCP). Una variante en el
PTCH1
gen fue identificado en el tumor primario de UH1 paciente. Este supresores de tumores funciones de los genes en la vía de señalización de Hedgehog y tiene sido mostrar a mutarse en el meduloblastoma infantil [23]. La segunda variante estaba dentro del gen
NF1
(también un supresor de tumor), que codifica la proteína neurofibromina 1 y es un gen mutado con frecuencia en GBM [18]. Estas dos variantes fueron los dos únicos cubiertos por el software MuTect, lo que hace efectivamente
PTCH1
y
NF1
las variantes más fiable identificados en los datos AmpliSeq CCP.
Se ha producido también poco solapamiento de las variantes entre paciente individual y los tipos de tumores. El único gen identificado como variante en más de un paciente fue
PIK3CG
, que fue mutado en tumores primarios de pacientes UH1 & amp; UH3. Este gen contenía diferentes variantes en los dos tumores y sólo estaba presente en los datos ExomeSeq. Los genes
PTEN
y
TP53
contenía las únicas variantes genéticas identificadas en tanto los tumores primarios y recurrentes de la misma paciente, UH3. A pesar de que ambos genes están entre los que frecuentemente mutado en GBM, estas variantes también eran exclusivos de los datos ExomeSeq. Además la inspección de las alineaciones en las bases variantes reveló solamente una cobertura parcial de la variante que contiene los exones por la AmpliSeq lee, que es un contribuyente probable a la variante no ser detectado por este panel.
Se anticipó que habría haber diferencias en las variantes identificadas a partir de los datos ExomeSeq y AmpliSeq CCP. En un esfuerzo para limitar estas diferencias, nos limita el análisis para incluir sólo los genes que estaban en la lista de genes de la AmpliSeq CCP. Los diferentes enfoques tecnológicos de la secuenciación del exoma un todo frente a la secuenciación de un subconjunto enfocada de los genes relacionados con el cáncer, probablemente podrían dar lugar a la búsqueda de un menor número de genes mutados utilizando el enfoque más centrado, como se observa en este estudio. Otro punto a tener en cuenta es que la heterogeneidad intratumoral es una característica de muchos tipos de cáncer, incluyendo GBM. El análisis del presente informe se realizó mediante dos cortes diferentes de cada tumor del paciente y nuestras discrepancias observadas en la identificación de la variante podría deberse a la heterogeneidad intratumoral inherente a GBM.
Este análisis demuestra que los genes
PTCH1 Opiniones y
NF1
se puede detectar de forma fiable en muestras de pacientes y que la falta de cobertura amplia exón puede afectar la detección de la variante en esas regiones. Los genes incluidos en el AmpliSeq CCP fueron seleccionados para ser representativos de una amplia selección de tipos de cáncer y los paneles de genes más específicos para el cerebro y los tumores cerebrales pueden mejorar la detección de la variante en GBM. Aunque algunos estudios han evaluado los tableros derivados de la secuenciación de profundidad de uso de genotipificación rápida cáncer [23, 24], nuestro estudio piloto demuestra el potencial para el Ion AmpliSeq CCP para contribuir a la detección de mutaciones en la investigación básica y clínica del cáncer. Otros estudios, con un mayor número de muestras nos ayudarán a entender las diferencias observadas entre las dos metodologías y añadimos a nuestra actual comprensión de las mutaciones que conducen a la progresión y recurrencia en GBM.
Reconocimientos
La autores desean reconocer los pacientes que participaron en el proyecto Atlas del Genoma del cáncer (TCGA) y Andrew E. Sloan, MD, por su apoyo del banco biológico del tumor cerebral hospitales universitarios. Los resultados publicados aquí son en su totalidad o en parte basándose en el proyecto Atlas del Genoma del Cáncer establecido por el Instituto Nacional del Cáncer y el NHGRI. Más información sobre TCGA se puede encontrar aquí: http://cancergenome.nih.gov/
.