Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Identificación y Caracterización de cáncer Las mutaciones en japonés adenocarcinoma de pulmón sin secuenciación de contraparte de tejidos normales

PLOS ONE: Identificación y Caracterización de cáncer Las mutaciones en japonés adenocarcinoma de pulmón sin secuenciación de contraparte de tejidos normales


Extracto

Se analizaron los datos secuenciación del exoma de 97 pacientes con adenocarcinoma de pulmón y japoneses identificaron varios genes y vías supuestos relacionados con el cáncer. En particular, se observó que los patrones de mutación relacionados con el cáncer fueron significativamente diferentes entre los diferentes grupos étnicos. Como se informó anteriormente, las mutaciones en el gen EGFR fueron característicos de Japón, mientras que los del gen KRAS eran más frecuente en la raza blanca. Además, durante el curso de este análisis, se encontró que las mutaciones somáticas específicos de cáncer pueden ser detectados sin la secuenciación de homólogos de tejido normal. El 64% de las variantes de la línea germinal se podía excluir el uso de un total de 217 conjuntos de datos externos exoma japoneses. También se muestra que un enfoque similar puede ser utilizado para otros tres grupos étnicos, aunque el poder de discriminación depende del grupo étnico. Se demuestra que el gen ATM y el gen PAPPA2 podrían ser identificados como genes relacionados con el pronóstico del cáncer. Sin pasar por la secuencia de contraparte de tejidos normales, este enfoque proporciona un medio útil para no sólo reducir el tiempo y coste de la secuenciación, sino también el análisis de muestras de archivo, para lo cual contraparte de tejidos normales no están disponibles.

Visto: Suzuki A, S Mimaki, Yamane Y, Kawase A, K Matsushima, Suzuki M, et al. (2013) Identificación y Caracterización de cáncer Las mutaciones en japonés adenocarcinoma de pulmón sin Secuenciación de las contrapartes tejido normal. PLoS ONE 8 (9): e73484. doi: 10.1371 /journal.pone.0073484

Editor: H. Sunny Sun, Instituto de Medicina Molecular, Taiwán

Recibido: Marzo 22, 2013; Aceptado: July 19, 2013; Publicado: 12 de septiembre 2013

Derechos de Autor © 2013 Suzuki et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este trabajo fue apoyada por la JSPS KAKENHI subvención número 24300345. Este trabajo también fue apoyado por el MEXT KAKENHI la subvención número 221S0002. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

el advenimiento de la tecnología de secuenciación de nueva generación ha facilitado en gran medida la detección y caracterización de las variaciones genéticas en el genoma humano. Lo más notable de este tipo de estudios ha impulsado el Proyecto 1000 Genomas [1,2], que tiene como objetivo proporcionar un mapa completo de las variantes genéticas humanas a través de diversos orígenes étnicos. Sin embargo, debido a la secuenciación de todo el genoma sigue siendo costosa, la secuenciación del exón regiones enteras utilizando métodos de captura de hibridación (secuenciación del exoma) [3-5] es ampliamente utilizado para la detección de los genes que están relacionados con las enfermedades hereditarias. Al secuenciar exomas de individuos sanos y enfermos y la comparación de ellos, genes que son responsables de muchas enfermedades se han identificado [6], incluyendo el síndrome de Miller [7,8] y la hipertensión hipercaliémica familiar [9]. Junto con el progreso que se ha hecho en la secuenciación del exoma, el volumen de datos de la línea germinal polimorfismo de un solo nucleótido (SNP) que se ha registrado en dbSNP se está expandiendo rápidamente por varias poblaciones [10].

secuenciación Exoma proporciona un potente herramienta para estudios de cáncer también. De hecho, un número de trabajos se han publicado que describe la identificación y caracterización de variantes de nucleótido único (SNVS) que se producen somáticamente en los cánceres y se sospecha que es responsable de la carcinogénesis y desarrollo de la enfermedad [11]. El Cancer Genome Consortium Internacional (ICGC) ha estado recogiendo datos exoma para SNVS somáticas que están presentes en más de 50 tipos de cánceres como parte de un esfuerzo de colaboración internacional [12-14]. El Atlas del Genoma del Cáncer (TCGA) ha desarrollado un gran conjunto de datos genómica, incluyendo exomas para el carcinoma de ovario de alto grado, que se ha utilizado para detectar los genes mutados de manera significativa, incluyendo TP53, BRCA1 y BRCA2 [15]. También han identificado diversas aberraciones genómicas y vías desregulados que pueden actuar como dianas terapéuticas.

En estudios exoma cáncer más en curso, contraparte de tejidos normales se han secuenciado en paralelo con tejido de cáncer de [15-19]. Esto se supone que es necesaria porque germinal variantes deben ser excluidos de la totalidad de los SNVS para detectar los SNVS somáticas que son exclusivos de los cánceres. Sin embargo, la secuenciación de homólogos de tejido normal aumenta el costo y el tiempo del análisis. Además, en algunos casos, es difícil de obtener homólogos de tejido normal. Además, no está claro qué precisión SNVS de la línea germinal se pueden excluir el uso de exomas tejido normal. Para excluir de forma conservadora SNVS línea germinal, sus profundidades secuencia y precisiones pueden necesitar ser mayores que las que se obtienen de los exomas cáncer.

En este estudio, hemos generado y analizado 97 exomas cáncer de los pacientes con adenocarcinoma de pulmón japoneses. También demuestran que SNVS somáticas se pueden enriquecer a un nivel que es suficiente para análisis estadísticos adicionales, incluso en ausencia de la secuencia de contraparte de tejidos normales. Para separar la línea germinal de los SNVS somáticas, lo primero que comparó los patrones de variación entre un exoma cáncer con exomas tejidos normales los otros 96 pacientes. También se intentó llevar a cabo una comparación mutua similar que utiliza únicamente exomas cáncer, sin la consideración de exomas de contraparte de tejidos normales. Es cierto que si se omite completamente la secuenciación de tejido normal, que haría tentativamente desconocimiento de las mutaciones somáticas que se produce exactamente en la misma posición genómica en múltiples tipos de cáncer. Sin embargo, trabajos recientes han dilucidado que tales SNVS compartidos son muy raros [15,20-22]. Por otra parte, muchas de estas mutaciones de forma recursiva se han registrado en las bases de datos de mutaciones somáticas del cáncer tales como Sanger CÓSMICO [23,24], y esas SNVS recurrentes pueden ser recuperados por los estudios de seguimiento utilizando parcialmente los datos de los tejidos normales. Para entender la naturaleza única de cada cáncer, un análisis estadístico de los distintos SNVS se presume que es esencial, además del análisis de los SNVS comunes.

En este estudio, hemos demostrado que es posible identificar el primeros candidatos para genes y vías relacionadas con el cáncer, incluso sin la secuenciación de un homólogo de tejido normal. Se demuestra que este enfoque es útil no sólo para reducir el coste de la secuenciación sino también para mejorar la fidelidad de los datos. Debe ser también útil para el análisis de muestras de archivo de edad, para lo cual contraparte de tejidos normales no siempre están disponibles. A continuación, describimos un método práctico y rentable para acelerar la secuenciación del exoma cáncer.

Resultados y Discusión

Caracterización de SNVS utilizando el conjunto de datos 97 del exoma

En primer lugar, se generaron y analizaron las secuencias de todo el exoma de 97 pacientes con adenocarcinoma de pulmón japoneses. exoma datos se obtuvieron de cáncer y normales de los tejidos homólogos, separadas por microdisección de captura por láser. Se purificó el ADN exonic (exomas) y generó 76-base-extremo emparejado lee utilizando la plataforma Illumina GAIIx. Aproximadamente 30 millones de secuencias asignadas fueron obtenidos de cada muestra, proporcionando 74 × cobertura de las regiones de destino; El 93% de las regiones de destino tenía 5 × cobertura (Figura S1 en el archivo S1). Burrows-Wheeler alineador (BWA) [25] y el kit de herramientas de Análisis Genómico (GATK) [26,27] se utilizaron para identificar SNVS (Figura S1 S2 en archivos). Sólo SNVS que se detectaron en tejidos cancerosos y no mostró evidencia de variación en los tejidos normales fueron seleccionados para su posterior análisis.

El conjunto de datos obtenido se utilizó para caracterizar los patrones de mutación específica del cáncer (Tabla S3 S1 en el archivo). Se calculó el enriquecimiento de los SNVS dentro de determinados genes, proteínas, dominios funcionales, categorías y vías. Se realizaron búsquedas de los genes con SNVS somáticas enriquecido significativamente en adenocarcinoma de pulmón japonés. Como se muestra en la Tabla S4 en Archivo S1, varios genes mutados fueron identificados como significativamente. En particular, se realizaron búsquedas de dominios que están enriquecidos con SNVS y el puerto mutaciones relacionadas con el cáncer conocidos en la base de datos cósmicos. En total, se identificaron 11 genes (P & lt; 0,02, Tabla 1). Por ejemplo, la homología de Dbl (DH) de dominio de gen PREX1 [28] se enriqueció con SNVS (
P
= 0,00071). Sin embargo, en el gen Prex-2 [29], el (PH) de dominio de homología Pleckstrin se enriqueció con SNVS (
P
= 0,011) (Figura 1A y B). Tanto el PREX1 y los genes Prex-2 activar el intercambio de GDP a GTP para la familia Rho GTPasas y los dominios DH /PH son indispensables para el intercambio de nucleótidos de GTPasas y su regulación [30-32]. Además, se analizaron los patrones de expresión de estos genes utilizando una base de datos de expresión génica del cáncer, GeneLogic (Figura S3 en Archivo S1). Los niveles de expresión de PREX1 y Prex-2 no fueron mejorados en el adenocarcinoma de pulmón, pero se han mejorado en gran variedad de tipos de cáncer, que se indica en parte en estudios anteriores [33]. Los SNVS en los PREX1 y Prex-2 genes, que se concentraron en sus dominios de señalización fundamentales, podrían aumentar las actividades en estos genes, e imita lo tanto funcionalmente la expresión de este gen aumentado en algunos tipos de cánceres. Los candidatos de genes relacionados con el cáncer identificados a partir de este conjunto de datos se enumeran en la Tabla 1.
Número de SNVs

Gene
Domain
Domain
Gene
P-value
*
EGFR
†IPR001245:Serine-threonine/tyrosine-protein kinase34374.4e-21KRAS
† IPR001806: Ras-GTPase678.0e 6TNNIPR003961: fibronectina, tipo III455.2e-5TP53
† IPR008967: p53 como factor de transcripción, DNA-binding20239.5e-5PREX1IPR000219: Dbl homología (DH ) domain450.00071DNAH7IPR004273: Dynein chain570.0025FSTL5IPR011044 pesada: amina deshidrogenasa quinoproteína, beta-cadena like770.0043NRXN3IPR008985: glucanase570.0063PREX2IPR001849 Concanavalina A-como lectina /: Pleckstrin homology370.011FER1L6IPR008973: dominio C2 de calcio /lípidos vinculante, CaLB360.013COL22AIPR008985: Concanavalina Un similar a lectina /glucanase360.015Table 1. Lista de los posibles genes relacionados con el cáncer identificados

*
P
. & lt; 0,02
† reportados en el gen del cáncer de censo [11]. Tenga en cuenta que los genes encima de la lista se informó anteriormente para ser asociada a este tipo de cáncer, mientras que la mayoría de ellos son nuevos posibles genes relacionados con el cáncer. Descargar CSV CSV
SNVS en el PREX1 (A) y Prex-2 (B) los genes están representados en los cuadros. Los dominios de la proteína en el que los enriquecimientos de las SNVS fueron estadísticamente significativas están representadas en cajas de color naranja (también ver Materiales y Métodos). DH-dominio: Dbl homología (DH) de dominio; PH: dominio de homología Pleckstrin; D: dominio DEP; P:. PDZ /DHR /GLGF

Del mismo modo, el enriquecimiento vía analiza el uso de la base de datos KEGG [34] también se detectaron varias vías supuestos relacionados con el cáncer. Las vías identificadas se enumeran en la Tabla 2. Curiosamente, se detectó la vía de cáncer de endometrio [35] en este análisis de enriquecimiento (
P
= 3.1e-15, Figura 2A). Esta vía incluye vías principales relacionados con el cáncer, por ejemplo, la vía de señalización MAPK y la vía PI3K /AKT. Por esta vía, se compararon los patrones de mutación entre nuestros datos japoneses y los del estudio previo de adenocarcinoma de pulmón en los caucásicos [21]. Se encontró que los SNVS en el gen EGFR eran cuatro veces más frecuente en la población japonesa que entre las poblaciones caucásicas (Figura 2B, panel izquierdo). mutaciones de EGFR se producen con frecuencia en no fumadora, pacientes de sexo femenino y asiática de adenocarcinoma de pulmón [36], que es una diana molecular del fármaco contra el cáncer,
gefitinib
[20,37,38]. mutaciones relacionadas con el cáncer Por el contrario, las mutaciones KRAS, que también son bien conocidos [39], fueron más de cuatro veces frecuente entre los caucásicos (Figura 2B, panel central). Sin embargo, no todos los patrones de mutaciones son diferentes entre poblaciones. Por ejemplo, TP53 albergaba mutaciones en ambos conjuntos de datos con una frecuencia similar (Figura 2B, panel derecho).
KEGG ID
Camino definición
Número de cánceres con SNVS
valor de p
*
hsa05213Endometrial cancer723.1e-15hsa04320Dorso-ventral eje formation484.4e-15hsa05219Bladder cancer624.9e-14hsa05223Non microcítico de pulmón de células cancer667.1e-12hsa05214Glioma706.5e-11hsa05218Melanoma701.3e-9hsa05212Pancreatic cancer686.9e-9hsa05215Prostate cancer714.3e-7hsa05216Thyroid cancer361.1e -6hsa04520Adherens junction593.7e-6hsa05210Colorectal cancer531.8e-5hsa04012ErbB señalización pathway642.6e-5hsa05120Epithelial señalización en
Helicobacter pylori
infection534.8e-5hsa04540Gap junction600.00024hsa04912GnRH señalización celular pathway610.0011hsa05217Basal celular carcinoma410.0020hsa05222Small de pulmón de células cancer520.0069hsa05220Chronic esclerosis lateral mieloide leukemia460.010hsa05160Hepatitis C670.012hsa05014Amyotrophic (ELA) y la digestión 360.014hsa04977Vitamin absorption200.015hsa05416Viral myocarditis400.028hsa04512ECM-receptor de interaction470.034hsa02010ABC transporters290.035hsa04510Focal adhesion780.037hsa05412Arrhythmogenic miocardiopatía del ventrículo derecho (MAVD) 400.039Table 2. Lista de los cáncer- posible identificado vías relacionadas

*
P Hotel & lt;. 0,05 CSV Descargar patrones de mutación CSV
(A) en la vía de cáncer de endometrio que se ha detectado en el análisis de enriquecimiento se muestran. El tamaño del círculo representa la población de los cánceres que albergan los SNVS en el gen correspondiente (porcentaje también se muestra en el margen). SNVS en este estudio y el conjunto de datos externa en poblaciones caucásicas se muestran en círculos rojos y azules, respectivamente. n.a .: frecuencias de mutación no estaban disponibles. (B) Comparación de la relación de la mutación de EGFR, KRAS y TP53 genes entre ambos conjuntos de datos. Los valores de p se calcularon mediante la prueba de dos muestras para la igualdad de proporciones.

La ambigüedad en la identificación de SNV contraparte de tejidos normales
línea germinal
En el análisis anterior, discriminamos variantes usando el contraparte de tejidos normales. También se encontró un número de SNVS inicialmente identificados como somática a estar presentes en los tejidos normales, por lo tanto, eran llamadas falsos positivos bajo las validaciones por inspección visual de las secuencias asignadas y la secuenciación de Sanger. Para examinar la causa de este problema, se inspeccionaron los errores en seleccionados al azar 26 tipos de cáncer y sus tejidos normales. En promedio, en cada tipo de cáncer, el veinticinco por ciento de los candidatos SNV somáticos resultaron ser falsos positivos (Figura 3). En estos casos, la secuencia de la cobertura y calidad de la contraparte normal no fueron suficientes. De hecho, las secuencias de apoyo cada SNV y estas cualidades se divergieron significativamente entre el cáncer y tejidos normales. Aunque hemos aumentado el número total de lecturas en los tejidos normales, era difícil en la práctica para cubrir todas las posiciones genómica (Figura S4 en Archivo S1). Un resumen de las validaciones del SNV de la línea germinal se muestra en la Tabla S1 S5 en Archivo.

candidatos somática SNV fueron identificados mediante el uso de 26 exomas de cáncer y cada contraparte normal. SNVS somáticas correctos y falsos positivos se muestran en las barras de color rosa y azul, respectivamente. Los 26 tipos de cáncer utilizados para el análisis fueron ordenados por el número total creciente de SNVS (eje x).

Sin embargo, nos dimos cuenta de que algunos se identificaron correctamente como SNVS línea germinal en exomas de referencia externos. Veinticinco exomas nos permitió excluir ocho llamadas falsos positivos en cada cáncer. Esto planteó la posibilidad de que los SNVS de los otros pacientes pueden ser utilizados como sustitutos para aumentar la profundidad y la calidad de la secuenciación.

Excluyendo SNVS línea germinal, considerando las superposiciones mutuas de exomas de otras personas

a fin de probar esta posibilidad, se examinó si los análisis exoma cáncer serían posibles sin la secuenciación de la contraparte tejido normal de cada cáncer. En primer lugar, se evaluó el grado en que los SNVS línea germinal podrían ser discriminados usando exomas externos. Para este fin, hemos utilizado los 97 pares de cáncer de lo normal exoma conjuntos de datos para la validación de datos. Se encontró que se podría detectar el 54% de los SNVS línea germinal mediante el uso de los 96 exomas tejido normal de la referencia externa (Figura 4A). Hemos ampliado aún más el conjunto de datos filtración utilizando los datos de 73 exoma japoneses disponibles externamente y 48 conjuntos de datos internos exoma japoneses. En total, hemos sido capaces de eliminar el 64% de los SNVS línea germinal, con un total de 217 conjuntos de datos exoma japoneses de otras personas, sin secuenciar contraparte normal de cada tipo de cáncer (Figura 4A). La extrapolación de la gráfica también indicó que se necesitarían 1.350 y 2.000 muestras para eliminar 90% y el 95% de los SNVS línea germinal, respectivamente. Esperamos que tal tamaño de muestra estará disponible en un futuro próximo teniendo en cuenta la rápida expansión actual del análisis de exoma.

(A) El poder de la detección de la línea germinal SNVS teniendo en cuenta la superposición mutua entre otros individuos japoneses. La sensibilidad representa la proporción de la línea germinal SNVS detectado correctamente. Los conjuntos de datos utilizados para excluir los SNVS de la línea germinal se muestran en el eje x. El recuadro representa la extrapolación de la gráfica. También se muestra el ajuste de curvas de la gráfica. (B) capacidad discriminatoria de tres grupos étnicos diferentes para los SNVS línea germinal en 97 cánceres japoneses. Sensibilidades para detectar SNVS línea germinal se muestran mediante los siguientes colores; verde: China; púrpura: Yoruba; naranja:. caucásica

Además, evaluó si el mismo filtración podría hacerse utilizando exclusivamente exomas cáncer. Se obtuvieron esencialmente los mismos resultados (Figura S5 en Archivo S1). salvedad obvia de este enfoque es que esta no tendría en cuenta sobre 3% de SNVS somáticas que ocurren de forma recurrente (Figura S5 en File S1, azul). Sin embargo, como se mencionó anteriormente, se encontró que aquellos SNVS recurrentes eran muy raros [15,19] y la mayoría de ellos se derivaron de SNVS somáticas dudosos, que fueron pasados ​​por alto en los tejidos normales. También tenemos en cuenta que la mayoría de esas SNVS recurrentes, en su caso, se puede analizar por separado mediante la secuenciación de un número limitado de tejidos normales.

El filtrado de la línea germinal SNVS considerando solapamientos mutuos para los diferentes grupos étnicos y de SNPs raras

Hemos examinado si SNVS de otros orígenes étnicos podrían ser utilizados como bases de datos externas para la filtración. Se obtuvieron datos exoma de individuos de diversos orígenes étnicos desde el Proyecto Genoma 1000. Utilizamos estos conjuntos de datos exoma para excluir los SNVS línea germinal que fueron identificados en los cánceres japoneses. Se encontró que el poder discriminativo fue significativamente menor en comparación con exomas de poblaciones japonesas. Por lo tanto, estos conjuntos de datos no eran adecuados para este fin (Figura 4B). También se examinaron y se encontró que los exomas en cada grupo étnico eran útiles para discriminar los SNVS línea germinal en el grupo correspondiente (Figura S6, S7 y en la Tabla S6 en S1 Archivo).

y, a continuación, examinamos en qué medida variantes de la línea germinal de menor importancia pueden ser cubiertas con este enfoque en la población japonesa. Se evaluó la sensibilidad del proceso de filtración para las SNVS en los 97 tipos de cáncer (Figura S8 en S1 File). Se encontró que el 88% de los SNVS línea germinal que se producen en más de un cinco por ciento de los 97 exomas podría ser detectado utilizando los 73 conjuntos de datos externos japoneses. Para los SNVS que ocurren en el 1% de los 97 tipos de cáncer, el 19% podría ser excluido.

Uso del conjunto de datos en bruto para caracterizar SNVS y vías relacionadas con el cáncer

En su conjunto, con 217 exomas japoneses utilizados para filtración, el 36% de los SNVS línea germinal se mantuvo sin filtrar. Sin embargo, consideramos que puede ser todavía posible utilizar el conjunto de datos SNV crudo como una primera aproximación para identificar y analizar los genes relacionados con el cáncer y los candidatos de la vía. Para validar esta idea, se compararon los resultados de los análisis de enriquecimiento de entre el conjunto de datos en bruto y los refinados somáticas conjuntos de datos del SNV, que se genera a partir de los exomas cáncer normales emparejados.

La mayoría de los genes y las vías supuestos relacionados con el cáncer que se identificaron a partir del conjunto de datos refinados también estuvieron presentes en el conjunto de datos en bruto (Tablas S7 y S8 en S1 archivo). El ejemplo del gen TNN, que fue reportado como un marcador de tumor de estroma [40-42], se muestra en la Figura S9 en S1 Archivo. En este caso, incluso con los SNVS de la línea germinal, que eran sin filtrar en el conjunto de datos en bruto (indicado por el negro en la Figura S9 en S1 File), el enriquecimiento de SNVS somáticas en este campo fue estadísticamente significativa. En total, también se detectaron nueve genes que se identificaron como poseedores de SNVS relacionados con el cáncer del conjunto de datos refinada en el conjunto de datos en bruto. Por otra parte, dos genes del conjunto de datos refinados no están representadas en el conjunto de datos en bruto. En el análisis de la vía, se identificaron 26 vías relacionadas con el cáncer que se identificaron a partir del conjunto de datos refinado. Además, 19 vías también están representadas en el conjunto de datos en bruto, así como el conjunto de datos refinado. El solapamiento entre los conjuntos de datos se resume en la Tabla 3. Cabe señalar que los análisis estadísticamente enriquecimiento eran posibles incluso en la cobertura actual del conjunto de datos de filtro. Con el conjunto de datos externa ampliada, sería más práctico para someter a los candidatos a los resultados de las validaciones de secuenciación de Sanger, así como la eliminación de la línea germinal SNVS restantes.
Número de identificar genes/pathways


Crude
*
Refined

Overlap

Genes16119Pathways232619Table 3. Comparación de los resultados en el enriquecimiento de los análisis entre el crudo y refinado conjunto de datos.

* identificaron utilizando el conjunto de datos en bruto.
† identificaron utilizando el conjunto de datos refinado.
‡ significativas tanto en crudo y refinado conjuntos de datos. Descargar CSV CSV
Identificación de los genes relacionados con el pronóstico utilizando el conjunto de datos en bruto

Como uno de los objetivos más importantes de los estudios de cáncer de exoma, se investigó si las mutaciones que afectan el pronóstico de cáncer pueden ser identificados mediante el uso conjunto de datos en bruto ( Tabla S9 y S10 figura en S1 File). En el análisis de Kaplan-Meier, siete pacientes que llevaban SNVS en el gen ATM (Figura 5A) mostraron peor pronóstico estadísticamente significativas (
P
= 9.6e-6, Figura 5B). Tres SNVS en el gen ATM fueron significativamente enriquecido en el la fosfatidilinositol 3- /4-quinasa dominio catalítico (
P = 0,014
). ATM detecta el daño del ADN y fosforila TP53, que, a su vez, llama a diversas respuestas celulares, tales como la reparación del ADN, la detención del crecimiento y la apoptosis, y evita en conjunto la progresión del cáncer (Figura S11 en File S1) [43,44].

SNVS (A) en el gen ATM. Los SNVS que fueron identificados en el cribado inicial y los que quedan después de la validación de secuenciación de Sanger de la contraparte en el tejido normal se muestran en negro y rojo, respectivamente. TAN: mantenimiento de los telómeros de longitud y el ADN a reparar el daño; PI3_PI4 quinasa: fosfatidilinositol 3- /4-quinasa, catalítica. (B) Análisis de supervivencia de los pacientes con y sin SNVS ATM. Los conjuntos de datos antes y después de la validación de secuenciación de Sanger están representados por líneas negras y rojas, respectivamente. La significación estadística se calculó utilizando una prueba de log-rank (
P Hotel & lt; 0,05). Tenga en cuenta que las diferencias de supervivencia para las personas con SNVS en el conjunto de datos validados de la no-Sanger fueron significativas antes de la validación de Sanger. (C, D) Los resultados de un análisis similar a la descrita en A y B para el gen PAPPA2. En este caso, los pacientes con los SNVS mostraron un mejor pronóstico. ConA como substitución: Concanavalina A-como lectina /glucanasa, subgrupo; N: Notch dimain; Peptidasa M43:. Peptidasa M43, asociada al embarazo de plasma-A

También se examinó si otros genes mutados con frecuencia se asocian con un pronóstico mejor o peor. Se encontró que los pacientes con mutaciones PAPPA2 mostraron tiempos de supervivencia prolongados (
P = 0,026
, Figura 5C y D). PAPPA2 proteolyzes IGFBP5 [45,46], que es un factor inhibidor para IGFs [47]. Las mutaciones en el gen PAPPA2 pueden resultar en la acumulación de IGFBP5, y la disminución resultante en la señalización de IGF pueden afectar la proliferación de células del cáncer [48]. Una vez más, hay que señalar que tanto para los genes ATM y PAPPA2, la significación estadística de la diferencia de pronóstico persistió tanto antes (línea de color negro) y después (línea roja) las mutaciones de la línea germinal restantes se eliminaron, que fue validado por secuenciación de Sanger (Figura 5B, D y Tabla S1 S10 en archivos).

Conclusiones

Hemos identificado y caracterizado los SNVS en el adenocarcinoma de pulmón en una población japonesa. Otras evaluaciones biológicas de los SNVS descubiertos se describen en otra parte. En particular, la información del transcriptoma y epigenoma debe ser importante para profundizar el análisis de los genomas del cáncer, como lo harían arrojar nuevas luces sobre la biología del cáncer (Tabla S1) [49]. En este estudio, también presentamos un enfoque útil para el análisis de exomas cáncer, sin la necesidad de secuenciar el homólogo tejido normal. Creemos que el enfoque no sólo reduce las barreras de costo, el tiempo y la fidelidad de datos en el análisis del exoma, sino que también permite el análisis de muestras de archivo exoma, para lo cual contraparte de tejidos normales no siempre están disponibles.

Materiales y Métodos

Ética declaración

Todas las muestras se recogieron siguiendo el protocolo (y el consentimiento informado por escrito) que fueron aprobados por el Comité de Ética en el Centro Nacional del Cáncer, Japón (Correspondencia a: Katsuya Tsuchihara; [email protected]).

la selección de casos y la preparación de ADN

Todos los materiales de tejido se obtuvieron a partir de pacientes con adenocarcinoma de pulmón japoneses con la el consentimiento informado apropiado. Se seleccionaron muestras de adenocarcinoma de pulmón primario resecado quirúrgicamente con dimensiones longitudinales de más de 3 cm. Los datos sobre los 52 pacientes que tuvieron recaídas y otra información clínica sobre los 97 casos se muestran en la Tabla S1 S11 en Archivo. Todos los tejidos normales y 97 con cáncer fueron extraídos de muestras fijadas con metanol por captura láser microdisección. la purificación del ADN se realizó usando una estación de trabajo EZ1 Advanced XL robótica con kits de ADN de tejidos EZ1 (Qiagen).

Whole-exoma secuenciación

El uso de 1 mg de ADN aislado, hemos preparado las bibliotecas de secuenciación del exoma-usando Sistema SureSelect Target Enrichment (Agilent Technologies) de acuerdo con el protocolo del fabricante. El ADN fue secuenciado capturado por la plataforma Illumina Genoma Analizador IIx (iluminación), obteniéndose 76-base-extremo emparejado lee.

somática SNV detección

Los métodos que se utilizan para detectar la SNVS, incluyendo BWA, SAMtools [50] y GATK, se muestran en la Figura S1 S2 en archivo. Utilizando datos de NCBI dbSNP construir 132 y un genoma japonesa [51], fueron excluidos principales SNVS línea germinal. Además, la línea germinal SNVS raras se han descartado el uso de 97 exomas de contraparte de tejidos normales, 73 exomas japonesas proporcionan desde el Proyecto 1000 Genomas (los datos de fase 1 exoma, 20110521) y 48 internos exomas japoneses. También se validó una parte de los conjuntos de datos SNV por la secuenciación de Sanger de tejidos de cáncer y su contraparte de tejidos normales (Figura S12 en S1 Archivo).

Identificación de genes mutados altamente

Hemos detectado genes que fueron significativamente enriquecido con SNVS mediante el cálculo del número esperado de los cánceres con SNVS en el gen. La longitud de las regiones totales CDS estuvo representada en
N
(aproximadamente 30,8 M bases). se calculó como: Cuando un paciente total de
m
SNVS, la probabilidad de que el paciente alberga SNVS en el gen
t gratis (
n
longitud) albergaba
P
:

P

m

,

t

,

n

=

1



(

1



m

N

)

n

The suma de
P
en 97 tipos de cáncer fue representado en el número esperado de los cánceres con SNVS en el gen
t
. Los valores de p de la cantidad observada se calcularon mediante la función de probabilidad de Poisson usando R ppois.

enfoque estadístico para el enriquecimiento de los análisis

Para examinar el enriquecimiento de las mutaciones en los dominios de proteínas funcionales, estudiamos la SNVS a dominios usando InterProScan [52] y los asignados al Catálogo de mutaciones somáticas en el cáncer (cósmica). Se analizó el enriquecimiento de los SNVS en los mismos dominios como las mutaciones que fueron proporcionados por el cósmico. Los valores de p para las mutaciones observadas en estos dominios se calcularon utilizando su distribución hipergeométrica (R) phyper. En pocas palabras, los dominios en los que los SNVS se enriquecieron estadísticamente significativa que se selecciona el número esperado de SNVS en la longitud dada del dominio. Para estimar el número esperado, el número total de los SNVS pertenecientes al gen se dividió por la longitud de genes. Para este análisis, se utilizó genes que albergan cinco o más SNVS en la región de codificación y tres o más SNVS en el dominio.

Hemos asignado a SNVS vías según lo descrito por la Enciclopedia de Kyoto de genes y genomas (KEGG) y calculado los enriquecimientos de las SNVS en las vías. La tasa de mutación M

representado la relación entre el número medio de genes mutados con el número total de genes (17.175) que fueron utilizados en nuestro estudio. El valor esperado para el número de cánceres con SNVS en vía de
t
fue designado
λ Opiniones y calculada a partir de la tasa de mutación
M
y el número de genes en la vía
n
como follows:

λ

t

,

n

=

{

1



(

1



M

)

n

}

×

97

The p-valor para el número observado de cánceres con SNVS en vía de
t
se calculó mediante la función de probabilidad de Poisson usando R ppois.

Estimación del poder discriminativo para la exclusión de la línea germinal SNVS considerando solapamientos mutuos

calcula el poder discriminativo para la exclusión de la línea germinal SNVS considerando los de otros exomas no cancerosas. SNVS línea germinal de 97 exomas-tumorales normales emparejados fueron utilizados como datos de referencia. Hasta 217 muestras (96 exomas tejido normal de otros y 121 exomas japoneses adicionales) fueron seleccionados al azar, y se detectaron sus sensibilidades y especificidades para detectar la SNVS de la línea germinal mediante la adopción de los promedios de cualquiera de todas las combinaciones o un subconjunto de aproximadamente 10.000 combinaciones . También estima que el poder discriminativo con los datos del Proyecto 1000 Genomas para cuatro grupos étnicos (73, 90 JPT CHS, 81 y 64 YRI CEU) usando ensayos similares. secuencias de todo el exoma (los datos de fase 1 del exoma, 20110521) se obtuvieron del sitio ftp en el Proyecto 1000 Genomas.

Las curvas de Kaplan-Meier

Se utilizó el método de Kaplan-Meier para probar la las relaciones de las mutaciones observadas en el tiempo de supervivencia, y los cálculos se realizaron con el paquete de software R. Los cambios en las tasas de supervivencia que fueron correlacionados con SNVS se examinaron mediante la prueba de log-rank (R survdiff).

Datos de acceso

conjuntos de datos completos primas serán compartidas con los investigadores que lo soliciten. La información de las mutaciones somáticas en las respectivas coordenadas genómica se ha proporcionado en la Tabla S2.

Información de Apoyo
archivo S1.
figuras S1 a S12 y las Tablas S3 a S11 se incluyen.
doi: 10.1371 /journal.pone.0073484.s001 gratis (PDF) sobre Table S1. Francia El comparación de nuestro conjunto de datos con el otro estudio diferente. Nosotros proporcionamos la comparación de nuestros datos con los genes identificados en el otro estudio diferente con los datos del transcriptoma y el epigenoma de los cánceres de pulmón
doi:. 10.1371 /journal.pone.0073484.s002 gratis (XLSX) sobre Table S2 . Francia El listado de mutaciones somáticas identificadas a partir del conjunto de datos refinado.

El conocimiento de la salud

Tener un tatuaje? Usted puede estar en riesgo de cáncer!

¿Actualmente tiene un tatuaje o pensando en conseguir uno? E

Terminal de cáncer de pulmón

terminales de cáncer de pulmón o cáncer de pulmón en fase te

Pérdida de apetito y el cáncer

¿Qué es la pérdida de apetito es cuando no quiere comer o no

Coger el cáncer de piel en sus signos tempranos con un dermatólogo de NYC

La mayoría de las personas son vanos cuando se trata de su p

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]