Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Identificación de Genes del cáncer de controladores druggable amplificados a través de TCGA Datasets

PLOS ONE: Identificación de Genes del cáncer de controladores druggable amplificados a través de TCGA Datasets


Extracto

El Atlas del Genoma del Cáncer (TCGA) proyectos han avanzado nuestra comprensión de las mutaciones del conductor, antecedentes genéticos, y las principales vías activadas en todos los tipos de cáncer . El análisis de los conjuntos de datos del TCGA se han centrado principalmente en las mutaciones somáticas y translocaciones, con menos énfasis en amplificaciones de genes. Aquí se describe una estrategia de cribado de la bioinformática para identificar los genes putativos conductor del cáncer amplificados a través del TCGA conjuntos de datos. Se realizó un análisis de GISTIC2 TCGA conjuntos de datos que abarcan 14 subtipos de cáncer y se identificaron 461 genes que se amplifican en dos o más conjuntos de datos. La lista se redujo a 73 genes asociados con el cáncer con potenciales propiedades "druggable". La mayoría de los genes se localizaron a 14 amplicones repartidas por todo el genoma. Para identificar los posibles genes controladores del cáncer, analizamos el número de copias de genes y la expresión de mRNA de datos de muestras de pacientes individuales y se identificaron 40 genes putativos conductor del cáncer vinculados a diversos procesos oncogénicos. actividad oncogénica fue validado por siRNA /shRNA desmontables y haciendo referencia a los conjuntos de datos de proyectos de Aquiles. Los genes amplificados representaban un número de familias de genes, incluidos los reguladores epigenéticos, los genes del ciclo asociada a células, la respuesta al daño del ADN /genes de reparación, reguladores metabólicos, y los genes vinculados a la Wnt, Notch, Hedgehog, JAK /STAT, NF-KB y MAPK vías de señalización. Entre los 40 genes putativos conductor se conocían los genes conductor, como
EGFR
,
ErbB2
y
PIK3CA
. De tipo salvaje
KRAS
se amplificó en varios tipos de cáncer, y
KRAS
líneas celulares de cáncer -amplified eran más sensibles a
KRAS
shRNA, lo que sugiere que
KRAS
amplificación fue un evento oncogénico independiente. Un número de adaptadores de quinasa MAP se co-amplificado con sus receptores de tirosina quinasas, tales como el adaptador de FGFR
FRS2
y el adaptador de la familia EGFR
GRB7
. La ubiquitina ligasa
DCUN1D1
y la histona metiltransferasa
NSD3
también fueron identificados como nuevos genes putativos conductor del cáncer. Se discuten las implicaciones para el paciente sastrería objetivos de medicamentos existentes contra el cáncer y se discute más oportunidades potenciales para nuevos esfuerzos de descubrimiento de fármacos

Visto:. Chen Y, J McGee, Chen X, TN Doman, Gong X, Y Zhang, et Alabama. (2014) Identificación de Genes druggable conductor cáncer amplificados a través de conjuntos de datos del TCGA. PLoS ONE 9 (5): e98293. doi: 10.1371 /journal.pone.0098293

Editor: Masaru Katoh, Centro Nacional del Cáncer, Japón

Recibido: 6 Marzo, 2014; Aceptado: 30 de abril de 2014; Publicado: 29 de mayo de 2014

Derechos de Autor © 2014 Chen et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este estudio fue financiado por Eli Lilly and Company. El donante prestado apoyo en forma de salarios para todos los autores, pero no tuvo ningún papel adicional en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito. Las funciones específicas de estos autores se articulan en la sección autores contribuciones

Conflicto de intereses:. Este estudio fue financiado en su totalidad por Eli Lilly and Company, el patrono de todos los autores. No hay patentes, productos en desarrollo o los productos comercializados para declarar. Esto no altera la adhesión de los autores a todas las políticas de PLoS ONE sobre los datos y compartir materiales, como se detalla en línea en la guía para los autores.

Introducción

Los recientes avances en la tecnología de secuenciación de ADN han permitido la secuenciación de los genomas del cáncer enteros y la identificación de los genes mutados comúnmente, amplificados, y eliminados a través de los tipos de cáncer. El (TCGA) Atlas del Genoma del Cáncer esfuerzo se creó para secuenciar y analizar varios miles de cánceres individuales, dando una instantánea de las bases genéticas de enfermedades específicas y los conductores del cáncer [1] - [6]. análisis integrado de los conjuntos de datos del TCGA identificado 127 genes asociados con el cáncer mutados que representan significativamente distintas vías biológicas y procesos celulares [6]. El número medio de mutaciones del conductor por muestra tumor fue de dos a seis, lo que sugiere que un pequeño número de genes mutados conductor podría inducir la carcinogénesis [6]. En los cánceres de mama, sólo tres genes (
GATA3
,
PIK3CA
, y
TP53
) se encuentra mutado en & gt; 10% de incidencia en todos los tumores de pacientes. Un análisis más detallado reveló mutaciones del conductor genético-vía específica en los subtipos de cáncer de mama, como
BRCA1 /2
alteraciones y
PIK3CA
alteraciones en los cánceres de mama-basales y como luminales, respectivamente [4]. En los cánceres colorrectales, veinticuatro genes fueron mutados comúnmente y la mayoría de los genes mapeados a la Wnt, TGF-b, PI3K, p53 y RAS vías de señalización [3]. En los cánceres de pulmón, once genes mutados fueron comúnmente, incluyendo
TP53
, genes de respuesta al estrés oxidativo y los genes de diferenciación escamosa [1]. Estos estudios han arrojado luz en los principales impulsores genéticos de los subtipos de cáncer y también han identificado las vías potencialmente druggable vinculados a estos subtipos. Los avances se acelerará el desarrollo de fármacos, ofreciendo nuevas estrategias de confección de pacientes para los inhibidores de la vía específica. Sin embargo, los estudios del TCGA se han centrado principalmente en las mutaciones y translocaciones raras, con menos atención puesta en amplificaciones de genes en el cáncer. Dado que la amplificación del gen es un importante mecanismo de la carcinogénesis, hemos tratado de minar las bases de datos del TCGA para identificar nuevas dianas y los controladores amplificados a través de los tipos de cáncer.

La amplificación génica en células de cáncer proporciona un medio para la sobreexpresión de los genes promotores del cáncer de controladores , como
EGFR
y
erbB2
en los cromosomas 7 y 17, respectivamente. La amplificación génica se produce somáticamente en una región restringida del genoma del cáncer a través de diversos mecanismos, tales como rotura de fusión-puentes ciclos [7]. Estas regiones amplificadas, conocidos como los amplificados, pueden abarcar decenas de kilobases a megabases y pueden incluir múltiples genes oncogénicos, así como genes de pasajeros en las regiones amplificadas [8]. La longitud de los amplicones puede variar considerablemente según el locus genómico y el cáncer tipo. Por ejemplo, la amplificación del gen único de
KIT
en el cromosoma 4 puede ocurrir en los tumores testiculares [9], sin embargo, los amplificados más grandes que contienen
KIT
,
PDGFRA
, y
ELIM./MUERTES
se amplifican en el glioblastoma [10]. Debido a que los amplicones a menudo contienen muchos genes, incluyendo genes de pasajeros no relacionadas con la oncogénesis, a menudo es difícil identificar el gen (s) conductor cáncer responsable de la amplificación. Estrategias para identificar los genes del cáncer de conducción un amplicón incluir el mapeo de la región mínima de la amplificación (MRA) a través de muchas muestras de tumores, la identificación de correlación positiva entre el número de copias y la expresión de ARNm de los genes, y la validación experimental con siRNA /shRNA desmontables en las células. Estos análisis tienen hasta la fecha genes amplificados identificados con un papel demostrado en la carcinogénesis [7]. Sin embargo, la mayoría de los análisis realizados hasta la fecha se han basado en los pequeños tamaños de las muestras, que dan lugar a grandes acuerdos de reconocimiento mutuo y los posibles genes positivos falsos. Los conjuntos de datos del TCGA ofrecen una colección única de muestras tumorales con muestras de gran tamaño para identificar los genes del cáncer de controladores amplificados en distintos tipos de cáncer.

Aquí se describe una estrategia de cribado de la bioinformática para identificar los genes del cáncer de controladores potencialmente druggable amplificados a través del TCGA conjuntos de datos. Se utilizó el análisis de GISTIC2 TCGA conjuntos de datos (portal CBio) y se identificaron 461 genes que fueron amplificadas estadísticamente en dos o más conjuntos de datos del TCGA que comprende 14 tipos de cáncer. Los genes con funciones putativas o verificadas por cáncer fueron identificados con los genes del cáncer de la base de datos CBio. Se asignó una puntuación de farmacobilidad para cada gen mediante la integración de datos de cuatro índices farmacobilidad externos. De los 461 genes, se identificaron 73 genes amplificados potencialmente druggable con una función conocida o supuesta en la carcinogénesis. A continuación, utiliza el análisis de correlación con el número de copias y datos sobre la expresión del ARNm de varios miles de muestras de pacientes TCGA para identificar potenciales genes controladores del cáncer en la lista. Esto dio como resultado la identificación de 40 genes conductor cáncer putativo vinculado a diversos procesos oncogénicos, incluidos los reguladores epigenéticos, los genes del ciclo asociada a la célula, la respuesta al daño de ADN /genes de reparación, reguladores del metabolismo, y los genes vinculados a la Wnt, Notch, Hedgehog, JAK /STAT, NF-KB y MAPK vías de señalización. La actividad del conductor cáncer putativo fue validado por el acceso a la actividad de la horquilla shRNA en líneas celulares de cáncer utilizando la base de datos del proyecto de Aquiles [11]. validación adicional se realizó en un subconjunto de los genes utilizando siRNA /shRNA caída en líneas celulares de cáncer que contienen la amplificación del gen de interés. Entre los 40 genes putativos conductor fueron conocidos genes de controladores, como
EGFR
y
ErbB2
, así como nuevas dianas, como
DCUN1D1
y
NSD3
.
KRAS
, un conductor de cáncer prominente con mutación activadora conocida en el cáncer [12], se encontró que se amplifica en un subconjunto de cánceres de ovario, gástrico, de pulmón, y de útero. Se discuten las implicaciones para los esfuerzos de descubrimiento de fármacos e identificamos nuevas estrategias de adaptación para los pacientes dianas terapéuticas existentes.

Materiales y Métodos

Bioinformática análisis

TCGA conjuntos de datos de 14 subtipos de cáncer eran analizadas para la amplificación del gen utilizando el algoritmo GISTIC2 en el portal CBio (http://www.cbioportal.org). Los 14 subtipos de cáncer incluyen BLCA - Vejiga carcinoma urotelial, BRCA - carcinoma invasivo de mama, CRC - Cáncer Colorrectal (EPOC y leer los estudios combinados), GBM - El glioblastoma multiforme, HNSC - La cabeza y el carcinoma de células escamosas del cuello, KIRC - renal de células claras del riñón carcinoma, LGG - cerebro de grado inferior glioma, LUAD - adenocarcinoma de pulmón, LUSC - carcinoma de pulmón de células escamosas, OV - cystadenocarcinoma seroso de ovario, PRAD - El adenocarcinoma de próstata, SKCM - piel melanoma cutáneo, STAD - adenocarcinoma de estómago, y UCEC - uterino Corpus endometrioideo carcinoma . Los genes que se amplifican en dos o más estudios TCGA se agruparon juntos para hacer una lista de 461 genes. Nivel 3 SNP6 y RNAseq versión 2 de datos fueron recuperados de página web TCGA, y el nivel 3 SNP6 datos se asignan además a nivel de genes usando CNTools R paquete. Pearson coeficientes de correlación para el número de copias del gen (SNP6) frente a la expresión de genes (RNASeq) se calcularon para los genes de interés utilizando la función cor () en R. El código de análisis de datos en R y Gawk pueden ser disponibles bajo petición. Cada gen se le asignó una puntuación farmacobilidad basado en los datos de las bases de datos externas Ensembl, InterPro-Blast, BioLT-DrugBank y lista de Qiagen farmacobilidad. Para cada base de datos, un gen se le dio una puntuación de 0-4 farmacobilidad, siendo 0 y 4 undruggable ser una diana terapéutica establecida. Un gen con una puntuación de "1" farmacobilidad en cualquiera de las cuatro bases de datos se considera "potencialmente druggable" e incluido en la lista de genes final. La lista de genes también se ha subido a la base de datos de genes cancerígenos (portal CBio) y los genes relacionado con la oncogénesis fueron incluidos en la lista final de genes.

Proyecto de Aquiles

La base de datos del proyecto de Aquiles consiste en el agotamiento de shRNA las puntuaciones de una biblioteca genómica agrupado a prueba a través de un panel de líneas celulares de cáncer [11]. Hemos desarrollado un método para marcar la dependencia de genes en cada línea celular mediante la ponderación de cada horquilla de acuerdo con el grado de coherencia con otras horquillas diseñadas contra el mismo gen, de una manera similar a la descrita por Shao et. al [13]. Razonó que si las líneas celulares de tumores variaban en su dependencia de un gen controlador en particular, entonces horquillas dirigidas de manera efectiva ese gen deben dar puntuaciones similares de agotamiento shRNA en las líneas dependientes. Se calcularon las correlaciones por pares de las puntuaciones de agotamiento a través del panel para todas las horquillas del grupo de construcciones shRNA diseñados para dirigirse a un gen particular. A continuación, cada shRNA fue ponderado por el número de otros shRNAs desde el conjunto de genes que están altamente correlacionados a ella (coeficiente de correlación de Spearman es mayor que 0,35, con un valor de p & lt; 0,01). Una puntuación compuesta a nivel de gen (puntuación shRNA) se obtuvo mediante la suma ponderada de las puntuaciones de agotamiento shRNA. Estos perfiles de dependencia de genes se utilizan para calcular las puntuaciones de coeficiente de riesgo para la asociación de la mutación del gen o el número de copias con la sensibilidad shRNA comparando el modelo de mutación del gen a un "modelo nulo" (sin ningún tipo de mutación genética).

Las células

Las células se obtuvieron de la American Type Culture Collection (ATCC) y se cultivaron en medio de Eagle modificado por Dulbecco (DMEM) suplementado con suero bovino fetal 10%. Amplifica y líneas de células no-amplificación fueron elegidos para cada cáncer amplificado gen de interés. Para cada gen de cáncer de amplificado, las líneas celulares utilizadas para los estudios de validación y su número de copias de genes correspondientes son los siguientes: (1)
NSD3
: H1581 (7 copias), H1703 (6 copias), SW48 (5 copias ), SW837 (no amplificados); (2)
DCUN1D1
: KYSE (6 ejemplares), T47D (4 copias), SW48 (no amplificados), HCT15 (no amplificados). Los valores de número de copias se obtuvieron a partir de datos publicados CCLE [14].

Gene desmontables

Para los genes de genes desmontables, que utiliza partículas de transducción lentiviral shRNA adquiridos de Sigma (Misión, SHCLNV).
DCUN1D1
construcciones shRNA fueron TRCN0000133666, TRCN0000134440, TRCN0000134715, TRCN0000136858, y TRCN0000137482. Para
NSD3
desmontables estudios, se utilizó on-Targetplus SmartPool siRNA dirigidos Nsd3 humana (Thermo Scientific). Las células se infectaron con partículas de ARNhc lentiviral en multiplicidad de infección (MOI) que oscila desde 5 hasta 10, en presencia de 10 ug /ml de polibreno. siRNA /shRNA experimentos se llevaron a cabo de acuerdo con los protocolos establecidos [15].

ensayos basados ​​en células

anti-DCUN1D1 (Sigma, HPA035911), anti-conejo anticuerpos utilizados para el análisis de transferencia de Western incluyen conejo WHSC1L1 (Proteintech, 11345-1-AP). Western blot se llevó a cabo de acuerdo con protocolos convencionales. ensayos de proliferación celular y la apoptosis se realizaron con el Cell Titer Glo y la caspasa ensayos Glo (Promega) de acuerdo con las instrucciones del fabricante. El análisis del ciclo celular se realizó con tinción con yoduro de propidio de líneas celulares de cáncer utilizando protocolos convencionales [15].

Resultados

Identificación de las amplificaciones de genes en los conjuntos de datos del TCGA

TCGA conjuntos de datos que comprende 14 tipos de cáncer se analizaron con el algoritmo GISTIC2 (portal CBio) para identificar las amplificaciones de genes en muestras de tumores de pacientes. Los genes se anotó para probabilidad estadística de amplificación, y los genes que muestran la amplificación en dos o más conjuntos de datos se identificaron (Figura 1). Un total de 461 genes fueron identificados como genes potencialmente amplificados (Tabla S1). En algunos casos, varios genes (por ejemplo,
CD274
y
NDUFC2
) se amplificaron en dos o más conjuntos de datos que se originaron de un único subtipo de cáncer (Figura 1, Tabla S1). La lista de genes se redujo aún más mediante la identificación del subgrupo de genes con funciones establecidas o putativos en la oncogénesis, así como los genes que eran potencialmente druggable. En primer lugar, la lista de genes fue una referencia cruzada con la base de datos del cáncer de Genes (portal CBio), que mostró que menos del 25% de los 461 genes estaban relacionados con la oncogénesis. A continuación, los genes se les asignó un puntaje farmacobilidad basado en los índices farmacobilidad de cuatro bases de datos externas (Ensembl, InterPro-Blast, BioLT-DrugBank y lista de Qiagen farmacobilidad). Para cada base de datos, un gen se le dio una puntuación de 0-4 farmacobilidad, siendo 0 y 4 undruggable ser una diana terapéutica establecida. Un gen con una puntuación de "1" farmacobilidad en cualquiera de las cuatro bases de datos se considera "potencialmente druggable" e incluido en la lista de genes final. A partir del análisis, se identificaron un total de 73 genes potencialmente cancerosas druggable amplificada a través de los conjuntos de datos del TCGA (Figura 1).

TCGA se identificaron conjuntos de datos fueron extraídos para la amplificación de genes (análisis GISTIC2, portal de CBio) y 461 amplificaciones génicas . La lista se redujo a 73 genes genes relacionados con el cáncer que eran potencialmente "druggable" basado en bases de datos externas farmacobilidad. De los 73 genes, se identificaron 40 genes conductor cáncer putativo basado en el número de copias en comparación con el análisis de la expresión de ARNm de los datos del TCGA.

Los genes amplificados 73 de cáncer se encuentran en todo el genoma y la mayoría de los genes agrupados en la enfermedad loci (Figura 2). De los 73 genes, 57 genes agrupados en 14 loci en todo el genoma y los restantes 18 genes fueron amplificaciones focales. Dentro de un clúster, los genes tienden a ser amplificado en los tipos de cáncer similares. Por ejemplo, un grupo cromosoma 20q que comprende cuatro genes (
PTK6
,
SRMS
,
RTEL1
, y
prpf6
) fueron todas amplificado en uterina /cánceres y adenocarcinomas de pulmón endometrial. Un grupo cromosoma 1q contenía 12 genes, como
SETDB1
,
BCL9
,
PIAS3
, y
MCL 1
, y 11 de los 12 genes eran amplificado en los cánceres de pulmón de células escamosas y el cáncer de vejiga (Figura 2). Un grupo bien estudiado en el cromosoma 4q que contiene
PDGFRA
,
KIT
, y
KDR
se amplificó en el glioma y melanoma [10]. Debido al rigor utilizado en el análisis Gistic2, que probablemente subestimamos los tipos de cáncer en las que se produjo una amplificación del gen. Por lo tanto, es probable que los 73 genes del cáncer que hemos identificado se amplificaron en los tipos de cáncer adicionales que no están representados aquí (Figura 2).

A partir de la lista inicial de 461 genes amplificados en uno o más conjuntos de datos del TCGA, 73 genes amplificados fueron identificado con propiedades potencialmente "druggable", así como los roles establecidos /putativos en la oncogénesis. Los genes /amplicones se organizan por localización cromosómica, con su localización genómica marcada como se muestra (Mb = Megabase). casillas de color indican los tipos de cáncer con las designaciones del TCGA, de la siguiente manera: BLCA - Vejiga carcinoma urotelial, BRCA - carcinoma invasivo de mama, CRC - Cáncer Colorrectal (EPOC y READ estudios combinados juntos), GBM - El glioblastoma multiforme, HNSC - Cabeza y cuello carcinoma de células escamosas , KIRC - renal del riñón carcinoma de células claras, LGG - cerebro de grado inferior glioma, LUAD - adenocarcinoma de pulmón, LUSC - carcinoma de células escamosas de pulmón, OV - ovárica cystadenocarcinoma serosa, PRAD - El adenocarcinoma de próstata, SKCM - piel melanoma cutáneo, STAD - estómago adenocarcinoma, UCEC - uterino Corpus endometrioideo Carcinoma

Entre los 73 genes del cáncer amplificados fueron una serie de objetivos farmacológicos establecidos, tales como
EGFR
,
erbB2
y
KIT gratis (Figura 2).
ErbB2
en el cromosoma 17 se amplificó en 5 tipos de cáncer y fue co-amplificado con el adaptador de la quinasa MAP
GRB7
y
PPP1R1B
.
EGFR
en el cromosoma 7 se amplificó como un único gen en 7 tipos de cáncer, la validación de la importancia de este objetivo de drogas en el cáncer [16]. La lista también incluye una serie de objetivos actualmente en desarrollo clínico en toda la industria, tales como
CDK6
,
PIK3CA
,
PIK3C2B
y
NOTCH2
.
CDK6
en el cromosoma 7q se amplificó como un único gen en el cáncer escamoso de pulmón y el glioblastoma, mientras que
PIK3CA
residía en un clúster cromosoma 3q con otros 6 genes y se amplificó en múltiples tipos de cáncer (Figura 2) [17]. Varios genes de cáncer amplificada previamente validados, como
FAK
/
PTK2
, no fueron identificados en el análisis, en parte debido a la alta rigurosidad que se aplicó al análisis de la bioinformática para reducir los falsos positivos hits [18].

identificación de los genes del cáncer amplificados con la actividad del conductor del cáncer putativo

Debido a que algunos de los genes identificados como genes del cáncer puede ser amplificada genes pasajeros en los amplicones, que además analiza el conjunto de genes para identificar los genes del cáncer de controlador putativos. Esto se hizo mediante el cálculo del coeficiente de correlación de Pearson entre el número de copias y el valor de la expresión de ARNm a partir de datos del TCGA tumorales del paciente. Los coeficientes de correlación se calcularon para cada uno de los 14 tipos de cáncer y las correlaciones promedio en todos los tipos de cáncer se calcularon (Figuras 3-4). El análisis reveló una amplia gama de número de copias de ARNm frente a las correlaciones de expresión para los genes. Se esperaba que los genes del cáncer de controladores putativos para mostrar alto número de copias en comparación con la expresión de ARNm de correlación. conductores cáncer validados como
ERRBB2
,
EGFR
, y
KRAS
demostró alto número de copias de ARNm frente correlación expresión en los tipos de cáncer correspondientes que regulan (
ErbB2
r = 0,9 en el cáncer de mama,
EGFR
r = 0,8 en el adenocarcinoma de pulmón,
KRAS
r = 0,9 en el cáncer de ovario) (Figura 3-4).

los coeficientes de correlación de Pearson se calcularon mediante el análisis del número de copias de genes y la expresión de ARNm a partir de muestras individuales derivadas del paciente en TCGA conjuntos de datos. Se muestran los coeficientes de correlación para cada subtipo de cáncer de TCGA y la correlación media en todos los tipos de cáncer (rojo denota alta correlación, azul denota una baja correlación). Las abreviaturas de los conjuntos de datos del TCGA se muestran en la Figura 1.

coeficientes de correlación de Pearson se calcularon mediante el análisis del número de copias de genes y la expresión de ARNm a partir de muestras individuales derivadas del paciente en TCGA conjuntos de datos. Se muestran los coeficientes de correlación para cada subtipo de cáncer de TCGA y la correlación media en todos los tipos de cáncer (rojo denota alta correlación, azul denota una baja correlación). Las abreviaturas de los conjuntos de datos del TCGA se muestran en la Figura 1.

El número de copias en comparación con el análisis de la expresión de genes reveló los controladores potenciales que fueron amplificadas en los grupos de genes. Por ejemplo, el clúster cromosoma 1q con 12 genes amplificados contenía 4 genes con el número de copias vs correlación expresión mayor de 0,5 (
SETDB1
,
ARNT
,
APH1A
, y
CHD1L
), lo que sugiere que estos pueden ser los genes de controlador en el amplicón (figura 3). Entre los 12 genes,
SETDB1
mostró la correlación más alto en general, de acuerdo con informes recientes de que
SETDB1
es un gen amplificado cáncer con actividad demostrada controlador [19], [20]. Los otros tres genes también pueden desempeñar funciones potencialmente importantes en la carcinogénesis -
APH1A
es una subunidad gamma secretasa compleja en la vía de Notch,
ARNT
es una subunidad del complejo HIF1, y
CHD1L
es una helicasa de ADN en la vía de respuesta al daño de ADN [21]. Cuatro genes en el amplicón muestran el número de copias en comparación con la expresión de correlación inferior a 0,3 (
PDE4DIP
,
s100a11
,
S100A9
, y
S100A8
) (Figura 3). El grupo 3 con el cromosoma 7 genes contenía 2 genes con número de copias de la correlación entre la expresión mayor de 0,5 (
DCUN1D1
y
PRKCI
) y 4 genes con expresión del número de copias frente a menos del 0,3 (
TERC
,
SKIL
,
GNB4
, y
Sox2
).
PRKCI
es una serina /treonina quinasa en la ruta de NF-KB y los datos de microarrays de tejidos anteriores validado este gen como un potencial gen controlador novela del cáncer [22].
DCUN1D1
es una ubiquitina ligasa E3 subunidad complejo con potencial actividad del conductor cáncer, que se validó aún más con shRNA desmontables (abajo). Mientras que
PIK3CA
muestra un coeficiente de correlación global 0.4, que muestra una alta correlación en el cáncer de mama (r = 0,9), cáncer de cabeza y cuello escamoso (r = 0,8), y uterino /cánceres endometriales (r = 0,7) ( La Figura 3).

El clúster cromosoma 11q contenía 5 genes, incluyendo
CCND1
, un regulador del ciclo celular bien establecida y el conductor oncogénico. Mientras que
CCND1
aparece el número de copias elevado en comparación con las correlaciones de expresión en el cáncer de hígado (r = 1,0), cáncer de vejiga (r = 0,8), cáncer escamoso de pulmón (r = 0,7), la cabeza y el cuello Caner (r = 0,7) y el cáncer de mama (r = 0,7), las correlaciones fueron más bajos en otros tipos de cáncer, lo que sugiere que
CCND1
amplificación es un conductor oncogénica específica de la enfermedad (Figura 3). Otros dos genes en el amplicón,
FADD
, y
PPFIA1
, muestran mayor correlación general entre los distintos tipos de cáncer, que implican a estos genes como potenciales conductores novela de cáncer para una mayor investigación.
FADD
, una molécula efectora apoptótica, fue identificado previamente como un nuevo gen conductor cáncer en un panel de cánceres de laringe 167 /faríngeas, lo que justifica una investigación más en su mecanismo de oncogénesis [23]. Es importante señalar que la correlación de la expresión de ARNm de número de copia no es esencial, en principio, para que un gen sea un gen controlador cáncer. Por lo tanto, los genes con expresión de ARNm de correlación baja versus el número de copias no son necesariamente genes pasajeros. Por ejemplo, el clúster cromosoma 1q contenía
MCL1
, un gen con una firma conductor del cáncer basado en el Proyecto de Aquiles (datos no presentados), pero con una expresión de ARNm de media con respecto al número de copias de correlación de 0,31.

Para identificar los genes del cáncer amplificados con mayor actividad global conductor del cáncer, que clasificó los genes con el fin de alto número de copias de ARNm frente a la correlación de expresión en todos los tipos de cáncer. Se identificaron 40 genes con r general mayor que 0,3 (Tabla 1). El r = 0.3 de corte se utiliza debido a que varios genes demostraron alta r en un pequeño número de tipos de cáncer. Por ejemplo,
FGFR3
representada r & gt; 0,7 en cuatro tipos de cáncer (cáncer de vejiga, glioblastoma, escamosas de pulmón y melanoma), pero r & lt; 0,5 en otros tipos de cáncer. Del mismo modo,
CDK6
demostró r & gt; 0,7 en sólo 4 tipos de cáncer (glioblastoma, cáncer de cabeza y cuello, adenocarcinoma de pulmón y cáncer epidermoide de pulmón), mientras que
IGF1R
tenía r & gt; 0,7 en una sola cáncer ( cáncer de mama) (Figura 3-4). Entre los 40 genes con la actividad del conductor cáncer más alto, los dos principales genes más altamente clasificados fueron
NSD3
/
WHSC1L1
y
SETDB1
, dos importantes histonas methyltransferases (Tabla 1) . Mientras que
SETDB1
fue establecido recientemente como conductor de buena fe amplificada cáncer en el melanoma y el cáncer de pulmón [19], [20], el papel de los
NSD3
/
WHSC1L1
tiene no ha caracterizado bien y así se validó aún más su papel oncogénico in vitro (abajo). Otros dos reguladores de la cromatina, el lector de la cromatina y Brd4 histona acetiltransferasa
YEATS4
, fueron también altamente calificados como genes putativos conductor del cáncer. Otras familias de genes que estaban representados en la lista incluyen genes de la vía Notch (
NOTCH2
,
APH1A
), genes reguladores metabólicos (
NDUFC2
,
PRKAB2
), genes de la vía Hedgehog (
DCUN1D1
), genes de la vía Wnt (
BCL9
), genes de la ruta de NF-KB (
ERC1
,
PRKCI
,
IKBKB
), genes de la vía JAK /STAT (
PIAS3
), MAPK efectores de señalización (
KRAS
,
FRS2
,
GRB7
), los receptores tirosina quinasas (
FGFR3
,
EGFR
,
erbB2
,
IGF1R
), respuesta al daño del ADN /genes de reparación (
RAD51AP1
,
RTEL1
,
ERCC5
,
RAD52
,
CHD1L
), genes p53-asociado (
MDM2
,
MDM4
,
GTPBP4
), y los genes reguladores del ciclo celular (
CCNE1
,
TPX2
,
CCND3
,
CDK6
) (Tabla 1).

los rangos de número de copias de los genes del cáncer amplificados se analizaron en los tumores de pacientes individuales TCGA para determinar el grado de amplificación de genes (Fig. S1, S2) . Algunos genes muestran la amplificación de alto nivel que corresponde a 10-20 copias del gen, mientras que otros genes muestran el nivel 3-8 amplificaciones bajo número de copias. La amplificación del cromosoma 1q, que contenía
PRKAB2
,
APH1A
,
ARNT
, y
SETDB1
, mostró la amplificación de bajo nivel (3-10 copias) , mientras que el cromosoma 12q amplicón, que contenía
MDM2
,
YEATS4
, y
FRS2
, mostró la amplificación de alto nivel (10-20 ejemplares) (Fig. S1, S2 ). Otros genes con amplificaciones de alto nivel incluyen
PRKAB2 gratis (6-10 copias en cáncer de ovario),
MDM4
(10-30 ejemplares en glioblastoma),
MDM2 gratis (10- 15 copias en el adenocarcinoma de pulmón),
PIK3CA gratis (5-20 copias en el cáncer escamoso de pulmón),
DCUN1D1
(5-15 copias en el cáncer escamoso de pulmón),
FADD
y
PPFIA1 gratis (cada uno con 5-10 copias en cáncer de cabeza y cuello),
NDUFC2 gratis (5-15 copias en el cáncer de ovario), y
Rap1b gratis (5- 15 copias en el adenocarcinoma de pulmón). MAP-quinasa genes asociados también mostraron amplificación de alto nivel, con los receptores tirosina quinasas
ErbB2
,
IGF1R
, y
EGFR in todos altamente amplificada, como se esperaba. Las proteínas adaptadoras MAP quinasa
FRS2 Opiniones y
GRB7
también fueron altamente amplificado (10-20 ejemplares en el adenocarcinoma de pulmón y cáncer de mama, respectivamente). reguladores del ciclo celular, tales como
CCNE1
(10-20 copias en cáncer de ovario), fueron también altamente amplificada, como se esperaba. Además de copiar rangos de números, la frecuencia de la amplificación de genes en los tumores de los pacientes se calculó utilizando la copia número 4 como punto de corte para la amplificación (Fig. S4). Un número significativo de genes fueron amplificados mayor del 30 por ciento de los pacientes de cáncer, incluyendo
DCUN1D1 gratis (43% de los cánceres de pulmón escamosas),
FADD
y
PPFIA1 gratis (~ 30% de los cánceres de cabeza y cuello), y
PRKCI gratis (36% de los cánceres de pulmón escamosas) (Fig. S4). Mientras que la amplificación genómica fue el cambio principal de estos genes, un número de genes también lleva a mutaciones somáticas, como
PIK3CA
,
KRAS
y
NOTCH2
. En estos casos, las amplificaciones y mutaciones fueron en gran parte mutuamente excluyentes (Fig. S4).
La actividad del conductor
vía MAPK genes amplificados

Los 73 genes del cáncer amplificados fueron analizados además por la validación shRNA para verificar el cáncer . Proyecto de Aquiles es un esfuerzo a gran escala para catalogar las vulnerabilidades genéticas en líneas celulares de cáncer mediante el uso de una biblioteca shRNA de todo el genoma para identificar los genes que afectan a la supervivencia del cáncer /proliferación celular [11]. Nos minó la base de datos de Aquiles para determinar cuál de los genes amplificados 73 cancerosas pueden desempeñar un papel en la supervivencia de las células cancerosas /proliferación. La biblioteca de Aquiles se compone de múltiples horquillas shRNA y se calculó una puntuación compuesta shRNA basado en los efectos de múltiples horquillas ARNhc lentiviral en líneas celulares de cáncer infectados. Los genes que muestran una baja puntuación shRNA en líneas de células infectadas se supone que son importantes para la supervivencia de las células cancerosas y pueden representar los conductores cáncer putativo. Las puntuaciones shRNA sólo son válidas cuando varias horquillas shRNA demuestran de forma consistente la inhibición de las células cancerosas ( "correlación grande" llamado). La base de datos de Aquiles se preguntó con los 73 genes y los genes con "gran correlación" actividad shRNA fueron identificados, y sus puntuaciones shRNA se calcularon a través de varios cientos de líneas celulares de cáncer (Fig. S3). Varios genes tenían puntuaciones negativas shRNA en la mayor parte de las líneas celulares de cáncer y presumiblemente eran críticos para la supervivencia de las células cancerosas /proliferación. Estos genes incluidos
KRAS
,
PRKAB2
,
GRB7
,
BRD4
,
prpf6
,
BCL9
,
PPFIA1
y
NOTCH2
. Otros genes mostraron puntuaciones shRNA negativos en un subconjunto de las líneas celulares de cáncer, como
CCND1
,
NDUFC2
,
YEATS4
,
GTPBP4
, y
CHD1L gratis (Fig. S3). En estos casos, se requiere una validación adicional con siRNA o shRNA para verificar la inhibición de la proliferación de células cancerosas o la supervivencia.

El cáncer de 73 genes amplificados incluyen una serie de receptores tirosina quinasas, GTPasas, adaptadores y genes de señalización en el MAP quinasa.

El conocimiento de la salud

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]