Extracto
Cabeza y cuello carcinoma de células escamosas (HNSCC) es una enfermedad heterogénea con frecuencia fatal. Más allá de la función de los virus del papiloma humano (HPV), no se ha establecido la caracterización molecular validado de la enfermedad. El uso de un análisis genómico integrado y metodología de validación confirmamos cuatro clases moleculares de HNSCC (basal, mesenquimales, atípico, y clásica) consistente con firmas establecidas para el carcinoma epidermoide de pulmón, incluyendo la desregulación de la ruta de estrés oxidativo KEAP1 /NFE2L2, la utilización diferencial de la marcadores de linaje SOX2 y TP63, y la preferencia por el PIK3CA oncogenes y EGFR. Para uso clínico potencial de las firmas son de cortesía a la clasificación por estado de la infección por VPH, así como el aumento de número de copias del gen CCND1 marcador de alto riesgo putativo. Una etiología molecular de los subtipos es sugerido por las ganancias y pérdidas cromosómicas estadísticamente significativas y diferencial de células de patrones de expresión de origen. También se presentan los sistemas modelo representativo de cada uno de los cuatro subtipos
Visto:. Walter V, X Yin, Wilkerson MD, CABANSKI CR, Zhao N, Du Y, et al. (2013) Molecular subtipos de cáncer de cabeza y cuello muestran patrones distintivos de cromosómica ganancia y la pérdida de genes cancerígenos Canonical. PLoS ONE 8 (2): e56823. doi: 10.1371 /journal.pone.0056823
Editor: Muy-Teck Teh, Barts & amp; La London School de Medicina y Odontología de la Universidad Queen Mary de Londres, Reino Unido
Recibido: 1 de octubre de 2012; Aceptado 15 de enero de 2013; Publicado: 22 Febrero 2013
Derechos de Autor © 2013 Walter et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Clínica /Premio traslacional del Centro de cáncer UNC Lineberger Integral; http://unclineberger.org/research/research/research/developmental-research-awards K12-RR-023248; http://www.nih.gov. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
Cabeza y cuello carcinoma de células escamosas (HNSCC) es una enfermedad heterogénea que representa la séptima forma más común de cáncer en los Estados Unidos. Más allá de la función de los virus del papiloma humano (HPV), no se ha establecido la caracterización molecular validado de la enfermedad [1] - [4]. la expresión génica Para caracterizar mejor la diversidad de HNSCC, así como otros tumores, nuestro grupo y otros han sugerido (GE) subtipos como un medio para dar prioridad a los patrones genómicas dominantes dentro de un grupo específico de tumor [5] - [11]. subtipos validados basados principalmente en GE perfiles de cáncer de mama, glioblastoma, cáncer de pulmón, y otros han ganado un amplio interés [5] - [7], [9] - [11]. El trabajo preliminar ha sugerido que los subtipos clínicamente relevantes se encuentran también en el cáncer de cabeza y cuello [8], pero los resultados no han sido replicados, no se han propuesto sistemas de modelos, y la etiología de los subtipos es oscuro. En otros tipos de tumores de la validación de las firmas moleculares ha sido establecido por el siguiente enfoque: (i) los subtipos mostraron ser estadísticamente válida, (ii) las alteraciones genómicas subyacentes a los subtipos fueron documentados, y (iii) los sistemas modelo representativo de la expresión se identificaron subtipos. El presente estudio fue concebido para hacer frente a cada uno de los puntos mencionados anteriormente. Debido a que el objetivo de este estudio fue detectar patrones de expresión génica y eventos genómicas subyacentes que están presentes en los CECC, el diseño del estudio no incorporó subtipos moleculares que fueron definidos a priori, por ejemplo - subtipos clasificados por el VPH.
Resultados
Sin supervisión Descubrimiento de Expresión CECC subtipos
Con el fin de abordar la cuestión de si estadísticamente significativas subtipos de expresión génica pueden ser detectados en los CECC, que realizó la agrupación jerárquica de una manera no supervisada e imparcial usando técnicas bien establecidas y objetivos [7]. Al igual que en el trabajo anterior de Chung et al. [8], documentamos la presencia de cuatro subtipos de expresión génica. mapas de calor de expresión génica (Figura 1A) y parcelas producidos por ConsensusClusterPlus [12] (Figura S1 A - C) no son compatibles con la presencia de grupos estadísticamente significativas adicionales en este conjunto de datos. Un conjunto representativo de genes conocidos o sospechosos de ser relevante para el cáncer de cabeza y cuello se muestra en la Figura 1B, y la estadística de prueba para la asociación de todos los genes en el conjunto de datos con el subtipo de tumor se proporcionan en la Tabla S1. SigClust [13] El análisis mostró que los valores de p para todas las comparaciones por pares de los subtipos de expresión fueron significativas al nivel the.05 después de aplicar una corrección de Bonferroni para comparaciones múltiples (Figura S1D). Nos referimos a los subtipos de expresión como basal (BA), mesenquimales (MS), atípica (AT), y clásica (CL) en función de las características biológicas de los genes altamente expresados en cada subtipo
.
Heatmaps de los valores de expresión de los 840 genes clasificador (a) y seleccione los genes asociados con CECC (B) para cada uno de los subtipos de expresión. heatmaps de validación de las distancias a base de centroide entre los centroides de los subtipos de expresión en el estudio actual y los de Chung et al. (C) y los subtipos LUSC de Wilkerson et al. (D).
Características clínicas
Las características clínicas de los pacientes incluidos en el estudio representan una amplia muestra de pacientes con CECC que es altamente representativa de la población se ve en una práctica clínica típica (Tabla 1). No hubo correlación del subtipo de tumor con la edad, el género, la raza, el consumo de alcohol, paquetes al año, o el tamaño del tumor. subtipos de tumores fueron estadísticamente asociado al punto, a pesar de todos los sitios tenían tumores en cada uno de los subtipos de expresión, con una excepción (hipofaringe no mostró BA). Además, ningún sitio contribuyó más del 58% de sus muestras a un subtipo de expresión. No subtipo de expresión se compone de más de 68% de los tumores a partir de un solo sitio. Por lo tanto, a diferencia de otros marcadores moleculares tales como HPV o p16, se concluye que los subtipos de expresión capturados una dimensión de la biología que no se limita a un solo sitio anatómico [14]. No hubo asociación estadísticamente significativa entre adicionales subtipo de tumor y el estado del VPH, el tratamiento, los ganglios, y la etapa general. Es de destacar que más BA mostró una tendencia hacia ser bien diferenciados, mientras que 13 de 16 tumores mal diferenciados eran o MS o CL, aunque esta diferencia no fue estadísticamente significativa.
Validación de los subtipos
a continuación, dirigimos nuestra atención a la cuestión de si los subtipos de expresión detectados en el conjunto de datos actual correspondían a los informados previamente por Chung et al. [8]. Wilkerson et al. [7] se presenta un método para comparar los patrones de expresión de genes que se encuentran en los subtipos de expresión a través de múltiples estudios. Utilizamos el mismo procedimiento, que se describe con más detalle en la sección Métodos. En pocas palabras, los centroides de los subtipos de expresión miden los valores de expresión génica de la media, y los subtipos con los patrones de expresión concordantes producen centroides que se correlaciona más de los subtipos con patrones de expresión discordantes. Una correspondencia clara se observó (Figura 1C), con BA, MS, AT, y CL que demuestra los mismos patrones de expresión como el Chung subtipos 1, 2, 3, y 4, respectivamente. Habiendo descubierto cuatro subtipos utilizando conjuntos de datos y métodos independientes e imparciales, tenemos en cuenta estos cuatro subtipos de expresión para ser validados.
procesos biológicos diferenciados y Semejanzas con el Pulmón Carcinoma de células escamosas
Los patrones de expresión se encuentran en el subtipos sugieren la presencia de diferencias fundamentales en la biología subyacente de los tumores asociados (Tabla S2). La expresión génica en BA mostró una fuerte similitud con la firma que se encuentra en las células basales del epitelio de la vía aérea humana, incluyendo la alta expresión de genes tales como
COL17A1, España que está asociada con la matriz extracelular, el factor de crecimiento y receptor
TGFA
y
EGFR
, y el factor de transcripción
TP63
[14]. Los tumores en MS se ejemplifican por elevada expresión de genes asociados con el (EMT) epitelio-mesenquimal transición, incluyendo el mesenquimales marcadores
VIM
y
DES
, el factor de transcripción
TWIST1
, y el factor de crecimiento
HGF
[15], [16]. AT tumores tenían una fuerte VPH + firma, como lo demuestra la elevada expresión de
CDKN2A, LIG1
, y el factor de transcripción
RPA2
[17]. Los tumores en la CL, el subtipo con la historia más pesado fumar, mostraron alta expresión de genes asociados con la exposición al humo del cigarrillo, incluyendo el metabolismo de xenobióticos genes
AKR1C1 /3 Opiniones y
GPX2
[7], [18], [19] y el factor de transcripción
NFE2L2
[10]
los carcinomas de células escamosas de los diferentes sitios en la parte del cuerpo una serie de características moleculares -. ej pérdida del cromosoma 3p y la ganancia del cromosoma 3q [20], [21] - por lo que la hipótesis de que una correspondencia entre los subtipos de expresión y, recientemente, informó pulmonares escamosas subtipos de carcinoma de células de expresión (LUSC) [7] se observarían. Para investigar un fenotipo más amplio de los carcinomas de células escamosas del tracto digestivo superior, hemos ampliado la metodología de predicción centroide y evaluamos la correspondencia de los centroides de LUSC y CECC (Figura 1D). Sorprendentemente, se observó un claro patrón de correlación en la que la BA, subtipos MS, y CL de HNSCC correspondió a la basal LUSC, secretora, y subtipos clásicos, respectivamente, de Wilkerson et al. [7]. El examen de los datos TCGA LUSC [10] proporciona evidencia convincente adicional de las conexiones subyacentes entre los subtipos de expresión en los dos sitios tumorales (Figura S2). La correspondencia entre los subtipos basales es notable porque Wilkerson et al. [7] se describe experimentos de tiempo que implican células epiteliales bronquiales humanas cultivadas en el que los patrones de expresión de genes en los puntos de tiempo iniciales mostraron un gran parecido con las observadas en el subtipo basal de LUSC. Del mismo modo, como se muestra en la Tabla S3, se observó que el subtipo basal de HNSCC es más similar al punto de tiempo de día 3 en los datos de curso de tiempo de la interfaz aire-líquido (ALI) modelo [22].
DNA el análisis por copia Subtipo
a continuación, se volvió nuestra atención a las alteraciones genómicas de CECC, medido por el número de copias matrices (CN). En primer lugar hemos confirmado muchas regiones reportados previamente como alterados en HNSCC, incluyendo la ganancia de los cromosomas 3q, 7p, y 11q (ganancias estadísticamente significativas se observan tanto en 11q13 y 11q22) y la pérdida de cromosomas 3p, 9p, 14q y (Tabla S4). Como se ha visto en otros tumores [11], hay patrones tanto concordantes y discordantes de número de copia alteración en las principales regiones del genoma en función del subtipo de tumor (Figura 2, el cuadro S5). Por ejemplo, las ganancias de 3q variar según el subtipo de expresión (p = 0,01), mientras que no se detectaron diferencias significativas entre los subtipos de NC en 11q13, que contiene
CCND1
(p = 1). La ganancia CECC 7p canónica se produjo en una región que contiene
EGFR
, pero estas alteraciones se encontraron en BA, MS, y CL, no AT (p = .01). valores de CN en 3p no fueron significativamente diferentes entre los subtipos (p = 0,47). Las pérdidas de la región que contiene 9p
CDKN2A
se encuentra en Buenos Aires y sólo CL, y las diferencias fueron significativas NC (p = .01). NC pérdida focal se encuentra en 14q32 para la EM, CL, y es particularmente pronunciado en AT, pero a pesar de esto no hizo no alcanzó significación estadística. Esta región contiene miR203, que se caracteriza porque se dirige a ΔNp63 [23], uno de los seis productos proteicos de
TP63
. inestabilidad cromosómica también varió considerablemente según el subtipo (p = 2.2e-4), como se ve en la figura S3.
Los gráficos de los valores medios del número de copias en los subtipos de expresión HNSCC después de alisar y eliminación de las demás, tanto en el genoma (a) y de cromosomas específicos o regiones de interés (B).
Copiar número cambia y la expresión diferencial de los genes en el cromosoma 3q por Subtipo de Expresión
Una de las alteraciones genómicas por excelencia asociado con carcinomas de células escamosas es la ganancia de 3q [20], [21], y en la sección anterior observamos que los valores de CN en esta región variaron según el subtipo de expresión. Curiosamente, hubo un uso diferencial proporcional distinta de los tres genes analizados típicamente como los objetivos de la amplificación:
TP63, PIK3CA, España y
Sox2 gratis (Figura 3). La CL y AT subtipos demostrado proporcionalmente mayor expresión de
SOX2
en relación con MS y BA, que de hecho parecía expresar menos
SOX2
que los controles normales de la amígdala. Por el contrario, el subtipo BA expresaron niveles mucho más altos de
TP63
que cualquier otro grupo. Del mismo modo, aunque las MS subtipo de copia exhibido ganancias de número en 3q, ninguno de los genes diana putativo parecía ser expresadas en niveles más altos que la amígdala normal. pruebas de Kruskal-Wallis mostró que la expresión de cada uno de los
TP63, PIK3CA, España y
Sox2
se asoció con el subtipo de expresión después de un ajuste de Bonferroni para múltiples pruebas (Tabla S6). Esta observación plantea la posibilidad de que la heterogeneidad de los CECC podría explicarse en parte por el uso diferencial de los factores de transcripción (
Sox2
y
TP63
) y el oncogén (
PIK3CA
) en el amplicón 3q, que es más complejo de lo que se ha informado anteriormente [24]. También sugiere que el uso diferencial de los factores de transcripción y oncogenes, impulsado en parte por distintas alteraciones del número de copias, puede contribuir a las firmas de expresión de genes que definen los subtipos de expresión.
La media de genes específicos de número de copias de genes y la expresión de los valores en los subtipos de expresión HNSCC y muestras de amígdalas normales (NL) de genes en el amplicón 3q.
número de copias Eventos que exijan genes cancerígenos Canonical
hemos advertido ya que los valores de número de copias en regiones de pérdidas y ganancias se asociaron con el subtipo de expresión. Ahora describimos hallazgos similares que se obtuvieron cuando los valores de número de copias de genes específicos de genes conocidos por jugar un papel en HNSCC -
CCND1, CDKN2A, España y
EGFR CD - fueron considerados, no el más amplio regiones discutidos anteriormente. En la discusión anterior hemos dicho que las ganancias de 11q13 no fueron significativamente diferentes entre los subtipos, y la Tabla 2 muestra que se encontraron resultados similares cuando se restringió la atención sobre las ganancias de
CCND1
. Por el contrario, la frecuencia de
EGFR
ganancias varió de 0% en el AT a 31% en CL (p = 0,069), mientras que la frecuencia de
CDKN2A
pérdidas variar entre 10% en la EM al 63% en CL (p = 0,004). Estos dos resultados son concordantes con los hallazgos en las regiones más amplias de 7p 9p y, respectivamente, descritos anteriormente.
Estudios anteriores han detectado asociaciones entre eventos genómicas distintas, y estos hallazgos, ya sea proporcionado información sobre la la biología subyacente o el manejo clínico de los pacientes con cáncer [25], [26]. En CECC,
CCND1
ganancias simultáneas y
CDKN2A
las pérdidas han sido estudiados por Okami et al. [27] y Namazie et al. [28], con Namazie et al. la detección de una asociación entre estos eventos genómicos. Hemos encontrado que
CCND1
ganancias NC se asociaron con
CDNK2A
pérdidas en todos los subtipos (Tabla S7), y que el evento conjunto se asoció con los subtipos de expresión (Tabla 2), confirmando de ese modo y extender los resultados de Namazie et al.
resultados clínicos por el subtipo expresión y focales genómica alteraciones
Después de haber analizado el conjunto de cerca de 140 tumores en subtipos HNSCC de expresión, ya la luz de los factores de riesgo conocidos tales como el VPH, el tabaquismo y el consumo de alcohol, consideramos si la estratificación adicional para los resultados del paciente podría sugerir. Lo primero que investigó si la ventaja de supervivencia reportados por Chung et al. para "subtipo 1" puede ser reproducida en la cohorte actual. No hemos podido confirmar este resultado, y en el presente estudio no hubo asociación entre la supervivencia libre de recidiva y subtipo de tumor, ya sea general (Figura 4A) o cuando nos limitamos a los pacientes en etapas avanzadas (no se muestra). Estas diferencias pueden explicarse por la heterogeneidad clínica de la enfermedad combinada con el hecho de que las distribuciones sitio del tumor en los dos estudios son marcadamente diferentes
.
gráficos de Kaplan-Meier y los valores de p log-rank test que comparan libre de recidiva el tiempo de supervivencia en todos los subtipos de expresión (a), el VPH + vs sujetos VPH (B), todos los subtipos de expresión en sujetos VPH (C), y AT-AT vs. no en sujetos VPH (D). La significación estadística se evaluó mediante la prueba de log rank.
Con el fin de aclarar si los factores de confusión conocidos o sospechosos podrían haber afectado a nuestra capacidad para detectar diferencias en los subtipos específicos de la evolución del paciente, se evaluó el impacto de la condición de VPH en la supervivencia global. Se observó un efecto relativamente grande pero imprecisa debido al pequeño número general de HPV + pacientes (Figura 4B). Por lo tanto, consideramos que es razonable para volver a evaluar la cohorte de pacientes con VPH + excluidos. Exclusión de VPH + pacientes reveló que el subgrupo EN demostró un resultado particularmente desfavorable (Figura 4C), y esta diferencia fue estadísticamente significativa en comparación con todos los otros subtipos combinados (Figura 4D). A continuación, accede a un conjunto independiente de 122 muestras de microarrays de tejidos (TMA), en un esfuerzo para validar este hallazgo. Dado que los valores de tinción de GE y la inmunohistoquímica (IHC) basadas en matrices no son comparables, que no era factible para predecir el subtipo de tumor de cada muestra de TMA. En su lugar se utilizó baja EGFR y alta tinción de p16 como un sustituto de la situación AT. La diferencia en los tiempos de supervivencia no fue estadísticamente significativa, pero se obtuvieron resultados similares a los descritos anteriormente (Figura S4).
También investigamos si cualquier evento número de copias focales se asociaron con el resultado clínico. Estudios previos han detectado una correlación entre ganancias CCND1 y la disminución de los tiempos de supervivencia libre de recidiva en HNSCC [29]. Se obtuvieron resultados similares cuando se examinaron los valores de CN para todas las muestras de tumores (Figura S5), aunque nuestros resultados son marginalmente significativa (p = 0,07). Sorprendentemente pocos a los sujetos expuestos
CCND1
ganancias (Tabla 2), y esto sugiere la presencia de dos grupos distintos en gran parte de los pacientes con resultados clínicos pobres: aquellos con
CCND1
ganancias y los que son VPH - y AT. Figura S6 apoya esta conclusión.
Los subtipos de expresión en el Sistema Modelo de
La línea celular de cáncer Enciclopedia [30] contiene los datos genómicos de más de 900 líneas celulares de cáncer humano, incluidos tanto los datos de GE y CN de 19 esofágico y 18 líneas de células del tracto digestivo superior. Hemos aplicado nuestro predictor centroide a los datos de GE de estas líneas celulares y se encontró que los cuatro subtipos de expresión estaban presentes (Tabla S8). Estos hallazgos son particularmente convincente a la luz de la relevancia clínica de los subtipos de expresión, ya que proporcionan la base para futuros estudios que implican sistemas modelo. Figura S7 proporciona ejemplos para ilustrar que los eventos de NC subtipo específico también se observan en las líneas celulares
Discusión
Nuestro resultado primario fue la detección de cuatro subtipos de expresión génica en HNSCC -. Basales, mesenquimal , atípica y clásica. También puso de manifiesto que estos subtipos tienen relevancia biológica y clínica, y por lo tanto proporcionan un mecanismo útil e informativa de la clasificación de los tumores HNSCC que complementa los métodos existentes sobre la base de la histología y la localización del tumor. Análisis de expresión de datos públicamente disponibles reveló que estos subtipos son reproducibles en HNSCC [8] y son notablemente similares a los encontrados en LUSC [7], [10]. Aunque los patrones de expresión génica para el subtipo LUSC secretora son similares a las observadas en el subtipo mesenquimales del CECC, estamos a favor de una nomenclatura alternativa. Datos que confirman el origen glandular de HNSCC es menos convincente en comparación a la del pulmón, y la evidencia de una firma mesenquimales es abundante [7]. Aunque sería posible utilizar los datos existentes para producir un factor de predicción de genes para el VPH, que no trató de hacer esto ya que los resultados de esta naturaleza fueron presentados por Martínez et al. [31]. Se detectaron regiones del aumento de número de copias de ADN recurrente y pérdida, algunos de los cuales contienen oncogenes y supresores de tumor conocidos. Los valores de número de copias en ciertas regiones aberrantes se asociaron con subtipo de tumor, lo que sugiere que los acontecimientos de número de copias pueden contribuir al desarrollo de los subtipos de expresión. Todos los subtipos de expresión se detectaron en líneas celulares HNSCC, un hallazgo que proporciona la base para futuros estudios.
Ahora discuten brevemente las definiciones de los subtipos de expresión. Basal y clásica fueron escogidos debido a que los patrones de expresión en estos subtipos mostraron fuertes similitudes con los subtipos basales y clásicos de LUSC. Wilkerson et al. en comparación con los patrones de expresión de los subtipos LUSC a datos del curso de tiempo del desarrollo de las células epiteliales bronquiales humanas, y encontraron que el subtipo basal tenía patrones de expresión similares a los observados en los puntos de tiempo tempranos cuando las células basales son más comunes. Del mismo modo, como se muestra en la Tabla S2, se observó que el subtipo basal de HNSCC es más similar al punto de tiempo de día 3 en los datos de curso de tiempo a partir del modelo ALI [22]. El subtipo clásico exhibe alteraciones genómicas canónicas asociadas con el carcinoma de células escamosas - por ejemplo, supresión de 3p y 9p, amplificación de 3q, y la amplificación focal de ambos
EGFR
y
CCND1
. Mesenquimales se selecciona en función de la vía de análisis indicativo de una transición epitelial a mesenquimal. Por último, atípica fue elegido debido a la falta de cualquiera de
EGFR
amplificación o deleción de 9p.
Las diferencias en los patrones de expresión que se encuentran en los subtipos son clínicamente relevantes.
TP63
produce seis proteínas distintas, y ΔNp63 es la isoforma más abundante en HNSCC [32]. Yang et al. [33] muestran que ΔNp63 promueve la proliferación celular. Chatterjee et al. [32] indicó que la exposición a cisplatino condujo a la disminución de los niveles de ΔNp63, por lo que este tratamiento puede ser particularmente eficaz para los pacientes en BA. Barbieri et al. [34] demostraron que la pérdida de
TP63 Hoteles en líneas celulares HNSCC condujo a la adquisición de un fenotipo mesenquimal, que es convincente en vista de los bajos niveles de expresión de
TP63
ha visto en la EM. Martin y Cano [35] indicaron que la expresión elevada de
TWIST1
o
IMC1 Hoteles en líneas celulares HNSCC podría aumentar la probabilidad de invasión y la migración. Debido a que los tumores MS mostraron un fenotipo de EMT y el aumento de la expresión de ambos
TWIST1
y
IMC1
, estos sujetos pueden ser más propensos a desarrollar metástasis a distancia. El hecho de que
EGFR
se sobreexpresa en la gran mayoría de los tumores HNSCC [36] hace
EGFR inhibidores
una opción de tratamiento atractiva para esta enfermedad. Sin embargo, estas terapias tienen menos probabilidades de ser eficaces en tumores en porque
EGFR
expresión era más bajo que en los otros subtipos de expresión.
Sox2
y
ALDH1
fueron altamente expresado en AT y CL, y ambos de estos genes son marcadores de células madre del cáncer putativas debido a sus contribuciones a la auto-renovación y un fenotipo pluripotentes [37], [38]. El producto proteico del
PIK3CA
es p110α, que fosforila AKT. AKT activado contribuye a la supervivencia de las células tumorales, y por lo tanto la transformación oncogénica [39]. West et al. [40] demostraron que la exposición de las células epiteliales de pulmón normales a la nicotina facilita la activación de AKT por lo que es dependiente de PI3K solo. Esta observación, junto con los altos niveles de fumar vista en CL, sugiere que los inhibidores de la cinasa PI3 proporcionan una opción de tratamiento atractiva para los tumores CL.
Hay varias limitaciones a este estudio. En primer lugar, no teníamos GE, CN, y los datos clínicos de todos los sujetos de estudio, lo que limitaba nuestra capacidad para analizar conjuntamente estas variables. Además, aunque las etiquetas de subtipo se objetivamente definidos por un algoritmo de agrupamiento y los patrones de expresión génica fueron validados independientemente, las asociaciones clínicas no lo eran. Copiar matrices numéricas se generaron para todas las muestras con suficiente calidad y cantidad de ADN. Desafortunadamente, más de 20% de las matrices no cumplió con las métricas de calidad estandarizados. Además, no estaba claro qué isoforma (s) de
TP63
se ensayaron por nuestros arrays de expresión génica, y por desgracia el papel que
TP63
juega en el subtipo basal no puede comprenderse plenamente el conocimiento de estas isoformas. Debido a que el VPH + muestras se retiraron al llevar a cabo el análisis de supervivencia secundaria, estos resultados deben considerarse como exploratorio y por lo tanto deben ser validados de forma independiente. Por último, el estado de todos los pacientes VPH no estaba disponible.
En conclusión, hemos confirmado cuatro clases moleculares de los CECC (basal, mesenquimal, atípica y clásica), en consonancia con las firmas establecidas para el carcinoma epidermoide de pulmón. El uso de un análisis genómico integrado y metodología de validación, documentamos subtipos identificados por los genes supresores de tumores y oncogenes canónicas, incluyendo la desregulación de la
KEAP1 /NFE2L2
vía el estrés oxidativo, la utilización diferencial de los marcadores de linaje
Sox2
y
TP63
, y la preferencia por los oncogenes
PIK3CA
y
EGFR
. Para uso clínico potencial, las firmas son de cortesía a la clasificación por estado de la infección por VPH, así como el marcador de alto riesgo putativo
CCND1
ejemplar número ganancia. Una etiología molecular de los subtipos es sugerido por las ganancias y pérdidas cromosómicas estadísticamente significativas y diferencial de células de patrones de expresión de origen. También se presentaron los sistemas modelo representativo de cada uno de los cuatro subtipos.
Materiales y Métodos
Colección tumoral y Genética Ensayos
Después de recibir el consentimiento informado por escrito, congelado, extraído quirúrgicamente, tumores de cabeza y cuello macrodissected se recogieron en la Universidad de Carolina del Norte bajo Junta de Revisión Institucional protocolo#01-1283. RNA Tumor se extrajo y la expresión de ARNm se ensayó usando Agilent 44K microarrays. ADN tumoral fue extraído y el número de copias de ADN fue ensayada mediante Affymetrix genómica SNP 6.0 fichas. Un resumen de todos los datos genéticos utilizados en este estudio se puede encontrar en la Tabla S9.
Análisis de la expresión de ARNm
procedimientos de control de calidad se aplican a los archivos de intensidad de la sonda de nivel de microarrays. Un total de 138 matrices tumorales se mantuvo después de la eliminación de las matrices de baja calidad, matrices duplicadas, y las matrices de muestras no HNSCC. La corrección de fondo normexp y procedimientos de normalización loess [41] se aplicaron a los datos de la sonda de nivel. Después de registro
2 transformación, sondas fueron combinados con una base de datos común de genes para producir valores de expresión de 15597 genes.
Expresión no supervisada Subtipo Descubrimiento
El procedimiento descrito aquí es similar a la que apareció en Wilkerson et al. [7]. Después de los valores de expresión génica fueron mediana centrada, la variabilidad de genes se calcula utilizando la desviación media absolución. Se seleccionaron los 2500 genes más variables. ConsensusClusterPlus [12] se utilizó para llevar a cabo la agrupación sin supervisión de estos genes en los 138 arrays. Este procedimiento se realizó con 1000 juegos seleccionados al azar de muestras de microarrays utilizando una proporción de muestreo de 80% y una métrica de distancia igual a uno menos el coeficiente de correlación de Pearson.
significación estadística de los patrones de expresión génica en los subtipos de expresión
Para confirmar la significación estadística de cuatro grupos, SigClust [13] se aplicó utilizando el conjunto de los 2.500 genes más variables descritas anteriormente. Todas las comparaciones por pares de los subtipos fueron examinadas usando muestras simuladas y 1000 el método de estimación de covarianza originales.
Los genes expresados diferencialmente y Vías Metabólicas
genes expresados diferencialmente se detectaron con el samr paquete de R [42] utilizando un umbral medio FDR of.01. Para cada uno de los subtipos de UNC se compararon los valores de expresión de genes en el subtipo a todos los otros subtipos combinados. DAVID [43] a continuación, se utilizó para encontrar KEGG vías que mostraron enriquecimiento para los genes altamente expresados en cada subtipo. Además, los genes expresados diferencialmente con categorías funcionales conocidos, por ejemplo, factores de transcripción, se encontró que mediante la comparación de las listas de genes específicos de subtipo de conocidos genes ontología categorías [44].
Expresión Publicado Datos
Los archivos de intensidad de la sonda de nivel de microarrays producidos por Chung et al. [8] fueron sometidos a corrección de fondo, la normalización, y los procedimientos de integración a nivel de genes similares a los descritos anteriormente. Esta expresión génica producido valora por 60 sujetos y 8224 genes. Las etiquetas de los subtipos de estas matrices 60 que aparecían en [8] se conocen como Chung subtipos 1, 2, 3, y 4.
Los valores RPKM Resumen de 20,502 genes y 178 sujetos se obtienen a partir de los datos RNASeq presentado en [10]. Los valores fueron RPKM registro
2 transformado, y cualquier gen que contiene al menos un valor faltante se eliminó del análisis. Este valor de la expresión de genes producidos por 15.314 genes.
Validación de Expresión subtipos
agrupación Consenso asigna una etiqueta a cada subtipo matriz. Como resultado, algunas matrices pueden no ser representativos de su subtipo. Utilizando anchos silueta [45], hemos identificado un conjunto de 125 muestras "núcleo" cuyos patrones de expresión eran más similares a los de los miembros de su propio subtipo que otros subtipos. ClaNC [46], un método de clasificación basado en centroides más cercanos, se aplicó luego a los datos de expresión UNC de las muestras de núcleos en un esfuerzo para crear un conjunto de genes clasificador cuya firma la expresión podría ser utilizado para clasificar nuevas muestras. Reducción al mínimo de la tasa de error de validación cruzada elaboró una lista de 840 genes clasificador (210 genes por subtipo).
Se identificaron los genes clasificador cuyos valores de expresión también están presentes en el conjunto de datos de expresión Chung y, a continuación, limita el UNC y Chung expresión de datos a estos genes. Después de mediana gen centrado cada conjunto de datos por separado, encontramos el centroide para cada uno de los subtipos UNC y Chung calculando el valor medio de expresión para cada gen sobre todas las matrices que tienen la etiqueta de subtipo apropiado. Al igual que en [7], las distancias entre los centroides de UNC y Chung se calcularon utilizando una métrica de distancia igual a uno menos el coeficiente de correlación de Pearson. Este proceso de validación se repitió utilizando los datos LUSC de Wilkerson et al. [7]. Los datos RNASeq de [10] fue manejado de manera similar con las siguientes diferencias: (i) los valores de la expresión génica de la UNC y log
2 valores (RPKM) de los conjuntos de datos del TCGA fueron por separado centrado en la mediana y estandarizados por gen, (ii)