Extracto
Para desarrollar una visión global del número de copias aberraciones (CNA) en fase II /III de cáncer colorrectal (CCR), que caracteriza 302 tumores del ensayo clínico PETACC-3. De microsatélites estables (MSS) muestras (n = 269) tenían 66 regiones CNA comunes mínimas, con ganancias frecuentes en 20 q (72,5%), 7 (41,8%), 8 q (33,1%) y 13 Q (51,0%) y pérdidas en 18 (58,6%), 4 q (26%) y 21 Q (21,6%). tumores del SMS tienen significativamente más que los tumores de microsatélites CNA-inestable (MSI): dentro de la MSI tumores una novela eliminación del supresor de tumor WWOX en 16 q23.1 se identificó (p & lt; 0,01). aberraciones focales identificados por el método logís- confirmaron amplificaciones de oncogenes, incluyendo EGFR, erbB2, CCND1, MET, y MYC, y supresiones de los supresores de tumores incluyendo TP53, APC, y SMAD4, y la expresión génica fue muy concordantes con el número de copias de la aberración de estos genes. amplicones novedosos incluyen oncogenes putativos como WNK1 y HNF4A, que también mostraron alta concordancia entre el número de copias y la expresión. El análisis de supervivencia asociada a un segmento específico del paciente ofrecido por el cromosoma 20 q ganancias a una mejora de la supervivencia global, lo que podría deberse a una mayor expresión de los genes, como EEF1B2 y PTK6. La agrupación CNA también agrupa tumores caracterizados por un mutante BRAF-como la firma mal pronóstico derivado de ARNm de datos de esta cohorte. Hemos puesto de manifiesto aún más la correlación no aleatoria entre CNA entre los loci no ligados, incluyendo correlación positiva entre el aumento de 20 Q y 8 de ganancia q, y q ganancia de 20 y el cromosoma 18 pérdidas, de acuerdo con el co-selección de estos CNA. Estos resultados refuerzan la naturaleza no aleatoria de somática CNA en fase II /III CRC y resaltan loci y genes que pueden desempeñar un papel importante en la conducción del desarrollo y pronóstico de esta enfermedad
Visto:. Xie T, d 'Ario G, Lamb JR, Martin E, Wang K, Tejpar S, et al. (2012) Una caracterización exhaustiva de todo el genoma número de copias aberraciones en el cáncer colorrectal Revela Nuevos oncogenes y patrones de alteraciones. PLoS ONE 7 (7): e42001. doi: 10.1371 /journal.pone.0042001
Editor: Alejandro H. Corvalan, Pontificia Universidad Católica de Chile, Chile
Recibido: 25 de abril, 2012; Aceptado: June 28, 2012; Publicado: 31 de julio 2012
Copyright: © Xie et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado en parte por una subvención de la Fundación Nacional de Ciencia de Suiza (SNF 320030_135421) y la Fundación del médico y una subvención de la Krebsforschung Schweiz (KFS 02697-08-2010) a AR y MD. ST es un investigador clínico principal del Fondo para la Investigación Científica de Flandes y ha recibido becas de investigación de la Federación Belga contra el Cáncer y del Plan Nacional del Cáncer belga. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:. TX, JL, KW, MM, SW, PR y JGH son o fueron empleados por Pfizer Inc. sin embargo, esto no altera la adhesión de los autores a todos los PLoS ONE políticas sobre el intercambio de datos y materiales. Los autores han declarado que no existen otros intereses en competencia.
Introducción
El cáncer colorrectal (CCR) ocupa el segundo lugar con el cáncer de pulmón en la incidencia y la mortalidad en los países desarrollados [1]. Se caracteriza por patrones altamente complejas de las alteraciones genéticas somáticas de oncogenes y supresores de tumor que impulsan la iniciación y la progresión [2], [3], [4]. La comprensión de los mecanismos celulares y moleculares por los cuales estos cambios genéticos facilitan la formación de cáncer de colon es crítico para el desarrollo de estrategias terapéuticas específicas destinadas a controlar la progresión de la enfermedad, mientras que se minimizan los efectos secundarios tóxicos.
Un mecanismo genético bien establecida por que las células de cáncer alterar la actividad de los oncogenes y supresores de tumores es a través de los cambios en la dosis génica. caracterización detallada de las aberraciones número de copias de ADN (CNA) han ayudado a identificar los oncogenes importantes, incluyendo ErbB2 y EGFR, así como supresores de tumores tales como TP53 [5]. Numerosos estudios han documentado CNA somáticas en todo el genoma en el CCR [6], [7], [8], [9], [10], [11], [12], [13], [14], [15] , [16], [17], [18], algunos de los cuales han sido relacionados con el resultado clínico o la progresión metastásica [19], [20], [21], [22], [23], [24]. Sin embargo, muchos de estos estudios se han limitado por el tamaño modesto de la muestra, los ensayos de baja resolución, o la falta de anotación clínica asociada, sobre todo para las primeras etapas (II /III) el cáncer de colon. En consecuencia, una visión global de la CNA y su asociación con el resultado en la etapa del cáncer de colon II /III no ha sido desarrollado.
Se encuestó somática CNA en una colección de 302 en estadio II /III cánceres de colon derivada del Pan Ensayos europeos en cáncer de colon adyuvante (PETACC) -3 juicio, una evaluación de gran aleatorizado fase III del papel de irinotecán añaden a fluorouracilo (FU) /leucovorina (FA) como tratamiento adyuvante para el cáncer de colon [25]. Los resultados presentados en este documento exploran la relación entre la CNA, ARNm [26] y el resultado, y contribuyen a una visión molecular global de fase II /III de cáncer de colon, que es de suma importancia para la clasificación de pacientes refinación y tratamiento eficaz.
materiales y Métodos
clínica y ARNm de datos para PETACC-3 pacientes
Todo en estadio II /III de pacientes con cáncer de colon incluyen en este estudio se obtuvieron a partir del ensayo clínico PETACC-3 [25], con al menos 5 años de seguimiento clínico de cada paciente. La edad, el sexo, estadio, MSI (microsatélites inestable), así como BRAF KRAS y el estado de mutación de la población de pacientes se enumeran en la Tabla S1. datos de expresión de ARNm se generó en la plataforma ALMAC cáncer colorrectal DSA (Craigavon, Irlanda del Norte), como se informó anteriormente [26]. aprobación del paciente y la ética para este estudio se obtuvo de la Parte PETACC-3 Investigación traslacional de Trabajo (PTRW).
Inversion Molecular sonda de generación de datos de
extracciones de ADN se realizaron en macrodissected fijado en formol, parafina -embedded tejido (FFPE) tumor derivado de un solo 5 uM diapositiva de 835 muestras de pacientes. Se identificó tejido tumoral dentro de cada sección y se marcó un patólogo cualificado (F. Bosman). Para los controles normales, el ADN fue extraído de muestras con cantidades suficientes de tejido normal adyacente histopatológicamente bien lejos de las márgenes del tumor. ADN se cuantificó usando el ensayo PicoGreen. Para las muestras que produjeron menos de la cantidad recomendada de ADN de entrada (75 ng), todo el ADN se llevó adelante en las Inversion Molecular Probe (MIP) de amplificación, etiquetado, y los protocolos de hibridación que utilizan los servicios OncoScan V1.0 FFPE Express de Affymetrix (Affymetrix, CA) . Las muestras que fallaron la amplificación por PCR o muestran una diferencia media media por parejas (MAPD) & gt; 0,6 después de la hibridación se eliminaron del análisis final, lo que resulta en 302 muestras tumorales junto con 44 muestras normales adyacentes como comparador de línea de base normal. Típicamente muestras inferiores a 20 ng de ADN de entrada fallaron el punto de corte de amplificación MIP y no se llevaron adelante a la gama de hibridación. Las muestras con al menos 75 ng de ADN de entrada universal produjeron datos de número de copia de alta calidad (MAPD & lt; 0,6). Los resultados variaron de cantidades de ADN de entrada de 20-75 ng, donde el MAPD & gt;. 0.6 filtro sirve para eliminar las muestras excesivamente ruidosos
Copia de Análisis de Datos Número
Copiar datos de número se analizó con el Nexus Copia número de software 6.0 (Biodescubrimiento, Inc., CA, EE.UU.). Los datos de número de copias en bruto para cada sonda proporcionada por Affymetrix fue suavizada por una corrección cuadrática proporcionada por NEXUS y centrados usando regiones diploides. comparaciones entre los grupos de frecuencia de la CNA de la muestra (por ejemplo, SMS frente MSI; fase-II-III en comparación con el escenario) se ha realizado mediante umbrales predeterminados nexo de & gt; 15% de diferencia y significación p & lt; 0,01 (prueba exacta de Fisher). Para generar segmentos de número de copias y regiones comunes mínimas (MCR), se aplicó una versión modificada del algoritmo de segmentación binaria circular (CBS) [27] llamado "Rango segmentación" en NEXUS. El punto de corte de p-valor para la CBS fue 1.0E-6, y los segmentos fueron asignados a 1 de 5 contenedores: amplificada (& gt; 3,8 copias), ganado (2,3 a 3,8 copias), sin cambios (1,7 a 2,3 copias), suprimido (0,5 a 1,7 copias) o eliminado homocigótica (& lt; 0,5 copias). Para las pruebas de significación MCR frecuencia, se utilizó un p-valor de corte de & lt; 0,01 de la prueba de significación estadística de número de copia aberrante método (STAC) [28]. La agrupación jerárquica de la CNA se realizó en NEXUS también (vinculación completa, los cromosomas sexuales ignorado). Para detectar amplificaciones focales, se aplicó logís- (Genómica identificación de objetivos significativos en Cáncer) versión 2.0 [29] usando un Q-valor de corte & lt; 0,25. Los genes reportados en los picos de amplificación GISTIC2 también se estudiaron, si se enriquecen en las vías biológicas. Se utilizó la base de datos vía canónica proporcionada por MSigDB [30]. Se excluyeron los conjuntos de genes de la ruta con menos de 10 miembros o mayor de 500 miembros. Se utilizó la prueba exacta de Fisher para el acceso si esos genes son sobre-representados. FDR se calculó basado en 100 permutaciones donde se probaron juegos al azar de genes de mismo tamaño. También se utilizó la prueba exacta de Fisher para ver si las frecuencias de ciertos CNA difieren entre los grupos de pacientes (fase II contra III, MSI vs. MSS etc). El análisis de supervivencia se realizó mediante el método de Kaplan-Meier con un valor de p (log-rank test) de corte de & lt; 0,01. Para el análisis de las correlaciones CNA /CNA, la correlación de Pearson se calculó a nivel de genes para todos los pares de genes como se ha descrito anteriormente [31]. Para obtener resúmenes de genes a nivel de los datos de número de copias, asignamos los valores del número de copias del segmento (s) que se superpone cada gen: cuando había varios segmentos dentro del ámbito del gen, un promedio de los números de copias de esos segmentos. Todos los datos basados en el genoma reportados en este manuscrito se basan en NCBI Build 36 (hg18) del genoma humano.
Expresión de datos Análisis de datos
La expresión génica de los PETACC-3 pacientes se informó anteriormente [26]. Nos corresponde con los datos de genes a nivel de número de copias por ENTREZ ID. eran al mismo tiempo disponible para 213 de los 269 pacientes del SMS con los datos disponibles de la CNA número de copias y la expresión génica de datos. Para probar cis-correlación entre el número de copias de un gen y su nivel de expresión propia ARNm a través de los tumores, se categorizaron los pacientes según su estado aberración (amplificación, aumento, sin cambios, pérdida o deleción homocigota) asociado a los valores de la expresión de la sonda fija mapeo a los mismos genes
resultados
Copy Number aberraciones y la inestabilidad de microsatélites
33 de las 302 muestras en nuestro análisis de microsatélites eran inestables (MSI):. consistentes con estudios previos [ ,,,0],19], [32], el número promedio de CNA en los tumores MSI (10,2 ± 6,5) fue significativamente menor (p & lt; 0,01, dos muestras t-test) que el número promedio de CNA en microsatélites estables (MSS) tumores (33,2 ± 17.6). Sin embargo, dos regiones focales se suprimieron significativamente con más frecuencia en muestras de MSI: chr16q23.1 (chr16:77,231,391-77,261,567 pb) en 24,2% de las muestras de MSI vs. 7,1% de las muestras del SMS (p & lt; 0,01), y chr20q11.1 (chr20 :28,118,678-28,244,164) en 24,4% de las muestras de MSI vs. 8,9% en las muestras de SMS (p & lt; 0,01). Curiosamente, el único gen contenido dentro del locus 16 q23.1 es el supresor de tumores WWOX, un inhibidor de la vía Wnt /beta-catenina [33], que se activa con frecuencia en el cáncer de colon.
recurrente CNA, nuevos oncogenes y afectados Rutas
Dada la prevalencia relativamente baja de la CNA en los tumores MSI, nos hemos centrado nuestro análisis en los 269 tumores MSS. Como se ha informado anteriormente [7], [8], [9], [10], [11], [12], [13], [14], [15], [16], [17], la frecuencias de las ganancias y pérdidas del número de copias de todo el genoma no se distribuyeron al azar (Figura 1A), con CNA que van desde las ganancias de copia única y pérdidas de regiones cromosómicas amplios, a focal deleciones homocigóticas y amplificaciones de alto nivel (figura 2). Las regiones más frecuentes de ganancia englobados regiones cromosómicas 7 p, q 8, 13 q, q y 20, y las regiones más frecuentes de pérdida de englobados 8 p, 17 p, q y 18 (Figura 1A).
(A) las frecuencias de aumento de número de copias (por encima del eje, azul) y la pérdida de número de copias (por debajo del eje, rojo) en todo el genoma humano. (B) Importancia de las amplificaciones focales detectadas por logís- 2.0. posiciones cromosómicas se indicaron a lo largo del eje y con posiciones centrómero indicados por líneas de puntos. Los diez picos logís- más significativos se muestran en rojo. logís- picos adicionales que codifican los oncogenes son establecidos en texto negro. Los detalles de todos los picos logís- se proporcionan en la Tabla S3.
(A-H) Copiar parcelas número de todo el genoma dispuestos en orden cromosómica en el brazo corto del cromosoma 1 (1pter) al brazo largo del cromosoma X (Xqter) para 8 muestras de tumores independientes. Los amplicones de interés particular se destacan con flechas, junto con oncogenes establecidos. Los detalles relativos a todos los amplificados y picos logís- están en la Tabla S3.
Para obtener una mayor comprensión, se resumieron las ganancias y pérdidas recurrentes cromosómicas en Minimal Regiones comunes (MCR) utilizando significativo Prueba de aberrante número de copias (STAC) [28], y logís- [29] para resaltar los oncogenes candidatos en el MCR en base a la focalidad y la amplitud de los cambios de número de copias. Un total de 66 MCR se identificaron a frecuencias superiores a 10% (Tabla S2): hubo 25 MCR de ganancia que van desde 251 a 104 Kb Mb, y 41 de MCR que van desde la pérdida de 286 kb a 138 Mb. Logís- ayudó a refinar el MCR a los loci y genes de importancia particular (Tabla S3). Muchos de los picos significativos identificados por logís- contenida oncogenes establecidas, entre ellas CCND1, CDX2, EGFR, erbB2, MET, y MYC (Figura 1B), junto con los supresores de tumores tales como APC, SMAD4 y TP53. Varios de los picos oncogénicas fueron impulsados por eventos focales de gran amplitud en un subconjunto de tumores (Figura 2), y estas amplificaciones focales condujo a un aumento significativo en la expresión de ARNm de varios de estos genes. picos altamente significativas logís- no asociados con oncogenes bien establecidos o supresores tumorales incluyen 12 p13.33 (Figura 2 E, F) y 20 q13.12 (Figura 2 G, H), que tenían amplificaciones focales de alta magnitud recurrentes, así como 14 q32.31 que, aunque no muy amplificada, tuvo ganancias de suficiente recurrencia y focalidad como para hacer una diferencia altamente significativa valor Q logís- (Figura 1B, el cuadro S3). Con los datos logís- amplicón, resumimos 114 conductores cáncer candidato de la Tabla S4, que incluyen doce (10%) oncogenes establecidos, tales como MYC, KRAS y MET. oncogenes putativos incluyendo WNK1 (Figura 3A) y HNF4A (Figura 3B) tienen Q-score, frecuencia amplificada, y que actúan en cis efectos sobre el ARNm que son comparables a los oncogenes establecidos (Figura S1). Nuestro análisis se ha reducido a más de 6.000 genes de las regiones del genoma MCR a un número manejable de aproximadamente 100 para validación experimental.
Las muestras tumorales fueron clasificados por su estado CNA (supresión, la pérdida, la normalidad, la ganancia, la amplificación ) para el gen indicado. Los paneles muestran el nivel de expresión por categoría para cada probeset desde la plataforma ALMAC (ver Materiales y Métodos) que representa el gen específico. Los valores se centraron para cada probeset; categorías se trazan si había al menos una muestra en ella.
Para buscar más lejos para los patrones de alteraciones vía afectada, estudiamos la lista de genes amplificados en el CCR (Tabla S4) en las vías de señalización molecular canónicas y los procesos celulares. La Tabla 1 muestra los mejores caminos canónicos posiblemente afectados por los genes amplificados. ciclo celular es una de las vías más enriquecidos afectados por somáticas CNA que implican genes tales como CCND1, MYC, TFDP1 y YWHAZ. KEGG "Caminos de cáncer" subyace en el amplio espectro de efectos somática CNA en la orientación de múltiples vías clave en el cáncer de forma simultánea. Más específicamente, también identificó las vías relacionadas con el cáncer individuales que son significativamente más representadas entre los genes que actúan en cis impulsados por somática CNA, incluyendo ERBB vía de señalización MAPK y la vía de señalización de la quinasa. Tomados en conjunto, estos resultados sugieren que estos CNA somáticas codifican nuevos genes oncogénicos conductor y potenciales dianas terapéuticas en el cáncer de colon.
CNA agrupación y no aleatorias Las correlaciones de la CNA en el CCR
Se realizó agrupación jerárquica sin supervisión de los datos globales CNA e identificados tres grupos principales. Aunque no se encontraron asociaciones significativas en la edad, el género, la etapa o estado de la mutación KRAS, se observó que los tumores de tipo salvaje BRAF se enriquecieron significativamente en el grupo más grande y mutantes BRAF en una de las agrupaciones más pequeñas (p & lt; 0,01). Anteriormente hemos [26] desarrolló una expresión genética BRAF mutante de la cohorte PETACC-3 y estudiamos sus implicaciones pronósticas. Entre 213 pacientes con SMS de expresión de mRNA de datos disponibles, la firma identificó 37 muestras "BRAFm-like" (incluyendo 8 mutantes BRAF), así como 176 muestras "no BRAFm-like". Se volvieron a análisis de agrupamiento en esas 213 muestras (Figura 4A), y encontramos un enriquecimiento muy significativo de muestras "no BRAFm-like" (p & lt; 0,01) en el grupo más grande (grupo 2) y muestras "BRAFm-like" en el el grupo 1 (P & lt; 0,01, Tabla 2). En comparación con el grupo 2, grupo 1 muestra las frecuencias mucho más bajas de eventos de amplificación /deleción, especialmente en q chr13, 14 q, q 18 y 20 q (Figura 4B). Una mirada más cercana revela que el grupo 1 está completamente agotada de CNA en chr20 mientras que el 95% de racimo 2 muestras había amplificado chr20. Estos resultados corroboran con la observación de la expresión relativa más baja de los genes en chr20 BRAFm similar con respecto al resto de las muestras BRAFwt [26].
Tres grupos principales (A). La anotación de la derecha indica, en orden, el BRAFm (en amarillo, mutantes BRAF, en azul, BRAF tipos silvestres), KRASm (mutantes en verde), y BRAFm similar (en verde, BRAFm similar; en rojo, no BRAFm similar). El color púrpura indica los valores que faltan. (B) gráfico de frecuencia de todo el genoma del aumento del número de copias (por encima del eje, azul) y la pérdida de número de copias (por debajo del eje, rojo) a través de tres grupos principales.
Hemos informado anteriormente de que, en líneas celulares CNA en loci no ligados con frecuencia se correlacionan entre sí y probable que tales correlaciones fueron el resultado de la selección [31]. Para evaluar si un fenómeno similar fue evidente en estadio clínico II /III MSS cáncer de colon, se llevó a cabo por pares correlaciones de número de copias de todos los genes ($ ~ $ 22 k) en todo el genoma. Como era de esperar, los genes (en relación) adyacentes están altamente correlacionados (Figura 5A, cerca de diagonal). En un nivel superior se convirtieron en unos brazos cromosómicos no enlazado (por ejemplo chr1p vs 1 q, q 10p vs. 10) o anti-correlacionados (por ejemplo CHR8 p vs 8 q). Además, hubo numerosas correlaciones entre loci no ligados (Figura 5A, fuera de la diagonal), lo que sugiere co-selección de estas regiones genómicas. Por ejemplo, el cromosoma 8 pérdidas de P se correlacionaron con las pérdidas de los cromosomas 17 y 18 p, junto con el aumento del cromosoma 20 q. Cromosoma 13 aumentos se correlacionaron con el cromosoma 14 pérdidas. La distribución de las asociaciones de gen-gen fue significativamente diferente de una asignación al azar de los datos de la CNV (Figura 5B). De manera similar a lo que se encontró en otros entornos de cáncer [31], [34] que había una estructura libre de escala en la que unos pocos genes están altamente correlacionados con muchos otros genes, mientras que la mayoría de los genes correlacionados con sólo unos pocos genes. Esto sugiere que un pequeño número de loci de ADN actúan como centros de conexiones en una estructura jerárquica altamente no aleatoria.
(A) pareja correlaciones calculadas a partir del número de copias del gen están clasificadas por posiciones cromosómicas a través del genoma en los ejes X e Y ejes, con lo que indica una correlación positiva de color rojo y azul que indica una correlación negativa. La diagonal roja representa la correlación de un gen con ella misma. Las porciones superiores derecha e izquierda inferior de la gráfica representan imágenes especulares entre sí que muestran las correlaciones número de copias de loci no ligados. (B) parcelas log /log de correlaciones significativas gen /genes (