Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: La identificación de oncogenes supresores de tumor y de genómica y epigenéticas en cáncer de ovario Características

PLOS ONE: La identificación de oncogenes supresores de tumor y de genómica y epigenéticas en cáncer de ovario Características


Extracto

La identificación de alteraciones genéticas y epigenéticas de células tumorales primarias se ha convertido en un método común para identificar los genes esenciales para el desarrollo y progresión del cáncer. Buscamos identificar aquellas aberraciones genéticas y epigenéticas que tienen el mayor impacto en la función de genes en el tumor. En primer lugar, se realiza un análisis bioinformático de la variación del número de copias (CNV) y la metilación del ADN que cubre el paisaje genético de las células tumorales de cáncer de ovario. Hemos examinado por separado CNV y la metilación del ADN de 42 muestras primarias serosas con cáncer de ovario usando ensayos MOMA-roma y 379 muestras de tumores analizados por Genoma del Cáncer Atlas. Hemos identificado 346 genes con deleciones o amplificaciones significativas entre las muestras tumorales. Utilizando los datos de expresión de genes asociados predecimos 156 genes con alteraciones del número de copias y cambios correlacionados en la expresión. Entre estos genes CCNE1, POP4, UQCRB, PHF20L1 y C19orf2 se identificaron dentro de los dos conjuntos de datos. Estábamos especialmente interesados ​​en la variación del número de copias como base de nuestra propiedad genómica en la predicción de los supresores de tumores y oncogenes en el tumor de ovario alterada. Por lo tanto, identificar los cambios en la metilación del ADN y la expresión de todos los genes amplificados y eliminados. Nos definimos estadísticamente supresor de tumores oncogénicos y las características de estas modalidades, y se realizó un análisis de correlación con la expresión. Predijimos 611 potenciales oncogenes y supresores tumorales candidatos mediante la integración de estos tipos de datos. Los genes con una fuerte correlación de metilación dependientes de los cambios de expresión expuestas a distintas número de copias aberraciones incluyen CDCA8, ATAD2, CDKN2A, Rab25, AURKA, Bop1 y EIF2C3. Proporcionamos la variación del número de copias y el análisis de la metilación del ADN de más de 11.500 genes individuales que cubren el paisaje genético de los tumores de cáncer de ovario. Se demuestra el grado de alteraciones genómicas y epigenéticos de los supresores de tumores y oncogenes conocidos y también utilizamos estas características definidas para identificar potenciales candidatos de genes del cáncer de ovario

Visto:. Wrzeszczynski KO, Varadan V, Byrnes J, E Lum, Kamalakaran S, Levine DA, et al. (2011) La identificación de oncogenes supresores de tumor y de Genómica y epigenética Características del cáncer de ovario. PLoS ONE 6 (12): e28503. doi: 10.1371 /journal.pone.0028503

Editor: Xin Yuan Guan, la Universidad de Hong Kong, China

Recibido: 25 Julio, 2011; Aceptado: 9 de noviembre de 2011; Publicado: December 8, 2011

Derechos de Autor © 2011 Wrzeszczynski et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este trabajo fue apoyado por el Departamento de Defensa W81XWH-05-1-0068, la Fundación Starr (http://www.starrcancer.org) y Philips Research North America. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:. Parte de esta investigación es financiada por Philips Research North America. Vinay Varadan, Sitharthan Kamalakaran y Nevenka Dimitrova son empleados de Philips Research North America. No hay patentes, productos en desarrollo o los productos comercializados para declarar. Esto no altera la adhesión de los autores a todos los PLoS ONE políticas sobre los datos y compartir materiales, como se detalla en línea en la guía para los autores.

Introducción

En los Estados Unidos, habrá más de 22.000 nuevos casos de cáncer de ovario en 2011. de ellos, aproximadamente 14.000 sucumbirán a la enfermedad. Con el fin de tratar mejor a estas mujeres y mejorar la supervivencia, nuestro objetivo es determinar los cambios moleculares que se han producido en los tumores de los pacientes, y para ser capaz de interpretar el significado de estos cambios en el crecimiento y desarrollo del tumor. Este crecimiento aberrante es el resultado de anormalidades cromosómicas y variaciones epigenéticas [1], [2]. Además, las tasas generalmente bajos de mutación somática de nucleótidos en cáncer de ovario en comparación con otros tumores sólidos sugieren un aumento de la importancia del número de copias y las aberraciones epigenéticas. Este tipo de regulación se ha demostrado que afectan a varios supresores de tumor y oncogenes relacionados con el cáncer de ovario [3].

Copiar variaciones en el número (CNV) son una ocurrencia común en todas las formas de cáncer [4], [5] , [6], [7], [8], [9]. Una muestra típica del cáncer exhibe un promedio de 17% y 16% amplificaciones supresiones dentro de un genoma completo. alteraciones del número de copias somática han sido demostrado que afectan significativamente la función de las vías de participación quinasa, la regulación del ciclo celular, las redes de Myc y NF-kB y la apoptosis [4]. La detección de estas alteraciones y la identificación de los genes específicos responsables de la proliferación del cáncer puede ayudar a los cánceres de subtipo molecularmente y conducir hacia terapias específicas más individualizada de tipo cáncer [7], [10], [11], [12], [13], [14], [15], [16], [17], [18], [19], [20].

propiedades epigenéticas del genoma del cáncer se correlacionan con el desarrollo y la función de las células cancerosas [1], [21], [22], [23], [24]. Específicamente, la metilación del ADN en las regiones promotoras de genes puede regular la expresión génica de varios oncogenes y supresores de tumores [25], [26], [27]. Se ha propuesto que la citosina total de ADN 5C-metilación entre células normales y cancerosas parece ser redistribuidos a loci específicos CpG en la célula del cáncer [28], [29]. La pérdida de función o el silenciamiento transcripcional a través de la hipermetilación se ha identificado los genes supresores de tumores, mientras que la hipometilación se ha atribuido a la oncogénesis y la pérdida de propiedades de impronta de ciertos alelos relacionados con el cáncer [1], [30].

supresores de tumores y las características genómicas y epigenéticos de oncogenes son altamente variables dentro de cáncer [3] de ovario. supresores y oncogenes conocidos de tumores no igualmente contribuyen al desarrollo del cáncer. Esperamos identificar esas aberraciones genéticas y epigenéticas que tienen el mayor impacto en la función de genes en el tumor. Muchos de los protocolos actuales de bioinformática emplear solamente análisis modal única para determinar la función de genes de un tipo de tumor particular. Un enfoque todo el genoma de la combinación de múltiples fuentes de datos de aberración genética es necesario para la predicción de las vías posiblemente consistentes y epigenetically integrados que funcionan en la tumorigénesis. Se realizó un amplio análisis de la bioinformática de la variación del número de copias, la expresión y la información epigenética para identificar potenciales supresores de tumores y oncogenes asociados con el cáncer de ovario seroso. El análisis de 42 muestras de cáncer de ovario seroso independientes y aprovechando Genoma del Cáncer Atlas (TCGA; http://tcga.cancer.gov) [31] Los datos para comparar y mejorar nuestro protocolo, identificamos el número de copias de ADN anormal con cambios en la metilación correlacionados y la expresión de los genes del cáncer de ovario seroso. La combinación de análisis de datos epigenético y la expresión posiblemente puede proporcionar información específica de las bases moleculares del cáncer y sus subtipos y elucidar los genes de conducción diversos tumores [28], [32], [33], [34], [35]. De esta manera, con el tiempo permite a los médicos incorporan estos tipos de datos multimodal completo en los análisis diagnósticos basados ​​bioespecıfica tumoral y la terapéutica dirigida vía [36].

Métodos

Las muestras de pacientes (MSKCC) guía de Datos
ADN tumoral de 42 pacientes con estadio avanzado, carcinomas recién diagnosticados, no tratados, de ovario seroso visto en el Memorial Sloan Kettering Cancer Center entre el período mayo 1992 a febrero 2003 se incluyeron en este estudio. Las muestras se recogieron en virtud de los protocolos de investigación aprobados por el IRB del Memorial Sloan-Kettering Cancer Center. El estudio de muestras y análisis de todos los datos de la muestra conforme a las directrices del IRB del Memorial Sloan-Kettering Cancer Center de los pacientes y fue aprobado por el Memorial Sloan-Kettering Cancer Center de la IRB. Los pacientes siempre de forma individual consentimiento informado por escrito para utilizar sus muestras con fines de investigación. Además, se utilizaron 7 muestras de ovario tejidos normales obtenidos de la Red Cooperativa de Tejidos Humanos, un depósito de material de tejido tumoral y dirigido por los Institutos Nacionales de Salud. Nos referimos a esta muestra del paciente y normal establecido como el conjunto de datos MSKCC.

Copia Detección Número través Representativo de oligonucleótidos análisis de microarrays (ROMA)

El protocolo ROMA como se describe anteriormente [11], [15 ], [37] se realizó en una matriz de oligonucleótidos de alta densidad que contiene ~85,000 características fabricados por Nimblegen Systems Inc. en resumen, las representaciones de complejidad reducida [38] que consta de fragmentos pequeños (200 a 1200 pb), generados por la escisión de las muestras de ADN con la endonucleasa de restricción BglII, se amplificaron por el adaptador mediada por PCR de ADN genómico [11]. Las muestras de ADN (2 g) se marcaron ya sea con Cy5-dCTP o Cy3-dCTP usando el kit de etiquetado de Amersham-Pharmacia MegaPrime y se hibridaron de forma competitiva el uno al otro en el mismo portaobjetos [11]. Las hibridaciones consistieron en 35 l de solución de hibridación (37% formamida, 4 x SSC, 0,1% SDS, y el ADN marcado). aplicación Microarry y la hibridación se realizaron como se informó anteriormente [11]. Escanearon en un escáner Axon GenePix 4000B utilizando un tamaño de píxel de 5 micras y todos los datos se importan en S-Plus software de análisis de 2000 (perspicaz, Seattle, WA). Los ratios de registro normalizados de cada experimento se promediaron por la segmentación. A continuación se aplica el algoritmo CBS (Circular Binario Segmentación) a estos datos. El método de segmentación CBS es el algoritmo de segmentación binaria circular como se describe en Olshen, AB. et. Alabama. [39]. Al igual que en el análisis anterior, los segmentos de la CNV se definen como regiones de sonda estadísticamente combinado (marcador) intensidades calculadas por el algoritmo de CBS [39], [40]. Todos los análisis general y las estadísticas se calcularon utilizando S-Plus, R paquetes y scripts individuales Perl /Python. Todos los datos ROMA es compatible con MIAME y se puede encontrar en la base de datos GEO (http://www.ncbi.nlm.nih.gov/geo/) para el número subserie adhesión GSE28013.

Detección de metilación a través Representativo de oligonucleótidos El análisis de microarrays (MOMA)

El protocolo MOMA se llevó a cabo como se describe anteriormente [41], [42]. La matriz de detección de metilación MOMA se ha realizado y validado en líneas celulares y muestras de tumores de cáncer de mama. lugares de la isla CpG genómicos anotados se obtuvieron de la UCSC genoma navegador. En el momento del experimento el genoma contenía 26.219 islas CpG en el intervalo de 200 a 2000 pares de bases. Estos lugares de la isla CpG estaban cubiertos por MspI fragmentación restricción. Las matrices fueron fabricados por Nimblegen Systems Inc. utilizando el formato de 390.000 sondas. La isla CpG anotación del genoma humano construir 33 (hg17) se utilizó para diseñar una matriz de suelo de baldosas 50-mer. La endonucleasa de restricción principal que se utiliza es MspI. Después de que los enlazadores de digestión se ligaron y el material se limpia por fenol cloroformo, se precipitó, se centrifugó y se resuspendió. El material se divide en dos, media ser digerido por la endonucleasa de McrBC según la especificación por New England Biolabs y siendo el otro medio mock digerido. Los procedimientos para la hibridación y el lavado se informó anteriormente [41]. El procedimiento se realizó por duplicado con un tinte de canje para el segundo experimento. Las etiquetas fueron intercambiados entre las muestras tratadas McrBC y simulacros. Para cada sonda, la media geométrica de los cocientes (GeoMeanRatio) de McrBC tratado y muestras de control se calcula entonces por experimento y su tinte de intercambio asociado. Microarray imágenes fueron digitalizadas en GenePix escáner y obtuvieron los datos en el software NimbleScan (Sistemas Nimblegen Inc) 4000B. Los GeoMeanRatios de todas las muestras en un conjunto de datos se normalizaron luego usando un método cuantil normalización [43]. Todos los análisis general y las estadísticas se calcularon utilizando S-Plus, R paquetes y scripts individuales Perl /Python. Todos los datos MOMA es MIAME compatible y se encuentran en la base de datos GEO (http://www.ncbi.nlm.nih.gov/geo/) para el número subserie adhesión Análisis FODA
Expresión Génica GSE27940. De ovario humano las muestras tumorales

datos de expresión génica se realizó utilizando el Affymetrix Genoma humano U133A: GEO identificador de plataforma GPL96. Se aisló el ARN utilizando el protocolo Trizol. ARN se convierte en ADNc y el ADNc de doble cadena se utiliza como plantilla en una reacción de transcripción in vitro que contiene CTP biotinilado y UTP, además de los cuatro trifosfatos de ribonucleósido modificados. Se aplica el protocolo de Affymetrix estándar. intensidades de señal finales se procesan utilizando el método de normalización de RMA en el paquete de affy R Bioconductor 2.5. Todos los datos de la matriz es compatible con MIAME y CEL archivos correspondientes se pueden encontrar en la base de datos GEO (http://www.ncbi.nlm.nih.gov/geo/) para el número subserie adhesión GSE27943.

Cross- Análisis modal del Genoma del cáncer de datos Atlas (datos del TCGA): perfil
Copiar datos de la variación del número de tumores primarios de ovario ha sido descargado de TCGA (http://tcga.cancer.gov/) y CBS [39] a partir de los archivos de datos se analizaron los microarrays Agilent SurePrint G3 humana 1 M CGH (hibridación genómica comparada) con la etiqueta mskcc.org_OV.CGH-1 × 1M_G4447A. La CBS procesa los datos del TCGA fue entonces anotados con la información de ensamblado Navegador hg18 UCSC Genoma para asignar valores seg.mean variación del número de copias de genes por cada muestra. Para el propósito de estudiar CNV por gen hemos limitado nuestros datos para un segmento completo CBS por gen por muestra. Por lo tanto, si un locus del gen está parcialmente cubierto por dos o más segmentos de CBS por muestra que no lo incluimos en nuestro análisis. Sólo en el caso de un locus del gen era completa dentro de una muestra segmento de CBS fue incluido en nuestro análisis. Por otra parte, se excluyó cualquier segmento de la CBS con un valor informativo (num.info) de menos de 4. Además, con el fin de capturar significativa CNV se analizaron muestras solamente en el 90% de los datos que no incluyen el 5% de los datos más cercanos a un seg. significa de 0 de la distribución de valores positivos y negativos. datos de metilación TCGA se obtuvo de los archivos de datos jhu-usc.edu_OV.HumanMethylation27.2.lvl-3 correspondiente para cada tumor y muestra normal. Esto es a partir del ensayo Human27-metilación Illumina Infinium. Un valor beta media final de los genes con 2 o más sondas se calculó por gen por muestra. Por último, los datos de expresión TCGA utilizados para este análisis fue desde el archivo de la expresión génica broad.mit.edu HT_HG-U133A para cada tumor y de ejecución correspondiente muestra normal en la matriz de Affymetrix GeneChip Human Genome U133A HT. Se examinaron 379 muestras de la TCGA que estaban presentes en el momento de nuestro análisis. Antes de la presentación final de nuestro manuscrito El Atlas del Genoma del Cáncer ha hecho público su informe preliminar sobre el carcinoma de ovario [31]. Nuestro uso del conjunto de datos TCGA es mejorar y comparar nuestro protocolo de detección supresor de tumores y oncogen que hemos aplicado al conjunto de datos MOMA-ROMA (MSKCC). Reconocemos ninguna resultados similares que hemos realizado utilizando nuestro protocolo en el conjunto de datos TCGA con la que se encuentra en la reciente publicación TCGA.

Análisis bioinformático de MSKCC número de copias (ROMA), la metilación del ADN (MOMA) y los datos de expresión

Todos los análisis se realizó utilizando Perl, Python, Matlab y R paquetes. Nuestra estrategia fue examinar las características epigenéticas y genómicos para posibles supresores de tumores y oncogenes en tumores primarios de ovario. Con la variación del número de copias siendo operación base examinamos los datos de metilación y de expresión de cada gen en condiciones de número de copias amplificadas o eliminados. Por lo tanto, un oncogén se clasifica como un gen amplificado que tiene una baja metilación y elevada expresión (Figura 1). Este mismo oncogén amplificado puede ser regulada a través de epigenetically hipermetilación en el cáncer de ovario lo que resulta en una disminución de expresión, incluso si el número de copias se amplifica. A la inversa, un supresor de tumor puede haber bajado la variación del número de copias y se hypermethylated que resulta en la disminución de la expresión o regulado a través de la hipometilación lo que permite su expresión en las condiciones de la CNV en posición baja (Figura 1). ROMA fragmentos fueron atribuidos a los genes utilizando el conjunto de Navegador hg17 UCSC Genoma. Se identificaron mediante la comparación de la muestra entre la plataforma y la plataforma TCGA ROMA (de los cuales 7 eran muestras en común) un umbral específico de la plataforma de ROMA & lt; 0,0 seg.mean que captura un porcentaje máximo de los genes suprimidos mientras se mantiene un porcentaje mínimo de falsos positivos de amplificado o genes de copia neutros. Final de asignación de metilación de genes se realizó utilizando el valor máximo de la sonda para cada fragmento MOMA y el valor máximo fragmento MOMA se atribuyó al gen más cercano. Se utilizó la prueba de Wilcoxon signed-rank para calcular los valores de p de enriquecimiento para el método de Benjamini-Hochberg (BH) y los datos de expresión CNV y fue utilizado para el ajuste y el control multitest Tasa de Falso Descubrimiento (FDR). distancias euclidianas se calcularon entre las muestras normales y tumorales de puntos de datos de metilación y de expresión de todos los genes, tanto en los conjuntos de datos MSKCC y TCGA. En el caso del conjunto de datos MSKCC, cuando haya suficiente de datos normal expresión de ejemplo no estaba disponible, a 50 × arranque de muestreo se realizó utilizando los datos de las muestras normales expresión TCGA por gen. variate sola y multivariados Hotelling t-tests se realizaron en estas distancias para calcular todos los valores de p cuando se realiza el análisis de metilación y de expresión a diferentes valores de número de copia, con múltiples ajustes FDR prueba estadística que el anterior. Con el fin de identificar los cambios funcionales y probablemente vía capturados por nuestro análisis génica basada en función de si la prueba de la composición de los genes del MSKCC previstas en cada clase de entidad dentro de un total de 173 KEGG vías biológicas era proporcional a su tamaño. Esto se traduce en la identificación de las vías cuyo gen membresía en cada clase de entidad se desvía significativamente de la hipótesis nula, como se define por una distribución hipergeométrica. Se eligió la lista final de las vías significativas después de controlar la tasa de falso descubrimiento por Benjamini-Hochberg múltiples pruebas de corrección. secuencias de comandos de análisis de datos e información adicional de análisis se pueden encontrar en Análisis S1.

número de copias variación es la característica genómica base para nuestra identificación del supresor de tumores y las propiedades de genes oncogénicos en el cáncer de ovario. Un oncogén puede ser sobreexpresado bajo el número de copia amplificada y baja metilación, mientras que la hipermetilación puede ser utilizado para regular la expresión en un estado gen amplificado. Del mismo modo, la disminución de la expresión de supresor de tumores puede ser el resultado de la pérdida de número de copia parcial con hipermetilación. Los supresores de tumor pueden también, posiblemente, ser regulados a través de hipometilación en un número de copias indicado borrado. Nuestro análisis se modela para tales propiedades y examina en primer lugar la CNV por gen y luego atribuye alteración epigenética para cada aberración número de copias con la expresión génica.

Resultados

tumor ovárico número de copias aberraciones y la metilación del ADN

analizó en primer lugar individualmente tanto la variación del número de copias y la metilación del ADN de cada gen por la posición cromosómica en 42 tumores primarios de ovario seroso proporcionados por el Laboratorio de Investigación de Ginecología en el Memorial Sloan-Kettering Cancer Center (MSKCC conjunto de datos) Representativo de oligonucleótidos usando análisis de microarrays (ROMA) [37], [44] y la metilación de detección de oligonucleótidos análisis de microarrays (MOMA) [41], [42]. Los loci amplificados de punto de interrupción y eliminados cubren un total de 561 regiones entre todas las muestras (Figura 2). ROMA identifica 205 y 356 puntos de interrupción eliminación de amplificación. Los puntos de interrupción se definen como regiones entre cada segmento (intensidad de la sonda estadísticamente combinados) calculados utilizando el método de la CBS ([40], la segmentación binaria circular [39]). Entre las muestras de tumor de 42, nos encontramos con un promedio de 76 segmentos CBS calculados por cromosoma. recuento de segmentación por cromosoma correspondió con tamaño de los cromosomas a excepción de los cromosomas 8, 11, 12, 17, 19, y 20 donde la densidad de segmentación fue mayor que normalizado para tamaño de los cromosomas y menos para los cromosomas 6, 9, 10, 14, 15, 16, y 18. La mayor variabilidad de la variación del número de copias (tal como se mide por valores medios CBS de segmentación) entre todas las muestras se produce en los cromosomas 19, 2, 10 y 4, respectivamente (Figura S1). se observaron en los loci; las supresiones más frecuentes (10% de muestras tumorales) & gt; CHR4: q25-q35.2, CHR7: p22.3-p15.3, CHR8: p23.3-p21.1, chr13q12.11-P34, chr14q32.2-q32.33, chr15q13.3-q21.1, chr16q11.2-q24.3, chr17p13.3-q25.3, chr19: q13.2-q13.43 y chr22: q11.21-q13.33 (Tabla 1 se presenta el porcentaje de todas las muestras borrados dentro de un loci). La mayor frecuencia amplificado (& gt; 10 muestras tumorales%) loci dentro de todos los cromosomas entre los 42 muestras de tumores son; chr1: p34.4-p34.1, chr1: q21.1-q21.2, chr3: q13.2-q23, CHR8: q11.22-q24.3, chr19: q12-q13.12 y chr20: Q13. 12-q13.2 (Tabla 1). Se encontraron tres loci simetría de punto de interrupción (amplificaciones y deleciones en las posiciones genómicas similares en múltiples muestras); Chr17: q11.2-q21.32, chr19: q13.12-q13.2 y Chr21: q21.3-22.13. Comparando los resultados ROMA (Tabla 1) con los datos de número de copias de los individuos normales que se encuentran en el HapMap [45] no muestra ningún solapamiento con las pocas regiones amplificadas se encuentran en el conjunto de datos normal HapMap. Las regiones superpuestas de deleción entre nuestros resultados y los de la CNV HapMap son 8p23 y 22q11.23 donde ambas regiones muestran pérdida de heterocigotos frecuente. A continuación, analizó la metilación del ADN en las islas CpG utilizando los mismos 42 tumores primarios de ovario y 7 muestras de tejido normal (Figura 3). Hemos recopilado los valores de metilación de regiones promotoras de genes que cubren 11,978 22 cromosomas. Cuando se compara directamente con el tejido normal se encontraron un total de 68 genes para ser clasificado como hypermethylated y 19 de un ranking de hypomethylated dentro del 10% de la totalidad de la normal a la distribución de la relación del tumor (Tabla S1). Los genes que muestran los valores de metilación por encima de las muestras normales incluyen el PHOX2B oncogén, el neuroblastoma asociado ALX3 gen, el grupo de genes PCDHα comúnmente metilado, POU4F2, REXO1L1, BAPX1, y el canal de potasio KCNJ8. Específicamente, REXO1L1, (RNA exonucleasa) muestra altos niveles de metilación en muestras tanto tumorales y normales sin embargo, hay un aumento del 56% de metilación en muestras de tumores. Los genes con el tumor más bajo a las relaciones de metilación normales incluyen la variante cromosoma 4 del gen de promoción de DUB3 oncogénico ubiquitina hidrolasa (19% de disminución) y las tapas (oncogén implicado en el cáncer de endometrio, 25% de disminución). Otros genes hipometilados en comparación con las muestras normales incluyen; RNPC3, USP37, LDHD, GJB4 (proteína de unión brecha), LCN8 (implicada en la metástasis) y CGB1 (gonadotropina coriónica, polipéptido beta 1) (Tabla S1).

posiciones del punto de interrupción de la variabilidad del número de copias (eliminaciones representan en azul, amplificaciones representadas en rojo) en 22 cromosomas se muestran como determina a partir de los datos generados ROMA segmentación. La supresión de alteración o amplificación genómica posición inicial se representa a partir de los 42 muestras de cáncer de ovario tumor

El tumor:. Porcentaje de relación normal para MOMA metilación por gen de 42 muestras de tumores de cáncer de ovario y muestras normales de tejido es 7 esbozado por cromosoma. Para cada muestra el valor medio de metilación se calcula a partir del valor máximo MOMA por sonda que incorpora la región promotora del gen. metilación de datos MOMA cubiertos 11.978 regiones promotoras de genes. hipermetilación prominente (rojo) y la hipometilación (verde) los genes se etiquetan y se proporcionan en la Tabla S2.

Las correlaciones de la expresión génica con número de copia variación o metilación del ADN

separado examinado la dependencia de la expresión génica (a través de la matriz de Affymetrix Human Genome U133A, ver Métodos) en la amplificación del número de copias, el número de copias de borrado y la metilación del promotor en los tumores de cáncer de ovario. primero se comparó la distribución de la expresión génica para los genes de la CNV de alta y baja discretos que se encuentran en nuestro conjunto de datos MSKCC y conjunto de datos TCGA. Los dos conjuntos de datos mostraron tendencias similares en la distribución de la expresión de los genes con la variación del número de copia alto y bajo (Figura 4, Figura S2). A medida que el número de copias variación aumenta la eliminación de la amplificación de la expresión génica media también aumenta (Figura 4). Por lo tanto, muestran una correlación entre el aumento de la expresión génica total, con la amplificación del número de copias de genes en los tumores primarios de ovario. Además, se midió la distribución acumulada de la expresión génica para los genes suprimidos y amplificados. La distribución acumulativa es el porcentaje total de genes que se encuentran por debajo de un umbral de expresión dinámica. Si los genes con una baja CNV (suprimido) están más bajo expresaron que los genes con una CNV mayor (amplificado y sobreexpresado) los resultados de la curva de distribución acumulativa en un aumento más pronunciado en los valores de expresión más bajos para los genes suprimido (lo que indica un mayor porcentaje de genes que se encuentran con bajos valores de expresión). A diferencia de la expresión máxima acumulada entre 7-17% se observa para los genes con bajo número de copias en comparación con los genes con alto número de copias (Figura S3). A continuación, se realizó la expresión de la correlación CNV por gen para todas las muestras tumorales, tanto en el conjunto de datos MSKCC y conjunto de datos TCGA. Hemos descubierto 124 genes con expresión CNV positiva a los límites del coeficiente de correlación de Pearson de ≥0.8 en el conjunto de datos TCGA (valores de p & lt; 1,0 x 10
-10, Tabla S2B). La amplificación y la eliminación gama seg.mean para el conjunto de datos MSKCC no es tan grande como se observa en el conjunto de datos TCGA (figuras S1 y S2) y, por tanto, un menor número de genes que son capturados con un peso significativo CNV a las correlaciones de expresión. Sin embargo, somos capaces de identificar 32 genes con Pearson values≥0.6 correlación (valores de p & lt; 4,0 x 10
-5, Mesa S2A) con 18 de los 32 genes identificados también en el conjunto de datos TCGA (Tabla S2A).

a medida que la variación del número de copias del gen aumenta la eliminación de la amplificación de la expresión génica media también aumenta tanto en el MSKCC (línea azul) y TCGA (línea verde) conjuntos de datos.

Mayor gen las diferencias de expresión entre las muestras normales y tumorales no se observan hasta que nos basamos sólo en aquellas muestras que contienen genes con amplificaciones extremas y deleciones (Figura 4). Por lo tanto nuestro enfoque para identificar genes con variación del número de copia alterada correlacionada con la expresión fue examinar los valores de expresión de los genes dentro de los valores seg.mean alto y bajo número de copias y comparar la expresión de esos genes a la de muestras de tejidos normales. En un evento donde hay número de copias aberración en muestras normales se observó este mismo tipo de correlación. Hemos examinado sólo las muestras tumorales ya que la magnitud y el alcance de las alteraciones del número de copias se detecta más significativa a través de nuestro protocolo. Inicialmente se calculó el valor promedio de expresión de cada gen, donde el 20% de las muestras tumorales mostró un valor de CNV por encima de 0,50 seg.mean o por debajo de -0.50 seg.mean y también filtran los genes para los que la expresión normal no estaba dentro de la norma desviación (se utilizaron los umbrales predeterminados TCGA CNV que corresponden a al menos una copia amplificada o y con la capacidad de capturar la mayor cantidad de muestras alteradas por la CNV gen posible suprimido). Este estrictos criterios de 20% de las muestras tumorales TCGA capturados 21 genes (Tabla S3). Estos 21 genes como CCNE1 y GSTT1 representan los más alterados genes de la CNV en las muestras tumorales con expresión diferencial en comparación con muestras normales de tejido en el conjunto de datos TCGA. Sin embargo este enfoque es dependiente en gran medida de los niveles de expresión de genes normales promedio. Para TCGA, en el momento de nuestra información de análisis de expresión sólo estaba disponible para 8 muestras designadas como de costumbre. Por lo tanto, un gen tal como MYC (lo más a menudo sobre expresa en las células tumorales), que tiene un valor de expresión de la muestra media de 8,93 en las ocho muestras TCGA normales (Figura S4) y un valor de la expresión muestra de tumor media de 7,75 (a partir de 339 muestras de tumor) no se observa por este método. Mediante la realización de un análisis específico muestra de tumor no podemos eliminar por completo estas variaciones, pero la esperanza de limitar su magnitud.

A fin de no depender de la pequeña muestra de tejido normal que los valores de expresión, se realizó una prueba de rangos de Wilcoxon sólo en la expresión los valores de un mínimo de 20% de las muestras tumorales en el gen de número de copias umbrales seg.mean muy bajas y altas. En los datos del TCGA tumorales fijados esto produjo un conjunto de 54 genes dentro de un falso descubrimiento tasa de 5% a valores seg.mean de 1,25 y -0,50 para la variación de alto y bajo número de copias, respectivamente (Tabla 2, Tabla S4). El número de genes capturadas depende de la cantidad de segmentación de copia alto valor utilizado como un umbral de filtrado significa (manteniendo al mismo tiempo un conjunto de umbral bajo de copias en -0,50, con lo que, como mínimo, la captura de una pérdida de heterocigosidad por gen [8]; Figura S5). Un total de 1114 genes son capturados (FDR & lt; 0,05) a un umbral más bajo de la CNV 0,8 seg.mean (Figura S5). Con el test de rangos de Wilcoxon encontramos genes tales como MYC, CCNE1, KRAS, NDRG1, MLL4 y MTSS1 cuyos datos establecen la expresión tejido normal específica puede no ser significativamente diferente de todas las muestras tumorales, pero es variable entre muestras número de tumores de bajo y alto número de copias. limitaciones de umbral conservadoras de 20% de inclusión muestra de tumor como resultado la identificación de genes de extrema loci CNV tal como en los cromosomas 1, 8, y 19. De interés, se encontró que el factor de transcripción CEPBG tener buena CNV a la correlación de expresión y también la expresión y la metilación correlación en el conjunto de datos MSKCC. Del mismo modo, la realización de la prueba de rangos de Wilcoxon de muestras tumorales MSKCC en un umbral alto número de copias ≥0.5 y un umbral específico de la plataforma & lt bajo número de copias ROMA; 0.0 (ver Métodos) capturamos 62 genes a una tasa de falso descubrimiento ≤0.05 (Tabla 2 , Tabla S4). Los genes identificados en el conjunto de datos MSKCC eran de loci del genoma similar a los encontrados en el conjunto de datos TCGA. Cinco genes se predijo a partir de ambos conjuntos de datos: CCNE1, POP4, UQCRB, PHF20L1 y C19orf2 (Tabla 2). Hemos integrado los datos de expresión con NVC para determinar los genes que son más propensos a ser candidatos como genes del cáncer de funcionamiento con potencial supresor de tumores oncogénicos y características CNV-expresión. Esto hace que el número de genes en otros estudios más accesible para la validación funcional de los genes afectados por aberraciones genéticas.

también se analizó la dependencia clásica de la metilación del ADN en las regiones promotoras de genes con el de la expresión génica. La metilación de datos exhibe más pobre correlación con la expresión de la variación del número de copias (Figura S6). Se determinó correlaciones de Pearson entre la metilación del ADN y la expresión génica, tanto en los conjuntos de datos de ovario tumor primario MSKCC y TCGA. Pearson valores de correlación & gt; 0,5 (valores de p & lt; 2,0 x 10
-4, bajo la metilación y la alta expresión de alta y baja expresión de metilación) se observan en 86 genes entre los dos conjuntos de datos. En lugar destacado, el gen que codifica la ubiquitina B (UBB) muestra una alta correlación entre la metilación y de expresión en ambos conjuntos de datos y Rab25 un conocido sospechoso de cáncer de ovario también se encuentra en los datos del TCGA establecidos [31], [46] (Tablas S2A y S2B)

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]