Extracto
análisis integradora de múltiples bases de datos genómicas para muestras seleccionadas pueden proporcionar un mejor conocimiento de los datos globales y pueden mejorar nuestro conocimiento del cáncer. El objetivo de este estudio fue determinar la asociación entre la variación del número de copias (CNV) y la expresión de genes en muestras de cáncer colorrectal (CRC) y sus tejidos no cancerosos correspondientes. Sesenta y cuatro pares de muestras de CRC de los mismos pacientes se sometieron a la CNV de perfiles utilizando el ensayo Illumina HumanOmni1-Quad, y la validación se ha realizado mediante el método de amplificación de la sonda ligadura de múltiplex. de perfiles de expresión de todo el genoma se realizó en 15 muestras pareadas del mismo grupo de pacientes que utilizan la matriz ST Affymetrix Human Gene 1.0. Importantes genes obtenidos de los dos resultados de la matriz A continuación, se solapan. Para identificar las vías moleculares, los datos fueron asignadas a la base de datos KEGG. El análisis del genoma entero de la CNV que en comparación tumor primario y el epitelio no canceroso revelaron ganancias en 1638 genes y las pérdidas en 36 genes. ganancias significativas se encuentran sobre todo en el cromosoma 20 en la posición 20q12 con una frecuencia de 45,31% en las muestras tumorales. Los ejemplos de genes que se asociaron en este cytoband fueron
PTPRT
,
EMILIN3
y
CHD6
. Se detectó el mayor número de pérdidas en el cromosoma 8, 8p23.2 posición con 17.19% ocurrencia en todas las muestras tumorales. Entre los genes que se encuentran en este cytoband eran
CSMD1
y
DLC1
. De todo el genoma de perfiles de expresión de genes mostró 709 a ser de hasta reguladas y 699 genes para ser reguladas en el CCR en comparación con las muestras no cancerosas. La integración de estos dos conjuntos de datos identificó 56 genes superpuestos, que se encuentra en los cromosomas 8, 20 y 22 de MLPA confirmado que las muestras de CRC tenían las mayores ganancias en los cromosomas 20 en comparación con las muestras de referencia. Interpretación de los datos de la CNV en el contexto del transcriptoma mediante análisis de integración puede proporcionar un conocimiento más profundo del paisaje genómico de CRC
Visto:. Ali Hassan NZ, Mokhtar NM, Kok Sin t, Mohamed Rose I , SAGAP I, Harun R, et al. (2014) Análisis integrado del número de copias variación y la expresión de genoma completo de perfiles en tejidos de cáncer colorrectal. PLoS ONE 9 (4): e92553. doi: 10.1371 /journal.pone.0092553
Editor: Hassan Ashktorab, Howard University, Estados Unidos de América
Recibido: 4 Julio, 2013; Aceptado: February 24, 2014; Publicado: April 2, 2014
Derechos de Autor © 2014 Ali Hassan et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. El proyecto fue financiado por el Ministerio de Ciencia, Tecnología & amp; Innovación (07-05-MGI-GMB016) y el Centro de Excelencia Institución Superior beca del Ministerio de Educación Superior. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
el cáncer colorrectal es un problema de salud importante, con más de un millón de individuos diagnosticados cada año en todo el mundo [1]. Este tipo de cáncer se encuentra entre los tres primeros de todos los cánceres que conducen a la muerte en todo el mundo [2]. En Malasia, se ubica como el segundo cáncer más común en ambos sexos [3].
Una forma de inestabilidad genética que se observa en al menos el 85% de los casos de CCR esporádicos es la inestabilidad cromosómica (CIN) [4] . La aneuploidía es una consecuencia de la CIN que conduce a la ganancia o pérdida de la totalidad o parte de las regiones cromosómicas [5], y puede causar la complejidad estructural que conduce a la inestabilidad genómica. Una forma común de variantes estructurales debido a CIN se conoce como variaciones del número de copias (CNV), que se define como una ganancia o pérdida de copias de segmentos de ADN que son mayores que 1 kb de longitud en comparación con un genoma de referencia [6]. CNVs puede afectar a la expresión génica y se han asociado con susceptibilidad a la enfermedad. Se ha sugerido que los cambios transcripcionales corresponden a CNVs y alteraciones en la dosis de genes pueden ser correlacionados con los cambios en el nivel de expresión [7].
Miles de sitios de la CNV han documentado el uso de la tecnología de microarrays. Estudios anteriores sobre el cáncer colorrectal han revelado ganancias en el cromosoma 8q, 20q y 13 y las pérdidas en el cromosoma 8p, 17p y 18q [8], [9], [10], [11], [12]. Estas aberraciones conducen a la supresión o amplificación de genes supresores de tumor, oncogenes, o ARN, tales como miRNAs, que resultan en la expresión aberrante de genes que afectan a los procesos biológicos relacionados con el cáncer [13] no codificante, [14].
un gen que tiene un alelo duplicada (un número de copias de 3) tiene un nivel más alto de expresión que la de tipo salvaje [15]. A la inversa, un gen que tiene un alelo suprimido (un número de copias de 1) tendrá un menor nivel de expresión [15]. Integrativa analiza en CRC mostró que los niveles de expresión de ciertos oncogenes y genes supresores de tumores estaban relacionados con CNV [16]. Por ejemplo, la amplificación o ganancia de la
MYC
gen en la posición 8q24 resultados en la sobre expresión de este gen en CRC. Por otra parte, la supresión o la pérdida de la
APC
gen en la posición 5q21 conduce a su expresión desregulada en el CCR [17]. Patrones similares de correlación también se han observado en los cánceres de mama y de pulmón. Aproximadamente el 12% de los cambios en los niveles de expresión génica fueron reportados a estar en concordancia con el número de copias en el cáncer de mama [18], y aproximadamente el 78% de los genes mostró una correlación positiva entre la CNV y el nivel de la expresión génica en un estudio de cáncer de pulmón [19].
El objetivo de este estudio fue obtener una visión de los mecanismos moleculares de la CRC a través de los análisis de la CNV y de todo el genoma de perfiles de expresión de un tumor primario y su correspondiente epitelio del colon no cancerosas. También queríamos identificar la relación entre el perfil de CNV y el transcriptoma en el CCR.
Materiales y Métodos
El reclutamiento de pacientes
El estudio se realizó con la aprobación del comité de ética de la Universidad Kebangsaan Malaysia (UKM 1.5.3.5/244/UMBI-004-2012), y el consentimiento informado por escrito fue tomado de cada uno de los 64 pacientes que se sometieron a cirugía. Ninguno de los pacientes habían recibido quimioterapia o radioterapia antes de la cirugía. Se obtuvieron tumor primario y los tejidos no cancerosos (10 cm de distancia del tumor) inmediatamente después de la cirugía y se congelaron en nitrógeno líquido para su almacenamiento.
ADN genómico y ARN aislamiento
Frozen lotes se realizado en todas las muestras usando un espesor de corte de 5 a 7 micras. Las secciones se montaron en portaobjetos de vidrio y se tiñeron con hematoxilina y eosina (H & amp; E). Los portaobjetos teñidos se evaluaron luego por un anatomopatólogo para confirmar la presencia (& gt; 80% células cancerosas) o ausencia de las células tumorales y sus correspondientes células no cancerosas. ADN fue aislado utilizando el Qiagen DNeasy Blood Kit y tisú de acuerdo con el protocolo del fabricante. ARN total fue extraído a partir de 15 muestras apareadas utilizando el Kit Qiagen QIAmp Mini Plus. La calidad del ADN aislado y el ARN se cuantificó usando un espectrofotómetro NanoDrop ND-1000 (Thermo Fisher Scientific, Waltham, MA), y sólo las muestras con una pureza de 01.08 a 02.01 (A260 /A280) fueron seleccionados. Se evaluó la integridad de las muestras de ADN aisladas en 1.0% geles de agarosa, y se determinó la integridad del ARN aislado usando un Bioanalyzer (Agilent Technologies, CA, EE.UU.). Se seleccionaron muestras con un número de integridad del ARN (RIN) de 6,0 y por encima de perfiles de expresión génica.
CNV y la expresión de genes de perfiles
Los 64 pares de muestras se analizaron utilizando el Illumina HumanOmni1 Quad-Bead chip, que contiene 1.140.419 loci polimorfismo de un solo nucleótido (SNP), basado en el protocolo de ensayo Illumina Infinium II (Illumina, San Diego, CA, EE.UU.). perfiles de expresión génica se realizó en las 15 muestras pareadas utilizando la matriz ST Affymetrix GeneChip Human Gene 1.0, que contiene 36,079 transcripciones con 28.869 genes bien anotado (Affymetrix Inc, Santa Clara, CA, EE.UU.). El ARN se preparó usando el protocolo Aplausos WT-Amp sistema ST antes de que el proceso de hibridación (NuGen Technologies Inc., San Carlos, CA, EE.UU.). Los arrays se tiñeron y se examinaron basan en el GeneChip Total Transcripción protocolo (WT) Sentido Meta Etiquetado de ensayo que estaba planteada por Affymetrix.
Presentación de los datos de microarrays para la base de datos ArrayExpress
La cruda y normalizada microarrays de datos se cargan en la base de datos ArrayExpress: http://www.ebi.ac.uk/arrayexpress. La adhesión es ArrayExpress E-MEXP-3980.
El análisis estadístico de la CNV de perfiles
Los archivos binarios (.
IDAT
) que fueron producidos por el software de exploración de Illumina (Bead Lector de exploración array) se analizaron utilizando la versión Illumina Genoma Estudio Genotipado Módulo 3.2.33 (Illumina, San Diego, CA, EE.UU.) para obtener el genotipo de datos normalizados. El umbral de tasa de llamadas genotipo se estableció en ≥90%, y el informe final del genotipo de datos normalizado se transfirió a un programa de terceros, Partek Genómica Suite versión 6.6 (Partek Inc., St. Louis, MO, EE.UU.), a determinar los perfiles de la CNV.
análisis
Paired CNV se llevó a cabo mediante la comparación de la intensidad de cada señal de hibridación de una muestra de tumor a la de su epitelio no canceroso emparejado. El algoritmo de segmentación genómico se utilizó para detectar las ganancias y pérdidas de la CNV. Se establecieron los siguientes parámetros estrictos para reducir cualquier alteración de falsos positivos: cada segmento debe contener un mínimo de 10 conjuntos de sonda filtrados consecutivos, un umbral de p-valor de 0,001, en comparación con las regiones adyacentes vecinas y un umbral de señal a ruido de 0.5. El valor de corte para la ganancia se fijó en 2.3 anterior, mientras que la pérdida fue establecido a continuación 1.7. CNV fue llamado por las ganancias o pérdidas que se produjeron en al menos el 10% (7 muestras) de las muestras totales. Una lista completa de todas las ganancias y pérdidas de la CNV se incluyen en la Tabla S1. Las localizaciones cromosómicas de los aumentos del número de copias y la fuga de los 22 autosomas se muestran mediante karyograms (Figura 1)
.
Las ganancias se muestran en verde y las pérdidas se muestran en rojo. La longitud de la barra horizontal corresponde al número de muestras que participan en la respectiva cytoband. La mayor parte de las ganancias se encontraron en el brazo largo del cromosoma 20 y las pérdidas se observaron principalmente en el brazo corto del cromosoma 8.
El análisis estadístico de los perfiles de expresión génica
El Affymetrix CEL archivos fueron importados a Partek Genómica suite 6.6 (Partek Inc., St. Louis, MO, EE.UU.) para llevar a cabo el análisis de la expresión génica de perfiles. CEL archivos primas fueron procesadas para la corrección de fondo y la normalización cuantil (escala media), utilizando el método robusto de múltiples matrices de promedio (RMA). Un análisis de componentes principales (PCA) parcela se generó como la etapa de control de calidad (Figura 2A), y el efecto lote se retira como fuente de variación. Un ANOVA de tres vías se realizó en todas las muestras. Estadísticamente se identificaron genes expresados de manera significativa mediante el modelo mixto de análisis de la varianza con una tasa de falso descubrimiento (prueba de Benjamini-Hochberg) ajustado valor de p ≤0.05 y cambio de tapa valores de -2 a 2. La agrupación jerárquica se ha generado para visualizar los patrones de expresión en los datos (Figura 2B). ontología análisis de enriquecimiento de genes se realizó utilizando DAVID (base de datos para anotación, y Visualización Descubrimiento e Integración) herramientas bioinformáticas.
(A) PCA parcela de dispersión de los datos de CRC. Cada punto representa la muestra. Los puntos son coloreadas por el estado del grupo con azul que representa el epitelio no canceroso y el tejido tumoral de color rojo que representa. (B) La agrupación jerárquica de los perfiles de ARNm. Las muestras se indican en el eje horizontal y se agrupan por la barra de color entre el dendograma y el mapa de calor. El azul representa el epitelio no canceroso y el rojo representa el tejido tumoral. En general, hubo una clara separación entre el grupo no canceroso epitelio y tejido tumoral cuando se examina por tanto PCA (Figura 2A) y la agrupación jerárquica (Figura 2B).
Integración de la variación del número de copias y genome- analiza amplia expresión
Los datos de CNV y la expresión de todo el genoma análisis se analizan individualmente. Para identificar los genes que mostraron significativos cambios de la CNV y la expresión génica, que se superponían los dos conjuntos de datos tal como se presenta en el diagrama de Venn (Figura 3A). Las localizaciones cromosómicas de los genes superpuestos entre los dos conjuntos de datos se muestran en un mapa circular (Figura 3B)
.
(A) de Venn-diagrama que representa los genes comunes en CNV y la expresión de genes conjuntos de datos reveló 56 genes superpuestos. (B) un mapa circular que muestra los datos CNV y la expresión génica. Los cromosomas se muestran en el código de color de los más anillo exterior. El segundo anillo muestra la distribución de perfil de expresión génica. (Rojo indica hasta regulados los genes y el verde indica reguladas por los genes). El anillo interior representa cambios CN (rojo denota la ganancia en CN y verde denota la pérdida en CN). El anillo más interno muestra la distribución de los dos conjuntos de datos superpuestos.
Sub-análisis de los datos de la variación del número de copias y la expresión de microarrays de todo el genoma de los 15 casos emparejados
analizó los datos que se obtiene a partir del número de copias y de todo el genoma de perfiles de expresión de las 15 muestras pareadas utilizando Partek Genómica suite 6.6 (Partek Inc., St. Louis, MO, EE.UU.). El algoritmo de segmentación genómico se aplicó con los parámetros que se mencionan en la sección de análisis de número de copias. La hoja de cálculo resultante contenía marcadores individuales que muestran los niveles aberrantes de ADN en cada tumor con respecto a su estado normal emparejado. Los datos de expresión se normalizaron a la línea de base y las relaciones eran log2-transformado antes del análisis. Ambos conjuntos de datos se correlacionaron con el método de correlación lineal de Pearson y que generan un diagrama de dispersión para la visualización de los resultados (Figura 4A y 4B).
Gráficos de dispersión de la expresión génica (eje y) se correlaciona con el número de copias (eje x ) con la expresión diferencial & amp; CN cambio en el CCR para
ARGLU1 gratis (Figura 4A) y
genes
UGGT2 (Figura 4B). Cada punto representa una muestra.
Multiplex Ligadura sonda de amplificación (MLPA)
Para validar la CNV perfiles de resultados, se seleccionó el cromosoma 20 para el ensayo MLPA usando la sonda SALSA MLPA P157 20q mezcle de acuerdo con el protocolo del fabricante (MRC-Holland, Amsterdam, y los Países Bajos). La mezcla de sondas contiene 34 sondas para 26 genes diferentes que se encuentran en 20q. Análisis de fragmentos de los productos de PCR se realizó usando el estándar de tamaño GeneScan-500 LIZ en el Applied Biosystems 3130 DNA Analyzer (Applied Biosystems, Foster City, CA). Se recogieron los datos de fluorescencia durante la separación de fragmentos y se importan al software Coffalyser.Net (MRC-Holland, Amsterdam, y los Países Bajos) para su análisis.
Resultados
Datos demográficos
De los 64 pacientes, 39 (60,94%) eran mujeres y 25 (39,06%) eran varones (Tabla 1). La mayoría eran malayos (48,44%), seguido de China (46,88%) y los indios (4,69%). Sobre la base de los duques de clasificación, 33 pacientes (51,56%) eran de Dukes B, 27 pacientes (42,19%) eran de Dukes C y 4 pacientes (6,25%) fueron de Dukes A. La edad media fue de 56 ± 13.35 años de edad.
Copiar ganancias numéricas se encuentran con frecuencia en el brazo q del cromosoma 20
de los 8722 segmentos genómicos en todas las muestras, hemos reducido nuestro análisis de 2212 de la CNV que las regiones correspondía a los autosomas que mostraron amplificaciones (Tabla S1). Los CNV fueron dispersados a través del cromosoma 1 a 22, con la más alta amplificación que se encuentra en el cromosoma 20, que tenía 388 segmentos que representaban el 17,5% de todas las ganancias. El segundo número más alto de ganancias fue documentado en el cromosoma 7, con 369 segmentos genómicos, seguido por el cromosoma 8, con 338 segmentos genómicos. La longitud más larga para los segmentos de ganancia de la CNV fue entre 8q22.1 8q22.2 y que corresponde a 4.070.488 pb. Un total de 1.638 genes fueron amplificados en todas las muestras y 765 de ellos eran únicos o genes no redundantes. Cytoband 20q12 tuvo la mayor frecuencia de las ganancias que participen al menos 45.31% de las muestras tumorales. Ocho genes fueron identificados en este locus y tres de ellos, es decir,
PTPRT
,
CHD6
y
EMILIN3
, se han descrito anteriormente en el cáncer colorrectal. La Figura 1 muestra la distribución de estos genes en el cromosoma 20, con ganancias que se muestran en verde. Los detalles de las 10 principales genes importantes de acuerdo con la base de datos RefSeq se proporcionan en la Tabla 2.
pérdidas número de copias se encuentra principalmente en el brazo p del cromosoma 8
Una deleción o pérdida del valor de número de copia de menos de 1,7 se observó a lo largo del cromosoma 1 a 22 autosomas, con la mayoría detectado en el cromosoma 8, que tenía 225 CNV afectada segmentos. Se observó que la región específica de las pérdidas en la posición 8p23.3 con el 17,9% ocurrencia en todas las muestras tumorales. Se detectó la segunda más alta frecuencia de las pérdidas en el cromosoma 17, con 213 segmentos genómicos, seguida por el cromosoma 19, con 184 segmentos genómicos. La pérdida más largo de un segmento genómico estaba en 8p23.1 a 8p22, que consistía en 3.093.282 pb. Sólo se identificaron 14 genes únicos o no redundantes (Tabla 3). El análisis de los genes individuales en el cromosoma 8 reveló que sólo 5 de los genes fueron reportados previamente estar relacionados con CRC; estos genes fueron
CSMD1
,
DLC1
,
TUSC3
,
SGCZ
y
LONRF1
. La distribución de las pérdidas, que se muestra en rojo, se puede observar en el diagrama de cariotipo como se muestra en la Figura 1.
Análisis de la expresión de genes de perfiles
El análisis reveló diferencias significativas en la expresión génica entre el tumor primario y las muestras epiteliales no cancerosas. Clasificación por PCA mostró una clara separación de dos grupos distintivos de acuerdo con el tipo de tejido (Figura 2A). Un total de 1408 genes son expresados diferencialmente en al menos dos veces con significación estadística (p & lt; 0,05). Sin embargo, un solo gen está representado por múltiples conjuntos de sonda llamados 'hermanos' sondas en el Affymetrix GeneChip. Por lo tanto, cualquier sonda fija redundantes se filtraron, que dejó 1191 genes únicos para su posterior análisis. De éstos, se encontraron 584 genes para estar regulado, mientras que se encontraron otros 607 genes para ser reguladas. La mayoría de los genes regulados se encontraron en los cromosomas 7 (n = 48, 8,22%), 2 (n = 44, 7,53%) y 12 (n = 42, 7,19%). reguladas por los genes se localizan principalmente en los cromosomas 1 (n = 73, 12%), 2 (n = 44, 7,25%), 3 y 4 (n = 43, 7,08%). Entre los genes regulados fueron
MYC
,
CD44
,
ABC22
,
TIMP1
, y
BIRC5
, mientras que el -regulado por los genes incluidos
FAS
,
KLF4
,
UGTIA1
y
CA2
. Una lista completa de los genes expresados diferencialmente y sus correspondientes factores de cambio en la expresión y los valores de p se proporcionan en la Tabla S2. La agrupación jerárquica se generó y se visualiza a través de un mapa de calor, donde se pueden observar dos patrones de expresión distintivos (Figura 2B). La caracterización funcional de los genes importantes se realizaron mediante análisis de IR, y se comprobó que estaban distribuidos a lo largo de los cinco principales clases, que incluían ciclo celular, la división celular, la segregación cromosómica, nucleósido unión y la unión de ATP (p & lt; 0,05).
Efecto de la CNV sobre la expresión de genes relacionados con el cáncer colorrectal
la integración de los dos conjuntos de datos de perfiles mostró la superposición de 56 genes (Figura 3A y 3B), y una lista completa de estos genes se solapan se presenta en Tabla S3. Se observaron un total de 1.135 genes con los cambios de expresión de genes y solamente 723 genes con los cambios de la CNV, pero no hay cambios en los niveles de transcripción. Integración de la CNV y la expresión génica análisis mostraron una asociación positiva en 48 genes (85,7%) y una asociación negativa en los 8 genes restantes (14,3%) (Tabla 4).
Para entender mejor aún más la función biológica de estos genes, los 56 genes fueron sometidos a la anotación funcional y análisis de clasificación utilizando DAVID v6.7. Nos pareció que los genes que están relacionados con los procesos biológicos y componentes celulares.
Estos genes fueron asignadas más a la base de datos KEGG vía para determinar las interacciones de los oncogenes supresores de tumores candidatos o genes que fueron identificados por la CNV y la expresión formación. El análisis reveló que el ciclo celular era la vía más notablemente enriquecido y
CDC25B
,
PCNA
y
p107 /RBL1
eran la clave, los genes implicados (Figura 5). se encontró
ciclo celular para ser la vía enriquecido más significativo (p & lt; 0,05). Los genes implicados (
CDC25B, PCNA y p107 /RBL1
) se muestra en la caja de color rojo indica los genes para tener una ganancia en CN y el aumento del nivel de expresión.
Correlación de la CNV con el gen expresión de genes relacionados con el cáncer colorrectal en un subconjunto de 15 muestras apareadas
Para determinar la relación entre el número de copias de ADN y la expresión del gen, aplicamos el modelo de la Pearson lineal de correlación (Figura 4A & amp; 4B). Los valores de correlación se encontró entre -0.85 a la 0,89. Utilizando un punto de corte de p & lt; 0,05, 2159 genes mostraron correlaciones significativas entre el número de copias y la expresión génica. Un total de 914 transcripciones de 616 genes mostraron una buena correlación (r & gt; 0,6) entre el número de copias y la expresión génica. Los genes de los cinco primeros correlacionados-eran
ARGLU1
,
UGGT2
,
CES2
,
FUT10
y
PAOX
. Una lista completa de los genes correlacionados con sus valores de correlación de Pearson y P, se puede ver en la Tabla S4.
Validación de perfiles CNV mediante MLPA
Se realizó el ensayo MLPA y dirigido en 26 genes 150 muestras (50 tejidos normales y 100 tumores) para validar los datos del perfil de la CNV. Elegimos sondas que cubrían el brazo q del cromosoma 20 y los resultados se consideraron aceptables si el pico de control estaba comprendido en el intervalo de 0,8 a 1,2. Una deleción se anotó si la dosis media de la prueba a los picos de control interno fue de menos de 0,7, y la duplicación se anotó si la dosis media fue de 1,3 o mayor. Una muestra de referencia normal no mostró alteraciones de número de copias en cualquiera de los genes, y análisis MLPA mostró que el aumento de número de copias se detectó en todas las veintiséis genes probados. La Tabla 5 resume el análisis MLPA con los valores medios de cada gen.
Discusión
Se realizó un análisis integrado el uso de múltiples conjuntos de datos en los tejidos colorrectal para identificar los genes expresados diferencialmente con alteración en segmentos genómicos. Hemos analizado la CNV y de perfiles de expresión génica en el 64 y 15 pares de tejidos CRC emparejadas respectivamente. El uso de tejidos no cancerosos adyacentes del mismo individuo reduce las variaciones que fueron causadas por la heterogeneidad interindividual.
El presente estudio identificó una serie de ganancias y pérdidas genómicas focales en el CCR, que mostró cierta concordancia con los resultados de estudios previos [20], [21], [22]. Análisis individual del conjunto de datos CNV reveló aumentos significativos en el cromosoma 20q que también eran muy coherentes con los estudios anteriores [23], [24]. Se registraron aumentos similares también se han observado en el cáncer de mama y el cáncer gástrico primario [25]. Cytoband 20q12 mostró la mayor frecuencia de las ganancias que se extendió por 39.239.931-41684451 pb con la participación de ocho genes, incluyendo
PTPRT
,
CHD6
,
EMILIN3
,
LPIN3
,
plcg1
,
TOP1
,
ZHX3
y
MAFB
. De los ocho genes,
TOP1
,
plcg1
y
PTPRT
estaban relacionados con CRC.
La topoisomerasa 1 (
TOP1
) es un oncogén que cataliza la anulación de ADN y crea moléculas de una sola hebra, que son necesarios en numerosos procesos biológicos, tales como la replicación del ADN, transcripción y reparación del ADN [26]. Un estudio de
TOP1
utilizando CGH array encontraron aumentos en su número de copias en las muestras de CRC [9]. Un aumento del número de copias de
TOP1
también se detectó en los pacientes en estadio III CRC con un promedio de cuatro copias de genes de cada célula utilizando una fluorescencia
In situ
hibridación (FISH) método [27], [28].
El segundo gen que estaba relacionado con CRC identificado en este estudio fue la fosfolipasa C gamma 1 (
plcg1
), que es una molécula de señalización y es un gen vecino de
TOP1
.
plcg1
se activa en respuesta a la estimulación del factor de crecimiento y está implicado en la regulación de una variedad de funciones celulares como la migración celular, invasión y metástasis [29], [30], [31].
la proteína tirosina fosfatasa receptor-T (
PTPRT
) está situado dentro de la región amplificada de 20q12 entre 39.344.635 a 41.684.451 pares de bases. Es un gen supresor de tumores y se ha demostrado que desempeña un papel integral en la adhesión celular y la señalización intracelular [32]. Ganancia del número de copias que implica la
PTPRT
gen ha sido identificado en un estudio previo sobre el carcinoma de células claras de ovario mediante el uso de CGH array [33]. La ganancia del número de copias de este gen puede ser el resultado del efecto 'gen pasajero', porque no hemos podido detectar cualquier cambio en su expresión génica.
Otros cytobands aumentaría significativamente en el brazo q del cromosoma 20 codificada bien establecida oncogenes que se asociaron con el CRC, y éstos incluyen 20q11.21 (
Bcl2l1
), 20q13.2-20q13.31 (
AURKA
), 20q11.23 (
SRC Hotel & amp;
CTNNBL1
), 20q11.21-20q11.22 (
DNMT3B
) y 20q11.22 (
DYNLRB1
). Estos hallazgos sugieren la implicación importante de múltiples genes candidatos en el brazo largo del cromosoma 20 en el desarrollo y progresión del cáncer. La MLPA parece ser un método fiable y eficaz para evaluar el número de copias de ADN cambia ya que la mayoría de estos genes probados concordancia reveladas con los resultados de microarrays.
pérdidas número de copias se encuentran principalmente en el brazo p del cromosoma 8. La pérdida más alta se encontró en cytoband 8p23.2 4008230-4.027.339 pb. Entre los genes que residen en esta región es la CUB y sushi varios dominios 1 gen (
CSMD1
), que es un gen supresor tumoral que codifica para múltiples dominios complementan proteína reguladora y la adherencia. número de copias pérdida focal de la
CSMD1
gen se ha observado en el CCR [34], el cáncer de mama [35] y el cáncer gástrico [36], y la disminución del nivel de
CSMD1
expresión se informó a se asocia significativamente con el grado alto de tumores y la reducción de la supervivencia global en un estudio de cáncer de mama [37]. Otra región que se observó para exhibir pérdida de número de copias que se identificó en este estudio se cytoband 8p23.1-p22, que incluye una región que cubría 12601480-15694761 pb. Un gen que se encuentra dentro de esta región es la Suprimido en cáncer de hígado 1 (
DLC1
), el cual fue reportado como un gen supresor de tumores y se ha demostrado que someterse a la pérdida de número de copias en varios tipos de cáncer, tales como hepatocelular el carcinoma de mama y el cáncer [38], [39].
hicimos un sub-análisis de 15 muestras apareadas de CRC para evaluar la relación entre los cambios de número de copias y la expresión génica. Los genes que participan en el CCR, como
MYC gratis (v-myc mielocitomatosis aviar viral homólogo de oncogén) [40]
CCNB1 gratis (ciclina B1) [41] y
Plk1 gratis ( Polo-quinasa 1) [42], fueron reguladas y concordantemente amplificado en el número de copias en nuestro estudio. Se encontraron siete genes que se redujeron reguladas con la pérdida del número de copias, pero sólo dos genes,
MUC17 gratis (mucina 7) [43] y
CES gratis (carboxilesterasa 2) [44] han sido demostrado estar relacionada con CRC.
análisis
integrado utilizando un diagrama de Venn mostró que 85,7% de los genes tenía una asociación positiva. Cuando se mapea a la vía KEGG, el ciclo celular se identificó como la vía más enriquecido significativamente (p & lt; 0,05). El ciclo celular es un regulador crítico de la proliferación celular, y el crecimiento y la división celular después de daños en el ADN. La vía del ciclo celular está impulsado principalmente por la familia quinasa dependiente de ciclina (CDK) y sus subunidades reguladoras, las ciclinas. El ciclo celular tiene cuatro fases y los dos puestos de control principales en el G1-S y G2-M transiciones de mantener el orden correcto de los acontecimientos [45]. La pérdida de control del ciclo celular puesto de control promueve la inestabilidad genética, lo que conduce a la proliferación celular incontrolada y podría promover el desarrollo del cáncer [46].
ciclo de división celular 25B (
CDC25B
) es un miembro de la familia fosfatasa ciclo de división celular (CDC) que funciona como activadores de las CDK y complejos de ciclina para regular la progresión del ciclo celular [47].
CDC25B
es responsable de la desfosforilación y la activación inicial de la CDK, iniciando así la secuencia de eventos que conduce a la entrada en mitosis [48], [49]. La sobreexpresión de la
CDC25B
se ha observado en el 43% de los pacientes con CCR y se correlaciona con mal pronóstico [50]. Aumento de
CDC25B
nivel es suficiente para poner en peligro los puestos de control de daño en el ADN, que a su vez, aumenta la mutagénesis espontánea e interfiere con la entrada en la mitosis [51], [52], [53].
antígeno nuclear de proliferación celular (
PCNA
) se informó a ser esencial para la replicación del ADN, la reparación del ADN y la regulación del ciclo celular [54]. Retinoblastoma tipo 1 (
p107 /RBL1
) es un miembro de la familia del gen del retinoblastoma (RB), y los genes de esta familia han sido identificados como supresores de tumores. RBL1 y otras proteínas RB cooperan para regular la progresión del ciclo celular a través de la fase G1 del ciclo celular [55]. Sin embargo, el mecanismo de PCNA y la participación RBL1 en la vía del ciclo celular de CRC es todavía poco clara y requiere una mayor exploración.
También tenemos genes que se encuentran con las asociaciones negativas entre el número de copias y la expresión de genes niveles. Los genes incluyen
BCAS1
,
EDN3
,
FABP4
,
MATN2
,
SDCBP2
,
SPTLC3
,
TRPA1
y
WFDC2
. Esta paradoja de una relación negativa entre el estado número de copias y la expresión de genes también se ha observado en un estudio previo sobre la CRC [56] y podría atribuirse a los múltiples mecanismos que son responsables del control normal y anormal de la expresión génica, incluidos los relacionados con mutación, la metilación del promotor y los genes miARN expresión [57]. Para entender este fenómeno, un método que utiliza la tecnología de secuenciación profunda, probablemente, lo más probable es dar una respuesta a estos hallazgos inesperados.
En conclusión, mediante la integración de los conjuntos de datos de dos estudios de perfiles diferentes, hemos logrado identificar 56 genes superpuestos con los cambios en el número de copias y la expresión génica. El ciclo celular fue identificada como la vía de señalización clave de este análisis integrado. Sin embargo, son necesarios para determinar el impacto de estos genes en el resultado de la enfermedad estudios futuros.
Apoyo a la Información sobre Table S1. .
La información completa sobre el perfil de copia variación del número de 64 pacientes con cáncer colorrectal
doi: 10.1371 /journal.pone.0092553.s001 gratis (XLSX)
Tabla S2. .
La información completa sobre el perfil de expresión génica de 15 pacientes con cáncer colorrectal
doi: 10.1371 /journal.pone.0092553.s002 gratis (XLSX) sobre Table S3.