Extracto
El análisis integrado de los cambios genómicos y transcriptomic nivel mantiene la promesa de una mejor comprensión de la biología del cáncer colorrectal (CRC). Hay una necesidad pertinente para explicar el efecto funcional de los cambios de nivel del genoma mediante la integración de la información en el nivel de transcripción. El uso de alta gama citogenética resolución, tuvimos genes controlador anterior identificados por 'Identificación de los objetivos de Genómica significativo del cáncer (logís-)' análisis de muestras de tumores normales apareados de pacientes con cáncer colorrectal. En este estudio, analizamos estos genes conductor en tres niveles a partir de datos exón matriz - gen, exones y de red. El análisis a nivel de genes reveló un pequeño subconjunto de experimentar la expresión diferencial. Estos resultados fueron reforzadas mediante la realización de análisis de expresión diferencial por separado (SAM y LIMMA). ATP8B1 se encontró que era el nuevo gen asociado con CRC que muestra los cambios en los niveles de citogenética, de genes y el exón. Se encontró índice de empalme de 29 exones que corresponden a 13 genes para ser alterado de manera significativa en las muestras tumorales. genes conductor se utilizaron para construir redes reguladoras para grupos tumorales y normales. Había reordenamientos en genes factor de transcripción que sugieren la presencia de la conmutación de regulación. Se encontró que el patrón regulador del gen AHR a tener la alteración más significativa. Nuestros resultados se integran los datos con el foco en los genes conductor en caso de nuevas moléculas altamente enriquecidos que necesitan más estudios para establecer su papel en la CRC
Visto:. Aziz MA, Periyasamy S, Al Yousef Z, AlAbdulkarim I, M Al Otaibi , Alfahed A, et al. (2014) integrado exón nivel Análisis Expresión de genes conductor explicar su papel en el cáncer colorrectal. PLoS ONE 9 (10): e110134. doi: 10.1371 /journal.pone.0110134
Editor: Osman El-Maarri, Universidad de Bonn, Instituto de Hematología Experimental y Medicina de Transfusión, Alemania |
Recibido: 20 Febrero, 2014; Aceptado: September 16, 2014; Publicado: 21 Octubre 2014
Derechos de Autor © 2014 Aziz et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este estudio fue financiado por el rey Abdullah Centro Internacional de investigación médica a través de una beca de investigación RC10 /083 otorgado a MAA. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
Hay una gran cantidad de información a nivel ómicas que asocia la citogenética y cambios de expresión génica que conduce al cáncer colorrectal (CCR). La integración de los datos de número de copias (CN) la expresión génica y la identificación de las alteraciones del ADN NC que inducen cambios en los niveles de expresión de los genes asociados es una tarea común en estudios de cáncer [1] - [3]. El dogma central de la biología molecular, por lo tanto se ha abordado en dos niveles importantes. Ha habido muchos informes que proporcionan evidencia de cambios a nivel del genoma en forma de número de copia aberración [4], polimorfismos de nucleótido único, pérdida de heterocigosidad que intento de comprender los eventos moleculares asociados con el cáncer colorrectal. Estos cambios somáticos o hereditarias tienen diferentes mecanismos de contribuir a la iniciación y progresión de la CRC. La pérdida y ganancia de regiones cromosómicas cruciales que conducen a la supresión o la amplificación de los genes relacionados con el cáncer ha sido muy bien establecido. La importancia funcional de estos eventos moleculares se ha medido utilizando diferentes herramientas y algoritmos. Los genes dirigidos por alteraciones del número de copias somáticas (scnas), en particular, desempeñan un papel central en la terapia de la oncogénesis y el cáncer [5]. Varias herramientas han sido puestos a disposición para evaluar el potencial de los genes que quedan afectados por scnas en la causa del cáncer colorrectal. "La identificación genómica de Blancos significativo del cáncer" herramienta (logís-) se ha utilizado con éxito en la identificación de 'scnas conductor en base a la frecuencia y amplitud de los fenómenos observados [6], [7]. El segundo aspecto de cambios que ocurren en las células tumorales es a nivel de la transcripción. análisis de expresión diferencial se ha llevado a cabo para averiguar los genes importantes que juegan un papel en la causa del cáncer colorrectal. Podría haber varios mecanismos por los cuales los genes afectados SCNA ejercen su efecto a nivel funcional. Las amplificaciones y deleciones en la región genómica que se reflejan en los niveles de transcripción y podría ser detectado mediante la realización de estudios basados microarrays de expresión. Mediante el empleo de arrays de exones, ganamos dimensión extra de los eventos que ocurren en el nivel de exón, que pueden conducir a corte y empalme alternativo que resulta en diferentes isoformas de genes. splicing alternativo es un paso crucial en la generación de la diversidad de proteínas y su regulación deficiente se observa en muchos tipos de cáncer humano [8].
La búsqueda para explorar la relación entre los cambios de número de copias y el nivel de expresión de los genes afectados /exones ha recibido un éxito limitado debido a una serie de razones [9]. Las mejoras tecnológicas en la gama de diseño de la citogenética, así como la transcriptómica han mejorado la exactitud y precisión de los datos generados. Combinando esto con mejores técnicas y algoritmos de análisis, las posibilidades de encontrar genes diana responsables de causar el cáncer colorrectal ha aumentado aún más.
últimas décadas han visto una búsqueda para encontrar nuevos genes que pueden servir como dianas terapéuticas o biomarcadores. Sin embargo, los genes o proteínas no funcionan solos sino que interactúan entre sí para formar redes o vías con el fin de llevar a cabo las funciones biológicas [10]. enfoques basados en la red a la búsqueda de biomarcadores representan más de cerca
in vivo
biología molecular, donde una perturbación en un gen puede afectar a muchos genes abajo. Cáncer de este modo se ha abordado con razón como una enfermedad biología de sistemas [11] a diferencia de las enfermedades causadas por los cambios en unos pocos genes o mutaciones. La reconstrucción de las redes de regulación de genes en los tejidos sanos y enfermos, por tanto, es fundamental para la comprensión de los fenotipos de cáncer y la elaboración de productos terapéuticos eficaces [12].
Con la disponibilidad de herramientas y técnicas para capturar los cambios moleculares que ocurren en diferentes etapas del dogma central con una mayor precisión y exactitud, sin embargo, hemos de desarrollar una visión global integrada que nos podría ayudar en la búsqueda de mejores objetivos para el cáncer colorrectal. En el presente estudio, nuestro objetivo es integrar la información a partir del análisis citogenético con los datos de expresión exón nivel utilizando muestras de tumores normales apareados de pacientes con cáncer colorrectal. Un conjunto de genes conductor sugeridas por el análisis logís- (denominado como "genes de conducir a partir de ahora en adelante) se les preguntó en el gen, el exón y el nivel de red. Tanto el ADN y ARN para la citogenética y estudios transcriptomic, respectivamente, se extrajeron del mismo tejido en un único flujo de trabajo para minimizar la variación. Este estudio proporciona evidencia para explicar diferentes mecanismos posibles por los cuales los genes SCNA conductor afectado puede ejercer su efecto funcional. Un subconjunto de genes conductor se encontraron para mostrar cambios en el nivel de genes en la expresión. La mayoría de estos genes también indicó los cambios de nivel de exón que resulta en la formación de diferentes isoformas. La red de genes logís- mostró un claro cambio en la regulación de factores de transcripción (TF). Se encontró que el gen ATP8B1 tener novedosa asociación con el cáncer colorrectal en citogenética, de genes y el exón nivel.
Materiales y Métodos
El estudio ha sido aprobado por el comité de ética e Institucional Review Board (IRB) de rey Abdullah Centro de Investigación Internacional médica tras el debido proceso de revisión de los aspectos éticos de la propuesta. Los formularios de consentimiento de procedimiento y éticos necesarios fueron firmados por cada paciente antes de la recogida de muestras.
Recogida de muestras y la extracción de RNA
La toma de muestras se realizó como se describe anteriormente [13]. El tipo y la etapa de todas las muestras de los pacientes se presentan en la Tabla S1. El estudio fue aprobado por el comité de revisión institucional después del debido proceso. Los pacientes fueron consintieron y los registros mantenidos de una manera aprobada. ARN fue extraído de la misma pieza de tejido que se utiliza para extraer el ADN para los estudios citogenéticos en un único flujo de trabajo. Maceherey Nagel kit trío prep (Alemania) se utilizó para extraer ADN y ARN en el mismo protocolo. Calidad y cantidad se comprobó utilizando Nanodrop (Thermo Fisher Scientific, EE.UU.).
Exon microarrays
GeneChip Human exón 1,0 ST arrays junto con WT Terminal etiquetado y controles del kit e hibridación, lavado, y las manchas Kit se obtuvieron de Affymetrix EE.UU.. Expresión Kit Ambion WT se obtuvo por Ambion, EE.UU.. Se procesaron 31 del tumor y 29 muestras normales de 32 pacientes. Los datos se extrajeron mediante la expresión software de la Consola de Affymetrix, EE.UU.. El control de calidad se llevó a cabo usando el Análisis de Componentes Principales (PCA) y la suite de biomarcador Integromics (TIBCO Spotfire). Todos los datos se deposita en la base de datos GEO con un número de acceso GSE50421.
Análisis de Datos
Antes de realizar cualquier análisis /exón del gen, se llevó a cabo análisis de componentes principales (PCA) para identificar los valores atípicos. Los datos de 4 muestras normales y 7 muestras de tumor se retiró posteriormente.
Análisis
Los datos relacionados específicamente con los genes controladores
de análisis
nivel de genes.
Para comprobar los niveles de expresión de genes lista 144 controlador generada por análisis logís- (13), se emplearon dos programas diferentes - consola Expresión y AltAnalyze [14]. Dos programas diferentes se utilizaron para confirmar nuestros resultados usando métodos independientes. estimaciones de señal se obtuvieron a partir de los archivos de la CDA de 60 muestras (29 normales y tumorales 31) utilizando Robust Multi-Array media (RMA) para la normalización de los datos. Los conjuntos de la sonda de nivel de núcleo exón se utilizaron para resumir los niveles de expresión génica.
Se utilizó la misma lista de 144 genes de controladores con valores de expresión calculados usando 'Altanalyze' basado en (GENIE3) análisis de vías /red de inferencia.
análisis de la expresión nivel de exón.
se usó el programa para evaluar Altanalyze splicing alternativo en los genes del conductor. Los datos en bruto se filtró para retirar la sonda fija que fueron considerados como no expresado. Un puntaje de corte y empalme de exones filtrados se calculó utilizando el método de índice de empalme y anotación exón /intrón /empalme fueron asignados a estos resultados. Un índice de empalme p-valor de corte de & lt; 0,05 se utiliza para filtrar los resultados de exones alternativos. AltExonViewer - un componente de Altanalyze y DomainGraph - un plugin de Cytoscape se utiliza para visualizar los valores del índice de empalme y los exones empalmados alternativamente. El valor del índice de empalme (SI) se calculó como se describe en [15]. En pocas palabras, la IS es log
2 ratio de intensidades normalizadas de muestras tumorales y normales. En nuestro análisis "muestra 1 'en el numerador era normal y" muestra 2 "en el denominador fue de tumor.
análisis de la red causal.
Para los enfoques basados en el análisis de redes, conocimiento e inferencia se utilizaron . Para los enfoques basados en inferencia, GENIE3 [16], [17] se utilizó para generar redes reguladoras de genes de muestras tumorales y normales. Para generar la red, genes conductor fueron clasificados como genes TF y genes diana. Aunque las interacciones 1000 se infiere de cada uno de los grupos, una interacción score & gt; 0,1 fue elegido como valor de corte. Con esta información las redes de regulación se infiere de forma independiente para las muestras tumorales y normales utilizando Cytoscape.
Análisis de datos con toda probeset
Integromics descubrimiento de biomarcadores Suite.
Con el fin de encontrar diferencialmente los genes expresados en nuestra base de datos, sin ningún prejuicio previo, los datos de CEL archivos fueron analizados utilizando el software Integromics (TIBCO Spotfire, EE.UU.) de tuberías de Affymetrix exón 1,0 ST arrays. cuantil normalización se llevó a cabo después de la eliminación de los valores atípicos con ACP. Tanto el análisis de la importancia microarrays (SAM) y Modelos lineales para datos de microarrays (LIMMA) Los análisis se llevó a cabo con un valor de corte de 0,01 para p-valor ajustado y doble cambio de & gt; 1 o & lt; -1. Dos metodologías diferentes pero complementarios fueron utilizados para hacer los resultados más seguros. enriquecimiento de ontología de genes se llevó a cabo en una lista de 760 genes expresados diferencialmente obtenidos del análisis de LIMMA.
Análisis vía Ingenio.
Lista de los 760 genes de análisis SAM /LIMMA hecho usando Integromics se utilizó para realice 'core' y 'biomarcador' análisis. análisis de núcleos se realizó como se describe antes [13]. Para el análisis de biomarcadores se utilizaron los siguientes filtros: Considerar sólo las moléculas donde (especies = humano) y (líneas tejidos /células = KM-12 o HCT-116 O RKO o cáncer de colon líneas celulares no especifique lo contrario o COLO205 O HT29 O HCC-2998 O HCT-15 o SW-480 u otra célula del cáncer de colon líneas o tejidos y células primarias no especificados en otra categoría o SW-620) y (enfermedades = cáncer) y ((aplicaciones de biomarcadores = Todas las aplicaciones de biomarcadores) y (enfermedades de biomarcadores = cáncer de colon o El carcinoma de colon o de neoplasia de colon o adenoma colorrectal o cáncer colorrectal o carcinoma colorrectal))
resultados
La estrategia de análisis que conduce a resultados siguientes se ilustra en la Figura 1a & amp;.. b
a) El análisis de la totalidad se clasifica en cuatro patas etapas, desde la 'generación de datos' a 'Los análisis de red'. B) Estrategia de análisis utilizando diferentes programas se muestra en este diagrama. Hay tres componentes del análisis - Gene, Exon y Red manejados por diferentes programas. Los análisis a nivel de genes se llevan a cabo utilizando 'Affymetrix, Expresión /transcriptoma análisis consola' y 'Tibco Spotfire'. El análisis a nivel exón se lleva a cabo por 'AltAnalyze' y 'herramientas eléctricas Affymetrix. Los análisis de la red empleada 'GENIE3 "," IPA "y" Cytoscape'. 'Número Nexus Copiar' es un programa usado en estudios anteriores para generar finalmente una lista de 144 genes conductor.
Un pequeño subconjunto de los genes identificados por logís- muestran un cambio significativo en el nivel de expresión.
Se estudiaron los patrones de expresión de genes de controladores a nivel de genes utilizando AltAnalyze y expresión de la consola softwares. Estos análisis arrojaron resultados gratuitos y dio una lista de 20 genes que se encontró que tenían un factor de cambio significativo de mayor que 2 y un valor de p & lt; 0,01 [Tabla 1]. 9 genes experimentaron una regulación a la baja. BCAS1 con puntuación más alta logís- de 5.323 fue uno de los genes más regulación a la baja de manera significativa. 11 genes mostraron una regulación al alza de IL6 y INHBA muestra el mayor cambio veces [Figura 2 bis (AltAnalyze), 2b (Expresión consola)]. Doblar los valores de cambio de los 144 genes controladores están dados en la Tabla S2
.
dos algoritmos diferentes se utilizaron para medir los valores de expresión de datos de la matriz Exon para apoyar los resultados. AltAnalyze (1a) y Expresión de la consola (1b) muestran resultados gratuitos con cambios máximos observados en los genes BCAS1, INHBA, IL6 y MUC4.
Tres genes regulados significativamente hacia abajo (BCAS1, ABP1 y AGR3 ) se encontraron en regiones amplificadas del genoma mientras que HTRA1 upregulated se encuentra principalmente en las regiones de pérdida. Estos genes experimentaron un cambio en su factor de transcripción en muestras tumorales y normales [Tabla 2].
análisis de la expresión diferencial utilizando datos de muestras relacionadas con el tumor normales de exón arrays de 32 pacientes se llevó a cabo. Después de la eliminación de valores atípicos con ACP [Figura 3], se encontraron 25 muestras normales y tumorales 24 adecuado para análisis adicionales. Empleamos no paramétrico (SAM) y métodos (LIMMA) paramétricas y encontramos resultados gratuitos. 6242 genes fueron expresados diferencialmente con ajustado p-valor de & lt; 0,01. Se encontraron 760 genes ser regulados diferencialmente (doble cambio & gt; 1 o & lt; -1) de los cuales 15 genes eran comunes con los genes de controladores de análisis logís- [Figura 4a-c y la Figura S1]. BCAS1, AURKA, ATP8B1, IL6 y INHBA eran los genes regulados diferencialmente se encuentran para estar entre los mejores goleadores en la lista de genes conductor.
60 muestras procedentes de 32 pacientes fueron sometidos a PCA y se eliminaron los valores atípicos. 4 muestras normales y tumorales 7 se eliminaron del análisis final.
(a) Diagrama de Venn de los genes comunes entre logís-, SAM y LIMMA análisis. Todos los genes fueron anotados y se compararon con IPA 'comparar' función. 43 genes de los análisis Integromics no fueron asignadas por IPA.15 genes son comunes entre los tres análisis. (B) agrupadas veces el cambio gráfico de barras del análisis LIMMA. Total de 6242 genes fueron haber ajustado el valor p & lt; 0,01 de los cuales 759 mostraron veces el cambio significativo (& lt; -1 o & gt; 1). (C) diagrama que muestra Volcán genes altamente significativas (rosa = downregulated, naranja = regulada al alza) en términos de valor-p y doble cambio.
Los cambios significativos en la expresión de la isoforma es exhibida por los genes identificados por el análisis logís- .
análisis exón nivel de 144 genes conductor se llevó a cabo. 29 exones que pertenecen a 13 genes mostraron tener cambios significativos en la expresión de la isoforma como se refleja en sus puntuaciones del índice de empalme [Tabla 3]. Mientras que los exones E25-1 de MUC4 y E3-2 de PTP4A3 mostraron altos valores negativos del SI, los exones E2-2 de IL6 y E21-2 de ADAM12 mostraron altos valores positivos del SI. Los valores negativos indican los exones del SI se enriquecen en muestras tumorales y se omiten o reprimida en muestras normales y viceversa para los valores positivos del SI. Por gen MUC4, exones E25-1, E2-2, E2-1, I4-6 y I3-6 registraron valores negativos del SI y el exón E8-1 registraron un valor positivo si. Los exones E2-2 y E4-3 de IL6 registraron valores positivos del SI. [Figura 5 ai-II & amp; bi-II y la figura S2]. Exones en MYLK y ANK3 mostraron cambios significativos en el patrón de empalme, pero no mostraron un cambio significativo en el valor de veces la expresión génica. Se observó detección de microarrays de empalme alternativo (Midas) Rango de valor de p de 0,01 a 0,04 en los resultados filtrados.
expresión Exon (i) y el empalme de índice (ii) los valores fueron asignadas para ambas muestras tumorales y normales para veintinueve exones que afectan a trece genes. Exon 25-1 del gen MUC4 (a) muestra el valor más alto índice de empalme negativo (a ii) valor más alto mientras que el exón 2-2 de IL6 (b) mostraron de 2,44 (b ii). de expresión y de índice de empalme exón valores para el descanso 27 exones se proporcionan como figura complementaria 1.
pantallas de análisis de red causal interruptor de factores de transcripción en las muestras tumorales.
análisis
red causal pantallas cambian en los factores de transcripción en las muestras tumorales. La influencia más significativa de genes TF en muestras tumorales y normales se refleja en la alteración en el número de bordes dirigidos [Tabla 4]. CHAF1A, AHR, PRPF4B, ZNF200, SMAD2, RUVBL1, SMAD4, TSHZ1, CTCFL y CEBPE estaban entre los principales factores de influencia. La jerarquía normativa entre estos grupos ha cambiado con respecto a TFS. Mientras RUVBL1 transforma en un regulador maestro en los tumores, TSHZ1 ha perdido su capacidad para dominar regular otros genes en los tumores [Figura 6a]. reordenamiento significativo en la modularidad también se observa entre estos dos grupos. Más genes diana funcionan como módulos en los tumores como se observa en los módulos regulados por AHR, CHAF1A y PRPF4B. Además, existe diafonía de regulación significativa entre los genes en el grupo normal [Figura 6b]. Mientras que los tumores han perdido las propiedades libres de escala en su interacción regulatoria, grupo normal exhiben grado distribuciones aproximadas a cabo libres de escala, lo que significa el potencial de TF para regular la cantidad de genes diana. Los tumores no muestran este tipo de regulación que indican el modo de regulación de avance de alimentación unidireccional.
Una topología de red jerárquica se utiliza para visualizar el grado de interacción entre los genes de los factores de transcripción y genes diana. (A) La red inferida para el grupo del tumor mostrando RUVBL1 como regulador maestro. (B) La red inferida para el grupo normal con regulador maestro TSHZ1as.
Análisis funcional de genes expresados diferencialmente confirma su papel en el cáncer colorrectal y revelar vías y biomarcadores importantes.
división celular ontología de genes de enriquecimiento de 760 genes expresados diferencialmente obtenidos a partir de SAM /LIMMA análisis mostró, la mitosis y la adhesión celular a ser los procesos biológicos más significativos afectados [Figura S3]. análisis de la vía ingenio de los 760 genes mostraron el cáncer y las enfermedades gastrointestinales entre las principales funciones seguido por el crecimiento movimiento celular y la proliferación [Figura 7]. NF-kB de señalización, el ciclo celular G
2 /daños regulación puesto de control de ADN M, la metástasis del cáncer colorrectal se encontraban entre las vías con mayor puntuación, seguido de adherencia agranulocyte [Figura 7b]. TGFB1 fue uno de los principales reguladores de aguas arriba. El análisis de redes sugiere MYC, MMP y los genes IL6 como nodos importantes [Figura 7c-e]. revela el análisis de biomarcadores 28 moléculas relevantes para el cáncer colorrectal [Tabla 5]. INHBA, CLDN7 y MUC4 fueron elegibles como biomarcadores y son comunes con logís-, SAM y LIMMA análisis de resultados.
Análisis Core utilizando IPA se llevó a cabo usando conjunto de 760 genes que son expresados diferencialmente en las muestras tumorales. funciones biológicas importantes (a) vías (B) y redes (CE) fueron reveladas por este análisis.
Discusión
En este trabajo se intenta comprender el nivel de transcripción cambios en los genes afectados por el conductor scnas en el cáncer colorrectal. Nos preguntó estos genes desde tres perspectivas utilizando herramientas de análisis a nivel de genes /exón /red. Nuestro análisis integrado a nivel genómico /transcriptómica dio lugar a la búsqueda de genes de alta prioridad que pueden ser estudiados experimentalmente para establecer su papel en el cáncer colorrectal. importancia funcional de los genes expresados diferencialmente confirmó los resultados de nuestros análisis.
Debido a la falta de disponibilidad de matrices de alta resolución citogenéticas gran tamaño de regiones cromosómicas fueron implicados en la causa del cáncer colorrectal a través de cambios de número de copias. Las matrices de genotipificación de SNP comerciales se centran en las variantes que están presentes en el 5% o más de la población y cuentan con un número limitado de sondas de la CNV. Por lo tanto, las variantes estructurales microscópicos sub están mal capturadas por las matrices disponibles genotipado de SNP que fueron diseñados para evaluar los SNPs. La reciente introducción de la matriz de Affymetrix CytoScan HD (array apuntado-CNV), que se basa en la matriz de validación de genoma completo SNP Humano 6.0 y contiene más de 2,6 millones de marcadores de número de copias variantes y aproximadamente 750.000 SNPs, ha permitido la detección de copiar aberraciones numéricas con alta resolución en todo el genoma [18]. Los datos de esta plataforma se utilizó para obtener la lista de genes conductor lo cual pude ser considerados para ser más preciso y exacto. Anteriormente, los resultados de diferentes grupos a menudo conducen a un alto nivel de discordancia con un solapamiento de & lt; 5% en algunos casos. logís- análisis fue capaz de abordar esta cuestión y diferenciar entre las mutaciones de pasajeros y del conductor con un alto nivel de precisión y exactitud [6]. La correlación entre la expresión y los datos CN es muy complejo [19] y está muy afectada por el tipo de plataforma utilizada para generar los datos, así como las estrategias de análisis. Nuestra estrategia de análisis destinado a reducir los factores de confusión. Se extrajeron los ADN /ARN a partir de la misma pieza de tejido en un único protocolo [20]. Se utilizó control pareado-tumoral normales emparejados que es posiblemente la mejor manera de hacer un estudio comparativo [21]. Varios métodos han sido empleados para la priorización gen del cáncer por análisis integrador [22], [23]. Se empleó un enfoque de dos etapas modificado mediante el filtrado de los genes del cáncer utilizando logís- y luego se realizó un análisis de la expresión del exón.
Gene Nivel.
El efecto de los cambios cromosómicos no siempre es de particular. la amplificación genómica a nivel mundial daría lugar a la expresión de alto nivel de los genes seleccionados [9]. Nuestro análisis a nivel de genes mostró que sólo 20 de los 144 genes controladores de experimentar un cambio significativo en el nivel de transcripción. 5 de estos genes fueron enumerados entre los principales genes de controladores de puntuación. Nuestros resultados se correlacionan amplificaciones focales con un aumento de los niveles de expresión y se ha informado anteriormente utilizando CGH array (aCGH) para FGFR2, GNAS y los genes AURKA [24]. Con un tamaño medio de amplificación de 4,56 Mb, que podría ser malinterpretada reportar todos los genes afectados /regiones no codificantes que se asocia con CRC. FAM46C, EGFR2 y IL6 genes de nuestro análisis también se han enumerado en el censo actualizado gen del cáncer [5], [25]. BCAS1 gen que obtuvo el más alto en el análisis logís- se había informado anteriormente que someterse splicing alternativo y regulación a la baja [26], que es coherente con nuestros resultados. La regulación positiva de SLC7A11 ARNm humano en células de fibroblastos del estroma de las metástasis hepáticas se asocia con cáncer colorrectal metastásico en humanos [27]. PTP4A3 informó que se upregulated significativamente en este estudio recientemente se ha implicado en la tumorigénesis de colon [28]. ATP8B1 es el gen que todavía no se ha informado que tienen cualquier forma de asociación con el cáncer colorrectal y sería una molécula importante para estudios adicionales.
Nuestro análisis de la expresión diferencial de tumor y normales conjuntos de datos exón serie utilizando dos herramientas independientes (SAM y LIMMA) mostró una superposición de 15 genes con los genes del conductor. Análisis de & gt; 44.000 sondas derivadas de genes expresados diferencialmente proporcionar un enfoque imparcial y se presta aún más la confianza en la lista de genes superpuestos. Tanto LIMMA y SAM los enfoques generados mismos resultados a nivel funcional como lo demuestra Ingenuity Pathway Analysis (IPA).
ABP1, AGR3 y BCAS1 mostró regulación a la baja a pesar de amplificación a nivel del genoma. Esto es apoyado por estudios anteriores para la línea celular MCF7 BCAS1in [29]. Hemos observado que la influencia del factor de transcripción SMAD4 se perdió en las células tumorales y puede ser responsable de esta observación. Se observaron cambios similares en los factores de transcripción para los otros dos genes que indican el comportamiento de conmutación como veremos a continuación.
Exon Nivel.
análisis a nivel de Exon para medir cambios de expresión génica es difícil pero gratificante. Incluso los algoritmos mejorados tienen limitaciones en el suministro de la cuantificación absoluta de los niveles de transcripción. Los métodos anteriores han encontrado datos de nivel de exón a ser más informativo sobre la naturaleza y el nivel de las transcripciones [30]. Ahora, con el conocimiento de que más de 90% de todos los genes se someten a corte y empalme alternativo para producir más de una transcripción de un gen, el potencial de los datos de nivel de exón se está realizando más que nunca [31] - [33]. Enfoque centrado en el gen para la realización de análisis integrado mediante aCGH y exón matriz de datos se ha producido más de los resultados confirmatorios y carecen de la utilización de todo el potencial de las matrices de todo el genoma [34]. gen FGFR2 se muestra a amplificar y upregulated que es engañosa debido a la forma truncada de FGFR2. en peso gen FGFR2 no se midió y por lo tanto no podía compararse con nuestro estudio [34].
estudios a nivel de exón en el cáncer colorrectal han sido pocos y llevar a varias limitaciones en términos de análisis de datos. Muchos de estos estudios tumor y normal de diferentes fuentes [35] en comparación. Nuestros resultados muestran un subconjunto de genes expresados diferencialmente de experimentar cambio en el patrón de empalme. 29 exones que pertenecen a 13 genes mostraron significativo índice de empalme (SI) y los valores de p Midas. Tanto los valores son fuertes indicadores para medir el splicing alternativo. MUC4 es muy conocido para someterse a corte y empalme alternativo y de la causa del cáncer [36], pero el corte y empalme alternativo de IL6 es novedoso en asociación con CRC. ADAM12 que obtuvo un alto valor de SI ha sido implicado anteriormente en el cáncer de pulmón [37]. 5 genes (ACTN1, CALD1, SLC3A2, CTTN y FN1) reportados anteriormente como diferencialmente empalmados [38] han sido encontrados en el estudio, así que utilizó una estrategia de análisis diferente.
ANK3 se conoce el uso de la transcripción alternativa los sitios de inicio en el cáncer colorrectal [8] y también podría ser el mecanismo para otra MYLK gen para el que no hemos visto un cambio significativo en el nivel de expresión génica.
a nivel de red.
tiene para análisis de rutas ha utilizado para medir la relevancia de los genes afectados por CNA mediante la creación de redes entre ellos [1]. Sin embargo, estas redes están limitados en su interpretación útil debido a la ausencia de direccionalidad. Nuestro análisis de la red causal proporciona información más útil sobre los genes implicados en estas redes. Se observó una diferencia significativa en el número de genes diana entre tumor y normal. En el caso de genes que se encuentran en la región amplificada, pero se downregulated se observó una pérdida de la regulación del factor de transcripción, mientras que en el gen upregulated de la región eliminada hubo un cambio en el factor de transcripción. En la lista de genes conductor elegimos los factores de transcripción y estudiamos su cambio de comportamiento en muestras de tumores. AHR se ha establecido como un gen supresor de tumores en el colon y otros cánceres [39]. Este estudio además explica el papel preponderante de la AHR por el aumento del número de genes de salida (destino) en el tumor. Nuestro estudio proporciona evidencia de que TSHZ1 pierde su papel como regulador maestro en las células normales, mientras que RUVBL1 asume ese papel. Estos proporcionan oportunidades interesantes para los estudios sobre el mecanismo de la red /vías afectadas en el CCR. Se ha previsto a través de estudios integrados que muchos diferentes alteraciones genómicas potencialmente dis-regulan las mismas vías en enfermedades complejas [40]. Otros estudios de los cambios en el nivel de regulación en este estudio serán capaces de establecer este concepto en el CCR.
El papel funcional de los genes expresados diferencialmente y la identificación de MYC, MMP e IL6 como nodos importantes en las redes afectadas proporcionan clientes potenciales que necesitan ser validados para establecer su asociación con el CRC. Biomarcadores, especialmente MUC4 serán una molécula importante para estudiar mecánica y establecer su uso en estudios clínicos. Este estudio proporciona gran cantidad de datos analizados y una lista enriquecida de genes que pueden servir como pistas posibles para entender la biología del cáncer colorrectal.
Información de apoyo
Figura S1.
Importancia del análisis de microarrays. SAM análisis se realizó utilizando Integromics suites descubrimiento de biomarcadores en todas las muestras. Los resultados fueron cortesía al análisis LIMMA como se refleja en el número de genes expresados diferencialmente
doi:. 10.1371 /journal.pone.0110134.s001 gratis (TIF)
figura S2. Índice
empalme y parcelas de expresión para el exón restante 11 genes. Índice de empalme y de expresión exón de los 13 genes que se encontraron significativa entre los genes conductor se representaron. La comparación de "Normal" y las muestras de "tumor" se representa para observar el cambio en el índice de empalme así el patrón de expresión a nivel exón
doi:. 10.1371 /journal.pone.0110134.s002 gratis (DOCX)
Figura S3.
Biológica procesa tabla de enriquecimiento para los genes expresados diferencialmente. Este diagrama de barras muestra los genes expresados diferencialmente (como se obtiene de Integromics) se enriquecen en tres funciones a saber, la división celular, la mitosis celular y adhesión
doi:.. 10.1371 /journal.pone.0110134.s003 gratis (PNG)
Tabla S1.
tipos y etapas de todas las muestras de los pacientes utilizados en el estudio
doi:. 10.1371 /journal.pone.0110134.s004 gratis (DOCX)
Tabla S2.