Extracto
Las causas moleculares por los cuales el crecimiento epidérmico receptor de la tirosina quinasa del factor induce la transformación maligna son en gran parte desconocidos. Para entender mejor los análisis de todo el genoma capacidad transformadora EGFs 'se aplicaron a un modelo de ratón transgénico de cáncer de hígado y se sometieron a métodos avanzados de análisis computacional para construir redes reguladoras de genes de novo en base a una combinación de análisis de secuencias y algoritmos de grafos-topológica arrastradas. Aquí hemos identificado factores de transcripción, los procesos, nodos clave y moléculas para conectar socios que interactúan aún desconocidos a nivel de la interacción proteína-ADN. Muchos de los que pudieron ser confirmados por el ensayo de desplazamiento de banda electromovilidad en sitios de reconocimiento de promotores específicos de genes y por el Western Blot de proteínas nucleares. Por tanto, una novela de circuitos de regulación celular podría proponerse que conecta genes regulados del ciclo celular con componentes de la vía de señalización de EGF. Promotor análisis de genes expresados diferencialmente sugirió la mayoría de los factores de transcripción regulados para mostrar especificidad ya sea a la pre-tumor o el estado del tumor. búsqueda posterior de nodos clave de transducción de señal aguas arriba de los factores de transcripción identificados y sus objetivos sugirió la vía del factor de crecimiento similar a la insulina para hacer que las células tumorales independientes de la actividad del receptor EGF. En particular, la expresión de IGF2 además de muchos componentes de esta vía fue altamente upregulated en tumores. En conjunto, se propone un cambio en la señalización autocrina para fomentar el crecimiento del tumor que se desencadenó inicialmente por EGF y demostrar la adquisición de conocimiento promotor análisis de la forma en combinación con la identificación del ganglio llave aguas arriba
Visto:. Stegmaier P, Voss N, T Meier , Kel a, E Wingender, Borlak J (2011) Métodos de Biología Computacional avanzada Identificar interruptores moleculares de malignidad en un modelo de ratón de cáncer de hígado EGF. PLoS ONE 6 (3): e17738. doi: 10.1371 /journal.pone.0017738
Editor: Michael Polymenis, Texas A & amp; M University, Estados Unidos de América
Recibido: 6 Octubre 2010; Aceptado: 9 Febrero 2011; Publicado: 28 Marzo 2011
Derechos de Autor © 2011 Stegmaier et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Partes de los trabajos fueron financiados por subvenciones de la UE "EURODIA" (LSHM-CT-2006 hasta 518.153) y Net2Drug (LSHB-CT-2.007 hasta 037.590) y la ETB conceder GlobCell y BMBF TcellTalk proyecto, así como el programa de colaboración de la Intenational rusa Ciencias de la Educación y del Ministerio y del Ministerio de Ciencia y Cultura, Baja Sajonia, Alemania; Grant número: 25A.5-76251-99-3 /00 a Juergen Borlak. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito. PS, NV, AK, EW son empleados de BIOBASE GmbH, Wolfenbuettel, Alemania. AK es también un empleado del Instituto de Biología de Sistemas Ltd., Novosibirsk, Rusia
Conflicto de intereses:. PS, NV, AK, EW y JB son empleados de BIOBASE GmbH, Wolfenbuettel, Alemania. AK es también un empleado del Instituto de Biología de Sistemas Ltd., Novosibirsk, Rusia. No hay patentes, productos en desarrollo o los productos comercializados para declarar. Esto no altera la adhesión de los autores a todos los PLoS ONE políticas sobre los datos y compartir materiales, como se detalla en línea en su guía para los autores.
Introducción
Factor de crecimiento epidérmico es un mitógeno importante para hepatocitos para su capacidad para modular proto-oncogén, así como la expresión de genes específicos de hígado. Para entender mejor el papel de EGF en la transformación maligna se desarrolló un modelo de ratón transgénico, donde EGF se dirige al hígado. En particular, los ratones transgénicos desarrolló cáncer de hígado alrededor de 7-8 meses y se identificó una red de fase dependiente del tumor de los genes EGF-regulada, como [1] se informó anteriormente. Alentados por estos resultados genes relacionados con tumorigenes y la progresión de la enfermedad podría ser propuestos. Aquí, hemos querido analizar perfiles de expresión génica de carcinomas hepatocelulares pre-tumorales y altamente diferenciados con un nuevo método de cálculo que permitió la identificación de los reguladores de la señalización del EGF en cascada asociada con la transformación maligna. Un nuevo método fue desarrollado en base a análisis de la secuencia promotora de los genes expresados diferencialmente. En concreto, la transcripción de un gen está determinada en gran parte por la actividad de factores de transcripción, que a su vez reconoce segmentos cortos de ADN específicas, sitios de unión es decir, el factor de transcripción (TFBSs) que a menudo están situadas en la región promotora aguas arriba del sitio de inicio de transcripción (TSS). Perfiles de expresión génica por lo tanto se pueden utilizar para identificar TFS que potencialmente influir en la expresión de genes en determinadas condiciones celulares mediante el uso de diversos algoritmos genéticos y matrices que reconocen TFBSs. La complejidad de los datos de expresión génica se puede reducir por la identificación de TFS comunes de genes co-regulados. El método aquí descrito y de nuevo desarrollo se centra en la identificación del factor de transcripción sitios con co-ocupación en los promotores de genes expresados diferencialmente de unión de una manera estadísticamente significativa. Esta generación de hipótesis habilitado y una identificación de factores de transcripción que actúan sobre un promotor de este tipo de conjunto con el fin último de identificar "factores desencadenantes moleculares" en las redes reguladoras de genes obligando a los hepatocitos en la transformación maligna. Sobre la base de factores de transcripción tales análisis se identificaron como efectores candidatos de la transformación maligna que puede funcionar en el cambio de EGF sobre la expresión al estado maligno. Con el fin de validar experimentalmente las predicciones computacionales experimentos de transferencia Western de proteínas nucleares y ensayos de desplazamiento de banda EMSA se llevaron a cabo para determinar la actividad de unión de ADN de varios factores de transcripción. La reconstrucción de las cascadas de señalización aguas arriba de estos TFS permiten sugerir los objetivos de abajo de la señalización de EGF en estos dos tipos de estados celulares, es decir, transgenicidad y cáncer de hígado. Como resultado, proponemos redes reguladoras que ayudan a comprender mejor las neoplasias malignas inducida por EGF. En un esfuerzo para buscar moléculas clave en la red de señalización aguas arriba de la transcripción identificado factores de la vía del factor de crecimiento similar a la insulina se identificó que de hecho puede representar un interruptor molecular de la tirosina del receptor de ruta quinasa EGF al estado tumor haciendo así células malignamente transformadas independiente de la actividad del receptor de EGF. Se obtuvo evidencia adicional para esta hipótesis cuando la expresión del gen de IGF-2 y sus socios de aguas abajo se investigó y se determinó que muy significativamente inducida en las células tumorales al igual que muchos componentes de esta vía.
En general, este estudio apunta a una mejor comprensión de la capacidad de EGF transformadora y combina diferentes líneas de evidencia para un posible mecanismo de la enfermedad
resultados
expresión diferencial en transgénico (pre-tumor) y tejido tumoral:. sub clasificación de conocida biomarcadores de cáncer de hígado por perfiles de expresión génica
2.3 explican mapeadas Affymetrix sonda fija a 10.262 genes del ratón. análisis de expresión diferencial con EBarrays detectado 303 y 355 hasta los genes regulados, así como 95 y 141 genes regulados hacia abajo en las células tumorales y transgénicos, respectivamente. La Tabla 1 resume la información sobre las listas de genes obtenidos y la Figura 1 muestra la distribución del factor de transcripción conocido sitios del sitio de unión de acuerdo con el comunicado de la base de datos TRANSFAC 12.1 (ver Material y Métodos, el cálculo de los valores de p para las puntuaciones del partido, para más detalles). Tabla S1 ofrece todos los símbolos, nombres de genes MGI molécula TRANSPATH, si está disponible, y los altos o más bajos veces los cambios medidos por la sonda fija de hasta reguladas o genes regulados hacia abajo, respectivamente. Una modificación manual de menor importancia se introdujo en conjunto de genes 5 (Tabla 1), donde un grupo de sondas asignada a cuatro estrechamente relacionados paralogs Bcl2a1a-d. Se utilizó el programa de alineación MAFFT [2] y Jalview [3] para inspeccionar las múltiples alineaciones de promotores BCL2A1 (Figura S1). Como las secuencias promotoras de estos genes son muy similares, un sesgo en promotor de análisis realizados en este trabajo era de esperar y por lo tanto elimina tres genes Bcl2a (b-d) de conjunto de genes 5.
La línea roja indica el pico de la distribución en relación -115bp a la SAT.
transgénicas y tumorales estados compartieron 144 hasta los genes regulados y 25 genes regulados hacia abajo (conjuntos de 3 y 8, Tabla 1). En los análisis posteriores, también se consideraron un solapamiento potencialmente mayor, cuando una sonda conjunto fue estadísticamente significativo en un contraste y logró un alto factor de cambio en la otra (conjuntos de 2, 4, 7 y 9). Por lo tanto, el 77 de los 303 hasta los genes regulados en células transgénicas (serie 2), una sonda conjunto detectado por el análisis estadístico también tenía un cambio múltiplo & gt; 2 en células tumorales, y se añadieron estos 77 genes de los 355 hasta los genes regulados en tumor para obtener un conjunto extendido de hasta genes regulados en las células tumorales. Correspondientemente, 103 de los 355 hasta los genes regulados en el tumor se adjuntaron al conjunto transgénico para derivar un conjunto extendido de hasta genes regulados en células transgénicas (conjunto de 4). Del mismo modo, los conjuntos de genes de la respuesta de regulación a la baja se ampliaron a un cambio veces por debajo de 0,5. Se consideraron subconjuntos restante (conjuntos de 1, 5, 6, y 10) regulado específicamente en el estado de progresión respectivo.
De acuerdo con el módulo de la enfermedad de la Biblioteca Conocimiento BIOBASE (BKL) [4], la carcinogénesis inducida por EGF causado expresión diferencial de 39 genes biomarcadores conocidos asociados con carcinoma de hígado /neoplasias (Tabla S1). Como se muestra en la Figura 2, estos biomarcadores presentaron diferentes patrones de expresión sugieren una clasificación sub aún más con respecto a su respuesta en pre-tumor y el estado del tumor. Tres genes, es decir, Myc, Glul, avena, fueron transitoriamente por incremento o disminución regulada durante el inicio de la enfermedad y por lo tanto pueden servir como marcadores tempranos de cáncer de hígado, que discriminan contra el estado del tumor (Figura 2A). El análisis estadístico sugirió también Dnmt3a, ITGA6, y SHC1, sin embargo se midieron los cambios altos de plegado para estos genes en las células tumorales como se discutió anteriormente. La expresión de 14 genes biomarcadores cambió de forma detectable en ambos estados de progresión (Figura 2 B) que indican un conjunto adicional de marcadores de cáncer de hígado temprano putativos. Por último, CCND1, GPC3, Mvk, PPARg, Rbl2, y Robo1 exhibió una respuesta específica del tumor (Figura 2C), donde se observaron cambios de expresión adversos para PPARg, que apareció el regulado en las células transgénicas (doble cambio & lt; 0,4) y significativamente regulada hasta en los tumores. Tomados en conjunto, estos resultados sugieren una interpretación refinada de biomarcadores conocidos para el cáncer de hígado /neoplasias. Entre los genes respectivos pudimos identificar varias firmas informativos que indican marcadores específicos pre-tumorales y tumorales y que muestran que los cambios de expresión de algunos marcadores biológicos conocidos pueden de hecho servir como indicadores tempranos de inicio de la enfermedad.
Los gráficos muestran log-Fold cambios de biomarcadores conocidos que son expresados diferencialmente en células transgénicas (a), ambos estados (B), o tumores (C). Plegables cambios de algunos genes indican expresión diferencial en ambos estados, aunque el análisis estadístico de ellos asignado a un solo Estado (líneas de trazos). Varios biomarcadores conocidos exhiben respuestas específicas del estado de progresión, que pueden estar al servicio derivación de firmas pre-tumorales y tumorales (líneas gruesas).
regulación del ciclo celular y el metabolismo de los lípidos cambia progresivamente en hepatocarcinogénesis inducida por EGF
con conjuntos definidos de genes expresados diferencialmente (dE) a la mano, nos propusimos identificar los cambios funcionales que acompañan hepatocarcinogénesis inducida por EGF. Para este propósito, se calcularon los valores de p de enriquecimiento para todos GO proceso biológico categorías asociadas con al menos un gen transgénico o en conjuntos de genes del tumor y las aplicó como medida de la importancia relativa de una función biológica particular para un determinado conjunto de genes. Para limitar el efecto de los resultados negativos falsos durante el análisis de la expresión diferencial, P-valores se calcularon para el enriquecimiento conjuntos de genes largos compuestos por conjuntos de 1-4 (hasta reguladas en las células transgénicas), 2-5 (hasta regulado en las células tumorales), 6- 9 (hacia abajo regulada en células transgénicas), y 7-10 (abajo regulada en las células tumorales) (Tabla 1). Los resultados de la comparación del valor P se muestran en la Figura 3. A continuación nos centramos en los 15 grupos van con grandes diferencias entre los valores de log P, obtenida en el análisis de cualquiera de los conjuntos de genes upregulated o downregulated. Parcelas de productos transgénicos con los valores de p tumorales (Figura 3, A y C) ilustran que el procedimiento ordenado categorías en función de su distancia a la (línea roja) en diagonal. Puntos en la diagonal indican que no hay diferencia entre los valores de p. En los 15 primeros procesos biológicos seleccionados, P-valores variaron en alrededor de 2-6 órdenes de magnitud entre los estados transgénicos y tumorales. De acuerdo con este análisis, la regulación positiva de genes durante tumorigenes alterado más fuertemente las funciones del ciclo celular (Figura 3B). Tenga en cuenta que las leyendas de las figuras 3B y 3D preservar el orden por diferencia de log-P-valor. Todas las cinco principales categorías GO, "la división celular", "ciclo celular", "fase M", "mitosis", y "fase M del ciclo celular mitótico" aluden a los cambios en el ciclo celular y se enriquecieron más significativamente en el tumor conjunto de genes, mientras que la regulación al alza en células transgénicas fue más fuertemente dirigida a mecanismos de motilidad celular así como la organización componente celular y la biogénesis. Además de las alteraciones del ciclo celular, la comparación funcional señala cambios en la regulación de los genes que participan en los procesos de desarrollo, el crecimiento celular y el desarrollo de la estructura anatómica (Figura 3B), que impliquen potenciales eventos de desdiferenciación. El análisis de las respuestas downregulation revela que la regulación del metabolismo de los lípidos fue fuertemente modificado durante la tumorigénesis. Los dos siguientes funciones de más alto rango se refieren a deubiquitination proteínas y la síntesis de ácidos biliares (Figura 3D). Tabla S2 proporciona detalles adicionales acerca de los genes que emparejan algunos grupos de procesos biológicos seleccionados y sus valores de P en cualquier estado progresión. categorías del ciclo celular altamente clasificados por comparación de conjuntos de genes upregulated se vieron afectados significativamente tanto en las células tumorales y transgénicos, lo que demuestra que estas funciones sufren alteraciones progresivas. En particular, los genes asociados con el desarrollo de la estructura anatómica fueron fuertemente enriquecido en transgénicos y tumorales conjuntos (punto amarillo y línea, la figura 3, A y B). En particular, las diferencias no manifiestan sólo en la regulación positiva de genes adicionales en la célula tumoral; p.ej. el grupo del ciclo celular de las células transgénicas comprende Foxc1, Gadd45a, Hic1, Hus1, Myc, y Uhmk1, que no fueron detectados en el tumor (a pesar de la extensión de la lista de genes). Se observaron los cambios más dramáticos en la regulación de los genes del metabolismo de lípidos. Transgénicos y de genes del tumor conjuntos implicados en esta función difirió en 21 genes y los valores de p de enriquecimiento se incrementaron en cerca de seis órdenes de magnitud. Además, deubiquitination proteínas y ácidos biliares metabolismo exhiben una regulación interruptor similar, donde se detectó primero la expresión diferencial en el tumor
(A y B - el análisis de genes upregulated, C y D - análisis de los genes downregulated). . A y C) Cada punto representa una categoría GO en el espacio de dos P-valores. B y D) Top 15 de los términos de GO con mayor diferencia de log-P-valor entre transgénicos y del tumor. Puntos que corresponden a las categorías enumeradas en B y D se destacan en A y C, respectivamente.
desregulación del ciclo celular fue previamente identificado como un mecanismo causal de la carcinogenicidad no genotóxico [5]. También se sabe que el cáncer de hígado conlleva trastornos metabólicos de lípidos, incluyendo el metabolismo del colesterol [6]. Los resultados presentados aquí muestran que la aparición de la enfermedad se acompaña de cambios progresivos en las funciones respectivas. La vía de la ubiquitina-proteasoma es relativamente un nuevo objetivo para la terapia del cáncer [7]. De acuerdo con nuestros datos de expresión de genes, hepatocarcinogenesis causada regulación a la baja de los tres genes deubiquitination, dub1, DUB2, y Dub2a, específicamente en el estado del tumor (Tabla S1). Recientemente, una enzima deubiquitinating, BAP1, con un papel en la regulación del ciclo celular se describe como supresor de tumores [8], el apoyo a la relevancia de la búsqueda de la categoría GO correspondiente entre los 15 mejores funciones alteradas a pesar de un enriquecimiento de P-valor moderado en el gen tumor establecer (P & lt; 0,0001). Regulación a la baja de los genes deubiquitination cumple con los resultados anteriores, como Ventii y coautores también observaron deficiencia en la actividad deubiquitinating en los mutantes asociados con el cáncer. En resumen, se observó cambios progresivos en la regulación del ciclo celular, las funciones metabólicas de lípidos y de desarrollo carabina hepatocarcinogenesis inducida por EGF, mientras que el potencial regulación interruptor-como para pequeños grupos de genes definidos por deubiquitination proteína y la biosíntesis de ácidos biliares, un componente del metabolismo del colesterol hepático . Estas funciones biológicas pueden albergar nuevos biomarcadores para el inicio de la enfermedad y la tumorigénesis.
Las agrupaciones de moléculas de transducción de señal aumentada en las células tumorales transgénicas y se integran de factores de crecimiento, ciclo celular, quimioquinas y citoquinas señales
Redes de interacción proteínas ejercen una gran parte de las funciones celulares. Análisis de moléculas expresadas diferencialmente en el contexto de las vías de señalización conocidos permite la identificación de redes moleculares dirigidas por los cambios de expresión observados. Se aplicaron análisis de conglomerados red de proponer contexto funcional para componentes codificadas por los genes expresados diferencialmente de células transgénicas y del tumor junto con el apoyo a las topologías de red construidos a partir de reacciones de señalización probadas experimentalmente señalización. Redes se construyeron para los conjuntos de genes upregulation y downregulation prolongados descritos anteriormente. Como resultado, se obtuvo una agrupación para cada uno de los genes upregulated de células transgénicas y para los genes upregulated de las células tumorales. Una pequeña red de genes downregulated fue encontrado en las células tumorales, en el que el EGF y el beta-C interactuar con Shc y un complejo que comprende EGF, ErbB1, Shc-1, Grb2 y Sos (no mostrado). Las dos redes de upregulated genes estaban constituidos por 85 y 88 componentes, incluyendo 39 y 41 moléculas upregulated en las células tumorales o transgénicos, respectivamente. Diagramas de transgénicos y de la red del tumor grupos se muestran en las figuras 4 y 5. Para más información acerca de las moléculas expresados diferencialmente y genes que codifican se da en la Tabla S3
nodos rojas: únicamente en la red transgénico;. Rojo claro: doble cambio fue de al menos 2 más alta que en el tumor; verde claro: doble cambio era por lo menos - 2 menor que en el tumor, Azul: Molécula upregulated con factor de cambio similar en transgénicos y el tumor. Por favor, véase el texto para una descripción más detallada
nodos rojas: únicamente en la red del tumor;. Rojo claro: doble cambio era al menos 2 puntos más que en las células transgénicas; verde claro: doble cambio era al menos 2 puntos inferior a la de las células transgénicas, Azul: Molécula upregulated con factor de cambio similar en transgénicos y el tumor. Por favor, véase el texto para una descripción más detallada.
Ambas redes cuentan con una mezcla de categorías funcionales, tales como la señalización del factor de crecimiento, por ejemplo, a través de receptores ErbB, InsR, o FGFR-1, cascadas de ciclo de célula, por ejemplo regulador la participación de ciclina B1, Cdk1, Aurora-A, o p53, así como citoquinas y quimioquinas señalización a través de IL-1RI y CXCR4. La lista combinada de componentes upregulated consta de 48 proteínas de las cuales 7 son específicos de la red transgénico y 9 son sólo una parte de la red del tumor (Tabla S3). Para 19 de los 32 moléculas compartido un cambio cuantitativo en la expresión durante la tumorigénesis puede ser la hipótesis según lo indicado por nodo para colorear sobre los diagramas de red (verde y nodos de color rojo claro, las Figuras 4 y 5). En particular, esto se aplica a un módulo compacto de reguladores del ciclo celular, es decir, survivina, ciclina B1, Cdk1, Plk1, y Bub1, cuya expresión aumento de aproximadamente 2 veces en el tumor frente a las células transgénicas de acuerdo con los cambios veces medidos. Por otra parte, el análisis de redes sugiere otro módulo, específico de tumor de reguladores del ciclo celular formados por p107, p130, p15INK4b, y Wee1 (Figura 5). Estos resultados apoyan la hipótesis de que la carcinogénesis inducida por EGF es impulsado en parte por alteraciones progresivas de la regulación del ciclo celular, que, como muestran las redes, también puede manifestarse a través de cambios cuantitativos de expresión.
Las agrupaciones de redes presentados revelan los posibles efectos sobre la actividad de TFS upregulated como c-Fos, c-jun, c-Myc, PPAR-gamma1, Smad3, Egr-1 y C-Ets-2. C-myc y PPAR-gamma1 se restringieron a la transgénico y la red de tumor, respectivamente. Cada factor se integra señales de varias moléculas de aguas arriba con expresión alterada. Curiosamente, conocida TFS asociados con el cáncer como c-Fos, c-Jun, Smad3, y c-Ets-2 exhibió niveles bastante constantes de regulación al alza a lo largo de la tumorigénesis. Por otra parte, un número relativamente alto de los dos de activación y las reacciones de inhibición p53 objetivo, que era nulo de la expresión diferencial detectable en cualquiera de los estados de progresión.
Una cascada que implica VCAM-1, alfa 4-integrina, y IAP se encontró específicamente en la red transgénicos (Figura 4). Alfa 4-integrina muestra la regulación específica de cada estado progresión con la regulación al alza en las células transgénicas y la regulación a la baja en las células tumorales (Tabla S3). Las integrinas están vinculados a la invasión de tejidos por células de hepatocarcinoma [9] y juegan un papel en la apoptosis [10]. BMP7, una molécula específica de la red tumor, puede actuar como factor de transcripción y puede, como tal, contribuir a la regulación positiva de c-Myb [11], así como de c-Fos, este último posiblemente por otros medios [12]. BMP7 se informó previamente para participar en la regulación de la apoptosis en las células del músculo liso vascular [13]. Dada su asociación con la apoptosis y sus perfiles de expresión específicos de cada estado de progresión, alfa 4-integrina y BMP-7 puede representar componentes de dispositivos de conmutación de la carcinogénesis.
Las agrupaciones de redes revelan trazados de circuito de regulación que podrían ser exploradas para nuevas intervenciones terapéuticas. De hecho, los antagonistas de PPAR-gamma se están investigando como tratamiento de diversos tumores malignos, incluyendo los cánceres de hígado. cascadas de regulación de orientación PPAR-gamma a través quinasas aguas arriba y fosfatasas, como M3 /6, JNK1, MEKK2, MKP3, MEK2, o ERK2, de los cuales M3 /6, MEKK2, y fueron inducidos durante la carcinogénesis 3 MFP-, sugieren posibilidades adicionales para desarrollo de fármacos. Además, el ligando de la insulina y los receptores similares a la insulina, IGF-2, fue fuertemente aumentada en las células tumorales, mientras que no hubo cambios moderados en células transgénicas (no detectados por el análisis de expresión diferencial). El papel potencial de este ligando en la regulación autocrina de crecimiento de células cancerosas se discutió previamente en el analizado en nuestro estudio de la literatura [14] y más (ver más abajo).
Promotor análisis e identificación de secuencias reguladoras
los factores de transcripción son importantes contribuyentes a coordinadas cambios de expresión génica como los observados en los datos del estudio. Es un enfoque estándar para la prueba de sobrerrepresentación de TF sitios en los promotores de los genes coregulated frente a un fondo de promotores de unión. Se cuantificó el enriquecimiento sitio de unión por el 0,01-cuantil de la relación de dos distribuciones beta que modelan el odds ratio de sitios y promotores de unión previsto y primer y segundo plano conjuntos de genes. El valor de 0,01-cuantil, en el siguiente denotado
q-valor
, estima el valor de la razón de posibilidades, por lo que la relación verdadera es más alta con un 99% de probabilidad (ver Métodos). Para cada una de las 578 PWM TRANSFAC, el algoritmo se inició con un umbral de puntuación baja PWM (valor P 0,05) y iterativamente ajustado el valor de corte (incrementando) para maximizar el valor de q.
Los sitios de unión fueron predicho por la coincidencia en las regiones promotoras que cubren -1000 a +100 relación con el SAT. Hemos construido conjuntos de fondo separadas para las células transgénicas y tumorales por muestreo al azar de 1000 genes con cambios de plegado entre 0,9 y 1,1 en el estado de progresión respectivo. Se analizaron los siguientes conjuntos de primer plano: la regulación positiva (Tabla 1: ajusta 1-3 y 3-5), la regulación positiva específica (Tabla 1: fija el 1 y 5), regulación a la baja (Tabla 1: establece 6-8 y 8-10), y regulación a la baja específica (Tabla 1: conjuntos 6 y 10). Además, la unión de enriquecimiento de sitio se probó en promotores de genes upregulated asociados con el ciclo celular y de genes downregulated asociadas con el metabolismo de los lípidos.
En la Figura 6, los valores de q de motivos TRANSFAC optimizados para los conjuntos de primer plano transgénicas se representan frente q-valores correspondientes conjuntos de primer plano del tumor. Por otra parte, se extrajeron los mejores PWM ordenados por q-valores de la Tabla S4. Identificadores de TRANSFAC matrices cuyos puntos se destacan en la Figura 6 son negrita escrito en la Tabla S4. La extracción de las matrices seguido la regla para mostrar los 15 primeros PWM, o todo ello con el enriquecimiento de al menos 2 veces en alguno de los conjuntos transgénico o tumor, o todos los PWM destacó en la figura 6, lo que resultó en el mayor número de motivos. También se extrajeron los genes del factor de transcripción (Tabla S5) de acuerdo con los PWM identificados (subrayado en la Tabla S4) y se realizó un análisis de la red de aguas arriba con conjuntos de factores de transcripción (véase más adelante).
Cada punto representa un sitio de unión TRANSFAC (= secuencia motivo) posicionado por enriquecimiento veces en transgénicos (eje x) y el tumor (eje y) conjuntos de primer plano. Los valores cuantiles superiores a 1 indican enriquecimiento sitio de unión. Varios motivos se ponen de relieve que se desplaza fuera de la diagonal que sugiere una importancia distinta de TFS para la regulación correspondiente en cualquiera de los estados transgénicos o tumorales. Por favor, véase el texto para una descripción más detallada. A) Análisis de enriquecimiento sitio de unión en todos abajo genes regulados b) Análisis de los enriquecimientos de sitios de unión en los genes específicamente hacia abajo regulados bien de los Estados transgénicos o tumorales C) Análisis de enriquecimiento sitio de unión en todos hasta los genes regulados d) Análisis de enriquecimientos sitio de unión en específicamente los genes regulados bien de los estados transgénicos o tumorales E) Análisis de sitio de unión enriquecimientos en hasta genes del ciclo celular regulados F) Análisis de enriquecimientos sitio de unión en reguladas por los genes del metabolismo de lípidos.
Como resultado, promotor análisis reveló motivos TF específicamente, o más articuladamente excesivamente en conjuntos de primer plano transgénicos o tumorales así como motivos con enriquecimiento común en ambos estados de progresión. En 5 de 6 conjuntos de primer plano, motivos de punto de uso se asocia con mayor fuerza el estado transgénico que con el estado del tumor (Figura 6A-E). Esta diferencia fue más pronunciada en los análisis de downregulated (Figura 6A) y conjuntos de genes regulados negativamente específicos (Figura 6B), donde se encuentran los puntos que representan las matrices de punto de uso (diamantes azules) lejos de la masa de puntos. En particular, los sitios de algunos motivos POU eran también más de 2 veces enriquecido en promotores de genes downregulated en tumor. matrices OCT1 se detallan los principales motivos clasificado en los genes regulados a la baja y específicos regulados negativamente en el tumor (Tabla S4). Sin embargo, los promotores de genes upregulated se enriquecieron de forma detectable con los sitios de punto de uso en el estado transgénico solamente (Figura 6C-E). Estos resultados sugieren que los factores de la UOP contribuyeron al cambio de transgénicos a estado tumor. Además, su actividad puede representar una de las causas principales de los eventos downregulation observados. Entre los factores de transcripción POU representados por matrices identificadas en los análisis, el perfil de expresión de POU5f1 (Oct4) parecía bien el enriquecimiento específico de estado progresión observada de sus sitios de unión (Tabla S5). El gen POU5f1 exhibió un cambio de alta veces (2,75) en el estado transgénico, que había disminuido en el estado del tumor (doble cambio 1,70). De hecho, el gen POU5f1 se expresa específicamente en las células madre embrionarias y en las células tumorales, pero no en células de tejidos diferenciados [15]. Los factores de transcripción con un dominio forkhead también mostraron asociación con el estado transgénico. Esta señal se observa mejor en la sobrerregulación del ciclo celular y conjuntos de genes (Figura 6Cand E), sin embargo, el enriquecimiento sutil en promotores transgénicos también podría ser detectada en la regulación negativa específica (Figura 6B) y la regulación positiva específica, donde el motivo FREAC2 clasificado entre los 15 mejores PWM ( S4 Tabla). En el conjunto de la regulación positiva, sitios de unión Foxd3 mostraron la señal más fuerte después de los sitios OCT1 (Tabla S4). Esto apoyaría un papel potencial de Oct4, como corepression a través de la superposición de sitios de unión de Oct4 y Foxd3 se informó anteriormente [16]. De acuerdo con las mediciones de expresión, se Foxd3 potencialmente downregulated en ambos estados de progresión (Tabla S5), a pesar de las diferencias de expresión medidos no fueron estadísticamente significativas. En lugar de ello, la expresión Foxc1 paralelo al enriquecimiento más fuerte de Forkhead sitios en conjuntos promotor transgénicas de unión, ya que es upregulated específicamente en el estado temprano progresión (Tablas S1 y S5).
Los promotores de genes upregulated en tumor se asociaron con la unión sitios de los reguladores del ciclo celular, tales como factores AP1-como, STAT, y E2F (Figura 6C-e), de los cuales ATF3, jun, y E2F3 se upregulated significativamente en ambos transgénicos y células tumorales (Cuadros S1 y S5). Este hallazgo apoya la regulación más estricta de los procesos del ciclo celular en tumores detectados por el análisis comparativo GO. El análisis de los promotores de genes del ciclo celular sugiere factores E2F como los reguladores más importantes de los dos estados, mientras que se observó una tendencia hacia valores más altos q en el conjunto del tumor por varios motivos E2F (Figura 6E). En particular, se detectó la proteína con dedos de zinc Myc asociado-en el ciclo celular transgénica conjunto de genes (Tablas S4 y S5), lo que indirectamente sugiere que Myc afectada la regulación del ciclo celular en las células transgénicas, pero no o en menor grado en las células tumorales. Esto estaría apoyado por el perfil de expresión de Myc con la regulación al alza significativa en el estado temprano y regulación al alza sutiles o ausentes en el tumor.
Finalmente, los conjuntos de genes del metabolismo lipídico muestran una fuerte asociación de HNF6 (Onecut1) y PPAR-gamma con el estado del tumor (Figura 6F). De estos, HNF6 se downregulated significativamente en el tumor, mientras que PPAR-gamma exhibió un perfil específico estado progresión con regulación a la baja en el estado transgénico y la regulación positiva significativa de tumor
.
Mientras que muchos de los factores de transcripción mencionados anteriormente son bien conocidos proto -oncogenes, tales como jun, Myc, o E2F3, y el vínculo entre HNF6, PPARgamma y metabolismo de los lípidos es comprensible, otros factores revelados por nuestro análisis son nuevos con respecto a su papel en la carcinogénesis hepática. sitios de Kaiso (zbtb33) que se une más fuertemente fueron excesivamente representados en los genes tumorales regulados a la baja. Kaiso se demostró para silenciar genes supresores de tumores en el cáncer colorrectal [17], y su papel en el cáncer se examinó anteriormente [18]. Por otra parte, los motivos de la HMG factores caja se asociaron con conjuntos de genes transgénicos en regulación a la baja (Figura 6A, LEF1 PWMs) y la regulación positiva específica (Figura 6D, Sry). [29].