Extracto
Ciertos genes del cáncer contribuyen a la tumorigénesis de una manera de cualquiera de las mutaciones concurrentes o mutuamente excluyentes (anti-co-ocurrente); Sin embargo, el panorama global de cuándo, dónde y cómo se producen estas interacciones funcionales sigue siendo poco clara. Este estudio presenta un enfoque de biología de sistemas para este propósito. Después de aplicar este método a los datos de mutación génica del cáncer generados a partir de a gran escala y la secuenciación del genoma completo de las muestras de cáncer, se construyó una red de genes del cáncer con mutaciones co-produciendo y anti-co-ocurren. El análisis de esta red reveló que los genes con mutaciones concurrentes prefieren transducciones señalización directa y que las relaciones de interacción entre los genes del cáncer de la red están relacionados con su similitud funcional. También se reveló que los genes con mutaciones concurrentes tienden a tener frecuencias de mutación similares, mientras que los genes con mutaciones anti-co-produciendo tienden a tener diferentes frecuencias de mutación. Por otra parte, los genes con más exones tienden a tener más mutaciones que coexisten con otros genes, y los genes que tienen estructuras de red coherente locales más pequeños tienden a tener una mayor frecuencia de mutación. La red mostró dos módulos complementarios que tienen funciones distintas y tienen diferentes papeles en la tumorigénesis. Este estudio presenta un marco para el análisis de los resultados de secuenciación del genoma del cáncer. Los datos que se presentan y los patrones descubiertos son útiles para la comprensión de la contribución de mutaciones genéticas a la tumorigénesis y valioso en la identificación de biomarcadores y dianas farmacológicas clave para el cáncer
Visto:. Cui Q (2010) Una red de genes cancerígenos con co-produciendo mutaciones y anti-co-produciendo. PLoS ONE 5 (10): e13180. doi: 10.1371 /journal.pone.0013180
Editor: Simon Rogers, Universidad de Glasgow, Reino Unido
Recibido: 4 Abril 2010; Aceptado: September 11, 2010; Publicado: 4 de octubre 2010
Derechos de Autor © 2010 Qinghua Cui. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. El autor no tiene soporte o financiación reportar
Conflicto de intereses:.. El autor ha declarado que no existen intereses en competencia
Introducción
El cáncer se origina a través de alteraciones genéticas y epigenéticas acumulados de somática las células [1], [2], [3]. En los últimos años, se han hecho numerosos esfuerzos para identificar mutaciones de genes en diversos cánceres humanos por secuenciación de todo el genoma o a gran escala [3], [4], [5], [6], [7], [8], [9]. De hecho, estos estudios han identificado miles de mutaciones genéticas del cáncer y ciertos patrones o normas de mutaciones de genes del cáncer han sido descubiertos a través del análisis de estos datos de mutación [1], [2], [10], [11]. El descubrimiento de los genes mutados en cánceres humanos y los patrones detrás de los datos de mutación han proporcionado una perspectiva crítica sobre los mecanismos que subyacen a la formación y el desarrollo del cáncer, y han demostrado ser útiles para la terapia del cáncer [3], [12]. Sin embargo, el rápido aumento de los datos de la mutación del gen de cáncer sugiere un alto nivel de complejidad relacionada con la comprensión del proceso tumorigénico [2]. Dada esta complejidad, se necesitan más novedosos métodos para el análisis de mutación de datos para una mejor comprensión del cáncer.
En general, las mutaciones del gen del cáncer no ocurren al azar. Las mutaciones de ciertos genes del cáncer tienden a ocurrir simultáneamente (co-produciendo mutación denominado en este trabajo), lo que sugiere que pueden contribuir en conjunto para la formación y el desarrollo de tumores. Sin embargo, las mutaciones de algunos otros genes se producen de una manera mutuamente excluyente (denominada mutación en este trabajo anti-co-produciendo) [8], lo que sugiere que dos genes con mutación anti-co-producen pueden tener componentes aguas abajo altamente similares. Por ejemplo, Ras y Braf muestran mutaciones contra-co-produciendo. De hecho, activaion de uno de los miembros es suficiente para la activación de la vía MAPK [13]. Aunque algunos genes de cáncer con mutaciones co-producen y anti-co-producen se han revelado, la complejidad de las mutaciones del gen de cáncer humano nos impide obtener un panorama global de mutaciones gen del cáncer de co-producen y anti-co-ocurren. Para comprender mejor estas interacciones funcionales entre los genes del cáncer, este estudio presenta un enfoque de biología de sistemas y lleva a cabo un análisis exhaustivo de los genes del cáncer con mutaciones co-produciendo mutaciones y contra-co-produciendo.
Resultados
red de co-produciendo y anti-co-produciendo mutaciones en el gen del cáncer
Una red de genes del cáncer con el co-produciendo mutaciones y contra-co-existentes (red CCA) se construyó mediante la conexión de los genes del cáncer que tienen significativa co-ocurrencia o anti-co-ocurrencia con otros genes (véase Materiales y métodos). La red CCA incluye 306 genes y 1.366 enlaces (Archivo S1; Figura 1). Entre los 1.366 enlaces, 1.355 (99,2%) son enlaces de co-produciendo la mutación del gen y sólo el 11 (0,8%) son enlaces de anti-co-produciendo mutación genética. Por lo tanto, en este estudio, se realizaron todos los análisis de los genes con mutaciones co-produciendo menos que se indique lo contrario o que se explica. La red CCA incluye cinco componentes de la red. El (más grande) componente de red gigante contiene 97,4% (298/306) de los nodos en total, lo que sugiere que la mayoría de los genes tienen relaciones potenciales que contribuyen a la tumorigénesis. Los grados de los nodos de la red CCA muestran una distribución de ley de potencia (Figura S1), lo que indica que la red CCA es una red libre de escala.
Cada nodo representa un gen del cáncer. Los genes conectados por enlaces grises representan mutaciones concurrentes. Los genes conectados por enlaces de color púrpura representan mutaciones contra-co-produciendo. La red CCA tiene dos módulos. Los nodos en un módulo son rojos y los nodos en el módulo dos son de color verde.
Preferencia de los genes con mutaciones concurrentes de transducción de señales de activación Directo
Se cree que los genes del cáncer con co mutaciones -occurring no se distribuyen al azar en el genoma del cáncer. En la actualidad, no está claro cómo se producen las mutaciones concurrentes. Como las células necesitan para responder a las diversas señales, y puesto que la señalización celular es crítica para tareas tales como el crecimiento celular, el mantenimiento de la supervivencia celular, la proliferación, la diferenciación, el desarrollo, y la apoptosis, la disfunción de la señalización celular a partir de mutaciones de genes puede resultar en cáncer [1 ]. Para hacer frente a las preguntas anteriores, se investigó la distribución de los genes con mutaciones que coexisten en las vías de señalización celular y humanos en una red de señalización celular humana. Co-produciendo genes mutados fueron asignadas por primera vez en 183 vías de señalización humanos, y 42 pares de genes con mutaciones concurrentes fueron asignadas a las mismas vías. A continuación, se realizó un ensayo de la asignación al azar para evaluar si de genes co-produciendo mutaciones prefieren a ocurrir en la misma vía de señalización (véase Materiales y métodos). Los resultados sugieren que genes co-produciendo mutaciones prefieren existir en la misma vía de señalización (P = 0,002, prueba de aleatorización, la Figura 2A). Esta observación sugiere además que las mutaciones de un solo gen en una ruta de señalización pueden no necesariamente afectar letalmente la vía, y que las disfunciones de una vía son a menudo el resultado de la co-ocurrencia de mutaciones de dos o más genes. Para determinar si los genes con mutaciones concurrentes tienden a tener interacciones directas durante la señalización celular, se investigó la distribución de los genes del cáncer con mutaciones concurrentes en una red de señalización celular humana. Un total de 306 genes de cáncer fueron asignadas primero en la red de señalización, y 107 de estos genes se determinó que existen en la red de señalización. Para pares de genes con mutaciones concurrentes, el 7,0% de ellos tenía interacciones directas en la red de señalización. En comparación, para los pares de genes que no tienen mutaciones concurrentes, sólo el 2,8% de ellos tenía interacciones directas en la red de señalización. Esto indica que los genes con mutaciones concurrentes tienden a tener interacciones directas de señalización (p = 0,02, prueba exacta de Fisher, odds ratio (OR) = 2,45). Las células deben utilizar las señales correctas (es decir, activación o represión) para hacer una respuesta adecuada a los diversos estímulos [14]. Diferentes señales pueden dar lugar a células diferentes destinos [15], [16]. Es interesante para revelar que las señales de estos genes del cáncer que interactúan prefieren utilizar. Para hacerlo, se contó el número de señales diferentes entre los pares de genes de cáncer que interactúan. Los resultados muestran que estos genes utilizan más señales de activación (69.2%), menos señales de represión (6,8%) y las interacciones físicas (24,0%) que la media (47,5%, 14,6% y 37,9% para la activación, represión, y enlaces físicos , respectivamente). Las señales utilizadas por estos genes del cáncer son fuertemente desequilibrada (P = 4,1 × 10
-6, prueba de Chi-cuadrado). Además, estos genes del cáncer prefieren utilizar las señales de activación y evitar el uso de señales de represión (P & lt; 2,0 × 10
-4, prueba de aleatorización; Figura 2B). Estos resultados sugieren que, en muchos casos, las mutaciones en un solo gen en una ruta de señalización no pueden afectar significativamente la señalización celular, y que las mutaciones acumuladas en la activación interacción de señalización tienden a amplificar los efectos de las mutaciones del gen de cáncer y por lo tanto tienen influencias significativas en la disfunción de la vía de señalización. Por tanto, estas mutaciones pueden contribuir más a la formación del cáncer y el desarrollo de otras mutaciones.
La flecha roja indica el número real de pares de genes del cáncer que existen en la misma vía. La curva es la distribución del número aleatorio de pares de genes de cáncer que existen en la misma vía. (B) Distribución de número de señales de activación y represión entre los pares de genes del cáncer con mutaciones concurrentes. El círculo rojo (señalado por una flecha roja) indica el número real de las señales de activación y señales de represión que existen entre los pares de genes del cáncer en la red de señalización humana. El mapa de calor indica la distribución de la unión de números aleatorios de las señales de activación y señales de represión que existen entre los pares de genes del cáncer en la red de señalización humana. (C) La correlación entre la distancia de los genes del cáncer en la red CCA y su similitud expresión.
Red distancia de los genes en la red CCA se correlaciona con su expresión similitud
Los resultados anteriores sugieren que los genes del cáncer con mutaciones concurrentes tienden a ser más funcionalmente relacionadas que los pares de genes al azar. Por lo tanto, los genes que están cerca el uno al otro en la red pueden estar más relacionadas funcionalmente que los genes que están lejos el uno del otro. Se ha informado de que la similitud de la expresión génica tiene una buena correlación con el gen similitud funcional [17], [18], [19]. Por lo tanto, se espera que la distancia de red (la longitud de la trayectoria más corta entre dos nodos en una red) de estos genes del cáncer que se correlaciona con su similitud expresión. Para confirmar esta expectativa, el autor calcula en primer lugar la expresión similitud de pares de genes que interactúan en la red CCA sobre la base de los datos de expresión de genes humanos presentados por Su et al. [20] por la correlación de Pearson, que se utiliza con frecuencia para calcular la similitud de la expresión génica (ver Materiales y métodos). A continuación, se analizó la correlación entre la distancia de red y la similitud expresión de genes en la red CCA. Como era de esperar, la distancia de la red y la expresión similitud tienen una correlación negativa (R = -0.04, P = 6,9 × 10
-11, correlación de Spearman). Teniendo en cuenta que muchos pares de genes tienen la misma distancia de la red, lo que puede generar sesgos en el análisis de correlación, los pares de genes se integraron su vez en grupos de acuerdo a su distancia a la red, y se calculó la expresión similitud promedio para cada grupo de pares de genes. Como se muestra en la Figura 2C, la distancia a la red de genes agrupados se correlaciona negativamente con su similitud expresión (R = -0,89, P = 0,03, de correlación de Spearman). Estos resultados indican que los genes con mutaciones concurrentes tienden a ser más relacionados funcionalmente, y viceversa.
Los genes con co-produciendo mutaciones tienden a tener frecuencias de mutación similares, mientras que los genes con anti-co-produciendo mutaciones tienden tener diferentes frecuencias de mutación
La frecuencia de mutación varía para los diferentes genes del cáncer y los diferentes tipos de cáncer. Por ejemplo, P53 está mutado en casi el 90% de muestras de cáncer de esófago, pero sólo en 7,5% de muestras de cáncer de riñón. Aunque una gran escala de genes mutados concurrentes se han identificado en este estudio, los patrones de la frecuencia de mutación de estos genes siguen siendo desconocidos. Para hacer frente a la falta, se calculó la diferencia absoluta de la frecuencia de mutación (AD) para cualquier par de genes vecinos en la red. a continuación, se compararon los valores de AD para los genes con mutaciones concurrentes, los genes con mutaciones anti-co-existentes, y los pares de genes al azar. Se han encontrado genes con mutaciones concurrentes a tener AD valores más pequeños que los genes con mutaciones anti-concurrentes (P = 3,32 × 10
-7, prueba de Wilcoxon, Figura 3A). También se encontró que los genes con mutaciones concurrentes tienen AD valores más pequeños que los pares de genes al azar (P = 0,002, prueba de aleatorización, la figura 3B), mientras que los genes con mutaciones anti-co-produciendo tener mayores valores de AD que los pares de genes al azar (P & lt ; 0,0002, prueba de aleatorización, la figura 3C)
(a) Comparación de los valores de AD de los genes con mutaciones concurrentes (rojo) y los genes con mutaciones anti-concurrentes (verde).. (B) Comparación de los valores de AD mediana de los genes con mutaciones concurrentes (flecha roja) y la distribución de los valores de la mediana de 5.000 grupos al azar de genes con mutaciones concurrentes. (C) Comparación de los valores de AD mediana de los genes con mutaciones anti-concurrentes (flecha verde) y la distribución de los valores de AD mediana de 5.000 grupos al azar de genes con mutaciones anti-co-produciendo.
Las funciones de red están asociados con las características de genes
una característica importante de un nodo en una red es su grado [21]. El grado de un nodo se representa como el número de enlaces que tiene. Esta es una métrica importante para medir la centralidad de un nodo en una red. Sin embargo, aún no se sabe que los genes tienden a tener más mutaciones concurrentes que otros genes en la red CCA. Como tal, se investigaron más las asociaciones de nodo de grado con una longitud de nodo, la frecuencia de mutación, y el número de exones. Los resultados del análisis muestran que el grado no está asociado con la frecuencia de mutación o la longitud de genes, pero se correlaciona positivamente con el número de exones (R = 0.13, P = 0.02, correlación de Spearman). Esto sugiere que las proteínas compuestas de más exones pueden tener una mayor diversidad funcional y, por lo tanto, potencialmente pueden tener más interacciones físicas o bioquímicas con otras proteínas. Esto sugiere además que co-ocurrencia de mutaciones de estas proteínas con otras proteínas a menudo puede ser necesario que la disfunción de las diversas vías que contribuyen a la tumorigénesis.
El coeficiente de agrupamiento (CC) es otra característica importante para los nodos en redes [21], ya que representa la coherencia de las regiones locales en las redes. La red tiene una CCA CC promedio de 0.48. Esto indica que a menudo se necesitan las mutaciones de múltiples genes en la tumorigénesis. Por otra parte, la CC de genes se correlaciona negativamente con su frecuencia de mutación (R = -0,19, P = 7,09 × 10
-4, de correlación de Spearman) y positivamente correlacionado con su grado (R = 0,19, P = 6,29 × 10
-4, de correlación de Spearman). Teniendo en cuenta que los genes con mutaciones concurrentes tienden a tener una relación funcional, según lo revelado anteriormente, este resultado sugiere que los genes en una estructura de red local densamente interactuado (es decir, los genes con muchas interacciones mutuas) tienden a ser más robusto frente a errores (por ejemplo, mutaciones ) y tienen letalidad más pequeño que los de una estructura de red local escasamente interactuado. Además, tanto el aumento del grado y CC desde el espacio extracelular al núcleo (grados mediana son 3, 6, 6 y 6.5; CC medianos son 0,17, 0,40, 0,44, y 0,45), lo que indica que los componentes celulares aguas abajo tienden a cooperar más entre sí en las disfunciones celulares que contribuyen al cáncer que los componentes celulares de aguas arriba.
la red CCA muestra estructuras modulares
al igual que muchas otras redes biológicas, la red CCA también muestra estructuras modulares. En una red, un módulo de red se refiere a un grupo altamente interconectada de nodos [21]. Los nodos entre dos módulos de red son escasamente conectado. Como se muestra en la Figura 1, la red CCA claramente tiene dos módulos. Estudios previos han revelado que los nodos de un módulo de red tienden a trabajar juntos para lograr una función específica [21], [22]. Para confirmar si o no los dos módulos en la red CCA tienen funciones distintas, las funciones moleculares enriquecidos (MFS), procesos biológicos (BPS), y componentes celulares (CC) de los genes en los dos módulos se identificaron utilizando el software DAVID [23 ] y el establecimiento de todos los genes del cáncer en los dos módulos como la población de referencia. DAVID es una herramienta popular para identificar conjuntos de genes enriquecidos (es decir, las vías, los términos de ontología de genes) mediante la evaluación de la importancia del enriquecimiento de los genes interesados en cada conjunto de genes predefinido [23]. Llevamos a los conjuntos de genes con valores de p menor o igual a 0.05 conjuntos de genes como significativos. Los resultados revelan que los dos módulos tienen conjuntos distintos enriquecido de genes (Figura 4; File S2). En términos de localización celular, por ejemplo, el Módulo Uno se enriquece en la membrana y el núcleo, mientras que el Módulo Dos se enriquece en el espacio intracelular. Ambos módulos se enriquecen con la función de unión, pero tienden a unirse con moléculas diferentes. Módulo Uno se enriquece con la unión de ADN, mientras que el Módulo Dos se enriquece con pequeñas moléculas de unión tales como adenil ribonucleótido, nucleótido de purina, ATP, y los lípidos. Por otra parte, los dos módulos también son diferentes en su procesos metabólicos y de señalización. Estos resultados indican que los genes con mutaciones concurrentes y anti-co-produciendo muestran arquitectura específica con respecto tanto a la topología y función.
Módulo Uno (palabras con color rojo) se enriquece en la membrana y el núcleo y el módulo Dos (palabras con color amarillo) se enriquece en el espacio intracelular. Las funciones enriquecidas y los procesos biológicos de cada módulo también se representan en los lugares correspondientes.
El autor preguntó si los genes en dos módulos podrían funcionar de una manera compensatoria o concertado para gobernar varias funciones. Con este fin, un conjunto de datos independiente de las mutaciones del gen del cáncer de todo el genoma de 22 muestras de cáncer de Sjoblom et al. 'Se utilizó estudio [7] para investigar la distribución de las mutaciones genéticas en los dos módulos. El autor contó el número de muestras que tienen mutaciones genéticas en ambos módulos, sólo en el Módulo Uno, y sólo en el módulo dos, respectivamente. Como resultado de ello, entre el total de muestras de 22 cáncer, 8 muestras tienen mutaciones genéticas en los dos módulos, 14 muestras tienen mutaciones de genes solamente en el Módulo Uno, y no hay muestras tienen mutaciones de genes solamente en módulo dos. modelado aleatoria de la distribución de los tres números muestra que las muestras tienen mutaciones genéticas en ambos módulos se producen con una probabilidad de 25% en el caso de azar. Este resultado sugiere que los genes de los dos módulos tienen una tendencia a trabajar juntos de manera complementaria para generar fenotipos tumorales. Por otra parte, todas las muestras tienen al menos una mutación del gen en el Módulo Uno. Este número es significativamente mayor que el caso aleatorio (P & lt; 2,0 × 10
-4, prueba de aleatorización; Figura 5A), lo que indica que este módulo parece ser el jugador crítica y esencial en la tumorigénesis. Esta conclusión se ve apoyada por las siguientes observaciones. (A) Módulo Uno se enriquece en función de anti-oncogén (S2 File). (B) Los genes en el Módulo Uno tienen una mayor fracción de metilación (10,0%, 21/210) en las células madre del cáncer que aquellos en el Módulo Dos (1,1%, 1/88). El autor obtuvo el número de genes metilados en estos dos módulos por primera cartografía de genes metilados en los genes de estos dos módulos y luego contar el número de genes metilados mapeadas en el Módulo Uno y el módulo dos, respectivamente. La prueba exacta de Fisher muestra que los genes del cáncer metilado ha enriquecido significativamente la distribución en el Módulo Uno (P = 0,006), lo que sugiere que los genes en el Módulo Uno contribuyen más a la pérdida a largo plazo de la expresión génica y representa la etapa inicial de la formación de tumores [1]. (C) La frecuencia de mutación de los genes en el Módulo Uno es significativamente mayor que la de los genes en el Módulo Dos (P = 5,75 × 10
-9, prueba de Wilcoxon; Figura 5B). Se obtuvo el significación estadística mediante la prueba de Wilcoxon para probar la diferencia entre dos grupos de frecuencia de mutación de genes de cáncer de Módulo Uno y el módulo dos.
El eje x representa el número (M) de las muestras que tienen al menos una mutación en el Módulo Dos. El eje Y representa el número (N) de las muestras que tienen mutaciones solamente en módulo dos. El círculo rojo (señalado por una flecha roja) indica el número real de M y N. El mapa de calor indica la distribución unión del número aleatorio de M y N y de su color representa la densidad de probabilidad. (B) Comparación de la frecuencia de mutación de los genes en el Módulo Uno y los genes en el módulo dos.
Discusión
A pesar de una serie de genes del cáncer de contribuir a la tumorigénesis de una forma de co-produciendo o anti-co-produciendo mutaciones, ha sido un reto para ganar un panorama global de cuándo, dónde, y cómo sus interacciones ejercen efectos sobre la formación y el desarrollo de tumores. Con la construcción de una red CCA y realizar un análisis integral de esta red, el autor descubrió una imagen global de las mutaciones del gen del cáncer de co-produciendo y anti-co-ocurren. mutaciones co-produciendo preferentemente se presentan en pares de genes funcionalmente relacionados, tales como moléculas de señalización de transducción, especialmente las moléculas de transducción de señales de activación. Los pares de genes que interactúan cáncer tienen un efecto en sus frecuencias de mutación. Los genes con mutaciones concurrentes tienden a tener frecuencias de mutación similares, mientras que los genes con mutaciones anti-co-produciendo tienden a tener diferentes frecuencias de mutación. Topológicamente, la red CCA muestra dos módulos que tienen funciones específicas. Los dos módulos tienden a tener colaboraciones funcionales y Módulo Uno parece ser el actor central de contribuir a la tumorigénesis.
Debido a la enorme diversidad y complejidad de las mutaciones del gen del cáncer, cánceres, incluso el mismo tipo de cáncer muestran muy diferente perfiles de mutación y algunos patrones comunes detrás de estos datos han sido identificados. Por lo tanto, algunos investigadores dudan del valor de la genómica del cáncer [24]. Por un análisis a nivel de sistemas, este estudio ha presentado una evidencia directa de los principios de genes del cáncer de mutaciones co-produciendo y anti-co-producen, que son útiles para entender el mecanismo por el cual los genes del cáncer contribuyen a la formación y el desarrollo del cáncer de una manera de co-ocurriendo o mutaciones anti-co-produciendo.
La secuenciación de los genomas del cáncer es un proceso continuo. Actualmente, los datos de mutación secuenciados pueden interpretar sólo una parte de las mutaciones. A medida que el desarrollo de la tecnología de secuenciación del genoma de próxima generación, se acumularán más y más datos de mutación génica del cáncer. Por lo tanto, se espera que las observaciones más fiables y novedosos se realizarán en el futuro. Este estudio presenta un marco biología de sistemas para el análisis integral de los resultados de secuenciación del genoma del cáncer, lo que será útil no sólo para la comprensión de la tumorigénesis, sino también la identificación de biomarcadores valiosos y blancos de la droga.
Materiales y Métodos
datos de mutación génica del cáncer
de datos de mutación génica del cáncer fueron descargados de la Catálogo de mutaciones somáticas en el cáncer (diciembre de 2008, cósmico, http://www.sanger.ac.uk/genetics/CGP/cósmico/). La frecuencia de mutación de un gen se calculó dividiendo el número total de muestras de cáncer que secuenciaron este gen con la de las muestras de cáncer con al menos una mutación de este gen, como se describe por Cui et al. [1]. Debido a que la frecuencia de mutación de genes se correlaciona significativamente con la longitud de genes (R = 0,4; p = 5,16 × 10
-14, correlación de Spearman), la frecuencia de mutación de genes se corrigió aún más por la longitud de genes utilizando la fórmula "longitud de la frecuencia de mutación original /gen".
genes metilados en células madre del cáncer de
Los 287 genes metilados en células madre cancerosas se obtuvieron a partir del estudio Cui et al 's [1], en el que se recogen estos genes de tres estudios [25 ], [26], [27]. Veintidós de los 287 genes fueron encontrados en la red CCA
vía de señalización celular humana y la señalización de la red
Ciento ochenta y cuatro vías de señalización humanos se obtuvieron de BioCarta (http: //www. .biocarta.com /) y una red de señalización celular humana se obtuvo a partir del estudio de Cui et al. [1]. La red de señalización celular humana incluyó 1.634 nodos y enlaces, que contienen 5.089 2.403 interacciones de activación, 741 interacciones represión, 1.915 interacciones físicas, y 30 enlaces cuyos tipos son desconocidos (S3 Archivo).
Red de co-producen y anti -CO-produciendo mutaciones en el gen del cáncer de
para cualquier par de genes, por ejemplo, a y B, se identificó primero el número de muestras de cáncer que se secuencia tanto de genes a y gene B. El número de muestras de cáncer con mutaciones en ambos genes A y B (AandB), el de cáncer de muestras con mutaciones solamente en el gen A (AnotB), el de cáncer de muestras con mutaciones solamente en el gen B (BnotA), y la de las muestras de cáncer con mutaciones en genes ni A ni B de genes (notAnotB) a continuación fueron contados. La significancia (valor de p) de las mutaciones del gen del cáncer de co-produciendo o anti-co-ocurrente fue determinada mediante la prueba exacta de Fisher sobre la base de los cuatro números obtenidos aún más. Una red de co-produciendo y co-produciendo contra las mutaciones del gen del cáncer (CCA red, archivos S1) se construyó mediante el establecimiento de un valor P de corte de 0,02. Cualquiera de los dos genes con valor de p de menos de o igual a 0,02 (FDR P & lt; = 0,08) fueron ligados. Por último, una red CCA se construyó a partir de este método. La red final incluyó 306 nodos y enlaces 1.366 (Figura 1), que fue elaborado por pajek, una visualización de la red libre y software de análisis (http://vlado.fmf.uni-lj.si/pub/networks/pajek/).
el grado y el valor de CC para cada nodo en la red CCA se calculó según la fórmula presentada por Barabási y Oltvai (S4 archivo) [21]. La frecuencia de mutación de los genes del cáncer también se da en S4 Archivo. Los componentes de red se identificaron mediante un programa Java diseñado para este propósito (S5 File). La distancia a la red de dos genes se obtuvo mediante el cálculo de la duración de su camino más corto, el cual fue implementado utilizando el algoritmo de Dijkstra. El grado de distribución se calcula R, un software estadístico libre (http://cran.r-project.org/). A medida que la red CCA mostró estructuras modulares muy claras, dos módulos de red (Archivo S6) se identificaron manualmente sin necesidad de utilizar otras herramientas.
Análisis de los datos de expresión de genes
En este estudio se obtuvo la expresión de genes humanos normalizada perfil a través de 79 tejidos humanos de Su et al. 'Estudio [20] para el análisis de similitud de la expresión génica. El autor extrae los perfiles de expresión de genes incluidos en la red de CCA y más midieron la expresión similitud de cualquiera de los dos genes vinculados en la red CCA por coeficiente de correlación de Pearson absoluta, que es una frecuencia utilizada métrica en análisis similar [17].
cálculos estadísticos
Todas las pruebas estadísticas se realizaron con el paquete R. Las pruebas de aleatorización se realizaron por programas Java diseñados para este propósito. La idea básica de las pruebas al azar fue introducido aquí por tomar la prueba para el enriquecimiento de las mutaciones concomitantes en los humanos vías de señalización como un ejemplo. Los genes fueron primero al azar volver a conectarse en la red utilizando el mismo número de enlaces. a continuación, se contó el número de re-generada enlaces que se encuentran dentro de las mismas vías de señalización. Estos procedimientos se repitieron 5.000 veces. El número de veces (T) el número aleatorio fue mayor o igual que se contó el número real. El valor P se calculó utilizando la fórmula
(T + 1) /5001
.
Apoyo a la Información
Archivo S1. Francia El archivo de la red pajek de la red de genes del cáncer con el co-produciendo y anti-co-ocurren mutaciones
doi: 10.1371 /journal.pone.0013180.s001 gratis (0.05 MB TXT)
de archivos S2. List de las funciones moleculares enriquecidos (MFS), biológicos (BPS), y componentes celulares (CC) de los genes en el módulo 1 y módulo 2.
doi: 10.1371 /journal.pone.0013180.s002
(0,05 MB DOC)
archivo S3. List de los genes, sus funciones, localizaciones celulares y las relaciones de señalización en la red de señalización humana
doi:. 10.1371 /journal.pone.0013180.s003 gratis (0.49 MB XLS)
archivo S4. List de nodos de red y su coeficiente de frecuencia de mutación, el grado y la agrupación (CC)
doi:. 10.1371 /journal.pone.0013180.s004 gratis (0.01 MB TXT)
S5 Archivo. . Francia El archivo de código fuente Jave para la identificación de los componentes de la red
doi: 10.1371 /journal.pone.0013180.s005 gratis (0.00 MB TXT)
archivo S6. List de genes en dos módulos de red
doi:. 10.1371 /journal.pone.0013180.s006 gratis (0.00 MB TXT)
Figura S1. distribución
Grado de la red CCA
doi:. 10.1371 /journal.pone.0013180.s007 gratis (0.41 MB TIF)
Reconocimientos
El autor agradece a los revisores para comentarios y sugerencias valiosas, gracias Prof. Yongfeng Shang de valiosos consejos, y gracias Dr. Wei Pang para ayudar en el dibujo de la figura 4.