Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Biología Integrativa de red: Gráfico de prototipos para la co-expresión del Cáncer Redes

PLOS ONE: Biología Integrativa de red: Gráfico de prototipos para la co-expresión del Cáncer Redes


Extracto

análisis basado en la red se ha demostrado útil en áreas orientadas biológicamente, por ejemplo, para explorar la dinámica y la complejidad de las redes biológicas. La investigación de un conjunto de redes permite derivar el conocimiento general acerca de las propiedades topológicas y funcionales subyacentes. El análisis integrador de redes normalmente combina redes de diferentes estudios que investigan los mismos o similares preguntas de investigación. Con el fin de realizar un análisis integrador a menudo es necesario comparar las propiedades de búsqueda de bordes en el conjunto de datos. Esta identificación de los bordes comunes suele ser complicado y computacional intensivo. A continuación, presentamos un enfoque que es diferente de la inferencia de una nueva red sobre la base de características comunes. En su lugar, seleccione una red como un prototipo gráfica, que a su vez representa un conjunto de objetos de red comparables, ya que tiene la distancia media al menos todas las otras redes en el mismo conjunto. Se demuestra la utilidad del enfoque de prototipos gráfico en una serie de redes de cáncer de próstata y de un conjunto de redes benignos correspondiente. Además, muestran que las distancias dentro del grupo de cáncer y el grupo benigna son estadísticamente diferentes en función de la medida de distancia utilizada

Visto:. Kugler KG, Mueller LAJ, Graber A, Dehmer M (2011) Biología Integrativa de red: Prototipos gráfica para la co-expresión del cáncer de Redes. PLoS ONE 6 (7): e22843. doi: 10.1371 /journal.pone.0022843

Editor: Dongxiao Zhu, de la Universidad de Nueva Orleans, Estados Unidos de América

Recibido: Marzo 22, 2011; Aceptado: 30 de junio de 2011; Publicado: July 29, 2011

Derechos de Autor © 2011 Kugler et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este proyecto fue apoyado por el Tiroler Zukunftsstiftung y la Tiroler Wissenschaftsfonds. Este trabajo también fue financiado por el cometa Centro ONCOTYROL y financiado por el Ministerio Federal de Transportes de Innovación y Tecnología (BMVIT) y el Ministerio Federal de Economía y Trabajo /Ministerio Federal de Economía, Familia y Juventud (BMWA /BMWFJ), el Tiroler Zukunftsstiftung (TZS) y el Estado de Estiria representado por la Agencia de Promoción de Negocios de Estiria (SFG). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

para muchas enfermedades ya no los genes individuales actuar como marcador, sino un conjunto de genes que interactúan puede ser utilizado para caracterizar o diagnosticar un proceso patológico [1]. Impulsado por que una gran cantidad racional de nuevos métodos de análisis de datos surgido en los últimos años, como la necesidad de métodos que son capaces de capturar surgieron las complejidades relacionadas. Un ejemplo sencillo es la búsqueda de objetos que están muy conectados con otros objetos y, por tanto, pueden desempeñar un papel central en los procesos de regulación. El análisis basado en la red [2] de datos biológicos es un campo relacionado en la biología de sistemas [3]. Mientras que el análisis de datos clásica fue impulsado por un punto de vista reduccionista, la biología moderna red apunta a percibir los datos de manera integral [3]. El uso de redes permite dejando atrás la exploración estática de una característica a la vez, y que permite una investigación de la naturaleza dinámica más realista de los datos biológicos y médicos. La dinámica se encuentran en varias dimensiones, como los sistemas cambian con el tiempo [4], reaccionan a las perturbaciones [5] o simplemente están formado por las funciones biológicas, que están vinculados entre sí en las cascadas de complejos [6]. Al mismo tiempo, la combinación de diferentes fuentes de datos se ha convertido en un procedimiento estándar en biología computacional moderna. Ya sea por medio de la integración de datos o meta-análisis clásico, todavía se está poniendo en la estandarización de los enfoques que permiten un análisis mucho esfuerzo integrador [7]. Enfoques integradores permiten incrementar la base de pruebas para nuevos hallazgos mediante la combinación de información de diferentes fuentes. En una clásica visión de integración de datos se refiere a la integración de los datos de distinta naturaleza (por ejemplo, la expresión de genes y proteómica). En el presente trabajo, también nos referimos a la integración del mismo tipo de datos como la integración de datos

Investigación para la combinación de la biología de la red de datos y análisis integrador ha florecido en los últimos años [8] -. [10]. Esto permite derivar generalizaciones a partir de un conjunto de diferentes redes que investigan los mismos o similares preguntas de investigación. Tales conclusiones generales se pueden utilizar para responder a las preguntas biológicas o para crear nuevas hipótesis sobre los procesos subyacentes. La medición de la similitud entre las redes ha demostrado ser útil para la evaluación de los efectos sistemáticos de evolución en el tiempo de las redes metabólicas [8], a juego interacciones de regulación [9] o para la identificación de subgrafos similares en pares de las redes [10]. Otra aplicación del análisis comparativo de la red es la comparación sistemática de las dos redes de asociaciones que fueron recortados de las correlaciones parciales [11]. Sin embargo, la detección e inferir el conocimiento acerca de las propiedades comunes de un conjunto de redes es una tarea difícil, puesto que la comparación de las redes depende de la definición de la medida de similitud subyacente. Sin embargo, la similitud entre los objetos no se define de forma única desde múltiples aspectos tales como la estructura, la función y la semántica están involucrados [12]. Por lo tanto, es necesario encontrar características comparables en redes biológicas. A menudo esto se hace mediante la detección de bordes o vértices comunes, y la comparación de ellos o sus distribuciones [13], [14]. Para abordar el tema de manera significativa que comparan las redes biológicas se ha desarrollado una multitud de métodos. Podemos aquí sólo se presenta una pequeña selección de estos enfoques y sus aplicaciones. Piruzian et al. información topológica empleado para la integración de datos de transcriptómica y proteómica en un enfoque basado en el rango [15]. Una forma generalizada de la distribución de grado, el llamado grado de distribución graphlet, se puede aplicar para determinar la similitud de la red [16]. Graphlets también se utilizaron para alinear PPI redes de humano y de levadura [17]. Un método estadístico para comparar las redes de enfermedades grandes inferidas de cáncer de cuello uterino utilizando una descomposición árbol y técnica de alineación también fue propuesto en [18]. Aquí, nos centramos en la aplicación de redes que comparan, que se derivan de un mismo tipo de datos y se utilizan como representaciones de una clase de espécimen. Por lo tanto, se analiza un conjunto de redes asociativas derivadas de cáncer de próstata datos de expresión génica. Al hacer uso de esta combinación es posible derivar información generalizada sobre los hallazgos basados ​​en la red relacionados con ciertas enfermedades o estados de desarrollo. Un enfoque común para el problema de analizar las propiedades de red por medio de meta-análisis es comparar la superposición de los bordes en diferentes redes. Hemos demostrado su utilidad para una integración basada en la red en un estudio anterior [19]. Un enfoque similar para los bordes compartidos fue dada por Cootes et al. [10]. Un método alternativo fue presentado por Wang et al., Que utiliza información sobre el efecto del tamaño de combinar la información de un conjunto de red [20]. Sin embargo, este enfoque requiere información sobre el efecto de tamaño para estar disponible. La detección de bordes comunes en una red es una tarea difícil si ninguna asignación adecuada entre las etiquetas de los vértices está disponible. Al considerar las redes de co-expresión, las etiquetas de los vértices se refieren a los nombres de genes. Con el fin de generar un espacio de nombres común a través de las diferentes redes, por lo que es útil para asignar los identificadores de genes, la plataforma dependido específicos para el estudio de otros identificadores, por ejemplo, identificadores de genes Entrez.

En el presente trabajo se demuestra un enfoque alternativo para inferir propiedades topológicas comunes para un conjunto de redes. Aquí, la creación de prototipos gráfico puede entenderse como un método que selecciona una red existente de un conjunto de redes como representante para el conjunto completo, con respecto a una medida de distancia gráfico subyacente [21]. Esto significa que el prototipo gráfico estructural representa las propiedades topológicas de un conjunto completo de redes, dependiendo del criterio de selección que se define por las medidas de distancia gráfico. Una ilustración esquemática para la selección de un prototipo gráfico se da en la Fig. 1. Tenga en cuenta que otras definiciones de prototipos gráfico como el llamado árbol de consenso [22] También se han explorado. Pero esas no serán discutidos en este documento. Por lo tanto, este prototipo de red se puede utilizar para realizar un análisis topológico y deducir nuevos conocimientos, ya que representa las propiedades de todas las demás redes del mismo conjunto. Un punto fuerte de este método es que la detección de bordes o nodos comunes pueden llegar a ser innecesaria, dependiendo de las medidas de distancia gráfico empleadas. Entonces, es fundamental el uso de una medida de distancia gráfico cuya complejidad computacional es polinomio. Para llevar a cabo la creación de prototipos gráfica, seleccionamos medidas de distancia gráfica adecuados que son capaces de cuantificar de manera significativa la distancia entre dos redes. Como parte de nuestra contribución describimos cuatro medidas de distancia que se basan en las distribuciones de probabilidad de las propiedades de red. Este es otro punto fuerte de este método, ya que puede ser modificado para hacer uso de otras medidas de distancia de gráficos personalizados,. Para demostrar la selección de un prototipo gráfico [21], [23] que hacen uso de cáncer de próstata estudios de expresión génica. 25% de los cánceres masculinos recién diagnosticados en los EE.UU. son los cánceres de próstata [24], lo que hace que sea un objetivo atractivo para la investigación biomédica en curso. Una amplia gama de estudios se han realizado en los últimos años, y gran parte de los datos correspondiente está disponible en los repositorios de datos públicas [25] - [27]. Aplicamos nuestro método en un conjunto de siete estudios de cáncer de próstata [28-24], que consisten en muestras de cáncer y muestras de tejido benigno o saludable. Esperamos un resultado doble: En primer lugar, esperamos ver importantes diferencias estructurales entre los estudios benignas y cancerosas, haciendo uso de medidas topológicas. En segundo lugar, esperamos ver diferencias significativas entre las distancias dentro de las redes de datos de cáncer y las distancias dentro de las redes de datos benignos. Esto podría mostrar que no sólo las propias redes difieren, pero que incluso las semejanzas entre los dos grupos diferentes. Si es así, los procesos patogénicos que son causadas por el cáncer son más probablemente responsable de explicar estas observaciones. Basado en el trabajo previo [19] esperamos observar similitudes más altas dentro del grupo de cáncer. Más precisamente, esperamos distancias dentro de los conjuntos de datos de un grupo de cáncer sean más pequeños que los de un conjunto benigna.

Esta figura ilustra esquemáticamente la derivación del prototipo gráfico.

La trabajo se organiza de la siguiente manera: En la sección "datos y Métodos 'se presentan los conjuntos de datos explotados y el proceso de inferencia de las redes. A continuación, se describe el enfoque de creación de prototipos gráfico y las medidas de distancia de gráficos empleados en detalle. resume y la sección "Resultados" se describen los resultados obtenidos. La sección "Discusión y Outlook 'termina el papel con la discusión de nuestros resultados y es seguido por algunas observaciones finales.

Materiales y Métodos

Datos de próstata Cáncer

Se demuestra la gráfica enfoque de prototipos utilizando un conjunto de estudios sobre el cáncer de próstata. Desde este cáncer ha sido investigado a fondo durante los últimos años, un número mayor de datos de expresión génica es a la mano a través de repositorios públicos. Para el estudio presentado NCBI GEO [25], EBI ArrayExpress [26] y Oncomine [27] se llevó a cabo una encuesta sobre los repositorios. Para su inclusión en nuestros estudios de análisis tiene que reportar los niveles de expresión de genes de cáncer de próstata y muestras benignas utilizando microarrays. espécimen benignos son o bien muestras de tejido normal adyacente a los tumores o varones sanos. Nos eXpurgate formas metastásicas de las muestras de cáncer de este estudio con el fin de disminuir la heterogeneidad en las redes. También se incluyen los datos de expresión de la línea celular. . Para reducir el esfuerzo de preparación de datos y mapeo sólo se incluyen las plataformas de microarrays de Affymetrix en este estudio

Para la realización de este análisis se seleccione siete conjuntos de datos [28] - [34] de la agrupación de datos que se enumeran en la Tabla 1. para investigar el efecto del tamaño de la muestra dentro de los estudios a los resultados de una amplia gama de tamaños de la muestra (de pequeños estudios para los más grandes) está permitido. Después de la selección de los estudios a incluir, nos re-ejecutar una pre-procesamiento de microarrays. Los tamaños de las muestras dadas en la Tabla 1 se refieren al estado de control posterior a la calidad. Para permitir la comparación entre los estudios de los genes, los identificadores originales se asignan a los identificadores de genes Entrez mediante el paquete de BioMart [35] para Bioconductor [36]. Dondequiera múltiples probesets se asignan a un identificador de genes Entrez, conservamos la medición con la más alta varianza. Después de este mapeo 8906 genes comunes dentro de los siete estudios se dejan para su posterior análisis. Para derivar una representación de red adecuada de los datos, se eligió la creación de redes de asociaciones. Sin embargo, los métodos que se presentan a continuación son aplicables a una amplia gama de otros tipos de red también, si se adoptan correctamente.

Red Inferencia

Para deducir una representación apropiada de la red de los datos subyacentes es una importante reto en la investigación basada en la red [37] - [39]. Existe una amplia gama de representaciones de red los datos biológicos [39] - [41], y el método gráfico de prototipos presentados más adelante se pueden aplicar para la mayoría de ellos. Aquí, utilizamos la información sobre la asociación entre dos genes. Por tanto, las redes resultantes se denominan redes de asociación. Para inferir y analizar los datos de expresión de genes como las redes de asociación, las relaciones co-expresión se han utilizado a menudo [42]. Tenga en cuenta, que la asociación no indica necesariamente causalidad. Una manera de abordar este problema es aplicar el concepto de pertenencia a causales [43], donde los genes han sido clasificadas funcionalmente.

A continuación, utilizamos la información mutua como una medida de la asociación, como se describe en [39 ]. Para inferir las redes a partir de los datos de expresión génica, se hace uso del algoritmo MRNETB [38]. Para configurar los conjuntos de datos para la selección de un prototipo gráfica, inferimos dos redes de cada estudio. Una red que se basa en la información de las muestras benignas en un estudio, y una red de las muestras de cáncer en el mismo estudio. Esto conduce a 6 redes benignos y 7 redes de cáncer, ya que eliminamos la red benigna partir de los datos Wang. Esto se hace debido al tamaño pequeño de la muestra (), ya que consideramos que la red inferida por ser de poca fiabilidad. En general, inferir una red para cada grupo de pacientes por separado permite realizar comparaciones topológicas y por lo tanto derivando nuevos conocimientos sobre las diferencias funcionales subyacentes.

Selección de un gráfico Prototipo

Para generalizar el problema gráfico de similitud [ ,,,0],21], se ha demostrado por Dehmer et al. que un gráfico puede ser usado para representar un conjunto de otros gráficos comparables [21]. La tarea de determinar esta llamada prototipo gráfico se puede resolver mediante la aplicación de medidas de distancia o de similitud [21], [44]. Dejar ser una red, y ser una medida de distancia gráfico. Tener un conjunto de redes, el prototipo gráfico puede ser expresado por [21], [23], [45] :( 1), vemos que en la ecuación. 1 da la distancia media desde la red a todas las otras redes. Denotamos esto como. Nuestro objetivo en el presente trabajo es aplicar una selección de medidas de distancia gráfico para la selección de prototipos de gráficos a partir de un conjunto de redes de cáncer de próstata y de un conjunto de redes benignos correspondiente. La aplicación de diferentes medidas de distancia gráfico que significa que podemos cubrir diferentes aspectos de la similitud estructural. En general, es un problema aún pendiente qué aspecto de una similitud estructural capturas medida en cuestión [44]. Si diferentes medidas de distancia gráfico seleccione la misma red como un prototipo gráfica de un conjunto de redes, esto aumenta la validez de la selección. Con respecto a la medida de distancia empleado el prototipo gráfico representa las propiedades topológicas de las otras redes del mismo conjunto. Por lo tanto, se puede utilizar para realizar un análisis topológico y funcional.

Medidas gráfico de la distancia

Con el fin de realizar el gráfico de creación de prototipos es necesario medir de manera significativa la distancia entre dos redes. En este apartado se presentan dos enfoques para llevar a cabo esta tarea. El primer enfoque se basa en el uso de juego gráfico inexacta. En particular, elegimos la denominada distancia de edición gráfica (
GED
) [46]. El segundo enfoque se basa en la comparación de dos distribuciones discretas de probabilidad [47], que se deducen mediante la derivación de las características estructurales de las redes.

El
GED
es el costo mínimo de una secuencia para la transformación de una gráfico en otro gráfico usando las operaciones de edición (borrar y añadir bordes o borrar, insertar, y sustituyendo vértices) [46]. El problema de fondo (para comparar dos gráficos estructuralmente) puede ser visto como una generalización del método de Levenshtein [48] para la comparación de secuencias. En general, el cálculo de la
GED Opiniones de gráficos (sin etiqueta) es computacionalmente exigente, ya que es NP-completo [49]. Para nuestro propósito, la complejidad puede reducirse debido a tres hechos [50]: i) Todas nuestras redes tienen el mismo número de (vértices no relacionados), ii) todos los vértices están marcadas de forma exclusiva, y iii) seleccionando sólo los genes que están presentes en todos los estudios, todas las redes tienen el mismo conjunto de vértices, que nos libera de borrar, insertar o sustituir algún vértice. Por lo tanto, la reducción de la complejidad computacional a [49]. Para la medición de las distancias entre dos redes, empleamos una forma normalizada, que viene dado por el porcentaje
GED gratis (
DESPGE
) [51] :( 2) donde es el número de máxima posible bordes en, y el factor se refiere a la naturaleza no dirigida de los bordes. Se pondera todas las transformaciones de edición restantes (insertar, eliminar) a partes iguales por la asignación de un peso de.

Un enfoque teórico de la información para cuantificar las distancias entre las gráficas se puede definir basa en la divergencia de Kullback-Leibler (
KLD
) [47]. Definimos dos distribución de probabilidad discreta y, por lo que el
KLD
se da como [47] :( 3) El
KLD
siempre se define de manera positiva para la distancia entre y. Tenga en cuenta que . A medida que el
KLD
es asimétrica y no satisface la desigualdad del triángulo, no es de métrica [52]. A continuación, calcular el prototipo gráfico mediante el establecimiento de la
KLD
en la ecuación. 1. Estabilidad numérico se asegura mediante el establecimiento de probabilidades de cero a.

Una distribución que normalmente se utiliza a menudo en la biología de sistemas es el grado de distribución. En las redes no dirigidas, el grado da el número de vecinos de un vértice. Si definimos al ser el número de vértices con los vecinos, podemos derivar una distribución de probabilidad de manera que: (4) donde es el número máximo de vértices vecinos. Higo. 2 muestra las distribuciones de grados de las redes benignas y cancerosas. puede ser utilizado para caracterizar una red [9], [42], [53] - [55], y se ha demostrado para ser libre de escala y siga una distribución de ley de potencia de varios tipos de redes biológicas [42], [ ,,,0],53] - [55]. distribuciones de ley potencial de los grados también se puede ver en la Fig. 2. A continuación, se utiliza para calcular el
KLD
, que por lo tanto se denota como.

Las distribuciones de grado para los datos benignos (arriba) y los datos sobre el cáncer (abajo). Para la visualización de razones recortamos el número de cuentas en 300.

Las distancias presente otra red prominente invariante. Para un vértice la distancia a todos los otros vértices está dada por (5), donde es el camino más corto entre los vértices y. Si dejamos que sea la cardinalidad de todas las distancias con la longitud, entonces la distribución según la distancia se da como (6), donde es el número de caminos. Vemos que. Nota, que es el diámetro de, que es el máximo de los caminos más cortos entre todos los pares de vértices. Las distribuciones de distancia para las redes se presenta en la Fig. 3. Se emplean las distribuciones de distancia de las redes incluidas con el fin de cuantificar la distancia entre dos redes, que se denota como.

Las distribuciones de distancia para los datos benignos (arriba) y los datos sobre el cáncer (abajo).

Mientras que para las tres medidas de distancia que presentamos por encima de la red completa, sin conexión se analizó, ahora presentan dos medidas de distancia que funcionan sólo en los gráficos conectados. Esto significa que tenemos para inferir la mayor subgrafo conexo de cada red y aplicar las dos medidas de distancia de ellos. La tercera distribución que incluimos en nuestro
KLD
basados ​​en medidas de distancia se basa en las probabilidades de vértices [56]. Una probabilidad vértice asigna un valor de probabilidad a un vértice, haciendo uso de un denominado vértice funcional [56] :( 7) vemos que. En este trabajo utilizamos el siguiente vértice funcional [56] :( 8) se da el número de vértices en el ámbito -th para cada vértice como [56]. Vemos que se basa en propiedades métricas de gráficos [57]. A continuación, dejamos que los factores de ponderación disminuyen de manera exponencial. Esto nos permite hacer hincapié en los vértices bastante cerca, ya que son probablemente más fuerte efectuada por la información que se extiende a partir de [56].

Por último, utilizamos una distribución que se puede calcular utilizando el contenido de información topológica basada en órbitas de vértices [58], [59]. Una órbita contiene topológicamente equivalentes vértices [58], y proporciona información sobre el número de vértices que pertenecen a la órbita vértice -th [58]. aquí determinamos una distribución de probabilidad sumando el número de órbitas que comparten el mismo número de vértices dentro de una red. Dejar ser el número de órbitas que contienen vértices. Si tiene órbitas de vértice entonces obtener la distribución de la órbita (9) Nota, que, cuando es la suma del número de órbitas que contienen el mismo número de vértices. La información sobre la distribución de vértices equivalentes topológicos en cada una de nuestras redes a continuación, se puede utilizar para combinar la información de un conjunto de redes por parte de la. Nos referimos a esto como.

Con cada uno de estos cuatro distribuciones de probabilidad presentados, podemos cubrir diferentes aspectos de las propiedades topológicas de nuestras redes. La distribución de probabilidad para se basa en información acerca de cómo conectar los genes en cada uno de las redes son. La información sobre las distancias de comunicación entre los genes se refleja en la distribución que se utiliza en. se basa en una distribución de probabilidad que describe la propagación de información en una red, mientras que la distribución de probabilidad en refleja equivalencia topológica de vértices. La Tabla 2 resume las medidas de distancia empleadas. Después de haber introducido nuestro aparato formal, calculamos las distancias y prototipo gráfica para los dos grupos de la muestra (benignas y cancerosas). Para los cálculos y análisis estadísticos hacemos uso del lenguaje de programación R estadística (http://www.r-project.org). Las distribuciones de probabilidad para calcular y se calculan utilizando el paquete QuACN [60].

Resultados

La Tabla 3 proporciona un resumen de las distancias medias de las cinco medidas de distancia y los dos grupos . Al calcular la vemos que la distancia media de las seis redes se extiende de a en el grupo benigno, y de que para los siete redes en el grupo de cáncer. Los valores medios son (benigno) y (cáncer). Higo. 4 proporciona una ilustración de todas las distancias individuales de una red a todos los otros en el mismo grupo. Una distinción entre la distribución de entre el cáncer y la muestra benigna puede ser visto. Para el grupo benigno, la red que se basa en los datos por Yu se selecciona como prototipo gráfica, mientras que para el grupo de cáncer de la forma de la red se selecciona los datos de Wang. La distancia media de los datos es Yu y Wang para los datos. La distancia media de la red específica de las gamas de que para las redes de los datos benignos, respectivamente, a los datos sobre el cáncer de próstata. Los valores medios son (benigno) y (cáncer). Higo. 5 visualiza los resultados. Los prototipos son seleccionados gráfico Yu (benigno) con una distancia media de y Wang (cáncer) con una distancia media de. , Que se basa en la distribución de la distancia dentro de una red, selecciona las redes de los datos Singh (benignos) y los datos de Wang (cancerosas) como prototipos de gráficos. Los prototipos de gráficos tienen una distancia media de (benigno) y (cáncer). Las distancias medias de una red a todos los demás en los mismos grupos para cada conjunto son (benignos) y (cáncer). Los resultados detallados se muestran en la Fig. 6. Las redes de Yu (benigno) y Wang (cáncer) se seleccionan de nuevo como prototipos de gráficos cuando se utiliza. El mínimo es para el prototipo gráfico benigna, respectivamente para el prototipo gráfico cáncer. Los valores medios son (benigno) y (cáncer). Las distancias de una red a todas las demás redes de un mismo grupo se ilustran como diagramas de caja en la Fig. 7. Junto con el presente representa los dos casos, cuando la distancia entre los datos del cáncer es más grande que dentro de los datos benignos. Para la medida basada en las órbitas las distancias de los prototipos gráfico son para la red Yu benigno y para la red de cáncer que se basa en los datos de Wang. Las distancias medias son (benigno) y (cáncer), como se muestra en la Fig. 8.

Esta figura ilustra las distancias de una red a todas las demás redes, basado en la Gráfica normalizada Editar Distancia
DESPGE
. En la parte izquierda que representa las distancias entre una red benigna y todas las demás redes benignas, mientras que en la parte derecha enumera las distancias por una red de cáncer a todas las demás redes de cáncer. Las redes que se seleccionan como prototipos gráfico se resaltan en diferentes colores (azul = benigna, cáncer = marrón).

A continuación, se muestran las distancias entre una red y todas las otras redes como diagramas de caja, medida por la divergencia de Kullback-Leibler, que se basa en el grado de distribución. En la parte izquierda se muestran los datos benignos, y en la parte derecha de las distancias de los datos sobre el cáncer. Los prototipos del gráfico se resaltan.

Esta figura muestra las distancias entre las redes como diagramas de caja. Las distancias se basan en la distribución de las distancias entre los vértices y la divergencia de Kullback-Leibler. En la parte izquierda son las distancias entre las redes benignas, y en la parte derecha las distancias entre las redes de cáncer.

Aquí, se muestra las distancias en base a la divergencia de Kullback-Leibler, basado en el funcionales esfera de vértices. En la parte izquierda se muestran las muestras benignas y en la parte derecha de las distancias de las muestras de cáncer. Los prototipos de gráficos seleccionados se resaltan.

Esta figura ilustra las divergencias Kullback-Leibler de las distribuciones de probabilidad órbita. En la parte izquierda se enumeran las muestras benignas, y en la parte derecha de las muestras de cáncer de los estudios.

Nuestra hipótesis principal es que hay una diferencia significativa entre las distancias en el grupo de cáncer y muestras de las distancias en el grupo de muestras benignas. Para probar esta hipótesis se emplea una prueba de Wilcoxon (ver Tabla 4) para cada una de las cinco medidas de distancia sobre el conjunto de distancias de las muestras de cáncer y las muestras benignas. Nos corregir las múltiples pruebas con el método de Bonferroni. ,, Muestran una diferencia significativa (), como se puede ver en la Tabla 4. El observaron resultados apoyan la hipótesis, ver los diagramas de caja en las figuras relacionadas.

Para la detección de patrones dentro del conjunto de distancias que empleamos la agrupación. Por lo tanto, se normaliza el resultado de cada medida de la distancia sin la información del grupo. Esto se hace para cada medida de la distancia por separado, de modo que el mínimo de cada medida de la distancia se establece en y el máximo a. A continuación, aplicamos la agrupación jerárquica. Para cada red tenemos un vector de características, que consiste en la distancia media a todas las demás redes para cada una de las cinco medidas de distancia utilizados. Por lo tanto, para la agrupación en general tenemos una matriz con 5 filas y 13 columnas. El mapa de calor correspondiente, utilizando la distancia euclidiana y la vinculación completa, se representa en la Fig. 9. También se aplica el promedio de vinculación como función de la agrupación, que conducen al mismo resultado. Por lo tanto, consideramos que el resultado observado como estable con respecto a estas dos funciones de vinculación. Los resultados muestran que tres de las redes de cáncer (Tsavachidou, Wallace, Singh, Liu) forman un grupo aparte, mientras que todas las demás redes se agrupan juntos. En el segundo grupo se observa que tres de las redes de cáncer (Chandran, Wang y Yu), el grupo de cerca de tres redes benignos (Yu, Singh, Tsavachidou).

Aquí mostramos la distancia media de una red a las otras redes dentro del mismo grupo (benigna o cáncer). Para la agrupación que luego omitió la información del grupo. Añadimos forma independiente la información del grupo en forma de barras de color marrón (cáncer) y las barras azules (benigno).

Sobre la base de los resultados de la creación de un prototipo gráfico seleccionamos la red a partir de los datos de Yu como prototipo para el gráfico benigna conjunto, y la red de los datos de Wang como prototipo gráfico para el conjunto del cáncer. Para el análisis de las propiedades topológicas de las redes se investigan los genes del cubo. La distribución de los 15 grados de cubo en su mayoría conectados se muestra en la Tabla 5. Se observa que los principales genes de concentradores de la red de cáncer son notablemente menores que las de la red benigna. Esto está de acuerdo con los resultados conocidos para los que se les aplicó el recuento de votos de última generación para el análisis de redes de integración [19]. En ese estudio también se observó bastante pequeños grados en la red cáncer común. Una desregulación de genes de cubo, asociada con el ciclo celular, puede jugar un papel importante en el desarrollo de una forma agresiva de cáncer de próstata [61]. Al igual que en otras redes libres de escala [62], [63], las redes biológicas pueden ser vulnerables a los ataques en contra de una de las pocos genes de cubo central. Sin embargo, se ha demostrado recientemente que el centro de los genes no califican necesariamente como siendo frágil, y que otras medidas para esta propiedad podría ser más apropiado [64]. El análisis de las distancias entre los vértices permite la caracterización de los procesos de comunicación en una red biológica. Por lo tanto, exploramos las distancias entre los vértices en los dos prototipos de gráficos. Por definición, la excentricidad de un vértice es el máximo de los caminos más cortos de todos los demás vértices. Para la gráfica benigna prototipo la mayoría de los vértices de tener una, mientras que para el prototipo gráfico cáncer de la mayoría de los vértices tiene una de 1. Se comparan las distribuciones de excentricidad de las dos redes con una prueba de Kolmogorov-Smirnov, que resulta en una muy significativa diferencia (). Otra característica interesante red es el diámetro de la red, que es el máximo de todos. Para los dos prototipos del gráfico son los diámetros 17 (benigno) y 12 (cáncer).

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]