Extracto
El cáncer es reconocida como una familia de enfermedades basadas en genes cuyas causas se encuentran en las interrupciones de los procesos biológicos básicos. Un catálogo cada vez más profunda de las redes canónicas detalla la interacción molecular específica de los genes y sus productos. Sin embargo, el mapeo de fenotipos de la enfermedad a alteraciones de estas redes de interacciones se logra indirectamente y no sistemáticamente. Aquí objetiva identificar las vías asociadas con la malignidad, puesta en escena, y el resultado en el cáncer mediante la aplicación de un enfoque analítico que evalúa sistemáticamente las diferencias en la actividad y la consistencia de las interacciones dentro de los procesos biológicos canónicas. El uso de grandes colecciones de expresión de genes en todo el genoma de acceso público, identificamos conjuntos pequeños y comunes de las vías - receptor TrkA, la respuesta de apoptosis al daño del ADN, ceramida, la telomerasa, CD40L y la calcineurina - cuyas diferencias con firmeza distinguir diversos tipos de tumores a partir de muestras normales correspondientes, predecir el grado del tumor, y distinguir fenotipos tales como el estado del receptor de estrógeno y el estado de mutación de p53. Vías identificadas a través de este análisis se desempeñan tan bien o mejor que los fenotipos utilizados en los estudios originales para predecir la evolución del cáncer. Este enfoque proporciona un medio para utilizar caracterizaciones de todo el genoma para mapear procesos biológicos claves a las características clínicas importantes en la enfermedad
Visto:. Efroni S, Schaefer CF, Buetow KH (2007) identificación de los procesos clave que subyacen en el cáncer fenotipos Utilizando Análisis vía biológica. PLoS ONE 2 (5): E425. doi: 10.1371 /journal.pone.0000425
Editor Académico: Nick Monk, Universidad de Sheffield, Reino Unido
Recibido: 5 de Enero, 2007; Aceptado: March 29, 2007; Publicado: 9 Mayo de 2007
Este es un artículo de acceso abierto distribuido bajo los términos de la declaración Creative Commons Public Domain que estipula que, una vez colocado en el dominio público, este trabajo puede ser reproducido libremente, distribuir, transmitirse, modificarse, construida sobre, o de otra forma utilizado por cualquier persona con cualquier objeto lícito
financiación:.. Esta investigación fue apoyada por el programa de investigación intramural del NIH, Instituto Nacional del cáncer
Conflicto de intereses :. los autores han declarado que no existen intereses en competencia
Introducción
fenómenos biológicos surgen como consecuencia de la acción de los genes y sus productos en las vías. surgen enfermedades a través de la alteración de estas redes complejas [1] - [5]. Con el fin de hacer afirmaciones mecanicistas que complementan los enfoques actuales a escala del genoma análisis [6] - [9], hacemos un mapa vías biológicas canónicas a fenotipos de cáncer. Un total de 2011 Affymetrix GeneChip gama hibridaciones obtiene a partir de 9 fuentes de datos de acceso público diferentes [10] - [17] fueron analizados. Las hibridaciones representados 70 tipos de tumores diferentes (1348 muestras). Adicionalmente 83 diferentes tipos de muestras de histología normal se incluyeron (663 muestras). Los niveles de expresión se ajustaron utilizando RMA [18]. La definición de normal utilizado aquí excluye muestras adyacentes no afectadas y /o tumorales obtenidas de individuos con cáncer.
El uso de vías como marco para el análisis no es en sí misma novela. Estos incluyen la proyección de los genes del cáncer conocidos y los datos de expresión de genes en las vías [19], [20]. Lo que distingue el trabajo que aquí se presenta es la evaluación sistemática de la estructura de interacción a través de las redes canónicas predefinidos. Al medir el estado de la interacción que combina la información de estado de genes y la estructura de la red. estados de genes múltiples pueden dar lugar a una puntuación vía común. Por el contrario, las puntuaciones de vía puede mostrar mayores diferencias que las firmas de genes.
Enfoques para la Rama de Análisis de
Esta investigación complementa otros trabajos de la utilización de la información vía.
Más específicamente, Segal et. Alabama. [6] se define módulos biológicos y los refinado para un conjunto de módulos estadísticamente significativas. Ellos fueron capaces de utilizar estos módulos para obtener una mejor perspectiva de los diferentes procesos biológicos que se activan y desactivan en diversas condiciones clínicas. Observamos dos principales diferencias entre lo que presentamos aquí y el trabajo en Segal et. Alabama. [6]: en primer lugar, los módulos biológicos utilizados en el papel, aunque muy informativo y útil, se definen internamente dentro del papel. La determinación de los genes en estos módulos se deriva de los mismos datos a los que se aplican después. Las vías canónicas que utilizamos son definidos externamente independiente de los datos que analizamos, representan los conocimientos actuales en el campo, y no se derivaron ad-hoc. En segundo lugar, Segal et. Alabama. no hacer uso explícito de las interconexiones, o la estructura de la red, que existe entre los genes que componen los módulos biológicos. Las calificaciones de actividad y la consistencia que aquí presentamos dependen de la estructura de la red y las relaciones específicas (tales como la inhibición y promoción) que son características de la información de red.
Otro enfoque importante es que de Rodas et. Alabama. [21], en el que se utiliza la red interactome humano para identificar subredes activados en el cáncer. El enfoque de Rodas el. Alabama. utilizar, en contraste con la que se presenta aquí, no intenta computacionalmente y algoritmos de relieve las diferencias en los fenotipos mediante la construcción de un clasificador alrededor características de la red medibles. En su lugar, se genera subredes por su asociación con grupos de genes identificados a través del sobre (o bajo) expresión en cada fenotipo biológico. Rhodes et. Alabama. enfoque hace uso de la estructura de la red para construir la subred, pero no hace uso adicional en la observación de la co-expresión o co-silenciamiento de los conjuntos de genes, como es el caso en el trabajo que aquí se presenta.
Bild et. Alabama. [14] y Glinski et. Alabama. [22] demostrar que las firmas de genes determinados por pequeño conjunto de vías canónicas preseleccionados puede distinguir las características del tumor. En su trabajo, que comienzan con un conjunto limitado de vías, (por ejemplo Bild et. Al., Utilizar 5 vías) y muestran que difieren en diferentes fenotipos. Como este enfoque comienza con un pequeño conjunto de las vías de los autores eligieron a hacer aquí, no tiene la capacidad para descubrir nuevas asociaciones de la vía con fenotipos. A diferencia del trabajo actual, que no emplea un método objetivo para identificar un conjunto de vías que pueden discriminar fenotipos
.
Los análisis enriquecimiento conjunto de genes [23] permite a los autores para elegir un conjunto de genes y para determinar su relación estadística importancia en una lista de genes que separan fenotipos. enriquecimiento conjunto de genes comienza con la premisa de genes individuales como clasificadores. pertenencia vía se mide para evaluar las contribuciones combinadas. Una vez más, el método no hace uso de la estructura de la red, ni proporciona una cuenta sistémica para el conocimiento combinado de las vías para reducir a un conjunto óptimo de los procesos de clasificación. Puesto que el método comienza con la discriminación de los genes individuales, sólo se puede construir sobre esta inferencia estadística, y no dar cuenta de las diferencias que provienen de la interdependencia de la interacción de múltiples genes. Por ejemplo, si el gen A parece permutan al azar en los dos fenotipos y el gen B parece permutan al azar en los dos fenotipos continuación, cada uno de los genes marcará mal en una prueba de significación estadística. Sin embargo, la puntuación definida por su dependencia combinada (por ejemplo (si A entonces B)) podría proporcionar mucho mayor discriminación.
El método por el Tomfohr, et. Alabama. [24] es tal vez el más cercano a la presentada aquí, en que se ve en los grupos combinados de los genes y los ordena en consecuencia. Sin embargo, Tomfohr, et. Alabama. no utilice el conocimiento estructura de la red para obtener puntuaciones, pero en su lugar realizar descomposición en valores singulares (SVD) para elegir un MetaGene específica, y definir una actividad de la vía como la expresión de ese gen. Como tal, el resultado no utiliza la interdependencia de la red al igual que el trabajo presentado anteriormente
Métodos
La evaluación de un estado del gen:.
Estado del gen
en la evaluación de la red interacción se calcula a partir de los datos observados como uno de dos estados alternativos: arriba y abajo. Para ser capaz de identificar si un gen está en un estado "abajo" o un estado "arriba", nos fijamos en su (RMA ajustado [18]) valor de expresión en una muestra, en comparación con los valores de la expresión del mismo gen en todos otras muestras. Para poder dar cabida a una gran variedad de distribuciones de probabilidad, se utiliza una distribución gamma como la plantilla tanto a la forma de distribución de "abajo", así como la distribución de "arriba", y redefinir el problema como una mezcla de dos distribución gamma. La forma suprimida a menudo sigue una distribución exponencial, que es un caso particular de una distribución gamma. El estado promovido con frecuencia sigue a una forma similar a una distribución normal, que puede ser aproximado por una distribución gamma de un gran media. Por cada juego de sondas de medida por el microarray, nos fijamos en la distribución de la expresión y tratar de adaptarse a esta distribución en una mezcla de dos distribuciones gamma. Hacemos esto mediante el uso de un algoritmo de Expectación-Maximización (EM), interactuando sobre los datos en una forma que garantice el aumento de la probabilidad de ajuste de los datos de las distribuciones modeladas. En el caso de las dos distribuciones gamma, lo primero que dividen los datos en dos grupos: los valores "abajo" y "arriba" valores. El número de genes en el "arriba" grupo es
N
T
y el número de genes en el grupo suprimido es
N
D
. Las probabilidades previas son, por tanto:
Asumimos cada grupo distribuye según una distribución gamma:
El objetivo del algoritmo EM es que nos proporcione estimaciones de máxima verosimilitud a la
una
T, b
T
valores para el grupo promovido y al
a
D, B
D
valores para el grupo suprimido. Además, se calcula las estimaciones de máxima verosimilitud de los coeficientes de mezcla, η
1, η
2.
Se supone que la distribución de la expresión de cada gen está bien proviene de una mezcla de dos distribuciones (uno para el caso de "arriba" y otro para el caso "abajo") o desde una única distribución (por ejemplo, cuando el gen es "arriba" en todas las muestras que tenemos). Determinamos el número de distribuciones subyacentes (uno o dos) utilizando el algoritmo EM en combinación con un método de selección de modelo, véase más adelante.
Para encontrar el máximo de la probabilidad de registro, tenemos que encontrar el máximo de la función auxiliar
Q
[25]: whereHere,
θ
es la colección de parámetros que definen la distribución, y el superíndice 0 designa magnitudes que habían sido determinados en la iteración anterior
.
para encontrar máximos, diferenciamos
Q
con respecto a los parámetros del modelo, y comparar a la zero.And Ψ coefficientswhere (
x
) es la función psi.
el uso de un multiplicador de Lagrange para incorporar la restricción que tenemos para maximizar el objetivo functionwith respecto al
η
i
, que deriveand obtainWe resolver este numéricamente (usando Matlab) en cada paso iterativo, hasta que llegar a algún criterio de convergencia predefinido
la elección de un número óptimo de distribuciones:.
Obviamente, los más distribuciones tomamos como base para las distribuciones generales, el mejor ajuste disponemos de los datos y la mejor la probabilidad será. Consideremos, por ejemplo, como muchas distribuciones ya que hay puntos de datos. Eso encajaría exactamente los datos y producir probabilidad máxima. Para superar esto, y ser capaz de elegir un número óptimo, se comparan los modelos con diferente número de distribuciones utilizando el Criterio de Información Bayesiano (BIC) [26], la función de coste calculado asThis compensa el aumento adicional de complejidad. El modelo estadístico elegido es el que tiene el mayor BIC
calcular y parecida:. Pero necesitamos la probabilidad de estar en el estado "promovido" por un valor de expresión específica: Y sincewe puede obtener los valores necesarios por: por ejemplo, la expresión del gen CDKN1A en el conjunto de datos [13] (una colección de muestras tumorales 698) sigue esta distribución (véase la Figura 1):
arriba /abajo pide a los estados de genes se basan en una valor de la expresión clasifica como residente en una de las dos distribuciones distintas.
las dos distribuciones distintas (arriba y abajo) son evidentes y el algoritmo da los parámetros para las dos distribuciones gamma.
actividad de la vía y la vía consistencia
Camino puntuación de consistencia: Para determinar la puntuación de consistencia vía de una vía de señalización dada en una muestra, seguimos estos pasos:
Cada ruta es un conjunto de interacciones. genes de entrada y de salida genes definen cada interacción. Para cada interacción en la vía, lo primero que mira en los genes de entrada y determinar, para cada uno de esos genes, la probabilidad de estar en un "abajo" o estado "arriba" (ver "estado gen" arriba)
a continuación, determinar la probabilidad de que la materialización de la interacción específica como la probabilidad conjunta de todos los componentes necesarios (genes) guía
a continuación, nos fijamos en la salida molecular de la interacción. Por lo general, esta salida es una lista de genes, para lo cual establecemos la probabilidad de estar en un "abajo" o estado "arriba" (ver "estado gen" arriba)
A continuación, se calcula la probabilidad de que el gen (s) de salida está en uno de los dos estados, bajo la probabilidad dada de la interacción (calculado en (b))
por último, para obtener la puntuación consistencia vía, se calcula la puntuación de consistencia para cada interacción en la vía y el promedio de los puntajes más de todas las interacciones para el que hemos sido capaces de obtener una puntuación. En la figura 2 se muestra un ejemplo para el cálculo del valor de consistencia de una interacción tomada de la vía "Señalización de eventos mediados por el receptor del factor de células madre (c-Kit)", una de las vías NCI-Naturaleza seleccionadas de la base de datos Camino Interacción (PID ) [27]. Los pasos específicos para el cálculo de la consistencia en este ejemplo son los siguientes:
Establecer probabilidades para todos los genes implicados en la interacción. Esto se realiza de acuerdo a los pasos descritos a continuación (véase la sección "Estado de genes"). Los valores que obtenemos son: P (CREBBP) = 0,95; P (STAT5A) = 0,8; P (KIT) = 0,7
Calcular la probabilidad conjunta de una interacción activa. Dado que las moléculas de entrada a la interacción no son co-dependiente, la probabilidad conjunta de la interacción es P (CREBBP) × P (STAT5A) = 0,95 x 0,8 = 0,76
Calcular la probabilidad de que la molécula de salida es la resultado de la interacción. Dado que la molécula depende únicamente de la interacción de la probabilidad es sencillo:
Iterar este cálculo a través de todas las interacciones en la vía. El resultado final de una vía es un promedio de todas las interacciones.
Una puntuación de actividad de la vía es el promedio sobre la actividad de las interacciones en una vía. Por ejemplo, en el ejemplo anterior, la actividad de interacción es 0,76. La principal ventaja de cálculo de las actividades de la vía en la parte superior de consistencias vía es que las actividades se pueden calcular incluso cuando no hay suficientes datos para trabajar con la salida, como es el caso, por ejemplo, cuando la interacción se basa en la activación o la modificación de moléculas sin la generación de una nueva molécula como salida. En tales casos, todavía podemos calcular la actividad, a pesar de la consistencia pierde su significado.
Ver Métodos para más detalles.
La elección de un conjunto mínimo de vías para clasificar fenotipo
a medida que obtenemos de actividad y de consistencia puntuaciones de la vía para cada vía, que son capaces de transformar la representación de cada bio-muestra de una lista de mediciones de la expresión génica en una representación de la novela, se presentan cada muestra con la colección de actividad de la vía y índices de consistencia. Como utilizamos esta representación de distinguir entre fenotipos, deseamos encontrar el conjunto mínimo de las puntuaciones de las vías que es capaz de hacer la distinción entre las clases fenotípicas. Utilizamos la función de selección para elegir un conjunto mínimo óptimo (ver Resultados). Utilizamos diferentes métodos de extracción de características y clasificación de elementos [28], [29], incluyendo la selección hacia adelante, hacia atrás de selección y búsqueda [29] flotantes. Estos métodos ayudan en la eliminación de las puntuaciones de la vía que no contribuyen a hacer la distinción y poner de relieve las vías específicas que juntos logran una tasa de clasificación óptima.
Camino índice para predecir el resultado
En representación de cada uno de bio-muestra usando sus indicadores de la vía nos permite buscar patrones de la colección de las vías. Mediante el uso de algoritmos de agrupamiento, se observa que los valores de indicadores de la vía se segregan en grupos de muestras. Si nos fijamos en los patrones de supervivencia de estos grupos, se observa que en algunos casos y para algunas vías, los grupos se corresponden con distintos patrones de supervivencia.
Resultados
El análisis aplicado aquí usa para tratar una vía como una red de genes cuyas interacciones son evaluados de forma lógica en el contexto vía para generar series de puntajes. Biológica información de estructura de vía fue obtenida de fuentes públicas [27], [30], [31].
Cada vía se evaluó la consistencia y la actividad. Una puntuación de consistencia vía se calcula como la probabilidad promedio de la consistencia lógica de la colección de las interacciones dados los estados calculados de los genes (ver Métodos). Una puntuación de actividad de la vía se calcula como la probabilidad media de las interacciones individuales de la vía de ser activo dado los estados de genes calculados. Utilizando los principios básicos de la máquina de aprendizaje supervisado [28], [29] un algoritmo de clasificación que distingue cada fenotipo oncogénico (por ejemplo, el cáncer de la muestra verso normal) se generó y validado. Sobre la base de la simplicidad y la comparabilidad de los enfoques alternativos a prueba, se utilizó un clasificador bayesiano discriminante lineal.
En primer lugar, un algoritmo de clasificación se deriva de distinguir diversos fenotipos de cáncer de los tejidos fenotipo normal. Un clasificador derivado de una muestra de 1.800 conjunto de entrenamiento (10 veces validación) demostró% de éxito 98 en un conjunto de pruebas de validación independiente de 211 muestras (véase la Figura 3 y Tabla 1).
Cada panel en la figura corresponde a una diferencia fenotípica diferente, de acuerdo con las leyendas del panel. El eje horizontal en cada panel corresponde a la proyección unidimensional calculado por el algoritmo de clasificación, que significa la distancia entre las muestras biológicas, de acuerdo con las métricas de la vía multidimensionales. El eje vertical es una dispersión de fluctuación de las muestras para permitir una visión clara de la separación.
Desde clasificadores lineales se convierten cada una de las vías en el problema en una variable en el clasificador, se es posible a través de análisis de características para identificar subconjuntos de variables clasificador (vías) que, como un grupo, distinguir los fenotipos con gran precisión. Se utilizó la selección de características para identificar un conjunto que demuestra la óptima 98% de precisión de la clasificación original en el análisis de la muestra de validación. Se compone de las puntuaciones de actividad de seis vías:. Trka Camino, vía de daño del ADN, ceramida Camino, Camino de la telomerasa, CD40L Camino y la calcineurina Camino
El cáncer es una enfermedad de gran heterogeneidad fenotípica y molecular. Incluso dentro de un sitio de órgano dado, la heterogeneidad fenotípica se asoció con diferencias significativas en el resultado cáncer. Por tanto, es de interés adicional para identificar los procesos moleculares que subyacen a las diferencias fenotípicas y que predicen el resultado. por lo tanto Derivamos firmas para una variedad de subtipos de cáncer de mama. Estos subtipos incluyen: grado histológico (grados Elston 1 vs 3, o 2 grados frente a 3); estado de p53 (tipo mutado /salvaje); receptor de estrógeno positivo /negativo de estado (ER +/-); y el estado del receptor de progesterona positivo /negativo (PGR +/-). El rendimiento de los clasificadores se muestra en la figura 3. En todos los casos, los clasificadores con un pequeño número de vías (de tres a seis) alcanzaron un alto nivel de precisión (83% a 95%). La Tabla 1 muestra los diferentes grupos de la vía que clasifican a diferentes fenotipos.
Seguidamente, evaluó la capacidad de las firmas de los subtipos específicos de cáncer para estratificar las 236 muestras de cáncer de mama en un resultado. Después de agrupamiento no supervisado de las muestras de cáncer que utilizan las vías identificadas anteriormente, Kaplan Meier análisis se llevó a cabo (Figura 4). En tres casos, una única vía de la sub-tipo de firma resultado predicho de manera significativa: la vía de los ritmos circadianos, a partir de la firma de grado 1/3 (P = 2.9E-11); la vía de Sonic Hedgehog, a partir de la firma de grado 2/3 (P = 4E-8); y Agrin en Postsináptica diferenciación, a partir de la firma P53 (P = 4.6E-7). Las tres vías en la firma RPg +/- separaron las muestras en dos grupos con un valor P 0,0001, con la contabilidad vía Bone Remodelación de la mayor parte del efecto. Además, las cinco vías en el ER +/- firma separaron las muestras en dos grupos con un valor P de 0,004, con la vía de SREBP que representa la mayor parte del efecto.
(A) (1) Kaplan parcela de supervivencia -Meier de pacientes con cáncer de mama a partir de [15], estratificados de acuerdo a la agrupación basada en actividad de la vía. El panel (2) en (A) muestra la puntuación de la actividad de la vía hedgehog sonic color de acuerdo a la afiliación con cualquiera de las curvas de supervivencia de colores en consecuencia (1); (B) Los mismos análisis realizados con pacientes con cáncer de mama a partir de [15], sobre la base de la vía de la remodelación ósea (véase el texto para la elección vía). (C) de Kaplan-Meier parcelas de supervivencia de los datos de los pacientes con cáncer de pulmón a partir de [17], estratificado en función de la actividad de la vía Csk y la vía (D) NFKβ. En cada panel, el (2) sub-panel muestra la métrica vía más influyente fuera del grupo de las vías de estratificación. Esto no quiere decir que la vía representada es responsable de toda la separación en dos grupos.
Es importante tener en cuenta que un número de hallazgos en la literatura surgen independientemente de nuestro análisis de la vía de la cáncer de mama muestras. A medida que la importancia de la sala de emergencias +/- distinción en el tratamiento del cáncer de mama está bien establecida, nos fijamos en cada uno de estos subgrupos por separado. Se ha observado [32] que el Trka Pathway (identificado tanto en la firma oncogénico genérico y la firma de grado 2/3) juega un papel importante en los casos ER-. Nuestro análisis muestra que la firma oncogénico genérico separa las muestras de ER en dos grupos (P = 4.6E-9) con la vía de Trka que representa la mayor parte del efecto, la alta actividad de esta vía se correlaciona con mal pronóstico. Del mismo modo, se ha observado [33], [34] que el beta-catenina desempeña un papel importante en la respuesta al tratamiento con tamoxifeno, un tratamiento estándar para ER + enfermedad. Para analizar la naturaleza de la respuesta tamoxifeno inducida, derivamos un clasificador para distinguir los casos ER + que habían sido tratadas con tamoxifeno de aquellos casos que no habían sido tratados de esta manera y luego se utilizan las vías de la firma resultante de agrupar los casos por resultados . La vía beta-catenina surgido como la vía más significativo (P = 1E-13) para predecir el resultado.
Desde hace tiempo se sugirió que las clasificaciones moleculares de cáncer pueden tener la capacidad de trascender de órganos o tejidos específicos de las definiciones . Más específicamente, se ha sugerido que las definiciones moleculares que reflejan las propiedades universales del tipo de célula o la ontología y que apuntalan una etiología molecular común puede surgir a través de las definiciones de sitios de órganos. Para evaluar si las firmas observadas anteriormente en el cáncer de mama epitelio pueden generalizarse a otros tipos de cáncer, se analizó su capacidad para predecir los fenotipos de pulmón y cáncer de colon. Aplicamos firmas derivadas de los subtipos de cáncer de mama para agrupar los resultados de cáncer de pulmón (Figura 4). Vías incluyen la predicción del resultado de la función principal de IL-7 (P = .002) y el Camino Csk (P = 3E-11). Anteriormente se ha señalado que estas vías se han relacionado con el resultado en el cáncer de pulmón [35], [36]
Por último, se analizó la capacidad de la firma oncogénica en general para predecir el resultado de órganos específicos in situ. Curiosamente, las vías de firma separaron las muestras de cáncer de mama 236 en cinco subgrupos diferentes de supervivencia (P = 2E-8) muestras del cáncer de pulmón y 90 en dos subgrupos diferentes (P = 5E-17).
Discusión
los resultados anteriores sugieren que el uso de la vía como la unidad de análisis puede aumentar los enfoques basados en genes de un individuo corriente a fenotipo mapeo a proceso molecular subyacente. identificación objetiva de los procesos previamente asociado con fenotipos que utilizan conjuntos de datos de todo el genoma proporciona la validación parcial de los resultados observados. Recientemente observado mapeos de procesos de fenotipos, sin embargo, requieren claramente ya sea la verificación de los conjuntos de datos independientes o confirmación experimental.
Las observaciones realizadas a través de este análisis son provocativos. Muchas de estas vías (por ejemplo, apoptosis, mantenimiento de los telómeros) se han descrito anteriormente como componentes universales de la oncogénesis [2]. Adicionalmente, los procesos se identifican que puede ser la base fenotipos relacionados cáncer común, tales como la inflamación. Curiosamente, nuevas vías también se identifican como parte de la firma oncogénica en general como se representa en las vías (por ejemplo, ceramida y de la calcineurina) seis vías colectivos. El reciente interés en Ceramide apoya esta hipótesis. Ceramida se ha sabido por mucho tiempo de estar involucrados en la apoptosis [37] - [39] y el reciente trabajo está mirando a la relevancia de la ceramida en el cáncer [40] - [42] y en la terapia del cáncer [43], [44]. interés similar se ha venido desarrollando en la calcineurina. Mientras que el interés se limitaba previamente a su actividad en la respuesta inmune, que ahora está siendo reconocido como participante predominante en la oncogénesis [45], [46]. La combinación de este conjunto de vías pueden definir los procesos clave que son característicos de un tipo de células progenitoras universal.
A la inversa, el análisis de la vía de cáncer subfenotipos también puede proporcionar nuevos conocimientos sobre mecánica que revelan la biología subyacente. Por ejemplo, el tamoxifeno es eficaz en el tratamiento de algunos casos de cáncer de mama ER +. En estos casos, el tamoxifeno deben afectar a la actividad de las redes de interacción. Es lógico, pues, la hipótesis de que no habrá diferencias observables en la actividad de la red entre los casos en que el tamoxifeno es eficaz y aquellos casos en los que el medicamento no es eficaz. Nuestro enfoque utiliza firmas vía para predecir la varianza en el resultado, que se toma como medida de la eficacia del fármaco. Creemos que nuestro enfoque puede revelar aquellas redes que están diferencialmente tanto activan en respuesta al tratamiento con tamoxifeno e importantes para el crecimiento del tumor y la sostenibilidad.
El enfoque aplicado aquí tiene paralelismos con el uso de mapas de genes para la traducción en fenotipos el dominio molecular. En primer lugar, los modelos de la vía representan un marco reproducible que puede ser probado en todos los estudios y se extendió como un mayor conocimiento esté disponible. Además, las vías y su estructura de orden superior proporcionan una construcción para evaluar el papel de los genes.
Cada interacción dentro de un itinerario requiere la aportación de observaciones múltiples genes. Cada nivel de actividad de un solo gen contribuye sólo en el contexto de otros genes que participan en una interacción dentro de la red de proceso. Esto se demuestra por la observación de que no fuimos capaces de obtener clasificadores eficaces, directamente a partir de los valores de estado solo gen (por los genes que componen los seis principales vías).
También es interesante que cinco de las seis vías utilizamos para clasificar normal y muestras de tumor de formar una sola red conectada (Figura 5, la vía de la telomerasa sigue sin estar conectado). Esta interconexión puede proporcionar nuevas oportunidades para el desarrollo de intervenciones. El conocimiento de las conexiones puede sugerir objetivos alternativos que tendrían efectos múltiples de la vía. Como mínimo, se puede permitir la identificación de las complejidades asociadas con la selección de destino antes de diseño de la intervención
.
nodos compartidos El color de las vías unidas.
Se entiende que la clasificación probabilística de los genes en las estados alternativos de abajo y arriba es una simplificación de mucho mayores patrones de complejidad de la conducta y la acción de genes. Sin embargo, la evaluación empírica de los datos observados encuentra que los patrones de expresión de genes comúnmente pueden encajar una de las dos distribuciones alternativas de nivel de expresión. Por otra parte, esta simplificación, se ha demostrado su utilidad en otros campos de investigación. Por ejemplo, la simplificación que abstrae la lógica digital a partir del flujo continuo subyacente de los electrones en los circuitos integrados ha permitido el diseño de dispositivos de funcionalidad asombrosamente complejo [47].
Es evidente que el conocimiento actual de vías biológicas es incompleta y imperfecto. Como tal, los procesos identificados no son casi con toda seguridad los únicos factores que influyen en los fenotipos de interés. Sin embargo, cuando se identifican los procesos, que sirven como objetivos importantes para una mayor investigación. Por otra parte, el enfoque orientado al proceso permite distinguir qué componentes de las redes complejas en las que participan los genes diferencialmente están contribuyendo a un fenotipo de interés. El uso combinado de la actividad y la puntuación de consistencia permite la discriminación de los procesos activados por el fenotipo frente a aquellos cuya lógica se diferencia entre fenotipos. Este último (consistencia), potencialmente es atribuible causalmente al fenotipo y sugiere candidatos que han sido alterados. Sin embargo, la utilización de los datos de expresión de genes, índices de consistencia sólo pueden ser calculados para las interacciones que implican eventos de transcripción, lo que limita su capacidad de discriminación.