Crónica enfermedad > Cáncer > artículos del cáncer > PLoS ONE: Proyecciones Cruz-estudio de biomarcadores genómicos: una evaluación de la Genómica del Cáncer

PLoS ONE: Proyecciones Cruz-estudio de biomarcadores genómicos: una evaluación de la Genómica del Cáncer


Extracto

estudios de enfermedades humanas utilizando microarrays de ADN en ambos estudios clínicos /experimentales y de observación /controlada tienen cada vez más impacto en nuestra comprensión de la complejidad de las enfermedades humanas. Un concepto fundamental es el uso de la expresión génica como una "moneda común" que vincula los resultados de
in vitro
experimentos controlados para
in vivo
estudios observacionales humanos. Muchos estudios - en el cáncer y otras enfermedades - han demostrado ser prometedores en el uso de
in vitro
manipulaciones celulares en mejorar la comprensión de
in vivo
la biología, pero los experimentos a menudo simplemente no reflejan la enorme variación fenotípica visto en enfermedades humanas. Nos dirigimos a esto con un marco y métodos para diseccionar, mejorar y ampliar el
in vivo
utilidad de
in vitro
derivados firmas de expresión génica. A partir de una firma la expresión génica experimental definido usamos análisis de factor estadístico para generar
múltiples factores cuantitativos
en los datos de expresión de genes de cáncer humano. Estos factores conservan su relación con el original, unidimensional
in vitro
firma, pero describen mejor la diversidad de
in vivo
biología. En un análisis de cáncer de mama, se muestra que los factores pueden reflejar fundamentalmente diferentes procesos biológicos ligados a las características moleculares y clínicas de los cánceres humanos, y que en combinación pueden mejorar la predicción de los resultados clínicos

Visto:. Lucas JE, Carvalho CM, Chen JL-Y, Chi JT, West M (2009) Proyecciones de la Cruz-estudio de biomarcadores genómicos: Una evaluación de la Genómica del cáncer. PLoS ONE 4 (2): e4523. doi: 10.1371 /journal.pone.0004523

Editor: Sridhar Hannenhalli, Universidad de Pennsylvania School of Medicine, Estados Unidos de América

Recibido: 1 de septiembre de 2008; Aceptado: 31 de diciembre de 2008; Publicado: 19 Febrero 2009

Derechos de Autor © 2009 Lucas et al. . Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación: Investigación parcialmente apoyado por la Fundación Nacional de Ciencia (DMS-0342172) y los Institutos nacionales de Salud (NCI U54-CA-112952). Las opiniones, resultados y conclusiones o recomendaciones expresadas en este trabajo son las de los autores y no reflejan necesariamente los puntos de vista de la NSF o NIH

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

la tecnología de microarrays permite la captura de diversos aspectos de los factores genéticos, ambientales, y otros oncogénicos como se refleja en la expresión del ARNm global y abre la posibilidad de personalizar el tratamiento de la enfermedad [1], [2 ]. Múltiples estudios han adoptado un enfoque "de arriba hacia abajo" para el perfil de expresión de genes en los cánceres humanos, y esto ha llevado a la identificación de los subtipos de tumores no reconocido previamente, así como firmas de genes que predicen diferentes fenotipos clínicos [3] - [7]. Por otra parte, otros estudios han adoptado un enfoque "de abajo hacia arriba" para determinar el cambio de la expresión génica causada por las manipulaciones específicas de las células cultivadas
in vitro
. En estos estudios de expresión génica sirve como un fenotipo común para reconocer características similares en los cánceres humanos
in vivo
y proporcionar un vínculo directo entre la perturbación biológica conocida y los contextos clínicos [8] - [12].

Aunque muchos de estos estudios han mostrado promesa en el uso de
in vitro
manipulaciones celulares para entender
in vivo
biología, este enfoque no puede reflejar plenamente la enorme variación fenotípica observada en los cánceres humanos. A partir de estos estudios, se puede derivar

firmas. Estos definimos ser listas de genes que son expresados ​​diferencialmente junto con sus niveles asociados de expresión diferencial (que llamamos pesos). Sin embargo, casi siempre hay una mala correspondencia entre estas firmas y patrones de expresión de los mismos genes
in vivo
. Por lo tanto, se necesita un marco conceptual para diseccionar, mejorar y ampliar el
in vivo
utilidad de la
in vitro
firma derivada de. A continuación, presentamos una técnica para lograr este propósito. Proponemos que deriva de múltiples factores, en base a estudios de expresión de genes de cáncer humano, de una firma definida experimentalmente. Estos factores derivados conservarán su relación con la firma original, sino que representan los procesos biológicos distintos. Es importante destacar que, mostramos que diferentes factores derivados se pueden combinar para proporcionar mucho mejores valores predictivos de los resultados clínicos. Existen diversos factores que también reflejan diferentes procesos biológicos y están vinculados a diversos aspectos de las características moleculares y clínicas de los cánceres humanos.

Hay una serie de posibles enfoques a este problema. Un método popular ha sido el de comparar la identidad de las sondas expresados ​​diferencialmente a bases de datos de las vías de predefinidos. Descripciones de tales enfoques se pueden encontrar en [13] - [15]. Si bien estos enfoques son atractivos por su interpretabilidad, se basan en las vías adecuadamente pre-definidos en lugar de la estructura de los datos en estudio. Alternativamente, se puede simplemente definir el nivel de actividad de la firma para una muestra como la media ponderada de los
in vivo
niveles de expresión (donde los genes sobre los que calcular los pesos y los mismos pesos se han extraído de la firma original). Aunque algunos estudios han demostrado el poder de este concepto, es evidente que no se puede esperar capturar la heterogeneidad de
in vivo
la biología de la respuesta biológica controlada unidimensional del
in vitro
refleja la firma.

La heterogeneidad inherente del medio ambiente y el tipo de células en muestras de tejido significa que los genes en una firma podrían participar en muchas actividades adicionales que no son evidentes
in vitro
. Además, los experimentos con líneas celulares clonadas de un solo tipo de células cultivadas bajo condiciones estrictamente controladas para una longitud fija (y relativamente corto) de tiempo pueden contrastar fuertemente con muestras clínicas extraídas de organismos vivos que contienen múltiples tipos de células que han estado en un entorno dinámico para meses o años. No hay claridad método "correcto" para tomar lo que se aprende por medio de experimentos de microarrays en la cultura y su aplicación para evaluar la actividad de la vía en muestras de tejido. Algunos genes pueden ser representantes más pobres de la actividad de la vía
in vivo
porque son más propensos a estar involucrados en otras vías, ya que reaccionan a las condiciones ambientales que no están presentes
in vitro
, o para una miríada de otras razones. Está, por lo tanto, importante proporcionar un marco estadístico y conceptual que puede permitirnos usar el
in vivo
datos de expresión para diseccionar más, refinar y mejorar los
in vitro
firmas genéticas en -derivado .


Firma Factor de análisis para la descripción gratis (SFPA), basado en modelos dispersos factor estadístico, [16], [17] es un marco para el mapeo de
in vitro
firmas para una colección de
in vivo
factores. Si bien esto suena similar a la agrupación jerárquica (que se ha convertido en el método predeterminado para este tipo de problema), hay diferencias importantes. En primer lugar, mientras que la agrupación jerárquica se puede utilizar para romper una serie de muestras en grupos, dentro de los cuales los patrones de expresión son similares de alguna manera, no cuantifica que la similitud. En segundo lugar, la agrupación jerárquica requiere que cada observación (gen) ser miembro de un solo clúster. Esto se opone a la asignación de grupos a las vías biológicas, debido a que muchas combinaciones de actividad de la vía son posibles. Por último, debido a que los factores se generan dentro de un modelo estadístico, es posible identificar los niveles de actividad en cada uno de los factores en una muestra recién medido sin rehacer el análisis estadístico. Si bien existen otras técnicas de agrupamiento jerárquico que abordan algunas de estas cuestiones, por ejemplo soft-agrupamiento [18] y k-means clustering [19], nuestro algoritmo de ellos todas las direcciones dentro de un mismo marco estadístico coherente. SFPA ofrece:

modelización estadística robusta de expresión tanto la expresión génica y muestra de tejido experimental

Identificación y corrección de artefactos de ensayo, que se sabe que son un problema importante asociado con el uso de las tecnologías de microarrays. .

un mapeo de una sola firma, generada
in vitro
, a un conjunto de factores que conserven las características pertinentes de la firma mientras que refleja mejor la heterogeneidad
in vivo servicios asociados con la perturbación biológica representa la firma.

Un modelo para la imputación de los valores de los factores en las nuevas colecciones de muestras de tejidos a pesar de que estas muestras pueden proceder de diferentes grupos y en diferentes momentos.

exploramos este enfoque de análisis en la traducción de una colección de firmas de genes que reflejan la respuesta celular a cinco factores microambientales tumorales conocidas, descubrimos
in vitro
[8], con especial énfasis en la firma asociada con la respuesta a la acidosis láctica. Se demuestra que múltiples factores que surgen en un contexto de cáncer de mama siguen siendo representativa de las respuestas de la vía microambientales individuales a partir de los que se derivan. Por otra parte, estos factores se diferencian fenotipos biológicos clave en el cáncer de mama, son capaces de mejorar las predicciones clínicas a través de múltiples conjuntos de datos de cáncer, y conservar su capacidad predictiva, incluso cuando se aplica a muestras tomadas en tiempos muy diferentes o en diferentes centros de estudio.

Resultados

Contexto, datos y Análisis de Estrategia

comenzamos con cinco firmas definidas por las respuestas transcripcionales de las células epiteliales de mama mamarias humanas cultivadas a cinco perturbaciones microambientales: hipoxia, acidosis láctica, la hipoxia, más lácticas acidosis, lactosis y acidosis. Cada uno de éstos se ve en los cánceres humanos y lleva información de pronóstico con respecto a los resultados clínicos [8]. Las firmas representan cambios en la expresión de genes entre un conjunto de observaciones de control y las células cultivadas en presencia de acidosis láctica (25 mM de ácido láctico, pH 6,7), la hipoxia (2% de O2), el ácido láctico además de la hipoxia, lactosis (sodio 25 mM lactato, pH neutro), y acidosis (pH 6,7 sin lactato). ensayos de expresión utilizados Affymetrix U133 + 2.0 microarrays y firmas que reflejan cada uno de los factores microambientales se han descrito [8]. Como se muestra en [8], la hipoxia, acidosis láctica y acidosis tienen un fuerte significado pronóstico en varios estudios de los cánceres de mama. Nuestro objetivo aquí es explorar los diversos componentes de los genes de las firmas originales para evaluar la oportunidad para mejorar aún más sus valores pronósticos y la disección como elementos relevantes de la vía biológicos distintos que tienen relevancia clínica.

Utilizamos bayesiano factor de regresión de modelado (BFRM) [20] para definir y factores de estimación basada en una firma determinada. Esto comienza con una pequeña colección de genes que son altamente sensibles a la intervención original (altamente expresados ​​diferencialmente entre los grupos experimentales en el cultivo de células de control y) y luego refina de manera iterativa el conjunto de genes, basado en la co-expresión en un conjunto de datos in vivo, en el contexto de un análisis de factor estadístico. En primer lugar, los patrones comunes de expresión (factores) se descubren dentro de la subconjunto de genes actualmente bajo consideración. A continuación, la asociación entre estos factores y el conjunto completo de genes de la matriz nos permite identificar genes adicionales que deben incluirse en una revisión del análisis factorial. La razón de esto es que, mientras que la evaluación de los factores que subyacen a los genes iniciales de la firma seleccionada nos permite dilucidar
in vivo
variabilidad que no está presente
in vitro
, la adición de genes desde fuera la firma original puede mejorar la caracterización de estos factores al tiempo que proporciona vínculos con otras vías pertinentes. Correr SFPA en cada una de las cinco firmas de forma independiente, obtenemos 11 factores de hipoxia, acidosis láctica factores 10, 20 hipoxia, además de los factores de acidosis láctica, 17 factores lactosis y 9 factores acidosis. SFPA deja de factores descubrir una vez que la mayor parte de la variabilidad en el conjunto de genes original ha sido explicado.

Firma-Factor Relaciones

Nos centraremos, por ahora, en los diez factores de acidosis láctica. El examen de los genes en cada uno de los factores (Figura 1a) muestra que todos los factores tienen representantes de la firma original además de los genes añadidos durante el proceso de ajuste del modelo factor. Es importante estar seguro de que en el descubrimiento de estos diez factores, no hemos perdido nuestra firma original. Comprobamos esta haciendo una regresión de los 10 conjuntos de puntuaciones de los factores derivados de las puntuaciones de la firma acidosis láctica. (El cálculo de una puntuación de firma se describe en la sección Métodos.) Witin un único modelo de regresión multivariante, encontramos que 7 de los 10 son significativos al nivel de .01, y que cuando eliminamos los tres factores restantes de la regresión multivariante, los siete siguen siendo significativo. Por lo tanto, al menos siete de los factores muestran una asociación significativa con la firma original.

(a) Las conexiones entre los genes y los 10 factores de acidosis láctica en el factor de análisis estadístico de los datos sobre el cáncer de mama a partir de [21]. Los genes incluyen los genes iniciales seleccionados de firma (negros) y las que se añaden a través del enriquecimiento de análisis iterativo (rojo), con el negro o rojo que indica que un gen (fila) está muy asociada con un factor (columna), y el blanco indica poca o ninguna asociación. Diafonía entre los factores y supuestos genes relacionados con la vía-es evidente. (B) la firma de acidosis láctica (eje vertical) se predice mediante un ajuste de regresión lineal (eje horizontal) en los siete factores asociados significativamente con la firma acidosis láctica. (C) Imagen de correlaciones de umbral entre 67 factores (verticales) y los 10 factores de acidosis láctica (horizontal), con pares que indican negros de factores cuyos pares de muestras de correlación supera 0,9 en valor absoluto.

Figura 1b muestra los valores ajustados de la regresión de la puntuación láctico firma acidosis en los factores de acidosis láctica a partir del análisis de los datos de la muestra 251 tumor establecidos a partir de [21]. El de esta regresión es alta (0,74), pero es posible estos diez factores podrían ser capaces de explicar muchas firmas diferentes. Con el fin de demostrar que esto no es una asociación espuria, probamos la hipótesis de que este nivel es independiente de los cuales se asignan los genes que los pesos. Nos volvieron a muestrear los pesos 10.000 veces, cada vez regresión del vector de puntuación de la firma calculada a partir de estos pesos en los 10 factores de acidosis láctica y calcular un valor. De los 10.000 valores de por lo calculado bajo la hipótesis nula, la máxima fue de 0.48 garantizar que el valor de p «10
-4. Si nos aproximamos la distribución de los valores de una distribución beta (calculado por el método de los momentos) obtenemos un ajuste muy estrecha (véase la figura S1) y estimar el valor de p para ser ≈10
-13. Debido a que sólo la lista de genes expresados ​​altamente diferencialmente a partir de la firma acidosis láctica, y no los pesos, se utilizan en el descubrimiento del factor, y porque los pesos son críticos para el cálculo de las puntuaciones de la firma acidosis láctica, la posibilidad de recuperar las puntuaciones de la firma de factores es una fuerte evidencia de la relación entre los dos.

los tres factores derivados de la firma acidosis láctica que no fueron importantes en la predicción de las puntuaciones de la firma todavía puede representar la actividad correspondiente a la presencia de ácido láctico, pero no son un fuerte predictor de la firma original. También pueden representar simplemente la actividad de las vías biológicas que implican grandes conjuntos de genes, y por lo tanto se descubren desde muchos puntos de partida diferentes posibles. No obstante, representan estructura significativo en la expresión del gen de la firma expandido fijado en datos tumorales, y ninguno de estos factores serían detectables del estudio de la firma solo como un fenotipo.

Los factores pueden reflejar aspectos distintos de la actividad biológica. La figura 1c muestra cuál de los 67 factores (todos los factores descubiertos de cada una de las cinco firmas de partida) tienen una alta correlación con los 10 factores de acidosis láctica a partir del análisis de datos de mama Miller [21]. Observe que no hay dos de los factores de acidosis láctica están altamente correlacionados, por tanto, estos factores parecen describir procesos distintos. Algunos de los 10 factores, tales como el factor de acidosis láctica 8 por ejemplo, están altamente correlacionados con múltiples otros factores, lo que indica que estos factores han sido identificados a partir de varias firmas iniciales. La mayoría, sin embargo, muestran bajos niveles de correlación por pares. Entre los 67 factores, se requieren 40 componentes principales para tener en cuenta el 95% de la variabilidad observada (figura S2 complementario) lo que implica que una proporción relativamente alta "dimensión" biológica subyace a los factores de 67 - que reflejan un conjunto diverso de actividades biológicas, y presumiblemente vías alterado en las respuestas celulares a la acidosis láctica en los tumores de mama humanos. La Figura 1a muestra las conexiones entre los genes y los 10 factores acidosis láctica en el análisis. Los genes son los genes seleccionados de la firma iniciales y las que se añaden a través del enriquecimiento de análisis iterativo. Los factores derivados de SFPA retienen un alto porcentaje de genes que han demostrado exhibir un cambio en la expresión cuando las células se exponen a la presencia de ácido láctico
in vitro
, mostrando de otra manera que estos factores todavía mantienen su relación con la firma original. La diafonía entre los factores, en función de los genes que definen más de un factor, es también evidente.

Factores que predicen características moleculares

SFPA derivados de factores pueden representar distintos aspectos de los procesos biológicos asociados con fenotipos clínicos. Para evaluar esto, hemos explorado los modelos de regresión de subconjuntos para predecir una serie de fenotipos clínicos en el conjunto de datos de Miller [21] - los fenotipos incluyendo ER y PgR estado, el estado de p53 y el tiempo de supervivencia. Los indicadores de estado moleculares fueron modelados con regresiones probit binarios sobre los factores de supervivencia, y con modelos de supervivencia típica de la Weibull. Hemos utilizado el método de la escopeta estocástico Búsqueda (SSS) [22], [23] para identificar pequeños subconjuntos de los factores que muestran valor predictivo con respecto a cada uno de estos fenotipos. SSS es un modelo de selección de variable que permite el uso del modelo de promedio (basado en la probabilidad posterior) para la predicción. promediado modelo se ha demostrado que funciona mejor que los algoritmos que utilizan el modelo más sencillo para la predicción (como AIC o BIC), ya que da una estimación más real de la incertidumbre [24]. Este análisis se llevó a cabo en el conjunto de datos a partir de [21], y luego se utilizaron los modelos de regresión resultantes armarios /capacitados para predecir los fenotipos en cada uno de los cinco conjuntos separados y biológicamente diversos datos de cáncer de mama [25] - [28]. Todos los conjuntos de datos están disponibles en la Expresión Génica Omnibus (GEO).

Factores que predicen el estado del RE.

El análisis indica que los modelos de regresión altamente puntuación para la predicción de la condición de ER utilizan uno de los factores - la acidosis 1, 4 hipoxia, acidosis láctica 2, o Lactosis 5. a partir de la figura 2a, uno puede ver que la correlación entre dos cualesquiera de estos factores es alta, por lo que se hará referencia a ellos colectivamente como los factores de ER. La figura 3a demuestra la capacidad de este factor para predecir el estado del RE en el conjunto de entrenamiento [21] y 3b muestra la predicción en un conjunto de pruebas distintas y sin relación alguna [27]. Para examinar la composición de la ontología de genes (GO) de la lista de genes implicados en los factores de ER, se aplicó la Tabla GATHER análisis [29] y encontramos que GO términos asociados con el ciclo celular, la proliferación y la mitosis y se enriquecen en gran medida en estos factores ( 1), lo que corrobora la conexión conocida entre la progresión celular y ER. También se espera que la presencia de ácidos o hipoxia actos láctico para cerrar el ciclo celular y el factor de ER aparece para enlazar directamente los dos procesos.

Cada punto en estas parcelas representa un solo paciente del conjunto de datos en [21]. (A) los diagramas de dispersión por pares de factores Acidosis 1, 4 hipoxia, acidosis láctica 2 y 5 Lactosis de los sesenta y siete factores. Cada uno de estos factores se deriva de una firma de partida diferentes y que son importantes e intercambiable en la predicción de la condición de ER. Las parcelas en el eje diagonal muestran los histogramas de las puntuaciones en los factores respectivos. (B) Tres hay una correlación significativa entre el RE y factores PGR. (C) La ER y p53 factores mostrar alguna evidencia de una relación, pero tienen estructuras claramente diferentes (valores mostrados son para la actividad de los factores respectivos en los datos de [21]).

ER y RPg factores predicen el estado del receptor de progesterona: (a) formación conjunto de datos [21]; (B) proyectada en los datos de Wang. Los resultados son PGR- (azul, obs = 0) y la PGR + (rojo, obs = 1). Los factores de ER (acidosis 1, 4 hipoxia, acidosis láctica 2, o Lactosis 5): set (c) la formación [21], fuertemente asociados con la condición de ER; (D) proyectada en los datos de expresión tumoral de un estudio completamente diferente - los datos que figuran Wang, en este caso 25 - son capaces de predecir el estado del RE. Los resultados son ER- (azul, obs = 0) y ER + (rojo, obs = 1). (E) la predicción estado de p53, con resultados p53 de tipo salvaje (azules, obs = 0) y mutante (rojos, obs = 1) dividida entre la formación (azul y rojo oscuro) y la prueba /validación de muestras (azul y rosa claro).


factores que predicen el estado de la PGR.

El estrógeno y la progesterona son conocidos por ser antagonistas, por lo que se espera que los factores ER pueden predecir el estado del receptor de progesterona. El uso de SSS nos encontramos con que los modelos de regresión altamente puntuación para RPg implican el factor ER, además de factor de acidosis láctica 10 - etiquetamos este factor específico PGR. Figuras 3c y 3d muestran la capacidad equipada y predictivo de estos dos factores utilizados en un modelo de regresión binaria en condiciones de estado del receptor de progesterona. No existe una correlación significativa en la expresión tumoral entre la PGR y factores de ER (Figura 2b). la ontología de genes de los genes en el factor específico PGR (Tabla 2) llevan a cabo algunos de los vínculos conocidos entre la progesterona y el metabolismo del RNA en el cáncer de mama [30].

Factores que predicen la condición de p53.

El tercer fenotipo binario, de tipo salvaje frente gen p53 mutante, está presente sólo en el conjunto de datos [21]. SFPA se volvió a ejecutar en un seleccionado al azar 50% de estos datos y se utiliza para predecir el otro 50% (Figura 3). modelos muy marcados para p53 implican el factor ER, el factor específico PGR, y uno de hipoxia ya sea 1 o acidosis láctica 3. La correlación entre estos dos últimos factores es del 99%, por lo que les etiquete colectivamente como el factor específico de p53. Gene ontología para este factor es idéntica a la del factor de ER con las excepciones de que "proliferación celular" y "iniciación de la replicación de ADN" se sustituyen por "división nuclear" y "fase M". Para todas las ontologías de genes que figuran en los ocho primeros de estos dos factores, los factores de Bayes son ≥10. Debido al alto grado de similitud en la ontología de genes, es tentador tratar de equiparar estos dos factores. La figura 2c muestra un diagrama de dispersión de la actividad de los tumores en los datos a partir de [21] en cada uno de los dos factores. El factor de p53 es significativamente bimodal, y la correlación leve se puede ver se debe enteramente a este bimodalidad, como muestras de tumores con actividad de factor de alto ER son más propensas a estar en el segundo modo del factor de p53. Nos teorizan que esta bimodalidad se asocia con un subtipo particular de la mutación p53. Sin embargo, no hay evidencia de la multimodalidad en el factor de ER, y la p53 factor específico predice la condición de ER mal. Debido a estas diferencias, y debido a la replicación celular es un proceso complejo, es probable que estos dos factores están relacionados con distintas características de desarrollo de las células
.
Destacamos que, si contenernos a considerar el original
in vitro
firma acidosis láctica, no tenemos capacidad para encajar o predecir cualquiera de estos fenotipos biológicos (Tabla 3). Además, estos factores fueron generados entera sin tener en cuenta la condición de ER, PgR estado, o estado de p53 de las muestras. Esto está en contraste con un diseño más típico en el que las firmas asociado con fenotipos se definen estrictamente sobre la base de los genes con los perfiles de expresión que responden a esos fenotipos (por ejemplo [21]). Este tipo de diseño está plagado de dificultades que surgen de la gran cantidad de genes, de las decenas de miles de dólares en una matriz, con los patrones de expresión que responden a ningún fenotipo arbitraria. Con SFPA, que la búsqueda de genes que se expresan juntos sin tener en cuenta el fenotipo, y estamos por lo tanto mucho menos probable que se plagado de falsos descubrimiento (como lo demuestra nuestra salida de la exactitud de predicción de la muestra).

factores predicen fenotipos clínicos

SFPA el centro o una técnica para interrogar a una sola muestra de tumor independiente contra cualquier número de firmas determinados biológicamente, y luego la consiguiente vinculación de los factores a fenotipos pueden incluir resultados clínicamente relevantes, tales como los resultados de supervivencia del paciente y la respuesta a fármacos .

factores que mejoran la predicción de la supervivencia del cáncer de mama.

los subconjuntos de los 67 factores fueron evaluados en modelos de regresión de Weibull de supervivencia utilizando el método de SSS para identificar y anotar modelos para predecir la supervivencia. Cada modelo en un conjunto resultante de los modelos altamente puntuación produce curvas de supervivencia empotrados y también se puede usar para predecir la supervivencia para las nuevas muestras. mandatos de análisis bayesianos promedio de las predicciones de un conjunto de tales modelos, y esto se hizo para dar lugar a la figura 4a. Esto demuestra ataques de curvas de supervivencia para la formación conjunto de datos [21], junto con las predicciones de la muestra en cuatro de los otros conjuntos de datos para los que existe información con respecto a la supervivencia. Recordemos que se trata de conjuntos de datos a partir de estudios bien distintas y diversas, por lo que estamos evaluando un modelo ajustado a un conjunto de datos en cuatro bastante difícil de conjuntos de datos de validación de la muestra. Aunque no se describe adicionalmente aquí, el análisis del modelo estadístico BFRM utilizado por el SFPA también se ocupa de los problemas de los efectos específicos de genes de muestras de estudio dentro de los análisis y es capaz de corregir suficientemente de la idiosincrasia y el sesgo inherente a los ensayos de microarrays para retener la exactitud de predicción [19 ], [31]. Los resultados demuestran que los factorprofiles de éstos
in vitro
firmas ambientales pueden mejorar la predicción de la supervivencia significativamente a través de varios conjuntos de datos de prueba. Resultados similares se obtienen para la predicción de la supervivencia libre de metástasis.

(a) Predicción de los tiempos de supervivencia de un promedio de modelos de supervivencia de Weibull, donde se utiliza para separar las muestras de 251 [21] Según encima /debajo de la mediana de las predicciones , y se muestran las curvas de supervivencia empíricas resultantes (curvas de Kaplan-Meier). El rojo /azul estratificación de los pacientes es a partir del análisis utilizando subconjuntos de los 67 factores (rojo - alto riesgo del 50%, azul de bajo riesgo 50%); las curvas grises son del mismo análisis utilizando los cinco firmas originales (por lo tanto no hay compensación por exceso de ajuste aquí). Los valores de p en cada una de las parcelas corresponden a la estratificación por el análisis factorial (arriba, negro) y la estratificación usando las firmas (abajo, gris). Los datos de [21] se utilizó para identificar los modelos de supervivencia, por lo tanto este gráfico representa los valores ajustados. Los cuatro parcelas adicionales representan de predicción en las cuatro muestras de tumor de mama diferentes basados ​​en el análisis de sólo los datos de entrenamiento. La relevancia predictiva, y la importancia de los factores es evidente y consistente entre los estudios, y consistente mejora en la que se consigue por medio de firmas por sí solos. (B) El primer factor de acidosis láctica predice la supervivencia en los pacientes que fueron tratados con tamoxifeno (mitad izquierda), pero no muestra ningún valor predictivo en pacientes que no recibieron el fármaco (mitad derecha). En todas estas figuras, los valores de p representan significación en un modelo de riesgos proporcionales de Cox.

Factores predictivos de la respuesta tamoxifeno.

Cuatro de los conjuntos de datos de cáncer de mama tienen anotación clínica perteneciente a el tratamiento con tamoxifeno. Aunque los factores de 67 son de ninguna manera dirigida específicamente a tamoxifeno, que sabemos que están asociados con las vías biológicas pertinentes. A partir de nuestros 67 factores, encontramos que la acidosis láctica 1 es predictivo de la resistencia a tamoxifeno. Se diferencia de supervivencia libre de metástasis en pacientes que recibieron el fármaco y no muestra capacidad predictiva en los pacientes que no lo hicieron (Figura 4b; el análisis que subyace a esta siguió el mismo planteamiento que para la supervivencia discutido anteriormente). Debido a que todos los pacientes que recibieron tamoxifeno se ER positivo, resistencia a los medicamentos asociados con este factor debe ser independiente de la acción antagónica de la droga en los receptores de estrógeno. Dado que ninguno de estos conjuntos de datos se utiliza en la formación del modelo de los factores, la capacidad de estos factores para distinguir la resistencia a tamoxifeno es notable y demuestra que son robustos a los sesgos de recogida a menudo en experimentos de microarrays. Hemos utilizado una vez más se reúnen para estudiar la ontología de los genes incluidos en este factor (Tabla 4). Esto conecta con la asociación conocida de tamoxifeno con el transporte de fosfato [32], [33] la adhesión celular [34], así como, [35]. En particular, Cowell et al. informan de que p130Cas /BCAR1 es una molécula de adhesión celular que promueve la resistencia a tamoxifeno a través de una vía de fosforilación particular. Además de estas conexiones a los efectos secundarios de tamoxifeno es la conexión conocida entre la supervivencia de los pacientes en tratamiento con tamoxifeno y la toxicidad asociada con la coagulación de la sangre [36]. Continuando el estudio de los genes de este factor puede conducir a la información sobre el mecanismo detrás de la resistencia a tamoxifeno en el cáncer de mama ER positivo.

El descubrimiento de factores específicos de órgano de firmas acidosis láctica.

Si bien los mismos procesos biológicos pueden contribuir a fenotipos tumorales en diferentes tipos de cáncer, el proceso por el que esto ocurre puede ser totalmente diferente dado el contexto celular en particular, la expresión génica específica de tejido y las influencias epigenéticas. Desde SFPA puede utilizar
in vivo
la expresión génica del cáncer para diseccionar el
in vitro
firma genética -generated, ofrece la posibilidad de identificar tejidos y órganos específicos de los factores asociados con los mismos genes de las firmas. Esta aplicación tiene el potencial para distinguir sub-vías que se conservan a través de muchos tipos de tejidos de los que son específicas del órgano. Para ilustrar este punto, utilizamos el conjunto de datos de cáncer de pulmón publicado en [11] y los datos de cáncer de ovario establecidos a partir de [10]. Se obtuvieron los datos sobre el cáncer de pulmón a partir de los datos de cáncer de ovario desde el sitio web de Duke Integrativa Programa de Biología del Cáncer (CIPA) (http://data.cgt.duke.edu/platinum.php) y GEO.

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]