Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: El cambio de Población de ancho para pronóstico del cáncer personalizada con microarrays

PLOS ONE: El cambio de Población de ancho para pronóstico del cáncer personalizada con microarrays


Extracto

La era de la medicina personalizada para la terapéutica del cáncer ha dado un importante paso adelante en la toma de pronósticos exactos para los pacientes individuales con la adopción de la tecnología de microarrays de alto rendimiento. Sin embargo, la tecnología de microarrays para el diagnóstico del cáncer o el pronóstico se ha utilizado principalmente para la evaluación estadística de las poblaciones de pacientes, y por lo tanto excluye la variabilidad interindividual y predicciones específicas para cada paciente. Aquí proponemos una llamada confianza clínica métrica que sirve como una medida de la fiabilidad de pronóstico para facilitar el paso de al pronóstico del cáncer personalizado en toda la población utilizando modelos predictivos basados ​​en microarrays. El rendimiento de los modelos basados ​​en muestras predichos con diferentes confidencias clínicos se evaluó y comparó la utilización sistemática de tres grandes conjuntos de datos clínicos que estudian los siguientes tipos de cáncer: cáncer de mama, mieloma múltiple y neuroblastoma. Las curvas de supervivencia para los pacientes, con diferentes confidencias, también se delinearon. Los resultados muestran que la métrica de confianza clínica separa pacientes con diferentes precisión de la predicción y el tiempo de supervivencia. Las muestras con alta confianza clínica eran propensos a tener pronósticos precisos a partir de modelos predictivos. Por otra parte, se esperaría que los pacientes con alta confianza clínica para vivir durante un tiempo notablemente más largo o más corto si su pronóstico era bueno o sombría sobre la base de los modelos, respectivamente. Llegamos a la conclusión de que la confianza clínica podría servir como una medida beneficiosa para microarrays que utilizan personalizada de predicción de pronóstico del cáncer. Atribuir un nivel de confianza con el pronóstico con la métrica confianza clínica proporciona al clínico un objetivo, de forma personalizada para las decisiones, tales como la elección de la severidad del tratamiento

Visto:. Shao L, X Fan, N Cheng, Wu L , Xiong H, fang H, et al. (2012) El cambio de Población de ancho para pronóstico del cáncer personalizada con microarrays. PLoS ONE 7 (1): e29534. doi: 10.1371 /journal.pone.0029534

Editor: Christina Chan, Universidad del Estado de Michigan, Estados Unidos de América

Recibido: 20 Junio, 2011; Aceptado: noviembre 30, 2011; Publicado: 25 Enero 2012

Derechos de Autor © 2012 Shao et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este trabajo fue apoyado por la Fundación Nacional de Ciencias de china (Nº 30801556 y 30830121), Nacional S & amp; T Proyecto Principal (núm 2008ZX09312-001), Fundación de Ciencias de la Universidad china (Nº 2009QNA7031), y la Fundación Provincial de Zhejiang de Ciencias Naturales de China (No. R2080693). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

No todos los individuos responden al tratamiento farmacológico de la misma manera. De acuerdo con ello, el desarrollo de los regímenes terapéuticos personalizados optimizados para cada paciente representa un objetivo importante de la 21
-medicina del siglo XXI [1]. Las herramientas modernas están siendo utilizados para ayudar a los médicos en el tratamiento de pacientes con eficacia como individuos y la disponibilidad para la intervención farmacológica personalizada.

variación entre individuos en respuesta al tratamiento farmacológico está fuertemente influenciada por el estado fisiológico del paciente en el momento del tratamiento. Este estado se caracteriza por perfiles de expresión génica [2]. Por lo tanto, la tecnología de microarrays puede guiar la selección de fármacos o regímenes terapéuticos y ser empleado para evaluar la susceptibilidad de un paciente a ciertas enfermedades, lo que permite un plan personalizado para el seguimiento y tratamiento de prevención de [3]. Los beneficios potenciales de la tecnología de microarrays en aplicaciones clínicas han demostrado en varios estudios de referencia [4] - [7]. basan en microarrays [13], como MammaPrint ™ [4], [5], un hito en - modelos predictivos basados ​​en microarrays (o características genómicas) han demostrado utilidad en la asociación de diferentes subgrupos de cáncer de mama con distintos resultados clínicos [8] el pronóstico para el cáncer de mama [14]

El desarrollo de un modelo predictivo basado en microarrays para la clasificación de tumores por lo general implica dos pasos secuenciales [4], [15] -. [17]. En primer lugar, el modelo se desarrolla en base a un conjunto de entrenamiento de los pacientes con etiquetas de clase de datos conocidos (por ejemplo, el estado del tumor) y la expresión génica. A continuación, el modelo de formación se valida el uso de un conjunto de validación que contiene los pacientes con etiquetas de clase conocidos. La validez del modelo de formación en el rendimiento en el conjunto de validación ha sido el foco de la investigación 'predicción de la clase'. Para garantizar el modelo de formación se pueden utilizar en aplicaciones clínicas en el mundo real, se sugirió que el modelo debe ser evaluada en un gran número de muestras independientes en este proceso de validación externa [18].

Es importante en cuenta que la estrategia de validación externa mencionada evalúa el desempeño de un modelo de formación utilizando una población definida por el conjunto de validación. El rendimiento medio (por ejemplo, especificidad, sensibilidad) sobre la población se utiliza para evaluar si el modelo puede ser una prueba de diagnóstico o pronóstico fiable. Esta estrategia se lleva a cabo bajo el supuesto de que el modelo funciona igual para todo el mundo sin tener en cuenta la variabilidad interindividual. Por lo tanto, el rendimiento promedio basado en una población de pacientes no puede asegurar su capacidad predictiva para pacientes individuales, lo que podría dar lugar a diagnósticos potencialmente poco fiables o pronósticos de la aplicación en el mundo real. Esta una talla única para todos estrategia necesita ser modificado a partir de la población de todo a la medicina personalizada en aplicaciones basadas en datos de microarrays.

Se propone una métrica llamada confianza clínica que mide la fiabilidad del modelo de predicción de rendimiento en una de manera individual. confianza clínica puede ser útil en la determinación de los tratamientos apropiados; por ejemplo, los pacientes con alto grado de confianza y de mal pronóstico se pueden administrar tratamientos más rigurosos. Además, los pacientes con confidencias clínicos inferiores pueden ser los principales candidatos para una nueva evaluación de sus condiciones con métodos alternativos. La exactitud de la métrica de confianza clínica fue investigado en tres grandes conjuntos de datos clínicos con un total de seis puntos finales clínicos [19].

En concreto, se divide en primer lugar cada conjunto de datos en dos, es decir, la formación y la validación del conjunto. Para imitar los escenarios clínicos reales, hicimos el conjunto de validación que contiene sólo los pacientes cuyos datos de microarrays se generaron en una fecha posterior que aquellos en el conjunto de entrenamiento. Estamos derivados de la confianza clínica del modelo de formación, seguido de la evaluación de su correlación con la precisión de la predicción para el pronóstico y el tiempo de supervivencia de los pacientes en el conjunto de validación. A lo mejor de nuestro conocimiento, este es el primer intento de proporcionar una medida de confianza para los pacientes individuales en la investigación "predicción de la clase" a base de microarrays, que es un importante paso adelante en la medicina personalizada.

Materiales y Métodos

Conjuntos de datos

Tres gran escala, se utilizan conjuntos de datos clínicos de cáncer en este estudio: cáncer de mama (BR) [20], mieloma múltiple (MM) [21], y neuroblastoma (NB) [22]. Un breve resumen de los conjuntos de datos se da en la Tabla 1. Una información más detallada de estos conjuntos de datos se puede encontrar en el papel principal de la segunda fase del proyecto de Control de Calidad de microarrays (MAQC-II) [19].

Cada conjunto de datos tiene dos puntos finales clínicos relacionados con el pronóstico del cáncer (incluyendo los datos de supervivencia) o el tratamiento: BR-PCR y BR-erpos en el conjunto de datos de la respuesta al tratamiento, NB-EFS y MM-EFS en el conjunto de datos de supervivencia libre de eventos, y NB -OS y MM-OS en el conjunto de datos de supervivencia global (Tabla 1). Estos tres conjuntos de datos clínicos fueron estudiados en el proyecto MAQC-II dirigido por la FDA [19]. Para emular un escenario clínico en el mundo real en la aplicación de firmas genómicas, dos poblaciones independientes de pacientes para cada uno de los tres conjuntos de datos clínicos fueron definidas por el Consorcio MAQC como los conjuntos de entrenamiento y validación utilizando un enfoque cronológico en que se generaron las muestras en los conjuntos de validación en una fecha posterior que aquellos en los conjuntos de entrenamiento. Los tamaños de muestra para los conjuntos de entrenamiento variaron entre 130 y 340, y la relación de los acontecimientos positivos a los acontecimientos negativos osciló entre 0,18 a la 1,60; Mientras tanto, los tamaños de muestra en los conjuntos de validación variaron desde 100 hasta 214, y la relación de los acontecimientos positivos a acontecimientos negativos variaron entre 0,14 y 1,56.

Dos positivo y dos puntos finales de control negativo también se utilizaron en este estudio. Los criterios de valoración de control positivo, es decir, NB-PC y MM-PC, se derivaron de los conjuntos de datos NB y MM por separado, con las muestras indicadas por el género. Para los dos puntos finales de control negativo, es decir, NB-NC y MM-NC (que corresponden a los conjuntos de datos de NB y mm, respectivamente), las etiquetas de muestra (es decir, eventos positivos o negativos) se generaron al azar. El uso de estos dos controles nos permiten evaluar el desempeño de las variables relevantes clínicamente contra el máximo esperado y el rendimiento mínimo previsto por los controles.

confianza clínica

La confianza clínica mide la confianza de una muestra de ser asignado a una clase específica de un modelo predictivo. Por ejemplo
i
, su métrica confianza clínica () es el nivel de confianza de una muestra en la que se le asigne correctamente por un modelo predictivo y se define como: (1) donde y son las medidas de similitud entre la muestra y en muestras clase 1 y clase 2, respectivamente. La medida de similitud varía de acuerdo con los clasificadores utilizados. Se emplearon dos clasificadores bien estudiados para los datos de expresión de genes en este estudio, es decir, muy cerca con Centroide regla de clasificación (
Carolina del Norte
) [4] y
k
vecinos -nearest (
kNN
,
k
= 5) [23]. Para el
Carolina del Norte
clasificador, y se definieron como los coeficientes de correlación de la muestra desconocida para los centroides de las clases 1 y 2, respectivamente. El centroide se define como vectores de los valores de expresión media. Para el
kNN
clasificador, y se define como el número de vecinos más próximos a la muestra desconocida pertenecientes a las clases 1 y 2, respectivamente.

Los valores oscilan entre 0,5 y 1 en el que una valor de 0,5 indica que la predicción se debe al azar. Cada vez más los valores más altos corresponden a cada vez mayor confianza de la predicción. En aras de la simplicidad, todos los análisis se basó en tres niveles de confianza: bajo nivel de confianza (LC; 0.5≤≤0.6), confianza media (MC; 0,6 & lt; ≤0.8) y el alto grado de confianza (HC; 0,8 & lt; ≤1.0 )

El análisis estadístico

El análisis general del flujo de trabajo se representa en la figura 1.; Mayores detalles se proporcionan en Métodos S1. El protocolo de análisis se inicia mediante el desarrollo de un mejor clasificador basado en el conjunto de entrenamiento, y termina al predecir el conjunto de validación. La clase predicho y confidencias clínicos se registran en las matrices correspondientes
L
y
C
, respectivamente. Para asegurar la validez estadística, el procedimiento se repite 500 veces, lo que resulta en 500 clasificadores diferentes de los conjuntos de entrenamiento y 500 predicciones para el conjunto de validación. El rendimiento de ambos modelos de formación y predicciones se evaluó mediante el coeficiente de correlación Matthews (MCC) [24], [25].

Mayores detalles se proporcionan en Métodos S1.

Una permutación también se utilizó la prueba para comparar la exactitud de predicción clasificador frente probabilidad [26], [27]. En cada permutación, el protocolo de análisis se muestra en la Figura 1 se repitió con la excepción de que las etiquetas de clase en el conjunto de entrenamiento se asignaron al azar. En otras palabras, los modelos construidos con formación conjuntos aleatorios se utilizaron para predecir los conjuntos de validación. Después de 500 repeticiones, el grado de correlación oportunidad y previsibilidad de los criterios de valoración se calculó con de Cohen
d
[28], que mide la diferencia estandarizada entre dos medios.

Resultados

el rendimiento de la validación cruzada se mide en valores de MCC para todos los modelos de formación, junto con el rendimiento medio de predicción en los conjuntos de validación se resumen en la Tabla S1. El rendimiento del modelo sigue el orden de NB-PC, PC-MM, BR-erpos, NB-EFS, NB-OS, BR-PCR, MM-EFS, MM-OS, MM-NC, y NB-NC. Los dos controles positivos realizan mejor mientras que los dos controles negativos realizan peor, lo cual es consistente con las expectativas del diseño de experimentos.

confianza clínica se correlaciona positivamente con la predicción del modelo de rendimiento

primer lugar, investigó el modelo rendimiento en el conjunto de validación para los pacientes que caen en diferentes categorías de confianza clínica. Como se muestra en la Figura 2, se muestra una correlación positiva entre la precisión de la predicción y el nivel de confianza de los seis criterios de valoración clínicos y cuatro de control utilizando el
kNN
clasificador. Entre los seis puntos finales clínicos, el conjunto de datos BR-erpos mostró la correlación más fuerte. Para la BR-erpos, las predicciones medias MCC valor con bajo nivel de confianza (LC) fue sólo de 0,19, mientras que el valor medio de MCC se incrementó notablemente hasta aproximadamente 0,78 como el nivel de confianza se acercó a 1. Por lo tanto, en comparación con el valor total de MCC (0,71) ( Tabla S1), confianza clínica podría explicar satisfactoriamente la variabilidad interindividual en la discriminación de los pacientes con menor o mayor que la precisión de predicción promedio.

el Círculo radios se escalan al porcentaje del total de muestras en el nivel de confianza clínica. Los niveles de confianza son '0.6', '0.8', y '1'.

Está claro que la previsibilidad intrínseca de perfiles de expresión génica varía para los diferentes criterios de valoración, como lo demuestra la disminución gradual de la pendiente del desempeño de los modelos de seis puntos finales clínicos durante diferentes intervalos de confianza (es decir, las pistas de la Figura 2, los datos se muestran en la Tabla S2) y el número de muestras distribuidas en diferentes regiones de confianza (es decir, el tamaño del marcador en la Figura 2). Como se muestra en la Figura 3, se observó una correlación lineal positiva entre la pendiente obtenida a partir de la Figura 2 y la previsibilidad inherente (cuantificada por Cohen de
d
[28]) de los puntos finales clínicos de seis y cuatro de control. Los puntos finales predecibles (por ejemplo, BR-erpos, NB-EFS) tendían a tener un mayor porcentaje de pacientes (representado como el tamaño del marcador en la Figura 2) en las regiones de alta confianza con alta precisión de la predicción de los criterios de valoración menos predecibles (por ejemplo, MM -EFS, MM-OS). La información detallada sobre la distribución de la muestra en cada región de confianza se da en la Tabla S3. Estas observaciones fueron verificadas adicionalmente utilizando un método diferente de reconocimiento de patrones (es decir,
Carolina del Norte
) (figuras S1 y S2), y también un ejemplo de estrategia de dividir diferentes (80/20 división, las figuras S4 y S5).

las pendientes son obtenidos a partir del análisis de regresión basado en la parte lineal de la curva de la confianza-MCC, mientras que de Cohen
d
representa la predictibilidad inherente del conjunto de datos.

la resultados demuestran que un predictibilidad inherente más alta de un punto final está relacionada con un mayor porcentaje de pacientes que caen en los niveles de confianza más altos cuando se utiliza modelos predictivos basados ​​en microarrays. A medida que la correlación de una firma genómica con un resultado clínico es raramente perfecta, la confianza clínica podría ser útil para separar a los pacientes en diferentes grupos para los cuales se pueden desarrollar procedimientos de tratamiento específicos.

La relación de confianza clínica con el paciente de la supervivencia tim
e

también se evaluó si la confianza clínica es predictivo de la tasa de supervivencia de los pacientes en el conjunto de validación. Los pacientes fueron divididos en dos grupos de pronóstico (es decir, el bien y el mal pronóstico) para ambos NB y MM conjuntos de datos con puntos finales OS (supervivencia global) y EFS (supervivencia libre de eventos), respectivamente (Métodos S1). La Figura 4 presenta las curvas de SG en pacientes con diferentes confidencias clínicos de ambos grupos de pronóstico. Los pacientes con alta confianza clínica mostraron una tasa de supervivencia mayor en el grupo de buen pronóstico y una tasa de disminución de la supervivencia en el grupo de pronóstico deficiente, lo que indica que la confianza clínico mejorado la exactitud de pronóstico derivado de los modelos de predicción. Tomando MM-OS como un ejemplo, la tasa de supervivencia es aparentemente mayor en los pacientes del grupo de buen pronóstico con alta confianza (HC) en comparación con aquellos con bajo (LC) (valor p test de log-rank & lt; 0,01) y medio (MC) los (log-rank test valor de p 0,13), especialmente para cada marca día más de 1000 días (Figura 4). Para los pacientes con mal pronóstico, más del 80% de las personas con baja confianza clínica vivido tanto como 300 días, mientras que aproximadamente el 30% de los pacientes para los que tienen altos confidencias sobrevivió en ese momento, respectivamente. También se observaron tendencias similares en el conjunto de datos NB-OS.

Figura S3, que representa las curvas de supervivencia sin complicaciones en pacientes con diferentes confidencias clínicos, demuestra una tendencia similar a las curvas OS presentan en la Figura 4. La positiva correlación de confianza clínica con tasa de SSC se muestra claramente en las figuras S3c y S3d para los pacientes con buen pronóstico. Sin embargo, la correlación es menos significativa para los pacientes con mal pronóstico (Figuras S3a y S3b). Correspondientes resultados de la división 80/20 se muestran en las figuras S6 y S7, y homogeneizadas con las observaciones antes mencionadas.

Los resultados demuestran que una vez que los pacientes se agruparon en el bien o grupos pobres pronóstico de los modelos predictivos , la confianza clínica puede caracterizar aún más la tasa de supervivencia de los pacientes individuales en cada grupo de pronóstico.

Discusión

Varias pruebas en toda la población de diagnóstico /pronóstico basado en la expresión génica se han reportado [4], [6], [7]. Los modelos basados ​​en la población sólo proporcionan una indicación promedio de la población con una precisión media de la población correspondiente. En este estudio, hemos demostrado que la confianza clínica es a la vez capaz de separar los pacientes que pueden predecirse de forma más fiable de los que se predijo con menos precisión, y predictivo de la tasa de supervivencia para los pacientes después de que se agrupan en diferentes grupos de pronóstico. Por lo tanto, atribuir un nivel de confianza con el pronóstico con la métrica confianza clínica proporcionará al clínico una base más personalizada y objetiva para las decisiones cuando se utilizan biomarcadores derivados de los datos de microarrays.

En concreto, se encontró que la confianza clínica proporciona una mejor estimación para el tiempo de supervivencia cuando los pacientes fueron clasificados en diferentes categorías de pronóstico en base a ambos 70/30 y 80/20 asignaciones de muestra. Para los pacientes con buen pronóstico, mayor confianza clínica fue fuertemente correlacionada con mayor tiempo de supervivencia. Del mismo modo, para los pacientes con mal pronóstico, la tasa de supervivencia fue significativamente menor para aquellos con altos confidencias que para los demás. Tomando los puntos finales MM-EFS y MM-OS como ejemplos, a pesar del hecho de que son bastante difíciles de predecir, los pacientes con alto grado de confianza muestran una tasa de supervivencia significativamente mayor o menor cuando se agrupan de acuerdo con el bien o el mal pronóstico, respectivamente. Es importante destacar que todos los pacientes en el grupo de alta confianza sobrevivieron a 5000 días (Figura S3C), lo que demuestra que la confianza clínica es una herramienta informativa el pronóstico del tiempo de supervivencia.

Un aspecto importante de este estudio es que dos (NB-PC positivo , MM-PC) y dos de control negativo (NB-NC, MM-NC) conjuntos de datos estaban involucrados, lo cual es esencial para evaluar el desempeño de las variables relevantes clínicamente contra el máximo teórico y el rendimiento mínimo previsto por los controles. En concreto, la correlación positiva entre el rendimiento del modelo y de confianza clínica para los dos conjuntos de datos de control positivo que se muestran en la Figura 2 confirma el potencial de la confianza clínica para proporcionar una medida de la fiabilidad de la medicina personalizada, mientras que el impacto insignificante de confianza clínica en los dos conjuntos de datos de control negativo más limitada la posibilidad de obtener falsos positivos. Por lo tanto, la inclusión de conjuntos de datos positivos y negativos de control en un análisis de este tipo sería de gran ayuda para garantizar la fiabilidad de los resultados.

Se mantiene enigmático por qué algunos de los criterios de valoración eran más difíciles que otros para predecir. La figura 2 y la figura 3 compara la previsibilidad en los tres conjuntos de datos y los correspondientes seis puntos finales. Fácilmente puntos finales predecibles tienen un alto porcentaje de pacientes que caen en la región de alta confianza. Por ejemplo, el porcentaje de pacientes que mostraron alta confianza clínica (74,70%) para la BR-erpos punto final es mucho más alta que la del punto final MM-EFS (37,51%) (Figura 2), lo que puede indicar que la BR-erpos punto final contiene una señal de expresión génica más fuerte que el MM-EFS hace. Además, la previsibilidad del conjunto de datos (de Cohen
d
) está directamente relacionado con el coeficiente de correlación entre el nivel de confianza y predicción de rendimiento de MCC (Figura 3).

La capacidad de cuantificar confidencias clínico puede mejorar en gran medida los procesos de toma de decisiones clínicas basadas en modelos de predicción basados ​​en microarrays, especialmente para las opciones de tratamiento personalizado. Por ejemplo, los modelos presentados aquí podría poner a prueba el potencial de la respuesta al tratamiento con las predicciones de alta confianza y la poca confianza que se utilizan de diferentes maneras. Los pacientes con buen pronóstico y altas confianzas son candidatos para la aplicación de protocolos de rutina para evitar el exceso de tratamiento, mientras que las estrategias rigurosas deben ser seleccionados para aquellos con un mal pronóstico y altas confianzas para prolongar el tiempo de supervivencia mayor tiempo posible. Sin embargo, para los pacientes en las regiones de baja confianza, la evaluación adicional utilizando métodos alternativos deben ser considerados.

Es importante tener en cuenta que la estrategia propuesta en este estudio haciendo hincapié en el cambio de la población basada en el pronóstico del cáncer personalizada no lo hace negar la importancia de la predicción basada en la población, sino que se basa en su éxito. Si el rendimiento de un modelo predictivo no es informativo, tal como se ve en los dos controles negativos (es decir, MM-NC y NB-NC), la confianza clínica no será predictivo. Por lo tanto, los métodos de validación de modelos que incluyen la validación cruzada y validación externa independiente siguen siendo esenciales para garantizar la validez de los modelos predictivos basados ​​en microarrays. Sin embargo, dado que la predicción basada en la población no proporciona una evaluación precisa para cada paciente dentro de la población, confianza clínica ofrece un medio para medir la fiabilidad de las predicciones individuales en base a la predicción basada en la población.

Los beneficios de la personalizada medicina en atención de la salud son bien reconocidos [1]. Permite que tanto el paciente como el médico para ser más conscientes de los beneficios y riesgos de posibles tratamientos y resultados potenciales afectados por genética u otros factores ambientales. Por lo tanto, informado, diseñada, y las decisiones relacionadas con la salud se pueden hacer para cada persona [29]. La combinación de la tecnología de microarrays capaces de perfilar los niveles de expresión de cientos de miles de genes con técnicas de reconocimiento de patrones ha sido un paso importante hacia individualizado de toma de decisiones [30]. Nosotros presentamos ejemplos que aplican la evaluación confianza para el pronóstico del cáncer y la supervivencia de predicción de tiempo para los modelos desarrollados a partir de los datos de microarrays. Sin embargo, el enfoque se puede generalizar a biomarcadores y modelos construidos sobre la base de datos de otras plataformas de alto rendimiento. Por otra parte, el concepto es de aplicación general para todas las metodologías de aprendizaje supervisado de clasificación que pueden definir una confianza clínica.

Apoyo a la Información
Figura S1.
Predicción MCC como una función de confianza clínica durante diez conjuntos de datos utilizando
Carolina del Norte
. radios del círculo se escalan para el porcentaje del total de muestras en el nivel de confianza clínica. Los niveles de confianza son '0.5-0.6', '0.6-0.8' y '0.8-1', respectivamente
doi:. 10.1371 /journal.pone.0029534.s001 gratis (TIF)
figura S2.
correlación entre el tipo de pendiente y Cohen
d
para el
Carolina del Norte
clasificador. Las pendientes se obtienen a partir del análisis de regresión basado en la parte lineal de la curva de la confianza-MCC, mientras que de Cohen
d
representa la predictibilidad inherente del conjunto de datos
doi:. 10.1371 /journal.pone.0029534.s002 gratis (TIF)
Figura S3.
de supervivencia libre de eventos (SLE) se curva para pacientes con diferentes confidencias clínicos utilizando
kNN
donde 'LC', 'MC', y significan 'HC' 'confianza baja (0.6)', 'confianza media (0.8) ', y' alta confianza (1) ', respectivamente.
doi: 10.1371 /journal.pone.0029534.s003 gratis (TIF)
figura S4.
Predicción MCC como una función de confianza clínica durante diez conjuntos de datos mediante la división y 80/20
kNN
. Los radios del círculo se escalan para el porcentaje del total de muestras en el nivel de confianza clínica. Los niveles de confianza son '0.6', '0.8', y '1'
doi:. 10.1371 /journal.pone.0029534.s004 gratis (TIF)
Figura S5.
correlación entre el tipo de pendiente y Cohen
d
para el
kNN
clasificador basado en 80/20 asignaciones de muestras. Las pendientes se obtienen a partir del análisis de regresión basado en la parte lineal de la curva de la confianza-MCC, mientras que de Cohen
d
representa la predictibilidad inherente del conjunto de datos
doi:. 10.1371 /journal.pone.0029534.s005 gratis (TIF)
Figura S6.
La supervivencia global (OS) para los pacientes con curvas diferentes confidencias clínicos usando 80/20 división y
kNN
, donde 'LC', 'MC', y 'HC' significan 'confianza baja (0,6)' , 'confianza media (0.8)', y 'alta confianza (1)', respectivamente.
doi: 10.1371 /journal.pone.0029534.s006 gratis (TIF)
Figura S7.
de supervivencia libre de eventos (SLE) se curva para pacientes con diferentes confidencias clínicos usando 80/20 división y
kNN
, donde 'LC', 'MC', y significan 'HC' 'confianza baja (0,6 ) ',' confianza media (0.8) ', y' alta confianza (1) ', respectivamente.
doi: 10.1371 /journal.pone.0029534.s007 gratis (TIF)
Tabla S1. rendimiento
MCC para conjuntos de entrenamiento y validación
doi:. 10.1371 /journal.pone.0029534.s008 gratis (DOCX)
Tabla S2.
Pendiente y Cohen
d
para cada conjunto de datos de
doi:. 10.1371 /journal.pone.0029534.s009 gratis (DOCX) sobre Table S3.
Porcentaje de pacientes de bajo nivel de confianza (LC), confianza media (MC) y el alto grado de confianza (HC) regiones
doi:. 10.1371 /journal.pone.0029534.s010 gratis (DOCX): perfil Métodos S1.
Construcción de la mejor clasificador y calcular la correlación entre la confianza clínica y la tasa de supervivencia
doi:. 10.1371 /journal.pone.0029534.s011 gratis (DOC)

Reconocimientos

los autores desean agradecer a los proveedores de datos MAQC por compartir sus datos e información para el Consorcio MAQC. Las opiniones expresadas en este artículo no reflejan necesariamente las de la Food and Drug Administration U. S..

Referencia
1. Loscalzo J, Kohane I, Barabási AL (2007) clasificación de la enfermedad humana en la era postgenómica: Un enfoque de sistemas complejos para patobiología humano. Mol Biol Syst 3: 124.
Ver artículo

PubMed /Revista

Google Académico
2. Holmes E, Wilson ID, Nicholson JK (2008) el fenotipo metabólico en la salud y la enfermedad. Cell 134: 714-717.
Ver artículo

PubMed /Revista

Google Académico
3. Abrahams E (2009) Medicina Personalizada Al darse cuenta de su promesa. Genet Eng Noticias Biotechnol 29 (15). Disponible: http://www.genengnews.com/gen-articles/personalized-medicine-realizing-its-promise/3025/. Visitada: 2012 Ene 2.
Ver artículo

PubMed /Revista

Google Académico
4. van't Veer LJ, Dai HY, van de Vijver MJ, Él YDD, Hart AAM, et al. (2002) perfiles de expresión génica predice el resultado clínico de cáncer de mama. Naturaleza 415: 530-536.
Ver artículo

PubMed /Revista

Google Académico
5. MJ van de Vijver, Él YD, van 't Veer LJ, Dai H, Hart AAM, et al. (2002) Una firma de expresión genética como un predictor de supervivencia en el cáncer de mama. N Engl J Med 347: 1999-2009.
Ver artículo

PubMed /Revista

Google Académico
6. Ayers M, Symmans WF, Stec J, Damokosh AI, Clark E, et al. (2004) Perfiles de expresión génica predicen la respuesta patológica completa a paclitaxel y fluorouracilo neoadyuvante, doxorrubicina, ciclofosfamida y la quimioterapia en el cáncer de mama. J Clin Oncol 22: 2284-2293.
Ver artículo

PubMed /Revista

Google Académico
7. Iwao-Koizumi K, Matoba R, Ueno N, Kim SJ, Ando A, et al. (2005) Predicción de la respuesta de docetaxel en cáncer de mama humano por perfiles de expresión génica. J Clin Oncol 23: 422-431.
Ver artículo

PubMed /Revista

Google Académico
8. Sorlie T, Perou CM, Tibshirani R, Aas T, Geisler S, et al. (2001) Gene patrones de expresión de los carcinomas de mama distinguen subclases tumorales con implicaciones clínicas. Proc Natl Acad Sci USA S A 98: 10.869 a 10.874.
Ver artículo

PubMed /Revista

Google Académico
9. Sotiriou C, Neo SY, McShane LM, Korn EL, Long PM, et al. el cáncer de clasificación (2003) de mama y el pronóstico sobre la base de perfiles de expresión génica de un estudio basado en la población. Proc Natl Acad Sci USA S A 100: 10393-10398.
Ver artículo

PubMed /Revista

Google Académico
10. Sorlie T, Tibshirani R, Parker J, Hastie T, Marron JS, et al. (2003) la observación repetida de los subtipos de tumores de mama en los conjuntos de datos de expresión de genes independientes. Proc Natl Acad Sci USA S A 100: 8.418 a 8.423.
Ver artículo

PubMed /Revista

Google Académico
11.

El conocimiento de la salud

Cánceres poco comunes de la niñez

El número total de casos de cáncer infantil ha ido en aument

Pelucas para conseguir muchas formas de cáncer Clients

Cada plan ha llegado a entender a nadie, así como consta de

PLOS ONE: Atribuciones de los síntomas del cáncer "alarma" en una muestra comunitaria

Extracto Antecedentes Reconocimiento de los síntomas tem

Consejos importantes para la detección precoz de Cancer

Cuando escuche el diagnóstico fatal de cáncer, usted debe pe

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]