Extracto
Antecedentes
La mayoría de las mujeres con un cuadro clínico compatible con cáncer de ovario tienen condiciones benignas. Por lo tanto los métodos para distinguir las mujeres con cáncer de ovario de aquellos con condiciones benignas sería beneficioso. Se describe el desarrollo y la evaluación preliminar de un ensayo multivariable basado en suero para el cáncer de ovario. Este estudio basado en hipótesis, examinó si un patrón informativo se pudo detectar en la enfermedad en estadio I que persiste a través de etapas posteriores.
Metodología /Principales conclusiones
Sera, recogido bajo protocolos uniformes a partir de múltiples instituciones, lo que representa 176 casos y 187 controles de mujeres que se presentan para la cirugía fueron examinadas usando de alto rendimiento, los inmunoensayos multiplexados. Estuvieron representadas todas las etapas y los subtipos comunes de cáncer epitelial de ovario, y las condiciones de ovario benignos más comunes. Un panel de 104 antígenos, 44 autoinmune y 56 marcadores de enfermedades infecciosas y se ensayaron combinaciones informativos identificado. El uso de un conjunto de formación de conjuntos de datos I 91 etapas, lo que representa 61 muestras individuales, y un número equivalente de los controles, un perfil de 11-analito, compuesto por la CA-125, CA 19-9, EGF-R, proteína C reactiva, la mioglobina , se identificó la apolipoproteína A1, apolipoproteína CIII, MIP-1α, IL-6, IL-18 y la tenascina C y aparece informativo para todas las etapas y subtipos comunes de cáncer de ovario. El uso de un conjunto de pruebas de 245 muestras, aproximadamente dos veces el tamaño del conjunto de la construcción de modelos, el clasificador tuvo una sensibilidad del 91,3% y 88,5% de especificidad. Si bien estos resultados preliminares son prometedores, aún más refinamiento y una amplia validación del clasificador en un ensayo clínico es necesario determinar si la prueba tiene un valor clínico.
Conclusiones /Importancia
Se describe un sangre- ensayo basado en el uso de 11 analitos que pueden distinguir a las mujeres con cáncer de ovario de aquellos con condiciones benignas. Evaluación preliminar del clasificador sugiere que tiene el potencial de ofrecer sensibilidad de aproximadamente 90% y 90% de especificidad. Aunque prometedor, el rendimiento debe ser evaluado en un estudio de validación clínica cegado
Visto:. Amonkar SD, Bertenshaw GP, Chen T-H, Bergstrom KJ, Zhao J, Seshaiah P, et al. (2009) Desarrollo y evaluación preliminar de un Índice de Ensayo multivariante para el cáncer ovárico. PLoS ONE 4 (2): E4599. doi: 10.1371 /journal.pone.0004599
Editor: W. Ewout Steyerberg, University Medical Center de Rotterdam, Países Bajos
Recibido: 21 Noviembre 2008; Aceptado 14 de enero de 2009; Publicado: 25 Febrero 2009
Derechos de Autor © 2009 Amonkar et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Todos los autores son empleados por Correlogic Systems, Inc.
Conflicto de intereses: Todos los autores son empleados a tiempo completo de Correlogic Systems, Inc. y tienen derechos de opciones sobre acciones. Correlogic Systems, Inc. ha presentado solicitudes de patente en los aspectos de este trabajo.
Introducción
El cáncer de ovario es el cáncer ginecológico más letal en los Estados Unidos [1]. En 2008, se detectaron un estimado de 21.650 nuevos casos de cáncer de ovario. El diagnóstico precoz se asocia con una tasa de supervivencia a 5 años del 92%, sin embargo, sólo el 19% de los cánceres de ovario se detecta a tiempo [1], [2]. La mayoría de los casos detectados son la enfermedad en estadio avanzado, donde las tasas de supervivencia a 5 años para las mujeres con tumores malignos regional y la enfermedad a distancia son 71% y 30% respectivamente. Como resultado, más de 15.000 mujeres mueren de cáncer de ovario en los EE.UU. cada año [1].
Los primeros síntomas de cáncer de ovario, que incluyen dolor pélvico y abdominal, urgencia y frecuencia urinaria, hinchazón abdominal, y dificultad para comer no son específicos, y típico de muchas afecciones no cancerosas y benignas [3]. Por lo tanto, el diagnóstico no suele ocurrir hasta que el desarrollo de cualquiera de una cantidad significativa de fluido abdominal, o una masa pélvica, detectado por examen físico o con evaluación radiológica [4]. Un informe reciente ha sugerido que una combinación única de síntomas, si la documentación completa de cada paciente, puede ser más informativo que previamente reconocido, aunque los resultados aún no se han validado [5]. Muchos informes indican que las técnicas de imagen más utilizados - ecografía transvaginal (TVS), la tomografía de positrones-emisión (PET), resonancia magnética (MRI), radioimmunoscintigraphy y la tomografía computarizada (TC) carecen de la suficiente especificidad para distinguir entre la enfermedad de ovario benignos y malignos [6]. Algunos estudios recientes han sugerido que el ultrasonido solo, o en combinación con otras variables de pronóstico pueden ser significativamente más informativo en las manos de un experto en la ecografía ovárica especializada [7], [8], sin embargo, muchos pacientes no tienen acceso a las habilidades de tales especialistas. Por otra parte, diagnóstico claro por lo general requiere, como mínimo, la intervención quirúrgica en la forma de laparotomía o laparoscopia. Por lo tanto, una precisa, informativa, sin embargo, no invasiva, la prueba sería de valor clínico.
No hay marcadores biológicos aprobados por la FDA para el diagnóstico de cáncer de ovario, o para la vigilancia de mujeres con sospecha de cáncer de ovario . A pesar de su uso generalizado, antígeno de cáncer 125 (CA-125) sólo está aprobado por la FDA para el control de la recurrencia y la respuesta terapéutica [9] - [11]. En los estudios de las mujeres con cáncer ovárico conocido o sospechado, las sensibilidades reportadas de CA-125 en la detección de cánceres en estadio I y II varían ampliamente de un 29-75% y 67-100%, respectivamente. Sin embargo, CA-125 es elevada en una amplia variedad de condiciones normales, benignas y malignas [12] - [14] y 86% de las mujeres que se presentan con CA-125 pruebas anormales resolver en 3-6 meses [15]. Se han adoptado muchos enfoques para mejorar el valor predictivo de la CA-125 a través de mediciones en serie [16], [17] o en combinación con otros marcadores [18] - [21]. Sin embargo, una herramienta de cribado del cáncer de ovario simple y clínicamente práctica sigue siendo difícil de alcanzar
Un estudio reciente [22] describe un panel de seis marcadores -. CA-125, la prolactina, la leptina, factor inhibidor de macrófagos (MIF), osteopontina y similar a la insulina factor de crecimiento II (IGF-II) que cuando se combina tenía una sensibilidad muy alta (95,3%) y especificidad (99,4%). La prueba está diseñada como una pantalla en mujeres de alto riesgo, sin embargo, las características finales de rendimiento no se evaluaron en mujeres de alto riesgo y se incluyen también las muestras utilizadas para construir modelos que pueden haber dado lugar a una sobreestimación de los resultados del clasificador. Por otra parte, los criterios de inclusión y exclusión para los participantes no estaban claramente definidos, y se recogieron las muestras de cáncer y de control en diferentes situaciones clínicas, que pueden conducir a un sesgo en el conjunto de la muestra. Prolactina y el IGF-II se notificó que ser individualmente más informativo que la CA-125, en este estudio, pero esto es incompatible con informes sobre otros conjuntos de muestras independientes [23], [24]. En otro estudio, Moore y sus colegas utilizaron la regresión logística para encontrar combinaciones de marcadores capaces de diferenciar entre las condiciones benignas y malignas en mujeres con masas pélvicas [25]. Mediante la combinación de HE-4 y CA-125, la sensibilidad 76,4% y 95% de especificidad se logró. Al tiempo que promete, sólo el 67 de las 233 muestras eran de individuos con cáncer de ovario y sólo 15 de los de las mujeres con cáncer en estadio I y II. Además, informó el rendimiento se basa en los resultados de validación cruzada que carecían de un conjunto de muestras de retención independiente.
El cáncer de ovario es una colección de diversas entidades con más de 30 subtipos de tumores malignos, cada uno con una histología distintiva, patología y comportamiento clínico [26]. La diversidad y la baja incidencia de cáncer de ovario dificulta la búsqueda de biomarcadores. En un análisis separado, post-hoc, de un subconjunto de las muestras utilizadas en el presente estudio, no hemos podido identificar un solo marcador capaz por sí mismo de predecir con precisión la presencia de cáncer de ovario [24]. En el presente estudio, se describe el desarrollo y la evaluación preliminar de un perfil de múltiples análisis que se pueden clasificar a las mujeres con sospecha de cáncer de ovario, en aquellos con y sin cáncer de ovario.
Métodos
Muestra cohorte
Todas menos 20 muestras fueron desde el repositorio de bancos de tejidos de la financiada por el Instituto Nacional del cáncer del Gynecologic Oncology Group (GOG, Columbus, OH, Tabla 1, Tabla S2). Se obtuvo consentimiento escrito por el Gobierno de Guyana para todos los participantes y de la Junta de Revisión Institucional GOG (IRB) aprobó el uso de las muestras en nuestro estudio. Estas muestras fueron recogidas de varios sitios, en virtud de los protocolos aprobados por el IRB GOG. Los pacientes elegibles eran mujeres programados para cirugía con sospecha de tener un cáncer ginecológico o programados para cirugía profiláctica debido al mayor riesgo de cáncer de ovario (1º o 2º grado con la enfermedad). Todas las muestras, incluidas las clasificadas como normales, después de la cirugía, se recogieron antes de cualquier intervención diagnóstica o terapéutica. alícuotas de suero remitidos a Correlogic Systems, Inc. ® (Rockville, MD) se habían aplica el anonimato y codificado con un identificador único GOG. Cada muestra se acompaña de un informe completo clinicopathology, la edad del paciente y la raza, y un código de-identificada que denota el lugar de recogida. Patología fue revisado y confirmado por los patólogos del GOG para garantizar la coherencia. Las muestras fueron seleccionadas de la colección GOG para equilibrar la distribución de la edad del paciente, la fecha de recogida de suero, y la representación de casos y controles en todos los sitios de recolección. Los sueros restante consistió en 20 muestras de individuos con enfermedades benignas de un estudio prospectivo de recogida Correlogic, que utiliza un protocolo de recogida de suero similar. Se obtuvo consentimiento escrito de todos los participantes. muestras "futuros" de Correlogic están siendo recogidos en virtud de la aprobación del IRB para apoyar el desarrollo de una prueba clínica para el cáncer de ovario. La población de estudio son las mujeres que presentan síntomas de cáncer de ovario y programado para la cirugía. Como tal, el estado de la enfermedad se confirma por la patología después de la cirugía. Las 20 muestras se retiraron de la colección prospectivo de una manera para evitar la introducción de cualquier sesgo en la colección restante y como tal no se seleccionaron deliberadamente para representar cualquier población particular. El estudio fue aprobado por el IRB Occidental (Olympia, WA) y por el IRB de cada sitio participante.
Producción de Suero, almacenamiento, manipulación y envío
Las muestras de sangre (5- se recogieron 20 ml) en tubos Vacutainer superiores de vidrio de color rojo (Becton-Dickinson, NJ) y coagulada de 30-180 minutos a 4 ° C, y luego se centrifuga a 3.500 g durante 10 minutos a 4 ° C. El suero se decantó en criotubos y se almacena puntualmente a -80 ° C. Las alícuotas de almacenamiento fueron enviados a Correlogic en hielo seco y se almacenaron inmediatamente a -80 ° C. Las muestras congeladas se calentaron suavemente con la mano hasta que esté casi descongelada, terminado en hielo, vortex, se dividió en alícuotas en volúmenes de 150 ul y vuelto a congelar a -80 ° C. Finalmente, las muestras fueron enviadas en hielo seco para Rules-Based Medicine, Inc. (GBR; Austin, TX). Un segundo documento proporciona un número de identificación de la muestra codificada y un orden específico de análisis. El sitio de analítica RBM fue completamente cegado a todos los detalles de la muestra incluyendo el estado de la enfermedad.
Multiplex inmunoensayos
Los inmunoensayos multiplexados se describen en otra parte [24]. En resumen, dos rondas de inmunoensayos multiplexados se realizaron a RBM en su laboratorio certificado por CLIA basado en Luminex. Los analitos fueron cuantificados por referencia a curvas de calibración de 8 puntos y el rendimiento de la máquina se verifica por medio de tres muestras de control de calidad (QC) para cada analito. muestras de control de calidad fueron distribuidos de manera relativamente uniforme en todo el rango dinámico del ensayo a niveles bajos, medios y altos y generalmente tenían coeficientes de variación inferior al 15%. Los estándares de calibración y las muestras de control de calidad se encontraban en una matriz a base de plasma complejo para que coincida con el fondo de la muestra y se analizaron por duplicado. En la primera ronda, se midieron un total de 204 analitos en representación de 104 antígenos, 44 autoinmune y 56 moléculas de enfermedades infecciosas en 147 muestras epiteliales de ovario cáncer (40 en estadio I, 23 en estadio II, 67 en estadio III, 12 en estadio IV, cinco, no preparado) y 149 muestras de control (104 afecciones benignas, 29 normales sanos, 14 tipos de cáncer y otras dos bajo potencial maligno) utilizando inmunoensayos multiplexados de propiedad (Tabla S1). Una segunda ronda de análisis se realizó 86 días después de la primera ronda de análisis, en los 104 antígenos, utilizando una segunda parte alícuota de suero que había sido sometido a una historia de congelación /descongelación idéntica como las muestras utilizadas en la primera ronda. Debido a las restricciones de volumen de muestra, 27 muestras no se volvieron a analizar en la segunda ronda. Por lo tanto, en la segunda ronda, 132 muestras de cáncer de ovario (30 en estadio I, 21 en estadio II, 65 en estadio III, 11 en estadio IV y cinco unstaged) y 135 controles (94 condiciones benignas, 28 normales sanos, 13 otros cánceres) se volvieron a analizar. Además, otras 69 muestras, no incluidos en la primera ronda, se analizaron (21 en estadio I, ocho en estadio II, 36 benignos, tres normales sanos y uno cáncer de colon). Para las dos vueltas de análisis, se estableció el orden del análisis para evitar cualquier sesgo secuencial debido a la presencia o ausencia de enfermedad, subtipo o etapa de la enfermedad, la edad del paciente, o la edad de la muestra de suero. En general, las muestras se alternaron entre los casos y controles.
Manejo de Datos
Desde sueros se analizaron a una dilución previamente optimizado, cualquier muestra superior a la concentración máxima de la curva de calibración se le asignó arbitrariamente la concentración de la más alto nivel, mientras que los que se ensayó por debajo de la concentración mínima de la curva de calibración se le asigna el valor 0,0. Un ensayo solo (IL-1α) que no mostró ninguna variación en la expresión en todas las muestras se consideró invariante /poco informativo y se retira del conjunto de datos extraído. Los datos restantes fueron entonces escaladas por la escala biweight; un mecanismo de reducción robusto y eficiente que da cuenta de la varianza dentro de cada uno de los ensayos individuales [27]. Se determinó una escala única para cada ensayo de una manera ponderada por población. Cualquier ensayo produciendo un factor de escala de cero se retiró del conjunto de datos. Los datos resultantes se exportan en archivos individuales, donde cada archivo que representan los resultados de todos los ensayos calificados para una sola muestra
Modelado -. "Fuera de la bolsa" Estimación del error de validación y Bootstrap
para minimizar el sesgo conjunto de la muestra y para ayudar en la evaluación de los modelos intermedios, hemos empleado un tercio de estimación de error "fuera de la bolsa" (fuera de banda) y una de 100 veces la validación externa de arranque con un 10% bootstraps aceptantes. Estas estimaciones de arranque nos permitió evaluar el valor potencial de muchos modelos usando sólo los datos de entrenamiento. De esta manera hemos sido capaces de mantener la independencia de la bodega de salida conjunto de pruebas de muestras. Sólo después de un clasificador específico había sido encerrado en un sistema de gestión de documentos de trazabilidad (DMS) fueron el atraco a cabo las pruebas de conjunto de datos que se utiliza para probar el rendimiento del modelo seleccionado
Modelado -. La prueba de principio clasificador
en un principio, el modelado se realizó con los datos generados en la primera ronda (Figura 1) utilizando una modificación del código Forestal aleatoria de Breiman [28]. El método fue mejorado por permitir la automatización de proceso por lotes, la adición de una capa externa de bootstrapping, proporcionando un mayor control sobre los parámetros de ejecución, y la personalización de salida. Los árboles resultantes se guardan y una rutina propietaria se utilizó para muestras de puntuación y la información de muestreo de salida, puntuaciones de probabilidad, y resultado de la clasificación. Cuarenta la etapa I el cáncer de ovario y 40 muestras de control se utilizaron para la construcción de modelos. Se seleccionaron los controles para asegurar que el conjunto de modelado representó las mismas proporciones de condiciones normales, benignos y otro tipo de cáncer como el conjunto de control, sin embargo, dentro de cada una de estas categorías, se seleccionaron muestras al azar. Modelado se optimizó variando tanto los recuentos de árboles (50, 100, 500 y 1000) en un bosque, y el número de biomarcadores (5, 10, 15, 20, 25, 30, 35, 40, 45, 50) exploraron en cada punto de ramificación, lo que resulta en 40 modelos. A partir de estos modelos, se identificaron los 20 analitos más informativos utilizando el valor de la variable de importancia. En el segundo paso, una serie de modelos se construyeron que se limita a la más importante analito (modelo 1-analito), los dos analitos más importantes (modelo 2-analito) y así sucesivamente para un modelo de 20-analito, un total de 20 modelos. El fuera de banda y los errores de arranque externos, y sus desviaciones estándar, se tabularon para cada uno de estos modelos. A partir de estos resultados se determinó que se requiere un mínimo de siete analitos para lograr la clasificación más precisa. A continuación, solo, modelo final se construyó sobre estos siete analitos y se deposita en el DMS como un modelo de "bloqueado"
Modelado -. clasificador final
El modelado última etapa incorporado todas me datos sobre el cáncer de rondas uno y dos, incluyendo los duplicados - un total de conjuntos de datos I-91 de la etapa, que representan 61 muestras únicas y un número idéntico de controles, emparejados como antes, y equilibrado en el mismo una ronda a la segunda ronda relación (Figura 1). Sólo se utilizaron estos conjuntos de datos (es decir, el conjunto de entrenamiento) en la construcción de modelos y la selección. El análisis del patrón se realizó utilizando un algoritmo único, pendiente de patente, el descubrimiento del conocimiento Motor-VS (KDE-VS ™). KDE-VS utiliza un grupo de estructuras de votación similares a los árboles de decisión con un método único de construcción y definición de los valores de corte dentro de cada estructura de votación, utilizando no sólo el valor medido de un analito sino también el error de estimación basada en el laboratorio asociado con que la medición, derivada de las mediciones de control de calidad históricos de cada analito. El usuario puede variar el valor fraccionario de la estimación del error incorporado en un clasificador durante el modelado. El resultado es un clasificador robusto que puede resistir la perturbación significativa de los valores de punto determinado experimentalmente de concentraciones de analito. Durante la construcción de modelos, cada nodo terminal de la estructura de votación se asigna a un estado dado - ya sea cáncer de ovario o cáncer no de ovario. Para marcar un desconocido, nuestro software extrae los valores de los analitos de interés para determinar qué nodo de la muestra cae en.
Dos carreras de modelado diferentes, con valor fraccionario de límites de error de 1.0 y 3.0, se llevaron a cabo utilizando datos para los ensayos de antígeno 104. Los 20 analitos más robustos se determinaron para cada ejecución y éstos fueron luego ensamblados en un conjunto exhaustivo de los modelos de 7-marcadores. Sin embargo, se requiere que todos los modelos para contener un núcleo invariante de los tres analitos más robustos e informativas, es decir, CA-125, la proteína C reactiva y EGF-R, que reduce el espacio de búsqueda a 2380 combinaciones. Para ambos niveles de tolerancia de error se identificaron los diez más sensible y diez modelos más específicos - dando un total de 40 modelos. La frecuencia de uso de ambos analitos individuales y varias combinaciones de analito a través de los 40 modelos, condujo a la identificación de 11 analitos que juntos apareció robusto e informativo. Por último, un único modelo fue construido en estos 11 analitos y bloqueado en el DMS. Sólo después de bloquear el modelo fueron los datos restantes, no se utilizan en la formación, anotó para poner a prueba el modelo (Figura 1).
Análisis de Datos
Los intervalos de confianza se calcularon utilizando el método de Newcombe [29] .
resultados
Evaluación preliminar de la prueba de principio clasificador
el primer conjunto de datos, generados en 147 cáncer de ovario y 149 muestras de control del cáncer de ovario no era utilizado para explorar la posibilidad de utilizar una plataforma de inmunoensayo multiplexado de alto rendimiento como herramienta de descubrimiento. La hipótesis de que un patrón de clasificación para el cáncer de ovario en estadio I persistiría a través de todas las enfermedades de fases posteriores, por lo que sólo las muestras de cáncer en estadio I se utilizaron para el desarrollo del modelo. Este enfoque también equilibra la edad promedio de los pacientes de casos y controles, la eliminación de sesgo relacionada con la edad durante el modelado (Tabla 1). A través de varias rondas de enriquecimiento para los biomarcadores más informativos, impulsados por la evaluación de los errores de arranque para el conjunto de muestras desarrollo del modelo, un modelo de 7 analito evolucionó, que consiste en la CA-125, EGF-R, la proteína C-reactiva, apolipoproteínas CIII y A1, IL-18 y tenascina C. Esta etapa I perfil específico fue encerrado en la DMS. Sólo después de que el modelo fue bloqueado en la DMS fue los datos de las muestras de prueba (los que no utilizan en el modelado) y anotó visitada por el modelo para dar los resultados se describen a continuación (Figura 1).
Dado que toda la etapa I datos generados en la primera ronda de ensayos habían sido utilizados en el modelado, no había datos independientes a la sensibilidad fase de prueba I. Sin embargo, el 100 veces estimación bootstrap de sensibilidad etapa I fue del 87% (Tabla 2). La estimación de arranque para la especificidad, basado en los controles utilizados en el desarrollo del modelo fue 82,3%. a continuación, se evaluó el clasificador utilizando la primera ronda de muestras de ensayo, un conjunto de muestras independientes que no se utilizan en ningún aspecto del desarrollo del modelo. El clasificador tenía sensibilidad 95,3% y 70,6% de especificidad. Rendimiento para las muestras benignas fue menor (67,1%) que los otros controles. No hubo un solo subtipo de cáncer que se anotó significativamente diferente de los otros y cuando se descomponen por etapa, la sensibilidad varía poco (94,0 a 100%), apoyando la hipótesis de que un patrón de la etapa I podría persistir a través de todas las etapas de la enfermedad. Después de la segunda ronda de ensayos, todos los datos de dos redondos se califica en este modelo de bloqueo. Las muestras comunes a una ronda mostraron un rendimiento reproducible con sensibilidad 97,1% (IC del 95%, 91,0-99,2%) y 74,5% de especificidad (CI 95%, 64,7-82,4%). Las 69 muestras adicionales, no analizados previamente, a condición de un segundo conjunto de pruebas y dio la sensibilidad del 85,7% para el estadio I, una sensibilidad del 100% para el estadio II y el 67,5% de especificidad.
Evaluación Preliminar del clasificador final
El clasificador de prueba de principio confirma nuestra hipótesis de que el uso de datos sólo en estadio I, tanto para el desarrollo de modelos y la evaluación que podrían identificar un patrón informativo que pueda existir y persiste a través de etapas posteriores del cáncer. Por lo tanto, hemos tratado de desarrollar el modelo de la etapa I aún más el uso de todas las etapas I muestras disponibles. La misma estrategia de modelado se repitió con dos modificaciones importantes. En primer lugar, se implementó un algoritmo propietario diferente, y en segundo lugar, todas las muestras analizadas en estadio I a través de ambas rondas uno y dos se utilizaron para aumentar el tamaño del conjunto de datos de desarrollo del modelo (Figura 1). La estrategia de modelado pasó por varias etapas iterativas para enriquecer los biomarcadores más informativos, sobre la base de una evaluación única de los datos de entrenamiento en estadio I antes de culminar en una búsqueda exhaustiva de cerca de combinaciones de biomarcadores que generó 2380 modelos. Se seleccionaron cuarenta modelos basándose en su sensibilidad y especificidad de arranque en el conjunto de muestra la etapa I. Mediante la comparación de las combinaciones de biomarcadores en estos 40 mejores modelos (Tabla 3), y teniendo en cuenta el equilibrio que mostraron en la precisión de arranque, la sensibilidad, la especificidad y las desviaciones estándar, se identificaron un conjunto final de 11 biomarcadores informativos. Ciertas combinaciones de analitos eran comunes en muchos modelos, y había claramente "patrones de sustitución", donde un analito diferente o una combinación de los analitos podría producir modelos equivalentes. Los 11 biomarcadores - CA-125, de la proteína C-reactiva, EGF-R, CA 19-9, apolipoproteínas A1 y CIII, mioglobina, MIP-1a, IL-6, IL-18 y la tenascina C - se ensamblaron en un modelo final utilizando el algoritmo de KDE-VS y bloqueado en el DMS como el modelo final (Figura 1).
como una prueba preliminar del desempeño del clasificador, todos los datos que no se utilizan en el desarrollo del modelo se anotó, produciendo 91,3 % de sensibilidad y 88,5% de especificidad (Tabla 4, Figura 1). En particular, la sensibilidad fase II fue 83,9% y el rendimiento en las muestras benignas mejoró a 90,4%. Las muestras adicionales en estadio I no estaban disponibles, en ese momento, para las pruebas de esta actuación. Sin embargo, la estimación de arranque de la sensibilidad para el conjunto de entrenamiento fue del 83,4% para la enfermedad en estadio I y el 84,2% (± 12,5%) especificidad (Tabla 4). Como un ejercicio separado, se marcaron todos los datos duplicados de la segunda ronda no se utiliza en el desarrollo del modelo. Como se anticipó a partir de los resultados anteriores, el rendimiento fue similar con una sensibilidad del 96,1% (IC del 95%, 89,7-98,7%) y el 88,1% de especificidad (IC del 95%, 80,8-93,0%) con las muestras benignas anotando 87,0% (IC del 95%, 76,2-93,5%). Para proporcionar un marco de referencia, se comparó el rendimiento del modelo a la de una decisión clínica basada en los niveles de expresión de CA-125. Dado que ya se ha establecido el valor de corte de 35 UI /ml, el conjunto completo de datos se utilizó para evaluar el valor predictivo de la CA-125. Con este valor de corte, CA-125 dio sensibilidad de 94,9% y 58,6% de especificidad (tabla 5). Para las muestras de fase I por sí solos, la sensibilidad se redujo a 88,5%.
implementa dos métodos para estimar la importancia de los diferentes analitos que el clasificador general. En primer lugar, se evaluó el rendimiento del modelo cuando todos menos uno analito se mantuvo constante en los archivos de datos, con el valor del analito elegido al azar. Esto se repitió secuencialmente para cada analito. El valor relativo de cada analito se clasificó luego determinando qué analito clasificación de rendimiento causado a disminuir más cuando aleatorizado. Hemos observado que biomarcador importancia tendían a agruparse. Específicamente, CA-125 fue el biomarcador más importante, seguido de un grupo que consiste en proteína C-reactiva, CA 19-9 y EGF-R, seguido de MIP-1α, seguido de la mioglobina, apolipoproteína CIII, apolipoproteína A1, IL-18 y IL-6 y finalmente la tenascina C. Como segundo método de estimación de importancia analito, se analizaron los puntos de ramificación de las estructuras de votación. En todos los puntos de ramificación de las estructuras de votación, CA-125 estuvo implicado con mayor frecuencia (15,8%), seguido de CA 19-9 (12,1%), mioglobina (11,1%), proteína C-reactiva (10,8%) y EGF-R (9,9%). CA-125 se utilizó en el 80% de los puntos de ramificación de alto nivel, que representa la primera partición de la muestra principal, seguido por la proteína C-reactiva (11,2%), EGF-R (5,0%) y CA19-9 (1,8%). En el segundo nivel, se utilizó CA19-9 con más frecuencia (20,3%), seguido de EGF-R (18,8%), CA-125 (11,4%), mioglobina (9,8%), tenascina C (8,0%), IL-18 (7,2%), y A1 apolipoproteína (6,9%). Los marcadores de fase aguda MIP-1 alfa e IL-6 fueron vistos sólo el 6,2% y 1,3%, respectivamente, a este nivel.
Discusión
En este estudio hemos identificado un patrón de clasificación para el cáncer de ovario en el proteoma suero de pacientes con enfermedad en estadio I, que sigue siendo evidente a través de la enfermedad en etapa posterior. Los sueros de pacientes con condiciones confirmado patólogo-- ya sea con o sin cáncer de ovario epitelial - se perfila usando un enfoque de perfiles de múltiples análisis basado en perlas. Los analitos abarcan una amplia gama de estructuras y funciones biológicas, incluyendo antígenos de cáncer, hormonas, factores de coagulación, factores de modelación de tejido, constituyentes de lipoproteínas, proteasas e inhibidores de proteasa, marcadores de riesgo cardiovascular, factores de crecimiento, citocinas /quimiocinas, formas solubles de por células receptores, y reactantes de fase inflamatorias y agudas, así como marcadores para la autoinmunidad y la infección (Tabla S1) de señalización. Dos análisis independientes de las muestras se realizaron 86 días de diferencia. Hubo varios cambios de lote de reactivos y de lote durante este período, proporcionando un verdadero desafío al mundo la solidez de los ensayos subyacentes y el modelo.
Los cuatro componentes principales fueron críticos para el éxito de este estudio. En primer lugar, era esencial para identificar un conjunto de muestras altamente consistente, bien documentada y clínicamente representativa de casos y controles confirmados. Para el cáncer de ovario, la confirmación sólo puede venir de un examen patológico del tejido extirpado quirúrgicamente. Se seleccionaron muestras de suero de colecciones bien caracterizado de las mujeres ya programados para cirugía. La gran mayoría de los controles en esta población tenía condiciones benignas confirmado patología, que basado en el análisis univariado, debería suponer un mayor desafío para la clasificación de los sueros de las mujeres no sintomáticos (Figura 2; [24]). En segundo lugar, se utilizó un panel de completo, de alto rendimiento, los inmunoensayos que miden una amplia diversidad de moléculas que incluyen autoinmune y marcadores de enfermedades infecciosas, y una amplia gama de proteínas del suero bien caracterizadas, incluyendo los previamente implicada en el cáncer de ovario. En tercer lugar, se utilizó un novedoso enfoque de modelización multivariante para identificar un patrón robusto de moléculas informativas para el cáncer de ovario. El algoritmo propietario (KDE-VS) mejor clasificación de rendimiento en comparación con Random Forest y otros algoritmos de clasificación mediante la construcción de límites de decisión robustas en sus estructuras de votación, que incorpora en el mundo real variabilidad experimental en los datos que se está modelando. Finalmente hubo una clara separación entre las muestras utilizadas para desarrollar e identificar un único modelo informativo, y las muestras utilizadas para evaluar el rendimiento que los modelos
Para cada analito, los diagramas de caja de bigotes muestran:. La observación más bajo, más bajo cuartil, mediana, el cuartil superior, y la observación más alta. Todos los análisis, incluyendo los duplicados. CA-125 - un cáncer ovárico, 11 benignos y cinco muestras normales por debajo del valor mínimo de calibración; CA 199 - 14 de cáncer de ovario, 18 benignos, nueve normales y otros cuatro muestras de cáncer por debajo del valor mínimo de calibración; proteína C reactiva - 93 cáncer de ovario, 21 benignos, dos normales y otras dos muestras de cáncer por encima de más alto valor de calibración; IL-6 - 82 cáncer de ovario, 161 benigna, 28 normales y otras 14 muestras de cáncer por debajo del nivel de calibración más bajo; MIP-1α - 50 cáncer de ovario, de 53 años benigna, 10 normales y otras cuatro muestras de cáncer por debajo de más bajo nivel de calibración; tenascina C - dos cáncer de ovario y una muestra de calibración por encima de más alto nivel benigna. OvCa, cáncer de ovario; Ca, cáncer; Apo, apolipoproteína; CA-125, antígeno de cáncer 125; CA 19-9, 19-9 antígeno de cáncer; EGF-R, receptor del factor de crecimiento epidérmico (forma soluble); IL, interleucina; . MIP-1a, proteína inflamatoria de macrófagos 1 alfa
Nuestro estudio se centró en el análisis de la enfermedad en estadio temprano con & gt; 50% del conjunto de la muestra que representa el cáncer en estadios I y II de la enfermedad (Tabla 1). En consonancia con la literatura, la edad del paciente promedio de diagnóstico correlacionados con la etapa de la enfermedad en el diagnóstico (tabla 1; [22]). La distribución subtipo era representativa de la población de Estados Unidos, con una mayor proporción de serosa (42%) y endometrioide (26%) de carcinoma (Tabla 1). Las muestras de control fueron predominantemente de individuos con condiciones comunes benignas de ovario (75%), así como otros cánceres ginecológicos y no ginecológicas (8%), y un pequeño número de muestras no enfermos (17%), en consonancia con la necesidad para una prueba clínica para mujeres sintomáticas (Tabla 1).
Nuestra razón para centrarse en la enfermedad en etapa temprana era doble. En primer lugar, el cáncer de ovario de estadio temprano se considera curable, pero en muchos casos los síntomas son sutiles y difíciles de detectar.