Extracto
Antecedentes
Más de dos tercios de las mujeres que se someten a cirugía por sospecha de neoplasia de ovario no tienen cáncer. Nuestros resultados previos sugieren fosfolípidos como potenciales biomarcadores de cáncer de ovario. En este estudio, se midieron los niveles séricos de varios fosfolípidos entre las mujeres sometidas a cirugía para el cáncer de ovario se sospecha para identificar biomarcadores que mejor predicen si una masa ovárica es maligno.
Metodología /Principales conclusiones
muestras de suero obtenidas antes de la operación de las mujeres con cáncer de ovario sospecha inscribieron a través de un sistema rápido Reconocimiento prospectivo, basado en la población. Se analizaron las muestras de todas las mujeres en las que se confirma el diagnóstico de cáncer de ovario epitelial (EOC) y de casos de enfermedades benignas seleccionados al azar de las muestras restantes (no-EOC). Medimos biológicamente relevantes fosfolípidos utilizando cromatografía /espectrometría de masas de ionización por electrospray líquido. Se aplicó un poderoso enfoque de aprendizaje estadístico y la máquina, híbrido huberized máquina de soporte vectorial (SVM-HH) para dar prioridad a los fosfolípidos para entrar en los modelos de biomarcadores, y utilizamos la validación cruzada para obtener estimaciones conservadoras de las tasas de error de clasificación.
Resultados
El modelo HH-SVM utilizando las mediciones de combinaciones específicas de fosfolípidos complementa la medición clínica CA125 y mejora la precisión diagnóstica. En concreto, la medición de los fosfolípidos mejoró la sensibilidad (identificación de casos con niveles de CA125 preoperatorios por debajo de 35) entre los dos tipos de casos en los que el rendimiento CA125 es históricamente pobres - los casos en fase inicial y los de histología mucinosa. La medición de fosfolípidos mejoró la identificación de los casos de estadios tempranos de un 65% (basado en el CA125) al 82%, y los casos mucinosos de 44% a 88%.
Conclusiones /Importancia
Los niveles de concreto fosfolípidos séricos difieren entre las mujeres con cáncer de ovario y aquellos con condiciones benignas. Si validado por estudios independientes en el futuro, estos biomarcadores pueden servir como un complemento en el momento de la presentación clínica, para distinguir entre las mujeres con cáncer de ovario y aquellos con condiciones benignas con síntomas y características compartidas
Visto:. Shan L, Chen YA, Davis L, Han G, Zhu W, Molina AD, et al. (2012) Medición de fosfolípidos puede mejorar la precisión diagnóstica en el cáncer de ovario. PLoS ONE 7 (10): e46846. doi: 10.1371 /journal.pone.0046846
Editor: Anthony WI. He aquí, la Universidad China de Hong Kong, Hong Kong
Recibido: 26 Octubre, 2011; Aceptado 10 de septiembre de 2012; Publicado: 17 de octubre 2012
Copyright: © Shan et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este estudio fue financiado por la Sociedad Americana del cáncer (CART-00-196), el Instituto Nacional del cáncer (R01-CA106414), Departamento de Defensa y la Fundación DAMD17-98-1-8659 Celma Mastry cáncer de ovario. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:. Los autores han leído la política de la revista y tienen los siguientes conflictos: 1) Los autores y instituciones afiliadas tienen patentes sobre los fosfolípidos analizados para esta publicación y 2) Uno o más autores son empleados de una empresa comercial. Las siguientes patentes se presentaron como resultado de la investigación realizada: Método para el cáncer de Detección de Uso LPA como marcador, Número de Serie 61 /189.495, 08/20/08 Fecha del archivo. Licenciado 01/09; Método para la Detección de Cáncer de Uso Plasmalógenos como marcadores, Serial nº 61 /199.565, 11/18/08 Fecha del archivo. Licenciado 01/09; Método para detectar o monitorizar cáncer utilizando LPC como un marcador (LPC 14:00), PCT /US2008 /012483, Fecha del archivo 11/05/08. Licenciado 01/09; Lisofosfatidilcolina como un biomarcador de cáncer de ovario, la patente US6248553#B1, Fecha de presentación 05.13.05. En el momento en que se realizó la investigación y el manuscrito fue escrito dos coautores, Lain Shan y Lorelei Davis, fueron empleados por una empresa comercial con el nombre de Frantz Biomarcadores, LLC. Frantz Biomarcadores, LLC ya no es una empresa comercial que opera. Esto no altera la adhesión de los autores a todas las políticas de PLoS ONE sobre los datos y compartir materiales.
Introducción
Los datos sugieren que las mujeres con cáncer de ovario recientemente diagnosticado, aquellos cuya cirugía inicial se lleva a cabo por un oncólogo ginecológico tienen menor morbilidad y mortalidad y el aumento de la supervivencia global [1], [2]. Sin embargo, hasta la fecha en los EE.UU., la cirugía inicial para el cáncer de ovario se sospecha se realiza a menudo sin una referencia a este tipo de especialistas [1]. Esto es en parte porque no hay forma precisa de saber de antemano de la cirugía si una masa pélvica sospecha de ser cáncer de ovario es, de hecho, el cáncer. Como resultado, más de dos tercios de las mujeres que se someten a cirugía por sospecha de neoplasia de ovario no tienen cáncer [3] - [5]. Ya que se estima que el 5-10% de las mujeres estadounidenses se someterá a una intervención quirúrgica por sospecha de neoplasia de ovario durante su vida, se trata de una cuestión que tiene repercusiones importantes para la salud pública [6].
En la actualidad es difícil de manera apropiada las mujeres de triaje con una masa pélvica de Oncología ginecológica sobre la base de un alto índice de sospecha de cáncer de ovario, ya que hay pocas herramientas para llevar a cabo dicha evaluación. Un nuevo análisis de sangre, OVA1, recibió recientemente la aprobación de la FDA como un complemento en la evaluación prequirúrgica de las masas anexiales [7]. El biomarcador de cáncer de ovario solamente bien validado en uso clínico, suero CA125, se eleva en sólo aproximadamente la mitad de cáncer de ovario epitelial en estadio temprano (EOC) y no está elevada en aproximadamente el 20% de todo el EOC etapa, que los hagan suficientemente sensibles [8] , [9] .El valor de referencia CA125 más frecuente que designa una prueba de detección clínicamente positivo es de 35 unidades /ml aunque CA125 también es elevada en muchas enfermedades ginecológicas benignas, incluyendo muchas condiciones asociadas con masas pélvicas. Uno de los primeros estudios de cribado que combinan CA125 y ultrasonido ha demostrado que el uso de CA125 en suero como la primera prueba de la línea y el ultrasonido pélvico como una prueba secundaria tiene alta especificidad (99,9%) y el valor predictivo positivo (26,8%) para la detección de cáncer de ovario [10 ]. En un análisis retrospectivo de mujeres de alto riesgo, el uso de mediciones repetidas de los valores de CA125 incorporados en modelos estadísticos longitudinales mostró una sensibilidad mejorada del 70% al 86%, manteniendo la especificidad del 98% [11]. Un gran estudio prospectivo reciente (Collaborative Trial Reino Unido de cribado de ovario [UKCTOC]), la evaluación de cribado multimodalidad (cribado anual CA125 interpretarse utilizando un algoritmo de riesgo de cáncer de ovario, junto con ecografía transvaginal como segunda prueba de línea) sugiere que la multimodalidad tiene significativamente mayor especificidad (99,8%) que el uso de ultrasonido solo (98,2%) para la detección de los cánceres de ovario y las trompas primarios, aunque no se encontró ninguna diferencia estadísticamente significativa en la sensibilidad [12]. En la próstata, pulmón, colorrectal y de prueba de detección del cáncer de ovario, un ensayo aleatorio, los resultados a través de cuatro rondas de cribado del cáncer de ovario mostraron que la mayoría de los casos detectados mediante cribado estaban en etapa tardía [13], que apoya la necesidad de métodos adicionales y estrategias para lograr la detección temprana. Por lo tanto, una herramienta o un biomarcador que permite una clasificación precisa de los pacientes en grupos de alto y bajo riesgo de malignidad ovárica mejorarían la capacidad de los pacientes de triaje adecuadamente a los oncólogos ginecológicos. Además, en los casos individuales de masa pélvica, donde sospecha clínica de malignidad no es muy alta, es posible que la evaluación de biomarcadores podría facilitar la espera vigilante y dar lugar a un menor número de cirugías y /o menos urgentes.
fosfolípidos previamente analizados circulantes, incluyendo el ácido lisofosfatídico (LPA), lisofosfatidilcolina (LPC) y especies afines, por su potencial para discriminar entre las mujeres con los controles sanos y EOC, con resultados prometedores [14]. En otros trabajos recientes, se identificaron como plasmalogens otro grupo de sustancias que circulan con potencial como biomarcadores de cáncer de ovario [15]. En el presente estudio, hemos tratado de ampliar nuestro trabajo anterior hacia la validación de estos biomarcadores prometedores para la aplicación clínica en el diagnóstico de cáncer de ovario. Se midió los niveles séricos de múltiples especies de lípidos, incluyendo especies particulares de LPA, LPC y plasmenylphosphoethanolamine (PPE) con el fin de evaluar su rendimiento en la discriminación entre EOC y enfermedad benigna en comparación con, o en combinación con, la medición clínica de CA125 en muestras preoperatorias obtenido de forma prospectiva desde las mujeres que presentan cáncer de ovario sospecha
Algunos de los retos computacionales generales para los estudios de biomarcadores incluyen los siguientes:. la identificación de métodos estadísticos de gran alcance, la selección de marcadores predictivos de una (grande) del panel de candidatos potenciales, la evaluación de la articulación efectos de múltiples marcadores, y evitando modelo overfitting debido a la complejidad de los modelos computacionales no lineales. máquina de vectores de soporte (SVM) se ha demostrado que tienen un rendimiento superior en términos de precisión de la clasificación y ha sido identificado como uno de los más poderosos métodos de aprendizaje estadístico y la máquina para analizar los datos de alta dimensión, tales como el derivado de la expresión génica y los estudios de biomarcadores [16], [17]. En nuestro estudio, hemos empleado SVM. Para priorizar los marcadores que entran en el modelo, se utilizó por primera vez híbrido huberized máquinas de vectores de soporte (SVM-HH), que seleccionan automáticamente las variables y estimar su importancia con el coste computacional eficiente [18]. Para evitar el sobreajuste del modelo, utilizamos una técnica de remuestreo común, cinco veces la validación cruzada, para obtener las tasas de error más objetivos [19]. En pocas palabras, que primero equipado el modelo usando 4/5 de los datos, mientras que las pruebas de los resultados en la quinta restante de los datos, y este paso se repitió 5 veces para que cada 1/5 de los datos fue validado una vez durante el modelo desarrollo. Hemos desarrollado dos tipos de modelos en este estudio, los modelos de un solo paso y los modelos de dos pasos. Para desarrollar nuestros modelos de un solo paso, CA125 se incluyó junto con los otros biomarcadores medidos como variables continuas con ningún punto de corte especificado previamente. Para desarrollar los modelos de dos pasos, primero se empleó el valor de referencia clínica frecuente de 35 unidades /ml de CA125 que designa una prueba de detección positiva y luego empleamos nuestro algoritmo para los otros biomarcadores medidos con el fin de consultar si una prueba adicional añadido a este valor de referencia de CA125 podría mejorar la precisión diagnóstica para la clasificación, entre las mujeres con una presentación clínica de cáncer de ovario se sospecha, entre los "casos" (muestras de las mujeres en los que la cirugía confirmó EOC) y "benignos" (muestras de mujeres en las que confirmó la cirugía sin cáncer de ovarios). Más detalles sobre el desarrollo del modelo se proporcionan en la sección de estadística.
Materiales y Métodos
Los sujetos
El protocolo de estudio fue revisado y aprobado por la Junta de Revisión Institucional de la Universidad del sur de la Florida y todos los participantes proporcionaron su consentimiento informado por escrito. Los sujetos en el presente estudio se inscribieron a través de una investigación en curso prospectivo basado en la población de cáncer de ovario en el Tampa, Florida área metropolitana (con una población de aproximadamente 2 millones). A través del sistema determinación rápida del estudio, un total de 1057 mujeres con cáncer de ovario sospecha se inscribieron antes de la operación entre enero de 2005 y marzo de 2009, lo que representa aproximadamente el 75% de todos los casos elegibles en la región geográfica definida. Las mujeres con ooforectomía unilateral o bilateral antes no eran elegibles, al igual que las mujeres con antecedentes de cáncer (excepto cáncer de piel no melanoma). Todos los pacientes fueron sometidos a técnicas de imagen preoperatoria, ya sea por ultrasonido pélvico, CT y /o MRI. Sólo los pacientes que se sometieron a cirugía basada en la sospecha clínica de cáncer de ovario fueron elegibles y si un paciente fue diagnosticado con EOC, la estadificación quirúrgica fue documentado (incluyendo 233 en los que EOC fue confirmada - define como ovárica primaria, trompa de Falopio primario o cáncer peritoneal primario). Las muestras benignas fueron seleccionados al azar de las muestras restantes (no-EOC); patologías benignas incluyen endometriosis, quistes ováricos, y el fibroma de ovario. mediciones clínicas preoperatorias de CA125 en suero se obtuvieron de los registros médicos. Patología fue revisado de manera centralizada por un patólogo experto en cáncer de ovario (S.N). Se realizaron todas las evaluaciones histológicas que desconocía los valores de laboratorio de los ensayos de biomarcadores y todas las pruebas de laboratorio se realizó cegados al resultado del histológica (benigna frente EOC). Las muestras de algunos de los sujetos de este estudio fueron genotipo de forma independiente en un estudio de asociación de todo el genoma para identificar loci de susceptibilidad asociada con el riesgo de cáncer de ovario [20] y /o la prueba de mutaciones en los genes conocidos de susceptibilidad al cáncer de ovario [21].
Las muestras de suero
Las muestras de sangre para la medición de biomarcadores de estudio se obtuvieron por punción venosa de rutina antes de la cirugía. Las muestras se dejaron coagular y se mantuvieron a temperatura ambiente durante el transporte. Las muestras fueron centrifugadas y el suero alícuotas en criotubos, congelados a -80 ° C dentro de las cuatro horas de la recogida de muestras y se mantuvieron congelados hasta su análisis en el laboratorio.
Se extrajeron los lípidos de extracción
Los lípidos usando un Bligh modificado -Dyer método [22], que sigue el procedimiento descrito a continuación: se preparó una mezcla que consiste en 1000 DHPE pmol (1,2-Diheptadecanoyl-
sn
glicero-3-fosfoetanolamina), 200 pmol [
13C
16] 16:00 LPA (isótopo pesado de carbono-13 etiquetado 1-palmitoil-2-hidroxi-sn-glicerol-3-ácido fosfatídico), y [
13 C
3] 14:00 LPC (isótopo pesado de carbono-13 etiquetado 1-miristoil-2-hidroxi-sn-glicerol-3-fosfocolina (N, N, N-
13C-trimetil)), que se añadió a 200 l de suero del paciente, recoge como descrito arriba. Estos lípidos adicionales sirvieron como estándares internos para la cuantificación de LPA, PPE, y LPC, respectivamente. La mezcla se agitó en vórtex y (v:v) se añadió 2 ml 2:01 de metanol-cloroformo. La nueva mezcla se agitó en vórtex de nuevo y se mantuvo a temperatura ambiente durante 10 min. y luego se centrifugó a 3000 g a 10 ° C durante 10 min. Después de la centrifugación, dos capas se podía ver en esta mezcla. La capa superior es una mezcla de agua, metanol y cloroformo, mientras que la capa inferior es un gránulo proteínico. La capa líquida superior se transfirió a otro tubo y se secó bajo nitrógeno. El sedimento seco se reconstituyó en 200 l 0,1 M de acetato de amonio se disolvió en metanol y se transfirió a una inyección insertar dentro de un vial de inyección.
Cromatografía y Espectrometría de Masas
cromatografía líquida electrospray espectrometría de masas tándem (LC /ESI /MS /MS) análisis de LPA, PPE, y LPC se realizaron con un espectrómetro de masas Quattro Micro (Waters, Milford, MA, EE.UU.) equipado con un ionización por electrospray (ESI) de la sonda y que la interfaz con un HPLC Shimadzu SCL-10Avp sistema (Shimadzu, Tokio, Japón).
Para LPA y cuantificación PPE, los lípidos se separaron con un (2) columna Luna 5μ C18 (50 x 2,0 mm, 5 micras de tamaño de partícula, Phenomenex, Torrance, CA, EE.UU.). de amonio 1 mM solución acuosa de acetato se utilizó como fase móvil A mientras acetato de amonio 1 mM disuelto en metanol se utiliza como fase móvil B. El tiempo total de ejecución fue de 15 min y la tasa de flujo fue de 200 l /min. El gradiente utilizado fue el siguiente: la columna se equilibró primero con 20% de B (80% A), seguido por un cambio lineal de 20% B (80% A) a 100% B (0% A) en el 3 primero min . El gradiente se mantuvo a 100% B (0% de A) de la siguiente 8 min. En el restante 4 min, el gradiente se cambió de nuevo a 70% B (30% A) para volver a equilibrar la columna. Para reducir la contaminación del espectrómetro de masas, los eluyentes entre 0-2,5 min y 13 a 15 min se dirigieron en residuos. 20 muestra l se inyectó en un bucle de inyección de 50 microlitros. Masa análisis de espectrometría se llevaron a cabo en línea usando ionización por electrospray espectrometría de masas en el modo negativo de monitorización de varias reacción (MRM). Los parámetros de EM son los siguientes: tensión capilar, 3,0 KV; tensión de cono, 50 V; temperatura de la fuente, 100 ° C; temperatura de desolvatación, 350 ° C; tasa de gas de desolvatación, 500 l /h de flujo; tasa de gas de cono, 50 l /h de flujo; resolución de masa de los iones de los padres y la hija, 15,0; multiplicador, 650.
Para LPC cuantificación, los lípidos se separaron con una columna HTS DASH GOLD Hypersil (20 × 2,1 mm, 5 micras de tamaño de partícula, Thermo Electron, Waltham, MA). 0,3% de ácido fórmico en agua se utilizó como fase móvil A mientras que se utilizó 0,3% de ácido fórmico en metanol como fase móvil B. El tiempo total de ejecución fue de 14 min y la tasa de flujo fue de 200 l /min. El gradiente utilizado fue el siguiente: la columna se equilibró primero con 20% de B (80% A), seguido por un cambio lineal de 20% B (80% A) a 100% B (0% A) en el 3 primero min . El gradiente se mantuvo a 100% B (0% A) en el siguiente 7 min. En el restante 4 min, el gradiente se cambió de nuevo a 20% B (80% A) para volver a equilibrar la columna. Para reducir la contaminación del espectrómetro de masas, los eluyentes entre 0-2,5 min y 11 a 14 min se dirigieron en residuos. 40 muestra l se inyectó en un bucle de inyección de 20 microlitros. Masa análisis de espectrometría se llevaron a cabo en línea usando ionización por electrospray espectrometría de masas en el modo positivo de monitorización de varias reacción (MRM). Los parámetros de EM son los siguientes: tensión capilar, 4,0 KV; tensión de cono, 40 V; temperatura de la fuente, 100 ° C; temperatura de desolvatación, 350 ° C; tasa de gas de desolvatación, 500 l /h de flujo; tasa de gas de cono, 50 l /h de flujo; resolución de masa de los iones de los padres y la hija, 15,0; multiplicadores, 650.
Medidas de Control de Calidad del Laboratorio
Dado que los efectos de lote son un problema potencial en los esfuerzos de descubrimiento de biomarcadores, hemos empleado varias estrategias para vigilar y dar cuenta de esta preocupación, incluidas las normas internas, la calidad muestras de control y calibradores. Las normas internas se han descrito anteriormente (en "Extracción de lípidos"). muestras de control de calidad (QC) consistían en múltiples 300 alícuotas idénticas de suero humano agrupado. Una de las muestras de control de calidad se ejecuta antes de cada 10 muestras clínicas. Calibradores consistieron de concentraciones variables de los estándares de lípidos puros con púas en albúmina de suero humano 4% en tampón DPBS. Nueve diferentes concentraciones de los calibradores se hicieron de la solución madre y se ejecutan antes de cada 100 muestras.
Datos Pre-procesamiento y normalización
Los datos obtenidos de las estrategias de control de calidad de tres descritos anteriormente se utilizaron para dirección de gestión a ejecutar variación y proporcionar una base para la conversión del área de pico cromatografía de concentración absoluta para cada analito. Se obtuvieron las áreas bajo los picos de cromatografía de 8 EPP, 6, 5 LPA LPC y sus normas internas correspondientes (marcados por isótopos pesados). Las áreas bajo los picos de los estándares internos fueron utilizados para estimar la relación máxima entre el analito y los estándares internos. El comportamiento de cada analito en la generación de pico en comparación con su correspondiente patrón interno fue similar, con la excepción de SPC y PAF-C16; estos analitos fueron excluidos de los análisis. Por lo tanto, se incluyeron un total de 17 lípidos y CA125 en los análisis.
Vamos a
R
denotar la relación de pico entre el área del pico cromatográfico para analito dentro de las normas internas, y
C
denotan la concentración. Dada la relación lineal observada entre la relación de pico cuantificado y concentración conocida en cada conjunto de datos de calibración, una regresión lineal simple se realizó para estimar la pendiente de regresión para cada lote, el cual fue luego utilizado para la conversión de la concentración de las muestras clínicas de la relación de pico como . Se utilizó el análisis de la muestra de control de calidad entre cada 10 muestras clínicas para examinar la variación de cualquier efecto potencial del lote. La concentración estimada de control de calidad también se utilizó para calcular las concentraciones de lote ajustados para cada analito de modo que las concentraciones fueron comparables entre los lotes para cada uno de los LPA y EPP. Si la concentración ajustada fue menor que cero, entonces cero se utilizó para la concentración estimada. Para LPC, que no había indicios de efectos observables por lotes. Por lo tanto, no se realizó ningún ajuste por lotes.
Desarrollo de Modelos Estadísticos
Hemos empleado un poderoso enfoque de aprendizaje estadístico y la máquina, SVM [16], [17], para clasificar las 211 muestras de la pacientes con diagnóstico de EOC (casos) y las 212 muestras benignas (benignos) incluidos en el análisis. Aunque SVM demuestra una clasificación de rendimiento superior a muchos otros métodos de aprendizaje estadístico y la máquina, que también comparte algunos desafíos comunes con otros métodos, a saber, la variable de selección (selección de biomarcadores) y el riesgo de generar tasas de error demasiado optimistas debido al modelo de sobreajuste. Utilizamos HH-SVM [18] para dar prioridad a los marcadores para entrar en el modelo de clasificación entre benignos y casos. HH-SVM combina la función de pérdida de bisagra huberized y la pena elástica-net para llevar a cabo la clasificación y selección de variables. Se utilizó el publicado anteriormente
R
código [18] para generar gráficos de peso para dar prioridad a los marcadores en función de su importancia en la clasificación. Debido a CA125 en suero es un marcador biológico común utilizado en la práctica clínica, construimos los modelos incluyendo CA125 y la adición de los lípidos marcadores candidatos uno por uno, basado en los pesos estimados por HH-SVM. Cada una de las SVM se ajustaron utilizando la función de Matlab
svmclassify Opiniones y se estimaron los parámetros. Utilizamos
K
-fold validación cruzada (CV) para evitar el sobreajuste del modelo [19], donde
K = 5
en nuestro estudio. Los errores generalizados estimados utilizando 5 veces la validación cruzada es más objetiva [19] que los porcentajes de error estimados sin la validación cruzada. Los datos se dividieron en
K
(= 5) partes más o menos del mismo tamaño. Para el
k
º (es decir, el 5
º) parte, hay más o menos una porción igual de caso EOC y las muestras benignas (mitad y mitad) y el modelo fue ajustado a la otra
K
-1 (= 4) partes de los datos. Después se calculó el error de predicción del modelo para el
k
ª parte. El procedimiento se llevó a cabo para
k
= 1, 2, ..., 5, y aswhere entonces la estimación de la validación cruzada del error de predicción (errores CV) fue calculado es la observación que contiene parte
i
, y es el valor ajustado para la observación
i
, calculada con el
ª parte de los datos extraídos.
Hemos desarrollado dos tipos de modelos, modelos de un solo paso y de dos modelos de paso. Para los modelos de un solo paso, no usamos un punto de corte específico para los valores de CA125 aunque los valores de CA125 se incluyeron en los modelos SVM. Para los modelos de dos pasos, desarrollamos nuestros algoritmos para los grupos de alto y bajo riesgo utilizando primero el punto de corte CA125 de 35 unidades /ml, ya que este es el valor de referencia más frecuente utilizado clínicamente para designar una prueba positiva, y tiene también ha utilizado en ensayos de cribado para definir un resultado anormal de la prueba, incluso en el de próstata, pulmón, colorrectal, cáncer de ovario Screening Trial [13] .Por lo tanto, se utilizó el punto de corte sencillo de 35 unidades /ml como el primer paso en la construcción del dos modelos de paso. Tenga en cuenta que todos los pacientes en nuestro estudio fueron sometidos a imágenes radiológicas de diagnóstico, no cribado, y la información de imagen no se incorpora en el desarrollo del modelo
.
Para los modelos de un solo paso, para un conjunto dado de marcadores, se desarrolla el modelo de la misma manera para todas las muestras, independientemente del nivel de CA125 preoperatoria. Empezamos con el desarrollo del modelo CA125 solo. fosfolípidos candidatos fueron clasificados por los pesos generados utilizando HH-SVM como se describe anteriormente, y después se añadió en los modelos de uno en uno durante el desarrollo del modelo. El uso de validación cruzada es más conservadora en comparación con los modelos desarrollados sin la validación cruzada. Para la prueba de principio, hemos desarrollado dos modelos con y sin validación cruzada, lo que demuestra que los modelos con rendimiento de validación cruzada tasas de error más objetiva.
Para los modelos de dos pasos, las muestras se clasificaron por primera vez en alta -CA125 (CA125≥35 unidades /ml) y de bajo CA125 (CA125 & lt; 35 unidades /ml) grupos. En el segundo paso, hemos desarrollado modelos separados para cada uno de los dos grupos, los grupos de alto y bajo de CA125, respectivamente. En concreto, hemos desarrollado los modelos de dos pasos, basado en el punto de corte frecuente de CA125 a 35 unidades /ml como el primer paso; que a continuación se preguntaron si una segunda prueba añade a este valor de referencia del CA125 puede mejorar la precisión diagnóstica para la clasificación de los "casos" (muestras de mujeres con EOC) y "benignos" (muestras de mujeres sin cáncer).
Resultados
el nuevo estudio incluyó muestras de todos los participantes en los que se confirma el diagnóstico de EOC (N = 233) y un número igual de muestras seleccionadas al azar de las mujeres de la misma cohorte diagnosticados con enfermedad benigna. Dos casos fueron excluidos debido a la falta de datos sobre el nivel preoperatorio CA125. El análisis preliminar (utilizando diagramas de caja e histogramas, los datos no se muestra) sugiere que los niveles de los biomarcadores medidos pueden diferir potencialmente entre los diferentes grupos raciales, y sólo una pequeña parte de las muestras son de sujetos de raza no caucásica. Por lo tanto, hemos limitado el análisis a los sujetos de raza blanca. Esto dio lugar a un total de 211 muestras de EOC y 212 muestras benignas incluyeron en los análisis. Entre los casos de EOC 211, la edad media (± desviación estándar) fue de 62 (± 12) años de edad, con 31 premenopáusicas y 180 posmenopáusicas. Entre los 212 benignos, la edad media (± desviación estándar) fue de 57 (± 14), entre los cuales 65 eran premenopáusicas y 147 posmenopáusicas. Más detalles acerca de las características de los casos de EOC se proporcionan en la Tabla 1.
Resultados de CA125
Se incluyó un total de 211 casos y 212 benignos en el análisis. Usando sólo la concentración de CA125 con punto de corte de 35 unidades /ml para clasificar las muestras en los casos (CA125≥35 unidades /ml) y benignos (CA125 & lt; 35 unidades /ml), la tasa de error es 29,79% (126/423). La sensibilidad es 84,36% (178/211) y la especificidad es 56,13% (119/212). La tasa de falsos positivos (muestras benignas clasificados como casos) es bastante alta, como es típico en la práctica clínica.
Resultados del modelo de un solo paso
Nos comenzaron con el desarrollo del modelo CA125 sola, la única de uso común biomarcador clínica para el cáncer de ovario. marcadores adicionales se han añadido en los modelos uno por uno basado en los pesos estimados usando HH-SVM (Tabla 2).
Como se describe en los métodos, un conjunto de modelos fueron equipados con el CV, y la otra sin CV. Los porcentajes de error estimados para los modelos con 1 a 5 marcadores incluidos se resumen en la Tabla 3. Como era de esperar, los modelos sin CV tienen estimaciones más optimistas de las tasas de error. A medida que el número de variables aumenta, las tasas de error se hacen más pequeños. Por el contrario, el error de CV de los modelos con dos marcadores, CA125 y 16:00, 18:01 PPE, es el mínimo entre los 5 modelos equipados con CV (Tabla 3). Como el número de marcadores aumenta 2-5, los errores CV se hacen más grandes (en lugar de más pequeño). Los errores CV aumentan a medida que el número de marcadores aumenta e indican el overfitting como se esperaba. Los modelos con un mayor número de marcadores no se enumeran aquí. El modelo con un mínimo de error CV contiene dos marcadores, CA125 y 16:00, 18:01 PPE. Su mejora para la clasificación sobre el modelo con solamente CA125 es debido a la mejora en la especificidad. La especificidad es 85.38% y la sensibilidad es 70.62%. Para comparar el rendimiento del modelo a la del punto de corte de 35 unidades /ml para CA125, el establecimiento de la especificidad de 56,13%, la sensibilidad es mejorada de 84,36% a 88,15%. De manera similar, el uso de este modelo, hay especificidad de diagnóstico comparable de 58,49% (en comparación con el 56,13%) en este grupo de muestras, mientras se mantiene la sensibilidad a 84,36%.
de dos pasos Modelo resultados
En los modelos de un solo paso anterior, hemos demostrado que el desarrollo del modelo utilizando la validación cruzada es más conservador. Por lo tanto, para los modelos de dos pasos, se utilizó sólo el enfoque conservador para desarrollar modelos con el fin de evitar el sobreajuste. Como se describe en los Materiales y Métodos sección, las muestras se clasificaron por primera vez en alta CA125 (CA125≥35) o de bajo CA125 (CA125 & lt; 35) grupos. Para la segunda etapa, hemos desarrollado modelos SVM separados para los grupos de alto CA125 y CA125 bajo. El HH-SVM como se describe en la sección Materiales y Métodos Se utilizó para dar prioridad a los biomarcadores para los grupos de alto y bajo de CA125, respectivamente.
Basándose en la clasificación de los marcadores en cada uno de los de alta y baja se estimaron -CA125 grupos (tabla 4), los errores de validación cruzada para SVM con 1 a 7 marcadores, respectivamente. Para el grupo de CA125 baja, el primer modelo SVM contiene el marcador mejor clasificado, 16:00, 18:01 PPE. El modelo se ajustó primero y se estimó CV error. El segundo modelo SVM contiene un marcador adicional en el modelo, 15:00 LPC, además de la original del marcador (de más alto rango), 16:00, 18:01 PPE. Este procedimiento de adición de marcadores de una en una en modelos basados en los pesos estimados por HH-SVM se repite para los modelos con 3 marcadores, 4 marcadores, y hasta 7 marcadores. Como el número de marcadores en el modelo aumenta, el aumento de los errores de CV indican el sobreajuste de los modelos como se esperaba, por lo que se detuvo la adición de marcadores. Para el grupo de bajo CA125, el modelo con la tasa de error menor CV es el modelo con 4 marcadores: 16:0, 18:01, 15:00 PPE LPC, 18:02 LPA, y 18:00, 22:06 PPE (como parte de los 3 modelos de la Tabla 5), que se refiere como "conjunto de 4 marcador" en la Tabla 5. para el grupo de alto CA125, los modelos fueron equipados de la misma manera. La primera SVM contiene los modelos de alta clasificación marcador, 16:00, 18:01 PPE, y adicionales con más marcadores fueron construidos por la adición de ellos uno por uno. El modelo se ajustó primero y se estimó CV error. La tasa de error CV más pequeña es la del modelo con 2 marcadores: 16:00, 18:01 y 14:00 PPE LPC, (como parte del modelo
M3
en la Tabla 5). Estos 2 marcadores se conocen como "marcador conjunto 2" en la Tabla 5.
El error de clasificación tarifas, especificidades y sensibilidades de los tres modelos de dos pasos con combinaciones de cualquiera de los 2 conjuntos de marcadores y /o los 4 conjuntos de marcadores se resumen en la Tabla 3. la primera etapa de la modelización para los tres modelos es idéntico, es decir, utilizando la concentración de CA125 de 35 unidades /ml como el punto de corte para clasificar las muestras en alta y baja grupos de CA125. Diferentes modelos para los grupos de alto y bajo de CA125 fueron equipados por separado (Tabla 5). El primer modelo,
M1
, tiene SVM modelos separados para los grupos de alto y bajo de CA125. Los marcadores para cada SVM son los 4 marcadores mencionados anteriormente (16:00, 18:01 PPE, 15:00 LPC, 18:02 LPA, y 18:00, 22:06 PPE), pero los modelos están equipados por separado para cada