Clínica
Extracto
La predicción exacta de los cursos clínicos sobre el cáncer de próstata sigue siendo difícil de alcanzar. En este estudio, se realizó un análisis del número de copias del genoma completo en los leucocitos de 273 pacientes con cáncer de próstata utilizando Affymetrix chip SNP6.0. las variaciones del número de copias (CNV) se encontraron en todos los cromosomas del genoma humano. Un promedio de 152 fragmentos de la CNV por genoma fue identificado en los leucocitos de pacientes con cáncer de próstata. Las distribuciones de tamaño de CNV en el genoma de leucocitos fueron altamente correlativa con la agresividad del cáncer de próstata. Un modelo de predicción de resultados cáncer de próstata fue desarrollado en base a la relación de gran tamaño de la NVC de los genomas de leucocitos. Este modelo de predicción genera un tipo de predicción promedio de 75,2%, con una sensibilidad del 77,3% y una especificidad del 69,0% para la recurrencia del cáncer de próstata. Cuando se combina con nomograma y el estado de transcritos de fusión, la tasa de predicción media se mejoró a 82,5% con una sensibilidad del 84,8% y una especificidad de 78,2%. Además, el modelo de predicción de leucocitos fue del 62,6% de precisión en la predicción de antígeno específico de próstata corto tiempo de duplicación. Cuando se combina con el grado de Gleason, nomograma y el estado de transcritos de fusión, el modelo de predicción genera una tasa de predicción correcta de 77,5% con una sensibilidad 73,7% y 80,1% de especificidad. Para nuestro conocimiento, este es el primer estudio que muestra que las VNC en leucocitos genomas son predictivos de los resultados clínicos de una enfermedad maligna humana
Visto:. Yu YP, Liu S, Z Huo, Martin A, Nelson JB, Tseng GC , et al. (2015) las variaciones genómicas número de copias en los genomas de leucocitos predecir los resultados clínicos del cáncer de próstata. PLoS ONE 10 (8): e0135982. doi: 10.1371 /journal.pone.0135982
Editor: Zoran Culig, Universidad Médica de Innsbruck, Austria |
Recibido: 24 Abril, 2015; Aceptado: 28 Julio 2015; Publicado: 21 Agosto 2015
Derechos de Autor © 2015 Yu et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Disponibilidad de datos: Todos los datos relevantes están dentro del apoyo de sus archivos de información en papel y. la información de datos en bruto de SNP6.0 partir de estas muestras se depositaron en la expresión de genes de Omnibus (GEO, número de acceso GSE70650)
Financiación:. Este estudio fue apoyado por una subvención del Instituto Nacional del Cáncer de los JHL (SR1 CA098249) y una beca de la Universidad de Pittsburgh Cancer Institute. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
el cáncer de próstata es una de las principales causas de muerte de hombres en los Estados Unidos. Tiene una considerable heterogeneidad en la agresividad biológica y pronóstico clínico [1-3]. Desde la implementación de la prueba de PSA sérico, la tasa de detección clínica de cáncer de próstata se ha incrementado sustancialmente debido principalmente a la identificación de los cánceres de grado pequeñas y bajas que probablemente no progresaría [1]. Sin embargo, cerca de 30.000 pacientes mueren cada año de cáncer de próstata [4]. La predicción exacta de la conducta agresiva de cáncer de próstata sigue siendo difícil de alcanzar.
En la actualidad, existen varias opciones de tratamiento disponibles para los pacientes con cáncer de próstata incluyendo espera vigilante, la radiación, hormonales /quimio-terapia y la prostatectomía radical. Gleason de clasificación solo o en combinación con otros indicadores clínicos tales como los niveles de antígeno específico de la próstata en suero y la estadificación patológica o clínica ha sido la herramienta de guía en la selección de estas opciones de tratamiento. Un número significativo de pacientes con cáncer de próstata, sin embargo, experimentó recurrencia después de la resección quirúrgica de la glándula de la próstata. Existe una clara necesidad de una mejor predicción del pronóstico del cáncer de próstata. citogenética anterior y otros estudios del genoma sugieren un vínculo claro entre las anomalías del genoma y el cáncer de próstata [5-21]. Recientes análisis de número de copias del genoma del cáncer de próstata, tejidos benignos adyacentes al cáncer y muestras de sangre de pacientes con cáncer de próstata sugiere que la supresión del genoma y la amplificación de ciertas regiones en las muestras de cáncer de próstata se asociaron con pobres resultados clínicos [14; 22]. Todo el genoma y la secuenciación del transcriptoma revelaron transcritos de fusión en el cáncer de próstata de predicción de la recurrencia del cáncer de próstata [23]. En este estudio, hemos realizado análisis de todo el número de copias del genoma en los leucocitos de pacientes con cáncer de próstata. variaciones del número de copia significativas (CNV) se identificaron en el genoma de leucocitos de pacientes con cáncer de próstata. Se encontró que los tamaños de las VNC en los leucocitos de muestras de cáncer de próstata fueron altamente correlativa a la recurrencia del cáncer de próstata. Los modelos de predicción fueron construidos para predecir los resultados de cáncer de próstata en función del tamaño de la CNV de los leucocitos.
Materiales y Métodos
El protocolo del estudio fue aprobado por la Universidad de Pittsburgh Junta de Revisión Institucional.
procesamiento de tejidos, extracción de ADN, la generación de amplificación, etiquetado, la hibridación, lavado y barrido de 6,0 SNP chips de
muestras de cáncer de próstata se obtuvieron de la Universidad de Pittsburgh Medical Center Banco de Tejidos. Estas muestras se obtuvieron de 1998-2012. Se analizaron los doscientos setenta y tres muestras de la capa leucocitaria de pacientes con cáncer de próstata. Entre estas muestras, 143 muestras fueron seguidos al menos 90 meses, 35 pacientes eran no recurrente durante 90 meses o más, 55 pacientes que experimentaron recurrencia con PSADT corto (PSA tiempo & lt duplicar; 4 meses), y 53 pacientes que experimentaron recurrencia de larga PSADT (PSA tiempo & gt duplicar; 15 meses) después de la prostatectomía radical (S1 Tabla). las puntuaciones de todas las muestras de cáncer de próstata del Gleason fueron reevaluados por UPMC patólogos antes del estudio. El seguimiento clínico se llevó a cabo mediante el registro de examen de la oficina, estudio de PSA en la sangre y seguimiento radiográfico. Estos seguimientos se llevaron a cabo hasta por un periodo de 15 años después de que el paciente tenía una prostatectomía radical. El protocolo fue aprobado por "Junta de Revisión Institucional de la Universidad de Pittsburgh". Quinientos nanogramos de ADN genómico fueron digeridos con Sty1 y NSP1 durante 2 horas a 37 ° C. El ADN digerido se purificó y se ligó con cebadores /adaptadores a 16 ° C durante 12-16 horas. Los amplicones se generaron mediante la realización de PCR usando los cebadores proporcionados por el fabricante (Affymetrix, CA) en los productos de ligación utilizando el siguiente programa: 94 ° C durante 3 min, luego 35 ciclos de 94 ° C 30 segundos, 60 ° C durante 45 seg y 65 ° C durante 1 minuto. Esto fue seguido por la extensión a 68 ° C durante 7 min. Los productos de PCR fueron entonces purificados y digeridos con DNAseI durante 35 min a 37 ° C para fragmentar el ADN amplificado. El ADN fragmentado se marcó con nucleótidos biotinilados a través de desoxinucleótido transferasa terminal para 4 horas a 37 ° C. Doscientos cincuenta microgramos de ADN fragmentado se hibridó con un Affymetrix SNP chip de pre-equilibrada 6,0 a 50 ° C durante 18 horas. Los procedimientos de lavado y barrido de SNP 6,0 virutas siguieron los manuales proporcionados por Affymetrix, Inc. Raw información de datos de SNP6.0 partir de estas muestras fue depositado en "Gene Expression Omnibus" (GEO, número de acceso GSE70650).
El análisis estadístico
análisis de la variación del número de copia.
CEL archivos fueron analizados con Genotipado de la consola para el análisis de control de calidad. Las muestras con una llamada de control de calidad por encima del 80% y la relación de contraste de control de calidad por encima de 0,4 fueron admitidos en el análisis. Para analizar la CNV, CEL archivos fueron importados en Partek GenomeSuite 6.6 para generar el número de copias a partir cruda intensidad. Para representar gráficamente la histogramas, deleción o amplificación de los genomas fueron analizadas por primera limitante para las regiones con p-valor inferior a 0,001. Las regiones seleccionadas se filtraron posteriormente mediante la limitación a las regiones con al menos 10 marcadores y 2 kb de tamaño. Las regiones fueron asignadas a los genes conocidos. Las frecuencias de amplificación y deleciones se representaron gráficamente con el genoma correspondiente a los lugares de genes (Fig 1A). Para cada gen, se aplicó la prueba exacta de Fisher para probar la asociación entre la participación de la CNV y el estado de la recurrencia de la muestra. A continuación, los valores de p menos log se representaron en la parcela de Manhattan con sus correspondientes localizaciones cromosómicas de genes para generar la figura 1B. Se aplicó el método de Benjamini-Hochberg (BH) para corregir los valores de p. Las vías enriquecido CNV-genes fueron seleccionados mediante la prueba de Kolmogorov-Smirnov en los valores p ajustados de genes. los valores de p vía también se corrigieron por el método de BH
.
(A) Histograma de la frecuencia de la amplificación (rojo) o deleción (azul) de secuencias del genoma de leucocitos (panel superior, n = 273) de pacientes con cáncer de próstata . (B) de Manhattan parcelas de los valores de p en asociación con la recurrencia del cáncer de próstata de cada gen CNV a partir de leucocitos.
De estado
métodos de aprendizaje de máquina para predecir recurrente y rápido recurrente.
construido modelos de predicción para los dos tipos de comparaciones clínicas: (1) no recurrente frente al recurrente; (2) recurrente no rápido (es decir, no periódico o recurrente, pero que tiene el antígeno específico de la próstata tiempo de duplicación [PSADT] ≥ 15 meses) frente a (PSADT≤ recurrente 4 meses)-rápido recurrente. Para cada comparación, los modelos se construyeron utilizando la puntuación de Gleason (G), la puntuación nomograma (N), el estado de transcripción de fusión (F) o información de la CNV en la sangre (L) por separado. Para la puntuación de Gleason discriminación, se utilizó la predicción binaria (puntuación de Gleason ≤ 0 significado 7 y 1 significado Gleason & gt; 7). Para la puntuación nomograma, se utilizó la probabilidad de supervivencia a los 7 ejercicio obtenido a partir http://www.mskcc.org/nomograms/prostate [24]. Para el estado de fusión, se aplicó ocho transcripciones de fusión (TRMT11-GRIK2, SLC45A2-AMACR, mTOR TP53BP1, LRRC59-FLJ60017, TMEM135-CCDC67, KDM4-AC011523.2, Man2a1-FER y CCNH-C5orf30) identificados y validados previamente en una estudio multicéntrico [23]. Se usó una puntuación de fusión binaria (0 significa ninguna de las ocho fusiones detectado; 1 significa uno o más transcritos de fusión detectado). Para la predicción de genes usando CNV de los leucocitos, hemos encontrado poca capacidad de predicción de la asociación basada en los genes (Figura 1B). Como resultado, hemos desarrollado un modelo de gran relación de tamaño (LSR), basado en la suposición de que no focalizados aberraciones de la CNV en la sangre jugaron un papel significativo en la predisposición de los tumores de próstata a la agresividad. Como se muestra en la figura 2A, LSR se definió como la proporción de gran tamaño CNV identificado en el genoma de la sangre de un paciente dado, en gran tamaño se define por δ umbral. En cada uno de dos veces la validación cruzada, las muestras fueron al azar e igualmente divididos en dos conjuntos de datos. En el primer conjunto de datos tratados como datos de entrenamiento, el mejor parámetro δ en el modelo de LSR y las mejores puntos de corte de las puntuaciones de nomograma y LSR se seleccionaron mediante la maximización de la AUC más alta (área bajo la curva) y el índice Youden (es decir, la sensibilidad + especificidad-1). Los modelos se aplican entonces a la segunda base de datos como datos de prueba. A continuación, la validación cruzada se repitió utilizando el segundo conjunto de datos como datos de entrenamiento y el primer conjunto de datos como datos de prueba. Las curvas ROC se representaron mediante la variación de los puntos de corte, tanto en la formación y las pruebas de datos. El correspondiente precisión, sensibilidad, especificidad, índice general Youden y AUC fueron calculados para evaluar el rendimiento. La validación de la igualdad de división se repitió durante 14 horas y la parte superior e inferior 2 2 división con la puntuación más alta y más baja de las AUC fueron retirados para evitar la formación de asignación /prueba accidentalmente extrema. Los 10 resultados de validación cruzada restantes fueron finalmente promedio (Tabla 1 y Tabla 2). ROC y Kaplan-Meier de supervivencia de las figuras 3-6 se muestran los resultados representativos de las 10 predicciones más cercanos a los valores promediados.
(A) Representación esquemática del modelo de LSR de leucocitos CNV. (B) LSRs de leucocitos están asociados con el comportamiento recurrencia del cáncer de próstata agresivo. Panel superior: Correlación de LSRs de genomas de leucocitos con cánceres de próstata que fueron recurrentes; Panel inferior: Correlación de LSRs de genomas de leucocitos con los cánceres de próstata que eran de carácter no recurrente de 90 meses después de la prostatectomía radical. (C) LSRs de leucocitos se asocian a corto PSADT. Panel superior: Correlación de LSRs de genomas de leucocitos con cánceres de próstata que tenían antígeno específico de próstata recurrente suero tiempo de duplicación (PSADT) 4 meses o menos; Panel inferior: Correlación de LSRs de genomas de leucocitos con los cánceres de próstata que no fueron recurrentes o recurrente, pero que tienen PSADT 15 meses o más
(A) LSR derivado del genoma de leucocitos CNV predice la recurrencia del cáncer de próstata.. Curva de funcionamiento del receptor (ROC) análisis utilizando LSRs derivadas de leucocitos CNV como parámetro de predicción (rojo) para predecir la recurrencia del cáncer de próstata, en comparación con el diagrama superior (azul), grado de Gleason (verde) y el estado de las 8 transcripciones de fusión [14] (amarillo). Las muestras fueron igualmente divididos aleatoriamente en formación y las pruebas conjuntos de 10 veces. El análisis ROC representa los resultados de la división más representativo. (B) Combinación de LSR (L), el grado de Gleason (G), nomograma (N) y el estado de transcritos de fusión (F) para predecir la recurrencia del cáncer de próstata. ROC análisis de un modelo que combina LSR, transcripciones de fusión, el diagrama superior y grado de Gleason usando LDA se indica con negro. ROC análisis de un modelo que combina la transcripción de fusión, nomograma y grado de Gleason usando LDA está indicado por el rojo. ROC análisis de un modelo que combina LSR, transcripciones de fusión y grado de Gleason usando LDA se indica con azul. ROC análisis de un modelo que combina LSR, transcripciones de fusión y Nomograma utilizando LDA se indica con color verde. ROC análisis de un modelo que combina LSR, Nomograma y Gleason de grado se indica mediante amarilla. divisiones aleatorias similares de formación y las pruebas conjuntos de datos se realizaron como en (A).
El análisis de Kaplan-Meier en pacientes predichos por LSR sobre la base de la CNV de los leucocitos de los pacientes más propensos recurrente frente probablemente no recurrente (arriba a la izquierda). supervivencia similar análisis también se realizaron en las segregaciones de casos basados en los grados de Gleason (media-alta), la probabilidad nomograma (parte superior derecha), el estado de 8 transcripciones de fusión (inferior izquierda), o un modelo mediante la combinación de LSR, Nomograma y el estado transcripción de fusión usando LDA (media baja), o un modelo mediante la combinación de LSR, el diagrama superior, grado de Gleason y el estado transcripción de fusión usando LDA (inferior derecha). Número de muestras analizadas y los valores p se indican.
LSR derivado del genoma de leucocitos CNV predice PSADT 4 meses o menos. análisis ROC utilizando LSRs derivadas de leucocitos CNV como un parámetro de predicción (rojo) para predecir PSADT 4 meses o menos, en comparación con el diagrama superior (azul), grado de Gleason (verde) y el estado de las 8 transcripciones de fusión [14] (amarillo). Las muestras se analizaron mediante el mismo procedimiento que la figura 3. (B) Combinación de LSR (L), el grado de Gleason (G), nomograma (N) y el estado de transcritos de fusión (F) para predecir cáncer de próstata PSADT recurrente 4 meses o menos . ROC análisis de un modelo que combina LSR, transcripciones de fusión, el diagrama superior y grado de Gleason usando LDA se indica con negro. ROC análisis de un modelo que combina la transcripción de fusión, nomograma y grado de Gleason usando LDA está indicado por el rojo. ROC análisis de un modelo que combina LSR, transcripciones de fusión y grado de Gleason usando LDA se indica con azul. ROC análisis de un modelo que combina LSR, transcripciones de fusión y Nomograma utilizando LDA se indica con color verde. ROC análisis de un modelo que combina LSR, Nomograma y grado de Gleason se indica mediante amarilla.
El análisis de Kaplan-Meier en pacientes predichos por LSR sobre la base de la CNV de los leucocitos de los pacientes más propensos recurrente y que tiene PSADT 4 meses o menos en comparación con probabilidad no recurrente o recurrentes pero tener PSADT 15 meses o más (superior izquierda). supervivencia similar análisis también se realizaron en las segregaciones de casos basados en los grados de Gleason (media-alta), la probabilidad nomograma (parte superior derecha), el estado de 8 transcripciones de fusión (inferior izquierda), o un modelo mediante la combinación de LSR, Nomograma y el estado transcripción de fusión usando LDA (media baja), o un modelo mediante la combinación de LSR, el diagrama superior, grado de Gleason y el estado transcripción de fusión usando LDA (inferior derecha). Número de muestras analizadas y los valores p se indican.
Para probar si la combinación de múltiples datos de información mejora el resultado de predicción, se aplicó el análisis discriminante lineal (LDA) para combinar dos o más factores predictivos. Todo se realizaron combinaciones posibles. Modelos usando (1) L + N + F (2) L + N + G (3) N + F + G (4) L + F + G (5) L + N + F + G se muestran en las figuras 3 y 5.
análisis de la curva de Kaplan-Meier
para la evaluación de la supervivencia (figuras 4 y 6), se combinaron la validación doble cruz de "Formación = & gt; Testing". consecuencia de comparar el rendimiento de diferentes métodos, a excepción de la puntuación de Gleason que utilizamos (≤7 VS & gt; 7 como límite para el conjunto de muestras). Las curvas de Kaplan-Meier se cortan después de los 90 meses de seguimiento. Se realizó la prueba de log-rank para calcular el valor de p entre las curvas de supervivencia de los dos resultados previstos. Para evaluar si la diferencia en la supervivencia de un modelo fue significativamente mejor que el otro, se define una estadística de prueba U como la diferencia absoluta de las estadísticas de prueba de log-rank de los dos modelos. En teoría bajo la hipótesis nula (dos modelos fueron no discriminante), la prueba estadística T seguían una distribución de la diferencia absoluta de dos chi-cuadrado independiente (grado de libertad = 1) distribuciones. Como resultado de ello, tomamos muestras de 10.000.000 de veces a partir de la diferencia absoluta de dos distribuciones independientes chi-cuadrado para formar nula distribución y evaluar los valores de p.
Copiar
Resultados
Genoma anomalías son algunas de las características para el cáncer de próstata. Sin embargo, poco se sabe acerca de las anomalías de copias del genoma en tejidos no cancerosos de pacientes con cáncer de próstata. Para el análisis de las regiones de la amplificación y la deleción en el genoma de leucocitos de pacientes con cáncer de próstata, se analizaron 273 capas leucocitarias de pacientes con cáncer de próstata para CNV a través de todo el genoma utilizando Affymetrix SNP6.0. Utilizando los criterios de corte de tamaño ≥2 Kb, número de marcador ≥ 10 y p & lt; 0,001, se identificaron un total de 41589 fragmentos de la CNV, incluyendo 24213 segmentos de eliminación y 17376 de la amplificación, con la participación 17865 genes basados en la anotación de genes Partek (figura 1A ). Esto se traduce en un promedio de aproximadamente 152 CNVs por muestra. El tamaño medio de CNV en el genoma de los leucocitos es de aproximadamente 147 Kb. En promedio, se encontró que 256 genes para tener ya sea el aumento de número de copias o pérdida por genoma. Entre las muestras de sangre de 273, 143 muestras de sangre tienen más de 90 meses de seguimiento clínico en términos de recurrencia del cáncer de próstata. Curiosamente, cuando la categorización de las muestras de sangre en función del estado de recurrencia del cáncer de próstata, la CNV de leucocitos de pacientes que experimentaron recurrencia después de la prostatectomía radical tuvo un promedio de & gt; 3.2 tamaño pliegue mayor de la CNV frente CNV de pacientes que no tenían recurrencia durante al menos 90 meses. Dos caras prueba de la t mostró una fuerte correlación entre el tamaño de la CNV en los leucocitos y la recurrencia del cáncer de próstata (p = 2,2 x 10
-16), lo que sugiere que el tamaño de la línea germinal CNV puede jugar un papel significativo en la predisposición de cáncer de próstata a los cursos clínicos agresivos. Sin embargo, no específica (FDR = 0,05) gen implicado en la CNV del fragmento del genoma alcanza el umbral que diferencia el cáncer de próstata recurrente en comparación con las de carácter no recurrente (figura 1B). En conjunto, los resultados indican que el modelo de predicción basada en los genes es probable que tenga éxito en el análisis de leucocitos CNV, pero la distribución del tamaño de las VNC puede ser predictivo.
Para examinar si la línea germinal CNV es predictivo de recurrencia del cáncer de próstata, se desarrolló un algoritmo utilizando proporciones de la cantidad de fragmentos de gran tamaño. Como se ilustra en la figura 2A, para cada muestra, la relación de tamaño grande (LSR) se define como la relación de los fragmentos de la CNV cuyos tamaños son mayores que un valor de corte de tamaño (δ) sobre el número total de fragmentos de la CNV. Por ejemplo, 3 de los 7 CNV detectado en la figura 2A se encuentran "grandes fragmentos de tamaño" (tamaño ≥ delta) y el LSR de este paciente se calcula como 3/7 = 0,43. En la figura 2B, la distribución de LSR de pacientes que experimentaron recurrencia del cáncer de próstata mostró valores significativamente más altos que los que no experimentan recurrencia. Del mismo modo, la distribución de LSR de pacientes con recurrencia rápida (PSADT≤ 4 meses) fue significativamente mayor que los de los pacientes recurrentes no rápidos (no periódicos o recurrentes pero que tienen PSADT≥ 15 meses, la figura 2C). En el modelo de LSR, el umbral de tamaño δ se determina mediante la maximización de las AUC. Cuando los valores delta se optimizaron (S1 figura, δ = 10
4,5 = 31622 pb para el modelo de predicción recurrente y 1B seleccionado δ = 10
5,7 = 501187 pb para una rápida predicción recurrente), que predice la recurrencia del cáncer de próstata con una precisión de 77,6%, con una sensibilidad del 80,4% y una especificidad del 68,6%, mientras que la recurrencia rápida con una precisión del 62,4%, con una sensibilidad del 72,9% y una especificidad del 54,1%.
Para validar este modelo, 143 muestras de sangre (S1 Tabla) de pacientes con cáncer de próstata fueron divididos aleatoriamente en un conjunto de entrenamiento (72 muestras) y un conjunto de pruebas (71 muestras). El gran tamaño δ corte optimizado y LSR-corte se obtuvieron del análisis de formación al maximizar el índice Youden. Los parámetros se aplicaron a los datos de prueba establecidos para evaluar la precisión de la predicción. A continuación, la validación se repitió 14 veces y el mejor y el peor 2 2 fueron retirados para evitar la aleatorización extrema. El resto de los 10 resultados de estos análisis formación y las pruebas se promediaron (Tabla 1). Como se muestra en la figura 3A (análisis de representación en S2 Tabla) y en la Tabla 1, la precisión de la formación del modelo de LSR en la predicción de la recurrencia del cáncer de próstata alcanza 76,5%, con una sensibilidad del 77,8% y 72,4% de especificidad. Cuando los parámetros se aplican al conjunto de pruebas, la precisión de la predicción alcanza 73,9%, con una sensibilidad de 76,8% y 65,6% de especificidad. Estas tasas de predicción son mejores que las de nomograma (66,0% de precisión para la formación y el 61,3% para las pruebas, Tabla 1), y son significativamente más altos que los de Gleason de la corte individual (40,3% para la formación y el 39,4% para las pruebas; p = 8.6x10
-3 para la formación y p = 5.8x10
-3 para la prueba por comparación República de China, véase la Tabla 1 y la Tabla S3).
para examinar si la combinación de diferentes modalidades mejorará la predicción modelo, LSR sangre, el diagrama superior, grado de Gleason y el estado de las 8 transcripciones de fusión (TRMT11-GRIK2, SLC45A2-AMACR, mTOR TP53BP1, LRRC59-FLJ60017, TMEM135 -CCDC67, KDM4-AC011523.2, Man2a1-FER y CCNH-C5orf30 ) [23] en las muestras de cáncer de próstata se combinaron mediante el análisis discriminante lineal (LDA) para entrenar el modelo de predicción en el conjunto de entrenamiento. Tal modelo generó una precisión de la predicción de 87,9%, con una sensibilidad del 88,8% y del 85,4% para la recurrencia del cáncer de próstata en el conjunto de entrenamiento, y la precisión del 75,7%, con una sensibilidad del 81,7% y 64,0% de especificidad en el conjunto de pruebas (Figura 3B y Tabla 1). Curiosamente, la combinación de LSR, Nomograma y el estado de la transcripción de fusión parece producir los mejores resultados de la predicción: el 86,4% de precisión en el conjunto de entrenamiento y el 78,6% de precisión en el conjunto de pruebas. Estas tasas de predicción aparecen significativamente mejor que los generados a partir de cualquier modalidad solo (Tabla 1). Para evaluar la contribución de cada una de estas modalidades en el modelo de combinación, la resta de una de cada modalidad en un momento se hizo en el modelo para evaluar sus impactos respectivamente. Como se muestra en la figura 3B y la Tabla 1, la resta de la modalidad LSR parecía tener el impacto más significativo en la predicción de la recurrencia del cáncer de próstata: Las tasas de exactitud de predicción caen de 87,9% a 75,1% (ROC p = 0,044, véase S3 Tabla) en el conjuntos de entrenamiento y del 75,7% al 64,0% (p = 0,037 ROC) en los conjuntos de prueba. Esto fue seguido por los genes de fusión (p-valor entre las dos curvas ROC fue 0,109 y 0,159 para el entrenamiento para la prueba). Por otro lado, la resta del nomograma o Gleason no tuvo ningún impacto apreciable en el rendimiento de predicción del modelo (Tabla 1, Figura 3 y la Tabla S3).
Para examinar el rendimiento de predicción de la puntuación de PSA-LSR supervivencia libre de pacientes con cáncer de próstata, de Kaplan-Meier se realizaron análisis en 143 pacientes que tenían información clínica definitiva (S1 Tabla). estado de recurrencia para las muestras de prueba fueron predichas por el modelo de formación del conjunto de entrenamiento, y el modelo de predicción de muestras de entrenamiento fue entrenado desde el conjunto de pruebas. Las dos veces la validación cruzada de predicción de resultados combinados fueron utilizados para dividir los 143 pacientes en el grupo recurrente predicho y el grupo no recurrente. Como se muestra en la figura 4, cuando los pacientes fueron predichas por LSR como de alto riesgo de recurrencia del cáncer de próstata, sólo el 12,1% de los pacientes sobrevivió durante 90 meses sin recurrencia, mientras que más de 52,3% de los pacientes con el modelo LSR prevé que sea probable no recurrente sobrevivió 90 meses sin ningún signo de cáncer de próstata recurrente (promedio p = 9,9 x 10
-5 mediante la prueba de log-rank, la figura 4 y en la Tabla S4). Por el contrario, la puntuación de Gleason no produjo resultados diferentes estadísticamente significativas para los grupos de carácter no recurrente (p = 0,113 por la prueba de log-rank) recurrente y. Nomograma, sin embargo, genera estadísticamente significativas mejores resultados clínicos (33,9% frente a 18,4% y la tasa de supervivencia p = 0,0038 para la prueba de log-rank) cuando los pacientes fueron separados en base a predicho recurrente frente a la no-recurrentes por nomograma. Cuando se combinaron transcripciones de fusión, LSR genoma de leucocitos y el diagrama superior, mejoró los resultados de la predicción del cáncer de próstata, hasta el 58,1% la supervivencia libre de PSA si se prevé que sea no recurrente por el modelo en comparación con el 16,9% si se predijo de probabilidades recurrente por el modelo combinado (p = 2.9x10
-6 para las dos curvas de supervivencia). Este modelo de modalidad combinada supera significativamente a cualquier modelo de predicción sola modalidad (p = 6.6x10
-3 frente LSR, p = 1.8x10
-5 frente a Gleason, p = 3.5x10
-4 frente Nomograma, p = 0,017 frente a la transcripción de fusión, consulte la Tabla S5). Cuando se añadió Gleason al modelo, no mejoró la precisión de la predicción, pero mejoró las curvas de supervivencia.
Muerte relacionada
El cáncer de próstata está estrechamente asociado con el aumento de la velocidad de PSA serial recurrente. PSADT corto (& lt; 4 meses) se han utilizado como un sustituto de la muerte relacionada con el cáncer de próstata en los últimos 15 años [25; 26]. Para examinar si LSR en el genoma de los leucocitos también es predictivo de corta PSADT, muestras de sangre (S1 Tabla) se dividieron aleatoriamente en formación (65 muestras) y pruebas (64 muestras) conjuntos. Procesos similares se realizaron en estas muestras como se describe en la predicción de la recurrencia. Como se muestra en la Tabla 2, el modelo de LSR en la formación y las pruebas conjuntos de datos produjo una exactitud de predicción de PSADT = & lt; 4 meses como el 67,7% y 57,5%, respectivamente. La curva ROC del modelo de LSR en comparación con la línea diagonal (conjetura al azar) tiene valor de p = 0,016 para el conjunto de entrenamiento y 0,017 para el conjunto de pruebas (Figura 5, Tabla 2 y la Tabla S6). La predicción basada en las puntuaciones de Gleason produjo 42,3% de precisión para el conjunto de entrenamiento, y el 44,5% para el conjunto de datos de prueba. Por otro lado, el diagrama superior genera una precisión de la predicción de 67,8% y ROC valor p de 0,0082 en el conjunto de entrenamiento y el 64,5% de precisión y 0,0014 ROC p-valor en el conjunto de prueba. El estado de la transcripción de fusión en las muestras de cáncer de próstata produce una precisión del 68,8% y del 68,4% en datos de pruebas de formación y se pone, respectivamente. Estos 4 métodos no parecen ser significativamente mejor que otra cuando se realizaron pruebas proporción pares. Sin embargo, cuando se combinaron los 4 métodos, se produjo una precisión del 83,0% (ROC p = 5,3 x 10
-9) para el conjunto de entrenamiento y el 72,0% (p = 1.3x10 ROC
-4) para el conjunto de pruebas. Estos resultados fueron mejores que cualquier modalidad de predicción individual en términos de los valores del índice Youden (Tabla 2) exactitud, AUC y. Para investigar el impacto de cada una de estas modalidades en el modelo de predicción, cada modalidad se restó de forma individual a partir del modelo de predicción combinada. Los resultados de la predicción mostraron un rango de 72,8 a 82,5% de precisión en el conjunto de datos de entrenamiento y de 65,0 a 73,6% de precisión en el conjunto de datos de prueba, cuando se sustrajo una modalidad. Curiosamente, cuando se sustrajo ya sea LSR sangre o el estado transcripción de fusión del cáncer, los modelos combinados no produjo ningún significativamente mejores predicciones que cualquier predicción modalidad única excepción (Tabla S7) de Gleason, lo que sugiere que LSR sangre y transcripción de la fusión de estado eran los que más contribuyen en la combinada modelo de predicción.
Para analizar el impacto de la predicción PSADT corto de supervivencia sin cáncer de próstata PSA, de Kaplan-Meier se realizaron análisis en muestras segregan con base a la predicción PSADT por LSR genoma de leucocitos. Como se muestra en la Figura 6 y Tabla S8, cuando las muestras de sangre predichos por LSR tengan PSADT≤4 meses, la tasa de supervivencia libre de PSA fue de 17.1% a 90 o meses después de la prostatectomía radical, mientras que la tasa de supervivencia mejoró a 41,5% para los predichos tener meses PSADT≥15 o no periódico (prueba de log-rank p = 0,0039, véase la figura 6 y la Tabla S8). Por el contrario, las curvas de supervivencia predichas por la puntuación de Gleason terminaron con una tasa de supervivencia similar a 90 meses, y el valor de p entre dos curvas fue 0,0816 mediante la prueba de log-rank. Nomograma tenía la tasa de supervivencia libre de PSA de 21,4% cuando los pacientes se predice que tienen meses PSADT≤4. Esta tasa de supervivencia fue del 31,5% cuando los pacientes se prevé que sea no recurrente (p = 0,0021 mediante la prueba de log-rank). Sin embargo, cuando el modelo de la combinación de Gleason, se aplicó el diagrama superior, la transcripción de fusión y LSR sangre, la tasa de supervivencia libre de PSA fue de sólo el 7,9% cuando los pacientes se predice que tienen meses PSADT≤4, mientras que la tasa de supervivencia fue del 52,1% cuando los pacientes eran predice que tienen PSADT & gt; 4 meses o no recurrente (p = 1,6x10
-7). El modelo que combina 4 modalidades superó significativamente a los modelos de predicción basado en el grado de Gleason (p = 1.5x10
-6) o el diagrama superior (p = 3.0x10
-5) o LSR (p = 1.9x10
-5 ) o la transcripción de fusión (p = 0,0018) solo (Tabla S9). Estos análisis indican claramente que los tamaños de la variación del número de copias de los leucocitos humanos son correlativos con comportamiento clínico de cáncer de próstata. La combinación del genoma CNV de leucocitos con la información clínica de pacientes con cáncer de próstata sería rendimiento mucho modelos de predicción mejorados para el comportamiento de cáncer de próstata.
Discusión
Amplia presencia de CNV es una de las características importantes de tumores malignos humanos. CNV en los tejidos normales de individuos sanos fue también bien documentado [14; 27; 28]. Puesto que el análisis CNV es en gran medida insensible a la contaminación pequeña, puede requerir la contaminación más de 25% para detectar una alteración del número de copias en el genoma. Pequeño contaminación de la corriente de la sangre por las células de cáncer de próstata es generalmente sin ser detectado. La CNV detectada a partir de las capas leucocitarias en nuestro estudio probablemente representan el genoma de las VNC a partir de leucocitos. Nuestros estudios sugieren que los tamaños de CNV a partir de leucocitos de pacientes con cáncer de próstata son altamente correlativa con los resultados clínicos de cáncer de próstata. cross-validations).
doi:10.1371/journal.pone.0135982.s017
(DOCX)
Acknowledgments
We