Extracto
Antecedentes
Muchos hombres desarrollan un aumento del PSA después del tratamiento inicial para el cáncer de próstata. Mientras que algunos de estos hombres desarrolla una recidiva local o metastásica que justifica aún más la terapia, otros tendrán ninguna evidencia de progresión de la enfermedad. La hipótesis de que un panel de expresión de biomarcador puede predecir que los hombres con un aumento del PSA se beneficiarían de un tratamiento adicional.
Metodología /Principales conclusiones
Un diseño de casos y controles se utilizó para probar la asociación del gen expresión con el resultado. casos de progresión sistémica (SYS) eran hombres post-prostatectomía que desarrolló la progresión sistémica dentro de los 5 años después de recurrencia de PSA. controles de progresión de PSA fueron agrupados los hombres después de la prostatectomía con recurrencia de PSA pero no hay evidencia de progresión clínica dentro de los 5 años. El uso de arrays de expresión optimizados para RNA tejido incluido en parafina, fueron evaluados, incluyendo 1021 genes relacionados con el cáncer 570 genes implicados en la progresión del cáncer de próstata. Se incluyeron genes de 8 paneles de marcadores previamente comunicados. Se desarrolló un modelo de progresión sistémica que contiene 17 genes. Este modelo generó una AUC de 0,88 (IC del 95%: 0,84 a 0,92). AUC similares se generaron utilizando 3 paneles previamente comunicados. En los análisis secundarios, el modelo predice los criterios de valoración de muerte por cáncer de próstata (en los casos SYS) y la progresión sistémica más allá de 5 años (en los controles de PSA) con los coeficientes de riesgo 2.5 y 4.7, respectivamente (p-valores log-rank de 0,0007 y 0,0005). Los genes mapeados a 8q24 se enriquecieron de manera significativa en el modelo.
Conclusiones /Importancia
patrones de expresión de genes específicos se asociaron significativamente con la progresión sistémica después de la recurrencia de PSA. La medición del patrón de expresión génica puede ser útil para determinar qué los hombres pueden beneficiarse de la terapia adicional después de la recurrencia de PSA
Visto:. Nakagawa T, Kollmeyer TM, Morlán BW, Anderson SK, Bergstralh EJ, Davis BJ, et al . (2008) Un Tejido Panel de biomarcadores predecir la progresión sistémica después de la terapia del cáncer de próstata PSA recurrencia post-definitivo. PLoS ONE 3 (5): e2318. doi: 10.1371 /journal.pone.0002318
Editor: Anja-Katrin Bielinsky, Universidad de Minnesota, Estados Unidos de América
Recibido: 27 Diciembre, 2007; Aceptado: March 12, 2008; Publicado: 28 de mayo de 2008
Derechos de Autor © 2008 Nakagawa et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Esta investigación fue apoyado por el P50 CA91956 Mayo del cáncer de próstata SPORE subvención del NIH, y la Fundación Richard M. Schulze familia. También fue apoyado por el Departamento de Minnesota de Empleo y Desarrollo Económico de la asignación legislativa del Estado para la Asociación de Minnesota de Biotecnología y Genómica Médica. Tohru Nakagawa fue apoyado en parte por una subvención-en-Ayudas a la Estrategia Integral de 10 años Tercer Término para el Control del Cáncer del Ministerio de Salud, Trabajo y Bienestar de Japón
Conflicto de intereses:. Los autores han declarado que existen conflictos de intereses.
Introducción
La mayoría de los hombres con cáncer de próstata ahora son diagnosticados con cáncer que tienen un bajo riesgo de mortalidad por causas específicas [1]. Estos hombres son generalmente tratados con prostatectomía radical retropúbica (PRR), radioterapia de haz externo o braquiterapia intersticial y luego son seguidos por evaluaciones regulares de PSA sérico. Durante el próximo período de 5 a 10 años, el 15-30% de estos hombres desarrollará un PSA en aumento [2] - [6], la definición de una población en rápido crecimiento de la mayor importancia para la salud pública y clínica. De este grupo recaída bioquímica algunos hombres tendrán recurrencia local o tienen metástasis clínicamente detectables, pero muchos no tendrán otra evidencia de cáncer de próstata recurrente que no sea el aumento del PSA. El PSA "tiempo de duplicación" ha sido identificado como un sustituto potencial de mortalidad por causas específicas, y es utilizado por algunos médicos para determinar qué varones con recurrencia bioquímica merecen la ablación hormonal adyuvante, radioterapia local, o la simple observación [4] - [6 ]. Los biomarcadores que predicen cuál de estos hombres se beneficiarían de cualquier tratamiento adicional son necesarios
escala estudios de expresión génica grande de los cánceres de próstata de diferente grado y estadio han sido llevadas a cabo por varios grupos [7] -. [16]. Estos estudios de expresión han utilizado matrices que contienen conjuntos de sonda de hasta 35.000 genes. Si bien estos estudios son importantes para el descubrimiento de biomarcadores, varias dificultades se oponen a su traducción en un entorno clincial. En primer lugar, es probable que los paneles más pequeños serán utilizados clínicamente. En segundo lugar, debido a que los estudios previos necesarios de material congelado, el número de muestras analizadas fue limitada. En tercer lugar, ya que los eventos clínicos adversos en pacientes con cáncer de próstata requieren largos de seguimiento, los métodos de prueba deben ser aplicables al material incluido en parafina de archivo. Finalmente, ninguno de los estudios anteriores se ha centrado en el desarrollo de un panel de biomarcadores para predecir la progresión sistémica del cáncer de próstata en el entorno de la recurrencia de PSA.
Uso de la Clínica Mayo radical retropúbica (PRR) del Registro, se diseñó una estudio de casos y controles anidados para poner a prueba la hipótesis de que un conjunto limitado de ARN biomarcadores de expresión puede predecir que los hombres con un PSA post-PVP levantamiento podrían beneficiar de una intervención clínica adicional. El DASL ™ plataforma de microarrays de expresión Illumina fue seleccionado como el método de medición de biomarcadores, ya que mide la expresión de los genes diana utilizando parafina de tejidos [17] - [19]. Utilizando los datos de expresión de la literatura y derivado de nuestro propio programa de investigación hemos desarrollado un conjunto limitado de marcadores de expresión que probablemente cambiará en asociación con la progresión del cáncer de próstata. El panel también incluye biomarcadores de expresión de varios otros paneles publicados anteriormente que se asocian con sustitutos (puntuación de Gleason alta, alta estadio patológico o enfermedad metastásica) para la agresividad del cáncer de próstata [12] - [16].
Se presenta que las mediciones basadas en matrices mostraron una excelente correlación con las mediciones cuantitativas de RT-PCR de ARN en parafina derivada. Nos informan también de excelente intramatricial, entre matriz y reproducibilidad dentro del gen. A continuación describimos la prueba y validación de un panel de biomarcadores de tejido de la expresión génica para la predicción de la progresión del cáncer de próstata sistémica después de un aumento del PSA después de la prostatectomía radical. Comparamos el rendimiento de nuestro panel con otros paneles previamente publicados. Finalmente, se muestra que la sobreexpresión de los genes asignadas a la banda cromosómica 8q24 se asocia con la progresión del cáncer de próstata sistémica.
Métodos
gen de selección y diseño de arreglos para el ensayo
dos Illumina DASL microarrays de expresión se utilizaron para los experimentos.
El estándar comercialmente disponible Illumina expresión DASL microarray (Cancer Panel ™ v1) que contiene 502 oncogenes, genes supresores de tumores y genes en sus vías asociadas. Setenta y ocho de los objetivos de la matriz comercial se han asociado con la progresión del cáncer de próstata.
Una costumbre Illumina microarrays de expresión DASL ™ que contiene 526 genes objetivos de ARN, incluyendo los genes cuya expresión se altera en asociación con la progresión del cáncer de próstata . Las sondas para el panel DASL® encargo fueron diseñados y sintetizados por Illumina, Inc. (San Diego, CA).
cuatro conjuntos diferentes de genes la agresividad del cáncer de próstata Se incluyeron en el estudio (si los genes no estaban presentes en matriz del Grupo cáncer v1, que se incluyeron en el diseño de la matriz personalizada):
los marcadores de la agresividad del cáncer de próstata identificados por un Mayo /Universidad de Minnesota Asociación [20]: los perfiles de expresión de 100 láser de captura lesiones de cáncer de próstata y lesiones microdissected de control normales y de BPH emparejados fueron analizados utilizando 2,0 microarrays de Affymetrix HG-U133 Plus. Se generaron listas clasificadas de genes significativamente superiores e inferiores a expresadas compararon 10 Gleason 5 y 7 a 31 lesiones metastásicas Gleason 3 lesiones cancerosas. Los 500 mejores genes en esta lista se compararon con las listas generadas a partir de los estudios de microarrays de expresión anteriores y otros estudios con marcadores de cáncer de próstata (ver 2-4 siguiente). Después de este análisis no había espacio para 204 nuevas dianas con potencial asociación con el cáncer de próstata agresivo en la matriz personalizada.
Los marcadores asociados con la agresividad del cáncer de próstata a partir de los conjuntos de datos disponibles públicamente microarrays de expresión (por ejemplo, EZH2, AMACR, hepsin, PRLz, PRL3): Cuando diseñamos la matriz suficientemente grandes conjuntos de datos de microarrays 9 estudios previos de cáncer de próstata para distintas calidades y potencial metastásico [7] - [15] estaban disponibles en el sitio Internet Oncomine [21], [22], www.oncomine .org. A partir de listas ordenadas de estos datos se seleccionaron 32 genes para su inclusión en la matriz
marcadores publicados anteriormente asociados con la agresividad del cáncer de próstata (PSMA por ejemplo, PSCA, Cav-1):. Los datos de microarrays de expresión también ha sido publicado. Esta literatura se evaluó de biomarcadores de tejidos adicionales. Por ejemplo, en el momento de la gama de diseño hemos sido capaces de identificar 13 estudios de microarrays de expresión de alta calidad de la agresividad del cáncer de próstata (Ver Tablas S1 y S2 para la lista completa de referencias). Además, entre los 13 informes, 5 trabajos presentados 8 paneles expresión de biomarcadores para predecir la agresividad del cáncer de próstata [12] - [16]. Cuando sondas apropiadas adecuadas para la química DASL se podrían diseñar para estos paneles que fueron incluidos en la matriz a medida. También se identificaron 12 artículos que tratan de los genes asociados con el cáncer de próstata. Estos criterios resultaron en la selección de 150 genes.
marcadores derivados de la investigación SPORE Mayo (incluyendo genes y EST asignadas a 8q24). Se identificaron noventa y tres biomarcadores adicionales (ver Tablas S1 y S2).
La matriz personalizada también incluye conjuntos de sonda durante 45 genes que no se esperaba que difieren entre los grupos de casos y controles basados en Mayo /Universidad de los datos de asociación Minnesota. Treinta y ocho de estos genes también estaban presentes en la matriz comercial (véanse los cuadros S1 y S2).
Después de enumerar el cáncer de próstata potencialmente genes relevantes en el panel sobre el cáncer disponible comercialmente 570 genes relevantes de cáncer de próstata potencialmente 451 y otro genes relacionados con el cáncer se evaluaron a través de ambas matrices.
Diseño de casos y controles anidados estudio
En este estudio se muestrearon individuos del Registro PVP Clínica Mayo. El registro consiste en una población de hombres que recibieron prostatectomía como primer tratamiento para el cáncer de próstata en la Clínica Mayo (Para una descripción y uso actual del registro; véase la referencia [23]). Como la progresión sistémica es relativamente poco frecuente, se diseñó un estudio de casos y controles anidado en una cohorte de hombres con un PSA en aumento. Entre 1987-2001, ambos inclusive, 9.989 hombres previamente no tratados tenían PVP en Mayo. En el seguimiento, 2.131 desarrollaron un aumento del PSA (& gt; 30 días después de la PRR) en ausencia de recurrencia clínica concurrente. elevación del PSA se definió como un seguimiento de PSA & gt; = 0,20 ng /ml, con la siguiente PSA al menos 0,05 ng /ml o mayor al inicio del tratamiento para la recurrencia de PSA (para los pacientes cuyo seguimiento PSA era lo suficientemente alto como para justificar el tratamiento). Este grupo de 2.131 hombres comprende la cohorte de base a partir del cual se seleccionaron los casos y los controles de PSA SYS.
Dentro de los 5 años de aumento del PSA, 213 hombres desarrollaron progresión sistémica (SYS casos), que se define como una gammagrafía ósea positiva o CT escanear. De éstos, 100 hombres sucumbieron a una muerte específica por cáncer de próstata, 37 murieron de otras causas y 76 permanecen en riesgo.
controles de PSA recurrencia (213) fueron seleccionados de entre aquellos hombres sin progresión sistémica dentro de los 5 años después de la elevación del PSA y fueron emparejados (1: 1) en el año de nacimiento, año calendario de elevación del PSA y la puntuación de Gleason patológica diagnóstico inicial (& lt; = 6, 7 +). Veinte de estos hombres desarrollaron progresión sistémica mayor que 5 años después del aumento inicial de PSA y 9 sucumbieron a una muerte específica por cáncer de próstata.
Un conjunto de 213 sin evidencia de enfermedad (NED) controles de progresión fueron también selecciona del Mayo Clinic Registro PVP de 9.989 hombres y se utiliza para algunas comparaciones. Estos controles tenían PRR entre 1987-1998, sin evidencia de aumento del PSA dentro de los 7 años de PVP. La mediana (25
ª, 75
percentil) el seguimiento de PVP fue de 11,3 (9,3, 13,8) años. Los controles de la NED fueron emparejados a los casos de progresión sistémica en el nacimiento años, el año calendario del PVP y diagnóstico inicial puntuación de Gleason. Computarizado adaptación óptima se llevó a cabo para minimizar la "distancia" total entre casos y controles en cuanto a la suma de la diferencia absoluta en los factores de apareamiento [24].
El presente estudio fue aprobado por el Consejo de Revisión Institucional Clínica Mayo.
bloque de identificación, aislamiento de ARN, y Análisis de Expresión
La lista de 639 casos y controles fue al azar. Se hizo un intento para identificar todos los bloques disponibles (incluyendo los ganglios linfáticos de apariencia normal y anormal) de la lista aleatoria de 639 casos y controles elegibles. El mantenimiento de la asignación al azar, cada bloque disponible se midió la concentración de tejido mediante revisión de la patología y el bloque que contiene el cáncer de Gleason patrón dominante fue seleccionado para el aislamiento de ARN.
Cuatro secciones 10μm recién cortadas de tejido FFPE fueron desparafinados y el Gleason dominante se macrodissected enfoque cáncer. ARN fue extraído utilizando el kit de ARN de alta parafina pura de Roche (Indianápolis, IN). El ARN se cuantificó usando un espectrofotómetro ND-1000 del NanoDrop Technologies (Wilmington, DE). Los ARN, incluyendo intra-e inter-placa de placa de réplicas, se distribuyeron en placas de 96 pocillos en el orden aleatorio para el análisis DASL.
RNA de muestras se procesan, se hibrida con Sentrix Universal 96-arrays, escaneados utilizando BeadArray Reader, y los datos procesados inicialmente en BeadStudio de acuerdo con las instrucciones del fabricante. microarrays de datos está disponible en la base de datos GEO (número de acceso http://www.ncbi.nlm.nih.gov/geo/GSE10645).
Para evaluar la exactitud de los niveles de expresión de genes definidos por la tecnología DASL , se realizó SYBR cuantitativa reacciones verde RT-PCR para el 9 de genes seleccionados "objetivo" (CDH1, MUC1, VEGF, IGFBP3, ERG, TPD52, YWHAZ, FAM13C1, y Page4) y 4 de uso común genes de control endógeno (GAPDH, B2M, ppia y Rpl13a) en placas de 384 pocillos, con el uso de instrumentos Prism 7900HT (Applied Biosystems, Foster City, CA). Se analizaron 210 muestras de ARN con abundante ARN del grupo del total de 639 pacientes. Debido a la escasez de ARN, sólo se analizaron 77 muestras de PAGE4. ARNm se transcribe inversa con superíndice III Primera Strand Síntesis SuperMix (Invitrogen, Carlsbad, CA) usando hexámeros aleatorios. Para cada uno de los nueve genes estudiados, se determinó el ciclo umbral (Ct) por triplicado y la expresión se normalizó con respecto al conjunto de cuatro genes de referencia.
Patología puntuación Opiniones sobre
El Gleason el Registro de la Clínica Mayo PVP se definió como la puntuación de Gleason inicial. Puesto que no ha habido cambios en la interpretación patológica de la puntuación de Gleason con el tiempo, un solo patólogo (CCM) revisó la puntuación de Gleason de cada uno de los bloques seleccionados para el análisis de la expresión. Esta variable clínica se definió como la puntuación de Gleason revisada.
Metodología estadística
Recolección de datos de expresión génica se intentó para los 623 pacientes como se describe en los resultados. De éstos, hubo 596 (n
SYS = 200, n
PSA = 201, n
NED = 195) pacientes en los que se recogieron los datos, el resto al no haber uno o ambos paneles de expresión como se describe en resultados. Para asegurar la selección de conjuntos de entrenamiento y validación similares, se seleccionaron 100 cohortes de casos y de control de control que constan de 133 pacientes elegidos al azar SYS (dos tercios de los 200 para la formación), junto con su PSA emparejado y controles define como un conjunto de entrenamiento propuesto. Los casos y los controles restantes fueron tratados como un conjunto de validación propuesto. Las variables clínicas fueron probados por la independencia entre los conjuntos de validación de la formación y la propuesta por separado dentro de los casos de SYS y los controles de PSA. factores clínicos discretos (estadio patológico, tratamiento hormonal adyuvante en RRP, el tratamiento adyuvante con radiación en RRP, el tratamiento hormonal adyuvante a la recurrencia de PSA, y la radioterapia adyuvante a la recurrencia de PSA) fueron probados mediante el análisis de Chi-cuadrado. Las variables continuas clínicos (puntuación de Gleason (revisada), edad en la primera recurrencia de PSA, el aumento de valor de PSA, en segundo lugar el aumento de valor de PSA, y la pendiente PSA) se sometieron a pruebas de suma de rangos de Wilcoxon. Seis de los cien conjuntos seleccionados al azar no logró mostrar la dependencia de cualquiera de las variables clínicas a nivel de 0,2, y el primero de ellos fue elegido como el conjunto de entrenamiento: 391 pacientes (n
SYS = 133, n
PSA = 133, n
NED = 125). Esta reservado 205 pacientes para el conjunto de validación (n
SYS = 67, n
PSA = 68, n
NED = 70).
Los datos en bruto de BeadStudio se normalizó el uso de loess cíclica (fastlo) [25].
Los datos de entrenamiento se analizaron utilizando los bosques aleatorios [26] utilizando R, versión 2.3.1 (http://www.r-project.org) y randomForest versión 4,5-16 ( http://stat-www.berkeley.edu/users/breiman/RandomForests). Los datos fueron analizados por el panel (cáncer, personalizada y fusionadas, cuando se fusionó los datos sobre el cáncer y personalizados tratados como una sola matriz). Al poner a prueba la
ntree
parámetro de la función randomForest 4000 se determinó que los bosques aleatorios fueron suficientes para generar una lista de marcadores estables. Los mejores marcadores como clasifican para la significación por el programa randomForest se combinaron con diversas combinaciones de variables clínicas utilizando programa de regresión logística R (GLM () con la familia = binario (un modelo logístico), donde GLM se refiere a modelo lineal generalizado). A continuación, la función de la puntuación resultante se analizó utilizando característica (ROC) métodos de funcionamiento del receptor y el punto de corte se eligió que supone una penalización igual de falsos positivos y falsos negativos. Una revisión de los modelos permite un subconjunto de los marcadores de ser identificado, y un subconjunto de datos de apoyo clínicos identificados. El número de características en el modelo fue determinada por la licencia de 1/3 a cabo Monte Carlo Validación Cruzada (MCCV) utilizando 100 iteraciones. Se seleccionó el número de características para maximizar la AUC y minimizar la variación aleatoria en el modelo. A continuación, el modelo final se aplica al conjunto de entrenamiento del paciente 391 y el conjunto de validación paciente reservado 205. A modo de comparación, otros modelos de expresión de genes se informó anteriormente también se ensayaron frente a los conjuntos de entrenamiento y validación [12] - [16].
Se han comparado los modelos previamente reportados para su clasificación de los pacientes en el control de la recurrencia de PSA conocido y grupos de casos progresión sys. Utilizamos V-estadística de la Cramér [27] para comparar modelos.
Resultados
Diseño del estudio /parafina Bloque de Recuperación /Aislamiento de ARN y Expresión Grupo Éxito
En pocas palabras, una anidada estudio de casos y controles se realizó utilizando la cohorte grande, bien definida de los hombres con un PSA en aumento después de PVP (Figura S1). SYS casos fueron 213 hombres que desarrollaron progresión sistémica entre 90 días y 5,0 años después de la elevación del PSA. controles de PSA eran una muestra aleatoria de 213 hombres que tenían 5 años después de la PRR con la recurrencia de PSA, pero sin evidencia de progresión clínica. NED controles eran una muestra aleatoria de 213 hombres que tenían 7 años de post-PVP sin elevación del PSA (la comparación de los controles de PSA con NED controles serán presentados en un documento posterior). fueron agrupados casos y controles de PSA SYS (1: 1) para el año de nacimiento, año de aumento del PSA, y la puntuación de Gleason patológico inicial (& lt; = 6 vs. & gt; = 7). La lista de casos y controles elegibles se randomizeed para la determinación ciega de bloques, el aislamiento de ARN y el rendimiento de los experimentos de expresión serie.
La Tabla 1 resume la distribución de los parámetros clínicos entre los casos SYS y el PSA y la NED grupos de control. No hubo diferencias significativas entre los grupos para las variables coincidentes (no había diferencia significativa en la puntuación de Gleason de diagnóstico inicial, cuando la & lt; = 6 y & gt; criterios fueron 7 grupos-el que coinciden en comparación). La comparación de la puntuación de Gleason de diagnóstico inicial de las puntuaciones de Gleason revisados reveló que las puntuaciones de Gleason han aumentado con el tiempo. Además, la proporción de Gleason de 8-10 tumores aumentó comparando NED controla a los controles de PSA, y PSA controla a los casos SYS. La puntuación de Gleason revisada se utiliza en todo el modelado de biomarcadores.
Se identificaron todos los bloques de parafina procedentes de hombres elegibles y cada bloque fue examinado por el tejido presente (regiones primarias y secundarias de cáncer Gleason, normal y ganglios linfáticos metastásicos, etc.). Nos macrodissected la región patrón de Gleason dominante y trató de aislar el ARN. Illumina cáncer Panel ™ y análisis de estructuras de paneles cáncer de próstata DASL personalizado, entonces se realizaron en todas las muestras de ARN. La sección de Métodos y cuadros S1 & amp; S2 describir la composición del Grupo Especial del Cáncer y el diseño del panel personalizado.
La Tabla 2 resume la disponibilidad de bloques final, la tasa de éxito de aislamiento de ARN y las tasas de éxito de la expresión analiza matriz. De los 639 pacientes elegibles, bloques estaban disponibles en 623 (97,5%). Se aisló el ARN y ensayos DASL realizarse con éxito en una alta proporción de pacientes /especímenes: ARN utilizable se preparó a partir todos los 623 bloques, y el Grupo de Cáncer y panel personalizado matrices DASL eran tanto éxito (después de repetir algunos especímenes véase más adelante) en 596 ARN especímenes (95,7% de los ARN; el 93,3% de los pacientes de diseño). Sólo 9 (1,4%) muestras de ARN fallaron los dos paneles. La razón principal de estos fracasos fue mala calidad del ARN-medido por QRT-PCR de la expresión génica Rpl13a [19]. De las 1246 muestras iniciales se ejecutan en ambos paneles, 87 (7,0%) especímenes fallidos. Esos especímenes para los que no había ARN residual se repitieron con una tasa de éxito del 77,2% (61 de 79 muestras).
Análisis de Expresión reproducibilidad
Replicar resultados de análisis (Figura S2), comparaciones de RT-PCR (Figura S3) y comparaciones de expresión genética inter e intra-panel se describen en los resultados S1.
resultados expresión génica específica que compara la progresión cohortes sistémicos con el PSA recurrencia y sin evidencia de progresión de las cohortes
los análisis univariantes por gen.
Debido a que el DASL ensayo apareció para generar resultados precisos y reproducibles, la matriz de datos fue examinado por los genes cuya expresión se vio alterada significativamente cuando los casos SYS se compararon con los controles de PSA . Para este análisis inicial, el valor de la expresión génica DASL se determinó que era el medio de intentos hasta a tres para cada gen en cada matriz. Tras el análisis univariado (de dos colas t-test) de los datos normalizados sonda promediada y fastlo [25], 68 genes fueron muy significativamente sobre o sub-expresados en los casos SYS frente a los controles de PSA (p & lt; 9,73 × 10
-7, corrección de Bonferroni para p & lt; 0,001) (Tabla 3). Ciento veintiséis genes fueron significativamente sobre o sub-expresados en los casos SYS en comparación con los controles de PSA (P & lt; 4,86 × 10
-5, corrección de Bonferroni para p & lt; 0,05). Tabla S3 ofrece la lista completa de genes ordenados por valor p. La figura 1 ilustra nueve genes con expresión significativamente diferente en los casos y los controles de PSA SYS.
P-valores se muestran (t-test) para la comparación de casos /control de PSA SYS. También se incluyen los controles sin evidencia de recurrencia de la enfermedad (NED).
sistémica progresión Predicción modelo de desarrollo y pruebas en un conjunto de entrenamiento.
Un modelo estadístico para predecir sistémico progresión (con y sin variables clínicas) usando un conjunto de entrenamiento fue desarrollado utilizando los bosques aleatorios [21] y de regresión logística como se describe en Métodos. Los datos de entrenamiento se analizaron por panel (cáncer, la costumbre y fusionada), por el gen (la expresión promedio para todas las sondas de genes específicos), y por las sondas individuales. La Tabla 4 enumera los 15 genes y 2 sondas individuales seleccionados para el modelo final.
Tabla 5 y la Figura 2A resumir las áreas bajo la curva (AUC) para tres modelos clínicos, la final de 17 genes /sonda los modelos de sonda clínicos combinados de modelo y. Las variables en los modelos clínicos (Tabla 6) se basan en la información clínica disponible. Un modelo clínico incluyó revisó puntuación de Gleason y el estadio patológico (información disponible inmediatamente después de la PRR). La adición de PSA de diagnóstico y la edad de la cirugía no incrementa significativamente el AUC y se quedó fuera de este modelo (datos no mostrados). modelo clínico B añadió edad a la cirugía, el valor del PSA preoperatorio, y cualquier adyuvante o terapia hormonal dentro de los 90 días después de PVP (PVP información disponible después pero antes de recurrencia de PSA). modelo clínico C añadió edad a la recurrencia de PSA, el segundo nivel de PSA en el momento de la recurrencia de PSA, y la pendiente de PSA (información disponible en el momento de la recidiva del PSA).
A. El conjunto de entrenamiento AUC para los tres modelos clínicos, la /el modelo de sonda 17 gen final y el modelo /sonda /17 gen clínico combinado. B. La validación del conjunto de las AUC durante tres modelos clínicos, la /el modelo de sonda 17 gen final y el modelo /sonda /17 gen clínico combinado. C. El conjunto de entrenamiento AUC de 4 informes anteriores modelos de expresión génica de la agresividad del cáncer de próstata en comparación con el modelo clínico por sí solo C y con el modelo /sonda de 17 genes. D. La validación del conjunto de las AUC de 4 informes anteriores modelos de expresión génica de la agresividad del cáncer de próstata en comparación con el modelo clínico por sí solo C y con el modelo /sonda de 17 genes. Para una explicación de los modelos clínicos véase la Tabla 6. (E y F) Una comparación de las AUC de formación y validación establecidos para cada uno de los modelos. E. AUC de la cada uno de los modelos de genes /sonda por sí solos. F. AUC de cada uno de los modelos de genes /sonda con la inclusión del modelo clínico C.
Uso del conjunto de entrenamiento, modelos clínica A, B y C solo tenían AUC de 0,74 (IC 95% 0,68-0,80), 0,76 (IC del 95%: 0,70-0,82) y 0,78 (IC del 95% desde 0,73 hasta 0,84), respectivamente. El modelo /sonda de 17 genes por sí solo tenía una AUC de 0,85 (IC del 95% 0,81 hasta 0,90). Cuando se combina con el modelo /sonda de 17 genes, los modelos clínicos A, B, y C tenía AUC de 0,86 (IC del 95% 0,81 hasta 0,90), (IC del 95%: 0,83-0,91) 0,87 y 0,88 (IC del 95% 0,84 a 0,92) , respectivamente. También hemos probado un modelo de 19 genes que añadió TOP2A y survivina (BIRC5) para the17 modelo de genes /sonda. La adición de estos dos genes no mejoró la predicción de la progresión sistémica en el conjunto de entrenamiento (datos no mostrados)
Los arreglos fueron seleccionados para incluir conjuntos de sondas para varios modelos de agresividad de próstata publicados anteriormente [12] -. [ ,,,0],dieciséis]. La Tabla 5 resume los resultados de la expresión de las AUC matriz para estos modelos de biomarcadores. La Figura 2C ilustra las AUC para cuatro de estos modelos con la comparación apropiada con modelo clínico C y con el modelo /sonda de 17 genes. Cada uno de estos modelos generados AUC que eran más pequeños que el modelo que hemos desarrollado. Sin embargo, varios de los modelos AUC generada (por ejemplo, la Lapointe et al. 2004 recurrencia, Yu et al. 2004, y Singh et al. Modelos 2002) que estaban dentro o cerca de la 95% límites de confianza de las estimaciones del conjunto de entrenamiento AUC.
prueba de modelos en el conjunto de validación.
a continuación, aplicar el modelo de 17 genes /sonda y los otros modelos publicados anteriormente reservada al conjunto de validación 205 pacientes (Figuras 2B y 2D). Figura 2E compara el conjunto de entrenamiento y validación establecer AUC de cada uno de los modelos de genes /sonda. Con la excepción de la Glinsky et al. 2004 Firma 1, todos los modelos de genes /sonda tenía AUC significativamente menores en el grupo de validación en comparación con el conjunto de entrenamiento. Figura 2F compara el entrenamiento y validación del conjunto de las AUC de cada uno de los modelos de genes /sonda que incluye modelo clínico C. Mientras que el /modelo de sonda de 17 genes y tres de los modelos publicados anteriormente (la LaPointe et al., 2004 recurrencia, Yu et al., 2004 y Glinski et al. 2005 modelos) superó al modelo clínico por sí solo, las AUC fueron significativamente inferiores en el conjunto de validación en comparación con el conjunto de entrenamiento.
también compararon los modelos para su clasificación de los pacientes en el PSA conocida grupos de control de recurrencia y progresión de casos SYS. Tabla S4 resume V-estadística de la Cramér [27] de los diferentes modelos, e incluye un predictor perfecto modelo ( "verdad") para la evaluación directa de los modelos. En pocas palabras, V-estadística de la Cramér varió de 0,38 a la 0,70. V-estadística de los más bajos de Cramér fue entre el verdadero estado (predicción perfecta) y la Glinski et al. modelo 2005 con datos clínicos. valor V el más alto de Cramér fue entre nuestro modelo de 17 genes /sonda y Singh et al. 2002 modelo, tanto con los datos clínicos. La mayoría de los modelos clasifican los mismos pacientes en los grupos conocidos (por ejemplo, la clasificación de un paciente en el grupo de control PSA como una recurrencia de PSA y un paciente en el grupo de casos SYS como una progresión sistémica). También tendían a clasificar incorrectamente los mismos pacientes (por ejemplo la clasificación de un paciente en el grupo de control de PSA como una progresión sistémica y viceversa). El modelo /sonda de 17 genes clasificó correctamente 5-15 pacientes más en su categoría conocida (controles de PSA o casos SYS) en comparación con los otros modelos (datos no mostrados).
Los análisis secundarios
exploratorio estudios de supervivencia.
Como se ha señalado anteriormente, el /modelo de sonda de 17 genes y los modelos de informes anteriores se clasificó cada algunos de los casos en la categoría SYS buen resultado (por ejemplo, para ser recurrencias PSA, no progressors sistémicos) y algunos de los controles de PSA en la categoría de resultado deficiente (por ejemplo, para ir a la progresión sistémica). Teníamos curiosidad por saber si estos aparentemente falsas clasificaciones tenían ninguna relevancia clínica o biológica
.
Diecisiete hombres en el grupo de control (PSA que tenían tanto en la matriz de datos y el modelo C clínica) pasó a tener la progresión sistémica más allá de 5 años en el momento del último seguimiento. De estos 17 pacientes, 9 fueron predice que tienen un mal resultado por el modelo /sonda de 17 genes. De los 179 pacientes que no tenían ninguna progresión sistémica, 38 fueron clasificados en la categoría de mal resultado por el modelo (valor de p = 0,0066, prueba exacta de Fisher). La figura 3A ilustra la supervivencia libre de progresión sistémica de los grupos buenos y malos resultados en los controles de PSA. controles de PSA con un tumor clasificado como país con un mal resultado habían aumentado significativamente el riesgo de desarrollar la progresión sistémica más allá de 5 años (log rank p-valor = 0,00050) (HR = 4,7 IC 95%: 1.8 a 12.1).
a) Sistémico supervivencia libre de progresión para los pacientes clasificados en la categoría de mal resultado y para los de la categoría de resultado bueno en el control de grupo PSA-17 modelo de genes /sonda. la supervivencia global específica del cáncer B) de próstata para los pacientes clasificados en la categoría de mal resultado y para los de la categoría de resultado bueno en el caso SYS grupo 17-gen modelo /sonda.