Extracto
Antecedentes
firmas transcripcional robustos en el cáncer pueden ser identificados por los metadatos similitud impulsada análisis de perfiles de expresión génica. Un imparcial de integración de datos y la estrategia de interrogación no ha estado disponible anteriormente.
métodos y las conclusiones
Hemos puesto en marcha y se realizó un meta-análisis de perfiles de expresión génica del cáncer de mama a partir de 223 conjuntos de datos que contiene 10.581 materna humana muestras de cáncer utilizando un enfoque basado en los datos de similitud novela (EXALT iterativo). firmas de expresión génica del cáncer extraídos de conjuntos de datos individuales se agruparon por similitud de datos y consolidan en un meta-firma con un recurrente y patrón de expresión génica concordantes. Se realizó un análisis de supervivencia retrospectivo para evaluar la capacidad de predicción de un nuevo meta-deducida a partir de la firma de perfiles de estudios de la transcripción de cáncer de mama humano. cohortes de validación que constan de 6.011 pacientes con cáncer de mama a partir de 21 diferentes conjuntos de datos de cáncer de mama y 1.110 pacientes con otros tumores malignos (cáncer de próstata y de pulmón) se utilizaron para probar la solidez de nuestros resultados. Durante el análisis EXALT iterativo, 633 firmas fueron agrupados por su similitud de datos y formaron 121 grupos de firmas. De las 121 agrupaciones de firma, hemos identificado una firma meta único (BRmet50), basado en un grupo de 11 firmas que comparten un fenotipo relacionado con el cáncer de mama altamente agresivo. En pacientes con cáncer de mama, hubo una asociación significativa entre BRmet50 y evolución de la enfermedad, y el poder pronóstico de BRmet50 era independiente de covariables clínicas y patológicas comunes. Por otra parte, el valor pronóstico de BRmet50 no era específico para el cáncer de mama, ya que también predice la supervivencia en el cáncer de próstata y pulmón.
Conclusiones
Hemos establecido e implementado un meta similitud impulsada novela de datos -análisis estrategia. Con este enfoque, hemos identificado un meta-transcripcional firma (BRmet50) en el cáncer de mama, y el rendimiento pronóstico de BRmet50 era robusto y aplicable en una amplia gama de poblaciones de pacientes con cáncer-
Visto:. Qiu Q, Lu P, Xiang Y, Shyr Y, Chen X, Lehmann BD, et al. (2013) Estrategia basada en la similitud de datos para un metanálisis de los perfiles de transcripción en Cáncer. PLoS ONE 8 (1): e54979. doi: 10.1371 /journal.pone.0054979
Editor: C. Aedin Culhane, Escuela de Salud Pública de Harvard, Estados Unidos de América
Recibido: 29 de mayo de 2012; Aceptado 22 de diciembre de 2012; Publicado: 29 Enero 2013
Derechos de Autor © 2013 Qiu et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado en parte por un premio Howard Temin del Instituto Nacional del cáncer, de los Institutos nacionales de Salud (CA114033 a YY), la Sociedad Americana del cáncer-Institucional de Becas de Investigación (# GRI-58-009-51 a YY) y la clínica Vanderbilt Premios y traslacional Ciencia (CTSA) UL1 RR024975 del Centro Nacional de Recursos de investigación (CNRR), una parte de los Institutos nacionales de Salud (NIH), (CRC1838 a YY). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
el cáncer de mama es el tipo más común de cáncer en mujeres y la segunda causa principal de muerte por cáncer entre las mujeres en los Estados Unidos. Un biomarcador molecular que puede predecir la probabilidad de progresión del cáncer a la enfermedad invasiva o metastásica puede guiar la agresividad con los pacientes son tratados inicialmente [1]. Existe una clara necesidad de una mejor comprensión de cómo los perfiles moleculares se refieren a fenotipos de cáncer y los resultados clínicos y para los nuevos biomarcadores de cáncer con un rendimiento definibles y reproducibles en diversas poblaciones de pacientes.
La introducción de la escala del genoma de perfiles de expresión génica ha llevado a la identificación de biomarcadores de la transcripción específicas conocidas como firmas de expresión génica. El descubrimiento de la expresión génica firmas de cualquier estudio solo pozo con motor es relativamente sencillo. Algunas firmas tienen utilidad como biomarcadores de la transcripción para la clasificación de pacientes con diferentes significativamente los resultados de supervivencia en cáncer de mama [2], [3]. Por ejemplo, el perfil transcripcional de cáncer de mama primario ha sido utilizado anteriormente para identificar una firma de 70 genes (comercializado como MammaPrint pero designado aquí como BRsig70) [3], una clara firma 76-gen (BRsig76) [2], y otros ( Oncotype DX [4], [5], TAMR13 [6], Genius [7], GGI [8], PAM50 [9] y PIK3CAGS278 [10]). Típico de otros biomarcadores de la transcripción, tanto BRsig70 y BRsig76 se obtuvieron a partir de un conjunto de formación de un único estudio y luego validado con una prueba de conjunto de las mismas cohortes de pacientes retrospectivos. Al ser sometido a la validación externa, la mayoría de las firmas sólo podían ser validados utilizando un conjunto de datos (NKI295) [11] o unos pocos conjuntos de datos más pequeños con muestras de forma retrospectiva acumulados. Este método de validación tiene limitaciones inevitables de la potencia estadística o el sesgo de selección de la muestra. Como resultado, una debilidad común de este enfoque es su falta de consistencia y reproducibilidad [12] - [16].
Con cientos de genes del cáncer de mama expresión de datos depositados en bases de datos públicas, ahora tenemos la capacidad de utilizar estos datos para su pleno potencial y descubrir la expresión génica firmas recurrentes y fiables para predecir el pronóstico del cáncer de mama. Sin embargo, la identificación de un patrón de expresión a través de pronóstico meta-análisis de perfiles de expresión génica del cáncer a disposición del público representa una oportunidad poco explotado. Hay varios informes de los marcos de meta-análisis que utilizan múltiples conjuntos de datos de cáncer de mama para construir y validar los clasificadores de pronóstico [7], [17], [18]. Estos enfoques se centran en la selección de los predictores de conjuntos de entrenamiento combinados, ya sea utilizando el promedio de Cox-resultados [18] o teniendo en cuenta los subtipos moleculares de la muestra [7], [17]. Sin embargo, una pregunta sin respuesta es cómo identificar los estudios de expresión génica homogéneos utilizando un método de selección refinada e imparcial [19]. Con el fin de extrapolar firmas pronósticos validados para una población de pacientes más amplia, se necesitan nuevos métodos bioestadísticos utilizando un análisis basado en la similitud de datos [20].
Para evitar los puntos débiles de las firmas individuales derivados de estudio y para generar una nueva estrategia para utilizar mejor los datos de expresión de genes disponibles de estudios independientes, hemos desarrollado una estrategia de meta-análisis llamado EXALT (Herramienta de análisis de expresión) [21], [22]. La característica esencial de EXALT es una base de datos que contiene miles de expresión génica firmas extraídas de los estudios publicados que permite comparaciones de firma. En este estudio, hemos utilizado EXALT de forma iterativa (EXALT iterativo) para llevar a cabo un meta-análisis impulsado por la similitud de datos y dilucidar las firmas transcripcional con valor pronóstico mejorado en cáncer de mama. Hemos demostrado que las firmas heterogéneas a partir de 223 conjuntos de datos públicos que contienen las muestras de cáncer de mama 10.581 podrían organizarse sistemáticamente por sus elementos comunes de información (es decir, similitudes intrínsecas y fenotipos de la enfermedad) y montados en un nuevo tipo de datos de la firma llamado un meta-firma. Se identificaron un meta-firma específica que consta de 50 genes (BRmet50) que es robusta predictivo de pronóstico del cáncer en 6.011 pacientes con cáncer de mama a partir de 21 diferentes conjuntos de datos de cáncer de mama, así como en otros tumores malignos, incluyendo de pulmón y cáncer de próstata. Estos resultados ilustran el valor de BRmet50 en el pronóstico del cáncer de mama independiente de las variables de tratamiento e indican que EXALT iterativo es un método novedoso metanálisis capaz de realizar el descubrimiento informativo y robusta de meta-firmas en el cáncer.
Extracción de cáncer humano Firmas
Para organizar los datos complejo transcripcional, hemos establecido una estructura de datos jerárquica. El nivel superior se compone de los estudios de la transcripción, y cada estudio transcripcional se dividió en tres niveles: los conjuntos de datos, grupos y muestras. Un estudio puede incluir uno o muchos conjuntos de datos en función de su diseño experimental [21]. De 56 estudios de cáncer de mama (Tabla S1), hemos recogido 223 conjuntos de datos de cáncer de mama que representan 10.581 muestras de cáncer de mama. Las muestras primarias de cáncer de mama dentro de cada conjunto de datos se agruparon por sus atributos clínicos. Cada conjunto de datos incluye al menos dos grupos de muestras tumorales con diversos fenotipos clínicos (Figura 1 panel superior). Por ejemplo, los fenotipos relacionados con la recaída del cáncer o de mal pronóstico incluyen el tamaño del tumor, la afectación ganglionar, grado de invasión linfovascular, estado de p53, la mutación BRCA1, BRCA2, receptor de estrógeno (ER), y receptor 2 del factor de estado de crecimiento epidérmico humano (HER2) [23], [24]. Se necesitan dos o más grupos por conjunto de datos para generar comparaciones estadísticas. Un total de 633 listas de genes significativa ( "firmas simples") de todas las posibles comparaciones de grupos por parejas en consecuencia se generaron utilizando la prueba t de Student [21]. Todas las 633 firmas "simples" se almacenaron en una base de firmas de cáncer humano (HuCaSigDB) que es accesible en línea (http://seq.mc.vanderbilt.edu/exalt/) [22]. Los principales pasos del procedimiento para la extracción de firmas están previstas en los métodos S1.
El flujo de trabajo del método iterativo EXALT incluye tres procesos principales. (1) Extracción de 633 firmas de cáncer de mama. Todos los grupos de muestras relacionadas dentro de cada uno de los conjuntos de datos de cáncer de mama (n = 223) se compararon sobre la base de todas las posibles covariables clínicas y patológicas tales como el tamaño del tumor, la afectación ganglionar, grado, estado de marcador, la invasión linfovascular, la recaída, la metástasis, la condición de p53, BRCA1 y BRCA2 mutaciones. a continuación, se realizó la prueba t de Student para todas las comparaciones por pares, y un total de 633 firmas de cáncer de mama se generaron y se carga en una base de datos (HuCaSigDB). (2) grupos de firma y clasificación. búsqueda iterativa se llevó a cabo utilizando cada una de 633 firmas como firma una consulta (anclado o semilla) contra HuCaSigDB varias veces para identificar las firmas homólogas con una similitud significativa de datos definido por EXALT. 121 de 633 firmas de consulta conocer al menos una firma similar en HuCaSigDB y formaron 121 grupos, mientras que los restantes 512 (singletons) fallaron para generar clusters. Dos resultados típicos se representan mediante una descripción esquemática marcado con firmas anclados: el singleton Sig21 y la Sig24 clúster entre ellos 11 miembros de la firma como Sig544, Sig128, Sig140, etc. El análisis basado en el conocimiento de los fenotipos de firma y tamaños se realizó entre 121 grupos de firmas. Ocho grupos tenían fenotipos de metástasis evidentes. De los ocho grupos, se seleccionó el grupo más grande anclado por la firma de consulta (sig24) para su posterior análisis. (3) Identificación de meta-BRmet50 firma. Todos los 6.526 genes de la firma de las 11 firmas del clúster Sig24 estaban reunidos para formar una firma sintética (BrMet). Los genes dentro de BrMet se clasifican en base a la frecuencia recurrente y la concordancia de la expresión diferencial representado por un mapa meta-calor. Las 50 mejores genes (BRmet50) representados en filas se determinaron mediante un perfil de expresión génica y la frecuencia recurrente 100% de concordancia entre las 11 firmas representadas en las columnas. Los colores en el mapa meta-calor representan la dirección de la expresión diferencial de genes dentro de un determinado perfil transcripcional (rojo para arriba, verde para abajo, y negro para un partido que falta). La intensidad del color refleja los niveles de confianza de la expresión diferencial.
Una firma la expresión génica ( "firma simple") tal como se define por EXALT es un conjunto de genes importantes con sus puntuaciones de estadística y de los códigos de dirección expresión de gen correspondiente ( arriba o abajo). Algunas firmas "simples" son biológicamente relacionados con el pronóstico del cáncer de mama, sino que se derivan de los estudios individuales de transcripción de perfiles y son muy a menudo de poca potencia, truncada, o de baja calidad. Existen limitaciones inherentes para cualquier estudio de perfiles individual, incluida pequeño tamaño de la muestra en relación con el gran número de posibles predictores, limitaciones de plataformas tecnológicas, la variación de la muestra, y la bioinformática o sesgo del método estadístico. Una de las hipótesis que hicimos en la formulación de este enfoque es que cualquier estudio individual perfil transcripcional no decodifica toda una firma la expresión. Más bien, estas "firmas simples" representan sólo fragmentos de un perfil transcripcional completa y común (meta-firma).
Identificación de una novela de mama Cáncer de Meta-firma
La hipótesis de que un meta- firma con una mejor capacidad de predicción podría ser descubierto por los datos de similitud impulsada meta-análisis de los perfiles de transcripción de varios estudios relacionados. EXALT análisis sirvió de base para la agrupación o clustering "firmas simples" que comparten una similitud significativa de datos. El proceso iterativo EXALT reunieron firmas homólogas de "firmas simples" y los textos en un meta-firmas (Figura 1 medias y panel inferior). En pocas palabras, cada firma cáncer de mama se comparó con todas las firmas de cáncer de mama en HuCaSigDB, y los pares de la firma con una importante similitud se agruparon. La relación intrínseca entre firmas por pares se determinó por primera vez por partido gen símbolo y concordancia en la dirección del cambio de la expresión génica. A continuación, una puntuación total identidad normalizada se calculó sobre la base de valores de Q de las dos firmas. El nivel de similitud significativa se determinó mediante análisis de simulación [21] como se explica en los métodos S1.
Se realizaron análisis de EXALT iterativo en el que todos-contra-todos la búsqueda de similitud de firma se llevaron a cabo. Más específicamente, cada uno de los 633 "firmas simples" de HuCaSigDB sirvió como una semilla (también llamada de consulta o firma anclada) para consultar todas las "firmas simples" en HuCaSigDB repetidamente y para llevar otras firmas homólogas entre sí por sus elementos comunes (es decir, intrínseca similitudes). Este proceso iterativo "agrupados" o "cluster" firmas en base a sus similitudes (Figura 1 panel central). pares de firmas que fueron lo suficientemente similares (p & lt; 0,05) fueron unidos entre sí para formar agrupaciones. Después de comparaciones iterativos, cada firma semillas, bien mantenido como un producto único (es decir, una firma de semillas que la auto-emparejado pero no se ha encontrado ningún otro firmas) o se forma un grupo con otras firmas.
Este proceso iterativo comenzando con EXALT 633 firmas de semillas resultaron en 121 grupos de firmas y 512 embarazos únicos (Figura 1 panel central). Nos centramos en ocho grupos específicos debido a las ocho firmas de semillas y todas las demás firmas agrupadas en cada uno de los ocho estaban claramente relacionados con la metástasis del cáncer. Los 113 restantes grupos no tenían fenotipos de metástasis del cáncer consistentes y evidentes. A los ocho grupos relacionados con la metástasis, cada una contenía varios miembros de la firma superpuestos asociados con fenotipos que se conocen factores de riesgo para la metástasis del cáncer tales como tumores de alto grado, la condición de ER-negativo, tipo de célula basal, y la recaída del cáncer. De éstos, se seleccionó el grupo más grande de la firma que contiene 11 firmas relacionadas con metástasis (Figura 1 y Tabla 1) [2], [3], [6], [8], [11], [25] - [29]. Debido a que cada firma en el grupo se deriva de una comparación entre los cánceres de mama más agresivos y menos agresivos, esta comparación se obtuvo un "mal pronóstico" firma genética (Tabla 1).
Cada una de las 11 firmas comprende varios cientos de genes. Con el fin de identificar un patrón de expresión génica recurrente y concordantes en el grupo de firma metastásico, todos los genes que formaban las 11 firmas (n = 6.526) fueron ensamblados en una firma sintética designada como BrMet. Los genes dentro de BrMet se clasifican en base a la frecuencia recurrente y la dirección de la expresión diferencial (meta-sentido) entre los 11 firmas. Se aplicó una frecuencia recurrente 100% para seleccionar las 50 mejores genes para el meta-firma (BRmet50) (Figura 1 panel inferior). Por lo tanto, los perfiles BRmet50 son concordantes entre los 11 firmas simples en clúster (Tabla 1). BRmet50 genes representan significativamente los genes expresados diferencialmente no sólo dentro de sus propias bases de datos, sino también a través de otros 11 conjuntos de datos relacionados (Figura 1).
Anotación de los genes BRmet50 se proporciona en la Tabla S3. Sólo cinco genes en BRmet50 superponen con BRsig70, y dos fueron encontrados en común con BRsig76. El número de genes superpuestos entre BRmet50 y las otras seis firmas con cáncer (Oncotype DX, TAMR13, Genius, GGI, PAM50, y PIK3CAGS278) es relativamente bajo (1% -27%), lo que sugiere que BRmet50 es una firma distinta. Debido BRmet50 se dedujo a partir de un grupo de firmas que comparan los cánceres de mama más agresivos y menos agresivos, predijimos que BRmet50 estaría asociado con un mal pronóstico en el cáncer de mama, como la recaída del cáncer, metástasis, y la muerte. La función de pronóstico general de BRmet50 podría ser diferente de las de BRsig70 /76 (BRmet70 y BRmet76) ya que fueron diseñados específicamente para predecir metástasis a distancia en pacientes con cáncer de mama en estadio temprano, estado de los ganglios linfáticos negativos [2], [3]. Por lo tanto, nos dimos cuenta de que ni BRsig70 ni BRsig76 era totalmente comparable a BRmet50. Por el contrario, sirvieron como control de firmas de pronóstico en este estudio.
Meta-validación de BRmet50 en Cáncer de Mama
Desde el BRmet50 se dedujo a partir de un grupo de comparación de firma cada vez menos agresivas de cáncer, retrospectivamente examinado la capacidad de BRmet50 para predecir el pronóstico en 21 conjuntos de datos, incluyendo 11 conjuntos de datos de validación independientes que no se utilizan en el proceso de firma de agrupamiento (Tabla 2).
para examinar la estabilidad del método iterativo EXALT y evitar exceso de montaje de los nueve conjuntos de datos de entrenamiento, se utilizó una estrategia de "dejar uno fuera" validación cruzada para deducir nueve firmas de control BRmet50 de las correspondientes nueve conjuntos de datos de entrenamiento. En cada ensayo dejar uno fuera, las firmas que se mantuvieron en clúster. Además, todas las firmas de control de BRmet50 el procedimiento de 'leave-one-out "compartieron el conjunto básico de los 50 genes. A continuación, prueba de control de estos meta-firmas en la formación de datos (Tabla S2) correspondiente y se encontró que sus actuaciones pronósticos eran tan buenos como BRmet50 (Tabla 2). Los datos sugieren que el proceso iterativo basado en la agrupación EXALT es un método fiable y estable que no esté afectado por cualquier miembro de la firma en particular en el grupo de BrMet.
Los 11 conjuntos de datos independientes de validación se utilizaron para evaluar el rendimiento pronóstico BRmet50. Se llevaron a cabo pruebas de log-rank para evaluar las diferencias en el análisis de supervivencia. Los valores de p de log-rank pruebas que comparan BRmet50, BRsig70, BRsig76, y las otras seis firmas de cáncer publicados (Oncotype DX, TAMR13, Genius, GGI, PAM50 y PIK3CAGS278) se resumen (Tabla 2 y Tabla 3). Cada firma se evaluó por su capacidad para clasificar a los sujetos con cáncer de mama en 'buenos' y 'malos' grupos de pronóstico. Expresión valores para cada firma fueron recuperados de cada conjunto de datos correspondiente, a continuación, la agrupación jerárquica sin supervisión se realizó mediante la correlación de Spearman, y asignaciones de los grupos se determinaron en cada conjunto de datos basado en la primera bifurcación de los dendrogramas de agrupación [30]. BRmet50 distingue entre los buenos y malos grupos de pronóstico con éxito en todos los conjuntos de datos (Tabla 2), mientras que BRsig70 y BRsig76 no podían discriminar grupos de pronóstico en cuatro y seis conjuntos de datos, respectivamente. El fracaso de BRsig70 y BRsig76 para estratificar los grupos de pronóstico en aquellos conjuntos de datos persistió muestras usando los algoritmos originales (por ejemplo, después de que re-clasificado, ya sea el método de correlación de Pearson [3] o el método de puntuación de la recaída en base a valores de los coeficientes de regresión ponderada de Cox [2] ). Por lo tanto, estos resultados fueron independientes de métodos estadísticos. Resultados similares se obtuvieron también entre las otras seis firmas de cáncer bien establecidos porque ninguno de ellos podía discriminar grupos de pronóstico en todos los conjuntos de datos de prueba 11 (Tabla 3). Como otra medida de rendimiento, se calculó el índice C para las firmas de cáncer en 11 la validación de datos (Tabla 3), que es una generalización de la zona bajo las que operan (ROC) curva característica [31]. Se comparó el valor pronóstico (índice C) para BRmet50 y las otras firmas de cáncer. Para cualquier conjunto de datos de prueba dado, BRmet50 c-índice es similar a los de las otras firmas de cáncer, lo que sugiere que la BRmet50 y otras firmas de cáncer proporcionan información pronóstica comparables.
Evaluación del Rendimiento en BR1042
de Kaplan-Meier para ilustrar diferentes supervivencia libre de recaída en BR1042 entre los tres tipos de firmas incluyendo BRmet50, una firma de control BRmet50, y dos firmas previamente identificados (BRsig70 y BRsig76) (Figura 2). Los resultados demuestran una diferencia significativa en la supervivencia libre de recaída entre los grupos de buen y mal pronóstico como se predijo para el conjunto de datos BR1042 por BRmet50, así como la firma BRmet50 de control (BrMet [-1042]) del proceso de la licencia-un-out (
p Hotel & lt; 0,05). Entre los pacientes para quienes BRmet50 predijo un buen pronóstico, la tasa a 10 años de la supervivencia libre de recaída fue del 79% frente a sólo el 47% entre los que tienen un mal pronóstico (Figura 2, panel superior izquierdo). El riesgo de recaída predicho por BRmet50 fue significativamente mayor entre los pacientes en el grupo de mal pronóstico que entre aquellos en el grupo de buen pronóstico. Sin embargo, para el mismo conjunto de datos, ni tampoco BRsig70 BRsig76 distinguir una diferencia significativa en la supervivencia libre de metástasis entre los buenos y malos subgrupos pronósticos.
Los datos de 108 tumores de la BR1042 conjunto de datos fueron estratificados en dos grupos por BRsig70 y BRsig76 (paneles inferiores), la firma de control (BrMet [-1042]) de la licencia-un-out método o BRmet50 (paneles superiores) los perfiles de expresión génica. En cada parcela de supervivencia, se compararon dos tipos de supervivencia libre de recaída: un grupo de mal pronóstico (negro línea discontinua) y un grupo de buen pronóstico (línea continua roja). El tiempo libre de recaídas en día se muestra en el eje x, y el eje y muestra la probabilidad de supervivencia libre de recaída. El p
-
valores indican la significación estadística de las diferencias de tiempo de supervivencia entre los dos grupos
El rendimiento de BRmet50 (c-index:. 0.6573, p
-
valor
:
0,002) era mejor que los de BRsig70 y BRsig76 (índice C: 0,5839 o 0,5172, respectivamente, valor p & gt; 0,14) cuando se examina el conjunto de datos BR1042. Nuestros resultados indican que el poder predictivo de BRmet50 es robusto y aplicable en una amplia gama de conjuntos de datos independientes.
Para evaluar si la asociación BRmet50 con el resultado pronóstico era específica, se generaron 1.000 firmas de tamaño idéntico (50 genes) usando seleccionados al azar genes del genoma humano. Todas las firmas al azar se ensayaron en el mismo panel de 21 conjuntos de datos de prueba. Después de 1000 permutaciones aleatorias de los genes de las firmas, se generó la distribución de p-valor (log p-valor) de cada conjunto de datos de prueba y los valores de p de BRmet50 y las otras seis firmas de cáncer publicados también se representa en el eje X las gráficas de distribución (figuras S2 y S3)
a pesar de que algunas firmas aleatorias son significativamente (
p Hotel & lt; 0,05). asociado con los resultados del cáncer de mama en varios conjuntos de datos, las asociaciones son más fuertes que los siete firmas de cáncer de mama en más de la mitad de los conjuntos de datos de prueba. Estos resultados proporcionan apoyo estadístico de control de validez de su relevancia pronóstico. Por otra parte, nos dimos cuenta de que la mayoría de los valores de p de BRmet50 estaban en el lado extremo derecho de la p aleatoria
- distribuciones de valores
(Figuras S2 y S3). Por último, comparamos la asociación de la evolución del paciente BRmet50 a los de 1.000 firmas aleatorias de tamaño idéntico (Figura S2 y S3), y se confirmó que BRmet50 mostró una asociación más fuerte que la gran mayoría de (& gt; 95%) firmas aleatorias. Por lo tanto, la probabilidad de obtener los mismos valores de p como BRmet50 por casualidad en los mismos conjuntos de datos de prueba en la Tabla 2 es significativamente más baja (
p Hotel & lt; 0,05).
Poder predictivo de BRmet50 Es Común independiente de clínicas y patológicas covariables
Debido a que el conjunto de datos BR1141 [6] incluye 269 pacientes con cáncer de mama y un panel completo de covariables clínicas y patológicas comunes, hemos probado si la asociación de BRmet50 con un mal resultado pronóstico era independiente de criterios clínicos y patológicos establecidos utilizando el conjunto de datos robusta BR1141 examinado por los modelos de riesgos proporcionales de Cox (Tabla 4 y la Tabla S4). La asociación entre BRmet50 y el riesgo de mala evolución clínica fue significativa, independientemente del tamaño del tumor, los ganglios linfáticos, o el tratamiento con tamoxifeno (
p Hotel & lt; 0,05). Por otra parte, el BRmet50 podría segregar los tumores con diferenciación intermedia o ER-positivo en buen y mal pronóstico subcategorías (razón de riesgo de un mal pronóstico: 2,5;
p
≤0.001) pero no para los que estaban ER-negativo. Ni BRsig70 ni BRsig76 fue capaz de estratificar los tumores, ya sea buena o mala diferenciación en cualquier subconjunto de BR1141 excepto subconjunto tratamiento con tamoxifeno (Tabla 4). Debido BR1141 fue uno de los conjuntos de datos de entrenamiento, también a prueba una firma 'leave-one-out "de control BRmet50, y encontraron asociaciones significativas idénticas (Tabla S4). La asociación entre BRmet50 y el resultado de recaída en el subgrupo de pacientes sin BR1141 tratamiento con tamoxifeno se describe adicionalmente en los métodos S1.
Cinco de los 21 conjuntos de datos utilizados para evaluar el desempeño BRmet50 (BR1042, BR1095, BR1128, BR1141, GSE7390) representado 1.183 tumores y tenía datos sobre un conjunto común de características clínico-patológicas, incluyendo el tamaño del tumor, grado, estado de los ganglios linfáticos, y el índice pronóstico de Nottingham (NPI) [32], [33]. Se realizaron análisis univariados y multivariados de estos cinco conjuntos de validación para evaluar mejor el rendimiento de BRmet50 en comparación con otros factores pronósticos, a saber, BRsig70, BRsig76, la edad, el tamaño del tumor, grado, estado de los ganglios linfáticos y el NPI. Se determinaron los (Tabla 5 y la Tabla S6) sin ajustar los coeficientes de riesgo (Tabla S5) y ajustados de estos factores y de las firmas.
univariante de Cox análisis de riesgos proporcionales demostró que BRsig70, BRsig76, o cualquier individuo común factor pronóstico (el tamaño del tumor, grado, estado de los ganglios linfáticos, o NPI) no podía predecir con éxito el pronóstico de cáncer en los cinco conjuntos de datos. Sin embargo, BRmet50 era el único capaz de diferenciar significativamente muestras tumorales en dos grupos de pronóstico en los cinco conjuntos de validación. El valor pronóstico de BRmet50 era mayor que cada uno de los factores de riesgo establecidos (Tabla S5). Por ejemplo, las óptimas proporciones de riesgo sin ajustar (HR) (alto riesgo versus bajo riesgo) en BR1128 eran de 2,8 (IC del 95%: 01.05 a 04.09; p & lt; 0,001) (control BRmet50), 1,9 (IC 95%: 1.1 a 3.3; p = 0,01) (BRmet70), 2,0 (95% CI: 1.1 a 3.5; p = 0,02) (BRmet76), y 2,2 (95% CI: 1.6 a 2.9; p & lt; 0,01) (NPI), respectivamente. Los datos sugieren que la BRmet50 fue más eficiente en la predicción de la supervivencia libre de recaída en BR1042, BR1141 y GSE7390 y la supervivencia libre de enfermedad en BR1095 y BR1128 que los factores de pronóstico establecidos.
Se utilizó el análisis multivariante de Cox de riesgos proporcionales para determinar si BRmet50, BRsig70, o BRsig76 añade información pronóstica independiente a otras características clínico estándar. En este análisis multivariante de Cox de riesgos proporcionales (Tabla 5), asociaciones significativas (
p Hotel & lt; 0,05) se observaron en todas las cinco bases de datos de prueba entre BRmet50 y el tiempo libre de enfermedad o libre de recaída del paciente después del ajuste por norma covariables clínicos. Por lo tanto, BRmet50 aportó información pronóstica nueva e importante más allá de la proporcionada por los predictores clínicos establecidos. En su mayor parte, BRsig70 y BRsig76 mostraron asociaciones significativas en estos análisis.
Poder predictivo de BRmet50 en otros tipos de cáncer
Debido a BRmet50 predijo con éxito el pronóstico del cáncer de mama y porque algunos eventos moleculares son oncogénicos conservada entre múltiples tipos de cáncer [34], la hipótesis de que BRmet50 puede representar un perfil transcripcional conservado de mal pronóstico en varios tipos de cáncer.
para examinar la especificidad pronóstica de BRmet50, se investigó si BRmet50 podía predecir el pronóstico en otra cánceres epiteliales como el de colon, pulmón o cáncer de próstata. Tres conjuntos de datos, uno para cada tipo de cáncer: cáncer de colon (n = 73) [35], el cáncer de pulmón (n = 441) [36], y los pacientes con cáncer de próstata (n = 596) (Tabla 6) [37] fueron sometidos a análisis univariados y multivariados. Sobre la base de la expresión génica firmas (BRsig70, BRsig76, o BRmet50), 1.110 muestras de pacientes fueron separados en dos grupos (Tabla 6). Las tres firmas no para predecir la recaída del cáncer en el cáncer de colon [35] (p & gt; 0,05). Sin embargo, BRmet50 pero tampoco BRsig70 ni BRsig76 predicho con éxito la supervivencia específica de la enfermedad en el cáncer de próstata y la supervivencia libre de recaída en el cáncer de pulmón (
p Hotel & lt; 0,01), lo que sugiere que los perfiles de transcripción de mal pronóstico puede ser más conservada en de mama, de pulmón y cáncer de próstata. En el conjunto de datos de cáncer de pulmón, los buenos grupos de pronóstico predichos por BRmet50 tuvieron la mayor supervivencia libre de recaída (& gt; 40% y
p Hotel & lt; 0,01) entre los 3 firmas. También se determinó si la asociación entre las tres firmas y los resultados clínicos en pacientes con cáncer de próstata, de pulmón, de colon y el cáncer era independiente de los criterios clínicos y patológicos establecidos (Tabla 6). Los resultados sugieren que BRmet50 podría servir como un biomarcador pronóstico tanto para el cáncer de mama y no materna y puede representar un perfil transcripcional conservado entre múltiples tipos de cáncer.
Discusión
Los datos generados por de alto rendimiento transcripcional estudios de cáncer ha acumulado rápidamente y cada vez hay más interés en traducir esta información en valor clínico. Aunque el análisis de un solo estudio puede ser de carácter informativo, a menudo se ve afectada por las limitaciones inherentes. Estas limitaciones pueden ser superadas mediante la combinación de estudios independientes relacionados en un meta-análisis. Nuestro estudio demostró que las firmas heterogéneas de los estudios individuales de cáncer pueden ser organizados sistemáticamente en un meta-firma (BRmet50) en base a sus similitudes intrínsecas de datos mediante una estrategia novedosa meta-análisis (EXALT iterativo). Este enfoque meta-análisis puede aumentar la potencia estadística, minimizar los falsos descubrimiento, reducir los efectos de lote, y mejorar la generalización de los resultados.