Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Yin Yang de genes ratio de expresión para firma pronóstico del cáncer de pulmón

PLOS ONE: Yin Yang de genes ratio de expresión para firma pronóstico del cáncer de pulmón


Extracto

Muchos estudios han establecido las firmas de pronóstico basadas en la expresión de genes para el cáncer de pulmón. Todas estas firmas se construyeron a partir de conjuntos de datos de entrenamiento por el aprendizaje de la correlación de la expresión de genes con el tiempo de supervivencia de los pacientes. Ellos requieren que todos los nuevos datos de ejemplo para ajustarse al tipo de datos de entrenamiento, lo que se traduce en problemas comunes de baja reproducibilidad y la falta de sentido práctico. Para superar estos problemas, se propone un nuevo modelo de la firma que no implica la formación de datos. Nuestra hipótesis es que el desequilibrio de los dos efectos opuestos en las células del cáncer de pulmón, representados por los genes Yin y Yang, determina el pronóstico de un paciente. Hemos seleccionado los genes Yin y Yang mediante la comparación de los datos de expresión a partir de muestras de tejido de pulmón y cáncer de pulmón normales utilizando tanto la agrupación sin supervisión y las vías de análisis. Se calculó la expresión génica Yin y Yang media razón (YMR) como las puntuaciones de riesgo del paciente. Se identificaron treinta y un Yin y treinta y dos genes Yang y seleccionados para el desarrollo de la firma. En los tejidos pulmonares normales, el YMR es inferior a 1,0; en los casos de cáncer de pulmón, el YMR es mayor que 1,0. El YMR se puso a prueba la predicción del pronóstico del cáncer de pulmón en cuatro conjuntos de datos independientes y de TI de manera significativa los pacientes estratificados en grupos de alto y bajo riesgo de supervivencia (p = 0,02, HR = 2,72; p = 0,01, HR = 2,70; p = 0,007, HR = 2,73; p = 0,005, HR = 2,63). También puso de manifiesto la predicción de los resultados de la quimioterapia para la fase II & amp; III. En el análisis multivariante, el factor de riesgo YMR tuvo más éxito en la predicción de los resultados clínicos de otros factores clínicos de uso común, con la excepción de la etapa del tumor. El YMR se puede medir en un paciente individual en la clínica independiente de la plataforma de la expresión génica. Este estudio proporciona una nueva comprensión de la biología del cáncer de pulmón y arrojar luz sobre la aplicabilidad clínica

Visto:. Xu W, S Banerji, Davie JR, Kassie M, D Yee, Kratzke R (2013) de Yin Yang Expresión génica Relación Firma de pronóstico del cáncer de pulmón. PLoS ONE 8 (7): e68742. doi: 10.1371 /journal.pone.0068742

Editor: Tono de Frost Bathen, La Universidad Noruega de Ciencia y Tecnología (NTNU), Noruega

Recibido: Enero 15, 2013; Aceptado: June 3, 2013; Publicado: 17 Julio 2013

Derechos de Autor © 2013 Xu et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Los autores no tienen el apoyo o la financiación para reportar

Conflicto de intereses:.. los autores han declarado que no existen intereses en competencia

Introducción

el cáncer de pulmón es la principal causa de cáncer relacionados muertes en América del Norte. Si bien ha habido una disminución de las muertes por cáncer de pulmón entre los hombres debido a una reducción en el consumo de tabaco en los últimos 50 años, que todavía representa el 29% de todas las muertes por cáncer en varones en 2010 [1]. La tasa de supervivencia global a los 5 años para el cáncer de pulmón es tan bajo como 16% y no ha mejorado significativamente en los últimos 30 años [1]. cáncer de pulmón de células no pequeñas (NSCLC) es el cáncer de pulmón diagnosticado con mayor frecuencia que representa el 85% de los casos anuales. Acerca de 25% a 30% de los pacientes de NSCLC se presentan con enfermedad en estadio temprano I y reciben intervención quirúrgica. Sin embargo, más de 20% de estos pacientes recaen dentro de los cinco años [2]. La terapia adyuvante ha mejorado la supervivencia de un subgrupo de pacientes con enfermedad en estadio II y III. Sin embargo, no se sabe qué pacientes tienen más probabilidades de recaída y se beneficiarían más de terapias adicionales.

Para mejorar los resultados clínicos, los investigadores han invertido mucho esfuerzo en la identificación de biomarcadores de cáncer de pulmón que permiten a los médicos realizar un diagnóstico precoz , predecir curso de la enfermedad, y el efecto del tratamiento. De todo el genoma de perfiles de expresión usando técnicas de microarrays ha identificado posibles firmas de genes para clasificar a los pacientes en diferentes cohortes de los resultados de supervivencia [3] - [17]. modelos previamente reportados fueron construidos por el aprendizaje de los coeficientes de correlación entre la expresión génica y el tiempo de supervivencia de los pacientes a partir de conjuntos de datos de entrenamiento y requieren que los conjuntos de datos nueva prueba se normalizaron a los datos de entrenamiento. En consecuencia, estas firmas tienen una baja reproducibilidad y no son prácticas en un entorno clínico. Hay poca evidencia de que cualquiera de los genes reportados firmas de expresión están listos para su aplicación clínica [18].

Para hacer frente a estos problemas, hemos desarrollado un modelo empírico que no se basa en el conocimiento del tiempo de supervivencia de los pacientes de la determinación de la firma biomarcador de cáncer de pulmón. La regulación génica es un proceso complejo y multidimensional que incluye un espectro de genes que se activan o se suprime o bien, y cuya expresión es continua o temporal. Nuestra hipótesis es que el pronóstico está determinado por dos grupos opuestos de genes que llamamos Yin y Yang. En las células de cáncer de pulmón, la expresión del gen normal se dysregulated resulta en la proliferación celular y la disminución de la diferenciación. El poder de la teoría de Yin Yang es que simplifica los aspectos multidimensionales complejos de la expresión génica en dos dimensiones opuestas - Yin y Yang, y donde el equilibrio entre el Yin y el Yang asegura un buen estado de salud para las células. estudios publicados anteriormente se han referido a las funciones opuestas de los supresores de tumores conocidos y oncoproteínas como yin y el yang en la tumorigénesis [19] - [21]. Nuestra hipótesis es que en lugar de un gen individual, dos grupos funcionalmente desequilibradas de genes (Yin y Yang) en las células de cáncer de pulmón determinar el destino de las células tumorales, lo que en última instancia determina el tiempo de supervivencia del paciente. La identificación precisa de los genes Yin y Yang en el desarrollo del tumor se puede utilizar para desarrollar un pronóstico firma.

Materiales y Métodos

Cáncer de pulmón de datos de muestras de pacientes

Nos hemos centrado nuestro estudio en el adenocarcinoma, ya que es un cáncer de pulmón más común y la expresión génica de datos con la información clínica asociada es más fácil de conseguir. Los datos de la muestra de Bhattacharjee
et al
. se ha descrito anteriormente [22]. Se compone de 203 muestras de pacientes con cáncer de pulmón incluyendo 139 adenocarcinomas, 20 carcinoides pulmonares, 21 carcinomas de células escamosas, 6 tipos de cáncer de pulmón de células pequeñas, y 17 muestras normales de tejido pulmonar de las secciones adyacentes. Entre los 139 adenocarcinomas, 125 muestras de pacientes se asociaron con la información clínica de seguimiento del tiempo de supervivencia y la recurrencia. Los datos de la muestra de Bild
et al
. contiene 58 adenocarcinomas primarios recogidos a través de la Duke pronóstico del cáncer de pulmón de laboratorio [23]. Estas muestras se asociaron con 1-6 años de los pacientes el seguimiento. Desafío Consorcio del Director Nacional Cancer Institute (DCC) para la clasificación molecular de las muestras de adenocarcinoma de pulmón se compone de 442 adenocarcinomas con la información clínica de los pacientes [13]. Estas muestras se recogieron y procesaron en 4 instituciones independientes: Canadá /Dana-Farber Cancer Institute (CAN /DF), Centro de Cáncer de Michigan (UM), HL Moffitt Cancer Center (HLM), y el Memorial Sloan-Kettering Cancer Center (MSK ). Etapas I, se recogieron II y III adenocarcinomas, con aproximadamente el 60% de las muestras de los tumores en estadio I. Ninguno de los pacientes recibió quimioterapia preoperatoria o la radiación y al menos 2 años de seguimiento de la información estaba disponible. 288 de adenocarcinoma de pulmón (LUAD) muestras de El Proyecto del Genoma del Cáncer Atlas (TCGA) tienen información clínica completa. Se excluyen del conjunto de datos eran 20 pacientes cuyo tiempo de supervivencia no está disponible y 9 pacientes que viven con el tiempo de seguimiento de menos de 2 días.

Expresión Génica Datos

Se detectó la expresión de los genes de las muestras Bhattacharjee por Affymetrix GeneChip HU_U95Av2. Los archivos de datos de intensidad de hibridación primas (CEL) fueron descargados de http://www.broadinstitute.org/mpr/lung/. Los índices de expresión génica fueron procesadas con el algoritmo MAS5.0 utilizando el módulo expresionista Refinador (Genedata, Inc, San Francisco, CA, EE.UU.). Ninguna otra normalización se realiza dentro de cada conjunto de datos con el fin de mantener la independencia de la muestra individual en la detección de genes de biomarcadores. Salvo en los análisis de agrupamiento para las identificaciones de genes expresados ​​diferencialmente, la robusta gama Multi-media (RMA) derivada y las mediciones de expresión normalizados fueron calculados a partir de los archivos CEL primas. La expresión de genes de las muestras Bild fue detectado por Affymetrix GeneChip HU_U133plus2 y la intensidad de señal se calcula algoritmo MAS5.0. El conjunto de datos ha sido descargado de base de datos NCBI GEO (GSE3141). Los archivos CEL HG_U133A prima DCC fueron descargados de la base de datos del NCI caArray (https://array.nci.nih.gov/caarray/project/details.action?project.id=182) [13]. MAS5.0 algoritmo se utilizó para el resumen de la expresión génica. No normalización o prefiltrado se aplicó a muestras o genes. Los datos 259 de RNA-seq fueron descargados de TCGA Portal de Datos (http://tcga-data.nci.nih.gov/tcga/tcgaDownload.jsp). El RKPM la expresión génica (lecturas por kilobase por millón asignada lee) el valor fue extraído de los archivos de ejemplo.

Los genes firma de identificación y selección

Los índices de expresión fueron resumidos por el algoritmo de RMA y más normalizado por itemwise Z-normalización utilizando el módulo analista Genedata (Genedata, Inc, San Francisco, CA, EE.UU.). jerárquica agrupación 2-D la distancia euclídea L2 con el ajuste de vinculación completa para ambos genes y las muestras se realizó para explorar los genes biomarcadores expresados ​​diferencialmente en los tumores de pulmón. genes regulados y regulados negativamente en los tejidos de cáncer fueron seleccionados de la agrupación 2D. Los genes que se expresan más alta en los tejidos pulmonares normales que en células de cáncer de pulmón fueron llamados "Yang" genes candidatos, por el contrario genes expresados ​​mayor en las células de cáncer de pulmón que los tejidos pulmonares normales fueron llamados "Yin" genes candidatos. Estas dos listas de genes se introducen en IPA9.0 (Ingenuity® Systems, www.ingenuity.com) para la red de interacción y análisis de la vía. Las redes están formadas por interacciones directas. Se seleccionaron las redes con importantes resultados para su posterior análisis.

Gene Clasificador Firma Desarrollo

Los valores de expresión de los genes seleccionados de Yin y Yang genes fueron extraídos de los datos de microarrays de expresión publicados. Inicialmente, el Yin (Y) y Yang (y) aritmética expresión significan ratio (YMR) se calculó como un clasificador de firma para cada muestra (YMR =). Desde 31 genes Yin y Yang 32 genes fueron identificados como sonda fija de HG-U95A GeneChip, hemos utilizado estos conjuntos de sonda para extraer los valores de la expresión génica Yin y Yang de muestras Bhattacharjeès. Para extraer los genes Yin y Yang de diferentes plataformas, hemos utilizado estos 63 conjuntos de sonda y /o sus símbolos de genes para que coincida con la sonda fija de otras plataformas. Primero miramos a los mejores conjuntos de la sonda partido que comparten una alta identidad de secuencia y representan los mismos genes. Los mejores archivos del conjunto de sonda partido se pueden descargar de Affymetrix (http://www.affymetrix.com). Si los mejores conjuntos de la sonda partido no se pueden encontrar en una plataforma en particular, hemos utilizado los símbolos de genes Yin y Yang. Un gen símbolo de Yin Yang o puede contener un único conjunto de sondas (partido único) o varios conjuntos de sonda. Para varios ID dentro del mismo símbolo de genes, se utilizó un valor medio. En HG-133plus2 del conjunto de datos Bild, 62 genes se han calculado los valores promedio de expresión de múltiples conjuntos de sonda ya que sólo una mejor sonda conjunto combinado de HG-U95A 39651_at (gen RECQL4). En la plataforma HG-133A del conjunto de datos DCC, 22 Yin genes de expresión se deriva de 22 mejores conjuntos de sonda emparejados, 3 genes coinciden con los conjuntos de sonda individuales y 6 genes de expresión fue un promedio de expresión de múltiples conjuntos de sonda; la expresión de 29 genes Yang 'era de la sonda fija mejor emparejados, y 2 genes de múltiples conjuntos de sonda. La puntuación de riesgo del paciente fue derivada de los valores YMR. El uso de un corte valores YMR, se dividió a los pacientes en grupos de alto y bajo riesgo pronósticos. Desde una diferencia de 2 veces se elige a menudo como un valor arbitrario en una comparación de dos grupos, definimos un 2 veces Yin Yang sobre como punto de corte y luego ajustamos basado en muestra normal significa YMR o muestra de cáncer significa YMR. Si la muestra de YMR pulmonar normal es significativamente menor que 1.0 (por ejemplo, los datos TCGA RNAseq), el punto de corte YMR será ajustada para ser menor que 2,0. Si muestra normal significa YMR no está disponible para un conjunto de datos en particular (por ejemplo, DCC y Bild conjuntos de datos), se ajustó un valor de corte que está cerca de la YMR media de los datos sobre el cáncer de pulmón establecidos ya que muchos estudios se utiliza la puntuación de riesgo media estratificar a los pacientes. El valor de la expresión de un gen puede medirse a partir de un único conjunto de sondas en una sola plataforma, pero sonda múltiple pone en otra plataforma. Esta diferencia en la medición de la expresión podría dar lugar a diferentes valores de corte YMR en diferentes plataformas. Esperamos el mismo valor de corte YMR de la misma plataforma. Cabe señalar que estas grandes plataformas de expresión escala fueron diseñados originalmente para fines de investigación, no para uso clínico. Los valores de corte YMR arbitrarios determinados a partir de estas diferentes plataformas sólo se utilizan para la validación de la firma YMR. En el futuro, vamos a optimizar un único valor de corte para YMR resultados desde una plataforma clínicamente relevante, como qPCR.

También comparó la YMR aritmética con una media geométrica de Yin y de Yang Ratio (gYMR). Para probar el tamaño óptimo de genes, se observó el efecto de dejar caer los genes de la 31 Yin y Yang 32 lista de genes en la asociación con el resultado clínico. También se evaluó la importancia de la firma YMR comparando YMR a razón de grupos recogidos al azar de tamaño de los grupos idénticos.

Análisis estadístico

Para evaluar el desempeño de la firma YMR, que utiliza cada YMR como dicotómica o covariable continua en un modelo de riesgos proporcionales de Cox, con 5-6 años de supervivencia global o como variable de resultado [13] sin recidiva, [24] - [26]. La razón de riesgo estimado, 95% intervalo de confianza y valor de p nos permitió comparar directamente las actuaciones de YMR covarianza con otras variables clínicas. De Kaplan-Meier métodos producto-límite y log-rank test fueron utilizados para estimar y diferencias de prueba en la probabilidad de supervivencia entre los grupos de pacientes de bajo y alto riesgo. La función de supervivencia se trazó para cada subgrupo. Todos los análisis estadísticos se realizaron utilizando el software Partek®, versión 6.3 (Partek Inc., St. Louis, MO, EE.UU.) o el paquete estadístico R Survcomp [27].

Validación

Con el fin de validar que el YMR es inferior a 1,0 en los tejidos pulmonares normales y mayor que 1,0 en muestras de tejido de cáncer de pulmón, que mide la YMR en nuevos conjuntos de datos independientes. Estos conjuntos de datos fueron procesados ​​por diferentes plataformas, incluyendo Affymetrix GeneChip HG-U95, HG-133A, HG-133plus2, Illumina BeadChip, y la matriz de dos canales. Los YMRS se calcularon a partir de estos conjuntos de datos, ya sea con o sin la normalización de datos basado en las fuentes de datos originales

Para validar la firma YMR para el pronóstico del cáncer de pulmón, se utilizaron cuatro conjuntos de datos independientes:. 125 Bhattacharjee adenocarcinomas conjunto de datos de muestra HG_U95Av2 de la plataforma de los cuales no se utilizó el tiempo de supervivencia en el modelo de construcción, Bild 58 adenocarcinomas de datos de ejemplo de plataforma de HG-133Plus2, 442 archivos de muestra de DCC plataforma HG-133A, y 259 muestras de TCGA plataforma de RNA-seq. Estas son muestras de pacientes bien definidos con la información clínica. Para los análisis en este estudio, la supervivencia o los resultados sin recidiva fueron comparados de acuerdo con alto riesgo YMR (es decir YMR es mayor que 2,0 o un punto de corte ajustado) y de bajo riesgo YMR (YMR es menor que o igual a 2,0 o un punto de corte ajustado ) pacientes. La estratificación puntuación YMR en las mismas etapas y en respuesta al tratamiento fue probado en los siguientes grupos de los pacientes, respectivamente DCC: la fase I; etapa II & amp; III; recibido quimioterapia; sin quimioterapia; la quimioterapia en la fase I; la quimioterapia en la fase II & amp; III; sin quimioterapia en la fase I; sin quimioterapia en la fase II & amp; III.

Resultados

Identificación de genes candidatos de biomarcadores del cáncer de pulmón

Se compararon muestras pulmonares normales con las muestras de cáncer de pulmón recogidas de pacientes en estadios tumorales mixtos con diferentes tiempos de supervivencia a identificar y seleccionar los grupos de genes para el desarrollo de la firma. Utilizando el análisis de agrupamiento no supervisado de datos de microarrays de Bhattacharjee
et al
. [22], se analizó la expresión diferencial de genes en 17 muestras normales de tejido pulmonar y 83 muestras de una variedad de tipos de cáncer de pulmón. En la agrupación 2D, se seleccionó una región en la que los genes regulados a la baja en las muestras normales, pero regulados por incremento en casi todos los tipos de cánceres de pulmón (Figura S1A). La región en la que los genes se upregulated en uno o unos pocos tipos de cáncer no se ha seleccionado. Se identificaron 74 conjuntos de sonda en esta región (Figura S1 B, el cuadro S1). También se identificó una región donde los genes se upregulated en las muestras normales, pero regulados a la baja en casi todos los tipos de cánceres de pulmón (Figura S2A). La región en la que los genes se downregulated en uno o unos pocos tipos de cáncer no se ha seleccionado. Se identificaron 108 conjuntos de sonda en esta región (Figura S2 B, el cuadro S2, Figura 1A).

A. La agrupación de la identificación de genes. Los conjuntos de sonda están en filas y las muestras están en columnas. Los índices de expresión de todos los 12.625 conjuntos de sondas de las 100 muestras fueron resumidos por el algoritmo de RMA y más normalizado por itemwise Z-normalización. 74 genes regulados positivamente (filas inferior y medio) y 108 (filas superiores y medio) los genes en tejidos de cáncer de abajo regulados fueron seleccionados de las regiones de agrupamiento 2D. Los preseleccionados 74 y 108 probsets fueron exhibidos por la agrupación de nuevo. B. Yin (parte inferior) y Yang (arriba) Selección de genes mediante el análisis funcional. Los dos círculos representan los dos núcleos de efectos funcionales del Yin y el Yang. Los genes resaltados por el mismo color están en la misma red de interacción.

Mediante la comparación de la expresión génica entre los diversos tipos de células de cáncer de pulmón a las células pulmonares normales, genes comunes Yin y Yang entre los diferentes tipos de cáncer podría ser identificado. la agrupación de genes, en lugar de prueba del grupo estadística, no sólo detecta los patrones de expresión, pero también indica cierta medida de las interacciones de genes dentro del mismo patrón. A diferencia de la expresión génica diferencial resultante de pruebas estadísticas de dos grupos, los patrones de expresión de genes resultantes de la agrupación tiene una mayor tolerancia a las variaciones debidas a la recogida de muestras y procesamiento de datos. los genes individuales pueden no presentes en la lista diferencial de genes debido a las grandes variaciones encontradas en algunas muestras, pero los mismos genes pueden mostrar un patrón de expresión en general similar en el análisis de conglomerados
.
Yin Yang genes mostraron poca superposición con la anteriormente cáncer de pulmón informado la firma genes de pronóstico. Sin embargo, muchos genes Yin aquí presentados fueron encontrados en estudios previos que se relacionan con el cáncer de pulmón u otro desarrollo del cáncer del tipo de tejido como GRIN2D [28], GAST [29], AMH [30], TCF3 [31], EXOSC2 [32], GRM1 [33], CDT1 [34], RECQL4 [35], CSTF2 [36], FCGR2B [37], RNASEH2A [38], CDC6 [39], CACYBP [40], BIRC5 [41], CDC25 [42], las ANR [43], EN2 [44], y MIF [45]. A pesar de los
n-ras
proto-oncogén se encuentra en la lista de genes Yin, no hemos encontrado otros oncogenes que están implicados en la tumorigénesis de pulmón. Esto puede ser debido a la alteración de diferentes oncogenes en diferentes subconjuntos de los cánceres de pulmón. Sin embargo, se especula que los genes de progresión puede jugar un papel más importante que los genes implicados en la etapa de iniciación o promoción de la tumorigénesis de pulmón para determinar el pronóstico del cáncer de pulmón.

Camino y red de interacción de los análisis de estos 74 genes permitió seleccionar dos principales redes que están relacionadas con la morfología del tumor (Tabla S3, la red de puntuación significativa de 42) y la replicación del ADN (Tabla S4, la red de puntuación significativa de 30). Estas redes participan en los mecanismos moleculares de la vía canónica del Cáncer (Figura 1B, la figura S3). Estas redes contienen 31 genes cuyos nombres gen símbolo igualado los identificadores de conjunto de la sonda Affymetrix U95 AV2. Hemos seleccionado estos 31 genes como genes candidatos Yin (Tabla 1). Los 108 genes regulados negativamente constituyeron dos redes principales relacionados con el mantenimiento (Red puntuación significativa de 63) y el desarrollo celular (puntuación de la red significativa de procesos 23). La vía de RAR activación y la ruta de activación de células hepáticas estrelladas (Figura S4) invocada por genes Yang ejercen una amplia variedad de efectos sobre la homeostasis del tejido, la proliferación celular, diferenciación y apoptosis. Hay pruebas de que el tejido pulmonar alberga hepáticos células estrelladas-como que son de vitamina A de almacenamiento de células de pulmón [46] - [47]. Se recuperaron los genes de enfoque de las redes que participan proceso de desarrollo celular que resulta en dos grupos de genes de mantenimiento celular y. Se combinaron estos dos grupos (Tabla S5, S6), resultando en 32 genes únicos en total. Definimos estos 32 genes como genes candidatos para el desarrollo de la firma Yang (Tabla 2).

Gene Firma del cáncer de pulmón

Para construir el modelo de la firma, que computa la YMR a las puntuaciones de riesgo del paciente. El YMR representa un simple efecto de la combinación o interacción de los genes de Yin y Yang genes. La relación indica el estado de equilibrio Yin y Yang en la que las células pulmonares o grupo de genes es más activos que otros y el alcance de esta diferencia. En las células pulmonares normales, el Yang es mayor que Yin. fenotipos de cáncer tienen mayores puntuaciones YMR a continuación están asociados con la enfermedad de mayor riesgo. Primer lugar, validado nuestra hipótesis de que YMR es inferior a 1,0 en los tejidos pulmonares normales y mayor que 1,0 en tejidos de cáncer de pulmón. Utilizamos varios conjuntos de datos de muestra independientes con diferentes plataformas y diferentes preprocesa (Tabla S7). YMRS eran de menos de 1,0 en todos los conjuntos de datos normales de pulmón [48] - [52] (Figura 2). También medimos la YMRS de 12 tipos de tejidos humanos normales diferentes en un conjunto de datos [52] (Tabla S8). Los YMRS eran de menos de 1,0 en pulmón normal, así como en otros tejidos normales, tales como el corazón, el bazo, músculo esquelético, y de próstata, pero mayor que 1,0 en otros tejidos tales como el hígado. Este resultado sugiere que los perfiles de expresión génica Yin y Yang son el tipo de tejido específico. En las 83 muestras de varios tipos de cáncer de pulmón a partir de los que se identificaron genes Yin y Yang a través de análisis de expresión génica diferencial, todas las muestras tenían un YMR mayor que 1,0. Los YMRS mayor que 1.0 en otros conjuntos de datos de ejemplo cáncer de pulmón independientes también se muestran en la Figura 2.

se utilizaron genes Microarray conjuntos de datos de expresión de diferentes informes con diferentes plataformas. Los conjuntos de datos se describen como en la Tabla S7.

predice YMR Firma resultados de supervivencia

Se evaluó la YMR para el pronóstico de los cuatro conjuntos de datos en los que se disponía de la información clínica del paciente. Primer lugar, validado el modelo YMR para el resultado del riesgo del conjunto de datos Bhattacharjee [22] a partir del cual se construye el modelo. Dado que no se utilizó el tiempo de supervivencia de los pacientes o información de tiempo libre de recurrencia en el modelado, este conjunto de datos, por lo tanto sirve como un conjunto de datos independientes. Primero probamos el YMR como una variable continua utilizando el modelo de riesgo proporcional y demostró que el aumento de YMR se asocia con resultados más pobres dentro de los 6 años de tasa libre de recurrencia (p = 0,044, HR = 1,96) (Tabla S9). A continuación, examinó la YMR como una variable dicotómica para estratificar a los pacientes como los grupos de alto y bajo riesgo. Dado que las muestras de pulmón normal desde el mismo conjunto de datos muestra una YMR media de 0,91 y los 125 adenocarcinomas tener un YMR media de 2,23, se definió un punto de corte de 2,0 YMR. Se agruparon los adenocarcinomas 125 pacientes en alto riesgo (YMR & gt; 2,0, n = 65) y (YMR y lt; = 2.0, n = 60) grupos de bajo riesgo. Como se ve en la figura 3A, el YMR estratificada de manera significativa la alta recurrencia y grupos de bajo riesgo de recurrencia (p = 0,013, HR = 2,7). Estudios previos han informado de un p-valor significativo para sus genes de firmas. Esto es de esperar que dichas firmas fueron desarrollados por el tiempo de supervivencia de los pacientes y, a continuación volver a utilizar para predecir el tiempo de supervivencia. Como se demuestra posteriormente, el problema con estos enfoques es su baja reproducibilidad para los nuevos conjuntos de datos independientes. Por el contrario, el enfoque YMR no está capacitado para un conjunto de datos específico y se supone que trabajar para cualquier conjunto de datos. Elegimos al azar 500 pares de grupos de tamaños de los grupos idénticos de genes Yin y Yang de 12.625 genes de la plataforma HU-95av2 y utilizamos la misma relación de corte como el YMR & gt; 2,0. Los valores de p 500 tienen una media valor de p de 0,75 (SD = 0,32) (Figura S5). Se encontró que cuatro valores de p de estas pruebas aleatorias son muy bajos (0, 0, 0, 1E-18, respectivamente), sin embargo sus CRI son 1,0 o cerca de 1,0 por lo tanto, estos grupos no puede estratificar los grupos de riesgo.

A. curva de libre recurrencia función de tiempo (bajo riesgo n = 60; alto riesgo n = 65) de los pacientes adenocarcinomas de Bhattacharjee
et al
. B. curva En general el tiempo de supervivencia de los pacientes función adenocarcinomas (bajo riesgo n = 27; alto riesgo n = 31) de Bild
et al
. C. muestras de pacientes (n = bajo riesgo 248 de alto riesgo; n = 194) del proyecto DCC. D. muestras de RNA-seq (bajo riesgo n = 121; alto riesgo n = 137) de TCGA. Las puntuaciones bajas YMR (en verde) se corresponden con la más alta probabilidad de supervivencia prevista y altas puntuaciones YMR (en rojo) se corresponden con el mayor riesgo previsto.

A continuación, evaluaron la YMR para un gran conjunto de datos independientes DCC . Estos conjuntos de datos se recogieron y procesaron a partir de cuatro instituciones diferentes. Contenían datos patológicos y la información clínica que describen la gravedad de la enfermedad en el momento de la cirugía y el curso clínico de la enfermedad después del muestreo [13]. Se agruparon estos 442 pacientes por YMR en alto riesgo (YMR & gt; 1,8, n = 194) y bajo riesgo (YMR & lt; = 1,8, n = 248) de los sujetos desde la media YMR es de 1.85. Como se ve en la figura 3C y en la Tabla S9, los resultados de supervivencia de estos dos grupos fueron significativamente diferentes (p = 0,005, HR = 2,63). Del mismo modo, se utilizó YMR punto de corte de 1,4 para los datos Bild establecidos ya que el YMR media de los 58 adenocarcinomas es de 1.6. El YMR estratificada de manera significativa (p = 0,019, HR = 2,72) estos datos independientes establecidos en alto (YMR & gt; 1,4, n = 31) y bajas (YMR & lt; = 1,4, n = 27) grupos de riesgo (Figura 3B). Se calculó el cociente YMR utilizando datos de RNA-seq de 259 muestras TCGA. Las puntuaciones continuas YMR asocian con la tasa de supervivencia significativamente (p-valor de 0,007, HR 1,87) (Tabla S9). La firma dicotómica YMR estratificada de manera significativa el alto (n = 137) y de bajo riesgo (n = 121) grupos (p = 0,007, HR = 2,73) (Figura 3D y Tabla S9).

Se calculó el media geométrica de la relación de la expresión génica Yin y Yang (gYMR) y se prueba su asociación con el mal resultado tanto como una variable continua y una variable dicotómica. Como se ve en la Tabla S10, el gYMR continua no funciona para los datos Bhattacharjee y datos Bild, y la dicotómica gYMR no funciona para los datos Bhattacharjee tampoco. El YMR aritmética es robusto en cuatro conjuntos de datos. El YMR continua no mostró su asociación con el resultado clínico en el conjunto de datos de la plataforma Bild HG-133plus2 (p = 0,49). Esto es debido al tamaño pequeño de datos es sensible a los valores atípicos o excepciones paciente. Después quitamos GSM70223 paciente cuya YMR es de 6.35, el valor p de la continua YMR se redujo a 0,08. Después de que el paciente GSM70159 más alejado cuya YMR es 2,87, pero sobrevivió durante 73 meses, el p-valor se redujo a un nivel significativo de 0,0199. No tenemos datos suficientes para ayudar a explicar por qué esta excepción tiene un alto YMR sino una supervivencia prolongada. Sin embargo, estos valores atípicos o excepciones no afectaron a la YMR dicotómica (corte & gt; 1,4) que estratifica significativamente el riesgo de los pacientes en este conjunto de datos (p = 0,02, HR = 2,72) (Tabla S9)

Uso de la DCC. conjunto de datos, hemos probado el efecto de dejar caer los genes de la lista de genes Yin y Yang (Figura S6). Dejar caer un gen Yin (217871_s_at, MIF gen) mejoró significativamente el valor de p de YMR, pero su HR disminuye al mismo tiempo (panel superior de la Figura S6). Dejar caer un gen Yin afecta al valor de p de gYMR pero no afectó a la AR (panel central de la Figura S6). Dejar caer un gen Yang un tiempo no afectó el valor p de ambos YMR y gYMR (datos no mostrados), ni el HR de YMR y gYMR (panel inferior de la figura S6). En comparación con YMR, gYMR es más resistente al efecto de bajada o aumento de la asociación de riesgo después de algunos genes fueron retirados. Dejar caer tres genes Yin (HIST1H4J, CDC25A y IGFBP5) se obtiene un mejor rendimiento de gYMR para los datos DCC (panel central de la Figura S6). Con la excepción de los datos Bhattacharjee utilizando dicotómica YMR, la misma caída de genes no mejoró el rendimiento de cualquiera de los YMR (Tabla S11) o la gYMR en otros tres conjuntos de datos (Tabla S12). Estos resultados indican que la lista de genes Yin y Yang podría optimizarse, para un tamaño más pequeño mediante la eliminación de uno a tres genes. Sin embargo, esta optimización se ve limitada por el tiempo de supervivencia del conjunto de datos a prueba, similar a las limitaciones del enfoque de formación de datos. Esperamos que alrededor del 30 Yin y Yang 30 genes garantizaría una representación de la totalidad de los efectos Yin y Yang de las células cancerosas y un rendimiento constante para diferentes conjuntos de datos. las listas de genes más pequeños pueden mantener el mismo o mejorar el rendimiento de un conjunto de datos, pero no pueden funcionar bien para otro conjunto de datos.

Comparación de YMR con firmas ya se ha informado

Se compararon varios aspectos de YMR a los de las firmas previamente comunicados. Como se resume en la Tabla 3, YMR se avanza en la reproducibilidad y la practicidad. También comparó el rendimiento pronóstico del modelo YMR a un 15-gen firma informó recientemente [17]. Esta firma se afirmó superior a muchas otras firmas de pronóstico de cáncer de pulmón ya se ha informado mediante pruebas de un mismo conjunto de datos con todas las otras firmas. Se utilizó el mismo conjunto de datos DCC y los datos de adenocarcinoma Bild [23] a partir de una plataforma diferente (U133plus2) para esta comparación. Como se ve en la Figura S7A, la firma 15-gen estratificó significativamente las muestras DCC (p = 0,011, HR = 2,68), pero no para las muestras Bild (Figura S7B, p = 0,6). Sin embargo, el YMR no sólo estratificó las muestras de DCC en alto riesgo y grupos de bajo riesgo más significativo (Figura S7C, p = p = 0,005, HR = 2,63) que la firma de 15 genes, sino también (Figura S7D, p = 0,019, HR = 2,72) separadas las muestras Bild en los grupos de alto y bajo riesgo de que la firma de 15 genes no pudo. No nos comparamos los otros dos conjuntos de datos (NLCI, Agilent 44k; JBR 10, RT-qPCR) que se utilizaron en Zhu
et al
estudio [17] debido a que estas dos plataformas no contienen suficiente firma genes YMR . Encontramos la firma de 15 genes que funciona mejor para los carcinomas de pulmón de células escamosas entre los cinco conjuntos de datos, pero YMR que no funcionó para estos datos (datos no mostrados), probablemente debido a la diferencia de la biología del tumor entre el carcinoma de pulmón de células escamosas y el adenocarcinoma.

Análisis de YMR y covariables clínicas

Se evaluó la YMR con covariables clínicas en el pronóstico del cáncer de pulmón.

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]