Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: un análisis comparativo de los datos de expresión de genes de tipos de cáncer Múltiples

PLOS ONE: un análisis comparativo de los datos de expresión de genes de tipos de cáncer Múltiples


Extracto

Un estudio comparativo de los datos de expresión de genes pública de siete tipos de cáncer (mama, colon, riñón, pulmón, páncreas, próstata y cáncer de estómago) se llevó a cabo con el objetivo de obtener genes marcadores, junto con las vías asociadas, que son o bien común a múltiples tipos de cánceres o específicos de cánceres individuales. Los resultados del análisis indican que (a) cada uno de los siete tipos de cáncer se pueden distinguir de su tejido de control correspondiente en base a los patrones de expresión de un pequeño número de genes, por ejemplo, 2, 3 o 4; (B) los patrones de expresión de algunos genes pueden distinguir varios tipos de cáncer de sus correspondientes tejidos de control, lo que podría servir como marcadores generales para todos o algunos grupos de tipos de cáncer; (C) las proteínas codificadas por algunos de estos genes se prevé que sean de secreción de la sangre, proporcionando de este modo potenciales marcadores de cáncer en la sangre; (D) el número de genes expresados ​​diferencialmente a través de diferentes tipos de cáncer en comparación con sus tejidos de control se correlacionan bien con las tasas de supervivencia de cinco años asociados con los distintos tipos de cáncer; y (e) metabólicos y vías de señalización son anormalmente activados o desactivados en todos los tipos de cáncer, mientras que otras vías son más específicas para ciertos tipos de cáncer o grupos de tipos de cáncer. Los nuevos hallazgos de este estudio ofrecen considerables conocimientos sobre estos siete tipos de cáncer y tienen el potencial de proporcionar nuevas y excitantes direcciones para la elaboración diagnóstica y terapéutica

Visto:. Xu K, J Cui, Olman V, Yang Q, Puett D, Xu Y (2010) Análisis comparativo de los datos de expresión génica de tipos de cáncer múltiples. PLoS ONE 5 (10): e13696. doi: 10.1371 /journal.pone.0013696

Editor: Vladimir Brusic, Instituto de Cáncer Dana-Farber, Estados Unidos de América

Recibido: 22 Julio, 2010; Aceptado: 4 de octubre de 2010; Publicado: 27 Octubre 2010

Derechos de Autor © 2010 Xu et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este estudio fue apoyado en parte por la National Science Foundation (DBI-0354771, ITR-IIS-0407204, CCF-0.621.700, DBI-0542119), los Institutos nacionales de Salud (1R01GM075331), una subvención "Académico Distinguido" de la Coalición de cáncer de Georgia y financiación inicial de la Universidad de Georgia. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

el cáncer es una gran amenaza para la salud y la vida de las personas, lo que representa ~13% de todas las muertes que causan enfermedades en el mundo [1]. En 2007, 7,6 millones de personas murieron de cáncer en todo el mundo. En el U.S, se registraron más de 1,4 millones de nuevos casos de cáncer cada año en los últimos años, y el cáncer se convierte en la segunda causa de muerte después de las enfermedades del corazón. Las estadísticas de los informes del SEER indican que la tasa de mortalidad en todos los tipos de cáncer en los EE.UU. fue de 195,4 casos por cada 100.000 en 1950, siguió una tendencia ascendente hasta 1978 alcanzando 204,4, y luego de forma constante se redujo a 184,0 en 2005 [2]. Esta tendencia a la baja se ha debido principalmente a las mejoras en las técnicas de diagnóstico para la detección de la etapa temprana del cáncer. estadísticas de supervivencia de cáncer en general indican que la detección temprana y el tratamiento son la clave para una mayor supervivencia en todos los tipos de cáncer.

Desafíos en la detección temprana del cáncer se deben principalmente a la realidad de que la mayoría de los pacientes son asintomáticos en las primeras etapas del cáncer, y sólo unas pocas pruebas eficaces de detección de cáncer son clínicamente disponibles. Aunque algunos ensayos han demostrado ser eficaces en la detección de cáncer en su etapa temprana, a menudo son demasiado invasiva, como la colonoscopia, para ser utilizado de forma rutinaria durante los exámenes físicos regulares y actualmente se limitan a sólo un pequeño número de tipos de cáncer. A menudo, un cáncer ya está en una etapa avanzada cuando se diagnostica; Claramente, se necesitan técnicas más eficaces para la detección temprana del cáncer.

Un número de marcadores genéticos se han propuesto para varios tipos de cáncer, como el BRCA1 y BRCA2 para el cáncer de mama y CDH1 para el cáncer gástrico. Además, un número de marcadores séricos prometedores para el cáncer se han usado clínicamente. Entre ellos, PSA (antígeno específico de la próstata) es el más bien conocido y ha sido ampliamente utilizada para el diagnóstico de cáncer de próstata mediante análisis de sangre [3]. Sin embargo, su eficacia de detección es muy insuficiente, ampliamente considerado como teniendo una tasa de falsos positivos que es demasiado alto para ser un cáncer de indicador fiable [4]. Observaciones similares se han hecho sobre otros marcadores séricos como CA 125 para el cáncer de ovario [5].

El presente artículo presenta un estudio computacional de predicción de ambos marcadores genéticos y suero para siete tipos de cáncer, basado en gene- microarrays pública un programa de ordenador para la predicción de proteínas de la sangre secretora datos de expresión y [6]. En comparación con estudios anteriores sobre la identificación del marcador de cáncer, incluyendo meta-análisis sobre múltiples tipos de cáncer [7], el presente estudio tiene las siguientes características únicas: (i) un enfoque en la identificación de marcadores múltiples genes a través de un análisis exhaustivo de todas las posibles combinaciones de genes, aprovechando al máximo la potencia de computación de alto nivel disponible, en lugar de utilizar métodos heurísticos que no necesariamente encontrar los marcadores óptimos; (Ii) un intento de encontrar marcadores para grupos de tipos de cáncer, además de aquellos para los cánceres individuales; (Iii) un intento de vincular la información derivada de los datos de transcriptómica de los tejidos a la predicción marcador en suero utilizando el novedoso programa de predicción [6]; y (iv) identificación de las vías que están reguladas de manera anormal, ya sea a través de múltiples tipos comunes de cáncer o específicos para tipos individuales de cáncer. Creemos que estos nuevos datos resultarán de gran valor en la aclaración de las alteraciones genéticas en varios tipos de cáncer, además de ofrecer indicaciones potenciales para los nuevos enfoques en el diagnóstico y la terapéutica.

Materiales y Métodos

1. Microarrays de expresión génica de datos para los cánceres humanos

Los datos de microarrays de expresión génica fueron descargados durante siete tipos de cáncer, a saber, mama, colon, riñón, pulmón, páncreas, próstata y cáncer de estómago de la base de datos NCBI GEO [8]. Para asegurar que nuestros resultados de predicción pueden generalizarse a los diferentes conjuntos de datos, dos series de pruebas independientes se utilizaron para evaluar la solidez de los marcadores de genes predichos obtenidos del conjunto de entrenamiento. La información detallada de los datos se enumeran en la Tabla S1. En este estudio, hemos elegido los más grandes conjuntos de datos de microarrays disponibles de cada uno de los siete tipos de cáncer, donde cada conjunto de datos incluye los (normalizados) los niveles de expresión génica de cada gen en el cáncer y el control de los tejidos de cada paciente, junto con la información de escenario para la mayoría de las muestras de cáncer (algunos datos no tiene esta información). Tenga en cuenta que todos los conjuntos de datos de microarrays utilizados se normalizan utilizando RMA, que ha sido informado de que más exactamente un reflejo de los cambios biológicos en comparación con otros métodos como MAS5 (Affymetrix). La distribución de los factores de cambio (FC) de los genes individuales a través de todos los genes entre el cáncer y los tejidos de control correspondientes para los siete tipos de cáncer se comprueban y se encuentran para ser muy similares. Figura S1 muestra una comparación de tales distribuciones FC entre cáncer de mama y cáncer de pulmón; por lo tanto, creemos que las comparaciones de los factores de cambio a través de diferentes conjuntos de datos de cáncer en nuestro estudio son significativos.

2. La identificación de genes expresados ​​diferencialmente

Para los conjuntos de datos no apareados con cáncer y de control de muestras de los mismos pacientes, se aplicó la prueba de Mann-Whitney para identificar los genes que son expresados ​​diferencialmente en el cáncer de
frente
muestras de control. Para los conjuntos de datos con información de emparejado de la prueba es el siguiente: Teniendo en cuenta la hipótesis de que un gen en particular no se expresa diferencialmente en el cáncer de
frente
el grupo de control, el rechazo de esta hipótesis significa que el gen se expresa diferencialmente en el cáncer . Let Y, sea los niveles de expresión del gen en los tejidos de control y el cáncer de
i-ésimo
paciente,
i = 1 ... m
, y
m
sea el número de pacientes . Es obvio que si la hipótesis es verdadera, entonces la probabilidad = = 0,5, suponiendo que la expresión del gen es una variable aleatoria continua. Vamos a
K
sea el número de pacientes con, entonces la variable aleatoria
K /m
sigue aproximadamente una distribución normal (de acuerdo con el teorema del límite central o de Moivre-Laplace Teorema) con su media = 0,5 y una desviación típica =, o sigue una distribución normal
N gratis (0,1). Así, el
p-valor
puede estimarse como
P gratis (
X Hotel & gt;), donde es el número de pacientes satisfactorio. En general, consideramos un gen que se expresa de forma diferente si la significación estadística,
p-valor
, es inferior a 0,05 y su factor de cambio es al menos 2.

3. Predicción de las proteínas secretadas en la sangre

Todos los genes predicen para ser expresadas diferencialmente entre el cáncer y las correspondientes muestras de control se analizaron para predecir si sus proteínas son de sangre-secretora, usando un programa que nuestro grupo ha desarrollado recientemente [6]. La idea básica del algoritmo es la formación de una máquina de vectores de soporte (SVM) clasificador basado en distinguir entre las proteínas y las proteínas de sangre secretora que no son secretadas, utilizando diversas funciones basadas en la secuencia, tales como péptidos señal, dominios transmembrana, sitios de glicosilación y medidas de polaridad. En un gran conjunto de pruebas independientes que contiene 105 proteínas de secreción y 7.258 proteínas no secretoras de los seres humanos, el clasificador logra ~94% predicción de sensibilidad y especificidad ~98% predicción.

4. Predicción de genes marcadores para cada tipo de cáncer

Para cada
k
-Gene combinación de los genes expresados ​​diferencialmente definidos en el apartado anterior, un clasificador basado en SVM fue entrenado para lograr el más alto posible la precisión de clasificación aswhere definido
TP
y
NP ¿Cuáles son los números de verdaderos positivos y negativos, respectivamente, y
N
es el número total de muestras. Una función núcleo lineal se utilizó para la formación a través de LIBSVM [9]. Para cada tipo de cáncer, todos los marcadores se clasifican de acuerdo con el rendimiento 5 veces la validación cruzada en la formación de datos. Con el fin de encontrar marcadores que se generalizan bien a otros conjuntos de datos, hemos probado los marcadores de genes predichos en dos conjuntos de datos de prueba independientes.

5. Predicción de marcadores para múltiples tipos de cáncer

Para identificar
k
discriminadores -Gene para varios tipos de cáncer, se consideraron todos los genes que muestran consistentemente expresiones diferenciales en al menos dos tipos de cáncer. Para cada
k
-Gene combinación entre estos genes, se calculó la precisión de la clasificación entre cada tipo de cáncer y los correspondientes tejidos de control. A continuación, el
k
se determinaron las combinaciones que exhiben -Gene poder de discernir a través de múltiples tipos de cáncer. Los mejores discriminadores para los tipos de multi-cancerosas fueron seleccionados mediante el uso de una línea de corte fijo en precisión de clasificación. A lo largo del resto de este documento,
k
grupos -Gene se refieren a combinaciones de
k
-genes para k = 1, 2, 3, 4 menos que se indique lo contrario.

6. Pathway análisis enriquecimiento de los genes expresados ​​diferencialmente

Análisis funcional y análisis de vías de enriquecimiento se realizaron utilizando DAVID [10], donde la vía de la información se basa en la anotación de KEGG, BBID y BioCarta. Un
p-valor
& lt; 0,05 se utilizó para garantizar el nivel de significación de una vía enriquecido

Resultados

Este estudio se centra en siete de los tipos de cáncer más frecuentes en. el mundo, que también tienen grandes conjuntos de microarrays de expresión génica de los datos disponibles en el dominio público, recogidos en una escala del genoma de los tejidos de cada tipo de cáncer, así como de su control de los tejidos cancerosos correspondientes. Al trabajar en múltiples tipos de cáncer a la vez, podemos derivar posibles marcadores específicos ya sea a los tipos de cáncer individuales o generales a todos o grupos de tipos de cáncer, así como para identificar las vías anormalmente activado o desactivado.

1. Los genes marcadores predichos para los tipos individuales de cáncer

Hemos buscado los genes individuales y combinaciones de genes cuyos patrones de expresión pueden distinguir mejor entre el cáncer y tejidos de control asociados a cada tipo de cáncer. Específicamente, todas las combinaciones de genes 4 1-, 2-, 3- y codificados en el genoma humano fueron clasificados en términos de su poder discernir en la distinción de las muestras de cáncer de las correspondientes muestras de control para cada tipo de cáncer. Además, también hemos clasificado
k
combinaciones -Gene, sobre la base de su poder discernir entre las muestras de cáncer temprana y muestras de control si están disponibles y lo suficientemente grande como los datos pertinentes.

A. El cáncer de mama.

El análisis se realizó sobre un conjunto de datos de expresión genética que consiste en 43 pares de cáncer de mama y el cáncer adyacente tejidos de control de los mismos pacientes [11]. De las 43 muestras, 32 eran cáncer en estadio temprano (estadios I y II). Se encontraron 294 genes que ser expresado constantemente y de forma anormal con al menos un cambio de 2 veces en su expresión a través del cáncer y los tejidos de control, de los cuales 81 fueron reguladas y 213 se redujeron reguladas en los tejidos de cáncer. Entre los genes expresados ​​diferencialmente, 69 de sus proteínas codificadas se prevé que ser secretora de sangre por nuestro programa de predicción [6], y por lo tanto podrían servir como posibles marcadores biológicos (suero adicional Información del archivo S1).

Análisis de Clasificación fue entonces realizado (ver Materiales y Métodos), con el objetivo de identificar
k
combinaciones -Gene cuyos patrones de expresión se puede distinguir con precisión entre el cáncer y las muestras de control. La figura 1 (A) y (D) muestran las precisiones de clasificación de los 100 mejores
k
combinaciones -Gene sobre todo el conjunto de entrenamiento y en el conjunto de entrenamiento que contiene sólo las muestras en fase inicial, respectivamente. Dos conjuntos de evaluación independientes se utilizan para evaluar la generalidad de los marcadores de genes identificados, que consisten en 31 y 68 de cáncer de mama, y ​​27 y 61 muestras de control [12], respectivamente. Figura 1 (B) y (C) muestra el rendimiento de clasificación por los clasificadores entrenados en los dos conjuntos de evaluación. La lista detallada de éstos 100
k
combinaciones -Gene figura incluido en el Suppplementary Información S1

En cada panel, el eje x es la lista de los 100
k.
- marcadores de genes ordenados por su rendimiento de clasificación en los conjuntos de datos de entrenamiento, y el eje y representa la precisión de la clasificación. (A) precisión de clasificación por la parte superior 100
k
combinaciones -Gene entre cáncer de mama y las muestras de referencia en el conjunto de entrenamiento, y (B) y (C) en los dos conjuntos de prueba; (D) precisión de clasificación por encima de 100
k
combinaciones entre -Gene temprana del cáncer de mama y las muestras de referencia correspondientes en el conjunto de entrenamiento y (E) en la prueba.

Como se muestra en la Figura 1, la mayoría de la parte superior
k
combinaciones -Gene, en particular para
k Hotel & gt; 1, un buen desempeño tanto en las unidades de prueba independientes con precisión global superior al 85% y la formación aunque su clasificación de las órdenes de los dos conjuntos de datos pueden no estar bien conservado. Las fluctuaciones en sus exactitudes de clasificación se cree que es debido al pequeño tamaño de los datos de entrenamiento. Se hicieron observaciones similares en todos los principales marcadores predichos a través de los siete tipos de cáncer.

Los mejores tres discriminadores individuales de genes son PCOLCE2, ANGPTL4 y LEP, que tiene el 88,4%, 88,4% y 87,2% de precisión de clasificación en el conjunto de entrenamiento y el 94,8% y el 84,1%, 84,5% y 79. 5% y el 96,6% y el 96,1% en los dos conjuntos de prueba, respectivamente. Los tres principales 2, 3 y 4 del gen combinaciones son TACSTD2 {+ CHRDL1, TACSTD2 + CAV1, PPARg + TMEM97}, {RRM2 + + COL1A1 PPARg, RRM2 + + COL1A1 PCOLCE2, RRM2 + + GPR109B SPINT2} y { RRM2 + + COL1A1 GPR109B + SPINT2, RRM2 + + GPR109B INHBA + SPINT2, TACSTD2 + + IGFBP6 IGF1 + TF}, respectivamente. Del mismo modo, para el cáncer de mama temprano, los tres mejores
k
discriminadores son -Gene {GPR109B, PCOLCE2, PCSK5}, {PCSK5 + COL10A1, FERMT2 + SPINT2, MAOA + IGJ}, {COL1A1 + PCSK5 + TF, GPX3 + + SPINT2 COL1A1, GPX3 + + FAP TMEM97} y {+ RRM2 COL1A1 + + GPR109B IGJ, RRM2 + + COL1A1 GPR109B + IGJ, RRM2 + + COL1A1 GPR109B + SPINT2}, respectivamente.

Aunque el Los mejores tres discriminadores representan nuevos descubrimientos, nos dimos cuenta de algunos genes de menor rango han sido considerados como posibles marcadores de cáncer de mama en estudios previos. Por ejemplo, ADIPOQ (adiponectina) se encuentra que está estrechamente asociado con un riesgo del cáncer de mama [13]. El SPINT2, un inhibidor del activador del HGF, se informó de que altos niveles de expresión en el cáncer de mama en fase inicial y se asocia con un mal pronóstico [14], en consonancia con nuestros hallazgos. Algunos otros están involucrados en las actividades de las células de cáncer en general. Por ejemplo, CAV1, las reguladas en las muestras de cáncer, se encontró que inhibe el crecimiento del cáncer de mama y metástasis [15]; la baja regulación de PPARg se asocia con recurrencia local y metástasis en el cáncer de mama [16]; y ANGPTL4 puede actuar como un regulador de la angiogénesis [17]. Para el mejor de nuestro conocimiento, todos los 2, 3 y 4 de genes discriminadores representan nuevos descubrimientos.

análisis similares se han llevado a cabo en otros seis tipos de cáncer. Las principales conclusiones sobre cada uno de estos seis tipos de cáncer se destacan a continuación, con el resumen que se da en la Tabla S2 y los nombres de genes aparece en S1 Información de archivo. Además, la información complementaria del archivo S2 muestran las precisiones de clasificación de los 100 mejores
k
discriminadores -Gene tanto en la formación y los conjuntos de pruebas para cada tipo de cáncer, respectivamente.

B. El cáncer de colon.

Nuestro análisis se realizó sobre un conjunto de datos de microarrays que consta de 53 cáncer de colon y cáncer de 28 tejidos de control adyacente de los mismos pacientes (algunas de las muestras de cáncer no tienen muestras de referencia) [18]. Se encontraron 247 genes que se expresa de manera consistente y anormalmente con al menos un cambio de 2 veces en su expresión a través de la cáncer y los tejidos de control en nuestros datos de entrenamiento, 56 de los cuales son regulados hacia arriba y 191 están regulados hacia abajo en tejidos de cáncer de colon . Dos conjuntos de pruebas independientes, que consiste en cáncer de colon 24 y 22 y 24 y 20 muestras de control de cáncer adyacente de los mismos pacientes [19], respectivamente, se utilizaron para evaluar la generalidad de los marcadores predichos.

Hemos encontrado los tres mejores discriminadores de un solo gen para el cáncer de colon son MMP7, DPT y MMP1 que tiene 97,5%, 96,3% y 95,1% de precisión de clasificación en el conjunto de entrenamiento, y el 97,9% y el 90,9%, 97,9% y 74,6%, y el 91,7% y el 84,1 % en los dos conjuntos de prueba, respectivamente. Los tres mejores discriminadores 2-gen son SLIT3 + MMP7, MMP7 MATN2 + y + MMP7 ptgs1. Algunos de nuestros mejores discriminadores han sido estudiados previamente en el contexto del cáncer colorrectal. Por ejemplo, MMP1 es un factor de promoción de la invasión, y su regulación, como se observa en nuestros datos, se asocia con la invasividad del cáncer [20]. MMP7 se sabe que juega un papel importante en el crecimiento del cáncer, y su regulación podría ser un mecanismo clave para el escape de las células cancerosas de la vigilancia inmune [21].

C. El cáncer de riñón.

El análisis se realizó sobre un conjunto de datos de microarrays de expresión génica que consiste en 49 cáncer de riñón y 23 muestras de tejido de cáncer de control adyacente de los mismos pacientes [22]. Se encontraron 231 genes que se expresa de manera consistente y anormalmente con al menos un cambio de 2 veces en su expresión a través de los tejidos de cáncer y de control en nuestro datos de entrenamiento, 129 de los cuales están regulados y 102 están reguladas en el cáncer. Dos conjuntos de evaluación independiente, que consta de 35 y 36 muestras de cáncer de riñón y 12 y 9 muestras de control de cáncer adyacente de los mismos pacientes, respectivamente, se utilizaron para evaluar la generalidad de los marcadores predichos [23], [24]. Los mejores tres individuales discriminadores de genes se encuentran para ser UMOD, ACPP y CCL18 para el cáncer de riñón, que tiene la misma precisión de la clasificación, el 98,6% en el conjunto de entrenamiento y el 100% y el 94,4%, 95,7% y el 86,11% y el 89,4% y el 68,1% en los dos conjuntos de prueba, respectivamente. Los tres mejores combinaciones de genes son 2-EGF + ALB, ACPP + UMOD, y UMOD + ALB. Entre los mejores discriminadores, UMOD ha informado que estar relacionado con la enfermedad renal [25]. SERPINA5, las reguladas en el cáncer, regula el potencial invasivo de crecimiento del cáncer renal y la invasión. Otros discriminadores superiores representan nuevos descubrimientos. Por ejemplo, AFM no se ha informado de que se relacionada con el cáncer, y C6orf155 no tiene una función caracterizado.

D. El cáncer de pulmón.

El análisis se realizó sobre un conjunto de datos de microarrays que consiste en tejido de cáncer de pulmón 58 y 49 muestras de tejido de cáncer de control adyacente de los mismos pacientes [26]. Se encontraron 683 genes que se expresa de manera consistente y anormalmente con al menos un cambio de 2 veces en su expresión a través de los tejidos de cáncer y de control en nuestro datos de entrenamiento, 255 de los cuales están regulados y 428 están reguladas en tejidos de cáncer de pulmón. Dos conjuntos independientes, que consiste en cáncer 27 y 20 de pulmón y 27 y 19 muestras de control con el cáncer adyacente de los mismos pacientes [27], se utilizó para evaluar la generalidad de los marcadores predichos.

La mejor tres solo gen discriminadores son CAV1, SFTPC y VWF para el cáncer de pulmón, que tiene la misma precisión de la clasificación, el 99,1% en el conjunto de entrenamiento y el 98,2% y el 100%, 96.3% y 82.5%, y 88.9% y 100% en los dos conjuntos de prueba, respectivamente. Los tres mejores combinaciones de genes son 2-FERMT2 + GREM1, TEK + NFASC, CAV1 + MMP1. Entre los mejores discriminadores, CAV1 se ha encontrado para ser abajo-regulada en cáncer de mama [28], y se ha informado que se asocia con la metástasis en el cáncer de pulmón [29]. SFTPC ha informado que se asocia con enfermedad pulmonar intersticial [30]. FAM107A, que suprime el crecimiento celular, puede desempeñar un papel en el desarrollo del cáncer [31]. Otros discriminadores superiores representan nuevas observaciones. Para ejemplos, TNXB, SPP1 y EMCN no han sido previamente reportado como relacionado con el cáncer.

E. El cáncer de páncreas.

El análisis se realizó sobre un conjunto de datos de microarrays que consta de 39 emparejado cáncer de páncreas y muestras de tejido de cáncer de control adyacente de los mismos pacientes [32]. Se encontraron 885 genes que ser expresado constantemente y de forma anormal con al menos un cambio de 2 veces en su expresión a través de los tejidos de cáncer y de control en los datos de entrenamiento, 616 de los cuales son regulados hacia arriba y 269 son reguladas en el cáncer de páncreas. Dos conjuntos independientes, que consta de 36 y 29 muestras de cáncer de páncreas y 16 y 5 muestras de control de cáncer adyacente de los mismos pacientes [33], se utilizó para evaluar la generalidad de los marcadores predichos.

Lo mejor tres sola discriminadores -Gene son KRT17, COL10A1 y CTHRC1 de cáncer de páncreas, que tiene la misma precisión de la clasificación, el 93,6% en el conjunto de entrenamiento y de 88,5% y 80,4%, 84,6% y 73,2%, y 84,6% y 85,7% en los dos conjuntos de prueba, respectivamente. Los tres 2- y 3-gen mejores discriminadores son {MMP7 + AZGP1; MMP7 + FGL1; MMP7 + PLA2G1B} y {+ CTHRC1 SGPP2 + CCL18; TNFRSF21 + + EGFL6 CTHRC1; COL10A1 + + S100A6 RSAD2}, respectivamente. Entre los mejores discriminadores, KRT17 se sabe están involucrados en la reparación tisular [34]. AZGP1 ha informado de causar una pérdida de grasa, a menudo asociado con cánceres avanzados [35]. Otros discriminadores superiores representan nuevos hallazgos. Para ejemplos, RSAD2, que participan en la defensa antiviral, no ha sido reportado por estar relacionados con el cáncer, así como SGPP2, se sabe están involucrados en la señalización pro-inflamatorias [36], y CST4.

F. El cáncer de próstata.

El análisis se realizó sobre un conjunto de datos de microarrays que consta de 65 cáncer de próstata y 63 muestras de tejido de cáncer de control adyacente de los mismos pacientes [37]. Se encontraron 118 genes que ser expresado constantemente y de forma anormal con al menos un cambio de 2 veces en su expresión a través de los tejidos de cáncer y de control en nuestra formación de datos, de los cuales 23 están regulados hacia arriba y 95 están reguladas en los tejidos de cáncer de pulmón. Dos conjuntos independientes, que consta de 62 y 53 muestras de cáncer de próstata y 47 y 14 muestras de control de cáncer adyacente de los mismos pacientes [38], se utilizó para evaluar la generalidad de los marcadores predichos.

Lo mejor tres sola discriminadores de genes son MYLK, PALLD y CAV1 para el cáncer de próstata, que tiene el 73,4%, 71,9% y 71,1% de precisión de clasificación en el conjunto de entrenamiento y el 83,5% y el 62,3%, 69,6% y 72,6%, y 94,2% y 75,5% en las dos pruebas establece, respectivamente. Los tres 2- y 3-gen mejores discriminadores son {LTF + IGF1; LTF + SPARCL1; SMTN + CCK}, {SMTN + CCK + CCL2; SMTN + CCK + COMP; SMTN + CCK + PLA2G7}, respectivamente. Entre los mejores discriminadores, LTF es conocida para inhibir el crecimiento de tumores [39]. IGF1, un factor de crecimiento, desempeña un papel en el desarrollo del cáncer de próstata [40] y se ha informado como un indicador de cáncer de próstata avanzado [41]. Otros discriminadores superiores representan nuevos descubrimientos. Por ejemplo, CHRDL1 puede jugar un papel en la regulación de la angiogénesis [42] pero no se ha informado de que se relacionada con el cáncer. Lo mismo es con SMTN.

G. El cáncer de estómago.

El análisis se realizó sobre un conjunto de datos de microarrays que consta de 89 cáncer de estómago y cáncer de tejidos de control 23-adyacentes de los mismos pacientes [43]. Fuera de las muestras de tejido de cáncer de 89, 31 son cánceres en etapa temprana. Se encontraron 311 genes que se expresa de manera consistente y anormalmente con al menos un cambio de 2 veces en su expresión a través de los tejidos de cáncer y de control en nuestro datos de entrenamiento, 166 de los cuales están regulados y 145 están reguladas en tejidos de cáncer de pulmón. Dos conjuntos independientes, que consta de 38 y 16 muestras de cáncer de estómago y 31 y 13 muestras de control de cáncer adyacente de los mismos pacientes [44], [45] se utilizó para evaluar la generalidad de los marcadores previstos, de los cuales 12 son muestras en fase inicial parcialmente emparejado con 10 muestras de control.

los tres mejores discriminadores de un solo gen son SERPINH1, BGN y COL12A1 para el cáncer de estómago, que tiene el 99,1%, 98,2% y 98,2% de precisión de clasificación en el conjunto de entrenamiento y de 94,2% y 96,7 %, 88,4% y 93,3%, y 84,1% y 75,8% en los dos conjuntos de prueba, respectivamente. Los tres mejores combinaciones de genes son 2-CHGA + SERPINH1, TGFBI + CHGA y PGC + SERPINH1, respectivamente. Para el cáncer de estómago temprano, los tres mejores
1

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]