Extracto
Un objetivo central de la biología del cáncer es entender cómo las células de esta familia de enfermedades genéticas sufren cambios morfológicos y fisiológicos específicos y una regresión a un estado desregulado de la ciclo celular. El hecho de que los tumores son incapaces de realizar la mayor parte de las funciones específicas del tejido original nos llevó a formular la hipótesis de que el grado de especialización del transcriptoma de los tejidos cancerosos debe ser menor que sus contrapartes normales. Con la ayuda de herramientas de teoría de la información, se analizaron cuatro conjuntos de datos derivados de transcriptomes de tejidos normales y tumorales para probar cuantitativamente la hipótesis de que el cáncer reduce especialización transcriptoma. Aquí, mostramos que la especialización de la transcripción de un tumor es significativamente menor que el tejido normal correspondiente y comparable con la especialización de las células madre embrionarias indiferenciadas. Además, se demuestra que la caída de la especialización en tejidos cancerosos se debe en gran parte a una disminución de la expresión de genes que son altamente específicos para el órgano normal. Este enfoque nos da una mejor comprensión de la carcinogénesis y ofrece nuevas herramientas para la identificación de genes que son altamente influyente en la progresión del cáncer
Visto:. Martínez O, Reyes-Valdés MH, Herrera-Estrella L (2010) Cáncer reduce el transcriptoma de especialización. PLoS ONE 5 (5): e10398. doi: 10.1371 /journal.pone.0010398
Editor: Shin-Han Shiu, Universidad del Estado de Michigan, Estados Unidos de América
Recibido: March 3, 2010; Aceptado: April 7, 2010; Publicado: 3 Mayo 2010
Derechos de Autor © 2010 Martínez et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por el Consejo Nacional de Ciencia y Tecnología (Conacyt), Consejo de Ciencia y Tecnología del Estado de Guanajuato (CONCYTEG), Centro de Investigación y de Estudios Avanzados del Instituto Politécnico Nacional (Cinvestav) y la Universidad Autónoma Agraria Antonio Narro (UAAAN). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
el cáncer es una familia compleja de enfermedades genéticas adquiridas en los que un clon de células y su progenie se acumulan cambios hereditarios que causan un fenotipo maligno de crecimiento celular desregulado y diferenciación [1]. Numerosos estudios se han realizado para comprender mejor las alteraciones que se producen en el perfil de la transcripción durante la progresión del cáncer [2]. Estos experimentos se han llevado a cabo contando directamente las etiquetas de los genes expresados utilizando análisis en serie de la expresión génica (SAGE) [3], marcadores de secuencias expresadas (EST) [4], y otras estrategias de conteo, o mediante la medición indirecta de los niveles de transcripción utilizando microarrays de ADN [5]. En muchos casos, estos experimentos han detectado genes que se expresan preferentemente en un tumor de cáncer y pueden servir como marcadores moleculares de malignidad. Además, también pueden detectar alteraciones significativas en el nivel de transcripción de conjuntos de genes que participan en las redes de señalización complejos. Los cambios en estas redes representan las distorsiones de las vías que regulan la fisiología de las células normales [6].
Las células cancerosas pierden la capacidad de realizar las funciones normales del tejido original, y al mismo tiempo, el aumento de las características que les permiten sobrevivir como un tumor independiente y con frecuencia invasivo. Como líneas celulares evolucionan a partir de una normal a un estado canceroso, las mutaciones en coche un aumento de la diversidad genética [7]. Este proceso ocurre en paralelo con la selección de los fenotipos y genotipos que permiten que las células pre-cancerosas para prosperar en su microambiente [8]. Las células tumorales con frecuencia carecen de la diferenciación que está presente en el tejido normal que se originan a partir de. Desde mediados de los 19
siglo XX, este hecho tiene patólogos han llevado a sugerir que los tumores surgen a partir de células de embrión similar a [9]. Dado que el cáncer debe surgir de una célula que tiene el potencial para dividir, históricamente se han propuesto dos hipótesis no exclusivos del origen celular de tumores. La primera hipótesis establece que la malignidad surge de las células madre debido a la detención de la maduración; los segundos estados de que el cáncer surge de la desdiferenciación de las células maduras [10]. Más recientemente, sin embargo, el concepto de "células madre del cáncer", o células raras con un potencial ilimitado para la auto-renovación, ha ganado aceptación como una subpoblación de células que impulsa la tumorigénesis. Esta hipótesis se basa en los hallazgos que han demostrado que en algunos casos, sólo un subconjunto de las células dentro de un tumor tiene ilimitado potencial proliferativo [11]. Sin embargo, esta hipótesis sigue siendo controvertido, puesto que el crecimiento de ciertos tumores malignos es impulsado por un porcentaje sustancial de las células tumorales que no son células madre de cáncer (de más de 10%) [12]. En cualquier caso, hay una clara evidencia de que el fenotipo no diferenciado de muchas células tumorales parece al fenotipo de las células normales no diferenciadas, tales como células madre embrionarias. Además, el estudio de la expresión génica en tumores de cáncer ha revelado que los tumores pobremente diferenciados muestran sobreexpresión preferencial de genes normalmente enriquecidas en células madre embrionarias, el apoyo a la posibilidad de que estos genes contribuyen a los fenotipos de células madre similares que se muestran por muchos tumores [13].
Anteriormente, hemos descrito el desarrollo de índices basados en la teoría de la información de Shannon para medir la diversidad transcriptoma, la especialización y la especificidad de genes de órganos y tejidos normales [14]. En ese estudio, se obtuvo un índice de especificidad génica,
S
i
, que tiene un valor de cero para los genes que son expresados por igual en todos los tejidos y tiene un valor máximo definido cuando se expresa un gen en un solo tejido. Transcriptome especialización,
δ
j
, por lo tanto, se define como la especificidad promedio gen expresado en el transcriptoma (ver Materiales y Métodos). En general, un tejido es más especializado si genes específicos son altamente expresado en ella. Se demostró además que los órganos humanos tienen un grado particular de la diversidad y la especialización que está relacionada con su funcionalidad. En este estudio, hemos aplicado herramientas de teoría de la información para comparar la diversidad transcriptoma y la especialización de los tumores cancerosos en comparación con sus homólogos normales. Se demuestra que la especialización de los tejidos de cáncer generalmente disminuye en comparación con sus contrapartes normales, lo que se debe principalmente a la disminución de la expresión de genes altamente específicos.
Resultados
La hipótesis de que las características morfológicas y cambios funcionales que se producen durante la progresión del cáncer daría lugar a cambios sustanciales en el transcriptoma del cáncer, incluyendo una reducción en la especialización, si se compara con la de los tejidos normales análogos. Para probar esta hipótesis en un marco amplio, se seleccionaron tres colecciones de etiquetas de genes y un experimento de microarrays. Conjuntos de datos
Un
y
B ¿Cuáles son seleccionados colecciones de bibliotecas de cDNA a partir del "Proyecto del Genoma del Cáncer anatomía" [15] para los tejidos humanos y de ratón, respectivamente. Conjunto de datos
C
consiste en SAGE bibliotecas de tejidos humanos normales y tumorales obtenidas del proyecto "transcriptoma humano Mapa" [16] y el conjunto de datos
D
es un estudio de microarrays de tejidos humanos en condiciones normales y pre estados cancerosa que fueron emparejados por los pacientes [17]. Conjuntos de datos
Un
y
B Opiniones incorporar cinco de células madre embrionarias (ESC) y las bibliotecas de una célula madre hematopoyéticas (HSC) y se incluyeron en el análisis en función de su grado de desdiferenciación. Estos conjuntos de datos se sometieron al análisis de las propiedades de información del transcriptoma como se describe anteriormente [14]. En las etiquetas de recuento de datos, se evaluó la significación estadística de las diferencias en la especialización. En cada caso, se obtuvo la especificidad (
S
i
) y Target Especificidad (
TS
ij
) de los genes estudiados en los conjuntos de datos, lo que permitió la selección de los genes sobreexpresados en el cáncer putativos o tejidos normales, así como la discriminación de los genes expresados preferentemente en una condición dada.
Evaluación de la especialización transcriptoma en tejidos normales y cancerosas
el análisis de conjuntos de datos
Un
y
B Opiniones para estimar la diversidad transcriptoma (
H
j, España) y la especialización (
δ
j)
índices se realizaron a tres niveles de biblioteca de ADNc agrupación con la designación siguiente: bibliotecas de ADNc individuales se definieron como "no agrupados"; bibliotecas de ADNc ensambladas procedentes de la misma especie de órgano y tejido estado (normal o cáncer) se definieron como "agrupados"; y una agrupación adicional de las bibliotecas de ADNc que sólo consideran el estado del tejido y no el órgano de origen se define como "agrupación completa" (ver Materiales y Métodos).
H
j
mide la variabilidad de la distribución de las transcripciones y
δ
j
evaluó la especificidad media de los genes expresados en el transcriptoma. La visualización de las posiciones de la transcriptomes en el (
H
j
,
δ
j
) coordina nos permitió evaluar de manera efectiva las diferencias relativas de estos parámetros significativos. Resultados para el análisis no agrupada, el análisis de conjunto de datos D, tablas de intervalos de confianza para los parámetros relevantes, y la disección de las diferencias en la especialización transcriptoma se discuten en apoyo Texto S1.
La figura 1 presenta dispersan parcelas para los niveles de transcriptoma la diversidad,
H
j
, y la especialización,
δ
j
, a nivel agrupados para conjuntos de datos
Un
y
B Opiniones . Al comparar 12 pares de tejidos análogos humanos, 11 tejidos cancerosos tuvieron significativamente menos especialización que sus homólogos normales, con cáncer de ojo es el único tejido que tenía una especialización estimado que era mayor que su contraparte normal (Figura 1A, Tabla S4, y el soporte de texto S1). Sin embargo, tras un análisis más detallado, llegamos a la conclusión de que la muestra de tejido del ojo es más probable distorsionada debido al menor tamaño de muestra de la biblioteca ojo normal (10,679 etiquetas) en comparación con la biblioteca de ojos canceroso (42,029 etiquetas) (véase el texto S1 de apoyo). Esto probablemente impidió la correcta estimación de los genes de ojos específico en la biblioteca normal. Todos los cambios en la especialización de los transcriptomes son estadísticamente significativas (Tabla S4 y S5 Tabla; P & lt; 0,01). La Figura 1A también muestra que la diversidad transcriptoma, medida por
H
j
, el aumento en los estados cancerosos de todos los tejidos, con la excepción de los testículos y la placenta. El aumento de los
H
j
indica una distribución más equitativa de los niveles de transcripción de los genes expresados, lo que es más probable debido a una disminución en la expresión de genes que prevalecen en los tejidos normales. Como se muestra en la Figura 1A, se observó que la especialización de las bibliotecas ESC agrupados está en el mismo nivel que la mayoría de los tejidos de cáncer. Esto está de acuerdo con la baja especialización morfológica de los CES.
conjuntos de datos comparables están unidos por una línea discontinua.
Un CD - Datos en humanos de 53 bibliotecas de 13 tejidos diferentes, con un total de 671,197 etiquetas para 28,087 genes; Los análisis agrupados.
B Opiniones - datos del ratón de 29 bibliotecas de 5 a distintos tejidos y con un total de 541,453 etiquetas expresadas por 25,044 genes distintos; Los análisis agrupados. Los datos de
Un
y
B ¿Cuáles son del "Proyecto del Genoma del Cáncer Anatomía" (http://cgap.nci.nih.gov/). los intervalos de confianza de 95% aproximados para la diversidad y la especialización se representan como líneas de color continuos. Ver Apoyando el texto S1, así como la figura S1, S2 Figura, Figura S3, S4 Figura, Figura S5 y S6 figura que ilustran comparaciones y detalles individuales.
Con el fin de evaluar la caída de la especialización de la tejidos cancerosos, se comparó la especificidad media de los genes que se sobre-expresan en tejidos normales a la de los tejidos cancerosos. En general, se encontró que había una significativamente mayor especificidad promedio de genes sobreexpresados en tejidos normales, lo que sugiere que la disminución de la especialización era debido a la reducción o eliminación de la expresión de genes altamente especializados en los tejidos normales durante la carcinogénesis (véase la tabla S11 y la figura S11). También se analizaron los diez genes más influyentes que causaron la reducción de la especialización en las once tejidos del conjunto de datos
A.
Para cada tejido, encontramos ejemplos de genes específicos de órganos que fueron desconectados en el tejido canceroso correspondiente, incluyendo condroadherina (
CHAD) Hoteles en hueso, uromodulina (
UMOD) Hoteles en los riñones, la fosfatasa ácida prostática específica (
ACPP)
gen en la próstata, y un gen de la proteína asociada a la espermatogénesis en el testículo (Tabla S12).
Para confirmar nuestra hipótesis de que la especialización disminuye en los tejidos cancerosos, se analizó un modelo completamente independiente de tejidos de ratón (conjunto de datos
B Opiniones). En este análisis, todos los tejidos normales mostraron significativamente mayor especialización de los tejidos cancerosos correspondientes (Figura 1B, Tabla S6 y S7 Tabla; P & lt; 0,01). Conjunto de datos
B Opiniones incluyó también una biblioteca de células madre hematopoyéticas obtenidas de la médula ósea. Estas células mostraron un nivel de especialización comparable con pulmonar normal y la piel, incluso cuando no diferenciado (Figura 1B). En cuatro de los cinco órganos estudiados en el conjunto de datos
B
, la especificidad media de los genes que se sobre-expresan en tejidos normales fue significativamente mayor que el valor correspondiente para los tejidos cancerosos, con la excepción de la glándula mamaria ( Tabla S11). Sin embargo, los genes relacionados con la producción de leche, que estaban dentro de los genes de mayor influencia de la glándula mamaria y tienen una alta especificidad de la expresión en este tejido (Tabla S13 y la Tabla S14), mostraron una caída extrema en la expresión en el tejido canceroso. Estos resultados explican la caída general de especialización visto en la glándula mamaria. Además, los gráficos de dispersión de cambio de frecuencia de genes entre tejidos normales y cancerosas vs. especialización mostró una prevalencia de genes altamente específicos, sobre-expresadas en los tejidos normales de los cinco órganos estudiados (Figura S12). Llegamos a la conclusión de que los genes altamente específicos que han disminuido expresión en los tejidos cancerosos en coche la caída de la especialización, similar a la observada en el conjunto de datos A.
Los datos de la "Transcriptome Mapa Humanos" (conjunto de datos
C
) consisten en una colección de etiquetas de genes SAGE que pertenecen a los tejidos normales y tumorales heterogéneos que se agrupan por cromosoma. No tuvimos en cuenta las evidentes diferencias en los perfiles de transcripción entre los distintos órganos y sólo prueba la hipótesis de que la especialización disminuye en la transcriptomes tumorales. Vale la pena señalar que en contraste con el análisis de conjuntos de datos
A
y
B
, donde se estimó especificidad gen para la combinación de tejido y el estado, en el conjunto de datos C de la especificidad se calcula solamente con en cuenta el estado del tejido (normal vs. tumor) y no tiene en cuenta el tejido de origen. Por lo tanto, la especificidad de genes en este conjunto de datos sólo se refiere a los tejidos normales o tumorales e implica que se observaría una especialización estimado mucho menor. Un cambio grande y significativo en la especialización transcriptoma entre los tejidos normales y tumorales se observó para todos los cromosomas (Figura 2, Figura S7, la Figura S8, la Figura S9 Figura S10, Tabla S9, y soporte de texto S1), con la excepción del cromosoma Y, para los que la diferencia no es significativa. La mayor parte de las diferencias que son significativas (23 de 24) se encuentran en la dirección esperada y tienen menos especialización en la transcriptomes tumorales. Una excepción a esto era el cromosoma 18, por lo que el cambio en la especialización es en la dirección opuesta (ver Apoyo Texto S1). Sin embargo, el análisis de todos los loci juntos (Figura 2 y Tabla S9) apoya firmemente la hipótesis de que el cáncer reduce la especialización de los tejidos
Datos de la expresión humana son del proyecto "Human transcriptoma Mapa" (http:. //bioinfo.amc.uva.nl/HTMseq/controller), conjuntos de datos "Todos los tejidos normales" y "Todos los tejidos del tumor". Los datos consisten en 18,609,073 etiquetas para un total de 62,916 loci por cromosoma. Ver Figura S7, S8 Figura, Figura S9 y S10 figura que amplifican las cajas de esta figura presenta los intervalos de confianza del 95% para las estimaciones.
En nuestro estudio anterior, hemos demostrado que el rango estimado de la variación de la diversidad y la especialización en el transcriptoma humano es mucho menor cuando se utilizan microarrays que cuando se cuentan las etiquetas de genes [14]. Esto es debido a la gama relativamente estrecha dinámica de microarrays en comparación con la etiqueta estrategias de conteo [18], que distorsiona ambos genes de alta y baja expresadas. A pesar de estas deficiencias, el análisis de la normalidad (TDLUs) y tejidos precancerosos (HELUS) emparejados por el paciente (conjunto de datos
D
) mostró una gran caída en la especialización en los tejidos precancerosos en siete de los ocho casos estudiados (Figura S13) .
los genes detectados sólo en el cáncer
el enfoque de teoría de la información para el estudio del transcriptoma tiene la ventaja de permitir una estimación del grado de especificidad génica global,
S
i
, de cada gen estudiado, así como su especificidad objetivo,
TS
ij
, un parámetro que mide la especificidad de un determinado gen para un transcriptoma seleccionado (véase la adenda de Matemáticas en apoyo el texto S1) . Estas herramientas permiten la selección fácil de los genes que se expresan preferentemente en tejidos de cáncer y por lo tanto tienen el potencial de servir como marcadores moleculares de malignidad. Además, estos índices pueden ayudar en la identificación de genes que son específicos para un tipo particular de cáncer o genes que no se modifiquen de manera significativa durante el desarrollo del cáncer y por lo tanto puede servir como controles de marcadores en la medición de genes de diferente expresión. Es importante señalar que cuando se detecta un gen en un conjunto de datos particular, en sólo los tejidos de cáncer, no puede deducirse de ser exclusivamente en el cáncer, ya que también podría estar presente en los tejidos normales a niveles indetectables. Sin embargo, los genes con altos niveles de expresión que sólo se encuentran en tejidos de cáncer son buenos candidatos para ser significativamente hasta reguladas en el cáncer.
Para identificar los genes que son expresados diferencialmente en tejidos de cáncer, se determinó la especificidad de genes (
S
i
) y Target especificidad (
TS
ij
) en el conjunto de datos
Un
mediante el análisis completo agrupación. La Tabla 1 muestra ejemplos de genes representados en tejidos de cáncer en la parte más elevada del nivel de expresión (más de 1 de cada 10.000) y ausente de todos los tejidos normales. Estos genes sólo se detectaron en los tejidos de cáncer, con una serie de etiquetas (que van desde 54 a la 535) en tejidos de cáncer y no hay etiquetas en tejidos normales (máximo
S
i
en el análisis). Para validar estadísticamente la frecuencia regulada al alza de estos genes, se aplicó la prueba exacta de Fisher [19] con la corrección de Bonferroni para múltiples ensayos [20] (ver Métodos). La Tabla 2 presenta los genes que se detectaron en sólo un tipo de cáncer. La identificación de estos tipos de genes fue posible (a través de
S
i
y
TS
ij
) debido a la inclusión de diversos tipos de tejidos de cáncer en el análisis. Tabla S10 se muestran ejemplos de genes expresados exclusivamente a la tasa relativamente alta en los tejidos tumorales en el análisis del conjunto de datos
C
.
Discusión
El uso de herramientas de teoría de la información para evaluar cuantitativamente los cambios en la abundancia de transcripción de estado estacionario nos permitió examinar cuatro conjuntos de datos diferentes para determinar si los tejidos cancerosos tienen una menor especialización transcriptoma que sus contrapartes normales. Los resultados obtenidos de estos análisis mostraron que la especialización del transcriptoma cáncer disminuyó en comparación con el equivalente de tejido normal. La disminución de la especialización del transcriptoma se debió principalmente a una reducción en el nivel de expresión de genes que son específico de tejido y por lo general se expresa en altos niveles en el tejido normal (ver Apoyando el texto S1 y el cuadro S11, Cuadro S12, Cuadro S13, Cuadro S14, Mesa S15 y S16 Tabla). Estos resultados están de acuerdo con la observación de que los tumores a menudo muestran los tipos de células morfológicamente indiferenciadas de una manera similar a la observada en las células madre [21]. Además, la evidencia molecular ha demostrado que los tumores de cáncer pobremente diferenciados sobreexpresan genes que están enriquecidas en células madre embrionarias [13]. No está completamente claro si el cáncer se inicia por un proceso de de-la regulación de las células madre de órganos o por una desdiferenciación-de novo de las células de órganos accionados por las mutaciones que surgen durante el desarrollo del tumor [7].
Todos los estudios del transcriptoma de alto rendimiento que utiliza tanto las estrategias o microarrays de etiquetas de conteo sólo se midieron los cambios relativos en los niveles de transcripción. Este enfoque hace que la hipótesis universalmente aceptada de que todas las células tienen la misma actividad transcripcional absoluta. Sin embargo, esta suposición carece de validación experimental, especialmente en el caso de las células cancerosas. El método utilizado en este estudio midió los niveles relativos de la expresión de genes (el conjunto de
p
ij
) para evaluar la especificidad de genes, la diversidad transcriptoma, y la especialización. Por lo tanto, no podemos descartar la posibilidad de que todos los genes podrían tener un mayor nivel de expresión absoluta en el cáncer que en los tejidos normales. Sin embargo, un aumento general de la transcripción en células cancerosas no tendría un impacto importante en la especialización transcriptoma o en la especificidad de la expresión génica
.
especialización transcriptoma, δ
i, se mide exclusivamente en el contexto de los órganos o tejidos incluidos en el análisis y refleja el órgano o tejido sesgo hacia la expresión de genes específicos. Para estimar la "verdadera" especialización de un tejido, todos los distintos tipos de células de un órgano determinado deben incluirse por separado en el análisis. Esto no se cumplió en el análisis realizado aquí debido a las limitaciones en los datos utilizados en este estudio. Un segundo factor que afecta a la estimación de la especialización es el tamaño de la muestra, o más específicamente, el número de etiquetas de genes emplea. genes altamente específicos tienden a ser expresados en un pequeño subconjunto de las células que forman un órgano y por lo tanto tienen una alta probabilidad de no tener ninguna etiqueta de genes y no estar presente si la muestra es relativamente pequeño. Como resultado, la especialización tiende a subestimarse en pequeños tamaños de muestra. En el caso del conjunto de datos
Un
, el número total de etiquetas fue 620.696, con 131,623 (21%) las etiquetas que corresponden a los tejidos normales y los 489,073 (79%) restantes etiquetas correspondientes a los tejidos cancerosos. Por lo tanto, el potencial para la subestimación de especialización fue mayor para los tejidos normales que en los tejidos cancerosos. Sin embargo, la figura 1A muestra una fuerte evidencia de menos especialización en los tejidos cancerosos. Esto se observó en los conjuntos de datos
B Opiniones y
C
también.
Los órganos humanos se componen de diferentes números y tipos de células y por lo tanto tienen distintos niveles de complejidad. Un órgano más complejo tendrá un mayor número de distintos tipos de células, y como resultado, la estimación de su diversidad y especialización será menos preciso y requiere un tamaño de muestra más grande para la exactitud. En contraste, los tumores se forman por un pequeño número de distintos tipos de células y la estimación de su diversidad y especialización será más preciso con un tamaño de muestra dado. Esto es evidente por el tamaño de los intervalos de confianza para cada punto en la figura 1 (véase también la figura S1, Figura S2, S3 Figura, Figura S4, S5 Figura y la Figura S6). En ambos casos (conjuntos de datos
Un
y
B Opiniones), el tamaño de los intervalos de confianza es mayor para los tejidos normales analizados que para sus contrapartes cancerosas. Sin embargo, las diferencias en la especialización entre los tejidos normales y cancerosas son varios intervalos de confianza de diferencia, lo que demuestra que las conclusiones son estadísticamente robusta (Tabla S4, S5 Tabla, Tabla S6, S7 y Tabla Tabla S8).
Es bien sabe que las células tumorales son a menudo indiferenciado y se asemejan a las células madre embrionarias [9]. Para comparar el nivel de especialización de los tejidos de cáncer con la de los CES, se incluyeron cinco bibliotecas de los CES en el conjunto de datos
Un
y los analizamos por separado (Figura S1) o como un grupo (Figura 1A). La posición de la ESC en la Figura 1 y la Figura S1 corrobora que el nivel de especialización de las células madre es comparable a la mayoría de los tejidos de cáncer analizadas. Estos datos confirman la correlación entre la desdiferenciación fenotípica y la caída de la especialización en ambos CES y células cancerosas. Por desgracia, los datos que muestran el grado de desdiferenciación de los tumores analizados en distintos conjuntos de datos
Un
,
B, y
C
no estaban presentes en las bases de datos, y por lo tanto que podríamos no inferir si existe una relación entre el grado de desdiferenciación del tumor y su caída en la especialización. Sin embargo, la hipótesis de que esta relación existe probablemente, ya que el grado de desdiferenciación del tumor parece estar relacionada con la expresión de los conjuntos de genes que están enriquecidos en los CES [13].
Se analizó una biblioteca de células madre hematopoyéticas como parte del conjunto de datos
B Opiniones. Esta biblioteca se realizó a partir de células madre purificadas-FACS, hematopoyéticas obtenidas de la médula ósea y representa células que pueden diferenciarse en células mielomonocítica, células B, o células T. En contraste con los CES de la figura 1, estas células se originaron a partir de un órgano adulto especializada. Como se muestra en la Figura 1B, las CMH tienen un nivel de especialización estimado comparable a la de pulmón normal y superior a la de la piel normal. Esto indica que los tipos de células relativamente indiferenciadas pueden presentar una relativamente alta especialización del transcriptoma. Nuestra conclusión es apoyada también por el análisis del transcriptoma de los tejidos linfáticos (ganglios normales y Lymphr; Figura 1A).
Proponemos que el estado físico de una célula precancerosa, en el contexto de un tumor, se producirá un aumento Si los genes relacionados con la función original del tejido parental se desconectan, porque este conjunto altamente expresado y específica de genes representa un alto costo en energía y recursos que sería desventajoso en el contexto del tumor. Nuestra hipótesis sugiere que si la expresión de estos genes altamente expresados y específicos se reduce o se apaga, se debe observar a continuación, una disminución en la especialización de los tejidos. La disección de la reducción de la especialización a través del análisis de los componentes genéticos individuales proporcionará una mejor comprensión de la carcinogénesis. Por otra parte, si la caída de la expresión de al menos algunos de estos genes precede a cambios morfológicos en las células pre-cancerosas, la caída podría ser explotada para propone diagnóstico. Nuestra hipótesis no se contradice con la observación de desdiferenciación en tejidos de cáncer, sino que es paralelo a este hallazgo:. Tejidos con un mayor fenotipo indiferenciado expresarán un transcriptoma menos especializado
El análisis del conjunto de datos
C
se realizó en loci que fueron agrupados por cromosomas a partir de una mezcla heterogénea de tejidos clasificadas sólo como "normal" o "tumor". Por lo tanto, la especificidad de los loci solamente se estima con respecto a este criterio y no con respecto al órgano de origen como en los conjuntos de datos
A
y
B.
Como consecuencia, la especialización estima para los tejidos "tumor" "normal" y es mucho menor que el rango de especialización estimada en que el órgano de origen se tiene en cuenta (comparar las figuras 1 y 2). A pesar de las diferencias más pequeñas en la especialización entre los tejidos normales y cancerosos en el conjunto de datos
C
, los datos son estadísticamente significativos para todos los cromosomas (excepto para el cromosoma Y) y todos los casos, excepto en el cromosoma 18, indican que una caída en la especialización se produce en los tumores (Tabla S8). Curiosamente, el cromosoma 18 contiene los genes supresores de tumores, incluyendo varios
DDC
,
DPC4, España y
JV18-1 /MADR2
[22], y por lo tanto la alta expresión de estos genes podría conducir al aumento observado en la especialización (véase el cuadro S15). Tomados en conjunto, estos datos sirven una confirmación independiente de la hipótesis de que la especialización transcriptoma disminuye en los tumores. Nuestra predicción es que una mayor comprensión de los mecanismos responsables de la caída de la especialización que se produce en los tumores mediante una mejor caracterización de los perfiles de transcriptoma del cáncer conducirá al desarrollo de nuevas herramientas de diagnóstico y técnicas de intervención molecular.
A partir del análisis de luces agrupadas tejidos normales y cancerosos en el conjunto de datos
un
( "agrupación completa"; ver Métodos) que detectan 14.573 genes (52%) de un total de 28,087 genes que se han representado en los tejidos normales o cancerosas, ya sea solamente (estimado de genes especificidad
S
i
= 1). De estos genes con la máxima especificidad, 6220 (43%) se detectó exclusivamente en el cáncer y los restantes 8.353 (57%) fueron detectados exclusivamente en los tejidos normales. Nuestras observaciones de que los genes particulares se encuentran en sólo un grupo específico (tejidos normales o cancerosas) dependían del tamaño de la muestra y por lo tanto requieren análisis estadísticos para determinar la significación. La prueba exacta de Fisher con la corrección de Bonferroni (ver Métodos) llegó a la conclusión de que sólo 17 de los genes que se detectaron exclusivamente en los tejidos cancerosos fueron upregulated significativamente. Estos genes se presentan en la Tabla 1. Tabla S17 presenta las clasificaciones de ontología de genes de los genes que se presentan en la Tabla 1.
Si los índices de teoría de la información son eficaces en la identificación de genes regulados positivamente en el cáncer, se debe también detectar los genes que previamente se ha informado que se asocia con el cáncer. Este fue el caso, ya que la lista de genes detectados exclusivamente en el cáncer (Tabla 1), incluyendo
TRAF7
,
PRPS1
,
CDT1, España y
ZWINT , España fueron reportados previamente como genes marcadores de cáncer [23], [24], [25], [26]. Más importante aún, este enfoque cuantitativo identifica genes potencialmente implicados en el cáncer que no han sido previamente identificados, como
KLHL21
,
KIFC1
, y
XAB2 gratis (Tabla 1). Una descripción de los genes enumerados en la Tabla 1 se presenta en apoyo de texto S1.
Se encontró que los genes enumerados en la Tabla 2 para estar presentes en sólo un tipo de cáncer a los niveles significativamente altos de expresión (análisis agrupado, el conjunto de datos
Un
) y ejemplificar las ricas posibilidades de la minería de datos utilizando especificidad (
S
i
) y apuntar a la especificidad (
TS
ij
) del gen expresión. Entre estos genes, encontramos ejemplos de marcadores de cáncer (
MLANA) gratis (también indicados en la Tabla 1), descrito recientemente un oncogén (
OTX2
) [27], y un gen utilizado como una