Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: inferir el orden temporal de cáncer mutaciones genéticas en el tumor individual Samples

PLOS ONE: inferir el orden temporal de cáncer mutaciones genéticas en el tumor individual Samples


Extracto

El orden temporal de las mutaciones del gen del cáncer en los tumores es esencial para la comprensión y el tratamiento de la enfermedad. Los métodos existentes no son capaces de inferir el orden de las mutaciones que se han identificado, al mismo tiempo en muestras de tumores individuales, dejando la heterogeneidad de la desconocido orden. Aquí, se muestra que a través de un enfoque basado en la compleja red, que se basa en la estadística que acaba de definir -
carcinogénesis información conductividad gratis (CIC), el orden temporal en muestras individuales se puede inferir de manera efectiva. Los resultados sugieren que los genes supresores de tumores con mayor frecuencia pueden iniciar el fin de mutaciones que los oncogenes, y cada tipo de cáncer podrían tener su propio orden única de mutaciones. Las mutaciones iniciales parecen estar dedicado a la adquisición de la función de evadir la apoptosis, y algunas restricciones de orden podrían reflejar regularidades potenciales. Nuestro enfoque está totalmente impulsada por los datos sin ningún tipo de ajustes de parámetros y se puede esperar para ser más eficaces a medida que más datos estarán disponibles

Visto:. Guo J, H Guo, Wang Z (2014) Deducir el orden temporal de cáncer de mutaciones genéticas en muestras de tumores individuales. PLoS ONE 9 (2): e89244. doi: 10.1371 /journal.pone.0089244

Editor: Raya Khanin, Memorial Sloan Kettering Cancer Center, Estados Unidos de América

Recibido: 22 Octubre, 2013; Aceptado: 20 de enero de 2014; Publicado: 27 Febrero 2014

Derechos de Autor © 2014 Guo et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Ciencias Naturales Fundación de China bajo ninguna concesión. 61273217; programa chino 111 de 'avanzada Inteligencia y Servicio de red' en virtud de concesión no. B08004. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:. Zhanyi Wang es con el instituto de investigación móvil de China, pero esto no altera los autores adhesión a todas las políticas de PLoS ONE sobre los datos y compartir materiales.

Introducción

el cáncer es una enfermedad genética causada por la mutación de los genes del cáncer que consisten en oncogenes y genes supresores de tumores. En la mayoría de casos de cáncer, múltiples mutaciones se producen en un procedimiento conocido como la progresión del tumor [1], [2]. Para entender la progresión del tumor, los estudios se han realizado para modelar regularidades generales en el orden temporal de las mutaciones para un tipo dado de cáncer utilizando tanto los enfoques experimentales y computacionales [3] - [7]. Como modelo canónico, el orden de las mutaciones para el cáncer colorrectal fue reconstruido a través de tamaño y grado del tumor [8]. Los últimos modelos computacionales infieren las limitaciones orden temporal típicos para cierto tipo de cánceres mediante la simulación de la progresión del tumor como un proceso estocástico [9] - [11]. A pesar de este progreso, todavía hay método bien definido para inferir el orden de mutaciones identificadas en el mismo tiempo en muestras individuales, aunque es necesaria esta inferencia para revelar la heterogeneidad de la orden de mutaciones en un cáncer. Recientemente, como nueva generación de secuenciación se convierte aplica ampliamente, los paisajes de mutación en varios tipos de cáncer están siendo revelados uno por uno. Los resultados han demostrado que las mutaciones en un cáncer con frecuencia demuestran correlaciones estadísticas entre sí o incluso causar-efecto de la inducción vínculos entre el primero y el segundo [12] - [18]. Sin embargo, estas correlaciones /vínculos no han sido plenamente explotado en inferir el orden temporal de las mutaciones
.
Desde el punto de vista informático, este estudio define una medición estadística para asignar valor a las correlaciones o ejes mencionados, y el modelo de las mutaciones dentro de una red compleja, a través del cual el orden temporal de las mutaciones en las muestras individuales se puede inferir. Llamamos a la medición de la
carcinogénesis información conductividad
(CIC), que mide la alcanzabilidad de transferir la información de un gen del cáncer de haber mutado en el proceso de la transcripción de un gen de cáncer de un-mutado dado para inducir su mutación. Estadísticamente, la accesibilidad puede ser estimado por las frecuencias de ocurrencia individuales y la frecuencia de co-ocurrencia secuencial de mutaciones de los dos genes 'en las muestras de cáncer. Además, la competencia entre la información enviada desde múltiples genes mutados al gen de un-mutado dado también debe considerarse como cualquier envío de éxito hará que el gen diana para mutar, terminando así el proceso de mutación. En este estudio, que llamamos dos mutaciones encontradas en las mismas muestras de cáncer mutaciones co-ocurrentes. Aunque la mayoría de los estudios genómicos proporcionan esta cantidad de forma indirecta, aquí tenemos como objetivo desentrañar la secuencia de aparición de dos eventos de mutación de la simple co-ocurrencia. A partir de estas secuencias de ocurrencia de mutación, la frecuencia de co-ocurrencia secuencial se puede calcular (Materiales y Métodos). Sobre la base de esta idea, hemos definido el CIC del gen del cáncer de
i
a gen del cáncer de
j
como: (1) donde () es la frecuencia de aparición de la mutación del gen
i
(
j
) en los cánceres, es la frecuencia de co-ocurrencia secuencial de la mutación del gen
I
seguido por la mutación del gen
j
, y es la prioridad del gen
I
en comparación con otros genes mutantes para enviar la información al gen
j
. Hemos determinado que. En esta ecuación es el conjunto de muestras de cáncer con genes mutantes
i
y
j
, es el número de muestras en el conjunto, y es un indicador de que la función es igual a 1 si los genes mutantes ,
j
y
i Hoteles en la muestra. De lo contrario, es igual a 0. En consecuencia, se le asignará la más alta prioridad de uno si es más grande que en todas las muestras del conjunto, y cuantas más veces mayor que el valor, mayor es el. Consideramos que la fórmula (1) como una medición de la conductividad información carcinogénesis porque la relación es una estimación de la máxima probabilidad de que el gen
i
envía información carcinogénesis a gen
j
y hace que su mutación, la relación es una estimación de la máxima probabilidad de que la mutación del gen
j
es causada por la información recibida de la carcinogénesis gen
i
, y es la prioridad del enlace de comunicación en comparación con otros enlaces a gen
j
. El valor de los rangos de 0 a 1. Al igual que la definición de
fuerza de activación
, una medida que previamente propuestos para la ponderación de los enlaces de redes complejas [19], la definición de CIC sigue la fórmula de la gravedad si imaginamos las proporciones y como masas y la prioridad como la distancia. Estadísticas definidas de esta manera son propensos a distribuir sus valores en una ley de potencia, que es conveniente para el análisis de redes complejas de relaciones intrincadas incluidas las de la biología [20] - [24]

Uno de los retos en el cálculo de los CIC. es la falta de muestras de cáncer que puede ser usado como la fuente de las frecuencias secuenciales de co-ocurrencia de las mutaciones del gen de cáncer debido a que las mutaciones de diferentes genes en una muestra de cáncer se identifican generalmente al mismo tiempo por secuenciación. Para hacer frente a este reto, se presenta un procedimiento iterativo que las parejas CIC cálculo y la inferencia de la probabilidad de cada pedido potencial de mutación génica del cáncer. La aplicación de este procedimiento para el Catálogo de mutaciones somáticas en el Cáncer (cósmica) base de datos [25], [26] reveló que la iteración alcanza la convergencia dentro de menos de 10 vueltas, y los resultados convergentes sugieren conclusiones significativas.

materiales y Métodos

inferencia iterativo esquema

Para llevar a cabo el procedimiento de inferencia iterativo, una amplia serie de muestras de cáncer con mutaciones en el gen del cáncer identificados por secuenciación de todo el genoma es necesario. Con el conjunto de datos, determinamos las estadísticas básicas de ocurrencia y no secuencial de co-ocurrencia frecuencias de mutaciones genéticas del cáncer. A partir de estas estadísticas básicas, la inferencia iterativo para el número de muestras en cuestión comienza y los resultados de la CIC y órdenes probables de la mutación del gen de cáncer para cada muestra en cuestión se determina cuando la iteración alcanza la convergencia. Higo. 1 ilustra una visión general del procedimiento.

(a) Las frecuencias de ocurrencia y co-ocurrencia de las mutaciones del gen de cáncer y se determinan a partir de muestras disponibles, dónde, y es el número de los genes del cáncer apuntado en el estudio . Una ocurrencia de un gen se contará si está mutado en una de las muestras, y un co-ocurrencia de un par de genes se contará si ambos están mutados en una de las muestras; Por lo tanto, y. (B) Con base en el principio de máxima entropía, los valores iniciales de las frecuencias de co-ocurrencia secuenciales se establecen como. (C) Las conductividades de información de carcinogénesis, se calculan a partir del vector de la matriz y de. Debe tenerse en cuenta que podría no ser igual a, lo que implica que la matriz de representa una red dirigida. (D) Para cada una de las muestras de que se trate, las probabilidades de cada posible orden de los genes mutantes en la muestra se calcula de acuerdo con los CIC de cada orden (Métodos). (E) La matriz de que se vuelven a determinar la matriz de y la relación del número de la probabilidad ponderada de las órdenes indicó que
i
ocurre antes de
j
al número de la frecuencia de co-ocurrencia , es importante tener en cuenta que no es igual a en general. Si la matriz de no ha alcanzado el criterio de convergencia, las órdenes inferidos no serán considerados como estable y un nuevo bucle de cálculo de y se llevarán a cabo. De lo contrario (f), las órdenes con una probabilidad mayor que el azar y las probabilidades correspondientes y son considerados como los resultados mencionados. Por ejemplo, de los 6 órdenes posibles para una muestra con tres genes del cáncer mutantes
a
,
b
y
c
, órdenes y son identificados como los más probables debido a probabilidades de 0,7 y 0,2 (mayor que una posibilidad aleatoria de 1/6).

procedimiento iterativo de cómputo CIC y la inferencia de orden mutación

Por definición, las frecuencias de co-ocurrencia secuencial son necesarias para estimar el valor CIC. Sin embargo, este requisito no puede ser satisfecha por las bases de datos actuales, incluyendo cósmico. Para superar esta dificultad, se adopta un procedimiento iterativo para acoplar la inferencia de las órdenes de mutación que se produce y el cálculo de los CIC. En primer lugar, nos dividimos uniformemente una frecuencia de co-ocurrencia no secuencial en las dos frecuencias posibles secuencial de co-ocurrencia para calcular los CIC iniciales. a continuación, inferimos las órdenes de mutación con los CIC iniciales para repredict las frecuencias de co-ocurrencia secuenciales, repetir CIC cálculo y la inferencia de las órdenes de mutación hasta que se obtiene un resultado convergente.

Con base en el principio de máxima entropía, nos primero utilice una distribución uniforme antes de las órdenes de ocurrencia, lo que significa que para la frecuencia de co-ocurrencia no secuencial de la mutación de dos genes
i
y
j
, las dos órdenes de mutación
i

j
y
j

I
ocurren con la misma probabilidad. Por lo tanto, la frecuencia de co-ocurrencia secuencial necesario se establece como un medio de la frecuencia no secuencial correspondiente. Con este ajuste, se calcula el CIC inicial entre cada par de genes del cáncer.

A continuación, calcular el CIC que una orden de más de dos genes mutantes posee. En este cálculo, debemos tener en cuenta que cada uno de los genes anteriores puede enviar la información de la carcinogénesis en paralelo a un gen diana dentro de la orden. Por lo tanto, tomamos prestado el principio de cálculo de la resistencia en un circuito, que es un paralelo by-serie procedimiento; sumamos todos los CIC paralelas de los anteriores genes a un gen diana en el fin de determinar el
fase CIC Red de la orden y luego formulamos la
Para CIC
en cascada toda la
fase CIC
s. Considere la orden
APC → → ATM KRAS
como un ejemplo; Esta orden contiene dos fases de la información que envían,
→ ATM
y
→ KRAS
. Durante la primera fase, la información se puede enviar de una sola fuente,
APC
. Por lo tanto ,, el CIC de
APC
a
ATM
, simplemente se convierte en el CIC de la primera fase. En la segunda fase, sin embargo, tanto
APC
y
ATM
puede convertirse en la fuente de información, lo que requiere la suma de las dos CIC paralelas como el CIC de la segunda fase. Después de la etapa paralela de cada fase, los recíprocos de
fase CIC
s, consideradas como resistencias, se suman en serie como el inverso de la
Para CIC
. Los pasos se resumen de la siguiente manera:


paso paralelo
:

Serie paso
:.

El
k
ª gen en el orden es la información que recibe de genes en el
(k-1)
ª fase y tiene
k-1 | remitentes de información paralela. Una orden que consiste en
n
genes tiene
n-1
fases de conducción información carcinogénesis. En general, tenemos la ecuación, ¿dónde está el CIC de fase
k
, es el CIC de un gen a gen, y es el índice del gen en la posición en el orden
.
Based en la definición de la CIC, un valor mayor CIC de un posible pedido implica la conducción de la información carcinogénesis más fácil dentro de la orden. Entre todas las órdenes de la competencia, cuanto mayor sea el valor de CIC de un pedido, la mayor probabilidad de la aparición de la orden. Por lo tanto, suponemos que el CIC de una orden es positiva proporcional a la probabilidad de que se produzca ese orden. Al estimar la probabilidad de cada orden potencial por una aplicación lineal de los CIC de todos los órdenes posibles para un determinado conjunto de genes mutantes, la suma de las probabilidades de todos los órdenes posibles es igual a uno. Formalmente, para una muestra con
n
genes del cáncer de mutantes, el número de órdenes posibles es
n
!; analizamos los CIC de orden
m gratis (
m
= 1, 2, ...,
n
!) en su probabilidad usando la ecuación

Después determinar las probabilidades de cada posible orden de las mutaciones, que vuelve a determinar las frecuencias de co-ocurrencia secuenciales predichos de la siguiente manera: ¿dónde está la probabilidad de orden
m Red de muestra de
l
, y
L
es el número de muestras en cuestión. es una función indicadora que es igual a 1 cuando se produce gen
i
antes gen
j
con el fin
m Red de muestra de
l
y es igual a 0 en todos los demás casos, y es la frecuencia de co-ocurrencia no secuencial entre el gen
i
y el gen
j
. Si vuelven a determinar los valores son casi idénticos a los ancianos o convergente, convertido en los CIC calculadas y por lo tanto las probabilidades de orden inferidos pueden ser considerados como resultados fiables. De lo contrario, los CIC y las probabilidades de orden tienen que volverse a determinar en un nuevo bucle. El procedimiento iterativo continúa de esta manera hasta que se alcanza la convergencia. En la práctica, el criterio de convergencia se puede considerar que concurre cuando la diferencia absoluta entre los nuevos y viejos valores de forma monótona reduce a un valor suficientemente pequeño.

Debido a que comenzamos el procedimiento iterativo con una predicción inicial de la secuencia frecuencias de co-ocurrencia de frecuencias no secuenciales basadas en el principio de máxima entropía, que proporciona el máximo potencial de modificación de las frecuencias de co-ocurrencia secuenciales en la primera iteración, la modificación disminuirán gradualmente y finalmente convertido en insignificante. Esta premisa fue verificado en el estudio; una convergencia satisfactoria se alcanzó en menos de 10 bucles del procedimiento de inferencia utilizando un conjunto de muestras de la base de datos cósmicos.

La iteración basado en los datos COSMIC alcanza la convergencia dentro de 10 vueltas. Aquí, nosotros usamos el cálculo del CIC de
KRAS
a
APC
para introducir el procedimiento en detalle. Inicialmente, calculamos las frecuencias de ocurrencia de = 125 y = 209 y una frecuencia de co-ocurrencia no secuencial = 79 de la base de datos cósmicos. Mediante la definición de la mitad de la frecuencia de co-ocurrencia no secuencial (79) como la frecuencia secuencial, determinamos que = 39,5. Cuando se compara con las frecuencias de co-ocurrencia secuencial de genes distintos de
KRAS
al gen
APC
en cada una de las 79 muestras, se encontró que tenía una orden promedio de 1.47. Por lo tanto la prioridad = 1,47, y el valor inicial de = (39,5 /125) * (39,5 /209) /1.47
2 = 0,028.

Uso de los CIC iniciales entre todos los pares de genes del cáncer, calculamos la probabilidad de cada pedido potencial mutación ocurrencia en cada muestra de la manera descrita anteriormente. De acuerdo con las probabilidades, las frecuencias de co-ocurrencia no secuenciales pueden ser divididos de manera desigual en frecuencias secuenciales. Para las 79 muestras en este ejemplo, la relación de
KRAS

APC
vs
APC

KRAS
basado en la probabilidad total correspondiente para cada pedido es de 0,28: 0,72. Por lo tanto, actualizamos el valor de = 79 * 0,28 = 22,1, y la prioridad entonces se determina con la nueva. Con estos nuevos valores, se vuelve a determinar.

La convergencia de su contraparte y durante las iteraciones se muestran en la Fig. 2. Este ejemplo demuestra que los valores alcanzan una convergencia satisfactoria después de sólo 6 iteraciones. Este ejemplo también representa la situación común, por lo tanto terminamos el cómputo de los AIC después de 10 iteraciones en este estudio.

Los CICs de (a) y su contraparte (b) alcanzar rápidamente convergente como se realizan las iteraciones de cálculo . Después de 6 iteraciones, una convergencia satisfactoria se ha alcanzado.

La complejidad del procedimiento de inferencia

CIC cómputo tiene una complejidad de
O gratis (
n

2) si el número de genes del cáncer en el estudio es
n
, y la inferencia de las probabilidades de todos los órdenes posibles para una muestra con
m
genes del cáncer mutante tiene una complejidad de
O gratis (
m! m

2). En nuestro estudio,
n
es igual a 397 y
m
varía de 2 a 8. Por lo tanto, la complejidad de
O gratis (
m! M

2) puede ser muy diferente para diferentes muestras. En realidad, durante la inferencia de las 1.118 muestras reportados en el estudio, la mayoría de las veces fue consumido por un par de muestras con el número máximo de genes de cáncer de mutantes. Vale la pena señalar que durante todo el procedimiento, sólo tenemos que calcular los CIC una vez en cada bucle para inferir las probabilidades de orden para todas las muestras. El procedimiento de inferencia con 10 iteraciones para las 1.118 muestras se completó en 10 minutos sobre una plataforma que consta de un PC (4 * 2,66 GHz Quad CPU) y Matlab.

Estudio de datos

Los resultados reportados en este estudio se obtuvieron de una base de datos COSMIC reciente (emitido el 12 de septiembre
ª, 2012) en la codificación de las mutaciones puntuales. Es un archivo de tabla que contiene los nombres de los genes del cáncer mutados en el cáncer de cada muestra. genes mutantes en el mismo tipo de cáncer tienen el mismo ID de tumores (
ID_tumour
), y los campos de
-genoma de pantalla ancha
y
lado primario
proporcionar la información necesaria utilizados en este estudio.

Pasos para determinar las frecuencias de ocurrencia y co-ocurrencia de mutaciones en el gen del cáncer en las muestras

las frecuencias de ocurrencia y co-ocurrencia de los genes del cáncer en las muestras de cáncer se utilizaron para estimar los CIC en el estudio, y las estadísticas básicas se determinaron utilizando los siguientes pasos:

Descargar el
fuente
archivo
CosmicMutantExport_v61_120912.tsv
través de ftp: //ftp. sanger.ac.uk/pub/CGP/cosmic/data_export/;

Hacer una

archivo temporal mediante la obtención de los registros con el valor '
y
' en el '
campo genoma de pantalla ancha de búsqueda: 'desde el
archivo de origen
;

Haga a
primaria archivo de fotos: por la obtención de los registros de cáncer de genes definidos por el archivo
Table_1_full_2012-03-15.xls
en el

sitio de red cósmica de la

archivo temporal, y el perfeccionamiento de los registros en secuencias de
Gene_name Opiniones y
ID_Sample
;

Hacer una
mutation_sequence
archivo en el que cada registro es una lista de los genes mutados en la misma muestra basada en el
archivo
primaria y descartar el registro que contiene un único gen nombre en el
mutation_sequence
archivo;

Cuenta las frecuencias de ocurrencia y co-ocurrencia de los genes del cáncer basado en la
mutation_sequence
archivo.


> Características de los CIC estimados

Se realizó la inferencia en los datos de la mutación del gen de cáncer de todo el genoma escaneados muestras recogidas en una versión reciente de la base de datos cósmicos. Un total de 1.212 muestras que albergan 6.281 mutaciones en 397 genes del cáncer estaba disponible para determinar la ocurrencia y co-ocurrencia frecuencias básicas. De estos, 1.118 muestras, cada una albergar no más de 8 genes del cáncer de mutantes, se utilizaron en el procedimiento iterativo de cálculo y la inferencia CIC orden. Tabla S1 se enumeran las 1.118 muestras. Se encontró que los resultados a converger en 10 iteraciones. Después de la convergencia, CICs con un valor mayor que 1.0E-6 presenta una distribución de ley-como poder sobre las magnitudes, de manera que la inmensa mayoría tiene una magnitud menor que la media de 4.0E-4 y una porción muy pequeña tiene una más grande que magnitud media (Fig. 3, el cuadro S2). Esta característica también es cierto para la distribución de las magnitudes de los CIC desde (o hacia) un gen dado en la mayoría de los casos, lo que significa que sólo un pequeño número de socios son significativos en cuanto a la conducción de la carcinogénesis información para un determinado gen. En otras palabras, los CIC identifican los socios más cercanos en la conducción de la información carcinogénesis. Por otra parte, las redes de genes del cáncer dirigidos unidos por los CIC eran asimétricos y pequeño mundo-similares. La CIC del gen
i
al gen
j
era generalmente desigual a los que a partir de genes
j
al gen
i
; la red tiene un número de genes de cubo con muchas más conexiones que normal. Esta característica es consistente con la noción de que la red de señalización en el cáncer es análoga a la Internet, que construye un pequeño mundo con nodos de buje [27] - [29]. Higo. 4 ilustra un CIC vinculado a la red que cubre 44 genes del cáncer, incluyendo los genes hub
APC
,
TP53
y
MLL3
, y los enlaces más fuertes que 1,0E-2, que muestra la asimetría . La asimetría de la AIC implica la existencia de una preferencia por ciertos órdenes de mutación. Además, los tres genes de cubo son todos los genes supresores de tumores, y el vínculo más fuerte dirigida, con un valor de 0,136, es de
APC
a
KRAS
, uno de los oncogenes más frecuentemente mutado , lo que sugiere un canal de información superior de la mutación de
APC
a la mutación de
KRAS
.

los AIC superiores a 1,0E-6 están presentes en una potencia similar a la ley distribución; específicamente, el logaritmo del número de los CIC frente al logaritmo de sus órdenes de magnitud se obtiene una relación lineal a trozos. Sobre la base de la cuestión de si una distribución de ley de potencia es adecuada para el análisis de redes complejas y las preocupaciones acerca de la falta de fiabilidad de los CIC infravaloradas que puedan ser causados ​​por piezas de los datos, sólo los CIC mayor que 1,0 E-6 se utilizaron directamente en la inferencia en este estudio . Los AIC inferidos como menos de 1,0 E-6 fueron reemplazados por el umbral para el alisado.

se ilustran Cuarenta y cuatro genes del cáncer mutados con frecuencia (en más de 20 muestras en todo el genoma escaneados en la base de datos cósmica) con los CIC entre ellas mayores de 1.0E-2. El espesor de la relación es proporcional a la fuerza de la correspondiente CIC. Cuando un par de genes tiene enlaces bidireccionales, el vínculo más fuerte se dibuja como una línea recta y el más débil se dibuja como una línea curva (véase el caso de
APC
← →
TP53
) . La asimetría se puede observar por el hecho de que no existen enlaces bidireccionales de fortalezas similares entre pares de genes, y
APC
,
TP53
, y
MLL3
cada uno un papel concentrador en la red.

la inferencia de las órdenes probables

las órdenes de mutación inferidos con una probabilidad mayor que el azar, nos referiremos en adelante como
órdenes probables
, siempre más ideas concretas en la progresión tumoral. Se analizaron las órdenes probables inferidos de las 1.118 muestras de cáncer de que se trata de investigar un máximo de 8 pasos de mutación de iniciación. Los sitios primarios de las muestras se encuentran principalmente en el
ovario gratis (256),
large_intestine gratis (
LI
, 180),
haematopoietic_and_lymphoid_tissue gratis (
Equipo de Alto Nivel
, 148),
de próstata gratis (100),
mama gratis (97),
central_nervous_system gratis (
SNC
, 86) y
upper_aerodigestive_tract gratis (
UAT
, 72).

Tabla S3 enumera todos los órdenes posibles y sus probabilidades en las muestras analizadas, y en la Tabla 1 muestra una selección de los mismos . Basado en las órdenes probables, llegamos a la conclusión de que en una muestra dada sólo una pequeña parte de todos los órdenes posibles tiene una probabilidad mayor que el azar, y la suma total de las probabilidades de esas órdenes está cerca del número de muestras con una relación de de 1034,4 /1118. Esto indica que la inferencia identificó una pequeña parte de todos los órdenes posibles permutados por el conjunto dado de genes de cáncer de mutantes como las órdenes probables. Para una muestra que alberga dos genes de cáncer de mutantes, la inferencia siempre sugiere fuertemente una de las dos órdenes posibles. Sin embargo, para las muestras con más de dos genes de cáncer de mutantes, algunas órdenes pueden tener probabilidades altas comparables. Aunque no podemos juzgar las verosimilitudes individuales de las órdenes probables inferidos a causa de la falta de veracidad terreno para las órdenes en la mayoría de los casos, su significado podría ser fuertemente sugerido por la evaluación de la inferencia con muestras de un cierto tipo de cáncer que han sido bien estudiados en términos de orden. Por ejemplo,
APC, KRAS y TP53 ¿Cuáles son los tres genes más frecuentemente mutados en cánceres de colon, y sus órdenes de mutación han sido bien modelada [30], [31]. En nuestros resultados, la muestra con los genes del cáncer mutantes
APC
y
KRAS
, arrojó una probabilidad inferido de 0,95 para la orden
APC

KRAS
, lo que era coherente con los estudios anteriores. Para la muestra con el mutante
APC, KRAS y TP53
genes del cáncer, tres órdenes probables de
APC → → KRAS TP53 gratis (0,33),
APC → → TP53 KRAS gratis ( 0,32)
y TP53 → → APC KRAS gratis (0.19) se infiere de los 6 posibles, y este resultado también fue consistente con estudios previos.
BRCA1
mutaciones germinales confieren un alto riesgo de cáncer de mama y de ovario, pero la pérdida somática de la naturaleza de tipo
BRCA1
alelo se ha demostrado que se producen por lo general
después de la mutación de

TP53
[32]. De acuerdo con esta observación, inferimos la orden de mutación somática
TP53 → BRCA1
con una probabilidad superior a 0,99. Estos ejemplos proporcionan evidencia para apoyar la validez de inferencia.

Los iniciadores de órdenes de mutación probables

La identificación de los iniciadores de órdenes de mutación ha sido considerado como uno de los principales retos en el estudio de los tumores progresión [1]. Nuestros pedidos probables inferidos de mutación proporcionan consejos informativos para resolver este desafío. Mediante el examen de los genes que inician las órdenes probables, se encontró que los iniciadores fueron dominados por los genes supresores de tumores. Una abrumadora mayoría (más del 77,5%) del número de la probabilidad ponderada de las órdenes probables se dedujo que ser iniciado por un gen supresor de tumor en lugar de un oncogén. Había 368 genes del cáncer en las muestras de cáncer de prueba, entre ellos solamente 92 fueron supresores de tumores. Más específicamente, hubo 1.858 mutaciones de los supresores de tumores entre totalmente 3.823 mutaciones de todos los genes del cáncer. Por lo tanto la posibilidad de la media para los supresores de tumores para iniciar las órdenes de mutación fue del 48,6% (1858/3823). Esto demuestra que el predominio de los supresores de tumores en la iniciación de las órdenes de mutación no podía atribuirse a la casualidad. Además, las proporciones de la cantidad de veces que un gen fue el iniciador a su frecuencia de mutación era en general diferente, lo que implica que no es seguro que los genes mutados frecuentemente se mutar temprana (Tabla 2). De manera significativa, el número de la probabilidad ponderada de las órdenes probables iniciadas por los dos primeros iniciadores del gen supresor de tumores
TP53
y
APC
, consistió en porcentajes tan grandes como el 46,9% y 11,4%, respectivamente . Por el contrario, los dos principales iniciadores de oncogenes,
PIK3CA
y
KRAS
, se encontraron en porcentajes tan pequeños como 3,1% y 1,3%, respectivamente. Los iniciadores superiores de la mutación en los respectivos sitios de cáncer primario sugirieron más detalles (Tabla 3). En general, todos los cánceres en los principales sitios primarios de las muestras revelaron un gen supresor de tumores como su principal iniciador. En particular,
TP53
era un iniciador de la parte superior común en cuatro de los tipos de cáncer anteriormente mencionados,

ovario,
UAT
,

pecho y
próstata
, con porcentajes de 91,5%, 73,4%, 57,6% y 30,4%, respectivamente. En
LI
cánceres, el iniciador de la parte superior fue
APC gratis (57,5%), seguido por
TP53 gratis (29,7%). Tanto
SNC
y
Equipo de Alto Nivel
cánceres tenían ninguna iniciadores obviamente superior, con
CIC gratis (13,6%),
PIK3CA gratis (10,1%) y
TP53 gratis (10,0%) fueron las tres principales iniciadores para el primero, y
TP53 gratis (14,9%),
NPM1 gratis (10,4%) y
MLL2
(9,9%) fueron las tres principales iniciadores de este último. Desde el punto de vista de la distribución del iniciador,

ovario,
LI
,
UAT
y
mama
cánceres se infiere a ser dominado por un pequeño número de tumores -suppressor genes, mientras que
Equipo de Alto Nivel
,
SNC
y
próstata
cánceres se infiere tener más diversos iniciadores significativos.

estudios anteriores han sugerido una serie de funciones distintivas que deben ser adquiridos por un cáncer para generar, ayudando a los investigadores a entender la complejidad en la progresión tumoral en una forma de manera lógica, científica [33], [34]. Nuestros resultados inferidos apuntan a una sugerencia de que va un paso más allá. En la mayoría de los cánceres, la función característica adquirida temprana podría ser
evadir la apoptosis
debido a que la mayoría de los primeros genes mutados en cada tipo de cáncer en la Tabla 3 (
TP53, APC, KRAS, PIK3CA, NPM1 Opiniones y
CIC
) se han encontrado para codificar proteínas reguladores de la apoptosis, y la mutación de todos estos genes se ha demostrado que conducen a funciones deficientes de apoptosis. Específicamente, la mutación de
TP53
puede resultar en la eliminación de un componente clave del sensor daño en el ADN, que funciona para inducir la apoptosis [33], [34], las formas mutantes de la proteína APC pueden atenuar las respuestas a los estímulos de apoptosis [35], [36], las mutaciones en
KRAS
y
PIK3CA
pueden activar las vías que transmiten señales de supervivencia anti-apoptóticos [33], y las proteínas codificadas por
NPM1
y
CIC
han demostrado que funcionan en la apoptosis [37], [38].

transiciones informativos en las órdenes probables

las transiciones en la probable órdenes proporcionaron información adicional sobre la progresión del tumor.

El conocimiento de la salud

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]