Extracto
genética de la línea germinal, el género y las vías de señalización hormonales están todos bien modificadores del riesgo de cáncer y la progresión descrita. Aunque una mejor comprensión de cómo la línea germinal variantes genéticas interactúan con otros factores de riesgo de cáncer puede permitir una mejor prevención y tratamiento del cáncer humano, la medición y la cuantificación de estas interacciones es un reto. En otras áreas de investigación, teoría de la información se ha utilizado para describir cuantitativamente las interacciones multivariados similares. Hemos puesto en marcha un novedoso análisis teórico de la información para medir el efecto conjunto de una alta frecuencia variante genética de la línea germinal de la vía supresora de tumores p53 (MDM2 SNP309 T /G) y el género en los fenotipos clínicos del cáncer. Este análisis describe cuantitativamente las interacciones sinérgicas entre el género, el locus MDM2 SNP309, y la edad de inicio de la tumorigénesis en los portadores de mutaciones de p53. Estos resultados ofrecen una base molecular y genética para el dimorfismo sexual observada de riesgo de cáncer en los portadores de mutaciones de p53 y se propone un modelo que sugiere una nueva estrategia para la prevención del cáncer portadores de mutaciones de p53
Visto:. Atwal GS, R Rabadán , Lozano G, LC Strong, Ruijs MWG, Schmidt MK, et al. (2008) un análisis teórico de la información de Genética, sexo y edad en pacientes con cáncer. PLoS ONE 3 (4): e1951. doi: 10.1371 /journal.pone.0001951
Editor: Juha Klefstrom, Universidad de Helsinki, Finlandia
Recibido: 3 de octubre de 2007; Aceptado 26 de febrero de 2008; Publicado: 9 Abril 2008
Derechos de Autor © 2008 Bond et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Apoyo de este trabajo proviene de la Fundación de Investigación del cáncer de mama, la Fundación Simons, la Fundación León Levy y el Instituto Nacional del cáncer francés. También en apoyo de este trabajo proviene de un programa de subsidios del Centro del Cáncer, CA16672, y una subvención del NIH para Louise Strong, CA034936 P01
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
las funciones de estrés p53 vía de respuesta como una vía fundamental supresor de tumores, como se demuestra por la observación de que el gen p53 es uno de los genes más frecuentemente mutados en tumores humanos [1]. Además, ratones y seres humanos que albergan una línea germinal mutación inactivante en un solo alelo del gen p53 desarrollan tumores temprano en la vida y a frecuencias muy altas [2] - [5]. Los seres humanos que albergan una mutación p53 inactivación de la línea germinal constituyen el 50% de los miembros del síndrome de predisposición al cáncer de Li-Fraumeni. La edad de inicio de la formación de tumores en portadores de la mutación p53 humanos se ha demostrado que ser modificado en cuatro estudios independientes por un polimorfismo de un solo nucleótido de alta frecuencia en el promotor del oncogén Mdm2 (MDM2 SNP309, T /G) [6] - [9 ]. El G-alelo de SNP309 aumenta la afinidad de unión de ADN de la Sp1 activador transcripcional, que se traduce en mayores niveles de MDM2 mRNA y proteína en células y tejidos humanos [6], [10] - [12]. Niveles más altos de MDM2 conducen a la atenuación de la vía p53, en concordancia con el papel de la MDM2 como un regulador negativo clave de la p53 [13]. En portadores de mutaciones de p53, se demostró en tres informes independientes que los individuos con el alelo G-SNP309 son diagnosticadas con cáncer en promedio siete a quince años antes que los portadores de la mutación de p53 homocigotos para el alelo T (Tabla 1) [6] - [8]. Se propuso que los altos niveles de MDM2 resultante de la G-alelo de SNP309, junto con el alelo p53 mutante, producen una vía supresor de tumores p53 gravemente debilitado y dan como resultado una mayor tasa de mutación, los procesos de reparación del ADN más pobres, y la apoptosis reduce, dando lugar a la formación de tumores más rápido y más frecuentes [14].
Recientemente, los estudios con los cánceres esporádicos (162 pacientes con linfoma de Ashkenazi judía, 969 de Finlandia y 164 pacientes con cáncer colorrectal italianos, 105 pacientes con sarcoma de Alemania, Noruega 341 no pequeñas pacientes con cáncer de pulmón de células y 658 Ashkenazi pacientes con cáncer de mama judía) han demostrado que los efectos de la G-alelo de MDM2 SNP309 locus en la tumorigénesis pueden ser modificados por dos variables adicionales; a saber, el género y la hormona principalmente femenina específica, el estrógeno [15] - [19]. En concreto, se demostró que el alelo G-MDM2 SNP309 para acelerar la tumorigénesis y aumentar el riesgo de cáncer en las mujeres y no en los hombres para el cáncer colorrectal, linfoma difuso de células B grandes, cáncer de pulmón y para el receptor altamente estrógeno positivo (& gt; 50% de los tumores células), pero no para receptor de estrógeno negativo, carcinoma ductal invasivo de mama [16], [18], [19]. Esto se demostró que resulte en el enriquecimiento de los individuos con el alelo G-en mujeres pre-menopáusicas con estos tipos de cáncer, en comparación con cualquiera de las mujeres post-menopáusicas o los hombres con los mismos tipos de cáncer. Recientemente, Hu et al. proporcionado evidencia de un posible mecanismo molecular de cómo el G-alelo de SNP309 podría acelerar la formación de tumores en esta forma dependiente de la específica de género y el estrógeno, mediante la demostración de que la hormona principalmente femenina específica, el estrógeno, preferentemente estimula la transcripción del gen MDM2 con el alelo G-SNP309 [20].
género Curiosamente, dos estudios independientes han definido también como un factor modificador del riesgo de cáncer en los portadores de mutaciones de p53 [21], [22]. En concreto, los portadores de mutaciones de p53 femeninos, se mostró a estar en mayor riesgo de desarrollar cáncer que sus homólogos masculinos. Por ejemplo, por 20, 30, 40, y 50 años de edad, las mujeres portadoras mostraron respectivos riesgos acumulados de 18%, 49%, 77% y 93% para el desarrollo de una primera cáncer, mientras que los hombres portadores mostraron riesgos de 10% , 21%, 33% y 68% [22]. El aumento del riesgo en mujeres portadoras no podía explicarse por la alta incidencia de cánceres específicos de género, ya que las diferencias se mantuvieron después de la exclusión de los casos de cáncer de mama, ovario y próstata. A pesar de la posible implicación de los estrógenos en el aumento de riesgo de cáncer en mujeres portadoras se discutió, esta hipótesis aún no probado.
Es intrigante hipótesis de que el locus SNP309 podría contribuir al aumento del riesgo de cáncer observada en mujeres portadoras aunque el preferencial estimulación dependiente de estrógenos de la transcripción MDM2 del alelo G-SNP309. Si es verdad, la manipulación de estrógenos podría incorporarse en las estrategias de prevención para los portadores de la mutación de p53 con el alelo G-MDM2 SNP309. Estos pacientes han limitado las estrategias de prevención del cáncer. En este informe, la hipótesis de que la hormona específica principalmente femenina, el estrógeno, podría afectar a la tumorigénesis en los portadores de mutaciones de p53 se prueba a pesar de la exploración de posibles interacciones entre MDM2 SNP309 locus y el género en la incidencia de tumores dependientes de la edad
.
ha aumentado el interés en el desarrollo de herramientas estadísticas para descubrir tales interacciones, ya que entre el genotipo y el género, y su efecto sobre fenotipos complejos, tales como la incidencia de tumores dependientes de la edad. Los recientes métodos, tanto paramétricos y no paramétricos, incluyen redes neuronales [23], los métodos de particionamiento recursivo [24], los métodos de combinatoria [25], la reducción multifactorial-dimensionalidad [26] y multi-locus de regresión [27], [28] . Estos métodos están diseñados para hacer frente a preguntas específicas acerca de la naturaleza de las interacciones multi-locus e invocar diferentes hipótesis sobre el modelo subyacente generación de estos datos. Aquí contamos con un novedoso marco teórico de la información para hacer frente a la cuestión específica de si el género y el locus MDM2 SNP309 interactúan de forma sinérgica o redundante con respecto a la edad de incidencia de tumores en los portadores de mutaciones de p53. Las propiedades óptimas de los términos de teoría de la información en la evaluación de la variabilidad y correlación entre múltiples variables son familiares para las comunidades de aprendizaje automático y estadísticas, pero quizás no muy conocido en los campos de la epidemiología y la estadística médica. Una ventaja adicional en el contexto de este estudio es que los principios de la teoría de la información nos permiten estudiar los fenotipos complejos expresados como números reales (es decir, la edad de aparición de cáncer en comparación con el escenario del caso /control binario) mediante la definición de la partición óptima, o hurgar en la basura, de los datos del fenotipo continuas.
Métodos
p53 mutación transportistas (MD Anderson Cancer Center)
88 individuos que son miembros del síndrome de Li-Fraumeni (LFS) familias (34 en total) con mutaciones de la línea germinal conocidos en un alelo de p53 se genotipo previamente para MDM2 SNP309 [6]. 66 de ellos han sido diagnosticados con al menos un cáncer. De las familias de la EPA incluyen en este estudio, 12 fueron determinadas mediante estudios sistemáticos de sarcoma de tejido blando infantil secuencial (7 familias) y osteosarcoma (5 familias) pacientes. Las familias restantes consistieron en pacientes que se refiere el MD Anderson para la investigación o estudios clínicos con una historia personal o familiar de cáncer de tipo que se encuentra en el LFS. La familia más grande contribuye 14 muestras para este estudio; 16 familias contribuyen a un solo individuo.
p53 mutación transportistas (Red Francesa de LFS)
Sesenta y un transportistas afectados o no afectados mutación en la línea germinal p53, pertenecientes a 41 familias no relacionadas LFS se genotipo previamente para MDM2 SNP309 [7]. Características clínicas de las familias y descripción de las mutaciones estaban disponibles bajo petición. Cuarenta y un portadores de mutaciones de p53 en la línea germinal afectados fueron incorporados en este estudio. La familia más grande contribuye 3 individuos afectados con este estudio; 27 familias que contribuyen a un solo individuo afectado.
p53 mutación transportistas (Dutch /Estudio finlandés)
Ciento ocho pacientes de 87 familias LFS o LFS-como fueron seleccionados previamente para mutaciones de p53 y genotipo para MDM2 SNP309 [8]. Noventa y siete fueron examinados en la Clínica de Cáncer Familiar del Instituto del Cáncer de Holanda y 11 en el Hospital Central Universitario de Helsinki. Treinta y seis individuos afectados de 19 familias llevan mutaciones en la línea germinal conocidas en el gen p53 y se incorporaron en este estudio.
Análisis teórico de la información
Dada una variable, por ejemplo
X
, que puede existir en una de
K
X
estados, y su conjunto de probabilidades asociadas {
P (X = x
1), P (X = x
2) ... P (X = x
K)
}, entonces la entropía de Shannon proporciona una medida no paramétrica general de la variabilidad, o el contenido de la información, de
X
. Esta medida de contenido de información es la única cantidad que satisfaga ciertos criterios razonables, tales como
H [X]
debería ser una función creciente de
K
X
si todas las probabilidades son iguales . La entropía conjunta de dos variables medidas en conjunto, por ejemplo
X
y
Y
, también se puede definir apropiadamente, donde
p gratis (
x
i
,
y
j
) es la probabilidad de que los dos eventos
X = x
i
y
y = y
j & co -occurring. Se puede demostrar que la siguiente desigualdad para la entropía conjunta debe aplicar siempre,
H
[
X
,
Y
] ≤
H
[
X
] +
H
[
y
], con igualdad si y sólo si
X
y
y ¿Cuáles son las variables independientes
p gratis (
x
i
,
y
j
) =
p gratis (
x
i
)
p
(
y
j
), es decir, la entropía conjunta será siempre menor que la suma de las entropías individuales si hay alguna dependencia o correlación, entre los dos variables. La medida de la dependencia estadística entre dos variables,
X
y
Y
, está entonces simplemente capturado por la reducción de la entropía total cuando las dos variables se miden juntos, es decir, la información mutua de Shannon. Tenga en cuenta que esto no invoca ninguna de la lineal (de Gauss) supuestos requeridos por otras medidas como la correlación de Pearson. Esta definición también se puede escribir de forma equivalente como
I
[
X
;
Y
] =
H
[
X
] -
H
[
X
∥
Y
] =
H
[
Y
] -
H
[ ,,,0],
Y
∥
X
], donde la entropía condicional
H
[
X
∥
Y
] se define como, por lo es evidente que
I. [X, y]
se puede interpretar como la reducción de la variabilidad de los
X
debido al conocimiento de
y
, y viceversa
el análisis de datos utilizando versiones discretas de expresiones teoría de la información, tal como se definen en el párrafo anterior, requiere la creación de contenedores que discretizar valores continuos. Por ejemplo, el número real que representa la edad de diagnóstico de cáncer tiene que compresión igual en uno de varios grupos, esencialmente una tarea en la compresión de datos. Podemos recurrir a la teoría de la información y tenga en cuenta que la división menos sesgada de cualquier conjunto de datos está dada por el principio de máxima entropía, es decir, la partición en contenedores igualmente pobladas o cuantiles. En este caso, cualquier expresión de información teórica calculada a partir de los datos agrupada tiene la propiedad importante y deseable que no varía en función invertible transformaciones de coordenadas, por ejemplo, multiplicando todas las edades por un factor constante no debe afectar a la información mutua con la variable de SNP. Un problema común con la cuantificación de los números reales en los contenedores es decidir cuántos contenedores a utilizar, y para este fin, un nuevo llamamiento a la teoría de la información. Un criterio sensato se puede extraer de la observación de que si tratamos de medir la información mutua entre las dos distribuciones finito muestreado independientes entonces que emplean demasiados contenedores se sobre-ajuste de los datos, dando lugar a un valor distinto de cero de la información mutua, incluso cuando se extrapola hasta el límite infinito muestra [29]. Por otra parte, la compresión de los datos en muy pocos contenedores de más de-suaviza los datos, y potencialmente pierde estructura importante en estos datos. Por lo tanto debe haber un equilibrio óptimo entre la compresión exceso de montaje y la información. Se determinó que el número óptimo de contenedores en nuestro conjunto de datos eran tres, y para establecer esto, los valores de la información mutua se calcularon primero con los datos mezcladas al azar, para destruir cualquier correlación, y se observó que cuando se aumentó el número de intervalos de tres a cuatro y más alto, los valores de la información mutua extrapolados fue mayor de cero no dentro de las barras de error. De este modo, restringiendo el número de contenedores que implícitamente incorporar una pena dependiente de tamaño de muestra para el exceso de ajuste de los datos. detalles más explícitos en este y otros posibles métodos de estimación de la información mutua se dan en [29], [30]
Información sinérgica
Estos conceptos de la teoría de la información pueden ser extendidas a sondear de forma natural de preguntas dependencias estadísticas entre más de dos variables. En particular, los niveles de sinergia y la redundancia entre tres variables se pueden cuantificar de una manera basada en principios, y recientemente se han formulado en el contexto del análisis de las correlaciones entre las neuronas [29], [30]. Si utilizamos la definición de sinergia entre las dos variables
X, Y
con respecto a una tercera variable
Z
, como la cantidad de información extra
X
y
Y
en conjunto proporcionan sobre
Z
que por
X
y
y
separado, entonces estamos de inmediato llevar a la formulación natural de la información sinérgica como
S ( X, Y; Z) = I (X, Y; Z) -I (X; Z) -I (Y; Z)
dónde. de este modo sinérgico la información revela cómo gran parte de la variabilidad de los
Z
se reduce por tanto saber
X
y
Y
juntos que saber por separado y por lo tanto cuantifica rigurosamente la no efectos independientes de ambos
X
y
y
en
Z
. Esta formulación matemática de la sinergia se puede generalizar naturalmente a más de tres variables.
Análisis estadístico
Se puede no estar claro cómo interpretar con precisión los valores de información teórica determinados a partir de las distribuciones empíricas, especialmente en lo estadístico fluctuaciones crecen con la disminución del tamaño de la muestra. Además, debido a la concavidad de la entropía de Shannon, el muestreo finito induce un sesgo negativo en la entropía empírica y un sesgo positivo en la información mutua empírica [29]. Estos problemas requieren la generación de los valores de p con los valores calculados información teórica contra una hipótesis nula especificada. En el caso de la información mutua, la hipótesis nula es que no existía una dependencia estadística entre una sola variable (ya sea SNP o género) y la edad de diagnóstico, es decir, la probabilidad conjunta es simplemente un producto de los marginales,
p (variable , edad) = p (variable) p (edad)
. En el caso de la información sinérgico, la hipótesis nula es que no existía una correlación entre dos variables y la edad de diagnóstico preservando al mismo tiempo la correlación entre las dos variables, es decir,
p (SNP, sexo, edad) = P (SNP, género) p (edad)
,
p (SNP, edad) = p (SNP) p (edad)
y
p (sexo, edad) = p (género) p (edad)
. Los valores de p se determinaron mediante una prueba de permutación de Monte Carlo. Un número mínimo de 10
se requieren 6 permutaciones para generar una confianza gama intervalo de menos de 0,005 en valor de p de 0,05.
Se empleó una prueba de dos caras de Mann-Whitney para determinar la significación estadística de la diferencia en la edad media de diagnóstico del tumor entre los grupos con y sin el alelo G-SNP309. En sentido estricto, la prueba de Mann-Whitney es una evaluación no paramétrico de si dos conjuntos de datos se obtienen de la misma distribución, pero si los dos conjuntos de datos tienen aproximadamente la misma forma, entonces es justificado para interpretar los resultados de la prueba como una declaración sobre si la mediana en los dos grupos estadísticamente no son diferentes. Se empleó una prueba de permutación para determinar la significación de la diferencia en la edad media de diagnóstico de tumores entre los dos grupos [6]. Tanto la prueba de Kolmogorov-Smirnov y una prueba de Cramer-Smirnov-Von Mises se utilizaron para determinar la significación de la diferencia en la distribución de la edad de diagnóstico entre los grupos con y sin el alelo G-SNP309. Mediante el empleo de todas estas pruebas de significación, muchas de las suposiciones inherentes en ninguno de los ensayos se eliminan.
Resultados
Para probar los efectos de, y las interacciones entre, el género y los alelos en el locus del gen MDM2 SNP309 sobre la tumorigénesis en los portadores de mutaciones de p53, p53 los 144 portadores de la mutación, que se genotipo en el locus MDM2 SNP309 anteriormente [6] - [8], fueron estudiados (Tabla 1). En conjunto, cuando los 144 individuos fueron separados en los diferentes genotipos del locus SNP309, los individuos que llevaban el alelo G-ya sea en el estado homocigoto o heterocigoto (n = 81), mostraron edad promedio un muy significativo 11-año anterior de primera tumor inicio en comparación con los individuos T /T (n = 63) en el genotipo (T /T individuos, la media es de 33 años de edad en comparación con los 22 años de edad en el G /G y T /G individuos, p = 0,0006, Test de Mann Whitney). Un significativo edad media antes de la primera aparición de tumores entre los portadores del alelo G también se observó tanto en hembras y machos. Los hombres que portaban el alelo G-ya sea en el estado homocigoto o heterocigoto (n = 35), reveló que la edad promedio de un significativo 12 años antes de la primera aparición de tumores en comparación con los machos T /T (n = 23) en el genotipo (p = 0,0436 , Mann Whitney). Las mujeres que portaban el alelo G-ya sea en el estado homocigoto o heterocigoto (n = 46), mostraron la edad de un significativo 10 del año anterior promedio de la primera aparición de tumores en comparación con las mujeres T /T (n = 40) en el genotipo (p = 0,0223 , Test de Mann Whitney).
con el fin de comparar directamente la incidencia depende de la edad de cáncer entre hombres y mujeres, los individuos que desarrollaron principalmente los cánceres de mama y cáncer de próstata) específicos de género (se excluyeron de este análisis, dejando STS , osteosarcomas y leucemias como los principales tipos de tumores analizados en ambos sexos (Figura 1A y B). De los restantes 101 individuos, 57 individuos eran hombres y 44 eran mujeres (Tabla 1). La información mutua compartida entre el género, los alelos G y T de MDM2 SNP309 y la edad del primer diagnóstico del tumor se calcularon y los resultados se presentan en la Figura 1C. Como era de esperar a partir de los análisis publicados anteriormente de estas poblaciones [6] - [8], el locus MDM2 SNP309 afecta a la edad de diagnóstico del tumor de una manera significativa, como lo demuestra un nivel significativo de información mutua (0,10 bits de, p = 0,007, Permutación Prueba). A diferencia de lo que se esperaba de las evaluaciones previas del riesgo total de cáncer en los portadores de mutaciones de p53 [21], [22], el sexo por sí solo no mostraron un nivel significativo de información mutua con la edad del primer diagnóstico del tumor (0.002 trozos, p = 0,9, prueba de permutación). De hecho, cuando los 101 individuos fueron separados en los diferentes genotipos del locus SNP309, los individuos que llevaban el alelo G-ya sea en el heterocigoto o estado homocigótico, mostraron una muy significativa de 12 años de edad anteriormente promedio, y la edad de 17 años mediana de inicio primer tumor en comparación con los individuos T /T en el genotipo (T /T individuos, la media es de 30 años de edad, que van de 1 a 71 años, frente a los 18 años de edad en el G /G y los individuos T /G, que van 1 y 59 años, la Figura 1D y en la Tabla 2). La significación estadística de esta edad promedio de 12 años antes, y la edad de 17 años mediana de la aparición del tumor se midió mediante una prueba de permutación y una prueba de Mann-Whitney (ver Materiales y Métodos, p = 0,0008 yp = 0,0015, Tabla 2) . Además, la importancia de la diferencia en las distribuciones de las edades de diagnóstico del tumor entre los portadores de alelo G y de los individuos T /T en el genotipo, como se ve en la Figura 1D, se midió usando dos enfoques: la Prueba Kolmogorv-Smirnov y la Cramer- Prueba de Mises Smirnov-Von. Ambas pruebas apoyan la importancia de estas diferencias de rendimiento valores de p 0.0091 y 0.0046, respectivamente (Tabla 2). Por el contrario, cuando los 101 individuos fueron separados en función del sexo por sí solo, no se observaron diferencias significativas en la edad media de aparición de tumores. En concreto, los portadores de p53 mutación mujeres fueron diagnosticadas en promedio a los 23 años de edad (que va de 1 a 71 años de edad) en comparación con los varones portadores que fueron diagnosticados en promedio a los 24 años de edad (que va de 1 a 59 años de edad la figura 1E y Tabla 2).
con el fin de comparar la incidencia depende de la edad de cáncer entre hombres y mujeres, los individuos que desarrollaron cánceres específicos de género principalmente fueron excluidos de este análisis, dejando STS, osteosarcomas y como leukemmias los principales tipos de tumores analizados como se muestra en los gráficos de sectores, tanto para machos (a) y mujeres (B). (C) El gráfico de barras que representa los bits de información mutua entre el locus MDM2 SNP309 y la edad de aparición del tumor, el sexo y la edad de aparición del tumor y, por último, entre las tres variables. El p-valores asociados se muestran a continuación. (D) La incidencia acumulada de diagnóstico de tumores, tanto para los individuos T /T en el genotipo (cuadrados negros) y T /G o G /G (SNP309) en el genotipo (diamantes grises) se representa como una función de la edad. Un cuadrado o un diamante representa al menos un individuo. (E) La incidencia acumulada de diagnóstico del tumor tanto en hombres (cuadrados negros) y hembras (diamantes grises) se representa como una función de la edad.
Como se mencionó anteriormente, una de las ventajas de una análisis teórico de la información de las interacciones es que las interacciones no aditivos pueden ser detectados y cuantificados. Curiosamente, este análisis reveló que el locus MDM2 SNP309 y el género se toman juntos interactúan para afectar a la edad de diagnóstico tumoral en un no aditivo, de manera sinérgica, como se demuestra por las medidas de 0,06 bits de información sinérgica significativa (p = 0,05, prueba de permutación) . Esto sugiere que el efecto modificador bien definido del locus MDM2 SNP309 de la edad de primera aparición de tumores en los portadores de la mutación de p53 (Tabla 1) podría ser significativamente diferente entre los géneros. Para probar esto, se midió la interacción de los alelos de MDM2 SNP309 con la edad de diagnóstico del tumor para ambos sexos mediante el cálculo de sus respectivas informaciones mutuas. Curiosamente, por esta medida, el locus MDM2 SNP309 interactúa solamente de forma significativa con la edad de diagnóstico de tumores en mujeres portadoras y no en los hombres portadores. En concreto, en las mujeres portadoras, el locus MDM2 SNP309 y la edad de la cuota de diagnóstico del tumor un significativo 0,2 bits de información mutua (p = 0,014, Figura 2A). Sin embargo, en los hombres portadores, los 0.114 bits de información mutua medida no alcanzó significación con un valor de p de 0,06.
(A) El gráfico de barras que representa los bits de información mutua entre el locus MDM2 y la SNP309 edad de aparición de tumores en las mujeres y en los hombres. El p-valores asociados se muestran a continuación. El locus MDM2 SNP309 y la edad de la cuota de diagnóstico del tumor de información mutua significativa sólo en las hembras y no en los hombres. La significancia estadística está representada por el etiquetado negro del gráfico de barras y los valores p mostrados a continuación. La incidencia acumulada de todos los tipos de tumores específicos no de género, tanto para los individuos T /T en el genotipo (cuadrados negros) y T /G o G /G en el genotipo (diamantes grises) se representa como una función de la edad para las mujeres (B) y los machos (C). Un cuadrado o un diamante representa al menos un individuo.
Cuando se separó en los diferentes genotipos del locus SNP309, las 23 mujeres que llevaban el alelo G-ya sea en el estado homocigoto o heterocigoto, muestran una significativa de 16 años a principios de la edad media, y 23 años de edad media de aparición de tumores en comparación con las 21 mujeres T /T en el genotipo (hembras T /T, de 31 años de edad, que van de 2 a 71 años, frente a los 15 años de edad en G /G y T /G hembras, que van desde 1 a 54 años, p = 0,007 y p = 0,0037, Figura 2B y en la Tabla 2). Sus respectivas distribuciones de las edades de diagnóstico del tumor también difieren significativamente, según lo medido por la prueba de Kolmogorov-Smirnov y la prueba Mises Cramer-Smirnov-Von (p = 0,0275 y 0,0077, Tabla 2). Como se predijo por el análisis de la información de la teoría de las diferencias entre el macho portadores de G de alelo y los machos T /T en el genotipo son mucho más débiles. Cuando se separó en los diferentes genotipos del locus SNP309, los hombres que llevaban el alelo G-ya sea en el heterocigotos o homocigotos estado, reveló que la edad promedio de un significativo 10 años antes de la aparición del tumor en comparación con los machos T /T en el genotipo (T /T Varón, 30 años de edad, que van de 1 a 55 años, frente a 20 años de edad en el G /G y hembras T /G, que va de 1 a 54 años, p = 0,0285, Figura 2C y Tabla 2). Sin embargo, el significado medida de las diferencias en las medianas y distribuciones en los machos eran simplemente frontera línea significativa con los valores de p de 0,0672, 0,0478 y 0,0469, respectivamente (Tabla 2). Así, los valores p calculados de varias maneras diferentes fueron 5-10 veces más débil por el impacto del G-alelo de la edad de aparición de los primeros tumores en los hombres que en las mujeres.
Discusión
en este informe, las dependencias estadísticas del locus MDM2 SNP309 y el género de la edad de la primera aparición de tumores en los portadores de mutaciones de p53 se determinaron utilizando un nuevo enfoque teórico de la información cuantitativa. Las tres poblaciones de pacientes que se utilizaron originalmente para definir MDM2 SNP309 como un modificador de la tumorigénesis en portadores de la mutación de p53 se analizaron (cuadro 1). El análisis reveló un nivel importante de información mutua entre el locus MDM2 SNP309 y la edad de la primera aparición del tumor, pero no entre el género y la edad de aparición del tumor (Figura 1). El enfoque teórico de la información permitida para el sondeo de dependencias estadísticas entre las tres variables (los alelos de MDM2 SNP309, el sexo y la edad de la primera aparición del tumor). Curiosamente, el locus MDM2 SNP309 y género, en su conjunto, se mostró a interactuar y afectan a la edad de diagnóstico del tumor sin género específico en un tipo no aditivo, de manera sinérgica (Información sinérgica = 0,06; p = bits de 0,05). En las mujeres, el locus MDM2 SNP309 y la edad de la cuota de diagnóstico del tumor información mutua significativa mientras que, en los hombres, el nivel de información mutua medida no alcanzó una significación (Figura 2). En otras palabras, el análisis de las tres variables en este estudio reveló que el género no de hecho jugar un papel en la incidencia dependiente de la edad, pero sólo cuando también se proporciona información acerca de la forma alélica del locus MDM2 SNP309. Esto es probablemente debido a la observación de que sólo el G-alelo en MDM2 SNP309 se estimula para producir más MDM2 mRNA y proteína en la presencia de estrógeno [20]. pruebas estadísticas estándar que miden la importancia de las diferencias tanto en la media y la mediana de edad de la primera aparición de tumores y en la distribución de las edades de diagnóstico del tumor entre los transportistas alelo G-e individuos T /T en el genotipo validados estas observaciones (Tabla 2).
Como se mencionó anteriormente, el enfoque teórico de la información puede sondear cuestiones de dependencias estadísticas entre más de dos variables y se puede cuantificar los niveles de sinergia y la redundancia. Los estudios genéticos y epidemiológicos a gran escala cada vez han reconocido que las variables interactúan de una manera no aditiva con respecto al riesgo de la enfermedad, es decir, las variables no actúan de forma independiente el uno del otro. Destacando estas dependencias es fundamental para entender cómo el riesgo de enfermedad puede ser modificado sutilmente por una variable oculta y puede explicar por qué diferentes estudios epidemiológicos pueden reportar diferentes conclusiones basadas en la visualización de una sola variable [17]. Por otra parte, la identificación y cuantificación de las interacciones sinérgicas también pueden arrojar luz sobre nuevos mecanismos biológicos, tales como la diafonía entre dos vías de señalización. Sin embargo, hasta ahora, no ha habido ninguna definición rigurosa y, por tanto, no cuantificación de tales interacciones sinérgicas. teoría de la información y los métodos detallados aquí la forma de un marco natural para abordar estas cuestiones de dependencias estadísticas entre las variables mientras se invoca ninguna hipótesis paramétricos
.
En conclusión, el análisis teórico de la información de las dependencias estadísticas del locus MDM2 y SNP309 el género de la edad de aparición de tumores en portadores de la mutación de p53 sugiere que el G-alelo de funciones SNP309 principalmente en portadores de la mutación p53 hembra para acelerar la formación de tumores, proporcionando de este modo un potencial de base genética para el dimorfismo sexual observada en el riesgo de cáncer [21], [22 ]. Estas observaciones en relación con las observaciones que tanto antes de la pubertad y post-púberes hembras tienen niveles más altos de estrógeno [33], [34], y que el estrógeno se ha demostrado que estimula preferentemente la transcripción de
MDM2 En venta el G-alelo [20], proporcionan una hipótesis razonable; el G-alelo del locus MDM2 SNP309 podría contribuir al aumento del riesgo de cáncer observado en portadores de la mutación p53 hembra a través de la estimulación dependiente de estrógenos preferencial de la transcripción del gen MDM2.