Extracto
Antecedentes
La evidencia sugiere que las mutaciones espontáneas doblete en los tejidos normales de ratón en general surgir de eventos chronocoordinate. Estas mutaciones chronocoordinate veces reflejan "duchas de mutación", que son múltiples mutaciones chronocoordinate que abarcan muchos kilobases. Sin embargo, poco se sabe acerca de la mutagénesis de doblete y mutaciones multiplete (domuplets) en el cáncer humano. El cáncer de pulmón representa aproximadamente el 25% de todas las muertes por cáncer. En este documento, se analiza la epidemiología de domuplets en el
EGFR
y
TP53
genes en el cáncer de pulmón. La
EGFR
gen es un oncogén en el que los dobletes son generalmente más conductor conductor mutaciones, mientras que el
TP53
gen es un gen supresor de tumores con una situación más típica en la que dobletes derivan de un conductor y mutación de pasajeros.
Metodología /Principales conclusiones
EGFR
mutaciones identificadas por secuenciación se obtuvieron de 66 artículos publicados y nuestra actualizada
EGFR
base de datos de mutación (www .egfr.org).
TP53
mutaciones fueron recogidos a partir de la versión 12 de la IARC (www-p53.iarc.fr). Para
EGFR
y
TP53
dobletes, no hay diferencias claramente significativas en la raza, se observaron etnia, género y tabaquismo. Dobletes en el
EGFR
y
TP53
genes en el cáncer de pulmón humano se elevan sobre ocho y tres veces, respectivamente, en relación con dobletes espontáneas en el ratón (el 6% y el 2,3% frente a 0,7% ).
Conclusiones /Importancia
a pesar de que hay una característica es definitiva, las propiedades globales de doblete y mutaciones multiplete en el cáncer de pulmón son consistentes con un subconjunto derivado de eventos chronocoordinate en el
EGFR
gen: i) los ocho dobletes marco de lectura (presente en el 0,5% de todos los pacientes con
EGFR
mutaciones) se agrupan y producen una red en el marco del cambio; ii) aproximadamente el 32% de dobletes están muy poco espaciados (≤30 nt); y iii) multipletes contener dos o más espaciados estrechamente mutaciones.
TP53
mutaciones en el cáncer de pulmón están muy próximos entre sí (≤30 nt) en el 33% de dobletes y multipletes generalmente contienen dos o más mutaciones muy próximos entre sí. El trabajo en sistemas modelo es necesario para confirmar la importancia de los acontecimientos chronocoordinate de pulmón y otros cánceres
Cita:. Chen Z, Feng J, Buzin CH, Sommer SS (2008) Epidemiología de la Doblete /multiplete Las mutaciones en los cánceres de pulmón : Prueba de que un subconjunto surge por Chronocoordinate Eventos. PLoS ONE 3 (11): e3714. doi: 10.1371 /journal.pone.0003714
Editor: Amanda Ewart Toland, Ohio State University Medical Center, Estados Unidos de América
Recibido: 4 Agosto, 2008; Aceptado: 10 Octubre 2008; Publicado: 13 Noviembre 2008
Derechos de Autor © 2008 Sommer et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Institución.
Conflicto de intereses:. Los autores han declarado que no existen intereses en competencia
Introducción
el cáncer es un grupo heterogéneo, de múltiples pasos enfermedad genética compleja, como resultado de mutaciones acumuladas. Los cánceres en general se consideraron surgir por la acumulación de un estimado de 5-7 mutaciones causantes [1], [2]. Recientemente, sin embargo, Vogelstein y otros han mostrado en los cánceres de mama y colorrectal que los tumores individuales se acumulan ~ 90 genes mutados somáticamente [3]. Sin embargo, son propensos a estar involucrados en la tumorigénesis, en cualquier tumor dado un número mucho más pequeño (se estima que ~ 11). La acumulación de tantas mutaciones contributivas es difícil de explicar únicamente por la frecuencia de múltiples eventos independientes de mutación. La acumulación de mutaciones en ciertos tipos de cáncer puede reflejar un fenotipo mutador con mutaciones aleatorias a nivel mundial [4] - [6]. Selección secuencial ofrece otra explicación [7], [8]. Una mutación causa el exceso de replicación, dando lugar a un clon, que se replica-sobre más debido a una segunda mutación, etc. Recientemente, la existencia de lluvias de mutación se informó, aumentando la posibilidad de "cáncer en un instante" si se producen lluvias de mutación dispersos . duchas de mutación se encontraron después de los análisis de mutaciones intragenic doblete permita establecer que no se agruparon y chronocoordinate [9].
Hemos demostrado que la mayoría de los dobletes en el
EGFR
gen tiene un diferente patrón de mutación relativa a singletes y constan de conductor y conductor mutaciones, debido a mutaciones secuenciales o chronocoordinate, supuestamente seguido de la selección funcional de dos mutaciones de forma individual sub-óptimos [10]. Además, adquirida segundo mutaciones (por ejemplo T790M) en cuatro
EGFR
dobletes se han reportado después del tratamiento con gefitinib y erlotinib y se asocia con resistencia a los medicamentos y la recaída de la enfermedad [11], [12]. En contraste, la mayoría
TP53
y
lacI
dobletes muestran mutaciones del conductor, más de pasajeros en los cánceres de pulmón y en el tejido normal Big Blue ratón, respectivamente. Sin embargo, los mecanismos de epidemiología y mutagénesis de dobletes y múltiples mutaciones subyacentes no están claros.
Para dilucidar la frecuencia de dobletes y el patrón de mutación distinta y espectro en la
EGFR
gen, la epidemiología del doblete mutaciones en el cáncer de pulmón se analizaron y se compararon con la de dobletes en el
TP53
gen. Aquí, nos encontramos con que el consumo de tabaco, raza, etnia, género, edad y no están los factores de riesgo para la aparición doblete en el
EGFR
y
TP53
genes. La frecuencia relativa de dobletes es mayor en el cáncer de pulmón humano que en el tejido normal de ratón. La existencia de pares Omidi (ver Terminología y abreviaturas en Materiales y Métodos) en
EGFR
, la alta frecuencia de alelos en comparación con dobletes compuesto heterocigotos, la alta frecuencia de dobletes muy próximas entre sí, y la agrupación en multipletes son consistentes con chronocoordinate mutaciones que contribuyen a por lo menos un subconjunto de la
EGFR
y
TP53
doblete y mutaciones multiplete encuentran en el cáncer de pulmón humano.
resultados
Epidemiología de doblete mutaciones en el EGFR y los genes TP53 en el cáncer de pulmón
el análisis por el consumo de tabaco, sexo y origen étnico no revela una diferencia significativa en la frecuencia doblete en el
EGFR
gen (Tabla 1, Tabla S1). La edad media de los pacientes con singletes y dobletes es similar (61.4 ± 11.3
vs
65,8 ± 10,3).
Los resultados para el
TP53
génica en el pulmón cáncer son similares con una excepción. La frecuencia de
TP53
dobletes es significativamente mayor en los asiáticos que en los caucásicos (3,2%
vs
1,8%, P = 0,03) (Tabla 1, Tabla S2), pero esto no es significativo cuando corregido para comparaciones múltiples (seis exacta de Fisher pruebas realizadas para el
EGFR
y
TP53
genes). son necesarios para evaluar este punto de datos adicionales.
En general, 98/1627 (6,0%) de las mutaciones de EGFR y 54/2387 (2,3%) de las mutaciones TP53 en los cánceres de pulmón humanos son dobletes, una frecuencia mucho más alta que la observada en el
lacI
gen en ratones Big Blue (8 veces y 3 veces, respectivamente) (Tabla 2).
los dobletes tienden a agruparse en el EGFR y TP53 genes en el cáncer de pulmón: la "vida media de separación mutación" es de 9 pb y 15 pb, respectivamente
espontánea
lacI
dobletes (0,7% del total de mutaciones) se agrupan con un espaciado apropiado una distribución exponencial y muestran un patrón de mutación similar a singletes, lo que indica un evento chronocoordinate [13], [14]. Sobre la base de la separación doblete entre dos mutaciones,
EGFR
dobletes se pueden dividir en dos grupos: el grupo proximal (& lt; 100 pb, separación media 22,8 ± 24,4 pb) y el grupo distal (& gt; 809 pb , separación media de 12,3 ± 5,1 kb) (Tabla S1). Análoga a
lacI
dobletes, un subconjunto [40% (39/98)] de
EGFR
dobletes que se producen en el mismo exón con una separación proximal muestra una exponencial (R
2 = 0.9979 ) en lugar de una distribución casi uniforme (Figura S1). La mitad de los dobletes han mutaciones separados por 9 pb o menos (la "vida media de separación mutación"; véase la terminología en Materiales y Métodos).
La distribución espaciamiento de
TP53
dobletes en el pulmón cáncer ocurra en el mismo exón (43%, 23/54) también muestra el espaciamiento proximal (& lt; 86 pb, media 20,2 ± 20,9 pb) y se ajusta a una distribución exponencial (R
2 = 0,979) (Tabla S2, la figura S1) con una vida media de la distancia entre la mutación de 15 pb. Dobletes que se producen en diferentes exones tienen el espaciamiento distal (131-4504 pb, promedio de 1317,9 ± 1000 pb) separados por un intrón. Se encontró una separación similar a la de cáncer de pulmón para
TP53
dobletes dentro del mismo exón en los cánceres de mama y colorrectal, con una vida media de la distancia entre la mutación de 24 y 16 pb, respectivamente (Tablas S4 y S5) .
Por lo tanto, alrededor de un tercio de los
EGFR
y
TP53
dobletes están muy agrupadas (≤ 30 pb) y todos los dobletes que ocurren dentro de un solo exón tener una interacción espaciamiento de mutación que se distribuye de manera exponencial en lugar de la distribución cuasi-uniforme era de esperar, consistente con los acontecimientos chronocoordinate en
lacI
en el tejido normal del ratón.
los pares Omidi son una fuerte evidencia de mutaciones chronocoordinate agrupados
La gran mayoría de germlime humana espontánea o MIDIs ratón somáticas son OMIDIs (
FIX
, Big Blue); de hecho, aproximadamente la mitad son deleciones de una sola base [15] - [18]. En contraste, no es una fracción muy baja de OMIDIs (0,26%, 4/1526) y mutaciones sin sentido (0,13%, 2/1526), en
EGFR
singletes, en consonancia con una fuerte selección para mutaciones que alteran, en lugar de eliminar, función. Ocho de 98 (6%)
EGFR
dobletes contienen un par de mutaciones de cambio (pares Omidi; véase siglas en Materiales y Métodos). Los ocho de los pares Omidi están espaciados estrechamente (Tabla 3, Figura S2), con el resultado neto es una mutación en el marco. Dada una mutación Omidi, una segunda mutación al azar 3 'de la primera (ya sea IMIDI o Omidi) restaurará el marco de lectura solamente 1/3 parte del tiempo, y un sub-fracción de ese tercer sigue truncando la proteína debido a una mutación sin sentido se produce antes a la segunda mutación. En total 0,49% de reportado
EGFR
mutaciones (8/1627) se agrupan pares Omidi sin mutación truncamiento se produce antes de la segunda Omidi. Se espera que estos ocho pares Omidi a residir en el mismo alelo; de lo contrario, compuestos dobletes Omidi heterocigóticos dará lugar a dos truncamientos alélicas, eliminando todos los
EGFR
la función del gen. Mientras tanto, ambas de las OMIDIs agrupados también debería producirse en sucesión rápida (mutaciones chronocoordinate) dentro del mismo ciclo celular debido a que la frecuencia de mutaciones secundarias que ocurren aleatoriamente en una proliferación celular deficiente resultante de una sola Omidi es raro. Los 14 restantes (deleciones en los exones), 9 indeles y 3 dobletes están todos en-marco (IMIDI) mutaciones (Tabla 2, Tabla S1).
Las mutaciones en el único par Omidi reportados en la
TP53
gen son 2.309 pb aparte, en diferentes exones (Tabla S2, ID#14373), y, a diferencia de los pares Omidi en el
EGFR
gen, no juntos restaurar el marco de lectura.
multipletes EGFR son consistentes con una camiseta y una segunda mutación chronocoordinate muy agrupadas
Cuatro trillizos y cuatrillizos en un
EGFR
se encuentra a una frecuencia de 0,3% (5 /1627) de los cánceres de pulmón con mutaciones antes del tratamiento con inhibidor de la tirosina quinasa (TKI) (Tabla 4). Es de interés que los pares de mutaciones en cada uno de los trillizos y tres mutaciones en el cuadrúpedo se estrechamente agrupadas con una separación proximal (3-60 pb), similar a los dobletes en
lacI Hoteles en tejidos normales de ratón. La tercera mutación se encuentra en un exón diferente, con espaciado distal. Los datos son consistentes con la selección secuencial de dos mutaciones en el que una de las mutaciones es decir un doblete chronocoordinate o triplete.
TP53
multipletes (6 trillizos y cuatrillizos uno) también representan el 0,3% ( 7/2387) de las mutaciones totales (Tabla S3). Cinco multipletes (71%, 5/7) residen en el mismo exón o dos exones, en consonancia con una mutación y una doblete chronocoordinate. Siete multipletes habían mutaciones separados por 15 regiones de separación. De éstos, seis fueron muy agrupadas (≤30 nt) y nueve eran menos de 100 nucleótidos o menos. El ochenta por ciento (16/20) de múltiples mutaciones en el cáncer de mama y 76% (25/33) en el cáncer colorrectal también residen en uno o dos exones (Tablas S6, S7).
Una comparación de Omidi pares y doblete estrechamente espaciados y mutaciones multiplete en el
EGFR
y
TP53
genes se muestra en la Tabla 5. la frecuencia de los pares Omidi en el
EGFR
gen es aproximadamente 10 veces mayor que en el
TP53
gen (y el par Omidi en el
TP53
gen no da lugar a una red de mutación en-marco), lo que refleja la selección de mutaciones más frecuentes que alteran, en vez de eliminar, la función de la proteína EGFR. La frecuencia de mutaciones muy próximas entre sí en dobletes y multipletes en ambos genes es similar
Todos los dobletes de EGFR son caracterizados alélica:. Un subconjunto significativo de mutaciones chronocoordinate ofrece una explicación alternativa
En la cara valor, los datos alelismo sugiere que las mutaciones conductor /conductor en
EGFR
necesitan estar en la misma molécula [10]. Sin embargo, la existencia de un subconjunto sustancial de mutaciones chronocoordinate ofrece una explicación alternativa. Dieciséis heterocigóticos
EGFR
dobletes de tres estudios diferentes han sido analizados por clonación o amplificación específica de alelo (Tabla S1) [10], [19], [20]. La posterior secuenciación de los productos reveló que todos estos alelos fueron de tipo ya sea doblemente mutado o salvaje, lo que indica que, en cada caso, ambas mutaciones se encuentran en el mismo alelo. Si los pares doblete resultan de eventos independientes, media puede esperarse que sea heterocigotos compuestos. La observación de 100% alelismo (16/16) vs. heterocigotos compuestos cero (p = 0,002) puede reflejar que, funcionalmente, se requiere que las mutaciones conductor /conductor para estar en la misma molécula a pesar de que las formas de la proteína EGFR dímeros [10] . Sin embargo, los datos también son compatibles con el 50% de eventos chronocoordinate, supuestamente durante la replicación del cordón o parche de reparación, y 50% de las mutaciones secuenciales independientes sin el requisito de que ambas mutaciones estar en la misma molécula (8 de 8 mutaciones alélicas observadas cuando 4 de 8 son espera al azar;.. p≤0.08)
por desgracia, a nuestro conocimiento, el análisis de alelos no se ha realizado en heterocigotos
TP53
dobletes
Discusión
Se presenta el primer análisis de la epidemiología de dobletes en el cáncer de pulmón. El nivel de tabaquismo, raza, etnia, género y edad no se les factores de riesgo de ocurrencia doblete en el cáncer de pulmón. La alta frecuencia de dobletes en clúster, la distribución exponencial de la separación, la aparición de pares Omidi agrupados en-marco, la naturaleza alélica de dobletes, y la agrupación de los multipletes en
EGFR
y
TP53
son consistentes con una minoría significativa de mutaciones chronocoordinate en el cáncer humano. Sin embargo, hay advertencias para cada una de las observaciones anteriores (véase más adelante).
Se demuestra que los dobletes son más frecuentes en el
EGFR
y
TP53
genes en el cáncer humano de en mutaciones somáticas espontáneas en el tejido normal de ratón. Dentro de las limitaciones de tamaño de la muestra, la frecuencia doblete no, obviamente, depende de la condición de fumador, género, etnia o edad. El
TP53
gen está mutado en aproximadamente la mitad de todos los tumores y se puede utilizar como una "prueba mutágeno", es decir, las frecuencias relativas de los diferentes tipos de mutaciones pueden ser utilizados como una herramienta epidemiológica para explorar la contribución de mutágenos exógenos frente a procesos endógenos en los cánceres de mama [21], [22]. La hipótesis de que las tasas de mutación más altas se esperan de los fumadores con más frecuencia producen mutaciones doblete. Sin embargo, no hay ninguna diferencia significativa entre los fumadores y los no fumadores, en consonancia con dobletes y multipletes derivados de procesos endógenos.
Los datos son consistentes con mutaciones chronocoordinate (con salvedades) guía
Varios aspectos de la datos son consistentes con un subconjunto de
EGFR
y
TP53
dobletes derivadas de acontecimientos choronocoordinate más que de hipermutabilidad (al azar espaciamiento distribuido) o la selección secuencial. Acerca de 32-35% de los dobletes que se encuentran en la
TP53 gratis (35%, 19/54) y
EGFR gratis (32%, 31/98) los genes son o bien pares Omidi o muy agrupadas dobletes separados por ≤30 nt. Sin embargo, hay advertencias para cada inferencia que debe ser descartada en el trabajo futuro.
El valor principal del presente análisis es generar datos que constriñen nuestras hipótesis y, por Occam de búsqueda: '
s de afeitar, generan una simple hipótesis (el subconjunto de eventos chronocoordinate) consistente con múltiples datos.
(1) los pares Omidi son la mejor prueba de mutaciones chronocoordinate. Para la mayoría de los genes, la mayoría de los MIDIs espontáneas son OMIDIs, pero en el
EGFR
gen, OMIDIs son raros, en consonancia con la selección general para la función alterada en lugar de falta de función. Es notable que los ocho
EGFR
dobletes que contienen pares Omidi todas las mutaciones tienen muy próximas entre sí que dan como resultado una mutación net en marco, lo que produce una proteína EGFR con potencialmente alterado, en lugar de ausente, función. Sin embargo, se ha demostrado ninguna evidencia experimental de una proteína que contiene una de estas mutaciones doblete. La explicación más razonable para esta ocurrencia es a través de mutaciones chronocoordinate que se seleccionan juntos para la función de la proteína alterada. Una explicación alternativa es que los pares Omidi pueden ser secuenciales de alguna manera, aunque las mutaciones aleatorias dentro de unos pocos nucleótidos en el genoma deben ser extremadamente improbable.
(2) La relativamente alta frecuencia de mutaciones doblete agrupados en el
EGFR
gen es consistente con mutaciones chronocoordinate. La distribución exponencial de la separación entre las dos mutaciones en
EGFR
y
TP53
dobletes en los mismos exones (R
2 = & gt; 0,98). Es muy poco probable por casualidad
Una simulación se realizó previamente para cada uno de los
TP53
exones 5-9 para probar la hipótesis nula de que las mutaciones en
TP53
dobletes son eventos independientes y que la distribución de la espaciado entre las dos mutaciones depende sólo de la espectro de mutaciones en el
TP53
gen y el tamaño de la diana de mutación [13]. La primera mutación de cada doblete simulado se elaboró al azar sobre la base de la distribución observada de mutaciones singlete en un exón dado. El uso de la distribución de la base de datos singlete TP53 IARC (versión 8) representa el sesgo que puede ser el resultado de los puntos calientes muy próximas entre sí. La segunda mutación en el doblete se extrajo aleatoriamente basa en una distribución uniforme en toda la secuencia de codificación de TP53 para que el exón, ya que es probable que sea una mutación "autoestopista" (de pasajeros), en lugar de una mutación controlador para el tumor.
la separación mutación en los dobletes simulados se comparó con 402 reales
TP53
dobletes en la base de datos de la IARC de todos los tipos de cáncer. Los resultados demostraron que dos mutaciones dentro de dobletes no son eventos independientes por comparación estadística de las distribuciones observadas y esperadas, e indicaron que más dobletes se produjeron con una separación mutación de menos de 30 nucleótidos de lo esperado por casualidad (P = 0,03, 0,02, 0,0006, y 0,01 para los exones 5-8). Estos resultados son consistentes con la presencia de mutaciones en el chronocoordinate humano
TP53
gen. Una explicación alternativa para la agrupación de dobletes es que pueden representar algunas limitaciones funcionales aún no apreciadas.
(3) La naturaleza alélica de dobletes es consistente con mutaciones chronocoordinate. Entre 98 pares doblete reportados en la literatura, sólo unos pocos han sido analizados para determinar si están presentes en el mismo o diferentes alelos. Entre 16 pares doblete probados por clonación o amplificación específica de alelo, se encontró que los 16 pares de estar presente en el mismo alelo. Sin embargo, para los pares de dobletes restantes, en los que no se realizó la clonación o alelo-específica de la amplificación, la posibilidad de que las mutaciones estaban presentes en diferentes alelos no puede ser descartada.
(4) La frecuencia relativamente alta de multipletes con dos o más mutaciones en clúster y una mutación adicional en una ubicación distal también argumenta a favor de un evento mutacional chronocoordinate más un evento mutacional única independiente. Una vez más, una explicación alternativa podría implicar limitaciones funcionales de las mutaciones agrupadas.
En conjunto, estos datos son consistentes con una contribución de mutaciones chronocoordinate agrupados con el cáncer humano. Un exceso de dobletes o multipletes con un subconjunto de distribución agrupada se produce con más frecuencia de lo previsto por casualidad en una amplia gama de organismos, incluyendo riboviruses, virus de ADN, procariotas, levaduras, y las líneas celulares eucariotas y tejidos [23], [24].
controlador de apoyo de datos más TP53 pasajeros dobletes en el cáncer de pulmón
Sobre se espera que el 22% de las segundas mutaciones en dobletes estar en silencio si son "pasajeros" mutaciones, en lugar de mutaciones "controlador" [25]. En los
TP53
dobletes, hay cinco silencio y dos cambios de nucleótidos intrónicas (13%, 7/54), no significativamente diferente de los 23,5% cambios de nucleótidos en silencio se espera que ocurran con mutaciones aleatorias de pasajeros (p = 0,46 ) [26], [27]. cambios de nucleótidos silentes (18%, 4/22) dentro de
TP53
multipletes también están cerca de un 23,5%. En conjunto, estos datos implican que
TP53
dobletes y multipletes consisten de un patrón de conductor y pasajero mutación, en contraste con el patrón conductor /controlador que se encuentra en
EGFR
dobletes [10].
mutaciones Doublet se asocian con duchas de mutación en ratón [9]. El advenimiento de la secuenciación masiva en paralelo puede facilitar el análisis de un número suficiente de muestras para definir cualquier dobletes y después determinar si estos dobletes están asociados con duchas de mutación en el cáncer. Las mutaciones de agrupamiento no aleatorias en las duchas de mutación deben proporcionar datos más definitivos para la ocurrencia de mutaciones chronocoordinate en cánceres humanos. sigue siendo la contribución de lluvias mutación de cáncer que se determine.
Materiales y Métodos
Terminología y abreviaturas
mutación del espectro.
Las frecuencias relativas de las mutaciones en sitios específicos.
patrón de mutación.
Las frecuencias relativas de los diferentes tipos de mutaciones, por ejemplo, las transiciones C a T vs T para las transiciones C.
singlete.
una sola mutación identificada dentro de un gen [13].
mutación Tandem-base (TBM).
una mutación que da lugar a cambios de bases en los nucleótidos adyacentes [28], [29].
doblete.
Dos mutaciones identificadas dentro de un gen que incluye una combinación de mutaciones TBM y no TBM.
multiplete.
Tres o más mutaciones identificadas dentro de un gen, con exclusión de la situación en la que todas las mutaciones son adyacentes. Multipletes pueden incluir una combinación de mutaciones TBM y no TBM.
Domuplets.
Un mutante que es o bien un doblete o un multiplete. Aproximadamente el 1% de los
lacI
placas mutantes son domuplets [9]
MIDI
Microinsertion, eliminación o indel..; una inserción, deleción o indel que se traduce en una ganancia o una pérdida de 1 a 50 nucleótidos [10].
IMIDI
.
Dentro de la trama MIDI
Omidi.
Fuera de la trama MIDI
la vida media de la distancia entre la mutación.
Desde el ajuste exponencial de los datos, el intervalo de separación mutación que corresponde al intervalo que abarca la mitad de la restante mutaciones dentro de la muestra. Esto es análogo a la vida media de un radioisótopo.
Chronocoordinate mutación.
Las mutaciones múltiples que se producen en el mismo ciclo celular y en rápida sucesión, típicamente dentro de segundos a minutos [13].
ducha de mutación.
Chronocoordinate múltiples mutaciones que abarcan varios kilobases [9].
mutación silenciosa.
Una mutación neutra que no cambia la estructura de proteínas, incluyendo cambios región de codificación sinónimos. Se reconoce que los tipos de mutación ocasionales se superponen, por ejemplo, una mutación silenciosa puede activar un sitio de empalme críptico o puede inactivar el sitio de empalme normal si interrumpe la secuencia de corte y empalme consenso de donantes [30]. En la práctica se han encontrado muy pocos de esos solapamientos.
Las muestras y análisis mutacional
Con el fin de investigar el mecanismo y las características de dobletes y multipletes,
EGFR
mutaciones identificadas por secuenciación eran recogidos de 66 artículos publicados y nuestra actualizada
EGFR
base de datos de mutación [10], [31] (www.egfr.org).
TP53
mutaciones se obtuvieron de IARC versión 12 (www-p53.iarc.fr) y las mutaciones en la fibrosis pulmonar y en el cáncer de pulmón excluidos en pacientes expuestos a las emisiones de humo de carbón, radón, gas mostaza, amianto, metales pesados y la radiación de la bomba atómica (rayos gamma). También se excluyeron los dos papeles en los que múltiples mutaciones comprendían & gt; 50% de las mutaciones totales, muy probablemente debido a los artefactos de la PCR, ya que múltiples mutaciones generalmente representan sólo ~ 3% de las mutaciones totales.
TP53
mutaciones en los cánceres de mama y colorrectal también se recuperaron y se analizó la distribución espaciamiento de dobletes /multipletes.
Análisis estadístico
patrones de mutación y otras distribuciones de recuento categóricas fueron probados las diferencias significativas por la prueba exacta de Fisher o no ordenada R × C tablas de contingencia utilizando la prueba de "Fisher-Freeman-Halton" implementado por el análisis estadístico paquete de software StatXact (Cytel software Corporation, Cambridge, MA).
Apoyo información
figura S1.
Un subconjunto de dobletes muestra espacios proximal y se adapta a la distribución exponencial en los genes EGFR y p53 en el cáncer de pulmón. El panel A muestra la separación (en pares de bases) entre las dos mutaciones en EGFR dobletes proximales (n = 37). Las distancias de separación se dividieron en tres grupos, con separaciones de 1 a 41 pb, 42 a 82 pb, y 83 a 123 pb, y se representan en el punto medio de cada grupo (20, 60, y 100, respectivamente). La separación se define aquí como el número de nucleótidos entre, pero no incluyendo, las dos mutaciones en un doblete. Para MIDIs, la separación se define como el número de nucleótidos entre, pero no incluyendo, el inicio de la primera y segunda MIDIs. El panel B muestra la distancia (en pares de bases) entre las dos mutaciones en p53 dobletes proximales (n = 23). Las distancias de separación se dividieron en tres grupos, con separaciones de 1 a 31 pb, 32 a 62 pb, y 63 a 93 pb, y se representan en el punto medio de cada grupo (15, 30, y 45, respectivamente).
doi: 10.1371 /journal.pone.0003714.s001 gratis (0.62 MB PPT)
figura S2.
dobletes en el gen EGFR que forman pares Omidi la secuencia de tipo salvaje (wt) de EGFR en el exón 19 de los nucleótidos 2227 a 2280 se muestra. Los ocho pares Omidi en el cáncer de pulmón se esquematizan para mostrar las deleciones (en magenta), inserciones (en verde) y una región que se duplica (en amarillo). Tenga en cuenta que dos de los dobletes consisten de dos deleciones cada uno, cinco dobletes consistir en una eliminación más un indel, y uno doblete tiene una duplicación (inserción) más un indel. En cada caso, el marco de lectura se restaura (véase la supresión neta)
doi:. 10.1371 /journal.pone.0003714.s002 gratis (DOC 0,03 MB)
Tabla S1. sobre Table complementaria 1 | doi: 10.1371 /journal.pone.0003714.s003 gratis (XLS 0.07 MB)
Tabla S2. sobre Table complementaria 2
doi: 10.1371 /journal.pone.0003714.s004 gratis (XLS 0.07 MB)
Tabla S3.
Supplemenatary Tabla 3
doi: 10.1371 /journal.pone.0003714.s005 gratis (XLS 0.03 MB) sobre Table S4. sobre Table complementaria 4 doi: 10.1371
/journal.pone.0003714.s006 gratis (XLS 0.08 MB) sobre Table S5. sobre Table complementaria 5
doi: 10.1371 /journal.pone.0003714.s007 gratis (XLS 0.11 MB) sobre Table S6. sobre Table complementaria 6
doi: 10.1371 /journal.pone.0003714.s008 gratis (XLS 0.04 MB) sobre Table S7.
que complementa el cuadro 7
doi: 10.1371 /journal.pone.0003714.s009 gratis (XLS 0.06 MB) guía
Reconocimientos
Agradecemos Wenyan Li y Chen Jiesheng de ADN secuenciación.