Extracto
Varios estudios recientes han examinado la función y la evolución de un homólogo de Drosophila el gen de susceptibilidad al cáncer de mama humano
BRCA2
, llamado
dmbrca2
. Se identificaron previamente lo que parecía ser una reciente expansión de la matriz BRC-repetición de unión RAD51 en el ancestro de
Drosophila yakuba
. En este estudio, examinamos los patrones de variación y evolución de la
dmbrca2
matriz BRC-repetición dentro de
D. yakuba
y sus parientes cercanos. Desarrollamos un modelo de cómo el cruce desigual durante pudo haber producido la forma desarrollada, pero también se observa formas de repetición cortos, típicos de otras especies en el
D. melanogaster
grupo, la segregación dentro de
D. yakuba
y
D. santomea
. Estas formas cortas no parecen ser idénticos por descendencia, lo que sugiere que la historia de
dmbrca2
en el
D. melanogaster
subgrupo ha implicado contracciones unidad de repetición que resultan en formas homoplasious. Llegamos a la conclusión de que la historia evolutiva de los
dmbrca2 Hoteles en
D. yakuba
y quizás en otras especies de Drosophila puede ser más complicado de lo que se puede inferir a partir del examen de las secuencias del genoma único publicado por especie
Visto:. Bennett SM, Mercer JM, Noor MAF (2010) patine lejos de deslizamiento: Cambios en serie y homoplasia en el número de repeticiones en el
Drosophila yakuba
homólogo del cáncer humano susceptibilidad génica
BRCA2
. PLoS ONE 5 (6): e11006. doi: 10.1371 /journal.pone.0011006
Editor: William J. Murphy, Texas A & amp; M University, Estados Unidos de América
Recibido: 20 Abril, 2010; Aceptado el 17 mayo del 2010; Publicado: June 8, 2010
Derechos de Autor © 2010 Bennett et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. La financiación proporcionada por premios de la Fundación Nacional de Ciencia 0509780 y 0715484, y los Institutos nacionales de Salud premios GM076051 y GM086445. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
El gen de susceptibilidad al cáncer de mama humano
BRCA2
codifica una proteína ampliamente estudiado debido a su importancia en la reparación del ADN [1] - [3]. Las mutaciones en la línea germinal humana
BRCA2
conducen a una vida mayor susceptibilidad a cáncer de mama y [4] ováricos, [5], tal vez como resultado de la reparación de ADN ineficiente de doble filamento se rompe (DSBs) durante la recombinación homóloga [6] - [8]. En estudios funcionales,
BRCA2
se ha demostrado que regulan la recombinasa RAD51, una importante filamento de nucleoproteína que se une a ADN dañado, de cadena sencilla en el sitio de DSBs y es crucial para la iniciación del proceso de reparación [9]. BRCA2 se une a RAD51 por asociación con la secuencia de motivos, llamado "BRC se repite" [10], [11], que consisten cada uno de aproximadamente 30 aminoácidos y se encuentran en una región altamente conservada de la
BRCA2
gen. Estas repeticiones conservadas han sido útiles en la identificación de
BRCA2
homólogos a través de muchas especies eucariotas incluyendo,
Arabidopsis thaliana
,
Caenorhabditis elegans
,
Drosophila melanogaster
, y
Trypanosoma brucei
[12], [13]. Los investigadores todavía tienen dificultades para determinar la forma en
BRCA2
coordina sus actividades RAD51 y ssDNA vinculantes para facilitar la transferencia de la proteína RAD51 en el ADN (pero véase [14]), pero Pellegrini y Venkitaraman [9] sugirieron que "primitivo organismos que albergan una versión más simple de la
BRCA2
proteínas proporcionará sistemas de modelo de utilidad. "
un supuestamente más simple
BRCA2
homólogo fue identificado en el organismo modelo
Drosophila melanogaster
utilizando las huellas dactilares de secuencias que representan los principales residuos de
BRCA2-RAD51
interacciones en el locus
CG30169
, llamada más tarde "
dmbrca2
" [15]. Los estudios funcionales de este gen Drosophila han demostrado que interactúa con
D. melanogaster Rad51 gratis (
spnA
), y su alteración afecta las tasas de mitótica y meiótica la reparación del ADN y la recombinación homóloga [15] - [17], lo que lleva Klovstad
et. al.
[16] a la conclusión de que la Drosophila
BRCA2
representa un homólogo funcional del gen que puede ser utilizado para caracterizar su homólogo humano. A diferencia de los mamíferos
BRCA, 2
que tiene ocho BRC se repite, el
D. Se encontró melanogaster
homólogo para contener tres repeticiones [13]. Una investigación posterior de este gen en todos los genomas de Drosophila publicados mostró una gran variabilidad en el número de BRC se repite, con
D. melanogaster Opiniones y su subgrupo tiene tres repeticiones (Figura 1), mientras que otras, las especies más alejadas, como
D. Pseudoobscura
y
D. persimilis
que lleva hasta once repeticiones [18]. Esta variabilidad en el número de repeticiones BRC También se demostró dentro de las especies individuales, así; diez cepas seleccionadas de
D. Pseudoobscura
se encontró que tenían siete, nueve u once BRC se repite, tal vez indicando la evolución reciente dentro de este gen [18].
Este árbol presenta el número de "BRC" se repite desde la secuencia del genoma publicado para cada especies del género Drosophila. El cuadro azul destaca el grupo melanogaster, que tiene un patrón de estabilidad aparente en el número de repeticiones.
A pesar de que existe una gran variación en el número de repeticiones en toda la filogenia de Drosophila, esta variación parece estar ausente en el grupo melanogaster, en el que las especies que han publicado secuencias del genoma contiene toda 3 BRC se repite. La excepción a este patrón en el grupo melanogaster es
D. yakuba
, cuya secuencia publicada del genoma de
dmbrca2
lleva cinco BRC se repite. La observación de esta forma la repetición alternativa plantea varias preguntas: ¿es este mayor número de repeticiones real o un artefacto genoma errores de montaje [19]? Si es real, es esta forma el número de repeticiones superior omnipresente en todos los
D. yakuba
cepas, o es una forma más corta presente en las poblaciones naturales? Podemos inferir que el cambio histórico en el número de repeticiones mediante el análisis de secuencia de nucleótidos? Y finalmente, si existen formas alternativas, podemos detectar pruebas de selección natural asociado en la propagación de la gran forma repetida número? En este estudio, investigamos la secuencia y la evolución del número de BRC repite en el homólogo de Drosophila
Hoteles en BRCA2
D. yakuba
y su especie hermana
D. santomea
y colocarlo en un contexto evolutivo. La comprensión de los patrones observados en estas especies puede nos permitirá conocer mejor los procesos genéticos que afectan a este gen que es importante para el proceso fundamental de la recombinación y la salud humana en general.
Materiales y Métodos
Drosophila
Las acciones
Drosophila yakuba
y
D. santomea
existencias utilizadas en el presente estudio se obtuvieron del Dr. Jerry Coyne [20]. Las moscas se conservaron en etanol absoluto hasta que el ADN se extrajo en nuestro laboratorio.
Aislamiento de ADN, amplificación por PCR y secuenciación
ADN genómico se aisló de adultos de
D. yakuba
y
D. santomea
con un único protocolo de desplazamiento de la mezcla mosca [21]. Los cebadores para la amplificación por PCR fueron diseñados a partir de la
D publicada. yakuba
ensamblaje de secuencias del genoma [22]. Los cebadores diseñados a partir de la
dmbrca2
región se utilizaron para amplificar por PCR los segmentos del gen en 25 volúmenes de reacción l. Los tamaños de los productos de la PCR fueron confirmados por electroforesis en un gel de agarosa al 1%. Los productos de PCR fueron purificados usando ExoSAP-It (USB Corp.) y se secuenciaron utilizando ABI BigDye en las instalaciones de secuenciación de la Universidad de Duke IGSP. Las secuencias fueron depositados en las bases de datos GenBank /EMBL con los números de HM146151-HM146174.
Análisis de datos
secuencias de ADN fueron alineados utilizando computacionalmente Bioedit 7.0.9 [23] y, a continuación, modificados por alineación manual . DNAsp [24] se utilizó para estimar la diversidad de nucleótidos (pi) y D de Tajima [25], para el
dmbrca2
región. Se obtuvieron los valores de D de Tajima para loci similar en
D. yakuba
y
D. santomea En venta Llopart
et. al.
[26] para la comparación.
Hemos examinado las regiones secuenciadas para cada cepa y los compararon con la secuencia completa ensamblada de esta región de la publicación
D. yakuba
genoma [22]. En la región del genoma publicado, se categorizaron los cinco distinta BRC repite utilizando aminoácidos de diagnóstico y las diferencias de tamaño, que suman numéricamente del 1 al 5 del extremo 5 '[18]. Hemos traducido la secuencia de ADN de los exones de las secuencias de nuestras cepas 'y manualmente comparó cada repetición individual a las repeticiones del genoma numeradas utilizando los aminoácidos y las diferencias de tamaño de diagnóstico.
El análisis filogenético se realizó con PAUP 4.0b10 * [27 ]. repetir motivos para BRCA2
D. melanogaster gratis (DME),
D. sechellia gratis (DSE),
D. Simulans
(DSI),
D. erecta gratis (Der), y
D. yakuba gratis (Dya) se obtuvieron a partir de los genomas de referencia FlyBase, y se combina con
D. santomea gratis (DSA) y adicional
D. yakuba
secuencias recogidos para este trabajo.
D. yakuba
fue utilizado como un estándar para la numeración de los motivos de repetición: 1 a 5 de la amino-fin a carboxilo final de péptido.
D. persimilis
repetición 2 (Dpe2) se utilizó como un grupo afuera. Los alineamientos de secuencias se realizaron en Seaview versión 4.0 [28] con ajustes adicionales por ojo. Los motivos de secuencias fueron delineadas por la larga Pfam modelo de 35 aminoácidos ocultos de Markov (HMM) para las repeticiones BRCA2 [29]. Debido a la corta duración y secuencia de niveles moderados de variación de la secuencia, se eligió vecino a participar con no corregidas de p para la estimación de distancias árbol.
Resultados y Discusión
análisis filogenético Antes de la publicación
D. melanogaster
secuencias del genoma de subgrupos para las repeticiones revelaron dos clados principales: todas las repeticiones de número par y todas las repeticiones impares [18].
D. yakuba
repetir 3 (Dya3) pertenecían al clado de número impar, pero no era inusual en la agrupación con repeticiones, ya sea del primer o tercer lugar, sino que queda basal para ambos (véase la Figura 2). El examen visual de la secuencias de aminoácidos y de nucleótidos reveló que el extremo 3 'de Dya3 dio fuerte similitud de secuencia con Dme1 y DER1, mientras que el extremo 5' poseía unos pocos aminoácidos de diagnóstico que se parecían a Dme3 y DER3 (Figura 3). Esta observación sugiere que la desigualdad de cruce sobre eventos (Figura 4) puede haber ocurrido entre la repetición 1 y repita 3 dando lugar a una expansión de repetición de un ancestral de 3 BRC repite a un estado derivado de 5 repeticiones históricamente en el
D . yakuba
linaje. Aunque el Dya2 y Dya4 repite grupo filogenéticamente, el 17% de aminoácidos divergencia de secuencias y la brecha de 18 aminoácidos en la secuencia del genoma publicado de Dya4 en relación con Dya2, indican que tal evento, si es que ocurrió en absoluto, no se produjo en el mismo pasado reciente.
Las secuencias incluidas se derivan de
Drosophila melanogaster gratis (DME),
D. yakuba gratis (Dya),
D. sechellia gratis (DSE),
D. erecta gratis (Der), y
D. Simulans
(DSI). Dya3c y Dya3n indican 5 'y 3' regiones de repetición 3, respectivamente.
Estas traducciones de las secuencias del genoma publicadas de aminoácidos
Drosophila melanogaster gratis (DMEL),
RE. yakuba gratis (Dya),
D. sechellia gratis (DSE),
D. erecta
, y
D. Simulans
(DSI) están alineados y codificados por color para resaltar las similitudes entre ellos. D. yakuba repita 3 (Dya3) se divide en dos mitades que parecen grupo de la siguiente manera, el extremo 3 'con el 1er repeticiones y el extremo 5' con la 3ª repeticiones.
el
D. yakuba
homólogo de
dmbrca2 Hoteles en la secuencia del genoma publicado contiene 5 BRC se repite [18]; sin embargo, cuando visualizamos los productos de PCR amplificados de esta región repetitiva en el 43
D. yakuba
y 18
D. santomea
cepas, se encontraron dos bandas claramente diferente tamaño. El producto más grande, observado en 57 de las 61 cepas, correspondió con el tamaño esperado para 5 repeticiones BRC. Por lo tanto, la forma 5-repetición se observa en la secuencia del genoma publicado no es fijo dentro de las poblaciones naturales. Esta variación en el número de repetición se confirmó mediante secuenciación de las 11 cepas largos y los 4 de las formas cortas, lo que demuestra que las formas largas poseían los esperados 5 BRC se repite distintas, mientras que las cepas cortos poseían solamente 3.
Estamos alineados el predijo secuencias de aminoácidos, los compararon con repeticiones individuales publicados genoma (y específicamente los ácidos aminoácidos que aparecían "diagnóstico" con respecto a Dya2 y Dya4), y ha descubierto lo que parecen ser múltiples formas cortas.
D. yakuba
cepa Cascade 21 y
D. santomea
cepa LAGO 1482, ambos de 3 repeticiones totales, que incluyen 1
ª y 3
er repeticiones que se asemejan a la plena 1
ª y 5
º repeticiones de la publicación
D . yakuba
secuencia del genoma. Su 2
nd repetición, sin embargo, comienza por asemeja al 2
nd genoma de repetición-basado en un aminoácido de diagnóstico y la presencia de una región de 18 aminoácidos específica para Dya2-pero cambia a mitad de camino a través de a parecerse Dya4 basado en 4 aminoácidos de diagnóstico (véase la Figura 5).
D. yakuba
cepa Cascade 24 y
D. santomea
STO cepa 7 también tiene sólo 3 repeticiones, pero mucho más de su segunda repetición se asemeja Dya4, incluyendo el truncamiento de 18 aminoácidos (Figura 5). Esta diferencia sugiere que al menos un evento de truncamiento condujo a la aparición de una nueva forma con 3 repeats- BRC y estas formas cortas pueden ser deleciones independientes de una, 5 forma de repetición de largo.
Estas traducciones de aminoácidos son de Dya2, Dya4,
D. yakuba
cepas Cascade24 y Cascade 21,
D. santomea
cepas STO7 y LAGO1482, Der y DME. Los asteriscos indican por encima de la alineación de los sitios que tienen diferencias entre las secuencias del genoma publicado Dya2 y Dya4, pero no son fijos entre las cepas secuenciadas 5-repetición de
D. yakuba gratis (lo que sugiere que no son de "diagnóstico").
Esta observación de 3 formas de repetición de los alelos homoplasious plantea la cuestión de si la aparente estabilidad de esta forma en el
D. melanogaster
grupo contrasta con las expansiones y contracciones ocultos en el número de repeticiones. Para probar esta hipótesis, hemos examinado de cerca la publicación
dmbrca2
secuencia de
D. erecta gratis (que, por desgracia, no tiene otras cepas disponibles para la secuenciación directa). El
D. erecta página 2
nd secuencia de ácido amino repetición BRC se parecía a las partes de la
D. yakuba página 2
ª y 4
º BRC repite de una manera consistente con lo que se deriva de una deleción de una forma de repetición de cinco (véase la Figura 5). En concreto, se lleva los 18 aminoácidos que están presentes en Dya2 pero no Dya4, pero tiene tres aminoácidos de diagnóstico de Dya4 en su extremo 3 '. Por lo tanto, en contraste con la hipótesis filogenético en la figura 4, la
D. erecta
forma de 3 repeticiones puede haber surgido en segundo lugar, de una forma 5-repetición ancestral. El
dmbrca2
secuencia de
D. melanogaster
también muestra un patrón que pueda ser similar (Figura 5), pero las conclusiones son más difíciles debido a la mayor divergencia de secuencia y los posibles cambios evolutivos múltiples en secuencia por cada aminoácido.
Para probar para la firma de los recursos naturales selección en la forma abundante 5-repetición, se calculó la D Tajima en
D. yakuba gratis (D = -0,68518) y
D. santomea gratis (D = -0,27805). No fuimos capaces de calcular Tajima de la forma corta debido a su muy baja frecuencia entre nuestras muestras (y que algunos de los alelos cortos tampoco son idénticos por descendencia). Sin embargo, se compararon los valores D Tajima del formulario 5-repeat a publicados valores D Tajima de
D. yakuba
y
D. santomea
para otros loci situado de manera similar en las regiones de la reducción de cruce sobre [26], debido a la posición de
dmbrca2
cerca del telómero del cromosoma 2 y los efectos conocidos de las bajas tasas de recombinación en los espectros de frecuencia sitio [ ,,,0],30]. Los valores observados para
dmbrca2
estaban bien dentro de la gama de estos otros valores publicados (
D yakuba
:.. Media = -0,34, -1,03 a 1,05 rango;
D santomea
: media = -0,29, -1,27 a 1,03 rango), por lo tanto, lo que nos permite descartar presiones de selección atípicos en este locus
Llegamos a la conclusión de que la historia evolutiva de los
Hoteles en dmbrca2
D. yakuba
, y tal vez en otras especies del subgrupo melanogaster
Drosophila, es más complicado de lo que puede suponerse a partir del examen de las secuencias del genoma individuales publicados por especie, y nos advierten contra la caracterización de especies enteras o procesos evolutivos de tales datos limitados (por ejemplo, [13]). Se presenta un modelo de una antigua expansión de
dmbrca2
número de repeticiones BRC en
D. yakuba gratis (véase la Figura 4) y sugieren que observó alelos más cortos dentro de
D. yakuba
,
D. santomea
, y tal vez
D. erecta
y otras especies surgieron de las contracciones de una forma ancestral de largo, la producción de alelos homoplasious. Tales expansiones y contracciones serían compatibles con los modelos de la evolución de secuencias repetidas en tándem, tales como los microsatélites (por ejemplo, [31]). Nuestra conclusión es provisional, sin embargo, ya no somos capaces de evaluar el papel de la posible conversión de genes intragenic entre repeticiones (es decir, la evolución convergente) que complica nuestras inferencias - estos procesos son difíciles de disentangle totalmente (por ejemplo, [32])
.
a pesar de las pruebas para el mecanismo preciso de los aumentos históricos propuestos y disminuciones en el número de repeticiones BRC está más allá del alcance de este documento, se argumenta que los hallazgos de la población análisis genéticos y filogenéticos de especies de Drosophila [18], frente a un fenómeno interesante rodea una característica importante de un gen pertinente para la salud humana. Al menos una repetición BRC está presente en todos los organismos en los que el homólogo se ha descubierto, y que parece ser absolutamente necesaria para la mediación de la interacción con RAD51. Se podría plantear la hipótesis de que la selección natural podría favorecer el aumento del número de repeticiones, ya que más repeticiones permitirían la interacción estrecha entre estas dos proteínas esenciales para la reparación de roturas de ADN de doble hebra; Sin embargo, la selección de alelos largos sólo puede extenderse hasta un cierto punto, ya que Gudmundsdottir y Ashworth [2] encontró que la sobreexpresión de una sola repetición BRC en células de mamífero en realidad interrumpe la formación de filamentos de RAD51 y disuelve filamentos premontados creando de ese modo un fenotipo BRCA2 deficientes. La persistencia de múltiples formas más cortas de
dmbrca2 Hoteles en poblaciones de
D. yakuba
y
D. santomea
argumentan en contra de la selección direccional consistente y fuerte para alelos largos. Una posibilidad interesante es explorar si la variación en el
dmbrca2
número de repeticiones BRC se acompaña de cambios en
Rad51
secuencia correspondiente. La investigación continua de los patrones de repetición de aumento y disminución BRC permitirá la futura iluminación de un mecanismo poco conocido que regula la susceptibilidad al cáncer, una cuestión importante en la medicina actual.
Reconocimientos
Los autores agradecen a L . Bukovnik (centro IGSP secuenciación) para la asistencia técnica, J. Coyne para las cepas de Drosophila, VL Roth y L. Stevison en busca de ayuda con las figuras, y C. Smukowski, S. McDermott, R. Varney, y dos revisores anónimos por sus útiles comentarios sobre el manuscrito.