Extracto
El modo evolutivo de una familia de genes múltiples pueden cambiar con el tiempo, dependiendo de la diferenciación funcional y genómica medio ambiente local de los miembros de la familia. En este estudio, se demuestra un cambio tal en el antígeno de melanoma (
MAGE
) familia de genes en el cromosoma X de los mamíferos. El
MAGE
familia de genes se compone de diez subfamilias que se pueden clasificar en dos tipos. genes de tipo I son de origen relativamente reciente, y que codifican epítopos para el antígeno leucocitario humano (HLA) en las células cancerosas. Tipo II genes son relativamente antigua y algunos de sus productos son conocidos por estar involucrados en la apoptosis o la proliferación celular. La historia de la evolución de la
MAGE
familia de genes se puede dividir en cuatro fases. En la fase I, un estado de una sola copia de un gen ancestral y el modo conservadas evolutivamente había durado hasta la aparición de los mamíferos euterios. En la fase II, ocho antepasados subfamilia, con la excepción de
MAGE-C Opiniones y
MAGE-D
subfamilias, se formaron a través de retrotransposition de forma independiente. Esto coincidiría con una ráfaga transposición de
elementos LINE
a la radiación euterios. Sin embargo,
MAGE-C
fue generado por la duplicación de genes de
MAGE-A
. Fase III se caracteriza por una amplia duplicación de genes dentro de cada subfamilia y, en particular, la formación de palíndromos en el
MAGE-A
subfamilia, que ocurrió en un ancestro del catarrinos. Fase IV se caracteriza por la desintegración de un palíndromo en la mayoría Catarrhini, con la excepción de los seres humanos. Aunque el palíndromo se trunca por deleciones frecuentes en los simios y los monos del Viejo Mundo, que se conserva en el ser humano. Aquí, argumentamos que esta retención humano específico se deriva de selección negativa que actúa sobre
MAGE-A
genes que codifican epítopos de células cancerosas, lo que conserva su capacidad de unirse a las moléculas HLA altamente divergentes. Estos resultados se interpretan con la consideración de los factores biológicos que determinan los últimos humanos
MAGE-A
genes
Visto:. Katsura Y, Satta Y (2011) Historia evolutiva de la inmunidad antígeno del cáncer
MAGE
familia de genes. PLoS ONE 6 (6): e20365. doi: 10.1371 /journal.pone.0020365
Editor: Nikolas Nikolaidis, California State University Fullerton, Estados Unidos de América
Recibido: 14 Febrero, 2011; Aceptado: 18 de abril de 2011; Publicado: 10 Junio, 2011
Derechos de Autor © 2011 Katsura, Satta. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por una subvención-en Ayuda de Investigación Científica en Áreas prioritarias (17018032). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
el modo evolutivo de una familia de genes, es decir, el proceso de nacimiento y muerte de los genes y la extensión de la secuencia de divergencia, depende de la divergencia funcional de los genes duplicados y sobre la estructura local del genoma en el que reside la familia [1], [2]. Aquí, la estructura local del genoma se refiere a tándem o repeticiones invertidas (IRS). La evolución de una familia de genes en IRs puede ser particularmente complejo como resultado de la homogeneización por la conversión de genes frecuente y la inestabilidad estructural, como debido a inserciones y /o deleciones frecuentes.
Warburton et al. (2004) encontraron una preponderancia de los grandes, los RI con un alto grado de similitud entre las repeticiones en los cromosomas X e Y (~ 30% de los RI en el genoma humano están en los cromosomas X e Y) [3]. Muchos RI en los ejes X e Y contienen genes que se expresan predominantemente en el testículo [3]. Warburton y sus colegas sugirieron que estos IRs jugar un papel importante en la evolución del genoma humano. Sin embargo, el papel preciso de los RI en la evolución ha seguido siendo poco clara. Por lo tanto, en este estudio, se pretende examinar el ritmo de juego y el modo de la evolución de la familia de genes en los RI, con un enfoque específico en el antígeno de melanoma (
MAGE
) familia de genes, en la que los miembros se encuentran en una gran ( ~ 100 kb) palíndromo en el cromosoma X humano.
MAGE
se identificó originalmente como "un antígeno de melanoma" y más tarde
MAGE
y sus homólogos fueron descubiertos para formar una familia de múltiples genes en genomas euterios [4] - [7].
MAGE
secuencias homólogas se han encontrado en algunos vertebrados (peces cebra y pollo) [8], [9] y los invertebrados (mosca de la fruta) [10]. En el genoma humano, esta familia se compone de 10 subfamilias y cada subfamilia se compone de uno a 15 genes [7]. Además de la clasificación por subfamilias,
MAGE
genes también se pueden clasificar en tipo I o tipo II, sobre la base de sus patrones de expresión y función. los genes de tipo I se componen de tres subfamilias (
MAGE-A
, a -
C
) y tipo II genes de siete subfamilias (
MAGE-D
a -
F
, -
H
, -
L2
,
NDN
,
NDNL2
). genes de tipo I se expresan en células altamente proliferantes tales como tumores, placenta y células de la línea germinal [4]. Tipo II genes, por el contrario, se expresan de forma ubicua en las células somáticas, y se sabe que algunos genes de tipo II de estar involucrados en la apoptosis o la proliferación celular [11].
Todo tipo I
MAGE genes
se encuentran en los cromosomas X antígenos tumorales y de codificación que juegan un papel clave en la inmunidad del cáncer. Los péptidos en el dominio de homología de MAGE humano (MHD), que es 160 a 170 aminoácidos de largo, son epítopos para el antígeno leucocitario humano (HLA) de clase I moléculas [4]. Cuando el antígeno (péptido en la MHD) en una célula tumoral se une a un receptor en una célula T asesina, los ataques de células T a la célula tumoral [4], [12].
HLA
es excepcionalmente polimórficos en el genoma humano y diferente
HLA
alelos se pueden unir diferentes epítopos [13], [14].
MAGE
genes pueden codificar muchos epítopos con el fin de unirse a, o reaccionar con, cada molécula HLA. Por lo tanto, es de interés para rastrear el origen de la asociación entre el
HLA
y
MAGE
, así como para determinar cómo la diversidad genética en la región codificante epítopo ha evolucionado y se ha mantenido.
Muchos
MAGE
se cree que los genes de mamífero específica [7]. Además, la mayoría de los euterios
MAGE
genes tienen un solo exón que codifican una proteína y por lo tanto es probable que se han derivado de retrotransposition de
MAGE-D
[7], porque sólo
miembros
subfamilia MAGE-D tienen 14 exones donde un ORF se codifica entre el segundo a los exones 12 [15]. Sin embargo, la relación entre el tipo I y tipo II genes no se ha investigado a fondo y la forma de diversificación de estos genes aún no está claro.
En este estudio, investigamos la historia evolutiva de la
MAGE
familia de genes. En primer lugar, se realizaron búsquedas de los más antiguamente divergieron
MAGE
genes en los genomas de vertebrados e invertebrados. En segundo lugar, se investigó cómo y cuándo los antepasados de cada tres de tipo I y tipo II siete subfamilias se generaron con especial referencia a su modo de amplificación. En tercer lugar, nos centramos en el
MAGE CD -
Un
subfamilia (una de las subfamilias de tipo I) y demostrar cómo se ha producido la disposición del genoma de los primates. Finalmente, se muestra que algunos
MAGE
humana -
Un
genes han sido objeto de selección negativa en contra de la homogeneización por la conversión de genes con el fin de conservar sus variaciones genéticas entre las secuencias de aminoácidos. Sugerimos que esta selección está relacionada con el mantenimiento de una variedad de HLA de epítopos en las células cancerosas.
Materiales y Métodos
secuencias utilizadas
Humanos (
Homo sapiens
) datos de la secuencia de nucleótidos y la correspondiente información genética se obtuvieron de la base de datos NCBI (construir 36,3; http://www.ncbi.nlm.nih.gov/). secuencias genómicas Syntenic u homólogos de otros primates y mamíferos, incluyendo zarigüeyas (
Monodelphis domestica
) y ornitorrincos (
Ornithorhynchus anatinus
), fueron recuperados de las bases de datos NCBI y Ensembl (http: //USWest .ensembl.org /index.html). Para encontrar synteny conservadas entre el cromosoma X humano y los cromosomas en otros animales, los análisis BLAST utilizando humana
MAGE
se realizaron los genes como las preguntas. Para identificar las secuencias homólogas, utilizamos el 70% como valor de corte para las búsquedas BLAST.
Identificación de estructuras genómicas
Identificación de los RI y repeticiones en tándem se llevó a cabo utilizando un enfoque de matriz de puntos [ ,,,0],dieciséis]. GenomeMatcher [17] se utilizó a continuación para obtener información detallada sobre la secuencia de nucleótidos similitud entre las unidades duplicadas. Un diagrama dibujado por este programa representa el grado de similitud entre secuencias utilizando códigos de color, con el rojo representa similitud mayor que 95%, naranja que representa aproximadamente el 90% -95%, verde que representa aproximadamente el 85% -90%, y azul que representa más baja que 85 %.
analiza la evolución filogenética molecular y
Para estudiar las relaciones filogenéticas entre los
MAGE Buscar miembros de la familia, 158 secuencias de codificación (CDS) en el ser humano, el chimpancé (
Pan troglodytes
), macaco (
Macaca mulatta
), ratón (
Mus musculus
), vaca (
Bos taurus
), perro (
Canis lupus
), zarigüeya, ornitorrinco, pollo (
Gallus gallus
) y el pez cebra (
Danio rerio
) genoma fueron recuperados de la base de datos NCBI (Tabla S1).
MAGE
homólogos También se realizaron búsquedas en la base de datos Ensembl del Xenopus laevis occidental (
Xenopus tropicalis
), lampreas (
Petromyzon marinus
), lancelets (
Branchiostoma floridae
), tunicados (
Ciona intestinalis
) y erizos de mar (
Strongylocentrotus purpuratus
). Para cada una de estas especies, se realizaron búsquedas de
MAGE
homólogos más de los genomas completos. En las búsquedas de homólogos,
MAGE-D
miembros de la subfamilia se utilizaron como una consulta, porque
MAGE-D
se piensa que es lo ancestral
MAGE
subfamilia [7] . Cuando usamos otros humanos
MAGE
secuencias como una consulta, se encontró que las secuencias detectadas ya estaban incluidos en el resultado obtenido utilizando
MAGE-D
.
En el genoma humano , había anotado 37
MAGE
genes en el cromosoma X: 15
MAGE-a
s, 11
MAGE-B Opiniones s, tres
MAGE-C
s, cinco
MAGE-D
s, dos
MAGE-e
s y una
MAGE-H
. Además, dos
MAGE-F
s se encuentran en el cromosoma 3, y
Necdin 2 similar gratis (
NDNL2
o
MAGE-G) ,
como MAGE-2 gratis (
MAGE-L2) y
Necdin gratis (
NDN
) están en el cromosoma 15. Además de los genes anotados, una secuencia homóloga (
psMAGEA similar: psMAGEAL
, NC_000023: 2765558 ‥ 2.770.471) correspondiente a la humana
MAGE
pseudogen,
psMAGEA gratis (NC_000023: 151952946 complementaria ‥ 151 957 859), fue identificado. Gene abreviaturas utilizadas en este estudio siguen las normas utilizadas para los genes humanos
.
Las secuencias obtenidas fueron alineados utilizando Clustal W de software [18] con correcciones manuales. Las secuencias de humano
MAGE-H
, -
A5
, y el ratón -
A9
eran cortas. Estos fueron descartados debido a la inclusión de estas secuencias hizo una breve secuencia de alineación significativa. El número de diferencias de nucleótidos por sitio (
p
-Distancia) se calculó utilizando MEGA4 [19], y la filogenia se haya construido mediante el [20] método disponible en este software vecino a participar (NJ). Filogenias También se construyeron con aleatorizado A (x) ccelerated Máxima Verosimilitud (RAxML) [21] y bayesianos métodos (Bayes). Un programa para el método RAxML es proporcionado por http://phylobench.vital-it.ch/raxml-bb/y que para el método de Bayes es MrBayes 3 [22]. Las alineaciones utilizadas aquí están disponibles bajo petición. DnaSP v5 [23] se utilizó para el análisis de la ventana de divergencia de nucleótidos. RepeatMasker [24] se utilizó para detectar secuencias de intercaladas repite en la base de datos NCBI. Un programa, GENECONV [25] se utilizó para detectar la conversión de genes.
unión al factor de transcripción sitios de
sitios de unión del factor de transcripción (TFBS) fueron examinadas usando la base de datos TRANSFAC R4.3 [26], disponible en el sitio web TFBIND (http: //tfbind.ims.u-tokyo.acjp/) [27]. Para encontrar un candidato TFB, las secuencias aguas arriba de los genes diana fueron alineados, y se eligieron secuencias altamente conservadas. Las secuencias se comprobó la presencia de TFBS anotada en la base de datos.
Resultados
Origen de los vertebrados y mamíferos
MAGE
familia de genes
Para identificar
MAGE
homólogos en lampreas, lancetas, tunicados y erizos de mar, una explosión de búsqueda se llevó a cabo por su genoma y las secuencias EST, utilizando
MAGE-D
genes como consultas. Aunque no hubo genes homólogos detectables en las lampreas y los erizos de mar, los hipotéticos genes en ambos tunicados (XM_002119518) y lancetas (XM_002613563) mostró 37% de similitud de secuencia con el ser humano
MAGE-D1
. Los resultados de la búsqueda BLAST indican que la aparición de
MAGE
gen podría haber ocurrido antes de la divergencia de Protochordata de Chrodata.
En los vertebrados con mandíbulas, el genoma del pez cebra posee un único
MAGE
gen,
Necdin 2 similar gratis (
DareNDNL2
) [8].
NDNL2
genes se encuentran también en humanos, ratones y vacas, pero euterios
NDNL2s ¿Cuáles son procesados genes y tienen un solo exón, mientras que
DareNDNL2
posee ~ 11 exones. Un árbol filogenético basado en secuencias de aminoácidos muestra que euterios
NDNL2
s son Paraphyletic a
DareNDNL2 gratis (figuras 1 y S1.):
DareNDNL2
es un ortólogo "primaria" de euterios
MAGE
genes [28]. Esta relación filogenética (topología del árbol) también es apoyado por los árboles y RAxML Bayes (datos no mostrados).
CDS de 158
MAGE
se utilizaron los genes (véase el cuadro S1). El CDS comparación es de 204 pb de longitud. Después de la alineación, se excluyeron todos los huecos para la construcción del árbol. se muestran agrupaciones subfamilia. El número en cada nodo es el valor de arranque apoyar el nodo. Fish
NDNL2 gratis (
Dare NDNL2
) y mamíferos
NDNL2
aparecen en azul. abreviaturas de nombres de especies son las siguientes: Bota (
Bos taraus
), Capo (
Cavia porcellus
), Dare (
Danio rerio
), Gaga (
Gallus gallus
), Hosa (
Homo sapiens
), Mamu (
Macaca mulatta
), Modo (
Monodelphis domestica
), Mumu (
Mus musculus
), Orna (
Ornithorhynchus anatinus
), y Patr (
Pan troglodytes
). Figura S1 es una versión ampliada de esta figura y tiene texto legible.
Cada uno de los genomas de pollo y rana posee sólo un
gen MAGE
. En ambos casos, respecto a la relación con syntenic
DareNDNL2
, posición del gen en un cromosoma no se pudo confirmar debido a la asignación incompleta de los genes en los cromosomas en estas especies. Sin embargo, dado que las fases en cada exón y el intrón de límites en los CDS de peces, ranas y pollos estaban bien conservadas (Tabla 1), la única
MAGE
genes en la rana y el pollo es probable que sea uno a -uno ortólogos de
DareNDNL2
.
a pesar de que solo un
MAGE
fue encontrado en peces, ranas y pollos, ratones y seres humanos tienen varias subfamilias de
MAGE
genes [7]. Por lo tanto, es interesante investigar
MAGE
homólogos en los monotremas (ornitorrinco) y marsupiales (zarigüeya). Una búsqueda en el genoma completo utilizando BLAST humana
MAGE-D1
como una consulta detecta un
MAGE
-como (
MAGEL
) secuencia en el ornitorrinco y dos
MAGEL
s en la zarigüeya. Estos fueron nombrados provisionalmente
OrnaMAGEL
y
ModoMAGEL1
/
L2
, respectivamente. BLAST búsquedas utilizando otro
MAGE
genes como
DareNDNL2
como una consulta dio como resultado la detección de los mismos genes.
Las zarigüeyas
ModoMAGEL1
y
¿Cuáles son ModoMAGEL2 encuentra en los cromosomas X y 8, respectivamente.
ModoMAGEL2
está codificada por un solo exón, mientras que
ModoMAGEL1
está codificada por 11 exones. Por lo tanto,
ModoMAGEL2
es probable que sea un gen transformados a partir de
ModoMAGEL1
. De hecho,
ModoMAGEL1
y
ModoMAGEL2
formar una monofilia en el árbol (Fig. 1, Fig. S1) y en los árboles construidos por tres métodos diferentes (Nueva Jersey, y RAxML Bayes).
los ornitorrincos
OrnaMAGEL
gen se localiza en el contig Ultra 403 y consta de 10 exones. Aunque el número de exones difiere de la de
ModoMAGEL1
, las fases y tamaños de los exones compartidos están bien conservadas (Tabla 1). Por otra parte, Ultra 403 también contiene el gen de la ubiquitina ligasa
HUWE1 gratis (hect, UBA y WWE dominio que contiene 1), que se encuentra ~600 kb aguas arriba de
OrnaMAGEL
. Un
In situ
estudio confirmó que la hibridación en el ornitorrinco,
HUWE1
se localiza en el cromosoma 6 [29]; Por lo tanto, es probable que este contig es una parte del cromosoma 6. cromosoma Platypus 6 es homóloga a la ancestro autosómica de euterios y marsupiales cromosomas X [29]. De hecho, la región circundante
OrnaMAGEL
en el contig mostró una relación syntenic con la región Xp11 humano. En el genoma humano, la posición correspondiente a
OrnaMAGEL
está ocupada por
MAGE-D2 y
-
D3 gratis (Fig. 2). Humana
MAGE-D2 y
-
D3
posee 13 exones, y las fases y tamaños de los exones se conservan compartidos con
OrnaMAGEL
, así como con
ModoMAGEL1 Opiniones y otro
MAGE
genes en el pollo, rana, y genomas de pez cebra (Tabla 1).
las barras rojas indican
MAGE-D
o
MAGEL
genes en el ser humano o ornitorrinco, respectivamente. Bares y negros indican los nombres de genes syntenic genes entre los seres humanos y los ornitorrincos. Las barras azules y los nombres de genes indican genes que no muestran synteny. Otros
MAGE-D
miembros de la subfamilia,
MAGE-D1
y
MAGE-D4 ¿Cuáles son situado en 51,6 M y 51,9 M en el cromosoma X humano, respectivamente.
filogenia de los mamíferos
MAGE
gen de la familia
Un árbol de humano
MAGE genes
muestra que los tres tipo I
MAGE
subfamilias (
MAGE-a
, -
B Opiniones y -
C
) forman un grupo monofilético que es distinto de los siete subfamilias de tipo II (
MAGE D
, -
e
, -
F
, -
H
, -
L2
,
NDN
y
NDNL2
) (Fig. 3). La evidencia se apoya en cinco sustituciones filogenéticamente informativos (D16Y, K23T, I62V, A113E, y R156Q en una alineación de la MHD, Fig. S3). Además,
MAGE-D
genes forman un grupo monofilético. Aunque el número de nucleótidos utilizados en este análisis es pequeño, está claro que de tipo I subfamilias divergieron más recientemente que tipo II subfamilias (Fig. 3 y la Fig. S2).
El árbol se basa en el número de diferencias de aminoácidos por sitio (
p
-distances). Los genes sino por
DareNDNL2
en el árbol son todos
MAGE
genes que se encuentran en el genoma humano.
DareNDNL2
de pez cebra se utiliza para determinar la raíz del árbol. El número de sitios de comparación es de 92 aminoácidos sin lagunas. El valor de arranque se indica en el nodo. Las secuencias se enumeran en la Tabla S1.
MAGE-E
ha duplicado MHD y la duplicación se ha producido antes de la aparición de los genes de tipo ß.
MAGEE1_1 gratis (
MAGEE2_1
) y
MAGEE1_2 gratis (
MAGEE2_2
) representan el MHD en el lado del terminal N y C de
MAGE-E1 gratis (
MAGE-E2
), respectivamente. El euterios
MAGE-D3
gen codifica trophinin (TRO), que se expresa en la placenta y afecta a la implantación del embrión.
Con la excepción de
MAGE-D
genes, los mamíferos
MAGE
genes tienen un solo exón de CDS. Por lo tanto estos son susceptibles de ser procesados genes derivados de las transcripciones de
MAGE-D
u otros
MAGE-D
procesado genes [7], [30]. Sin embargo, no podemos descartar la posibilidad de que un antepasado de cada subfamilia el resultado de la duplicación de un gen procesada.
Para examinar cómo el antepasado de cada familia de genes se levantó, las secuencias de nucleótidos de una sola representantes de cada subfamilia eran en comparación con los otros usando análisis de matriz de puntos [16]. Si una región codificante entera incluyendo acompañamiento de la región se ha duplicado, el análisis dotter muestra la similitud más allá de los CDS. Por otro lado, un antepasado de cada subfamilia ha sido generada por retrotransposition, el análisis muestra la similitud sólo en el CDS.
Para la mayor
MAGE
genes, el análisis de matriz de puntos reveló que dentro de y entre los de tipo I y II similitudes significativas se observaron sólo en las regiones de CDS, lo que sugiere un retrotranspostion. Una comparación entre
MAGE-A
y
MAGE-C
, por el contrario, era una excepción. La comparación revela la similitud más allá de los CDS, que sugiere que la duplicación de genes basados en ADN. Sin embargo, podría ser posible que otras subfamilias también fueron generados por la duplicación de genes. La similitud de secuencias en las regiones flanqueantes de los duplicados se perdió durante la evolución posiblemente debido a la limitación funcional más débil. De hecho, la extensión de sinónimos divergencias de secuencia entre gens de tipo II y aquellos entre el tipo I y tipo II genes varía de 0,81 a 1,0, de manera que no se observó similitud significativa en una región más allá de los CDS. Aunque, no se encontraron marcadores cladísticos como
Líneas
podrían haber sido informativo para distinguir retrotransposition de la duplicación de genes no hay tales elementos informativos. Por lo tanto, en ausencia de cualquier evidencia de apoyo, llegamos a la conclusión de que
MAGE-C
se duplicó desde
MAGE-A
y que otras subfamilias fueron generados por retrotransposition. En total, ocho inserciones de retrotransposed
MAGE
se han producido en el genoma de Placentalia ancestral y cada gen procesado se convirtieron en un antepasado de una subfamilia. Tras retrotransposition, una duplicación de genes independientes parece haber tenido lugar dentro de cada subfamilia.
La duplicación de genes y la formación palíndromo
Es de destacar que el patrón de agrupamiento de
MAGE-A
difiere de la de
MAGE-B
(Fig. 1, Fig. S1). Cada uno de los 11 humana
MAGE-B Opiniones genes forman un grupo monofilético con ortólogos en otros euterios, mientras que el 15
MAGE-A
genes forman grupos de especies o taxón (Fig. 1 , Fig. S1 y S2). Por otra parte, tres
MAGE-C
genes parecen ser primates específicos. Dentro de los dos tipo II
MAGE
subfamilias, cinco
MAGE-D
y dos
MAGE CD -
E
genes también muestran un patrón de agrupamiento (uno a-uno ortólogos) similar a la de
MAGE-B Opiniones (. Las figuras 1 y 3).
Un total de 16
MAGE-a
genes se encuentran en Xq28, en la región de 148 Mb a 153 Mb, y se agrupan en tres bloques a, B y C (Fig. 4A). Los bloques A y B contienen cinco (
MAGE CD -
A11
, -
A9
, -
A9B
, -
A8 y
psMAGEA7
) y diez (
MAGE CD -
A4
, -
A5
, -
A10
, -
A6
, -
A2B
, -
A2
, -
A12
, -
A3
,
psMAGEA
y
psMAGEAL
) genes, respectivamente, mientras que el bloque C contiene un solo gen (
MAGE-A1) (Fig. 4B y C). Cada uno de los tres bloques posee un palíndromo (Fig. 4C). Sin embargo, en solo bloque B mayoría de los genes (seis de cada diez) están situadas en ambos brazos del palíndromo (Fig. 4C). Tres pares casi idénticas de
MAGE
-
A2
/
A2B
, -
A3
/
A6
,
psMAGEA /psMAGEAL
se encuentra en posiciones simétricas en los brazos (Fig. 4B y 4C), mientras que
MAGE-A12
se encuentra en la región de bucle. Designamos un par de genes o secuencias duplicadas x e y en posiciones simétricas del palíndromo como x /y. La relación filogenética entre 16
MAGE-A
genes, incluyendo
psMAGEAL gratis (Fig. 4B, ver Materiales y Métodos) y con
MAGE-D y usados como afuera reveló que cinco genes en el bloque B se encuentran en una monofilia, mientras que un par de
psMAGEA
/
psMAGEAL
genes están alejadas a otro
MAGE-a
genes.
(
Un
) Una línea diagonal trazada desde la parte superior izquierda a la parte inferior derecha indica la identidad dentro de la región. La región se divide en las tres subregiones, A, B, y C, que contienen cinco, 10 y uno
genes MAGE-A
, respectivamente. (
B Opiniones) El árbol se construyó utilizando el número de diferencias de nucleótidos (
p
-distances) entre los CDS (1916 pb) del 16
MAGE-A
genes. El número en cada nodo representa la probabilidad bootstrap apoyo ese nodo. los valores de arranque superior al 50% se muestran. unidades taxonómicas operacionales (OTU) en magenta, verde y azul representan los genes en las subregiones A, B y C, respectivamente. (
C
) Tres predijeron palíndromos que se muestran en las subregiones A, B y C. En subregión B, la mayoría de los genes se encuentran en los brazos palíndromo putativos.
Bloque B humana se compone de siete unidades duplicadas. Cada unidad es de 10-20 kb de longitud y contiene un
MAGE-A
y un gen asociado condrosarcoma (
CSAGE
) [31] (Fig. 5
Un
). BLAST análisis de los genomas de mamíferos también muestra la ausencia de
CSAGE
homólogos en mamíferos no primates. El palíndromo en el bloque B no se observó en los genomas no primates, como los genomas del ratón, perros y caballos.
(
Un
) Las líneas diagonales desde la parte superior izquierda a la parte inferior derecha indica la identidad dentro de la secuencia de macaco (panel derecho) humano (panel izquierdo) o. Las brechas en la línea diagonal en el macaco indican huecos de secuenciación. Los cuadros de color en la parte inferior de cada panel indican siete unidades duplicadas. Las mismas cajas de colores dentro de una especie indican que están más estrechamente relacionados entre sí que a los demás, mientras que las que existen entre las especies indican ortólogos putativos. (
B Opiniones) palíndromos predijo en subregión B del ser humano (izquierda) o la secuencia (a la derecha) macaco. Números al lado de las líneas indican cada unidad duplicada. (
C
) Un árbol NJ basado en
p
-distances entre las unidades duplicadas (2880 pb) se muestra. El código de color para OTU es el mismo que en (
Un
) y (
B Opiniones).
Entre los primates, el bloque B se pueden identificar en macacos (Fig. 5
Un
). Este bloque también contiene siete unidades duplicadas, pero la forma del palíndromo esperada difiere entre lo humano y de macaco. A diferencia del tallo largo y corto circuito de la observada en el ser humano, en el macaco, un lazo grande una estructura tallo corto y se predice (Fig. 5
B Opiniones). Además, la orthology de unidades entre macacos y seres humanos es curioso dado sus posiciones. Por conveniencia, la designación de las siete unidades duplicadas en el bloque B como
h1
a
H7
en los seres humanos y
m1
a
página 7 m en macacos ( Fig. 5
Un
) y luego examina sus relaciones filogenéticas (Fig. 5
C
). Unidades de
h1
/
h7
albergar
psMAGEAL
y
psMAGEA
genes son ortólogos a
m1
/
. Unidades de
h3
/
h5
con
genes MAGE-A2 /A2B ¿Cuáles son ortólogos a
M5
con
MAGE-A2
: sin embargo, en macacos,
M5
, ubicado en el bucle y no hay un socio (una secuencia altamente similar) de
M5
en el bloque. La unidad de
h4
con
MAGE-A12
es orthologous a
m3
, pero en macacos esta unidad no contiene un
MAGE
gen (Fig . 5
Un
). Por otra parte, las relaciones entre los
h2
/
h6
,
página 2 m,
m4
y
página 6 m son un tanto confuso, a pesar del hecho de que el
maeg-A3 /A6
está en el
h2
/
h6 Opiniones y tres homólogos posibles (
MAGE-A3
, -
3L
, y -
A3L
) se encuentran en
página 2 m,
m4
y
página 6 m. El
p
-Distancia entre los
h2
y
h6
fue de 0,7% (± 0,2), mientras que el
p
-distances entre los
m página 2,
m4
y
página 6 m son mucho mayores (12,1%) que el primero. Las distancias por pares de unidades entre humanos y macacos variaron de 8,3% (± 0,5) a 17,7% (± 0,7), que es demasiado grande para una relación de ortólogos. La filogenia tampoco apoyó una relación ortólogos entre cada una de las tres unidades en macacos (
página 2 m,
m4
, o
m página 6) y
h2
/
h6 gratis (Fig. 5
C
).
a fin de examinar las relaciones ortólogos de estas unidades duplicadas, marcadores cladísticos como
SINE
s y
Línea
s, se pidió su uso de software RepeatMasker [24] (Fig. 6). En general, la disposición de
SINE
s,
Línea
s,
LTR
s, y repeticiones cortas en el bloque B muestra una similitud parcial entre el genoma humano y de macaco. La posición y el tipo de secuencias repetitivas que se encuentran a través de la totalidad de
m2
región son casi idénticos a los encontrados en la mitad distal del
h2
. Se observa una distribución similar de las secuencias repetitivas entre una región de
M5
y
h5
, y la similitud se observa también entre una parte de
m4
y el de
h4
. Sin embargo, especies específicas de regiones parecen estar presentes en cada genoma. En los seres humanos, la región es ~ 40 kb de longitud y se extiende desde el medio de
h2
a
h4
, mientras que en los macacos, la región específica de la especie es ~ 30 kb y se extiende desde el centro de
m2
a
m4
. A diferencia de los resultados de los análisis de filogenia y la distancia genética (Figs. 5
C
y 6), los marcadores cladísticos mostraron que
H2
con humanos
MAGE-A6
y
m2 Vaya con el macaco
MAGE3L ¿Cuáles son ortólogos de hecho el uno al otro.
triángulos coloreados muestran elementos intercalados (
líneas
o
Sines
) ,
LTR
, transposones de ADN (
ADN-TP
) o repeticiones simples (
SR
) encontrado en el genoma humano o de macaco, respectivamente. Paréntesis bajo cada línea indican las unidades duplicadas. flechas de color rosa claro indican la estructura de palíndromo. La flecha de color azul claro indica lagunas de secuenciación en macacos. Letras A a L y A 'a i' en los triángulos indican los elementos de inserción ortólogos en el genoma humano y de macaco. La barra de color verde claro indica una región y líneas punteadas humano-o-macacos específica indican el límite entre las regiones específicas de las especies y ortólogos.
Humano-específica palíndromo y el gen de conversión
La el análisis de matriz de puntos reveló que el palíndromo en el bloque B es evidente sólo en los seres humanos. Aunque lagunas de secuenciación existen actualmente en el chimpancé y el genoma orangután, las secuencias disponibles demostraron que el palíndromo en el bloque B es menos aparente en estos dos monos que en los seres humanos (Fig. 7). Nos parsimonia inferimos el estado ancestral de la palíndromo mediante el uso de información de la secuencia del genoma de las especies de primates existentes.
El tamaño de la ventana es de 500 pb con ningún solapamiento entre las ventanas adyacentes. rectángulos de color en la parte inferior de la figura indican la unidad duplicada que incluye el
MAGE
genes (flechas de color rosa claro). La ordenada representa la divergencia de nucleótidos (
d
) y la abscisa representa la posición (en pb) con respecto al centro del bucle (posición cero, flecha azul). El área que rodea una línea de puntos rojos indican la alta región divergido en
MAGE-A3
y
MAGE-A6
.
Los genes sobre palíndromos pueden experimentar la conversión de genes frecuentes . De hecho, un análisis de ventana de 500 pb con un intervalo de no superposición revela que las secuencias de palíndromo en brazos son casi idénticos (Fig. 8).