Extracto
Antecedentes
La identificación de los genes que están implicados causalmente en la oncogénesis es un objetivo importante en la investigación del cáncer. Se estima que 10 a 20% de las mutaciones de genes relacionados con el cáncer resulta en saltar de uno o más exones en los transcritos codificados. Aquí nos informe sobre una estrategia para la detección de una forma global para este tipo de eventos de omisión de exón usando la correlación basada patrón (PAC). El algoritmo de PAC se ha utilizado anteriormente para identificar las variantes de empalme expresadas diferencialmente entre dos subgrupos predefinidos. A medida que los cambios genéticos en el cáncer son muestra específica, hemos probado la capacidad de la PAC para identificar los exones expresados de forma aberrante en muestras individuales.
Principales conclusiones
Como prueba de principio, hemos probado la PAC estrategia en muestras humanas de cáncer de los cuales la secuencia de codificación completa de ocho genes del cáncer había sido analizada para detectar mutaciones. PAC detecta los siete mutantes de omisión de exón entre las líneas celulares de cáncer 12. PAC también identificado mutantes de omisión de exón en muestras clínicas de cáncer aunque la detección se vio comprometida debido a (de tipo salvaje) la transcripción de expresión heterogénea. PAC reducido el número de genes /exones para su posterior análisis mutacional candidatos por dos o tres órdenes de magnitud y tenía una tasa positiva verdadera sustancial. Es importante destacar que, de 112 exones atípicos seleccionados al azar, análisis de secuencias identificó dos nuevos eventos, la omisión de exón dos nuevos cambios de base y 21 ya se ha informado cambios de base (SNP).
Conclusiones
La capacidad de los PAC a enriquecer las transcripciones mutados e identificar los cambios genéticos conocidos y nuevos confirma su idoneidad como una estrategia para identificar los genes del cáncer candidato
Visto:. Schutte H, F Elstrodt, Bralten LBC, Nagel JAI, Duijm e, Hollestelle a, et al. (2008) Expression Arrays Exon como una herramienta para identificar nuevos genes del cáncer. PLoS ONE 3 (8): E3007. doi: 10.1371 /journal.pone.0003007
Editor: Christopher Arendt, Sanofi-Aventis, Estados Unidos de América
Recibido: 10 Junio, 2008; Aceptado: 31 de julio de 2008; Publicado: 20 Agosto 2008
Derechos de Autor © 2008 Schutte et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo con el apoyo de la Fundación Susan G. Komen del cáncer (BCTR0601309), el holandés Cancer Society Koningin Wilhelmina Fonds, DDHK 2002-2687 y Erasmus MC Mrace 2005.
Conflicto de intereses: los autores han declarado que no hay intereses en competencia existir.
Introducción
el cáncer es impulsada por mutaciones en los genes que controlan la proliferación de las células, su supervivencia y su integridad. Pantallas destinadas a la identificación de tales genes del cáncer a menudo usan localización cromosómica y /o propiedades funcionales para seleccionar genes candidatos para el análisis posterior mutación [1] - [4]. Aunque muchos loci genéticos de este candidato han sido identificados, el análisis de la mutación mucha mano de obra representa un grave obstáculo para encontrar el gen del cáncer correspondiente. Otras estrategias de búsqueda de genes se han centrado en aberrantes patrones de expresión génica para identificar candidatos. Por ejemplo, los mutantes de genes que dan lugar a codones de terminación prematuros se identificaron mediante la búsqueda de los genes que se expresan específicamente después de la inhibición química de absurdo mediada por la decadencia de ARN [5]. Por otra parte, los genes de fusión en el cáncer de próstata fueron identificados por pruebas de detección de valores atípicos en una gran cohorte de perfiles de expresión de genes [6].
mutaciones del gen de cáncer humano con frecuencia dan lugar a la omisión de uno o varios exones de las transcripciones codificadas [7] - [9]. De omisión de exón mutaciones pueden ser causadas por sustituciones de nucleótidos dentro de los sitios de empalme de consenso o por deleciones que abarcan los exones enteras. Además, las mutaciones de omisión de exón pueden ser causados por relativamente pequeñas intragenic inserciones, deleciones o duplicaciones. A pesar de que las mutaciones-omisión de exón representan aproximadamente el 10-20% de todas las mutaciones genéticas relacionadas con el cáncer [4], [9] - [12], ningún método de alto rendimiento ha estado disponible para la detección de tales mutaciones. A continuación, describimos correlación basada Patrón (PAC) como un enfoque para identificar los genes del cáncer candidato por la detección de eventos de omisión de exón de una manera global. El análisis detallado de mutación a continuación, se limita sólo a los exones identificados atípicos-PAC. Como prueba de principio, se demuestra la eficacia de la estrategia del PAC en las mutaciones de omisión de exón previamente identificados en líneas celulares de cáncer de mama y en muestras clínicas de tumores cerebrales. También demuestran que la PAC puede identificar nuevos omisión de exón eventos con cambios genéticos subyacentes en los genes conocidos de cáncer y en los exones identificados atípicos-PAC seleccionados al azar.
Resultados
Correlación de identificación de valores atípicos por el exón patrón basado (PAC)
en este estudio, hemos desarrollado un nuevo método para detectar eventos de omisión de exón en muestras humanas de cáncer. Debido a que las mutaciones en el cáncer a menudo son muy heterogéneos con respecto a su ubicación intragenic, tumores individuales a menudo expresan especies de ARN únicas. La detección de mutaciones que dan lugar a saltos de uno o más exones en la transcripción codificado por lo tanto requiere la detección de únicos, el exón-omitido, transcripciones dentro de una cohorte muestra específica. En pocas palabras, los perfiles de expresión a nivel de exón se generan utilizando Affymetrix Humanos Exon Arrays, que determinan el nivel de expresión de prácticamente todos los exones presentes en el genoma humano. La correlación basada patrón (PAC) algoritmo se utiliza para calcular el nivel de expresión de cada exón predicho (o conjunto de sondas). Luego se identifican los exones atípicos restando el nivel de expresión de los exones predicha a partir de su nivel de expresión medido, con valores que equivale a cero cuando el nivel de expresión medido de un exón fue similar a su nivel de expresión predicho (formulado en detalle en Métodos). El algoritmo de PAC se ha utilizado para identificar corte y empalme diferencial entre grupos predefinidos [13]. En este estudio, hemos probado el algoritmo PAC por su capacidad para identificar los exones expresados de forma aberrante en muestras individuales de una cohorte bien definido de líneas celulares o tumores. PAC normaliza eficazmente la variabilidad en los niveles de expresión génica entre las muestras y, en una sola muestra, normaliza la variabilidad en la intensidad de la señal entre los conjuntos de sonda de la misma transcripción (Fig. 1).
(A) los datos de expresión normalizada de todos los exones en el gen
PTEN
. Cada conjunto de sonda exón está representada por un punto en la línea continua; múltiples conjuntos de sonda pueden ser dirigidas contra el mismo exón. (B) PAC normaliza la variabilidad en los niveles de expresión génica entre las muestras y, en una sola muestra, la variabilidad en la intensidad de la señal entre los conjuntos de sonda de la misma transcripción. por lo tanto, el cálculo PAC permite la detección rápida de saltar de
PTEN
exón 4 en la línea celular de cáncer de mama MDA-MB-468 debido a un
PTEN
c.253 + 1G & gt; T del sitio de empalme mutación que nos previamente había identificado [17].
PAC detecta eventos de omisión de exón en líneas celulares de cáncer de mama
Hemos probado la viabilidad de la estrategia de PAC en un panel de 12 células de cáncer de mama humano líneas que habían sido seleccionadas para las mutaciones en los genes supresores tumorales siete:
BRCA1
,
CDH1
,
MAP2K4
,
PTEN
,
p16
,
p53
y
RB1
[14] - [18], y los resultados no publicados). análisis de la mutación se realizó por secuenciación de las secuencias de codificación completas de los genes y el análisis de todas las mutaciones en ambos fragmentos de genes genómicos y transcripciones. En conjunto, las líneas celulares 12 contenían siete mutantes de genes que deben ser detectable por PAC, ya que dieron lugar a la omisión de los ocho exones de entre cuatro genes supresores de tumores (mutaciones se detallan en la Tabla 1). Hemos explorado la estrategia PAC en diferentes niveles de corte, la identificación de los exones de valores atípicos que se expresaron menos de 16 veces, 8 veces, 4 veces, 2,8 veces y 2,5 veces de su nivel de expresión predicho (es decir, valores de PAC de -4.0, -3.0, -2.0, -1.5 y -1.3, respectivamente). exones se identificaron atípicos sin el conocimiento previo de los datos de mutación.
Del total de 3,4 millones de conjuntos de sonda de la base que ensayamos para las líneas 12 celulares (290.000 conjuntos de sonda núcleo por muestra), PAC identificaron 21151 (0,6%) sonda fija a valor atípico PAC -4,0 y 94.590 (2,8%) sonda fija al valor atípico PAC -1.3 (Fig. 2A). Todos los conjuntos de sonda a valores PAC & lt; -2.0 (conjuntos de sondas correspondientes a 34.137 31,357 10.247 genes y exones) se enumeran en el cuadro complementario S1 de datos. Cuando todos los valores de PAC se representan gráficamente en un histograma de frecuencias, se observa una cola hacia el extremo negativo (Fig. 2A). Esta distribución sesgada da una estimación aproximada de la tasa de falsos positivos en los distintos niveles de APA. PAC de los siete genes supresores de tumores completamente caracterizadas en las líneas de células de 12 análisis de 1.200 exones (1.752 conjuntos de sonda) que participan. PAC detecta correctamente seis de los ocho exones saltar al usar el valor PAC -4,0, siete saltamos se detectaron los exones a su valor PAC -2,0 y los ocho exones se saltó se detectaron por su valor PAC -1.3 (Fig. 2C). Es importante destacar que el número de falsos positivos exones de valores atípicos se redujo sustancialmente a valor PAC -4,0 en comparación con el valor PAC -1,3, lo que resulta en un aumento de la tasa positiva verdadera del 9% al 24% de los exones identificados atípicos (Fig. 2D) . Para la comparación, toma de muestras aleatoria de exones 24/1200 tiene un & gt; 85% de probabilidad de no encontrar ninguna verdadera mutación positiva y sólo a & lt; 10
-8 oportunidad de encontrar 6 o más. Para los genes del cáncer conocidos y utilizados en nuestro estudio, la verdadera tasa positiva de nuestro enfoque de este modo supera con creces exón selección aleatoria. A este respecto, la reducción del número de genes candidatos de falsos positivos puede inicialmente ser mucho más beneficioso para un proyecto de búsqueda de genes de la identificación precisa de todos los verdaderos exones atípicos positivos. En conjunto, nuestros resultados muestran que la estrategia PAC es fiable en la detección de mutantes de omisión de exón en líneas celulares de cáncer.
(A) y (B) Número total de conjuntos de sonda de valores atípicos detectados-PAC de entre 290.000 conjuntos de sonda de núcleo en 12 líneas celulares de cáncer de mama y en 14 glioblastomas, respectivamente. (C) Número de exones omitidos detectados por PAC como un porcentaje de los ocho omiten exones presentes en las líneas celulares de cáncer de mama, o como un porcentaje de la 36 omite
EGFR
exones presentes en los glioblastomas (véase la Tabla 1 ). (D) Número total de exones atípicos (positivos verdaderos + falsos) y el número de exones verdaderos valores atípicos positivos detectados por el PAC entre los siete genes supresores de tumores y el
EGFR
oncogén. Los verdaderos exones atípicos positivos incluyen todos PAC detecta los exones omitidos y dos mutaciones sin sentido (
PTEN
c.274G & gt; C en CAMA1,
MAP2K4
c.551C & gt; G en MDA-MB-134VI).
rendimiento PAC en las muestras con la transcripción de expresión heterogénea
al igual que otros métodos de cribado genético, el PAC es el más adecuado para detectar cambios genéticos homocigotos. Por ejemplo, el valor más bajo PAC cuando 50% transcripciones de tipo salvaje están presentes (como puede ser el caso de un cambio genético heterocigotos) es -1,0. La detección de un tanto comprometida de los exones omitidos a valor PAC -4.0 en comparación con el valor PAC -1.3 en nuestro panel de líneas celulares de cáncer de mama, por lo tanto puede haber sido causado por la expresión de una segunda transcripción aberrante (es decir, seis frente a los ocho exones omitidos) que todavía incluye (parte de) el exón. De hecho, un segundo
CDH1
longitud transcripción de menor intensidad se detectó en CAMA-1 (Fig. 3A), el mutante del sitio de empalme que se habían detectado en función del valor PAC -1.3.
Saltarse de
CDH1
exón 11 en mama línea celular de cáncer CAMA-1 sólo se detectó a valor PAC -1,3, probablemente debido a la expresión de una segunda variante de transcripción aberrante (*) que se ha detectado mediante RT-PCR convencional. (B) Expresión de
EGFR
transcripciones se detectó en muestras de glioblastoma por tiempo real RT-PCR, usando cebadores diseñados para hibridar dentro de la región de deleción del exón 2-7 de la
EGFRvIII
isoforma ( barras grises) o fuera de la región eliminación (barras negras). Las diferencias en los valores de Ct entre los dos fragmentos de transcripción son indicativos de
EGFRvIII
los niveles de expresión de isoformas. Las cinco muestras con el
EGFRvIII
isoforma también expresaron cantidades significativas de tipo salvaje
EGFR
transcripciones, es probable que comprometen detección de las demás por el PAC (indicadas por "detectado" y "no detectado"). De tipo salvaje, las muestras con transcripciones normales; Controles, muestras cerebrales no malignas.
Para más culos el rendimiento del PAC en las muestras con (de tipo salvaje y mutante) heterogénea expresión de la transcripción, se realizó PAC en 14 especímenes clínicos de glioblastoma (seleccionado para contener & gt; 70% del tumor núcleos) que tenía amplificaciones genómicas de la
EGFR
oncogén. Los glioblastomas con
EGFR amplificaciones
llevan con frecuencia una deleción de los exones intragenic 2 a 7, lo que resulta en la expresión de la constitutivamente activa
EGFRvIII
isoforma [8], [19]. Sin embargo, los glioblastomas que expresan el
EGFRvIII
isoforma también expresan con frecuencia de tipo salvaje
EGFR
transcripciones. Esta heterogénea
EGFR
expresión se relaciona con la amplificación de la
EGFR
locus antes de la deleción de los exones [20], aunque las células no malignas en las muestras de glioblastoma también pueden expresarse
EGFR
. De los catorce muestras de glioblastoma utilizados en este estudio, seis expresaron
EGFRvIII gratis (un total de 36 exones omitidos) de los cuales cinco también expresaron niveles significativos de tipo salvaje
EGFR
transcripciones según lo determinado por cuantitativa PCR en tiempo real (qPCR) (Fig. 3B) (ARN quedaba poco de la sexta muestra con
EGFRvIII expresión
para llevar a cabo qPCR).
del total de 4,1 millones de conjuntos de sonda central que que ensayaron para estas 14 muestras (290.000 conjuntos de sonda núcleo por muestra), PAC identificó 1.646 (0,04%) sonda fija a valor atípico PAC -4,0 y 39.936 (1,0%) sonda fija al valor atípico PAC -1.3 (Fig. 2B). por lo tanto PAC identificó tres a diez veces menos exones de valores atípicos en los glioblastomas, en comparación con las líneas celulares de cáncer de mama (Fig. 2A). Todos los conjuntos de sonda a valores PAC & lt; -2.0 (11287 sonda fija, correspondientes a 10.903 exones y 6.264 genes) se enumeran en el cuadro complementario S1 de datos. Este pequeño número de exones de valores atípicos en los glioblastomas puede estar relacionado con su histopatología homogénea y sus muy similares perfiles de expresión de genes [13], [21], a la presencia de células no neoplásicas en las muestras tumorales, o pueden reflejar sesgos de muestreo debido a los pequeños tamaños de cohortes.
PAC de la
EGFR
gen en los 14 glioblastomas implicó el análisis de 392 exones (434 sonda fija). PAC detecta dos de seis
EGFRvIII
tumores que expresan (12 de los 36 exones omitidos) en PAC valores de -2,0 y menor (Tabla 1 y Fig. 2C). De los dos glioblastomas con
EGFRvIII Windows que habían sido detectados por el PAC, uno tenía significativamente (es decir, & gt; 5 veces) más mutante de tipo salvaje
EGFR
transcripciones. En este tipo de tumor, la diferencia de valor de Ct era & gt; 2 entre los fragmentos de qPCR en el interior (que mide sólo de tipo salvaje
EGFR
transcripciones) y fuera (la medición tanto de tipo salvaje y
EGFRvIII
transcripciones) de la
EGFR
exón 2-7 supresión región (Fig. 3B). El otro glioblastoma tenía una diferencia de nivel de expresión similar entre los de tipo salvaje y
EGFRvIII
transcripciones (Ct diferencia de valor de ~ 1,5) como los tres glioblastomas que no habían sido detectados por el PAC, pero que tenían menor
EGFR general los niveles de transcripción
. Parece que la detección de la PAC
EGFRvIII
isoforma está determinado por el nivel de expresión general de
EGFR
transcripciones en combinación con la relación de
EGFRvIII
y de tipo salvaje
EGFR
transcripciones, donde las muestras con demasiado alto
EGFR
los niveles de transcripción pueden escapar a la detección de PAC debido a la saturación de la sonda fija involucrados. Estos resultados muestran que la estrategia PAC puede detectar mutantes de omisión de exón en muestras clínicas de cáncer si el nivel de relación mutante /de tipo silvestre transcripción es alta y cuando la sonda fija están dentro del rango de detección lineal de la micromatriz.
PAC desempeño en la detección de valores atípicos exones recurrentes
rendimiento PAC también puede ser impugnada por los exones atípicos recurrentes. Tales exones omitidos con frecuencia se traducirá en una subestimación de la relación de exón /transcripción en el algoritmo de PAC y así aumentar los valores de APA. Por lo tanto, se evaluó el desempeño de PAC en la detección de valores atípicos exones recurrentes mediante la sustitución reiterada de
EGFRvIII
expresando muestras con muestras que expresan sólo de tipo salvaje
EGFR gratis (Fig. 4A). Cuando seis de las 14 muestras expresan
EGFRvIII
, la deleción de los exones 2-7 en GBM67 no es detectada por el PAC. Los valores PAC de hecho disminuyó con la disminución de las relaciones de tipo salvaje en comparación con las muestras mutantes. Sin embargo, la disminución fue relativamente pequeña y resultó en la identificación de uno solo de los seis exones eliminados una vez que la relación había disminuido a una muestra mutante de las 14 muestras. También hemos simulado la detección de mutaciones recurrentes PAC con líneas celulares de cáncer de mama de dos, de los cuales se había saltado HCC1937
RB1
exón 22, y que ya fueron capaces de identificar el mutante de entre dos muestras hasta incluso cinco mutantes de entre seis muestras (Fig. 4B). Estos experimentos de simulación indican que el PAC se desempeña bien en la identificación de mutaciones recurrentes de omisión de exón
.
(A) Experimento de simulación para determinar el rendimiento del PAC en la detección de eventos recurrentes de omisión de exón entre las muestras de glioblastoma clínicos, en los que las muestras mutantes expresan el
EGFRvIII
isoforma con deleción de los exones 2 a 7. La cohorte de 14 glioblastomas incluyó seis muestras de mutantes que fueron reemplazadas por las muestras de tipo salvaje a través de la reiteración, en función de su posición de izquierda a derecha en la Fig. 3B. Supresión de
EGFR
exón 6 en la muestra GBM67 sólo se detectó la muestra mutante como único. (B) Experimento de simulación para determinar el rendimiento del PAC en la detección de eventos de omisión de exón recurrentes entre las líneas celulares de cáncer de mama, utilizando la línea celular de tipo salvaje CAMA-1 y el
RB1
exón 22 HCC1937 supresión mutante. Las dos líneas celulares se analizaron bajo varios tamaños de cohortes, ya sea con el de tipo salvaje o la línea celular mutante como única muestra. La muestra mutante todavía se detectó a valor PAC -2.0 con cinco mutantes recurrentes entre seis muestras. El nivel medio de expresión de
RB1
exón 22 cayó por debajo de PLIER 50 cuando se simularon más de cinco mutantes, lo que impide el análisis PAC (véase Materiales y Métodos).
Detección de sustituciones de nucleótidos y nuevos cambios genéticos por PAC
El rendimiento del PAC se evaluó mediante el análisis de valores atípicos exones seleccionados de entre todos los candidatos a valor PAC-≤ 2.0 en líneas celulares de cáncer de mama y las muestras de glioblastoma clínicos. En total, 44 y 68 exones atípicos fueron seleccionados en líneas celulares de cáncer de mama y las muestras de glioblastoma respectivamente. Análisis de secuencias de PCR amplificado exones atípicos identificaron dos nuevos eventos omisión de exón y dos nuevos cambios de base genética en muestras de glioblastoma, así como una serie de cambios de bases se informó anteriormente (SNPs homocigotos) en líneas celulares de cáncer de mama (n = 5) y glioblastomas ( n = 16). RT-PCR resultados del experimento se detallan en la tabla de datos suplementaria S2
.
La mayoría de los cambios genéticos identificados por el PAC fueron cambios de nucleótido único, tanto en líneas celulares de cáncer de mama (cinco conocidos SNPs) y en glioblastomas (nueva base para dos cambios y 16 SNPs conocidos). Por otra parte, dos de cada diez mutaciones puntuales oncogénicos previamente identificados que no dio lugar a la omisión de exón eventos fueron también detectados PAC en nuestra cohorte de líneas celulares de cáncer de mama:
MAP2K4
c.551C & gt; G en MDA-MB-134VI y
PTEN
c.274G & gt; C en CAMA-1; [16], [17] (Fig. 5). desajustes de nucleótido único se han utilizado para definir la especificidad de hibridación en otras plataformas de microarrays de Affymetrix. Por analogía, las sustituciones de nucleótido único en el cáncer también pueden causar la hibridación reducida a las sondas en el microarray y por lo tanto ser detectada como exones atípicos por el PAC. De hecho, la totalidad de la PAC detectaron cambios de base y SNPs fueron localizados centralmente dentro de la región de selección sonda conjunto y se superponen con varios de sus sondas individuales (Fig. 5).
(A) PAC predice que salta de la 5 ' final de
PTEN
exón 5 en la línea celular de cáncer de mama CAMA-1. Esta línea celular contiene una sustitución de nucleótidos en el exón identificados. Este cambio de base no induce la omisión de exón, pero está situado en el centro dentro de las tres sondas de la sonda conjunto (B). La ubicación central sugiere que esta mutación provoca una afinidad reducida a las sondas en el exón-matriz.
Uno de los PAC identificados novela de omisión de exón eventos fue predicho para dar como resultado una deleción de los cuatro extremo 3 ' exones de
EGFR gratis (Fig. 6A). Este evento de omisión de exón se debía a una deleción genómica como se determina usando semi PCR cuantitativa en el ADN genómico tumor. En comparación con el "fin de la
EGFR
locus en GBM157, 3 'del extremo 5 presenta una menor amplificación (Ct -2,5), mientras que otras muestras mostraron igual de amplificación entre los extremos 5' y 3 'del gen (Ct 0,3 ± 1,9). Similar 3 'deleciones en
EGFR
se han observado previamente en los gliomas [19]. El segundo caso de omisión de exón predicho por PAC daría lugar a una deleción del exón 30 en el
FCGBP
cDNA (Fig. 6B). Esta deleción provocará un desplazamiento del marco que se prevé que resultará en una proteína truncada. La ausencia del exón 30 fue confirmada por RT-PCR y análisis de secuencias (Fig. 6C). Novedosos identificados los cambios de una sola base incluyen un único cambio de base 1934C & gt; G (S645C) en el
EGFR
gen, (Figura 6A y D.), Y un solo cambio de base 946G & gt; A (G316R) en el
TLE2
gen (Fig. 6E). El G316R (946G & gt; A) mutación en
TLE2
se traduce como "patológico" por PMut (mmb2.pcb.ub.es:8080/PMut/) y "no tolerará" por SIFT abrir y cerrar (blocks.fhcrc. org /tamizar /SIFT_BLink_submit.html). En resumen, la novela de omisión de exón eventos y cambios de base identificados por el análisis de un conjunto seleccionado de exones atípicos confirma la idoneidad de la PAC para identificar los genes del cáncer candidato.
Detección (A) PAC de los cambios genéticos nuevos en
EGFR
. PAC predijo que salta de los últimos cuatro exones del GBM157 y el extremo 5 'del exón 17 en GBM172. PCR semi-cuantitativa sobre ADN genómico confirmó la deleción en GBM157 (no mostrado). (B) PAC predice la omisión del exón 30 en el
FCGBP
gen en GBM60. (C) RT-PCR confirmó la
FCGBP
omisión de exón evento en GBM60; otros tumores no mostraron esta omisión de exón. (D) La secuenciación directa identificó un único cambio de base en
EGFR Hoteles en GBM172 (como se predijo por el PAC, ver Fig. 6A). (E) La confirmación de una PAC predijo el cambio en el
TLE2
gen en GBM60. La sustitución de nucleótidos se superpone con sondas individuales de la sonda conjunto.
Discusión
Hemos desarrollado un enfoque que utiliza la correlación basada patrón (PAC) para la detección de mutaciones en el gen del cáncer que causan el exón saltar en las transcripciones codificadas. Se demuestra que la PAC detecta correctamente todos los siete mutantes de omisión de exón previamente identificados en líneas celulares de cáncer de mama y dos de los seis mutantes en muestras clínicas de glioblastoma. Los verdaderos y falsos positivos se determinaron las tasas en los distintos niveles de severidad. Es importante destacar que, el PAC identificó una serie de cambios genéticos nuevos, incluidas las que afectan empalme, que anteriormente no se podían detectar. Estos cambios genéticos nuevos están ya sea en los genes conocidos de cáncer (
EGFR
), dan lugar a un desplazamiento del marco (
FCGBP
) o son prestados "no son toleradas" por los algoritmos de predicción de genes PMut y cribar abrir y cerrar (
TLE2
). Se requieren experimentos adicionales para determinar si los cambios en los nuevos genes de cáncer candidato (
FCGBP
y
TLE2
) son, en efecto oncogénico. Un número significativo de sustituciones de nucleótidos que se encuentran dentro de la región de selección de conjuntos de sonda también son PAC detectado (Fig. 5). Nuestros resultados clasifican PAC como un enfoque fiable para la detección de los genes del cáncer candidato de una manera global.
perfiles de expresión génica a nivel de los exones individuales se ha convertido recientemente posible a través de la liberación de exón arrays. Aquí, hemos explorado la eficacia de la PAC para identificar mutantes de omisión de exón, pero la estrategia también se puede usar para deducir la estructura primaria de la transcripción de genes [13], [22]. Es importante tener en cuenta que el algoritmo de PAC, que se detalla en Materiales y Métodos, es en esencia una fórmula simple que predice exones atípicos basados en las diferencias de cambio de plegado entre los niveles de expresión del exón medidos y predichos. Otros métodos también se pueden utilizar para identificar valores atípicos (por ejemplo, & gt; n desviaciones estándar de la media del nivel de expresión), pero necesita para tener en cuenta la no linealidad en los niveles de expresión génica entre las muestras (especialmente para los genes del cáncer) y el tamaño limitado de la muestra. Debido a las altas tasas de positivos verdaderos obtenidos por el PAC, no explorar más métodos estadísticos alternativos.
El algoritmo PAC es independiente de la plataforma de hileras u organismo, que permite la aplicación de la estrategia del PAC en una amplia variedad de sistemas biológicos . Varios algoritmos para perfiles de expresión a nivel de exón están disponibles comercialmente, incluyendo Stratagene ArrayAssist (www.stratagene.com), Partek Genómica Suite (www.partek.com) y Genomatix Suite (www.genomatix.de). Aunque cada uno de estos paquetes de software es relativamente sencillo, ventajas importantes de la PAC son que permite la detección de los exones atípicos únicos sin ningún conocimiento previo del gen que codifica o su estructura transcripción y que no requiere subgrupos predefinidos de muestras con expresión diferencial de los exones atípicos
.
Al igual que con cualquier estrategia mundial de selección, el PAC tiene sus condiciones previas para la detección de valores atípicos exones. En primer lugar, la identificación de los exones de valores atípicos requiere su nivel de expresión del transcrito de estar dentro del rango de detección lineal de la matriz de exón, que está determinado por su nivel de expresión del transcrito, así como la eficiencia de hibridación y la especificidad de la sonda fija involucrados. La circunscripción de las muestras de ensayo es otra consideración, sobre todo cuando se pueden expresar tanto las transcripciones de tipo salvaje y mutante. Por ejemplo, el cáncer de mama línea celular cohorte incluyó dos mutantes del sitio de empalme, de difícil detección por el PAC, porque cada uno tenía una segunda longitud transcripción de mayor intensidad que resultó de empalme críptico (
BRCA1
c.5396 +1 G & gt; A en MDA-MB-436 [14] y
p16
c.150 + 2T & gt;. C en MDA-MB-436 (. Nagel
et al
, presentado para su publicación) por otra parte, la detección de PAC de la
EGFRvIII
isoforma transcripción en glioblastomas clínicos se determinó el nivel de expresión general de
EGFR
transcripciones, que estaba cerca de los límites de detección lineal en los cinco
EGFRvIII
glioblastomas , sino también por la relación de la
EGFRvIII
isoforma frente al tipo salvaje
EGFR
transcripciones (Fig. 3B). un corolario es que el rendimiento PAC puede verse comprometida en la detección de un exón valor atípico cuando silvestre transcripciones de tipo representan más de un cuarto de todas las transcripciones de ese gen particular, lo que podría ser el caso en las muestras tumorales con células neoplásicas de menos de 75%. Sin embargo, los niveles de expresión de los alelos mutantes y de tipo salvaje normalmente son desproporcionada a su alelo frecuencia y detección por PAC por lo tanto de nuevo se determina por el (relativo) nivel de expresión del transcrito de valor atípico. por lo tanto PAC realiza mejor en ausencia de la expresión del transcrito de tipo salvaje. transcripciones homocigotos se encuentran predominantemente entre los genes supresores de tumores, en los que a menudo se muta un alelo acompañada de pérdida del otro alelo
La influencia del alelo ratios fue recalcada en nuestras simulaciones de detección de las demás recurrentes por el PAC:. La
EGFRvIII
isoforma en GBM67 sólo se detectó una vez que estaba presente como un valor atípico única entre las 14 muestras, mientras que no se había detectado en nuestra pantalla PAC original que incluye otros cinco
EGFRvIII
expresar los glioblastomas (Fig . 4A). Sin embargo, este sub rendimiento óptimo PAC no parecía relacionada con la recurrencia de los valores atípicos, como valores atípicos recurrentes se identificaron fácilmente entre líneas de células - incluso cuando está presente en cinco de seis líneas de células (Fig 4B.). Los experimentos de simulación también revelaron que dos líneas celulares fueron suficientes para detectar con fiabilidad los exones de valores atípicos y que más de ocho líneas celulares no mejoraron aún más el rendimiento PAC, mientras que para las muestras de tumores clínicas diez aparecido el mínimo, pero veinte serían preferibles (Fig. 4).
¿Qué tan eficiente podría ser PAC en la detección de mutaciones en los genomas del cáncer? De nuestra selección de los exones de valores atípicos, identificamos ~ 20% (21/112) SNPs, cambios de base novela ~ 2% (2/112) y ~ 2% saltarse eventos (2/112) exón. Al incluir todas las sustituciones de nucleótidos, la tasa de falsos positivos en estos experimentos es ~76%. Por extensión, la amplificación y secuenciación 1.763 reacciones en una sola muestra (todos los valores atípicos en los valores de PAC & lt; -4,0) se puede esperar para producir tanto como 34 nuevos cambios de bases y 34 eventos omisión de exón. Por lo tanto, nuestro enfoque puede ser clasificado como un método de cribado de alta eficiencia para los genes del cáncer de candidatos, especialmente en comparación con la selección aleatoria de exones. Estudios adicionales a continuación, se deben realizar para determinar si los cambios identificados son causales para la formación de tumores y /o progresión, por ejemplo, mediante la detección de mutaciones adicionales (por ejemplo, deleciones, mutaciones sin sentido) en otras muestras de tumor o por análisis funcional de los mutantes identificados.
Materiales y Métodos
muestras
Nuestra colección de 41 líneas celulares de cáncer de mama humanos disponibles al público había sido sometido a las pantallas de mutación de genes supresores tumorales siete:
BRCA1
(el cáncer de genes de susceptibilidad 1; OMIM 113705),
CDH1 gratis (E-cadherina, OMIM 192090),
MAP2K4 gratis (MAP quinasa quinasa 4, también conocido como
MKK4
; OMIM 601335),
PTEN gratis (fosfatasa y Tensin Homólogo; OMIM 601728),
p16 gratis (CDK4-inhibidor, también conocido como
INK4A
,
CDKN2A
; OMIM 600160),
p53 gratis (proteína tumoral p53; OMIM 191170) y
RB1 gratis (Retinoblastoma susceptibilidad génica 1; OMIM 180200) [14] - [18] (Nagel
et al.
presentado para su publicación). El análisis mutacional involucrado secuenciación de la región codificante entera de estos genes en el ADN genómico así como el análisis de la transcripción codificado. Las líneas celulares de cáncer de mama doce utilizados para este estudio fueron: CAMA-1, T-EVSA, HCC1937, MDA-MB-134VI, MDA-MB-157, MDA-MB-435s, MDA-MB-436, MDA-MB- 453, MDA-MB-468, MPE600, OCUB-F y SK-BR-5. especímenes clínicos de glioblastoma se congelaron en nitrógeno líquido inmediatamente después de la resección quirúrgica de los pacientes en el Centro Médico de la Universidad Erasmus, tal como se describe en otro lugar [13]. opinión patológico reveló al menos 70% de núcleos tumorales para cada espécimen.