Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Identificación de Crecimiento Candidato Promoción de genes en el cáncer de ovario a través Integrado número de copias y Análisis de Expresión

PLOS ONE: Identificación de Crecimiento Candidato Promoción de genes en el cáncer de ovario a través Integrado número de copias y Análisis de Expresión


Extracto

El cáncer de ovario es una enfermedad caracterizada por reordenamientos genómicos complejos, pero la mayoría de los genes que son el objetivo de estas alteraciones permanecen sin identificar. La catalogación de estos genes diana proporcionará información útil sobre la etiología de la enfermedad y puede proporcionar una oportunidad para desarrollar intervenciones diagnósticas y terapéuticas novedosas. Alta resolución de número de copias del genoma de ancho y de expresión búsqueda de datos de 68 carcinomas de ovario epiteliales primarias de varias histotypes se integró para identificar los genes en las regiones de amplificación más frecuente con la correlación más fuerte con la expresión y número de copia. Regiones en los cromosomas 3, 7, 8, y 20 se aumentaron con mayor frecuencia en el número de copias (& gt; 40% de las muestras). Dentro de estas regiones, 703/1370 (51%) de genes de expresión único probesets se expresaron diferencialmente cuando las muestras con ganancia se compararon con muestras sin ganancia. 30% de estos probesets expresados ​​diferencialmente también mostró una fuerte correlación positiva (r≥0.6) entre la expresión y el número de copias. También se identificaron 21 regiones de alta amplitud número de copias ganancia, en el que 32 genes de codificación de proteínas conocidas mostraron una fuerte correlación positiva entre la expresión y número de copia. En general, nuestros datos valida previamente conocidos genes del cáncer de ovario, como los conductores potenciales nuevos
ErbB2
, y también identificó como
MYNN
,
PUF60
y
TPX2

Visto:. Ramakrishna M, Williams LH, Boyle SE, Bearfoot JL, Sridhar A, velocidad TP, et al. (2010) Identificación de Crecimiento Candidato Promoción de genes en el cáncer de ovario a través Integrado número de copias y Análisis de Expresión. PLoS ONE 5 (4): e9983. doi: 10.1371 /journal.pone.0009983

Editor: Patrick Tan, Duke-NUS Graduate Escuela de Medicina, Singapur

Recibido: 20 de enero de 2010; Aceptado: 7 Marzo 2010; Publicado: 8 Abril 2010

Derechos de Autor © 2010 Ramakrishna et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. MR es con el apoyo de la Beca Cancer Council Victoria Posgrado. Este trabajo está financiado por una beca del Consejo Nacional de Salud y la Investigación Médica (NHMRC) de Australia (ID: 566603). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

Si bien se han hecho progresos en el esclarecimiento de los eventos moleculares que subyacen en el desarrollo del cáncer de ovario, la identidad de la mayoría de los genes que impulsan el desarrollo de esta enfermedad sigue siendo difícil de alcanzar. Numerosos estudios de expresión génica han identificado las listas de genes con expresión alterada de manera significativa, pero lamentablemente hay poco consenso entre los estudios [1]. Mientras que los estudios de expresión génica son útiles para identificar categorías amplias de las vías alteradas en el cáncer y subtipos clínicamente importantes [2], que por sí solos pueden no ser capaces de distinguir los genéticamente alterados genes clave del controlador. Una estrategia alterativa utilizado para identificar los genes conductor ha sido anotación de aberraciones cromosómicas recurrentes. Los primeros estudios se vieron obstaculizadas debido a que las tecnologías para el análisis genómico de todo el genoma carecían de la resolución para filtrar adecuadamente el cáncer de loci asociados [3]. El problema de la resolución se ha superado con el desarrollo de ultra-alta resolución aCGH y SNP arrays. Recientemente, nuestro grupo ha utilizado estos SNP arrays de última generación para anotar incluso regiones pequeñas (tan pequeño como 25 kb) de alteración genómica [4]. Estos datos también demostraron que los eventos genéticos que ocurren en los cánceres de ovario son más numerosos y complejos que se sospechaba. Mientras que algunos genes potenciales controladores podrían ser identificados rápidamente a partir de estos datos debido a su ubicación en alteraciones focales, la mayoría de las alteraciones recurrentes son grandes y abarcan numerosos genes.

Para acelerar la identificación de los genes de crecimiento del cáncer ovárico promoviendo hemos integrado búsqueda de número de copias de ADN y los datos de expresión génica de una cohorte de 68 cánceres ováricos epiteliales primarias. Nos hemos centrado en particular en los genes en las regiones de ganancia del número de copias, con la expectativa de que la expresión de un gen conductor dentro de un amplicón será más fuertemente correlacionada con el número de copias de genes de genes co-amplificado cuya expresión es agnóstico a la tumorigénesis. Integración del número de copias y la expresión ha proporcionado una lista de genes conductor candidato que actúa dominantemente, que se puede utilizar para apoyar el análisis funcional que será necesaria para validar su contribución a la tumorigénesis de ovario. Además, el amplificado y más de los genes expresados ​​tienen el potencial de servir como marcadores de diagnóstico o terapéuticos como útil para el cáncer de ovario.

Resultados

frecuencia de alteraciones de número de copias (CNA) en el cáncer de ovario

Evaluación de la CNA en 72 tumores epiteliales de ovario (Tabla 1, Tabla S1) arrojó un total de 36,534 segmentos que comprenden 20.570 ganancias NC NC y 15.964 pérdidas. La mediana del número de regiones con ganancia CN por tumor era 208, lo que representa un promedio de 13,6% del genoma por muestra (Tabla S2). La mediana del número de regiones con pérdida CN fue de 194 que representa el 12,2% del genoma. Estos CNA se produjeron en todo el genoma, pero hubo algunas regiones muy frecuentes recurrentes de la CNA entre los 72 tumores (Figura 1), incluyendo las ganancias ubicados en 1q, 3q, 6, 7q, 8q, 19 y 20 y las pérdidas en los cromosomas 4, 6, 8, 13, 16, 17, 18, 22q y X. Dentro epiteliales histotypes de cáncer de ovario que señalar que mucinoso y en menor medida los casos de células claras parecían tener un menor número de CNA y una proporción más pequeña del genoma fue implicado en comparación con los otros subtipos (Figura S1). Sin embargo, el número de muestras en los subtipos de menor importancia eran pequeños, por lo que es difícil extraer conclusiones estadísticamente válidas sobre los cambios específicos de subtipos. La mayoría de las muestras eran del subtipo endometrioide alto grado seroso o relacionados y muchas de las regiones de ganancia y la pérdida son impulsados ​​principalmente por estos subtipos.

Frecuencia de aparición de las ganancias genómicas (amarillo) y las pérdidas (azul) en todo el genoma, se representa con el fin de cromosoma 1p a Xq.

Integración de la expresión de ARNm en las regiones de copia frecuentes aumento de número

Un mecanismo común de la activación de la función génica en el desarrollo del cáncer es a través de más de expresión como consecuencia de la amplificación de genes. Mientras que muchos genes pueden estar situados dentro de un amplicón en particular, se esperaría que el gen (s) específica para mostrar consistentemente elevada expresión en comparación con genes espectador adyacentes [5]. Hemos llevado a cabo previamente un análisis de la expresión integrada de los genes supresores de tumores candidato dentro de las regiones de la pérdida de heterozigosidad en una cohorte de tumores superposición [6], por tanto, para este estudio se optó por centrarse en la identificación de genes candidatos situados en los amplificados. Un umbral de frecuencia arbitraria de al menos 40% fue elegido como un filtro para la selección de regiones de teclas, lo que resulta en la demarcación de múltiples regiones cromosómicas en 3q, 7q, 8q y 20q (Figura 2). Cada segmento de la ganancia CN frecuente fue etiquetado por el cytoband perteneció a; después de lo cual las regiones con la misma etiqueta cytoband se derrumbó en una región más grande (Figura S2-A). Esas regiones se solapan con el número de copias de la línea germinal polimorfismo (CNP, el cuadro S3) fueron excluidos como se describe en la figura S2-B. Los últimos 106 amplicones variaron en tamaño de 11 kb a 7 Mb (Tabla S4) y 90 de estas regiones en total contenido 1370 de expresión génica probesets de la matriz de Affymetrix gen 1.0ST correspondiente a 938 de la proteína conocida genes de codificación. Los otros 16 no amplicones fueron representados por probesets en los arrays de genes 1.0ST.

ganancias frecuentes se producen en los cromosomas 3, 7, 8 y 20, con cada punto que indica la frecuencia de la ganancia de un segmento CN. La línea roja en todos los paneles indica el umbral de frecuencia 40%.

Expresión análisis se llevaron a cabo para probesets dentro de cada una de las 90 regiones (Tablas 2, 3, 4, Tabla S5). Para cada uno de los grupos de regiones de muestras que mostraron aumento de número de copias (3 o más copias) se ensayaron para la expresión diferencial frente a los grupos de muestras que mostraban el número de copias normal (~ 2 copias). En todas las regiones, hubo 703 (51%) expresados ​​diferencialmente probesets correspondientes a 629 genes con identificadores únicos, como un símbolo de genes Ensembl HGNC o ID (cuadro S5). Sólo un gen,
hCG_16001
, mostró una variación negativa de registro de pliegue (-0.34, Figura S3). En promedio (en regiones con al menos 5 probesets), se encontró que el 50% de los probesets ser expresados ​​diferencialmente lo que sugiere un aumento generalizado de la expresión de los genes dentro de las ganancias NC. Curiosamente, se observó que
MYC
, un oncogén que se caracteriza por el aumento de número de copias en una amplia variedad de tipos de tumores, no fue significativamente expresados ​​diferencialmente entre los grupos amplificados y no amplificados de muestras. Una posibilidad es que
MYC
se expresa en un alto nivel en todos los tumores, independientemente de la condición de número de copias y por lo tanto no es diferente entre los grupos de tumores que muestran una ganancia y los que no lo hacen. Para probar esta posibilidad se comparó la expresión de
MYC
en muestras de cáncer de ovario amplificadas a la expresión en epitelio trompa de Falopio normal. No se encontró ningún aumento en
MYC
expresión cuando se comparan los tumores de estas muestras (p = 0,41, Welch corregida la prueba t no pareada, figura S4).

Para matizar aún más esta lista de 703 probesets número de copias impulsado, expresados ​​diferencialmente, razonó que los genes que muestran la correlación más fuerte del número de copias y la expresión de los genes pueden ser más probables dirigidos por el aumento de CN. Por lo tanto, se calculó el coeficiente para todos los genes expresados ​​diferencialmente con cobertura probeset número de copias en los amplicones candidatos (Tabla S5) de correlación. De los 692 probesets analizadas (11 no contienen sondas de número de copias), 219 (correspondientes a 206 genes codificadores de proteínas) mostraron una fuerte correlación positiva (r≥0.6) entre la expresión y número de copia.

Los genes dirigidos por CN alta amplificación

Nuestro enfoque principal para identificar los genes relacionados con el cáncer era para filtrar las aberraciones más frecuentes, pero hemos observado que los genes del cáncer de controladores bien caracterizados, como
CCNE1
y
erbB2
[7], no se identificaron, ya que se amplificaron en menos de 40% de los tumores. En lugar de utilizar un menor de corte, que correría el riesgo de que incluye muchas regiones alteradas debido a la inestabilidad genómica generalizada (por ejemplo ~67% del genoma sería considerado como candidato regiones si un corte de & gt; se utilizó el 10%), se en vez filtrada para genes que muestran una alta ganancia CN amplitud. Aquí, nos fijamos en todos los segmentos que tenían un número de copias mayor que o igual a 5 y estaban presentes en al menos 5 muestras, que se identificaron 21 regiones más de 27.2 Mb (Tabla 5). Estas regiones corresponden a 181 probesets expresión génica en nuestros vectores Affymetrix gen 1.0ST, de los cuales 39 (22%) tenían una fuerte correlación positiva entre la CN y la expresión génica (r & gt; 0,6). Estos probesets corresponden a 32 genes conocidos de proteínas, incluyendo los genes del cáncer de controladores bien conocidos tales como la codificación
ErbB2 gratis (Tabla S6).

Prioridad de los genes candidatos conductor

dar prioridad a los candidatos más prometedores de los análisis anteriores, hemos construido una lista de genes utilizando los siguientes criterios. En primer lugar, se seleccionaron aquellos genes conocidos con una alta frecuencia de ganancia (& gt; 40%), que son expresados ​​diferencialmente (n = 629). De esta lista se seleccionaron los genes más fuertemente durante expresada por el nivel de factor de cambio de registro (& gt; 0,7) entre las muestras con el aumento de CN y muestras que fueron neutrales en el locus (n = 59). Como una medida diferente de la forma en la expresión génica se vio afectada por el número de copias, también seleccionaron los genes que mostraron una fuerte correlación (& gt; 0,7) del número de copias y la expresión (n = 58). La unión de estos criterios elaboró ​​una lista de 110 genes. De esta lista, hemos identificado los genes en cada cromosoma que fueron los más frecuentemente afectados por el cambio de número de copia; para CHR8, esto incluía los genes con una frecuencia de ≥60%, para chr3, ≥50% y para chr20 ≥42%. Esta lista compuesta por 37 genes (Tabla 6).

En segundo lugar, también deseaban incluir genes que son altamente amplificado. A partir de nuestra lista de genes altamente amplificado en al menos 5 muestras se seleccionaron aquellos que tenían una fuerte correlación positiva entre el número de copias y la expresión (r & gt; 0,6, n = 32). Algunos de los genes que son altamente amplificada, también son expresados ​​diferencialmente en base al análisis de la expresión de las regiones obtenidas con frecuencia, por lo que también incluía los genes con un pliegue del cambio de registro mayor de 0,6 (n = 17). Tomando los genes que satisfacen uno u otro de estos criterios, hemos añadido 41 genes en nuestra lista de alta prioridad (Tabla 6).

Cuando combinamos estas dos listas de genes, el primero basado en la "alta frecuencia" y la segunda el "gran amplitud", pero ambos con el aumento de expresión, el número final de genes únicos fue de 70 (Tabla 6).

Discusión

la expresión de genes ha sido ampliamente utilizado para identificar las vías principales y clínicamente subgrupos importante en el cáncer de ovario, pero la identificación de genes específicos del conductor, utilizando esta metodología solo se ha visto obstaculizada por el hecho de que la expresión es más bien plástico y ha habido poco consenso en los genes identificados entre estos estudios [1], [8]. Una razón para esta falta de consistencia es que la mayoría de estudios han analizado el ARN de muestras tumorales completas sin la verificación del epitelio cáncer porcentaje y /o han utilizado diversos tejidos de control como toda ovario suelo [9]. En contraste con la expresión de genes, alteraciones genómicas pueden ser un predictor más estable y fiable de la localización de genes de controladores. El cáncer de ovario mucho tiempo se ha sospechado de ser citogenético complejo [10] y los recientes avances en la tecnología de la genómica han confirmado las profundas aberraciones genómicas que caracterizan a la mayoría de cánceres de ovario [4], [11], [12], [13]. A pesar de esta complejidad, los perfiles de número de copias publicadas de los cánceres de ovario son muy comparables a nivel mundial [3] y muchos estudios han identificado regiones muy similares de número de copia alteración frecuente. Sin embargo, el progreso en la identificación de genes clave del controlador ha sido lento, con diferentes estudios a menudo la identificación de los diferentes candidatos en la misma región genómica. Por ejemplo, el controlador de amplicón cromosoma 20 diversamente se ha sugerido para ser
ADRM1
[14],
Eya2
[15],
AURKA
y
ZNF217
[16], entre varios otros. Los primeros estudios que integran expresión y el número de copias de datos tienen o líneas de células cancerosas utilizan para identificar más genes expresados ​​[17], [18] y /o plataformas de microarrays con resolución limitada y la cobertura del genoma [19], [20]. Hasta la fecha pocos estudios se han aprovechado de un número de copias realmente integrada en todo el genoma y el análisis de la expresión de diferentes muestras para la identificación objetiva de genes candidatos [21], [22], [23] y sólo ha habido un estudio previo de una cohorte más pequeña de los tumores de ovario [12]. En este estudio, por tanto, hemos intentado evitar algunos de los temas de examen de expresión o el número de copias en el aislamiento mediante la integración de dos conjuntos de datos obtenidos a partir de células epiteliales tumorales microdissected.

Como primer paso de los datos que se centró en las ganancias que ocurre en un porcentaje muy elevado de casos que incluía las regiones de los cromosomas 3, 7, 8 y 20. la identificación de genes expresados ​​diferencialmente reducido nuestra lista de genes del cáncer candidato en estas regiones por aproximadamente la mitad (rango 6-89% para las regiones con al menos 5 probesets). Hemos validado varios de los genes identificados en Haverty
et al
., Por ejemplo, en 3q26.2 Se confirmó la expresión aumentada en 7/8 de sus genes. Sin embargo, también hemos identificado una serie de genes amplificados adicionales y más expresadas (Tablas 2, 3, 4), muy probablemente debido a las diferencias en la aplicación de este método y el tamaño de muestra más grande. La proporción de genes expresados ​​diferencialmente en nuestro estudio es consistente con estudios previos de otros tipos de cáncer [24] apoyando el concepto de que el número de copias puede tener una fuerte influencia sobre la expresión génica. En consecuencia, para muchas regiones que no fueron capaces de identificar un gen controlador particular. Es posible que no pueda ser verdaderamente muchos genes conductor dentro de cada amplicón y aunque cada uno puede contribuir de forma individual poco a la progresión del cáncer, coordinar más de expresión de estos genes en regiones amplificadas pueden tener un efecto aditivo o sinérgico oncogénico. Alternativamente, muchos de los genes expresados ​​diferencialmente pueden ser pasajeros cuyos más de expresión dota ninguna ventaja o desventaja selectiva en el tumor. La discriminación entre los pasajeros y los conductores dentro de una región genómica puede, por tanto, solamente se logra a través de análisis funcionales a gran escala y enfoques combinatorios que examinan muchos genes en concierto.

A pesar de la relativamente gran número de genes expresados ​​diferencialmente y amplificados identificados en este estudio , todavía la hipótesis de que los genes que muestran los más fuertes sobre la expresión, y también aquellos genes con las mayores ganancias del número de copias de amplitud, pueden ser más propensos a ser conductores de la tumorigénesis que débilmente sobre los genes expresados. Por lo tanto, priorizamos nuestra lista de genes utilizando estrictos criterios de expresión. Por ejemplo, uno de los genes más frecuentemente el blanco de número de copias que es fuertemente sobreexpresada es
PUF60 gratis (
poli-T de unión al factor de empalme 60 kDa
). Este gen codifica para un factor de empalme pre-mRNA se cree que participan en el reconocimiento de 3 'sitios de empalme [25]. También puede inhibir la transcripción mediante la interacción con la helicasa TFIIH, el factor clave mutado en el síndrome de pigmentosum xeroderma propensos al cáncer, y esta interacción está implicada en la regulación correcta de
MYC
transcripción [26], [27] .

Myoneurin o
MYNN
es un gen que se encuentra en una región de ganancia número frecuente (60%) copiar en 3q26.2. Se expresa de forma diferente (p ajustada = 1.51E-05) entre los grupos amplificados y no amplificados, y muestra la correlación más fuerte entre el número de copias y la expresión (r = 0,74, Figura 3) entre todos los genes en esta región. Este gen se identificó como miembro del amplio complejo, Tramtrack, Bric a 'Brac (BTB) o virus de la viruela y el dedo de zinc (POZ) -ZF es decir la familia CEL /POZ-ZF de factores de transcripción [28]. Descubierta por primera vez en
Drosophila
, esta familia consiste en cerca de 60 proteínas humanas que incluyen varias proteínas relacionadas con el cáncer como factor relacionado con la leucemia (LRF /ZBTB7) y el linfoma de células B 6 (BCL6). Si bien el papel de MYNN en el cáncer aún no se ha caracterizado, otros miembros de esta familia se sobreexpresa de manera similar en los tumores [29].

A. Frecuencia de copia de ganancia en el cromosoma número 3 de la p-ter de la izquierda a la q-ter de la derecha como se indica por el ideograma. B. Genes en Chr3: 169,209 a 172,478 Mbps, una región aumentaron en un 60% (41/68) de las muestras, incluyendo genes previamente asociados con el cáncer de ovario (
PRKCI, MECOM
o
MDS1 /EVI1
) y potencialmente nuevos oncogenes (
MYNN
). C. Una parcela volcán presentar los resultados del análisis de expresión entre las muestras amplificadas y no amplificadas en esta región. Los genes en la esquina superior derecha se sobreexpresa significativamente en las muestras con el aumento de número de copias (p & lt; 0,05, por encima de la línea roja en -logP 4,32) en comparación con muestras sin cambio de número de copia (genes seleccionados se marcan). Para la lista completa de los genes expresados ​​diferencialmente ver Tabla S5. D. Parcela comparando el número de copias y la expresión en todas las muestras para el gen
MYNN Windows que mostró la mayor correlación (r = 0,74, prueba de Pearson) entre el número de copias y la expresión de esta región en 3q26.2.


además de la identificación de alta frecuencia, los genes expresados ​​diferencialmente, incluyendo los genes del cáncer conocidos como
PIK3CA
y
AURKA
, que también se utiliza regiones de gran amplitud para localizar adicional conocida ( por ejemplo,
erbB2
y
CCNE1
) y oncogenes potenciales. Por ejemplo, en el cromosoma 20, el enfoque de alta amplitud identificó una pequeña región mínima que no era evidente a partir del análisis de baja amplitud. Este intervalo de 421 kb en 20q11.21 abarca 10 genes, de los cuales
TPX2
mostraron la correlación más fuerte con el número de copias (r = 0,53). Este gen también se expresa de forma diferente entre las muestras con cualquier
TPX2
ganancia y aquellos con normalidad
TPX2
número de copias, y tenía el más fuerte factor de cambio de cualquier gen en el cromosoma 20 el cambio (log 2 veces mayor de 1,03 ). La proteína codificada por este funciones de genes como un activador de la Aurora-A con un papel en el ensamblaje del huso [30]. Curiosamente para el cáncer de ovario, se ha demostrado que interactúan con el complejo de BRCA1 /BARD1 (15). Recientemente, se ha identificado como un oncogén potencial en el cáncer de páncreas [31].

En resumen, nuestro estudio demuestra que la combinación de la alta frecuencia y análisis de alta amplitud y la orientación de la mayor fuerza sobre los genes expresados ​​reduce la lista de candidatos a sólo 70 genes fuera de los muchos miles dirigidos por el cambio de número de copia solo. Hemos identificado muchos genes candidatos prometiendo no observadas previamente en el cáncer de ovario, en particular los genes, como
MYNN
,
TPX2
y
PUF60
. Cabe señalar, sin embargo, que nuestro método de análisis es una de muchas que se pueden emplear en la identificación de nuevos genes de cáncer, y es poco probable que hayan identificado todos los posibles candidatos. El ejemplo de
MYC
, no expresa fuertemente en nuestros datos, pero previamente demostrado tener un efecto funcional en líneas celulares de cáncer de ovario [32], indica claramente que nuestro enfoque debe considerarse complementaria a otros, tales como pantallas funcionales y secuenciación profunda de las muestras de cáncer primario. Sin embargo nuestros datos proporciona una importante plataforma desde la que persiguen racionalmente la validación de estos potenciales conductores dominantes de la tumorigénesis de ovario. Además, esta lista puede incluir genes que son candidatos válidos para fines de diagnóstico o terapéuticos.

Materiales y Métodos

Ética Declaración

Se recogieron todas las muestras con el informado por escrito del donante consentimiento. Este estudio fue aprobado por el Centro de Cáncer Peter MacCallum Comité de Ética de Investigación Humana (Protocolo número 01/38).

Recogida de muestras

biopsias tumorales se obtuvieron de 72 pacientes que fueron sometidos a cirugía por ovárica primaria cánceres (a) en los hospitales de la región de Wessex del sudeste de Inglaterra, Reino Unido y (b) en los hospitales en Victoria, Australia (accederse a través del tejido Peter MacCallum Cancer Centre Banco). Se recogió sangre de los mismos pacientes para hacer coincidir los linfocitos. Muestras del tubo de Falopio se recogieron a través del banco de tejidos de
BRCA1
o
BRCA2 portadores de mutaciones
sometidos a salpingo-ooforectomía bilateral en los hospitales de todo Melbourne. La acumulación y uso de muestras de pacientes relacionados con este proyecto fueron aprobados por los comités de ética institucionales pertinentes. La información clínica e histopatológica de las muestras se proporcionan en la Tabla 1 y en la Tabla S1.

ADN y ARN extracción

tejido fresco congelado se ha incrustado en Optimal Compuesto de corte de la temperatura (OCT, Sakura Finetek, Torrance , CA) y se corta en 10 micras secciones. ADN del tumor y el ARN del tumor y la trompa de Falopio se extrajeron de regiones idénticas después de aguja micro-disección de & gt; 80% de células epiteliales tumorales. Secciones para RNA se tiñeron usando violeta de cresilo y el ARN se extrajo usando el protocolo de extracción de ARN total Ambion mirVana (Applied Biosystems /Ambion, Austin, TX). Las secciones de tejido se utilizan para la extracción de ADN se tiñeron con hematoxilina y eosina y el ADN fue extraído por medio de la sangre Qiagen y Tissue Kit (Qiagen, Valencia, CA, EE.UU.). ADN de la concordancia de los linfocitos normales de las muestras de la Peter MacCallum Cancer Centre Banco de Tejidos se extrajeron usando el mismo kit. ADN de la concordancia de los linfocitos normales para las muestras de Southampton se extrajeron como se describe anteriormente [33].

generación de los datos de microarrays y control de calidad

500 ng de ADN de cada muestra de tumor se analizaron mediante el Affymetrix Genoma de ancho SNP serie Human 6.0 (SNP6.0) siguiendo las instrucciones del fabricante (Affymetrix, Santa Clara, CA). Donde esté disponible (57 casos) de ADN de la concordancia de linfocitos de sangre periférica se analizó en la misma plataforma y en el mismo lote. Para la expresión de ARNm, 300 ng de RNA total de las mismas muestras de tumores se analizaron mediante la matriz de Affymetrix Human Gene1.0 ST. Análisis de rendimiento de la matriz de matrices SNP6.0 se realizó a través de tarifas de llamadas genotipado (& gt; 90% requiere tarifa de llamadas) y también la inspección visual del número de copias traza para extraer muestras ruidosas. 72 muestras pasaron medidas de control de calidad y se utilizaron en el análisis del número de copias. Para arrays de expresión, los perfiles de los controles de hibridación, controles de pico-a y área positiva versus negativa bajo la curva (AUC) fueron evaluados utilizando Affymetrix Expresión de la consola. Además, la calidad de las matrices se evaluó sobre la base de relativa diario de probabilidad (RLE) y errores estándar (Sin escala normalizada nUtilice) criterios generados utilizando el paquete "affyPLM" en el software de código abierto R. El despliegue de expresiones que fueron marcados como dudosos por 2 de cada 3 medidas (AUC, RLE, NUSE) fueron excluidos del análisis de la expresión. 68 muestras de tumores (57) con el ADN normal pasaron por tanto la expresión como número de copias y se mantuvieron en los análisis de la expresión integrada. La muestra final fijado en el análisis integrado incluye los cuatro subtipos más comúnmente visto histológicos de cáncer de ovario seroso - (n = 37), endometrioide (n = 14), de células mucinoso (n = 7) y claro (n = 9). Una de las muestras en el estudio fue de histotype desconocida (Tabla 1). Tanto los datos de expresión génica y el número de copias son MIAME compatible y se han presentado al Centro Nacional de (NCBI) de la Expresión Génica de Información Biotecnológica de Omnibus (GEO) página web, número de serie de la adhesión GSE19539.

Copia análisis del número de

Copia de generación de números y los análisis se realizaron utilizando Partek
® Genómica ™ suite versión 6.03 paquetes (Partek Inc., St. Louis, Missouri) y Bioconductor en el marco de software de código abierto-R [34], [35]. SNP archivos 6.0 CEL se importaron en Partek utilizando la configuración predeterminada para la corrección de fondo y resumen. Genoma Humano Build 36.1 (hg18, marzo de 2006) se utilizó para las ubicaciones de pares de bases. relaciones de número de copias ProbeSet se calcularon mediante la comparación de cada tumor con su normal de juego cuando esté disponible (n = 57). Para las muestras que no tenían se utilizó el ajuste de datos normales (n = 15), una línea de base normal mezclado de todas las otras muestras normales. Circular segmentación binaria [36] se realizó utilizando el paquete basado en R "DNAcopy" para segmentar los datos en distintas regiones de cambio de uso de parámetros de la aplicación predeterminada. Este análisis produjo una lista de regiones por ejemplo que a continuación se filtró para aquellas regiones que mostraron ganancia (Porcentaje de la copia número & gt; 2,5) o pérdida (copia relación en número & lt; 1,5) a través de ≥40% (n≥29) de todas las muestras. Estas regiones se derrumbó en cytobands para la manipulación de datos más fácil (Figura S2 para más detalles). Es importante tener en cuenta que, dado que estas regiones han sido objeto de filtrar pasos definidos anteriormente, que no incluyen toda la cytoband por el que se representen y por lo tanto la alta resolución de los datos no se vea comprometida.

Para identificar el potencial de la línea germinal polimorfismos de número de copias (CNP) que podrían interferir con la identificación precisa de los cambios somáticos, copia los datos de número de 57 muestras normales se generó en relación con una línea de base combinado de todas las muestras normales. Regiones que muestran una ganancia o pérdida en & gt; 5% de todas las muestras fueron llamados como los CNP (Tabla S3). Las regiones de interés a partir de los datos de los tumores se analizan en busca de estos partidos y los CNP se eliminaron de los análisis posteriores (Figura S2-B). CNP-desinstalados, regiones cytoband-colapsado se preguntó en contra de todo el conjunto de datos, el número de copias para generar valores exactos, por zonas de número de copias.

Se extrajo el número de copia sobre una base gen por gen para realizar Pearson análisis de correlación con la expresión. Debido a que algunos genes eran tan pequeñas que no había número de copias Probesets mapeo a ellos, un 10 kb adicional se añadió a todos gen de inicio y parada posiciones antes de extraer el número de copias.

Expresión análisis de microarrays

Para cada región candidata, las muestras se dividieron en dos grupos, G - que consiste en todas las muestras que mostraron ganancia (& gt; 3 copias) en la plataforma SNP6.0; y N - que consiste en todas las muestras que mostraban el número de copias normal (1,5-2,5 copias). Una prueba de la expresión diferencial se realizó entre estos dos grupos utilizando el paquete "limma" disponible en la plataforma de software de código abierto-R [34]. subtipo histológico se incluyó como un factor en el análisis. Los genes fueron considerados para ser significativamente expresados ​​diferencialmente con un valor de p de & lt; 0,05 después de múltiples pruebas de corrección [37]. También se realizó un análisis de correlación de Pearson entre el número de copias y la expresión. Se realizaron análisis separados de forma gen por gen para todos los genes dentro de (a) las regiones más frecuentemente amplificada (CN≥3; Freq≥40%) y (b) las regiones más altamente amplificados (CN≥5; Freq≥7% ).

Apoyo a la Información sobre Table S1.
detalles de la muestra. características clinicopatológicas y la información de ensayo para cada muestra. 57 de los 72 tumores habían cotejo de ADN linfocítica disponibles para el análisis de microarrays número de copias
doi:. 10.1371 /journal.pone.0009983.s001 gratis (0.06 MB PDF) sobre Table S2.
Proporción de la ganancia de todo el genoma y la pérdida de muestra. En todas estas muestras, el genoma aberrante se suma a 95,4% en promedio. La falta de 4,6% se puede atribuir a las regiones en el cromosoma Y, ADN mitocondrial y secuencias repetitivas en los alrededores de las regiones centroméricas que se retiran ya sea desde el análisis de segmentación o no cubiertos por el Affymetrix SNP6.0
doi:. 10.1371 /journal.pone .0009983.s002 gratis (0.06 MB PDF) sobre Table S3.
línea germinal copia polimorfismos de número de Chr 3, 7, 8, 20. El regiones /segmentos de aumento de número de copias que contenían uno o más de estos CNP fuera suprimido o alterado como se muestra en la Figura S1-B. El tipo de CNP también se muestra en la columna de la derecha
doi:. 10.1371 /journal.pone.0009983.s003 gratis (0.05 MB PDF) sobre Table S4.
Regiones de ganancia presente en & gt; 40% de las muestras. Esta tabla contiene la información genómica de las 90 regiones incluidas en el análisis de expresión, es decir, todas aquellas regiones que se asignan a 1 o más probesets en los microarrays GeneST1.0 Humanos. En esta plataforma de microarrays, la mayoría de los probesets mapa de forma única a un gen codificante de la proteína. Los identificadores de región corresponden a las de las Tablas 2, 3, 4 y S5
doi:. 10.1371 /journal.pone.0009983.s004 gratis (0.13 MB PDF) sobre Table S5. MyBestPlay Todos los expresados ​​diferencialmente probesets en regiones frecuentes de ganancia.

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]