Extracto
Antecedentes
Las tecnologías basadas en micromatrices de ADN tiene el potencial de proporcionar detallada información sobre aberraciones genómicas en las células tumorales. En la práctica un obstáculo importante para la detección cuantitativa de aberraciones es la heterogeneidad de tejido tumoral clínico. Dado que el tejido tumoral, invariablemente contiene células del estroma genéticamente normales, esto puede conducir a una falta de detección de aberraciones en las células tumorales.
Principal Encontrar
Uso de SNP serie de datos de 44 cáncer no microcítico de pulmón de células las muestras que han desarrollado un algoritmo bioinformático que modela con precisión las fracciones de células normales y tumorales en muestras de tumores clínicos. La proporción de células normales en combinación con SNP serie de datos se puede utilizar para detectar y cuantificar el número de copias neutral de pérdida de heterocigosidad (CNNLOH) en las células tumorales tanto en el tejido tumoral crudo y en muestras enriquecidas para células tumorales por captura láser microdissection.
Conclusión
análisis cuantitativo
todo el genoma de CNNLOH utilizando el método CNNLOH cuantificador puede ayudar a identificar aberraciones recurrentes que contribuyen al desarrollo de tumores en muestras de tumores clínicos. Además, el análisis basado SNP-array de CNNLOH puede llegar a ser importante para la detección de las aberraciones que se puede utilizar para los propósitos de diagnóstico y pronóstico
Visto:. Göransson H, Edlund K, Rydåker M, Rasmussen H, J Winquist, Ekman S, et al. (2009) La cuantificación de la fracción celular normal y número de copia LOH neutral en muestras de cáncer de pulmón clínicos utilizando SNP serie de datos. PLoS ONE 4 (6): e6057. doi: 10.1371 /journal.pone.0006057
Editor: Jörg Hoheisel, Deutsches Krebsforschungszentrum, Alemania |
Recibido: 18 de febrero del 2009; Aceptado: 5 Junio 2009; Publicado: 26 Junio 2009
Derechos de Autor © 2009 Göransson et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este estudio era parte de una colaboración de investigación abierta apoyado y financiado en parte por AstraZeneca, Alderley Park, Reino Unido. El trabajo también fue apoyado por la Facultad de Medicina y Farmacia (Universidad de Uppsala), la Universidad de Uppsala Hopsital, Akademiska laboratorio, la fundación Beijer, Wallenberg Consorcio Norte y Swegene. Los proveedores de fondos no tiene función alguna en el diseño del estudio, la recogida de datos y análisis, ni en la decisión de publicar el manuscrito. Andrew P. Thomas, quien es un investigador senior de AstraZeneca participó en la revisión del contenido intelectual
Conflicto de intereses:. El co-autor Andrew P. Thomas es empleado por AstraZeneca. Anders Isaksson y Andrew P. Thomas tienen acciones en Astra Zeneca.
Introducción
algoritmos bioinformáticos se han desarrollado para utilizar SNP información de la matriz para identificar aberraciones genómicas tales como cambios de número de copias de ADN y pérdida de -heterozygosity (LOH), es decir, tramos de ADN con marcadores exclusivamente homocigotos [1] - [8]. Sin embargo, un inconveniente principal de estos métodos es que la heterogeneidad genética en muestras de tumores, causada por la mezcla de células cancerosas y del estroma, a menudo no se tiene en cuenta. Como consecuencia aberraciones a menudo no se detectan en muestras con una gran proporción de células genéticamente normales. Esto puede explicar en parte por qué, a pesar de la acumulación de grandes cantidades de datos genómicos, el impacto clínico de este tipo de análisis con fines de diagnóstico es aún pequeño. El tejido tumoral representa una mezcla de células tumorales y no tumorales, es decir, células inflamatorias, fibroblastos del estroma y las células de los vasos de sangre y ganglios [9]. La fracción de las células normales a menudo excede la fracción de células tumorales en muestras de pacientes almacenadas en bancos de datos genéticos (Figura 1A). Esta heterogeneidad de la muestra afecta gravemente el análisis del número de copias. A lo mejor de nuestro conocimiento no hay estimaciones sobre cómo la sensibilidad de la detección de las aberraciones genómicas depende de la proporción de células normales en muestras de tumores clínicos. Una razón puede ser la dificultad para estimar el tumor histológicamente normal vs. proporción de células por microscopía de muestras de tumores heterogéneos con diferentes proporciones de células normales en diferentes partes de la muestra. Por otra parte, existe una falta de consenso sobre cómo el contenido de las células tumorales en un cáncer sólido debe ser evaluada y anotada. Por lo tanto, el rendimiento de las herramientas actuales para la detección de aberraciones genómicas en muestras tumorales clínicas es a menudo incierto.
A) hematoxilina-eosina manchado sección congelada de un caso NSCLC representante analizados en este estudio (aumento original 40 ×) . La muestra de tumor se compone de una mezcla de células tumorales de flecha blanca, estroma con una flecha negro vaso sanguíneo, las células inflamatorias, es decir linfocitos flecha roja, y un alvéolo pulmonar restante lleno de macrófagos flecha verde. B) La supresión LOH. Las células normales se indican mediante la forma celular oval. La región suprimida en las células tumorales (forma rectangular) de células se indica por círculos blancos. pares de cromosomas esquemáticos sólo con marcadores A informativo para el negro y B para el chromosme rojo. Debajo de cada cromosoma se indica el genotipo en el área de la eliminación. Las células con genotipos diferentes números de copia están etiquetados N
normales, T
2 N, T
1 N, y T
0N. N indica que la célula es normal y T que sis una célula tumoral. Los subíndices de las células tumorales indican el contenido de ADN de la región con su eliminación. Dado que estos son todos los tipos de células en la muestra las proporciones suman uno. C) Copia LOH neutro. En este caso, las células tumorales tienen todos el contenido de ADN 2N. Sin embargo, algunas células tumorales son homocigotos (en este caso BB) para la región de interés (T
HOM) y el otro tipo es heterocigoto AB (T
Het). La suma de las fracciones de células es igual a uno.
Una herramienta desarrollada recientemente toma en cuenta la heterogeneidad de la muestra para la identificación del número de copias de los estados [10]. Está diseñado para los estudios con muestras pareadas (tumoral y normal). En la práctica, sin embargo, las muestras pareadas a menudo no están disponibles para grandes cohortes de pacientes.
En otro estudio Nancarrow et al visualizar el patrón esperado de las frecuencias alélicas en función de proporciones variables de células normales en la muestra tumoral mediante simulaciones [11 ].
Otra herramienta analítica prometedora, AsCNAR, es capaz de identificar LOH incluso cuando sólo está presente en una proporción de alrededor del 20% [12] una de las dos líneas de células mixtas. Recientemente Assie et al describe un algoritmo que toma en cuenta la heterogeneidad del tumor en la identificación de aberraciones genómicas en muestras con 40 a 75% de las células tumorales [13].
Los estudios sugieren que el número de copias LOH neutral puede ser un mecanismo para la inactivación de genes supresores de tumores [14]. Varios estudios y nuestros propios datos sugieren que CNNLOH es más común de lo que se pensaba anteriormente [15], [16]. En conjunto esto sugiere que CNNLOH puede ser importante en la determinación de ciertos fenotipos de cáncer. Para analizar CNNLOH en un genoma de gran escala en las células tumorales en muestras heterogéneas nos centramos en 1) el desarrollo de un algoritmo para cuantificar la proporción de células normales en la muestra y 2) para cuantificar CNNLOH por todo el genoma de las células tumorales. Tal análisis cuantitativo tiene el potencial de convertirse en una herramienta importante para el diagnóstico del cáncer moleculares.
Resultados
Una estrategia para la cuantificación de CNNLOH en muestras de tumores heterogéneos
Para cuantificar CNNLOH en heterogénea muestras de tumores de la contribución de la señal específica de alelos de diferentes tipos de células tienen que ser estimado. La Figura 1 ilustra una mezcla típica de células en secciones congeladas de un cáncer de pulmón de células no pequeñas (NSCLC) muestra de tumor y proporciona una representación esquemática de los diferentes tipos de células y de los genotipos que podría estar presente en el caso de una deleción genómica o CNNLOH. Otras aberraciones genómicas, incluyendo las que dan lugar a aberraciones de ploidía más altas, también puede ocurrir en el mismo lugar como la eliminación o CNNLOH, complicando aún más el cuadro. Sin embargo, la probabilidad de que este tipo de eventos se puede esperar a ser baja y en este estudio que se ha supuesto que es insignificante en comparación con los efectos de las supresiones y CNNLOH.
La fracción de células normales puede para algunos tipos de tumores pueden medir de una manera directa. En hematológica Tumores la fracción de las células normales se puede medir usando citometría de flujo empleando marcadores de superficie informativos. Sin embargo, las suspensiones de células individuales para la citometría de flujo son difíciles de obtener a partir de tumores sólidos. Como alternativa, se pueden usar medios automatizados o manuales para la identificación de las células normales contándolas
In situ
basado en marcadores moleculares o morfología. Estos métodos requieren técnicas de imagen o el trabajo que lleva tiempo avanzaron por un anatomopatólogo cualificado. En este trabajo se utiliza la intensidad de señal de los dos alelos de SNP para estimar la fracción de células normales y utilizar esa información para estimar la proporción de células tumorales con CNNLOH.
La cuantificación de la proporción de células normales de genotipado de SNP datos de la matriz
En muestras en las que la proporción de células normales es difícil de obtener por otros medios, nos propusimos estimar la fracción de células normales de sólo datos de SNP. Como se muestra en la Fig. 1B la fracción de células con ADN 2N (C
2 N) en regiones con deleciones es la suma de las células normales (N
normal) y las células tumorales con ADN 2N (T
2N). La base para el método CNNLOH cuantificador es utilizar las señales específica de alelo A y B para cada locus para obtener la frecuencia del alelo B experimental (ABF), como una relación normalizada de B /(A + B) Véanse los métodos. Una derivación y una ilustración gráfica están disponibles en otros lugares [17]. Los ABFS de marcadores informativos heterocigotos en muestras de tumores complejos dependen de número de copias y la composición celular de la muestra. En un primer paso que nos propusimos identificar la proporción de células C
2N mediante la comparación de los ABFS experimentales en una ventana de SNPs consecutivos en regiones con deleciones mono-alélica con datos simulados. Las simulaciones toman en cuenta factores tales como la heterocigosidad media, el número de copias de las células tumorales, la variación experimental y la composición de células diploides y células tumorales. La figura 2 ilustra cómo los histogramas de ABFS observadas se comparan con los histogramas simulados con diferentes fracciones de C
2 N utilizando la distancia euclídea. El histograma con la menor distancia al histograma observado identifica el correspondiente C
2 N (véase la Fig. 2 y Métodos).
Dos ejemplos de valores ABF observados a lo largo de los cromosomas. Ventanas de al menos 140 marcadores SNP consequtive se utilizan para reunir información específica de alelo a lo largo del cromosoma. Los valores de ABF en cada ventana se ilustran como un histograma observado. En el siguiente paso del histograma observado se compara con cientos de histogramas simulados donde la fracción de células heterocigotas ha sido variada. El histograma simulado con la distancia euclidiana más corta a la histograma observado identifica la más probable proporción de células heterocigotos en la muestra (X%). La comparación de histogramas se utiliza tanto para la estimación de la proporción de células diploides (C
2 N) en regiones en las que las células tumorales tienen deleciones y la proporción de células heterocigotos (C
het) en regiones genómicas con células tumorales 2N. C
2 N y C
Het se utilizan posteriormente para la estimación de la fracción de células normales y cuantificación de CNNLOH.
N
normal no se obtiene directamente de la estimación de C
2 N. Sin embargo, ya que se puede esperar que las células normales de tener dos de cada autosoma se espera que su contribución a la ABF ser igualmente grande para todos los autosomas, mientras que la contribución adicional de T
células 2N puede variar con la heterogeneidad tumoral para cada cromosoma . Así, en muestras cuando se detecta la pérdida de número de copias en varios cromosomas la estimación más baja de C
2 N para un cromosoma tiene la contribución más pequeña de las células tumorales 2N. En muchos casos en los que la deleción ha causado una ventaja proliferación de la contribución a los más pequeños C
2 N a partir de células tumorales 2N con el tiempo será cercano a cero. Por lo tanto, en los casos en que la información de varios cromosomas está disponible, puede estar justificado para estimar N
normal, como el más pequeño C
2 N.
estimaciones basadas Validación de SNP gama por comparación con el conteo manual de las células normales
aplicó el método de 60 muestras no pequeñas de cáncer de pulmón de células (véase el método). Cuarenta y cuatro de sesenta muestras (73%) cumplieron con los criterios arbitrarios que al menos dos regiones en dos cromosomas diferentes variaban no más del 5% en sus C
estimaciones 2N y que podrían utilizarse para proporcionar una estimación de N
normal (ver Métodos). Los criterios se han establecido para tener en cuenta el posible efecto de los patrones alélicos constitutivas semejantes a CNNLOH. La mayoría de los 16 casos en los que no pudo obtenerse una estimación no tener dos supresiones
.
Con el fin de validar las estimaciones de la fracción celular normal basado en los datos de SNP, un subconjunto aleatorio de las 60 muestras de NSCLC eran seleccionado por recuento microscópico cuidadosa y extensa de las células normales y tumorales en secciones congeladas (ver Métodos). Siete de estos casos se superponen con los 44 casos donde N
normal pueda ser estimado, la Tabla 1 muestra las estimaciones de la fracción de células normales obtenidos utilizando SNP serie de datos y el conteo manual basado en la morfología de estas muestras. Existe una buena concordancia entre los resultados obtenidos por los dos métodos, lo que indica que el método basado SNP proporciona información precisa sobre la fracción de células normales en muestras de tumores.
La cuantificación del número de copias LOH neutral en el pulmón muestras de cáncer de
es necesario cuantificar la fracción de células normales presentes en una muestra de tumor antes de la información de análisis de matriz de SNP se puede utilizar para estimar la fracción de las células tumorales con ADN 2N que tiene LOH, es decir CNNLOH. CNNLOH = T
hom /(T
hom + T
Het). (Ver Fig. 1B). En este caso se trata de las células tumorales heterocigotos T
Het que junto con las células normales se modificar la frecuencia del alelo B de las células tumorales homocigotos con LOH. Para CNNLOH la frecuencia del alelo B de los marcadores informativos depende de las células heterocigotas C
Het. histogramas simulados que tienen diferentes fracciones de células heterocigotas en cuenta se compararon con histogramas basados en valores ABF de una ventana en movimiento con un número fijo de marcadores (ver Fig. 2 y Métodos). El histograma simulado más similar al histograma observado, identificó la fracción correspondiente de las células heterocigotas, C
Het. Si la fracción de células normales N
se conoce normales, CNNLOH se puede calcular, ya que 1 = N
normales + T
hom + T
Het. Para demostrar el valor del método CNNLOH cuantificador lo aplicamos a un conjunto de muestras de NSCLC (ver Métodos). mediciones cuantitativas de todo el genoma de CNNLOH se muestran en la Fig. 3. Se puede observar que hay regiones recurrentes con altos grados de número de copia LOH neutral. Un ejemplo en el cromosoma 11 se muestra en la Fig. 3. El trabajo futuro se centrará en la aclaración de la importancia del número de copias LOH neutral en esas regiones para el desarrollo de tumores. Para la comparación CNNLOH también fue analizado en 60 muestras normales de referencia (véase la Fig. S1).
A) La información cuantitativa sobre tumores LOH que van desde 0% negro a rojo 100% para los 22 autosomas el 43 de células no pequeñas muestras de cáncer de pulmón cada una representando una fila. Supresiones se indican con verde y amplificaciones en azul. Las regiones donde más del 10% de las muestras en un conjunto de referencia normal hubo CNNLOH superior a 0,5 fue retirado de la trama (ver Métodos). flecha negro indica un ejemplo de una región en el cromosoma 11 con una mayor frecuencia del número de copias LOH neutro (52%) que la frecuencia máxima de 10% en el conjunto de referencia normal
Cuantificación de CNNLOH. - la comparación entre los peces y los datos SNP
con el fin de estudiar la exactitud de la cuantificación de CNNLOH hemos querido comparar los resultados con los obtenidos con un método independiente. Gunnarsson et al han medido la presencia de pequeñas deleciones en 13q14 en preparaciones de células tumorales de pacientes con leucemia linfocítica crónica (CLL), utilizando hibridación in situ fluorescente (FISH) [18]. En dos casos, las células tumorales habían adquirido dos copias del cromosoma 13 con un interior supresión 13q14. Por lo tanto, en estos casos la proporción de las células de LLC con la señal de FISH cero y uno representan las células tumorales homocigotos y heterocigotos respectivamente. Una estimación de la CNNLOH en el cromosoma 13 fuera de la región eliminada en 13q14 se puede obtener como la proporción de células con la señal de cero en 13q14 dividido por la suma de las proporciones con la señal cero y uno. Debido a muy pocas regiones con deleciones la proporción de células normales no se podría obtener a partir de los datos de SNP. En lugar de citometría de flujo de datos de Gunnarsson et al 2008 dieron esta información. Por lo tanto, se utilizó la proporción de las células normales de la citometría de flujo y la serie de datos de SNP para las dos muestras para cuantificar CNNLOH. La Tabla 2 muestra las estimaciones de CNNLOH obtenidos por los dos métodos. Se puede observar que las estimaciones sólo difieren por 4 y 6% en las dos muestras, lo que indica que la medición de CNNLOH es exacta.
Cuantificación de CNNLOH es robusto a las variaciones en la pureza de la muestra
Un requisito importante para la cuantificación de CNNLOH es que el método debe ser robusto y no influenciada por la fracción de células normales en la muestra. Con el fin de probar el rendimiento del algoritmo variamos la fracción de células normales en una muestra de tumor mediante el enriquecimiento de las células tumorales. En cinco casos se seleccionaron 6 000-10 000 células tumorales mediante microdisección por láser (ver Métodos). Standard análisis array Affymetrix SNP se realizó en el ADN de estas preparaciones enriquecidas-tumorales. La fracción de las células normales y LOH tumor para regiones neutras número de copias se cuantificó y los resultados se compararon con los resultados de muestras de tumores crudo (Fig. 4). Las mediciones de CNNLOH en las muestras de crudo parecen ser altamente compatibles con los de las muestras microdiseccionadas. Con el fin de cuantificar el rendimiento de la detección CNNLOH que elegimos para contar el número de segmentos cromosómicos en la fig. 4 que tenía LOH tumor mayor que un umbral establecido de forma arbitraria, en este caso 0,5 en ambas muestras. Este procedimiento proporciona una estimación aproximada de la capacidad de detectar CNNLOH. La Tabla 3 muestra la relación del número de segmentos que se detectaron en la muestra microdissected en comparación con toda la muestra. La proporción es de cerca de uno para todas las muestras que indican que aproximadamente el mismo número de segmentos se detectan con independencia de la fracción de las células normales que variaban entre 1% y 26%. Se podría argumentar que la fracción de células normales es tan baja que es difícil de observar alguna diferencia entre los pares de muestras. Sin embargo, el estudio de la robustez de detección de número de copias se puede observar que en tres pares de muestras (13A, 296A y 319A) hubo una reducción dramática (hasta 122 veces) en el número de segmentos detectados como cojinete de número de copias aberraciones en totalidad de la muestra (véase la Tabla 3). En resumen, el análisis de CNNLOH parece ser robusto, mientras que la detección del número de copias puede ser muy influenciada incluso por una proporción de células normales en el intervalo de 1 a 26%, que es modesta para muchos tipos de muestras de tumores clínicas.
Cinco muestras tumorales 13A, 234A, 296A, 319A y 367A se analizaron para el tumor de LOH utilizando tanto el ADN de las secciones congeladas frescas de todo el tumor y de porciones de láser microdissected de las secciones del tumor con tumor de contenido enriquecido. El grado de un tumor LOH está indicado para segmentos de 200 kb chromosmal en el color que van desde el negro (0%) al rojo oscuro (100%) a lo largo de los 22 autosomas. Los segmentos con número de copias aberraciones se indican con deleciones (verde) y amplificaciones (Azules). Tenga en cuenta en una sección ampliada del cromosoma 7 que las mediciones son CNNLOH approxiamately iguales en los pares de muestras tumorales enteras y microdisecado.
Rendimiento de la detección CNNLOH en los datos simulados de mezclas de normales y tumorales células
el método que aquí se presenta CNNLOH cuantificador puede identificar y cuantificar CNNLOH la fracción de células tumorales que tiene CNNLOH. El método parece ser robusto a las variaciones en el contenido de células tumorales en muestras clínicas. Sin embargo, también sería interesante comparar su rendimiento con otros métodos. Con este fin se recogieron datos de la matriz de SNP de células tumorales en una muestra de cáncer de pulmón microdissected y a partir de tejido de cáncer de pulmón fuera del tumor del mismo paciente. Basándose en esta información simulamos de datos a partir de mezclas de células normales y tumorales. Con el fin de medir el desempeño en términos de sensibilidad y especificidad se utilizó LOH detectado por pares de análisis de la muestra de tumor y su control normal utilizando dChip del número de copias 2 regiones como el estándar de oro que define CNNLOH. Quisimos comparar el método CNNLOH cuantificador a otros métodos también utilizando la información específica de alelo. Estos métodos se han demostrado que superan los métodos basados en el genotipo [13]. AsCNAR es uno de tales métodos, pero la aplicación actualmente disponible no es lo suficientemente flexible para utilizar en este tipo de datos simulados. Por otro lado el método somática fue diseñado para datos de la plataforma Illumina SNP, pero podría ser adaptado para analizar los datos simulados basados en datos de la plataforma Affymetrix. Por lo tanto elegimos para comparar el rendimiento del método CNNLOH cuantificador con somáticos (ver Métodos para más detalles). La sensibilidad y especificidad de los métodos para variar las mezclas de células normales y tumorales se muestran en la figura 5AB. Puede ser observado que CNNLOH cuantificador tiene un fuerte aumento de la sensibilidad, por encima de las células tumorales 40%, es decir debido a la umbral de CNNLOH de llamada que corresponde a una fracción de las células tumorales 35%. CNNLOH cuantificador tiene una mayor sensibilidad de alrededor de 90% en comparación con 60% para somáticos por fracciones de tumor de más de aproximadamente 50% (véase Fig. 5A). La especificidad es generalmente más alta para CNNLOH cuantificador en comparación con somáticos (ver Fig. 5B). La sensibilidad de la somática fue menor que lo que se ha informado anteriormente para los datos basados en SNP serie de datos de la plataforma Illumina [13]. La hipótesis de que el algoritmo somáticos realiza de forma diferente en los datos generados por las dos plataformas. En Gunnarsson et al las mismas preparaciones de ADN de los tumores de LLC se analizaron en ambos 250K arrays de Affymetrix y 317K arrays de Illumina [18]. Se analizaron ambos conjuntos de datos a partir de 9 tumores de LLC con somáticos y encontramos que el algoritmo identificó más CNNLOH utilizando los datos de Affymetrix. Las relaciones de la longitud de las regiones CNNLOH detectados con Affymetrix datos en comparación con el rango de datos Illumina 1,9 a 36 (véase la Tabla S1). Estas regiones adicionales de CNNLOH identificados utilizando los datos de Affymetrix pueden en gran medida, ser falsos positivos debido al ruido experimental más grande. Tal un gran número de falsos positivos sería coherente con la baja sensibilidad de somáticos en la detección de CNNLOH en la simulación de datos basados en los datos de Affymetrix (véase Fig. 5A).
Los datos correspondientes a diferentes fracciones de normal y tumor las células se simuló utilizando los datos de las células normales y células tumorales microdissected del mismo tumor de cáncer de pulmón. El rendimiento de los dos algoritmos se evaluó como de sensibilidad (A) y especificidad (B) en comparación con CNNLOH detectado por dChip en un análisis pareado de SNP serie de datos de las células normales y tumorales.
Métodos
Ética declaración
Este estudio se llevó a cabo de acuerdo con los principios expresados en la declaración de Helsinki y fue aprobado por el comité de revisión ética regional en Uppsala (número de referencia 2006/325). La necesidad de obtener el consentimiento individual de cada paciente fue cortado por la junta de revisión ética, ya que la mayoría de los pacientes de la población estudiada (& gt; 90%) habían fallecido en el inicio del proyecto, los resultados de la investigación no implican ningún riesgo médico , y los resultados no podían alterar la información para los pacientes, sus familias o la gestión del cambio. El procedimiento es totalmente de acuerdo con la Ley de Ética de la sueca.
Las muestras tumorales, estimación histológica del contenido de células tumorales y la preparación de ADN
NSCLC humanos congelados frescos se obtuvieron del tejido fresco y Uppsala Biobanco se utiliza de acuerdo con la legislación biobanco sueco. Las muestras de tumor emanado de los pacientes de una cohorte definida por que se registraron en el /registro de cáncer de pulmón Uppsala Örebro que tienen NSCLC, tuvieron una muestra de tejido congelado en el banco de tejidos y fueron diagnosticados en vida. estado de los casos se verificó mediante examen histopatológico y estudio de los registros médicos. Hematoxilina-eosina manchadas secciones criogénicas (4 mM) fueron preparadas a partir de los bloques de tejido tumoral incrustadas-OCT congelados y examinados al microscopio por un patólogo quirúrgico. Sesenta casos con un contenido de célula tumoral estimado más del 50% se incluyeron en el estudio. Para un subconjunto de estas muestras (Tabla 1) se realizó un recuento manual cuidadosa de tumor y las células normales por microscopía de luz usando rejillas en los campos de magnificación de alta energía (HPF). Al menos células 2000 se contaron en 5-10 diferentes áreas de la sección congelada, dependiendo del tamaño y la heterogeneidad de la muestra de tumor. Para cada muestra de ADN genómico se extrajo de 5-10 secciones de tejido congelado (10 mM) utilizando el Kit QIAamp DNA Mini (Qiagen) de acuerdo con el protocolo del fabricante.
Capture Laser Microdissecion de muestras de cáncer de pulmón
microdisección se realizó como se ha descrito previamente con modificaciones menores [19]. A partir de 5 muestras de cáncer de pulmón, se prepararon 12 micras de espesor secciones criogénicas, se transfirió a PALM portaobjetos de vidrio recubierto de membrana, y se almacenan a -80 ° C. Inmediatamente antes de la microdisección, las secciones se descongelan y se tiñeron con hematoxilina durante 2 minutos, seguido de fijación en un fijador de zinc durante 1 minuto y la deshidratación durante 1 minuto en 70% y 95% de etanol, respectivamente. Utilizando el Laser-MicroBeam Sistema PALM, áreas tumorales seleccionados que contienen 6000-10000 células se microdissected y se transfieren por medio de un láser puls a 15 l ATL tampón de extracción de ADN (Qiagen) en la tapa de un tubo de microcentrífuga. a continuación, la extracción de ADN se realizó utilizando el kit QIAamp DNA Micro acuerdo con el protocolo del fabricante (Qiagen).
Análisis de SNP arrays Affymetrix 250K
Se realizaron experimentos de matriz de acuerdo con los protocolos estándar de Affymetrix GeneChip ® matrices Mapping 250K (500K de gene Chip de Mapeo Ensayo manual (P /N 701930 Rev2.), Affymetrix Inc, Santa Clara, CA). Brevemente, el ADN genómico total se digirió con una enzima de restricción (
NSP1
), se ligó a un adaptador adecuado para la enzima, y se sometió a amplificación por PCR usando un único cebador. Después de la digestión con DNasa I, los productos de PCR se marcaron con un análogo de nucleótido biotinilado usando desoxinucleotidil transferasa terminal y se hibridaron con la micromatriz. sondas hibridadas fueron capturados por los conjugados de estreptavidina-ficoeritrina y, finalmente, se escanearon las matrices. control de la calidad del control de calidad, llamada genotipo y el número de copias de los análisis se hizo en el GeneChip® software de análisis de genotipificación Affymetrix (GType) 4.1. El modelo dinámico (DM) algoritmo se utilizó para realizar solo QC muestra. La especificación del control de calidad de 250K es un tipo de referencia & gt; 93% utilizando los valores por defecto del algoritmo. El análisis del número de copias posterior se realizó con un modelo oculto de Markov disponible en la herramienta Copia Número Análisis (CNAT) 4.0.1 con los siguientes parámetros: la decadencia de transición 5 Mb, la normalización y la mediana de 0,3 Mb factor de alisamiento. El conjunto de referencia utilizado consistió en 96 muestras CEU del proyecto HapMap (www.hapmap.org/downloads/raw_data/affy500k/).
La cuantificación de la fracción de células normales
Como primer regiones genómicas paso inferirse para contener deleciones mono-alélica se identificaron utilizando el Affymetrix Software CNA 4.0.1 como se describe anteriormente. Para estimar la fracción de células con contenido genómico 2 N, C
2 N, se utilizó la información específica de alelo. Los datos en bruto Affymetrix SNP se normalizó en el software dChipSNP utilizando el método de expresión basado en modelo y un método de sustracción de fondo que utiliza desajuste sondas (PM diferencia /MM) [6]. Las señales normalizadas se utilizaron luego para calcular alélica ratios de intensidad de I
i para cada SNP (R
i = B /(A + B)). Para tener en cuenta que el mismo número de alelos A y B pueden producir diferentes señales en el ensayo se normalizaron las relaciones alélicas al alelo frecuencias B (ABF) para un locus particular SNP en una muestra dada por una interpolación lineal de las frecuencias de los alelos conocidos para los tres genotipos (0, 0,5 y 1,0), tal como se derivan y gráficamente se ilustra en Peiffer
et al
2006 [17]. En resumen, la ABF para un determinado SNP
I
se calculó de la siguiente manera: en la que R
i es la relación de intensidad alélicas y m
AA, AB, BB son los ratios de intensidad alélicas medias para una referencia población, para el SNP particular. El conjunto de referencia era el mismo que el descrito para el análisis del número de copias de seguridad. Sólo se utilizaron los SNPs donde estaba presente una llamada AB en la población de referencia. Para los SNPs que no se disponía llamadas homocigotos, se utilizó la media AA o BB señal para todos los SNPs en las muestras de la población de referencia en su lugar.
Un histograma de la información de la frecuencia del alelo B-alelo específico de los marcadores en cada autosoma con la pérdida de número de copias se calculó. El histograma observado se comparó con histogramas simulados para variar fracciones de C
2N. El C
2 N del histograma más similar es la que tiene más probabilidades de haber dado lugar a los datos observados (ver Fig. 2). Las simulaciones describen la variación de ABF debido a la variación en las señales procedentes de los alelos A y B mediante la elaboración de las señales A y B a partir de distribuciones normales estimados a partir de regiones con número de copia 2. La media y la varianza para las distribuciones estaban (0, 0.015) para el alelo a y (0,995, 0,015) para el alelo B. El grado promedio de heterocigosidad se estimó a partir del número de copia 2 regiones al 36,7%. valores ABF simulados fueron calculados como la suma de las señales simuladas alelo B dividido por la suma de las señales de B alelo A y a partir de células que componen la muestra virtual. Por ejemplo, cuando la simulación de muestras con fracciones más altas de las células 2N, también se incrementa la proporción de células simuladas tanto con señales A y B. Para mantener el grado promedio de heterocigosidad y para obtener histogramas estables que se basan en los valores de la ABF número impar de 14 848 simulada loci SNP (ver descripción más detallada de la opción de configuración en el texto S1). La elección de otro número suficientemente grande de loci simulada produciría histogramas muy similares. Los histogramas se normalizaron a unidad de superficie para representar el patrón esperado para cada uno de los 200 pasos que variaban la fracción de C
células 2N entre 0 y 67%. La distancia euclidiana más pequeña entre el histograma observado y los histogramas con diferentes C
2N identificado la fracción más probabilidades de haber dado lugar al patrón de frecuencia de alelos B observado.