Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Next Generation-Análisis de la secuencia de modelos de cáncer de xenoinjerto

PLOS ONE: Next Generation-Análisis de la secuencia de modelos de cáncer de xenoinjerto

Estudios
Extracto

secuenciación de próxima generación (NGS) en el cáncer están limitados por la cantidad, la calidad y la pureza de las muestras de tejido. En esta situación, los xenoinjertos primarios han demostrado modelos preclínicos útiles. Sin embargo, la presencia de células del estroma derivadas de ratón representa un reto técnico para su utilización en estudios de NGS. Hemos examinado este problema en un modelo de xenoinjerto primaria establecida de cáncer de pulmón de células pequeñas (SCLC), un tumor maligno a menudo se diagnostica a partir de pequeñas muestras de biopsia o aspirado con aguja. El uso de un
in silico
estrategia que asignar lecturas según la especie de origen, de forma prospectiva compararon los datos de NGS modelos de xenoinjertos primarios con líneas celulares emparejados y con conjuntos de datos publicados. Mostramos aquí que bajo la cobertura de análisis de todo el genoma demostró notable concordancia entre los datos del genoma publicados y controles internos, a pesar de la presencia de ADN genómico de ratón. secuenciación de captura Exoma reveló que este procedimiento de enriquecimiento era altamente especies específicos, con menos de 4% de lecturas alinear con el genoma del ratón. expresión humano específico de perfiles con ARN-Seq replicado basadas en matrices experimentos de expresión génica, mientras que los perfiles de transcripción específicos de ratón correlacionados con los conjuntos de datos publicados de estroma del cáncer humano. Llegamos a la conclusión de que los xenoinjertos primarios representan una plataforma útil para el análisis complejo de NGS en la investigación del cáncer en los tumores con los recursos limitados de la muestra, o aquellos con poblaciones de células del estroma prominentes

Visto:. Rosselló FJ, Tothill RW, Britt K, Marini KD , Falzon J, Thomas DM, et al. Análisis de Secuencias (2013) de próxima generación de modelos de cáncer de xenoinjerto. PLoS ONE 8 (9): e74432. doi: 10.1371 /journal.pone.0074432

Editor: William B. Coleman, Universidad de Carolina del Norte Facultad de Medicina, Estados Unidos de América

Recibido: Abril 29, 2013; Aceptado: August 1, 2013; Publicado: 26 Septiembre 2013

Derechos de Autor © 2013 Rosselló et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Los fondos para este trabajo fue proporcionado por la Agencia de cáncer de la Victorian Consejo de Investigación médica de Australia (Proyecto de Grant 546.204), el Programa de Apoyo a la Infraestructura operativa del Gobierno de Victoria Nacional de Salud y, y. La financiación de cargo de acceso abierto: Agencia de Cáncer de Victoria. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:. Sr. Erwin Tantoso es empleado por Partek SG Pte. Ltd. Esto no altera la adhesión de los autores a todas las políticas de PLoS ONE sobre los datos y compartir materiales. Los otros autores no revelaron los posibles conflictos de interés.

Introducción

A pesar de la aplicación de la tecnología NGS a la investigación del cáncer ha dado lugar a avances dramáticos en la comprensión de la base genómica de estas enfermedades, la profundidad y la complejidad de los datos de secuenciación se correlaciona negativamente con la cantidad y la calidad de la muestra de tumor utilizado para el análisis [1]. Además, muchos tumores comunes, tales como el cáncer de páncreas, se caracterizan por una extensa infiltración de elementos del estroma, lo que reduce el umbral de detección para variantes específicas raras, cáncer [2]. Como resultado, los cánceres comunes diagnosticados por pequeñas biopsias son muy poco representados en los estudios de NGS, que se basan predominantemente en muestras de tejido resecado quirúrgicamente.

Un enfoque para superar este problema es el uso de modelos de xenoinjertos primarios, en la que pequeños muestras de tejido pueden ser injertados directamente, expandido y se pasaron en ratones inmunodeficientes sin exposición a las condiciones de cultivo de tejidos convencionales [3]. Aunque las células tumorales se mantienen en ratones inmunodeficientes, que [4], y otros [5] - [7], han mostrado que retienen las características importantes del tumor primario que, de forma importante, se pierden irreversiblemente en cultivo celular [2], [ ,,,0],4]. Por otra parte, a pesar del hecho de que el componente estromal es derivado de ratón, modelos de xenoinjertos primarios se han utilizado con éxito para la investigación preclínica de una variedad de células de los sistemas de señalización autónomo y del estroma derivadas de relevancia terapéutica para el cáncer [7].

Basándose en estos datos, los xenoinjertos primarios podrían representar una plataforma útil para el análisis de NGS cuando el tejido de cáncer es limitante. Ding
et al.
[8], en un estudio que tuvo como objetivo identificar las mutaciones somáticas y variantes estructurales de cáncer de mama de tipo basal, que se calcula mediante técnicas de patología tumoral de la composición a continuación, calcular y ajustar el número de tumores leer. Basándose en las estimaciones de patología, los autores utilizan una corrección determinista de contaminación de tumor por el recuento normal de lectura, lo que afecta la frecuencia del alelo mutante, y se aplican sólo a las muestras de tumor y metástasis primarias. Se asumió que debido al tipo de mapeo de baja específico de huésped lee al genoma del injerto, se requiere corrección profundidad de lectura de la muestra de xenoinjertos.

En nuestra opinión, la presencia de contaminación de ADN y ARN afecta ratón la sensibilidad y especificidad del análisis de NGS en estos modelos tumorales que no deben basarse en estimaciones celularidad, pero debe ser precisa y sistemática dirigida. Además, dado que la mayoría de las técnicas actuales utilizan la metodología NGS escopeta de secuenciación, la resolución de cualquier artefacto potencial podría realizarse
post-hoc
durante los análisis bioinformáticos, que inequívocamente identifican las especies de origen lee. Este problema se ha discutido previamente para ofrecer un altísimo rendimiento de secuenciación de ADNc (RNA-Seq) por Conway
et al.
[9] y Raskatov
et al.
[10], quienes encontraron variables cantidades de la secuencia derivada del huésped lee. A continuación, se analizaron de forma prospectiva la capacidad de un
in silico
flujo de trabajo diseñado para asignar definitivamente las especies de origen de NGS lee en varios modelos de xenoinjertos de líneas derivadas de células primarias y previamente caracterizados de SCLC, y la comparación de estos resultados con conjuntos de datos publicados.

Materiales y Métodos

Ética Declaración

Todos los experimentos con animales fueron aprobados previamente por un Comité de Ética Animal de la Universidad de Monash y se llevaron a cabo de acuerdo con " Código australiano de Prácticas para el Cuidado y uso de animales con fines científicos ".

las células

las líneas de xenoinjertos de SCLC primario LX22, LX33 LX36 y se hicieron pasar como se describe anteriormente [4]. En breve, se utilizaron tejidos extirpados de pacientes con CPCP quimioterapia anteriormente para generar muestras de xenoinjertos primarios. muestras tumorales fueron cortadas en trozos pequeños con hojas de afeitar estériles, se trituró en 1 x PBS, se filtró a través de un filtro de malla de 60 micras, se centrifugó y se resuspendió en 500 l de Matrigel (BD Biosciences) a 4 ° C. células procesadas fueron inyectadas subcutáneamente en los flancos de graves ratones diabéticos no obesos /combinados inmunodeficientes. Una vez que los tumores P0 alcanzaron un diámetro de 1 cm, se sacrificó el ratón y el tumor resecado se dividió en secciones para la congelación a presión o el paso en serie. xenoinjertos de tumores se prepararon para pases en serie
in vivo
como se describió anteriormente y se inyectaron las células en los costados de ratones desnudos atímicos en Matrigel. muestras de tumores congelados a pases y mosquetón se caracterizaron de forma rutinaria para histopatológico e inmunohistoquímicos en el tumor matriz [4].

línea celular NCI-H209 autenticados se adquirió de ATCC, re-derivado de un único clon de células usando el sencillo clonación de células por dilución en serie (Corning, Tewksbury, MA, EE.UU.) y después se cultivaron
in vitro
e in vivo como se describe en Watkins
et al.
[11]. ADN de las muestras se extrajo utilizando DNAeasy Tissue Kit y Blood (Qiagen, Santa Clara, CA, EE.UU.) según las instrucciones del fabricante. ARN fue purificado utilizando miRNeasy Mini Kit utilizando QIAzol (Qiagen, Santa Clara, CA, EE.UU.) siguiendo las instrucciones del fabricante.

Preparación de secuenciación bibliotecas en
Exoma y bajo la cobertura de todo el genoma de ADN re- secuenciación: ADN diana (3UG) se cortó en primer lugar, el uso de un dispositivo acústico focal (Covaris, Woburn, MA, EE.UU.). bibliotecas de fragmentos de ADN para exoma re-secuenciación y bajo la cobertura de la secuenciación de todo el genoma se construyeron a partir de ADN cortado por etapas secuenciales de fines de reparación, A-tizón y la ligadura de secuencias adaptadoras compatibles lllumina indexada (ADN TruSeq, Illumina, San Diego, CA , ESTADOS UNIDOS). bibliotecas de fragmentos para exoma re-secuenciación, PCR amplificados se enriquecen de ADN exonic por largo oligonucleótido de captura de hibridación de acuerdo con el protocolo del fabricante (v3.0 SeqCap EZ Exoma Biblioteca, Roche Nimblegen, Madison, WI, EE.UU.). De bajo la cobertura de todo el genoma, bibliotecas amplificados por PCR eran de un tamaño seleccionado para capturar el ADN de longitud 500-700nt, utilizando una plataforma de electroforesis automatizada (Prep Pippen, Sage Science Inc., Beverly, MA, EE.UU.). Todas las bibliotecas de secuenciación fueron cuantificados usando PCR en tiempo real contra una biblioteca de concentración conocida y luego procesado para la generación de clúster y la secuenciación de acuerdo con protocolos estándar (HiSeq de 2000, Illumina, San Diego, CA, EE.UU.).

ARN Sec.

ARN total se comprobó la calidad y el rendimiento mediante electroforesis de microfluidos automatizado (Bioanalyzer 2100, Agilent Technologies, Santa Clara, CA, EE.UU.) y espectrofotómetro (NanoDrop, Thermo Scientific, Wilmington, dE, EE.UU.). bibliotecas de ARN-Seq no direccionales fueron creados de acuerdo con el protocolo del fabricante (kit Truseq RNA-Seq Biblioteca Prep v2, Illumina, San Diego, CA, EE.UU.). Brevemente este método implicaba etapas secuenciales de enriquecimiento de mRNA de 3UG ARN total, ARN fragmentación por calentamiento en presencia de cationes divalentes, una transcripción inversa cebada al azar y la síntesis de cDNA de la segunda cadena seguido de la preparación de las bibliotecas de fragmentos de ADN utilizando Illumina adaptadores compatibles y amplificación por PCR como se ha descrito anteriormente para las bibliotecas de ADN.

Todas las muestras se evaluaron por separado para la calidad de lectura general utilizando FASTQC (http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc) y la baja calidad lecturas se filtraron y fueron recortados duro usando Trimmomatic (puntuación mínima promedio de Phred, 6 bases consecutivas, de 20 y una longitud mínima de leer 50nt, el cuadro S1) [12].

primas conjuntos de datos de secuenciación de profundidad están disponibles al público en el Centro Nacional de Información biotecnológica corto Leer archivo (número de acceso SRA082685).

estrategia para aislar e identificar las especies de origen NGS lee

La estrategia propuesta se asemeja a la descrita por Conway
et al.
[9], pero difiere en varios aspectos importantes. En primer lugar, una alineación primaria con el genoma del injerto, en este caso, se realiza el genoma humano, donde lee se dividen en lecturas de injerto asignada y de injerto no asignada; segundo, tanto de injerto asignan y de injerto-unmapped de lectura-conjuntos están realineados para el genoma del huésped, en este caso el genoma del ratón, para identificar más común injerto-huésped y anfitrión específico lee respectivamente; Por último, común injerto-huésped Las lecturas se filtra a partir del conjunto de lectura obtenido en la alineación principal para obtener injerto específica lee. En este estudio, los procesos de identificación y clasificación se realizaron
a través de
recopilación y comparación de los identificadores de lectura de las alineaciones de injerto de acogida /, productores lee en formato FASTQ. Como resultado, injerto específico identificado dice estaban re-alineado con el genoma del injerto.

alineaciones posteriores produjeron tres conjuntos de datos separados, alineados
i. e.
, dice que solo se puede correlacionarse con el genoma humano, lee que fueron asignadas exclusivamente al genoma del ratón y lee mapeado en el que ambos genomas. Además de analizar el ARN-Seq leer conjuntos, se verifica aún más esta estrategia de bajo cobertura de todo el genoma y el exoma de captura de experimentos de secuenciación. Una visión completa descripción de todas las medidas incluidas en la estrategia propuesta se muestra en la Figura 1. Por cada alineación, mapeado y sin asignar lee contenida en archivos con formato SAM BAM /[13] fueron filtrados en función de su estado de indicador bit a bit usando Samtools [13], un script de Perl personalizado que recoge las identidades únicas de lectura de la alineación /SAM no alineado archivos de formato y se les filtra desde los archivos FASTQ prima, [Simon Andrews, 2010, Seqanswers.com [14]. Disponible en: http://seqanswers.com/forums/showpost.php?p=25302&postcount=3] y el software cmpfastq_pe, que comparó los archivos FASTQ par de gama prima e informó común y único lee (http: //compbio .brc.iop.kcl.ac.uk /software /cmpfastq_pe.php).

también se especifican las componentes de software utilizados en cada paso. Las líneas continuas representan la trayectoria analítica director siguió y las líneas discontinuas representan pasos auxiliares.

Asignación de puntajes se utilizaron para evaluar la calidad de la cartografía de las muestras procesadas y para descartar aún más exitosa de múltiples lee. Como regla general, se asumió que una calidad de mapeo más alto significa una lectura más "único" alineado y para la mayoría de las muestras, un alto porcentaje de los pares de lectura tenía una calidad de mapeo por encima de 20 (Tabla S2).

análisis del transcriptoma

el análisis del transcriptoma entero de tres xenoinjertos de SCLC primarios se realizó a través de RNA-Seq utilizando las plataformas de secuenciación GAIIX 2000 y HiSeq (Illumina, San Diego, CA, EE.UU.). El experimento fue emparejado con el fin de 100 nt de longitud de lectura (tamaño de inserto promedio 300nt). El número mínimo de lecturas dirigidas por muestra fue de 40 millones de lecturas (Tabla S1).

Con el fin de identificar de forma inequívoca e injerto separado (humana) y el anfitrión (ratón) lee, muestra procesada dice estaban alineados secuencialmente tanto del injerto [completa del genoma humano hg19 (versión UCSC, febrero de 2009)] y el anfitrión [completa del genoma del ratón mm.9 (versión UCSC, julio de 2007)] utilizando los genomas de Bowtie-TopHat [versión 2.0.4, el segmento de longitud 29nt, 1 desajuste en el segmento, permitir que durante la máxima sensibilidad, la cobertura de la búsqueda realizada [15], [16]. No se de-duplicación se realizó para el análisis de RNA-Seq posterior a la asamblea.

la cuantificación del mRNA de todos los genes anotados desde el genoma humano se realizó utilizando el software Partek® (Partek Inc. (1993) Partek® Genómica ™ Suite) . Las lecturas se normalizaron mediante la lecturas por kilobases del modelo exón por millón asignada lee método [17].

Una expresión de xenoinjertos de microarrays conjunto de datos primario humano específico (GSE15240) [4] fue recuperada del Centro Nacional de fibroblastos de Información biotecnológica (NCBI) gene Expression Omnibus (GEO) repositorio [18].

para comparar el ratón específico lee a firmas de genes del estroma del cáncer publicados anteriormente, un cáncer de mama asociado conjunto de datos [19] fue recuperado de la GEO repositorio (GSE10797). [18]

para todos los análisis de microarrays, sondas de genes se normalizaron utilizando cuantil normalización y corrección de fondo (base 2 y mediana polaco para la transformación probeset y resumen respectivamente log) se ha realizado mediante el robusto múltiples -array método de la media (RMA) [20].

Comparación de microarrays y ARN-Seq resultados de la expresión de genes se realizó utilizando la correlación lineal (r de Spearman) entre la base de registro 2 de las unidades de intensidad de genes arbitrarias cuantificada y la log de base 2 RPKM como se describe en Mortazavi
et al
[17].

exoma resecuenciación análisis

análisis Total-exoma de las muestras obtenidas de la sangre periférica, células NCI-H209 línea y su derivado xenoinjerto se llevó a cabo a través de la secuencia de ultra-alto rendimiento exoma usando la plataforma de secuenciación HiSeq 2000 (Llumina, San Diego, CA, EE.UU.). El experimento fue emparejado con el fin de 101nt longitud de lectura (200 pb tamaño de inserto). La profundidad media específica de la cobertura fue ajustado a 50x (ver Tabla S1 para el número total de lecturas secuenciados).

Procesado de muestras dice estaban alineados secuencialmente tanto del injerto [hg19 completa del genoma humano (versión UCSC, febrero de 2009)] y el anfitrión [completa del genoma del ratón mm.9 (versión UCSC, julio de 2007)] genomas utilizando la herramienta de alineación de Burrows-Wheeler [(BWA), BWA algoritmo utilizado ALN, longitud de semilla de 22nt; máxima distancia de edición en la semilla de 0 [21].

variantes de nucleótido único (SNVS) descubrimiento se realizó a través de un conjunto de herramientas incluye en Picard (http://picard.sourceforge.net) y GATK [22 ], [23]. En primer lugar, lecturas duplicadas fueron retirados de los archivos BAM realineados utilizando los MarkDuplicates comando desde Picard (http://picard.sourceforge.net). duplicación niveles estimados se describen en la Tabla S3. Posteriormente, los archivos deduplicados BAM se realinear localmente alrededor novedoso y conocidos indeles utilizando el RealignerTargetCreator y los caminantes IndelRealigner de GATK [23]. Por último, las puntuaciones de calidad de base fueron recalibrados utilizando los CountCovariates y caminantes TableRecalibration de GATK [23]. Este procedimiento se llevó a cabo para cada una de las tres muestras analizadas.
Se realizaron
llamadas sin procesar SNP utilizando el UnifiedGenotyper Walker de GATK [23] con una puntuación mínima de calidad Phred base 20, un umbral de confianza de llamada de 50 (Phred -scaled) y un umbral de confianza del 10 emmition (Phred-escala). Prima llama SNPs fueron filtradas utilizando el VariantFiltration andador con los siguientes parámetros: tamaño de clúster SNP = 10; Cobertura: ≥ 5; Qual: ≥ 50; Strand sesgo: la prueba exacta de Fisher, ≥ 60. específico de la muestra nuevos SNPs,
i. . E
, los que no están presentes en la base de datos de polimorfismos de nucleótido único (dbSNP) (Bethesda (MD): Centro Nacional de Información sobre Biotecnología, Biblioteca Nacional de Medicina (dbSNP. 137: 137; http: //www.ncbi. nlm.nih.gov/SNP/), fueron anotados y su efecto predicho usando SnpEff [24] y el variantAnnotator Walker de GATK [23].

Genoma visualización se realizó mediante el navegador Genoma Integrativa (IGV) [ ,,,0],25], [26]. Multiespecies pistas de alineación locales fueron recuperados desde el servidor de datos IGV.

todo el genoma de análisis

A bajo la cobertura de la secuenciación de todo el genoma de las muestras obtenidas a partir de sangre periférica, H209 línea celular y su xenotrasplante primario derivado se llevó a cabo a través de todo el genoma escopeta secuencia de ultra-alto rendimiento utilizando la plataforma de secuenciación HiSeq 2000 final emparejado (Llumina, San Diego, CA, EE.UU.). el experimento fue con (tamaño de 200 pb inserción) 101nt longitud de leer . La profundidad media específica de cobertura se establece en 4 veces (véase el cuadro S1 para el número total de lecturas secuenciados).

procesado de muestras dice estaban alineados secuencialmente tanto del injerto [hg19 completa del genoma humano (versión UCSC, febrero de 2009) ] y el anfitrión [completa del genoma del ratón mm.9 (versión UCSC, julio de 2007)] genomas utilizando la herramienta de alineación de Burrows-Wheeler [(BWA), BWA algoritmo utilizado ALN, longitud de semilla de 22nt; máxima distancia de edición en la semilla de 0 [21]. duplicación niveles estimados resultaron ser marginal y se describen en la Tabla S3.

intra e inter-cromosómicas reordenamientos descubrimiento de lo específico humano identificado lecturas se realizó utilizando FusionMap [palmo y leer dividida umbral de recuento de 3 y dividida ancla mínimo de 4 lee [27]. fusiones detectados se representaron frente a una representación circular del genoma humano (parcela Circos) usando Circos [28].

variaciones del número de copias (CNV) y el contenido de alelos en regiones genómicas se detectaron utilizando Control-Freec [29]. La muestra de sangre periférica se utilizó como un control de línea de base. Circos parcelas de la CNV detectados fueron construidos usando Circos [28].

Resultados

Como se muestra en la Figura 2, las estrategias de NGS evaluados revelaron diferentes proporciones de acogida específica lee. captura Exoma y RNA-Seq producen la menor proporción de ratón específico lee, que van desde 4% a 7%. En contraste, la secuenciación de todo el genoma escopeta produjo el mayor número de lecturas que alineado única para el genoma del ratón, que correspondía a 20% del número total de lecturas (Figura 2). El número homóloga de lee,
es decir
, los lee que Alineados tanto para el genoma de ratón y humano, se encontró que era similar para todos los métodos, que van desde 4% (RNA-Seq) a 1,5% (Exoma -capturar). Un resumen completo de las alineaciones realizadas se describe en la Tabla S2.

Para cada categoría de leer, la proporción (%) del número total de lecturas se especifica.

Todo el genoma el análisis

Como era de esperar, la profundidad de la cobertura de secuencia de las muestras sometidas a baja cobertura de la secuenciación del genoma estaba por encima de 3 veces para todas las muestras analizadas (Tabla S3 a). Sin embargo, la profundidad de la cobertura de la muestra de xenoinjerto se vio gravemente afectada por la contaminación del ratón y produce el valor más bajo de las 3 muestras tanto de media profundidad de la cobertura (3,3 veces) y el porcentaje de lecturas cubierto al menos 3 veces (Tabla S3 A).

Copiar número análisis de la variación tanto de la línea celular y las muestras de xenoinjerto producido resultados muy similares cuando se utilizó la muestra de sangre periférica como control (Figura 3 A). Se observaron un total de 578 y 470 alteraciones del número de copias adquiridas de forma somática para la línea celular y las muestras de xenoinjerto respectivamente. Estas diferencias se deben principalmente a las diferencias sutiles en la profundidad de la cobertura de las regiones genómicas evaluadas y la mayoría de ellos corresponden a focales ganancias o pérdidas de número de copias en el medio de las regiones diploides (Figura 3 B). Como se observa en la Figura S1, tanto la línea celular (Figura S1 A) y de xenoinjerto (Figura S1 B) muestras produjeron perfiles de la CNV muy similares para todos los cromosomas analizados. Un perfil detallado CNV de ambas muestras se puede encontrar en conjuntos de datos de S1 y S2. Un patrón similar se observó para
beta
perfiles de frecuencia de los alelos para ambos tipos de muestras (Figura 3 C).

(A) de la trama Circos que representa las variaciones del número de copia, reordenamientos inter e intra-cromosómicas de NCI línea celular -H209 y un tumor de xenotrasplante derivada de ella. variaciones del número de copia (rojo, ganancia; verde, pérdida) se calcularon sobre la base de la cobertura mediante el corresponsal de sangre periférica como control. reordenamientos inter e intra-cromosómicas están representados en azul (inter-cromosómicas) y azul oscuro (intra-cromosómicas). (B, C) Perfil detallado de las variaciones del número de copia y las frecuencias de los alelos B-1 del cromosoma de la línea de células analizadas y xenoinjerto. Como se describió anteriormente, se utilizó la sangre periférica corresponsal como control para ambos tipos de análisis. perfiles de número de copias se muestran en rojo (ganancia), verde (pérdida) y gris (sin cambios). LOH se muestran de color azul claro.

se pudieron observar resultados comparables para las reordenamientos intra e inter-cromosómicas (Figura 3 A), donde se detectaron más de 70 reordenamientos para ambas muestras. Se encontró un ejemplo de reordenamientos cromosómicos entre inter-
BAGE4
, unos antígenos tumorales candidato gen de codificación, y
MLL3
, un miembro de la mieloide /linfoide o leucemia de linaje mixto familia (MLL) . Una lista completa de los reordenamientos intra e inter-cromosómicas comunes a ambas líneas celulares y de las muestras de xenoinjerto se puede encontrar en conjuntos de datos S3.

Los datos presentados anteriormente apoya nuestra hipótesis de que una CNV y análisis a fondo variante estructural puede llevar a cabo cuando se utilizaron tanto la línea celular y las muestras de xenoinjerto. Se encontró que en la contabilización correcta de contaminación ratón específicos, los resultados obtenidos usando líneas celulares no contaminados pueden ser reproducidos con precisión utilizando muestras de xenoinjertos, con los beneficios adicionales de la utilización de un
in vivo
modelo.

secuenciación Exoma análisis

Una secuencia de profundidad de la cobertura en las regiones capturadas específicas en todas las muestras de más de 100 veces significa que se logró, con más del 80% de las bases cubiertas al menos 30 veces (Tabla S3 B) . En la línea celular y las muestras de xenoinjerto, 68,5 y 74,7 por ciento de las regiones exoma dirigidos fueron cubiertos al menos 50 veces, con una secuencia de profundidad media de cobertura de 109 y 136 veces, respectivamente. El análisis de secuencias en las tres muestras (
i. e.
, sangre periférica, de líneas celulares y xenoinjertos) detectó un total de 53.186 (52.429 conocido y 757 novela) SNPs. Esas variantes que se han encontrado en la sangre periférica se consideraron de origen de la línea germinal, y se procesaron para el análisis no más lejos terciaria.

Un total de 946 variantes somáticas, 351 de estos nuevos, eran comunes tanto a la línea celular y muestras de xenoinjertos (Figura 4 A). De éstas, 886 fueron sustituciones de una sola base, 28 eran inserciones y deleciones eran 32 (Figura 4 B). Una lista completa de las mutaciones somáticas detectadas se describe en conjuntos de datos S4. análisis de clase de mutación mostró G & gt; A /C & gt; T transiciones fueron los más frecuentes (33%), seguido por A & gt; G /T & gt; C transiciones (23%) y G & gt; T /C & gt; A transversiones (20%) (Figura 4 DO). En general, este patrón fue similar a la reportada por Pleasance
et al
[30] .El descrito previamente TP53 aceptor de empalme y perturbar punto de mutación RB1 C706F, característico de SCLC, [30], se detectaron tanto en la célula xenoinjertos de línea y muestras.

el número de variantes conocidos y nuevos (a) y tipos de variantes (B) que se consideren comunes a ambos la línea celular y xenoinjerto y los detectados sólo en la línea celular y xenoinjerto. . (C) Cuantificación de los seis posibles clases de mutación

En las 946 variantes comunes a ambas líneas celulares y de xenoinjerto, el efecto predictor SnpEff reportaron un total de 1,806 (Figura 5 A & amp; B). Para los fines de este análisis, se informó el efecto para todos los posibles transcripciones de genes, por lo que el número total de variantes reportados difiere del número total de efectos encontrados. Las categorías de efectos más representados, cuando se clasifica por tipo, eran los correspondientes a los intrones (721), no es sinónimo de codificación (305) y sinónimo de codificación (170) (Figura 5 A). Cuando los efectos variantes fueron clasificados por regiones región, intrón y exón, como se esperaba, fueron los representados más significativamente (Figura 5 B). Una descripción de moderado y alto impacto SNPs predijo efectos de la primera transcripción afectados se describen en los conjuntos de datos S5.

Se identificaron sesenta y cuatro variantes somáticas únicas para el xenoinjerto (Figura 4 B). De éstos, sólo 15 eran variantes de codificación no sinónimas. En todos los casos, las variantes fueron heterocigotos, y SnpEff predijeron un efecto moderado sobre la función de la proteína (Tabla S4 A). Estas variantes de genes afectados transcripciones de los genes siguientes:
ESPN, KAZN, APEH, MUC20, MUC17, AQP7, ZNF808
y
LUZP4
. Con el fin de identificar la causa de estas discrepancias entre las variantes detectadas en la línea celular y las muestras de xenoinjerto, se examinaron las regiones genómicas que rodean las variantes detectadas. Con el fin de excluir la posibilidad de que estas variantes surgieron contaminen secuencia de ratón, se realizó el siguiente análisis. En primer lugar, se aisló la secuencia lee adyacente a la región de interés dentro de una gama de 1,000bp (Ver Figura S2 para ejemplos detallados). alineamientos locales por pares de estas regiones entre los genomas humanos y de ratón mostraron que un alineamiento global no podría haber sido posible entre la secuencia analizada lee y el genoma del ratón (Figura S2). A continuación, se intentó alinear estas lecturas con el genoma del ratón. No se produjeron alineaciones. Estos datos muestran que la codificación de las variantes región única para el xenoinjerto eran de origen humano

Desde la heterogeneidad genética ahora se considera una característica cardinal de muchos tipos de cáncer [31] - [33]., Nos preguntamos si estos xenoinjerto variantes específicos de pudieron detectarse en el conjunto de datos de la línea celular original. Inspección detallada de la secuenciación lee y la secuencia de la profundidad de la cobertura de las regiones pertinentes reveló que la gran mayoría (9 de 15) de estas variantes fueron detectables, pero estaban por debajo del umbral de frecuencia de los alelos de 0,2 (Figura S3 & amp; Tabla S4 Un ). Para las variantes no se detectó en la línea celular, ya sea la profundidad de la cobertura de secuencia estaba por debajo de 10 veces o el nucleótido alelo alternativo no se observó (Tabla S4 A). Estos datos apoyan la conclusión de que las variantes únicas para el xenoinjerto surgieron como consecuencia de la expansión clonal de una población celular heterogénea línea, o nuevas variantes que surgen de mutaciones espontáneas fondo.

A más de 74 variantes se identificaron en la célula línea, pero no en la muestra de xenoinjerto (Figura 4 B). De ellos, 9 (
RHOA, MUC17, TRIM22, UNC93B1, MAML2, HIF1A, FAM18B2 y GPR64
) dio lugar a no sinónimo cambios de codificación región con un impacto moderado predicho en función de las proteínas (Tabla S4 B). Todas estas variantes discrepantes resultaron ser heterocigotos (Tabla S4 B). Una comparación de la secuencia lee y secuencia de profundidad de la cobertura de estas regiones reveló una cobertura similar tanto en la línea celular y de la muestra de xenoinjerto (Tabla S4 B & amp; figura S4). Utilizando un enfoque similar al adoptado para las variantes de xenoinjertos-específica, se determinó que en todos menos en un caso, la variante de la línea celular específica podría ser fácilmente detectado en el xenoinjerto, pero una vez más estaban por debajo del umbral misma frecuencia de los alelos. Desde estas lecturas se identificaron en una población pura línea celular humana, se concluye que las células que contienen estas variantes discrepantes se representan en la frecuencia más baja en el xenoinjerto, más que como resultado de la contaminación del ratón o la variación en la profundidad de secuenciación.

el número de variantes detectadas discordantes para cada muestra - 64 xenoinjerto específica

frente a 74 líneas de células variantes específicas - puede haber sesgado la relación conocida novela a la observada en el xenoinjerto (Figura 4 B). Esta relación muestra está cerca de 1:01, más alta que la observada para la línea celular específica y común línea celular -. Xenoinjertos variantes, que está por debajo de 1 (Figura 4 B)

El conjunto de datos de la muestra xenoinjerto producidos la más alta profundidad de secuencia media de cobertura y 75% de las bases secuenciadas fueron cubiertos al menos 50 veces. La gran mayoría de las variantes somáticas se detectaron en ambas líneas celulares y de xenoinjerto, mientras que las variantes que se detectaron de forma única a cualquiera en la línea celular o el xenoinjerto representa una proporción menor sin efectos significativos sobre la traducción del mRNA de empalme. Tomados en conjunto, estos datos muestran que la secuenciación del exoma de captura en modelos de xenoinjertos produce una detección altamente precisa y reproducible de variantes significativas de codificación de cada región.

transcriptoma análisis

El análisis del transcriptoma humano específico de primaria de tres SCLC modelos de xenoinjertos (LX22, LX33 y LX36) mostraron una fuerte correlación (correlación de Spearman = 0,75, P & lt; 0,001) con una serie de datos de expresión de genes publicados previamente establecidos en los mismos modelos de tumores utilizando probesets cDNA humanos específicos [4] (Figura 6 A), por lo que la validación independiente nuestra estrategia de especies específicas

(A) Comparación de la expresión génica detectada por RNA-Seq y Affymetrix gama de plataformas de expresión para muestras de SCLC idénticos (media, n = 3, P & lt;. 0.01) . (B) Comparación de la expresión de genes entre los tumores primarios de SCLC [34] (eje Y, medio, n = 15) y xenoinjertos primarios (eje X, significa, n = 3) (P & lt; 0,01). (C) Comparación de la expresión génica detectada por Affymetrix matriz de estroma cáncer humano micro-diseccionado [19] (eje Y, significa, n = 28) y RNA-Seq datos de expresión de ratón-específicas en los modelos de xenoinjerto de SCLC (eje X, significa , n = 3) (P & lt;. 0,01) guía empresas
Un análisis de correlación entre la expresión de genes a tumores primarios publicados recientemente SCLC experimento RNA-Seq [34] y la humanos específicos de ARN-Seq lee de SCLC modelos de xenoinjertos primarias, mostraron una correlación positiva entre ambos conjuntos de datos (correlación de Spearman = 0,68, P & lt; 0,001) (Figura 6 B).

El conocimiento de la salud

Los síntomas del cáncer de cerebro que afectan la salud

Los síntomas del cáncer de cerebro dependen de varios factor

Los costos relacionados con la atención del cáncer

Todo tiene un precio en este mundo moderno; hay un component

Acomodásemos a Búsqueda - ¿Puede usted realmente se les paga para tienda

¿Cómo es posible que le paguen por buscar, entonces usted de

Varios consejos para prevenir hueso Cancer

varios Consejos para prevenir cáncer de hueso El cáncer d

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]