Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: impacto de las variables pre-analíticos sobre dirigidas contra el cáncer de genes Secuenciación Efficiency

PLOS ONE: impacto de las variables pre-analíticos sobre dirigidas contra el cáncer de genes Secuenciación Efficiency


Extracto

especímenes tumorales son a menudo conserva como (FFPE) los bloques de tejido fijado en formol e incluidos en parafina, la fuente clínica más común de ADN secuenciación. En este documento, se evaluó el efecto de los parámetros pre-secuenciación para guiar la selección de la muestra adecuada para la secuenciación del gen diana. Se recogieron datos de 113 muestras de tumor de pulmón FFPE, y se realizó la secuenciación del gen diana. Las bibliotecas se construyeron utilizando sondas personalizadas y se secuenciaron de extremo emparejado en una plataforma de secuenciación de próxima generación. Un ensayo de control de calidad basado en la PCR (QC) se utilizó para determinar la calidad del ADN, y una relación fue generada en comparación con el control de ADN. Hemos observado que el tiempo de almacenamiento FFPE, relación de PCR /QC, y la entrada de ADN en la preparación de la biblioteca, se correlacionó significativamente con la mayoría de los parámetros de eficiencia secuenciación incluyendo la profundidad de la cobertura, la tasa de alineación, el tamaño de inserción, y leyó la calidad. Una puntuación combinada usando los tres parámetros se generó y ha resultado ser muy precisa para predecir las métricas de secuenciación. También puso de manifiesto la variabilidad del recuento de lecturas amplia dentro del genoma, con una peor cobertura en regiones de bajo contenido de GC como en
KRAS
. calidad de la muestra y el contenido de GC tuvieron efectos independientes sobre la profundidad de secuenciación, y se observaron los peores resultados en las regiones de bajo contenido de GC en muestras de mala calidad. Nuestros datos confirman que las muestras FFPE son una fuente fiable para la secuenciación del gen diana en el cáncer, previstos controles de calidad adecuado de la muestra se ejercen. la calidad del tejido se debe evaluar de manera rutinaria para los factores pre-analíticos, y la profundidad de secuenciación puede ser limitado en regiones genómicas de bajo contenido de GC si se utilizan muestras subóptimas

Visto:. Araujo LH, Timmers C, Shilo K, Zhao W , Zhang J, Yu L, et al. (2015) Impacto de las variables pre-analíticos sobre Eficiencia dirigidas contra el cáncer de genes Secuenciación. PLoS ONE 10 (11): e0143092. doi: 10.1371 /journal.pone.0143092

Editor: Sumitra Deb, Virginia Commonwealth University, Estados Unidos |
Recibido: Septiembre 4, 2015; Aceptado: September 26, 2015; Publicado: 25 Noviembre 2015

Derechos de Autor © 2015 Araujo et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Disponibilidad de datos: Todos los datos relevantes están dentro del apoyo de sus archivos de información en papel y

Financiación:. LHA con el apoyo de una Fundación Conquer cáncer de ASCO Largo Plazo Beca Internacional (vida) y un Premio Fundación Landon AACR-INNOVADOR Internacional para la Colaboración en Investigación del Cáncer. Este trabajo fue financiado por un NIH /NCI 1RC1 CA146260-01, NCI R01CA60691, NCI R01CA87895, NCI P30CA022453, y el Centro de Cáncer programa de subsidios del Estado de Ohio (CCSG), NCI CA16058. T.G.N y C.J.M. son empleados por GenomOncology. Esta fuente de financiación proporcionado apoyo en forma de salarios de los autores (T.G.N y C.J.M), pero no tuvo ningún papel adicional en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito. Las funciones específicas de estos autores se articulan en la sección autores contribuciones

Conflicto de intereses:. T.G.N y C.J.M. son empleados por GenomOncology. Esto no altera la adhesión de los autores a PLoS ONE políticas en los datos y materiales de uso compartido.

Introducción

En la última década, una mejor comprensión de la biología del cáncer y la identificación de mutaciones somáticas en el cáncer han dado lugar a una nueva era en la oncología personalizada. [1] Landmark ejemplos incluyen el descubrimiento de mutaciones en los protooncogenes c-
KIT Hoteles en tumores del estroma gastrointestinal (GIST), [2] receptor del factor de crecimiento epidérmico (
EGFR
) en los adenocarcinomas de pulmón, [3] y v-Raf sarcoma murino oncogén viral homólogo B1 (
BRAF
) en los melanomas. [4] Los tumores que albergan estas mutaciones demuestran excepcional sensibilidad a la quinasa específica inhibidores dirigidos contra las respectivas vías activadas.

Estas mutaciones oncogénicas son a menudo definidos como conductores de cáncer, ya que ofrecen una ventaja selectiva a un clon celular, necesario para la iniciación del tumor y el mantenimiento. [5] En la clínica, pueden sirven como huellas digitales que ayudan a los médicos a subtipo de cáncer que, de lo contrario, presentan patrones histológicos similares. [6-9] Si bien perfilado mutacional se ha convertido en una herramienta útil para nuevos tratamientos más eficaces a medida dirigida, han surgido nuevos desafíos incluyendo la frecuente necesidad de obtener muestras tumorales óptimas para las pruebas genéticas adicional. [10-12] por otra parte, las pruebas múltiples se pueden recomendar en un entorno clínico en el que un gran número de mutaciones conductor candidatos que necesitan ser evaluados. En el cáncer de pulmón de células no pequeñas (NSCLC), las alteraciones en por lo menos 10 proto-oncogenes se han sugerido como potencialmente "druggable", con las frecuencias de mutación que varía de 1% a 25% para
MAP2K1
y
KRAS
, respectivamente, de acuerdo con la población estudiada. [13] el mejor algoritmo para la prueba, incluyendo secuencial frente evaluación múltiplex de tales alteraciones es todavía un tema de debate.

a pesar de secuenciación de Sanger ha sido utilizado tradicionalmente para la detección de mutaciones puntuales recurrentes en el cáncer, las nuevas tecnologías han permitido un análisis más exhaustivo de las perturbaciones genéticas. En este escenario, la secuenciación de próxima generación (NGS) plataformas, también conocida como la secuenciación masiva en paralelo a la oferta de una amplia gama de oportunidades para caracterizar el genoma del cáncer. [14-16] Por ejemplo, la disponibilidad de técnicas de hibridación de captura proporciona un alto -throughput y rentable estrategia para evaluar cientos de genes simultáneamente. [16-19] Como una breve revisión metodológica, se purifica el ADN genómico (gDNA) a partir de muestras de tumor y cizallado ya sea por sonicación o enzimas de restricción en millones de fragmentos pequeños (decenas o cientos nucleótidos de largo). Estos fragmentos se hibridan a una sonda conjunto personalizado que contiene cebos específicos para los genes de interés, y se amplifican para generar la biblioteca de secuenciación. Un código de barras único se liga a cada biblioteca-correspondiente a cada muestra, lo cual permite múltiples muestras que deben mezclarse juntos para la secuenciación. Varias tecnologías de captura de ADN comerciales están actualmente disponibles, y muchas instituciones han diseñado e implementado personalizado paneles dirigidos a determinar el genotipo de las muestras de cáncer. [10, 20, 21]

muestras de tumores clínicos a menudo se conservan tan embebido en parafina y fijado en formalina (FFPE) bloques de tejido en biorepositories, y esta es la fuente más fácilmente disponible para la obtención de gDNA tanto en entornos clínicos y de investigación. [22-24] Sin embargo, se conocen varios pasos en el procesamiento de FFPE de causar daños en el ADN, lo que afecta directamente el ADN calidad e idoneidad para la secuenciación. Por ejemplo, la fijación con formalina puede dar lugar a diversos tipos de enlaces cruzados entre dos aminoácidos, dos ácidos nucleicos, o entre un aminoácido y una base de ácido nucleico. [25-27] Estas modificaciones químicas pueden confundir pruebas moleculares a través de la inhibición de la manipulación enzimática de DNA. la fijación con formalina también puede causar la oxidación de nucleótidos y desaminación, siendo este último en relación con el desarrollo de las transiciones de nucleótidos de artefactos (principalmente C & gt; T en dinucleótidos CpG) entre las muestras almacenadas como FFPE [23, 28] Por último, las reticulaciones de metileno causadas por formalina pueden resultar. en la fragmentación del ADN, lo que limita la longitud de ADN para la secuenciación. Además de la fijación con formalina, la preparación del tejido, la inclusión en parafina, y el almacenamiento de archivos
per se
puede en último término todos desempeñar un papel en la calidad de las muestras. [29] Además, FFPE bloques se obtienen a menudo a partir de pequeñas biopsias y tejidos de baja cantidad puede constituir una limitación adicional para la secuenciación. el control de calidad con el fin de evaluar la calidad de ADNg extraído de muestras FFPE, basado en la PCR se han recomendado (QC) ensayos. [30-33] Otras variables que pueda afectar a los resultados finales de secuenciación incluyen la cantidad de ADN utilizado como entrada para la biblioteca preparación, la profundidad de secuenciación, y la región diana de interés (contenido de GC y la homología de secuencia).

en este documento, se evaluó el impacto individual y combinado de parámetros pre-secuenciación sobre la eficiencia secuenciación génica dirigida. Con este fin, se utilizó un conjunto de muestras totalmente anotada caracterizado por el conocimiento de una amplia gama de variables pre-analíticos, que se genotipo para un panel de genes personalizado utilizando una secuencia génica dirigida disponible comercialmente enfoque del objetivo Sistema de Enriquecimiento de Agilent Haloplex (Agilent Technologies ). Esta plataforma se diferencia de otras técnicas de hibridación de captura en que un grupo de enzimas de restricción se utiliza para digerir el ADN de la muestra (a diferencia de la sonicación), y las sondas están diseñadas con homología sólo a los extremos de fragmentos de restricción de ADN específicos. [34] posteriormente, cebadores universales se utilizan para amplificar las regiones capturados y generarán una alta frecuencia de lecturas similares, se asemeja a los resultados encontrados en las plataformas basadas en amplicón (S1 FIG). Por esta razón, algunos indicadores como la tasa de duplicación de secuenciación y cuantificación única lee no son aplicables a esta tecnología. También se verificó la variabilidad de profundidad de lectura dentro del genoma, reveló regiones problemáticas basadas en el contenido de GC, y se determinó el impacto de estos parámetros en la variante de la llamada. Estos datos podrían ser muy informativo para guiar a la comunidad clínica y la investigación en la selección adecuada de muestras clínicas para la secuenciación del gen diana, y en la interpretación adecuada de los resultados de la secuenciación como una función de la calidad de la muestra y la uniformidad de secuenciación.

Materiales Métodos y

las muestras clínicas

el conjunto de datos compuesta estudiado 113 muestras de tumor de pulmón resecado de los pacientes en el hospital del cáncer James /la Universidad Estatal de Ohio (OSU, Columbus, OH) entre 1988 y 2011. Todos las muestras se archivan como bloques tumorales FFPE, y se seleccionaron en base a la disponibilidad de tejido. Ciento diez muestras fueron NSCLC primario (60 adenocarcinomas, 31 carcinomas de células escamosas, 10 adenoescamosa, y 9 otros subtipos histológicos), mientras que 3 muestras fueron cánceres de cabeza y cuello (todos los carcinomas de células escamosas) metástasis a los pulmones (Tabla A en S1 Archivo). Cada muestra se le asigna un código único, no identificable, y la fecha de la cirugía fue revisado y anotado para estimar el tiempo de almacenamiento en bloque del tumor. La Junta de Revisión Institucional aprobado este proyecto, y renunció a la necesidad de dar su consentimiento.

Procesamiento de tejidos

Se seleccionaron muestras de tumores resecados con tejido representativa para las pruebas de NGS. Para aumentar el contenido de tumor, un patólogo (K. S.) marcó un H & amp; E manchadas de diapositivas para delimitar las regiones que contienen tumorales, y estas áreas se macrodissected por el manual de raspado de las áreas marcadas secciones FFPE no teñidas de serie. celularidad del tumor se determinó por inspección visual de la cantidad de núcleos tumorales en comparación con el fondo del estroma en las áreas marcadas para macrodissection, y la mayoría de las muestras (88%) se clasificaron como que contiene o bien celularidad alto o moderado de tumores (Tabla B en S1 de archivo y S2 Fig ). gDNA fue extraído de muestras FFPE utilizando el Maxwell
16 kit de purificación de ADN ® LEV FFPE Plus (Promega). De dos a diez portaobjetos que contenían secciones gruesas 10μm se rasparon en un microtubo y se incubaron durante la noche a 70 ° C con una solución de proteinasa K y el tampón de incubación. Posteriormente, cada muestra se trató con tampón de lisis, se transfirieron a cartuchos de carga y ejecuta en el instrumento automático. pruebas local mostró que este protocolo produjo cantidades similares de ADN en comparación con los sistemas manuales (datos no mostrados). ADNg cuantificación se realizó mediante la Quant-iT
™ de Alta Sensibilidad-ADN Kit de ensayo (Life Technologies
™).

calidad del ADN evaluación

Con el fin de determinar la calidad general de el gDNA, se aplicó un ensayo de control de calidad basado en la PCR, y se utiliza como una guía para recomendar la cantidad de entrada de ADN en la preparación de la biblioteca, como se recomienda por el fabricante. [35] en resumen, 10 ng de cada muestra de ADN se amplificó con 2 pares de cebadores independientes a fin de generar amplicones de tamaños incrementales: 105 pares de bases (pb), y 236 pb. Como control positivo no degradado, se utilizó gDNA extraídos de una línea celular de NSCLC (A549). Después de la PCR, los productos fueron evaluados para rendimiento y el nivel de fragmentación utilizando el TapeStation Agilent 2200 (Agilent Technologies). La relación del control de calidad se calculó dividiendo la cuantificación bandas para cada muestra de la banda respectiva en el control positivo, y a continuación, con un promedio de cada relación de banda. Una relación de control de calidad por encima de 0.20 indica la calidad favorable, mientras que relaciones inferiores a 0.20 sugiere calidad moderada o pobre. [35]

La hibridación de captura y secuenciación

Un panel personalizado fue diseñado usando el seguro basado en Internet el software de diseño (Agilent Technologies) para cubrir las regiones codificantes de los 81 genes seleccionados de interés para el NSCLC (Tabla C en S1 archivo). El panel de cubierta total de 920,980 pares de bases, e incluyó 44,234 amplicones. Las bibliotecas se construyeron y se indexan utilizando el Sistema de Agilent Haloplex Target Enrichment (Agilent Technologies). Las bibliotecas se agruparon indexadas en cantidades equimolares y de extremo emparejado secuenciados (2 x 100 pares de bases) a 1.000 x promedio de cobertura en una Illumina HiSeq 2500.

Procesamiento de datos

lecturas de secuenciación se suman a el genoma humano (asamblea hg19) y los archivos bam se generaron utilizando el software SureCall (Agilent Technologies). llamada variante se realizó utilizando el Kit de Herramientas de Análisis Genómico (GATK) Unificado Genotyper. anotación variante se llevó a cabo en la plataforma de GenomAnalytics GenomOncology (GenomOncology, Cleveland, OH) y el Visor de Genómica Integrativa (IGV, Broad Institute) se utilizó para confirmar verdaderos positivos. rendimiento de secuenciación se evaluó midiendo el número de lecturas, asignada lee, la cobertura de base de destino, y leyó calidad utilizando Picard (Broad Institute), SAMtools y BEDTools. [36, 37] La ​​profundidad de la cobertura en regiones genómicas se verificó con la profundidad de herramienta de cobertura (GATK), [38] y en la posición genómica específicos (puntos de acceso) usando IGV.

métodos estadísticos

Tres variables de pre-analíticos fueron utilizados para predecir el tiempo de almacenamiento secuenciación de profundidad final de FFPE , relación de PCR /QC, y la entrada de ADN. tiempo de almacenamiento FFPE en el bloque de parafina se calculó como el intervalo (en años) a partir de la fecha de la cirugía hasta la fecha de procesamiento de tumor (extracción de ADN) para la secuenciación. Para probar el efecto de estas variables sobre la eficacia global de secuenciación, se utilizaron varios parámetros como la profundidad de la cobertura, la tasa de alineación, tasa fuera del objetivo, la calidad de base, entre otros. La correlación entre las variables pairwise pre-analíticos (tiempo de almacenamiento, PCR /QC relación y el ADN de entrada) y los parámetros de rendimiento de secuenciación se evaluó por el método de Pearson. Posteriormente, se ha creado un conjunto de datos de entrenamiento que comprende alteraciones genómicas situadas en los genes con la variabilidad menor cobertura. Diez genes fueron filtradas en:
ALK
,
BCL11A
,
REL
,
VGLL4
,
RAF1
,
FBLN2
,
RET
,
FGFR2
,
MAP2K1
,
U2AF2
. a continuación, se excluyeron las regiones genómicas con una cobertura pobre en general (menos de 100 promedio lee) o con una variabilidad alta profundidad (con una desviación estándar en los cuartiles superiores de varianza) dentro de estos genes. Estos criterios condujeron a un conjunto de datos de entrenamiento de 33 regiones genómicas, que se utilizó para comparar las variables pre-secuenciación. regresión lineal multivariable se realizó para la correlación entre la mediana y lee las tres variables pre-analíticas y para la multicolinealidad potencial entre los tres factores. Este análisis indica si cada uno de covarianza incluida en el modelo todavía se correlacionó significativamente con el rendimiento de secuenciación después de ajustar por otras variables. Una ecuación basada en el procedimiento de selección de modelo por etapas de los tres factores individuales y términos de interacción de 2 vías se construyó para generar la puntuación combinada o el rendimiento de secuenciación predictivo. El modelo final seleccionado los tres factores antes de la secuenciación individuales. La fórmula se presenta aquí:...
Combinado puntuación = 202

95-7

86 * Tiempo de almacenamiento + 249

95 * PCR relación + 0
.
08 * ADN de entrada
. Con el fin de evaluar la variabilidad de cobertura dentro del genoma (en el análisis de contenido de GC), la cobertura global fue del cuantil normalizado y luego estratificados de acuerdo a la relación de contenido de GC. Para comparar el efecto del contenido de GC y la calidad del tejido en conjunto, las muestras fueron estratificados de acuerdo a la calidad de la línea de base (definido por el pre-secuenciación combinaron puntuación cuartiles), y la profundidad total de la cobertura era-cuantil normalizado dentro de cada grupo. P-valor de ≤ 0,05 fue considerado estadísticamente significativo. Los análisis estadísticos se realizaron utilizando la versión 3.0.1 R, SAS 9.3, e IBM SPSS versión 22.0.

Resultados

Muestra y secuenciación parámetros

Se ha observado una gran variación en la muestra y el parámetro de control de calidad pre-secuenciación a través de las muestras seleccionadas (Tabla 1), incluyendo una gama de tiempo de almacenamiento FFPE de 0,32 años a 24.22 años. El ensayo de control de calidad basado en la PCR indicó una relación media de 0,19 (rango de 0,03 a 0,58), lo que sugiere que el gDNA tenía una calidad favorable en aproximadamente la mitad de las muestras, mientras que el otro medio tenía menor calidad. La cantidad de ADNg utilizan como materia prima en la preparación de la biblioteca varió de 77 ng a 2337 ng, con una mediana de 899 ng.

La mediana del número final emparejado lee y lee asignada por muestra fueron 5,0 millones (rango de 01.04 a 07.07) y 4,9 millones (rango 1,1-7,6), respectivamente, y el 98,1% (rango 78,4-98,9) lee del asignan a la región de destino. La cobertura de objetivo real media fue de 881X (rango 204-1,373), con los porcentajes medianos de destino lee cubiertos al menos 20 veces (20x), 50 veces (50x), y 100 veces (100x) que es 95,4% (rango 78,9-98,8), 90,8% (intervalo 66,7 a 97,7) y 84,6% (intervalo 52,1 a 95,1), respectivamente. El tamaño medio de inserción era 89,4 pares de bases (intervalo 73,5 a 120,7), y 98,5% de las llamadas de base tenía una puntuación de calidad Phred de al menos 30. Estos parámetros se resumen en la Tabla 1 y S3 Fig.

Correlación entre las variables pre-analíticos y de eficiencia secuenciación

Las variables pre-analíticos (tiempo de almacenamiento FFPE, relación de PCR /QC, y la entrada de ADN) se correlacionaron significativamente con la mayoría de los parámetros de eficiencia secuenciación (figura 1 y en la Tabla D en S1 archivo ). tiempo de almacenamiento FFPE se correlacionó negativamente con el número total de lecturas (
r = -0,356
), significa cobertura objetivo (
r = -0,405
), la tasa de alineación (
r
= -0,354), insertar tamaño (
r = -0,764
, p & lt; 0,01 calidad en todos los casos), y la media de base (
r = -0,188
, p = 0,046), y positivamente correlacionada con la tasa fuera del objetivo (
r = 0,285
, p & lt; 0,01), compatible con mejores resultados si se seleccionan las muestras más recientes. La relación del control de calidad se correlacionó insertar tamaño (
r = 0,601
, p & lt; 0,01), y de manera insignificante correlacionada a la meta de cobertura (
r = 0,183
, p = 0,058), la tasa de alineación (
r = 0,169
, p = 0,08), y la base de la calidad (
r = 0,162
, p = 0,094). entrada de ADN se correlaciona con el número total de lecturas (
r = 0,548
), significa que la meta de cobertura (
r = 0,549
), la tasa de alineación (
r = 0,449
), significa la calidad de base (r = 0,477), y la tasa fuera del objetivo (
r = -0,336
, p & lt; 0,01 en todos los casos), pero no para insertar tamaño (
r = 0,081
, p = 0,395). Estos datos sugieren que una mejor relación de QC y superior de entrada de ADN en la preparación de la biblioteca pueden predecir una mayor eficiencia de secuenciación.

tres variables pre-analíticos (tiempo de almacenamiento FFPE, relación de PCR /QC, y la entrada de ADN en la preparación de la biblioteca) se correlacionaron significativamente con la mayoría de los parámetros de post-secuenciación (a). Las variables pre-análisis se clasificaron como debajo o por encima valores de la mediana para ilustrar el impacto del tamaño de la pieza de inserción (B) y en la calidad de lectura /puntuación Phred (C). Abreviaturas: FFPE, bloques de parafina de tejido fijados con formol; PCR /QC, control de calidad basado en la PCR.

El efecto combinado de las variables pre-analíticos

El efecto combinado de las variables pre-analíticos se evaluó en un conjunto de datos de entrenamiento de 33 genómica regiones, con una profundidad media de cobertura de 267 (rango de 43 a 464). tiempo de almacenamiento FFPE se correlacionó negativamente a la profundidad de la cobertura (
r = -0,558
, p & lt; 0,01; Figura 2A), mientras que el índice de control de calidad y la entrada de ADN se correlacionaron positivamente (
r = 0,37
y 0,47, respectivamente; p & lt; 0,01 en ambos; figura 2B y 2C). El uso de un análisis multivariado, demostramos que cada una de estas variables todavía se correlacionó significativamente con el rendimiento de secuenciación (Tabla E en S1 Archivo). Con el fin de generar una puntuación única que predice la calidad de la muestra en esta cohorte, fusionamos todas las tres variables en una puntuación combinada, tal como se describe en los métodos. Como era de esperar, la puntuación combinada se altamente correlacionada con la profundidad de la cobertura en la formación de datos (
r = 0,751
; p & lt; 0,01; Figura 2D). Para confirmar su exactitud, lo comparamos con la meta de cobertura media en todas las regiones genómicas estudiadas (independientemente de sesgo causado por alteraciones del número de copias) y para la profundidad de lectura en las bases de la acogida de la línea germinal frecuentes o variaciones somáticas de un solo nucleótido (SNV), que se encuentra en los genes no se utiliza en la formación de datos. Hubo una fuerte correlación positiva entre la puntuación combinada y la profundidad de la cobertura en todos estos casos. Además, hemos demostrado una fuerte correlación entre la puntuación combinada y la 20x, 50x, y la cobertura de base objetivo 100x (
r
= 0,779, 0,790 y 0,792, respectivamente; p & lt; 0,01), así como a otros parámetros de eficiencia de secuenciación (Tabla 2 y figura 3A).

tiempo de almacenamiento FFPE (a), la relación de PCR /QC (B), y de entrada de ADN (C) se correlacionaron con la profundidad de secuenciación de la cobertura. Una puntuación combinada (D) se construyó en base a estos tres parámetros, y fue altamente correlacionado con la profundidad de secuenciación. Abreviaturas: FFPE, bloques de parafina de tejido fijados con formol; PCR /QC, control de calidad basado en la PCR.

La puntuación combinada se correlaciona fuertemente con los parámetros post-secuenciación (A). Correlación con la cobertura de 50x se utiliza para definir los umbrales de pre-analíticos que podrían predecir la eficiencia de la secuenciación, y se ilustran mediante el suavizado curvas (B).

A continuación trató de definir una preanalítica corte de valor que podría predecir resultados de la secuenciación adecuados. Para este fin, se trazan las variables pre-secuenciación (incluyendo la puntuación combinada) en contra de la cobertura de 50x en nuestro conjunto de datos, y definimos el 90% de cobertura 50x como parámetro para obtener resultados favorables. De acuerdo con este análisis, un tiempo de almacenamiento de FFPE de 8,6 años, una relación de PCR /QC de 0,22, una entrada de ADN de 960 ng, o una puntuación combinada de 266 fueron los umbrales asociados con la eficiencia de la secuenciación (Fig 3B).

baja profundidad de la cobertura era característico de las regiones con bajo contenido de GC

Además de la calidad de la muestra, se evaluó el efecto de la composición de la base de la profundidad de secuenciación. Para evaluar la profundidad de la uniformidad de cobertura, se evaluó la cobertura media normalizada a través de las regiones genómicas abarcado por las sondas diseñadas. Hemos demostrado una gran variabilidad, y observamos que la mala cobertura se asoció significativamente con las regiones que presentan un menor contenido de GC (figura 4A). Se observó la mejor cobertura en zonas con relaciones de contenido de GC 0,5-0,7, con un marcado deterioro por debajo de 0,4 (p & lt; 0,01). Posteriormente, las muestras se estratificó según la calidad de la línea de base (medido por la puntuación combinada de pre-secuencia), y volverse a evaluar el efecto contenido de GC. En particular, las regiones con bajo contenido de GC (por debajo de 0,4) tenían una peor cobertura en todos los estratos, con una cobertura más baja pronunciada en las muestras con baja calidad de pre-secuencia (Figura 4B).

profundidad normalizada de cobertura presenta una gran variabilidad dentro de el genoma, con una peor cobertura observada en las regiones con menor contenido de GC (a). El efecto era aditivo contenido de GC para probar la calidad de predecir profundidad de la cobertura, tal como se observa después de la estratificación de calidad de la muestra usando la puntuación combinada (B). Abreviaturas:. Desv, desviación estándar. Obs: ** indica significancia en p & lt; 0,01

Impacto de la variabilidad de la cobertura de puntos de acceso de genes

A medida que las métricas de secuenciación son en última instancia, un sustituto de la variante llamada óptimo, se interrogaron si la calidad de la muestra. y el contenido de GC tendría un impacto en la meta de cobertura en las posiciones de punto de acceso en
KRAS
y
EGFR
. Como se muestra en la Tabla 3, estos genes ejemplifican los extremos opuestos del espectro de cobertura observado en el presente documento. Mientras que las posiciones de punto de acceso en
EGFR
presentó un contenido ideal GC (0,51-0,55) y una cobertura óptima,
KRAS
mostró menor contenido de GC (0,33-0,36) y una cobertura dramáticamente peor. La mediana del número de lecturas en el
KRAS codón 12
era sólo el 51 (rango 3-183), y la cobertura de 20x y 50x objetivo fueron de 87,9% y 51,4%, respectivamente. Por otra parte, todos los
EGFR
posiciones de punto de acceso presentó una cobertura satisfactoria (Tabla 3). Como NGS variantes llamando tuberías menudo incluirán bases de filtros en una cobertura mínima (por ejemplo. 20x o 50x), recurrente
KRAS
mutaciones podría perderse fácilmente debido a la baja cobertura. De hecho, 12 de los 22
se detectaron casos
KRAS mutantes entre las muestras con 50 lee o menos, y 3 casos se encontraron con menos de 20 lecturas (cuadro F S1 archivo), todos los cuales fueron confirmados por inspección visual de lectura. cobertura pobre en estos sitios también podría perjudicar la sensibilidad para detectar mutaciones de baja frecuencia alelo. El uso de un umbral mínimo de puntuación combinada de 266, el número medio de lee en el
KRAS
codón 12 fue 72,5 (rango 18-183), y la cobertura de 20x y 50x fue del 98,2% y 80,4%. De acuerdo con informes recientes, se observó una correlación negativa entre la proporción de PCR /CC y el dinucleótido CpG a TPG transiciones (
r = -0,186
; p = 0,049). correlaciones similares no fueron vistos con otras variables pre-analíticos u otros cambios de dinucleótidos.

Discusión

En el presente estudio, hemos confirmado que las muestras FFPE clínicos son una fuente fiable de ADN para secuenciación génica dirigida en el cáncer, siempre y controles de calidad adecuado de la muestra se ejercen. Hemos demostrado que tres variables-FFPE pre-analíticos en tiempo de almacenamiento, la relación de PCR /QC, y la entrada de ADN en la biblioteca preparación se correlacionó significativamente con la mayoría de los parámetros de eficiencia secuenciación. El examen combinado de estas características puede ser particularmente útil para definir la adecuación de la muestra para la secuenciación, como se ha demostrado por un modelo combinado derivado de ellos, que fue altamente correlacionado con la eficiencia de secuenciación. También mostramos una variabilidad significativa en la profundidad de la cobertura dentro del genoma, que depende de la relación de contenido de GC. regiones genómicas con menor contenido de GC presentan peores profundidad de la cobertura, y este efecto fue aditivo para probar la calidad.

Se ha demostrado que los datos de NGS muestras FFPE tienen pequeños tamaños de inserción de la biblioteca y una mayor variabilidad cobertura. [23] en esto, fuimos más allá de demostrar que el tiempo de almacenamiento FFPE, relación de PCR /QC, y la entrada de ADN pueden predecir la calidad de toda la secuencia dentro de este grupo. Por ejemplo, el tiempo de almacenamiento FFPE (o la edad del tumor) se correlacionó negativamente a varios parámetros post-secuenciación, incluyendo la profundidad de la cobertura, tamaño de inserto, y la calidad de base. Estos resultados están en línea con los hallazgos de Hedegaard et al [12], que también mostraron mejores resultados cuando se utilizaron muestras FFPE más recientemente obtenidos. En este sentido, varios factores pueden haber afectado negativamente a los resultados en muestras mayores, incluyendo métodos no estandarizados utilizados en el pasado para la fijación del tumor, procesamiento, inclusión, así como el tiempo de almacenamiento
per se
. Por otro lado, Schweiger et al [39] no encontraron una influencia de la edad tumor en profundidad secuenciación, sin embargo, que estudio estaba limitado por un muy pequeño tamaño de la muestra (sólo 7 muestras FFPE). Aunque los tumores de mayor edad pueden ser una excepción en el ámbito clínico, los patólogos pueden necesitar para utilizar antiguas muestras FFPE en entornos de investigación específicos. Algunos escenarios posibles incluyen análisis retrospectivo de muestras únicas adquiridas en los ensayos clínicos, el estudio de las enfermedades raras, y cuando las muestras de bancos de tejidos son la única fuente disponible. Si las muestras mayores son para ser incluidos, puede ser esencial para seleccionar para aquellos con una mejor calidad del ADN (utilizando estimaciones de la fragmentación del ADN). Cuando fuentes alternativas no son una opción, el aumento de la entrada de ADN o la profundidad de secuenciación puede ayudar a superar las limitaciones intrínsecas relacionados con el almacenamiento de la muestra más larga y métodos de manipulación de más edad.

se ha informado de diferentes métodos para evaluar la calidad de gDNA deriva de muestras clínicas FFPE. Estos incluyen la verificación de la relación A260 /280 utilizando espectrofotómetro Nanodrop (una proporción de 1,8 o mayor sugiere pureza razonable), el cálculo de la cantidad de ADN de doble cadena estimada dividiendo Qubit
® estimación de ADN por Nanodrop (proporciones de 0.4 o más alto son ideales) , corriendo una alícuota de gDNA en un gel de agarosa o TapeStation (fragmentos de 200 pb o menos indican mala calidad), o el uso de un enfoque basado en PCR. [30-33] en este estudio, se utilizó un protocolo estándar recomendado por el fabricante , basado en la amplificación por PCR de regiones genómicas de diferentes tamaños. [35] ADN de baja calidad generará menos abundantes amplicones, simulando los resultados esperados durante el enriquecimiento de destino. Este tipo de análisis se correlacionó de forma independiente a la profundidad de la cobertura, con relaciones más altas que dan la mejor cobertura. Este ensayo basado en la PCR es relativamente sencillo, de bajo costo, utiliza poca cantidad de ADN como entrada, y por lo tanto son fácilmente aplicables en la mayoría de los laboratorios.

entrada de ADN en la preparación de la biblioteca es un importante predictor del éxito de secuenciación. [21 ] Para la plataforma utilizada en el estudio actual, el fabricante recomienda un mínimo de 225 ng de ADNg (estimada por métodos de fluorescencia como PicoGreen
® o Qubit
®), que puede ser incrementado en el caso del ADN de baja calidad . Nuestros datos muestran que la entrada de ADN se correlaciona con la profundidad de secuenciación, la velocidad de la alineación, la calidad de base, y la tasa desviado. Más importante aún, la entrada de ADN era intercambiable con otros parámetros pre-secuenciación (edad tumor, PCR /CC) para predecir la profundidad de secuenciación. Esto significa que el aumento de la entrada de ADN a menudo puede compensar para el ADN de baja calidad, mientras que el ADN de alta calidad se podría utilizar en la entrada sustancialmente menor, como se muestra por el análisis de puntuación combinada presentada en este documento.

Hemos generado una puntuación única que se tienen en cuenta los datos de tres variables pre-analíticos que demostraron impacto independiente de la profundidad de secuenciación. Por otra parte, se especuló sobre los posibles valores de corte para cada una de estas variables que podrían ayudar a definir la adecuación del tejido para la secuenciación. A pesar de que puede ser atractivo para tener en cuenta estos valores en la rutina de los laboratorios de secuenciación, algunas limitaciones deben ser discutidos. Por ejemplo, todavía no se sabe si esta evaluación se podría aplicar a otros ámbitos, sobre todo si se emplean distintos ensayos de control de calidad o NGS.

El conocimiento de la salud

? disturbios por alimentos y Civil Unrest

Are Estás listo para disturbios civiles y los próximos distu

Quanta Revisión

Este video va a ir sobre la Revisión Quanta. Es una revisión

Consejos para prevenir los tumores carcinoides del Lung

La causa exacta de los tumores carcinoides pulmonares no se

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]