Extracto
El cáncer colorrectal (CCR) es la segunda causa de muerte relacionada con el cáncer en los países desarrollados. La detección temprana del CRC conduce a la disminución de la mortalidad por CCR. Una prueba de cribado de CCR basada en la sangre es muy deseable debido a la invasión limitada y alta tasa de aceptación entre los pacientes en comparación con la prueba oculta en heces se utilizan actualmente en la sangre y la colonoscopia. Aquí se describe el descubrimiento y validación de un panel de 29 genes en las células mononucleares de sangre periférica (PBMC) para la detección de CRC y pólipos adenomatosos (AP). Las muestras de sangre se recogieron de forma prospectiva a partir de un estudio clínico multicéntrico, de casos y controles. En primer lugar, perfilado 93 muestras con 667 candidatos y 3 de referencia genes por un alto rendimiento en tiempo real PCR (sistema OpenArray). Después del análisis, 160 genes fueron retenidos y se ensayaron de nuevo en 51 muestras adicionales. los genes expresados bajos e inestables se descartaron que resulta en un último conjunto de datos de 144 muestras perfilado con 140 genes. Para definir qué genes, solos o en combinaciones tuvo el mayor potencial para discriminar AP y /o CRC de los controles, los datos se analizaron mediante una combinación de métodos univariados y multivariados. Una lista de 29 genes potencialmente discriminantes se compila y se evaluó la exactitud de predicción por regresión logística penalizado y de arranque. Este método discriminado AP & gt; 1 cm y CRC de los controles con una sensibilidad de 59% y 75%, respectivamente, con 91% de especificidad. El comportamiento del panel 29-gen se validó con una plataforma de PCR 480 en tiempo real LightCycler, comúnmente adoptada por los laboratorios clínicos. En este trabajo hemos identificado un panel de 29-gen expresado en CMSP que se puede utilizar para el desarrollo de una nueva prueba mínimamente invasiva para la detección precisa del punto de acceso y el uso de un CRC en tiempo real plataforma estándar de PCR
Visto:. Ciarloni L, S Hosseinian, Monnier-Benoit S, Imaizumi N, Dorta G, Ruegg C, et al. (2015) Descubrimiento de un panel de 29 genes en células mononucleares de sangre periférica para la detección del cáncer colorrectal y adenomas de alto rendimiento El uso de PCR en tiempo real. PLoS ONE 10 (4): e0123904. doi: 10.1371 /journal.pone.0123904
Editor Académico: Antonio Moschetta, IRCCS Istituto Oncológico Giovanni Paolo II, ITALIA
Recibido: 8 de Diciembre, 2014; Aceptado: 27 Febrero 2015; Publicado: 13 Abril 2015
Derechos de Autor © 2015 Ciarloni et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Disponibilidad de datos: Todos los datos relevantes están dentro del apoyo de sus archivos de información en papel y
Financiación:. Este estudio fue apoyado por Diagnoplex SA. El donante prestado apoyo en forma de salarios de los autores LC, Ni, SMB, SH, pero no tuvo ningún papel adicional en la recogida de datos y análisis, decisión a publicar, o la preparación del manuscrito. Las funciones específicas de estos autores se articulan en la sección de las contribuciones de los autores
Conflicto de intereses:. LC SH SMB NI eran empleados de Diagnoplex SA en el momento del estudio. Además, son dueños de las opciones sobre acciones en Diagnoplex SA. CR es un co-fundador, miembro del consejo asesor y es propietaria de acciones y participaciones de Diagnoplex SA. GD ha servido como orador, consultor y miembro del consejo asesor de Diagnoplex SA, y ha recibido fondos de investigación de Diagnoplex SA. Esto no altera nuestra adhesión a las políticas de PLoS ONE en los datos y materiales de uso compartido.
Introducción
El cáncer colorrectal (CCR) es el tercer cáncer más común y la segunda causa de muerte por cáncer en las hombres y mujeres en Europa [1]. Es importante destacar que, el CRC es curable en muchos casos, cuando se diagnostica en etapas tempranas. Por otra parte, la detección y eliminación de los pólipos adenomatosos (AP) previene la formación de CRC y disminuye la mortalidad por CRC. Varios países ya han adoptado modalidades de cribado de CCR y guías de práctica clínica recomiendan que las personas de riesgo promedio de comenzar las pruebas a los 50 años de edad [2, 3] |
La colonoscopia es el "patrón oro" para el diagnóstico de AP y CRC, sin embargo, no es el método preferido para el cribado masivo debido a su costo, capacidad de invasión, bajo cumplimiento y la accesibilidad limitada. métodos no invasivos actualmente recomendadas para el cribado masivo incluyen inmunoquímica fecal y guayacol en la prueba de sangre oculta (iFOBT, gFOBT). Sin embargo, el cumplimiento de las pruebas fecales todavía es subóptima en los países con un programa de cribado FOBT [4, 5, 6]. Por lo tanto, todavía hay una gran necesidad no satisfecha llamando a un punto de acceso no invasivos o mínimamente invasivos, que cumple, rentable y precisa prueba de detección para detectar y CRC en las primeras etapas. Una prueba de detección basados en la sangre es muy atractivo debido a su mínima invasividad y de alta aceptación entre los pacientes. En particular, y otros han informado de firmas derivadas de células mononucleares de sangre periférica perfiles (PBMC) de expresión de genes asociados con digestivo [7, 8, 9, 10], de mama [11], renal [12, 13], pulmonar [14] y cánceres de la vejiga [15]. Estas pruebas son conceptualmente diferente de pruebas de biomarcadores tumor clásicos, ya que se basan en la detección de la respuesta del huésped a las señales derivadas de tumores [16, 17] en lugar de en los marcadores procedentes de la propia tumor.
Durante la búsqueda las diferencias en la expresión génica y la identificación de transcritos de ARN para ser utilizados posteriormente como biomarcadores potenciales, los métodos utilizados comúnmente incluyen plataformas de hibridación de ADN a base de microarrays o técnicas de secuenciación basados en ARN [18, 19]. Aunque potente, estos métodos son complejos, largo y costoso, y generan gran volumen de datos que requieren herramientas bioinformáticas y competencias especializadas para su análisis. Por otra parte, los genes de interés identificados requieren una validación adicional por qPCR métodos más precisos y sensibles, en tiempo real, antes de que puedan ser traducidos a las pruebas de utilidad clínica [20]. En alternativa a estas técnicas, en tiempo real plataformas qPCR de alto rendimiento demostró que realizar bien cuando la selección de genes candidatos fue impulsado por la evidencia científica sólida, a pesar del hecho de que permiten el análisis de sólo una fracción de la transcriptoma [21]. Es importante destacar que, los descubrimientos de biomarcadores basados en plataformas qPCR tienen la gran ventaja de que no se requiere una etapa de validación más en vista de su uso clínico. Además, son bastante más económicos que los enfoques de todo el genoma, lo que permite el análisis de un conjunto de muestras más grandes y aumentando así el poder estadístico del estudio.
Aquí mostramos el descubrimiento y caracterización de un panel de 29 genes en PBMC para la detección de adenomas y carcinomas colorrectales utilizando un nanolitros de alto rendimiento plataforma de qPCR (OpenArray) [22]. Para este fin se utilizó muestras recogidas de forma prospectiva a partir de un estudio de casos y controles multicéntrico en el que los pacientes fueron remitidos para colonoscopia o programados para cirugía para la extirpación de CRC. Se demostró además que el panel de genes podría ser fácilmente transferido y aplicado en un ensayo de laboratorio con niños médica, lo cual es un paso clave en el desarrollo de una nueva y simple prueba de detección del cáncer colorrectal basados en la sangre rentable.
material y Métodos
Los pacientes
Un estudio de casos y controles (DPNG-COL-0310), incluyendo tres centros surcoreanos y seis suizos que incluyeron 1665 sujetos mayores de 50 años que fueron remitidos para colonoscopia por médico general o fueron programados para la cirugía, se llevó a cabo entre junio de 2010 y abril de 2013. el estudio fue concebido específicamente y diseñado para el desarrollo y validación de una nueva prueba para la detección de CCR. La fase de descubrimiento de biomarcadores tuvo lugar durante la primera mitad del reclutamiento de pacientes. Para este propósito, un subgrupo de 144 sujetos, asignado para controlar, (Tabla 1), se seleccionan grupos de CRC y AP al azar, y se utilizan para el perfil de expresión génica de alto rendimiento qPCR.
Los sujetos no tenían historia familiar de primer grado de la familia de CRC o un conocido predisposición CRC, historia previa de pólipos o cáncer, incluyendo CRC, no hepatobiliar, genitourinario, trastornos autoinmunes e inflamatorias, incluyendo enfermedades inflamatorias del intestino, enfermedades infecciosas y fiebre dentro de las 4 semanas antes de la colonoscopia. Las enfermedades crónicas comunes en la edad de la población, como la diabetes, la hipertensión, la hipercolesterolemia, insuficiencia cardíaca, no se consideraron como criterios de exclusión. Un sujeto de control se define como una persona sin ninguna historia pasada y presente de las lesiones colorrectales o enfermedades (por ejemplo, los adenomas pequeños pólipos hiperplásicos, cáncer). El grupo AP incluye sujetos diagnosticados con un adenoma de más de 1 cm, en base a la medición endoscópica. El grupo CRC incluido pacientes con carcinoma en los cuatro estadios TNM. El diagnóstico definitivo se basa en la evaluación histopatológica y la colonoscopia.
La aprobación ética
El protocolo de estudio (DPNG-COL-0310) fue aprobado por los comités de revisión ética de planchar y competentes para la investigación en seres humanos de Cantón de Berna, Suiza (Kantonale Etikkommission Berna, nº 139/10 KEK), cantón de St. Gallen, Suiza (Ethikkommission del Cantón de St. Gallen, nº EKSG 10/091 /1B), Cantón de Vaud, Suiza (Comisión Cantonal de éthique de la Recherche sur l'être humana, Nº 77/10 VD), Cantón de Basilea, Suiza (Basilea Ethikkommission beider, Nº EKBB 242/10), del hospital Severance, Yonsei University College of Medicine, Corea del Sur (No. 4-2010-0128) y por la Junta de Revisión Institucional de Bioética del hospital de la Universidad Nacional de Seúl, Corea del Sur (IRB Nº H-1004-020-315). escrito el consentimiento informado se obtuvo de todos los participantes del estudio que se adhieren a las directrices éticas locales.
recolección y procesamiento de la sangre
La sangre periférica de todos los sujetos fue dibujada ya sea hasta 30 días antes o hasta 12 semanas después de la colonoscopia y antes de cualquier pólipo o cáncer de resección o la quimioterapia preoperatoria. Las muestras de sangre se recogieron en tubos ml BD Vacutainer CPT 4x4 (Becton Dickinson, Franklin Lakes, NJ). tubos CPT rellenas se mantuvieron a temperatura ambiente y la separación de PBMC a cabo dentro de las 6 horas de acuerdo con las instrucciones del fabricante. pellets de PBMC se resuspendieron en ARN
después
Solution (Life Technologies, Carlsbad, CA) y se almacenaron a -80 ° C.
preparación de ARN
Purificación automatizada de ARN total fue realizado en QIAcube por RNeasy Mini kit (Qiagen, Venlo, Países Bajos) y se incluye un tratamiento con DNasa. La concentración de ARN se midió por Nanodrop espectrofotómetro (Thermo Scientific, Waltham, MA) y la integridad del ARN se analizó por Agilent 2100 Bioanalyzer (Agilent Technologies, Santa Clara, CA). Las muestras con un RIN & lt; 7 fueron considerados de mala calidad y se desechó. En promedio ARN mostró una RIN de 9 ± 0,5. ARN total aislado se dividió en alícuotas y se almacenó a -80 ° C. A fin de satisfacer la alta concentración de ARN requerida por el protocolo de RT, las muestras de ARN se precipitaron sistemáticamente siguiendo un método de acetato de sodio /3M 100% de etanol estándar.
diseño Screening y la generación de conjunto de datos
Para para encontrar biomarcadores sanguíneos relevantes para CRC, se realizó el cribado de la expresión génica en 144 muestras derivadas de pacientes con AP o CRC y los sujetos de control. La proyección fue concebido en 2 fases (Figura 1). En primer lugar, nos perfilamos 93 muestras con un gran panel de genes. El panel incluyó a 667 candidatos, de los cuales 42 biomarcadores identificados previamente por nuestro laboratorio [8] y 625 nuevo candidato seleccionado por la literatura (Tabla S1). También se añadieron tres genes de referencia para la normalización de datos qPCR. La búsqueda bibliográfica se centró en los genes, las vías moleculares y procesos biológicos que se consideran relevantes en la respuesta del tumor-huésped tal como la inflamación y la respuesta inmune, la invasión tumoral y la metástasis, la hematopoyesis, las vías de transducción de señales (en particular ruta de NF-kB), quimiocinas y citoquinas (en particular IL-1, IL-2), proteínas de matriz extracelular, moléculas de adhesión y los marcadores de la superficie celular. Para cada gen candidato, un ensayo TaqMan fue seleccionado de un repositorio comercial (tecnologías de la vida, Carlsbad, CA) (S1 Tabla) y se distribuye en tres placas abiertas de matriz 224-ensayo, cada medición de 12 muestras en paralelo. Por lo tanto, al perfil completo de 12 muestras, tres placas 224-ensayo, termocicladas en paralelo, se utilizaron. Para comprobar si hay variabilidad entre la placa y la reproducibilidad, la RPLP0 gen de referencia se ensayó para cada muestra en las 3 placas. El análisis RPLP0 desviación estándar (DE) de las 3 réplicas de la muestra mostró una mediana de 0,21 SD Ct, con un rango intercuartil de 0,14-0,34, lo que indica que la medición de la muestra fue altamente precisa y reproducible a través de la serie de 3 placas. En esta fase nos hemos centrado en la captura de la más amplia variabilidad biológica en lugar de minimizar la técnica, por lo que no se realizaron réplicas de muestreo sistemático, para permitir la elaboración de perfiles de un número máximo de muestras.
En una primera fase de selección realizadas en el sistema OpenArray, 670 genes fueron perfilados en 93 muestras. De estos, se seleccionaron 163 genes y se ensayaron adicionalmente en la fase 2 en 51 muestras adicionales. El último conjunto de datos incluye 144 muestras perfiladas con 163 genes. Un panel de 29 genes fue compilado sobre la base de más alto poder para discriminar AP /CRC de los controles mediante análisis univariante y multivariante. Por último, el panel de 29 genes se validó con una plataforma LightCycler480, que se utiliza comúnmente en los laboratorios clínicos.
Fuera de 670 genes analizados, 133 mostraron ninguna expresión o una mala amplificación por PCR. Los restantes 534 genes candidatos y 3 genes de referencia fueron en general bien expresan con una mediana de Ct 22.94 (rango intercuartil: 21,28-25,24) y una mediana de 0,7 SD (rango intercuartil: 0,59 a 1,04) (Tabla S2). perfiles de genes pasan por una etapa de filtrado de luz en el que tenían que satisfacer al menos uno de los siguientes criterios para al menos uno de los análisis de discriminación (
i
.
e
. CRC o control frente control frente AP): un valor de p inferior a 0,1 o un factor de cambio superior a 1,5 (escala lineal). Además, los biomarcadores identificados previamente en nuestro laboratorio [8] fueron retenidos en esta fase sin tener en cuenta su p-valor o doble cambio con el fin de ser evaluados en un conjunto mayor de muestras y el uso de un enfoque estadístico multivariado. En total, se seleccionaron 160 genes, junto con los tres genes de referencia, para la segunda fase de la proyección. Esta vez los 163 genes, medida por 168 ensayos (5 genes con expresión muy baja tuvieron un segundo ensayo para validar la medida obtenida), se asignaron en una sola placa (Tabla S3). Adicionales 51 muestras fueron perfilados por duplicado con este panel gen reducida para aumentar el tamaño de la muestra y la potencia estadística en los análisis posteriores. Además, 40 muestras ya se perfilan en la fase 1, se volvieron a analizar para asegurar la reproducibilidad de las mediciones a través de la fase 1 y fase 2 y la diferente formato de placa (224-
vs formato 168-ensayo
.). Los niveles de expresión obtenidos en las dos fases de estas 40 muestras fueron altamente correlacionados (R
2 = 0,993) (S1 figura), nos llevó a combinar los 93 y 51 muestras, perfiladas para los 163 genes, en un único conjunto de datos final ( Figura 1). Para compilar el conjunto de datos, se utilizaron los valores medios de las 40 muestras analizadas en los duplicados.
nanolitros alto rendimiento qPCR
Novecientos ng de ARN total fue transcrita inversa en un volumen de 20 l usando el alto -Capacidad cDNA Reverse Transcription kit (Life Technologies, Carlsbad, CA) con cebadores aleatorios, de acuerdo con las instrucciones del fabricante.
perfiles de expresión génica se realizó usando el sistema de OpenArray [22] (Life Technologies, Carlsbad, CA) , una plataforma de alto rendimiento de la PCR en tiempo real de nanolitros, permitiendo 3.072 reacciones en una sola placa. Las reacciones de PCR se realizaron de acuerdo con el protocolo de placas en tiempo real TaqMan OpenArray. En pocas palabras, las mezclas de reacción de PCR que contenían 2,5 l GeneAmp Fast PCR Master Mix (Applied Biosystems, Carlsbad, CA), 1 l TaqMan OpenArray Remix (Applied Biosystems, Carlsbad, CA), 0,3 l de agua libre de RNasa, y 1,2 ADNc l, se cargaron automáticamente en reacción simple o por duplicado en las placas OpenArray utilizando un instrumento OpenArray AccuFill de acuerdo con los protocolos del fabricante. El protocolo de los ciclos térmicos consistía en 40 ciclos a 95 ° C durante 15 segundos y 60 ° C durante 1 minuto. Al final de cada carrera, las imágenes, recogidas antes y durante la ejecución de la PCR, se inspeccionaron visualmente para comprobar si hay error de carga de la muestra o placas de lectura de problemas. Los valores de Ct se calcularon mediante el software de análisis OpenArray utilizando umbralización automática con el conjunto mínimo de señal Ct confianza en 300. Los valores inferiores al valor mínimo de la señal indica una reacción fallado o sin amplificación y los valores perdidos aparecieron en los datos exportados. La mayoría de las veces una reacción no era debido a los niveles de expresión más allá del límite de detección. Dado que la máxima Ct detectado fue inferior a 36, estos valores fueron sustituidos por el valor Ct arbitrario de 36. Los valores perdidos juzgado para ser causada por razones técnicas fueron sustituidos por los valores de la mediana Ct del gen en cuestión en todas las muestras. Una referencia ARN (ARN Xpress Ref Humana Universal total) (Qiagen, Venlo, Países Bajos) estuvo presente como control positivo, al menos una vez en cada PCR plazo con el fin de asegurar que el proceso y la estabilidad de los reactivos, así como la reproducibilidad sobre diferentes PCR se ejecuta. Los controles negativos que contienen agua en lugar de ADNc se utilizaron para descartar una posible contaminación de ADN.
qPCR en tiempo real sobre placas de 384 pocillos
Doscientos ng de ARN total fue transcrita invertir en cDNA utilizando superíndices VILO síntesis de cDNA Kit (Invitrogen, Carlsbad, CA) según las instrucciones del fabricante.
RealTime listos ensayos de RT-qPCR personalizada (Roche, Basilea, Suiza) en base a ProbeLibrary universal (UPL) tecnología (Tabla S4), eran pre-cargado en placas de 384 pocillos por parte del fabricante. Análisis en tiempo real PCR en placas de 384 pocillos se realizó en el instrumento LightCycler 480 (Roche, Basilea, Suiza) en 144 muestras. Las reacciones de PCR se llevaron a cabo por duplicado en placas de 384 pocillos en un volumen total de 10 l. Cada pocillo se cargó por una pipeta automática (Microlab Starlet, Hamilton Robotics, Reno, NV) con 5 l de ADN en tiempo real Listo Sondas Master Mix (Roche, Basilea, Suiza) y el cDNA equivalente a 2,5 ng de ARN total. El programa de PCR cuantitativa consistió en 2 segundos a 95 ° C y 30 segundos a 60 ° C durante 40 ciclos. Los controles positivos y negativos se generaron con cada lote retrotranscripción y se incluyeron en cada ejecución de qPCR para cada ensayo diana. El control negativo contenía ni RNA ni ADNc para confirmar ocurrido contaminación. El control positivo se hizo con una cantidad estandarizada de ARN humano de referencia Universal (Clontech, Mountain View, CA) en alícuotas y almacenado a -80 ° C. Para qPCR validación de gestión, el control negativo no produjo amplificación o un punto de cruce (Cp) Valor arriba o igual a 35, y el control positivo un valor Cp, para cada gen diana, que cayó dentro de un rango predeterminado. Los valores de Cp se calcularon automáticamente con el software de análisis LightCycler 480 de acuerdo con la
ª derivada máxima método 2 [23].
El análisis estadístico
de datos de PCR derivados de la OpenArray y las plataformas LC480 se normalizaron por el método? Ct usando la media de tres genes de limpieza RPLP0, NACA y TPT1. Se seleccionaron estos genes porque eran las más estables de 3 microarrays de datos relacionados con las PBMC disponible en la base de datos de GEO [24] y también en el análisis qPCR realizado por nosotros (datos no mostrados).
Cambio de expresión génica veces, se definió como con, donde se encuentran los datos normalizados.
test de rangos de Wilcoxon [25] se aplicó a los datos de expresión génica normalizados a fin de definir los genes expresados diferencialmente significativa entre los grupos. Además, en la detección de fase 2, se aplicó la prueba de rangos de Wilcoxon para 500 conjuntos de datos seleccionados al azar (de arranque) y significación se fijó a los genes que aparecen significativa (valor de p & lt; 0,05) en al menos 250 bootstraps de 500.
El análisis multivariado utilizado para la selección de funciones en la detección de fase 2 incluye los métodos siguientes:. puntuación par K-top, un algoritmo de selección de características sin parámetro [26], y el método de regresión logística penalizado con diferentes algoritmos [27, 28]
Para determinar el valor predictivo del panel de 29 genes, modelos de regresión logística se ajustaron penalizados en el conjunto de datos y validados por el método de arranque no se superponen [29]. Quinientos conjuntos de datos aleatorios fueron extraídas con reemplazo del conjunto de datos; cada arranque tenía el mismo tamaño que el conjunto de entrenamiento. El modelo fue re-equipado en cada arranque y validado en las muestras fuera de la bolsa. La especificidad y sensibilidad valores promedio más de 500 bootstraps se calcularon y las características operativas del receptor (ROC) fueron generados por el trazado de la sensibilidad frente a la tasa de falsos positivos (1-especificidad). El área bajo la curva (AUC) se calculó.
Se utilizó el coeficiente de correlación de Pearson para evaluar la correlación lineal entre las mediciones de genes 'por dos instrumentos.
El entorno de las estadísticas de I fue utilizado para los análisis estadísticos.
Resultados
Definición de un panel de 29 genes para el cáncer colorrectal y adenoma de detección
El conjunto de datos generados a partir de la detección de fase 2 (163 genes y 144 muestras) se analizó y se filtran para la baja expresión y genes inestables a través de las dos fases, y 20 genes fueron descartados además, reducir el número de genes candidatos a 140. los datos se analizaron con el fin de definir qué genes, solos o en combinaciones, tenía el más alto poder para discriminar CRC , AP y AP junto con CRC temprano etapa (AP + CRC I-II) del grupo de control (S3 Tabla). Además, el grupo CRC se comparó con el grupo AP, para identificar genes específicos capaces de diferenciar entre CRC y AP. En general, la mayoría de los genes parecían estar regulada en los grupos de CRC y AP en comparación con el grupo control. La expresión génica observada pliegue cambios fueron relativamente modestos, que no exceda de un factor de 2,3 (log 2 = 1,22) (Figura 2). Cuando un filtro basado en un FC & gt; 1,3 y el valor p & lt; se aplicó 0,05 a todas las comparaciones de grupos (CRC /CON, AP /CON, AP + CRCI-II /CON, CRC /AP), encontramos 28 genes que cumplían ambos criterios (S3 tabla). Entre ellos, 14 discriminar CRC y 8 AP del grupo de control (figura 2), dos de los cuales eran comunes a ambas condiciones (CES1 y IL1B). Siete eran específicos sólo para separar AP de CRC y 1 para discriminar AP + CRC I-II. Los genes fueron confirmados a ser significativo cuando la prueba estadística se aplicó a 500 conjuntos de datos generados aleatoriamente (bootstrap, datos no presentados).
Las parcelas volcán resumen la expresión de genes factores de cambio (FC) (
eje x
) y los valores de p (
eje y
) para las comparaciones: a, CRC versus control o, B, AP versus control. P-valor de corte se fijó en 0,05 (línea horizontal) y la tapa de cambio umbral en el ± 0,38 (equivalente a ± 1,3 en escala lineal, línea vertical). Una FC igual a 1 significa que el gen se expresa en el grupo de interés, en promedio, el doble que en el grupo control.
El análisis multivariado se aplica al conjunto de datos para discriminar CRC, AP , AP + CRC del grupo control. Se incluyó KTS-par [26], y cinco diferentes algoritmos basados en el método de regresión logística penalizado [27, 28, 30] para las selecciones y ajuste del modelo variables. Los genes se clasifican en función de la frecuencia de la selección por el método utilizado por el que se resume la puntuación multivariante. Treinta y ocho genes con una puntuación de al menos dos fueron retenidas para compilar la lista final de genes (Tabla S3).
El gen univariante y multivariante listas eran entonces se combinó, lo que resulta en una lista final de 29 genes (Tabla 2). Curiosamente, la mayoría de los genes con mayor puntuación univariados parecía ser también los genes con mayor puntuación en el análisis multivariante. Cuatro genes (MAP2K3, MAPK6, CD63, ITGB5), excluidos por el filtro del análisis univariado debido FC & lt; 1,3, pero estadísticamente significativa (valor de p & lt; 0,05), fueron "rescatados" por el análisis multivariante. De los otros 10 genes no estadísticamente significativas e integrados en las listas definitivas gracias al enfoque multivariado (GATA2, LTF, MMP9, CXCL10, MSL1, RHOC, FXYD5), los tres primeros mostró un FC & gt;. 1.3
el análisis funcional realizado con el paquete de Ingenuity Pathway Analysis (IPA; www.qiagen.com/ingenuity), reveló que el panel se enriquece en genes implicados en la migración de leucocitos y la quimiotaxis (CCR1, CXCL10, CXCL11, CXCR3, IL1B, IL8, ITGA2, MMP9, S100A8) (Tabla 3). Estas funciones celulares están estrechamente relacionados con el tráfico de células inmune y la inflamación. Altamente representado también eran genes implicados en la proliferación y diferenciación celular (bcl3, CD63, EGR1, GATA2, JUN, LTF, MAPK6, MMP11, NME1, PPARg, TNFSF13B), lo que refleja un posible papel en la hematopoyesis.
Validación del panel de 29 genes
para evaluar la relevancia clínica de nuestro panel de 29 genes, en particular, su exactitud predictiva, la regresión logística penalizado se aplicó al conjunto de datos y modelos ajustados fueron validados por arranque no superpuesto Método. Modelos podían discriminar CRC o AP & gt; 1 cm de controles con una sensibilidad media del 75% y 59%, respectivamente. La especificidad promedio, definida como el número de controles clasificadas correctamente sobre el número total de los controles, fue del 91%. análisis ROC determinó un AUC de 0,88 (IC 0,83-0,92, 95%) y de 0,85 (0,78-0,91; IC 95%) para CRC o la detección de AP, respectivamente (Fig 3). Cuando el mismo enfoque se aplicó a los 15 mejor clasificado de genes de CRC o AP discriminación por análisis univariado solamente (Tabla 2), la exactitud de predicción se redujo drásticamente. Cuando especificidad se fijó en 91%, el CRC se detectaron con una sensibilidad del 65% y un punto de acceso con una sensibilidad del 37%, con una AUC de 0,86 (0,77-0,84, IC del 95%) y 0,77 (0,70-0,82, IC del 95% ), respectivamente. Este resultado apoya nuestra elección de la integración del enfoque univariante y multivariante para la selección de genes: los genes que de otro modo habrían sido descartados debido a que no cumplen el p-valor fijo y FC criterios, eran realmente valiosa para la detección de CRC y AP según se considere por métodos multivariantes
A. Resumen de las tasas de falsos positivos y verdaderos del panel de 29 genes en la clasificación de los casos de CCR. B. Resumen de las tasas de falsos positivos y verdaderos del panel de 29 genes en la clasificación de los casos de AP. Los análisis se realizaron utilizando 500 validaciones de arranque. Los diagramas de cajas representan la distribución de los 500 sin ayuda de nadie. La línea de color negro representa los valores medios obtenidos durante 500 bootstraps de especificidad y sensibilidad clínica.
Ensayo de migración a una plataforma de qPCR de 384 pocillos placa
La plataforma OpenArray demostrado ser valiosa para alta rendimiento de perfiles de expresión de genes y el descubrimiento de biomarcadores. Sin embargo, esta plataforma no es adecuado en un entorno de laboratorio clínico de rutina, en la que se prefiere la facilidad de uso, flexibilidad y bajos costos. Con el objetivo de desarrollar el panel de 29 genes en una prueba ampliamente utilizada cribado de CCR, se evaluó el comportamiento del panel en una plataforma de qPCR comúnmente adoptada por los laboratorios clínicos. Las 144 muestras se perfilan con el panel de 29 genes utilizando un instrumento LightCycler 480 (LC480) y un conjunto de ensayos basados en sondas disponibles comercialmente (Universal ProbeLibrary, Roche), precargado en placas de 384 pocillos.
Correlación y análisis de regresión lineal mostró que los niveles de expresión de genes medidos en las dos plataformas eran muy comparables (coeficiente de correlación: 0,933) (Fig 4A). En general, la expresión de genes mostró variación similar a través de las muestras (Figura 4B). Sin embargo, un grupo de genes expresados humilde muestra mediciones con desviaciones estándar más pequeñas en la plataforma LC480 que en el OpenArray uno, lo que sugiere que los ensayos en el instrumento LC480 son más precisos. Cuando se repitió el análisis de la expresión génica diferencial entre los controles y los grupos de CRC con el conjunto de datos LC480, encontramos que la abundancia relativa y la significación estadística de los 29 genes fueron similares o con la tendencia similar a lo observado en el conjunto de datos OpenArray (Fig 4C y 4D) . Sin embargo, para los cinco genes (PTGES, MMP11, IL8, CCR1, S100A8) significación estadística se perdió cuando se mide en el LC480.
Los diagramas de dispersión que comparan los análisis realizados para cada gen en los conjuntos de datos generados en el LC480 y plataformas OpenArray . Las siguientes variables se han utilizado: A. La media de los valores de expresión normalizados (ΔCp y Ct) (R
2: 0.933), B. La media de las desviaciones estándar relativa (SD) para cada gen diana medida, la expresión de genes C. pliegue entre los cambios el CRC y el grupo control (valores absolutos lineales), los valores de p D. de la prueba estadística entre el CRC y el grupo de control (log transformado). Las líneas representan un valor de p & lt; 0,05. los nombres de genes se han superpuesto a los gráficos
Discusión y Conclusiones
En este trabajo hemos identificado un panel de 29-gen expresado en CMSP, capaz de discriminar individuos con AP & gt.; 1 cm o CRC de individuos sanos. El análisis de regresión logística penalizado clasificó correctamente el 75%, el 59% (sensibilidad) y 91% (especificidad) del CRC, AP y controles, respectivamente.
El enfoque que utilizamos es diferente en comparación con las pruebas de detección existentes para el CDN, como que se basa en PBMC perfiles de genes de expresión. Esto aprovecha el concepto bien establecido de la interacción tumor-huésped y la contribución de las células derivadas de la médula ósea a la progresión del tumor [16, 17]. Es de interés el hecho de que AP, lesiones premalignas considerados, también se detectan, aunque con una menor sensibilidad, por el panel 29-gen. De hecho, la inflamación está asociada con la formación neoplásica colónica pólipo [31] y las enfermedades inflamatorias del intestino, colitis ulcerosa, en particular, son un factor de riesgo para CRC [32]. Es importante destacar que, los fármacos anti-inflamatorios no esteroideos protegen contra el desarrollo de CRC [33], prevenir la formación de adenoma en modelos experimentales de poliposis coli adenomatosa [34] y revertir los cambios de expresión génica en el colon normal a la secuencia adenoma [35]. Esto refuerza la idea de que el enfoque propuesto podría ser desarrollado para AP y la detección temprana de CRC como alternativa más eficaz para pruebas de sangre oculta en las heces. La piscina de 670 genes candidatos utilizados para la proyección incluye muchos genes del huésped y rutas implicadas en la inflamación, respuesta inmune y la progresión tumoral. Es importante destacar que estos genes no fueron elegidos en base a un genoma de pantalla ancha precedente, pero en base a los conocimientos existentes (es decir, la literatura y los datos propios) y la hipótesis (es decir, el papel de la inflamación en la progresión del cáncer). La mayoría de estos 29 genes del panel son mediadores /reguladores de la inflamación, la motilidad celular, la supervivencia celular, la señalización celular y la proliferación (Tabla 2 y 3). Esto es consistente con la noción de que las células circulantes myelomoncytic derivadas de médula ósea movilizado-tumor están en un estado de activación en respuesta a factores-lanzado tumorales.