Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Desbloqueo descubrimiento de biomarcadores: Gran Escala de Aplicación de aptámeros proteómico Tecnología para la detección temprana del cáncer de pulmón

PLOS ONE: Desbloqueo descubrimiento de biomarcadores: Gran Escala de Aplicación de aptámeros proteómico Tecnología para la detección temprana del cáncer de pulmón


Extracto

Antecedentes

El cáncer de pulmón es la principal causa de muerte por cáncer en todo el mundo. Se necesitan nuevos métodos de diagnóstico para detectar el cáncer de pulmón en estadio temprano, ya que se puede curar con cirugía. Sin embargo, la mayoría de los casos se diagnostican demasiado tarde para la cirugía curativa. Aquí presentamos un estudio de biomarcadores clínica integral del cáncer de pulmón y la primera aplicación clínica a gran escala de una nueva tecnología proteómica basada en aptámero para descubrir biomarcadores de proteínas en la sangre en la enfermedad.

Metodología /Principales conclusiones

Se realizó un estudio de casos y controles multicéntrico en muestras de suero archivadas de 1.326 sujetos de cuatro estudios independientes del cáncer de pulmón de células no pequeñas (CPCNP) en las poblaciones expuestos al tabaco a largo plazo. Los sueros fueron recogidos y tratados en virtud de los protocolos uniformes. Caso sueros se obtuvieron de 291 pacientes dentro de las 8 semanas de la primera cáncer de pulmón confirmado por biopsia y antes de la extirpación del tumor mediante cirugía. Los sueros de control se obtuvieron de 1.035 participantes en el estudio asintomáticos con ≥ 10 años-paquete de cigarrillos. Medimos 813 proteínas en cada muestra con una nueva tecnología de proteómica basada en aptámero, identificamos 44 biomarcadores candidatos, y desarrollado un panel de 12 proteínas (cadherina-1, ligando CD30, endostatina, HSP90α, LRIG3, MIP-4, pleiotrophin, PRKCI, RGM-C, SCF-sR, SL-selectina, y SI) que discrimina NSCLC de los controles con una sensibilidad del 91% y 84% de especificidad en el entrenamiento de validación cruzada y sensibilidad del 89% y 83% de especificidad en un conjunto de verificación independiente, con un rendimiento similar para la etapa temprana y tardía NSCLC.

Conclusiones /Importancia

Este estudio es un avance significativo en la proteómica clínica en un área de alta necesidad clínica insatisfecha. Nuestro análisis es superior a la amplitud y rango dinámico del proteoma interrogado de los estudios clínicos publicados anteriormente de plataformas de perfiles proteoma amplio suero incluyendo la espectrometría de masas, los arrays de anticuerpos y matrices de autoanticuerpos. La sensibilidad y especificidad de nuestro panel 12-biomarcador mejora los paneles de expresión de proteínas y genes publicados. verificar por separado el rendimiento clasificador proporciona evidencia contra exceso de montaje y es alentador para la siguiente fase de desarrollo, validación independiente. Este cuidadoso estudio proporciona una base sólida para desarrollar pruebas que se necesitan urgentemente para identificar el cáncer de pulmón en estadio temprano

Visto:. Ostroff RM, Bigbee WL, Franklin W, L Oro, MEHAN M, Miller YE, et al. (2010) Desbloqueo descubrimiento de biomarcadores: Gran Escala de Aplicación de aptámeros proteómico Tecnología para la detección temprana del cáncer de pulmón. PLoS ONE 5 (12): e15003. doi: 10.1371 /journal.pone.0015003

Editor: Irina Agoulnik, Universidad Internacional de la Florida, Estados Unidos de América

Recibido: 6 Agosto, 2010; Aceptado: 7 Octubre de 2010; Publicado: December 7, 2010

Derechos de Autor © 2010 Ostroff et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. El cáncer de pulmón paciente y PLUSS sujeto de control de acumulación y anotación junto con la recogida de muestras de sangre, procesamiento y almacenamiento de la Universidad de Pittsburgh Cancer Institute con el apoyo de unos Programas especializados de Investigación de Excelencia (SPORE) subvención del Instituto Nacional del cáncer (NCI) de la Nacional de EE.UU. institutos de la Salud (NIH) de los Estados Unidos de América en el cáncer de pulmón (P50 CA090440) a JMS. estudios de cáncer de pulmón en la NYU fueron apoyados por becas de la Red de Investigación de Detección Temprana (EDRN) del Instituto Nacional del Cáncer de los NIH de los Estados Unidos de América y de la E. Fondo Banner Stephen para el cáncer de pulmón de HIP, y una donación de biomarcadores de la NCI de los NIH de los Estados Unidos de América (5U01CA086137) para WR. estudios de cáncer de pulmón en el Instituto del Cáncer Roswell Park se apoya en parte por una subvención del Centro de Apoyo del Cáncer (5P30CA016056) del Instituto Nacional del Cáncer de los NIH de los Estados Unidos de América. Universidad de contribuciones Colorado para este estudio fueron apoyado por una beca SPORE del Instituto Nacional del Cáncer de los NIH de los Estados Unidos de América (P50-CA58187) y una beca de la EDRN del Instituto Nacional del Cáncer de los NIH de los Estados Unidos de América (U01 -CA85070). SomaLogic financió la investigación de biomarcadores proteómicos. SomaLogic tuvo un papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito. Los donantes que no sean SomaLogic no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:. Los autores han leído la política de la revista y los siguientes conflictos. R Ostroff, Dorado L, M MEHAN, A Stewart, J Walker, S Williams, D Zichi, E Brody son empleados a tiempo completo de SomaLogic. Esto no altera la adhesión de los autores a los PLoS ONE políticas en los datos y materiales de uso compartido.

Introducción
cáncer
pulmón es la principal causa de muerte por cáncer, debido a ~84% de los casos se diagnostican en una etapa avanzada [1] - [3]. En todo el mundo en 2008, ~ 1,5 millones de personas fueron diagnosticadas y ~1.3 millones muerto [4] - una tasa de supervivencia sin cambios desde 1960. Sin embargo, los pacientes diagnosticados en una etapa temprana y tienen experiencia en la cirugía una supervivencia global a los 5 años del 86% [2], [3]. Por lo tanto, se necesitan nuevos métodos de diagnóstico para identificar el cáncer de pulmón en estadio temprano

Durante la última década la utilidad clínica de una dosis baja de TC ha sido evaluado [5] - [8]. con la esperanza de que las imágenes de alta resolución puede ayudar detectar el cáncer de pulmón temprano y mejorar los resultados del paciente, tanto como el cribado ha hecho por cáncer de mama y colorrectal [9]. Las conclusiones definitivas sobre la detección de CT y la mortalidad por cáncer de pulmón esperan los resultados de los ensayos aleatorios en los EE.UU. [8] y en Europa [10] - [13]. La TC puede detectar tumores pulmonares pequeñas, en sus etapas iniciales, pero distinguiendo los cánceres raros de condiciones benignas comunes es difícil y ha dado lugar a procedimientos innecesarios, exposición a la radiación, la ansiedad, y el costo [6], [14] - [16]. Nosotros (JMS, jlw y colegas) informó recientemente de dichas conclusiones para el estudio de cribado de pulmón Pittsburgh (Pluss), la más grande de una sola institución estudio de cribado CT reportados hasta la fecha [5].

Otros tipos de biomarcadores tienen también ha buscado [17]. Las proteínas son atractivos debido a que son una medida inmediata del fenotipo, en contraste con el ADN que proporciona genotipo, en gran parte una medida del riesgo de enfermedad [18]. biomarcadores de proteínas individuales son la base del diagnóstico molecular en la clínica hoy. En general se piensa que varios biomarcadores podrían mejorar la sensibilidad y especificidad de las pruebas de diagnóstico, y que las enfermedades complejas como el cáncer cambiar las concentraciones de múltiples proteínas [19]. Sin embargo, el descubrimiento de múltiples biomarcadores de proteínas mediante la medición de muchas proteínas (proteómica) simultáneamente en muestras complejas como la sangre ha sido difícil por razones de cobertura, la precisión, el rendimiento, la variabilidad preanalítica, y el coste [20].

Para habilitar el descubrimiento de biomarcadores , hemos desarrollado una nueva tecnología proteómica que se basa en una nueva generación de reactivos de unión de proteínas aptámero y tiene potencialmente una amplia aplicación [18]. El ensayo actual mide 813 diversas proteínas humanas en sólo 15 l de sangre con bajos límites de detección (media de 1 pm y tan bajas como 100 FM), 7 registros de rango dinámico general y alta reproducibilidad (5% Coeficiente de variación mediano) [ ,,,0],18]. Aquí presentamos la primera aplicación clínica a gran escala de nuestra tecnología proteómica para descubrir biomarcadores de proteínas en la sangre en un estudio de casos y controles multicéntrico a gran escala realizado en muestras archivadas de 1.326 sujetos de cuatro estudios independientes del cáncer de pulmón de células no pequeñas (CPCNP) en poblaciones expuestos al tabaco a largo plazo.

Materiales y Métodos

Ética Declaración

Todas las muestras se obtuvieron de los participantes en el estudio después de obtener el consentimiento informado por escrito bajo protocolos de investigación clínica aprobado por el siguiendo los consejos de revisión institucionales: La Universidad de Pittsburgh Junta de Revisión institucional (Pitt); La Escuela de Nueva York Universidad de Medicina Junta de Revisión Institucional (Universidad de Nueva York); La Junta de Roswell Park Cancer Institute de Revisión Institucional (RP); La Junta y Salud de Cape Cod de Revisión Institucional (BS).

Diseño del estudio

Los objetivos de este estudio fueron para descubrir biomarcadores que discriminan NSCLC de los fumadores con ≥ 10 años de historia de tabaquismo, a entrenar y validación cruzada de un clasificador de múltiples biomarcadores de CPNM para satisfacer los criterios de rendimiento especificados previamente, y para verificar el cumplimiento de este clasificador con un conjunto separado de muestras ciegas. El diseño general del estudio se muestra en la Figura 1. Se diseñó y ejecutó este estudio con los estándares rigurosos estudios clínicos actuales para biomarcadores [21] - [23] con los objetivos de maximizar la robustez de biomarcadores, validez y fiabilidad en la fase de descubrimiento, y minimizar los efectos potenciales de la variabilidad preanalítica. El estudio fue un diseño de fase de descubrimiento, de casos y controles. características de diseño del estudio crítico incluyen los siguientes. La pregunta y el diseño del estudio clínico fueron pre-especificada antes de la identificación y adquisición de muestras. Las muestras fueron compradas a los cuatro sitios de estudio independiente con el fin de controlar la variabilidad preanalítica de potencial. estrictos procedimientos operativos estándar fueron seguidos para garantizar el anonimato de la muestra y los datos y el cegamiento en todo momento (ver más abajo). Un conjunto de muestras de verificación que consiste en el 25% de todas las muestras del estudio se seleccionó al azar y fue cegado la identificación de este conjunto. El plan de análisis estadístico se pre-especificado e incluyó criterios de rendimiento mínimamente aceptables de sensibilidad y especificidad

cohorte muestra

La cohorte muestra está compuesta por 1.326 muestras de suero obtenidas de cuatro biorepositories independientes: New. York University (NYU) [24]; Roswell Park Cancer Institute (RPCI) [25]; La Universidad de Pittsburgh (Pitt) [5]; y un biorepositorio comercial (BioServe (BS)) (Tabla 1). Todas las muestras se obtuvieron de los participantes del estudio después de obtener el consentimiento informado bajo protocolos de investigación clínica aprobado institucionalmente como se describe [5], [24], [25]. Ambas muestras de suero de casos y controles se recogieron a partir de cuatro centros de estudio. Las características clínicas de la cohorte del estudio de los conjuntos de entrenamiento y verificación se muestran en la Tabla 2. La puesta en escena y la histología de los casos de NSCLC se muestran en la Tabla 3. La cohorte de muestras incluyendo todos los casos patológicos o estadio clínico I-III NSCLC y un alto -Riesgo control de la población con antecedentes de consumo de tabaco a largo plazo, incluyendo activos y ex fumadores con ≥ 10 años-paquete de cigarrillos. Las poblaciones de control fueron seleccionados al azar dentro de cada estudio para representar a la población de pacientes en riesgo de cáncer de pulmón que serían candidatos para la detección de CT, con una relación de la caja: el control de 1:3.5. Las muestras de sangre para los casos se obtuvieron de los pacientes dentro de las ocho semanas de la primera diagnosis de cáncer de pulmón por biopsia y antes de la extirpación del tumor por un procedimiento quirúrgico. Todos los casos utilizados en este estudio se confirmaron como cáncer de pulmón primario por revisión de la patología. CPNM puesta en escena fue asignado por la estadificación patológica de 240 sujetos y la estadificación clínica de 51 sujetos. controles de nódulos benignos tienen al menos un año de seguimiento de los datos y el diagnóstico no maligno. controles Fumador participantes en el estudio eran asintomáticos con ≥ 10 años-paquete de cigarrillos. Fumador controles de NYU y Pitt fueron nódulo libre por CT; estado nódulo es desconocida para los controles fumador de RP y BS. Los datos demográficos se recogió mediante cuestionarios de auto-informe. Datos adicionales para casos se adquieren a través de revisión de la historia clínica. pruebas de función pulmonar se evaluó mediante espirometría para un subconjunto de los participantes en el estudio.

Suero toma, la preparación, almacenamiento y envío

Se recogieron todas las muestras de suero siguiendo los protocolos uniformes recomendadas por la Red de Investigación de Detección temprana del Instituto Nacional del cáncer [22]. Tres de los centros (Universidad de Nueva York, Pitt y RPMC) de suero recogidas en tubos Vacutainer top rojo (Becton Dickinson, Raritan, NJ) y un centro (BS) de suero recogidas en tubos superiores tigre SST Vacutainer (Becton Dickinson). Todas las muestras se dejaron coagular y el suero se recuperó por centrifugación dentro de 2-8 horas de la recogida y se almacenaron a -80 ° C. HIPAA, muestras sin identificación se envían congeladas en hielo seco para SomaLogic de los centros de estudio y se almacenaron a -80 ° C. Las muestras se descongelaron alícuotas de una vez para antes del análisis proteómico.

Muestra el cegamiento

Con el fin de evitar posibles sesgos, este estudio siguió un estricto procedimiento operativo estándar para la muestra de la identificación y el cegamiento, de manera que todas las muestras físicas y registros de datos se identificaron exclusivamente por un número de código de barras único, no identificable y la clave se almacenan en una base de datos segura accesible sólo para los administradores responsables designadas. Todas las alícuotas de las muestras se ejecutan en este estudio fueron almacenadas en tubos idénticos identificados únicamente por el código de barras asignado. El código cegadora ejemplo sólo se rompió de acuerdo con el plan de análisis pre-especificado para los fines de la formación clasificador con el conjunto de entrenamiento y verificación clasificador con el conjunto de verificación. Para el conjunto de la muestra de verificación, una clave única cegadora se generó y se debe exclusivamente a un lector de terceros (KC), sin relación con los centros de estudio o SomaLogic, para anotar e informar de los resultados finales de verificación.

Análisis proteómico

Las muestras de suero se analizaron en nuestra plataforma de descubrimiento proteómico como se describe en Gold et al [5]. En pocas palabras, esta tecnología utiliza nuevos aptámeros de ADN que contienen nucleótidos modificados químicamente como reactivos de unión de proteínas altamente específico en un ensayo multiplexado única que transforma la cantidad de cada proteína objetivo en una cantidad correspondiente de aptámero, que se cuantifica con una matriz de hibridación personalizado. cantidades de proteína se registran como unidades fluorescentes relativas (RFU), que pueden ser convertidos a las concentraciones de las curvas de calibración. La plataforma está altamente automatizado [26] y escalable para acomodar una amplia gama de rendimiento de la muestra. En este estudio, 813 dianas proteicas se midieron en 15 l de suero para cada sujeto, y todos 1.326 sueros se analizaron en un proceso continuo durante un período de ocho días. En general, los resultados son análogos a un poco más de 1.000.000 de mediciones de ELISA de alta calidad. Las muestras fueron procesadas en múltiples placas de microtitulación de 96 pocillos, y todas las 1.326 muestras se distribuyeron aleatoriamente y sus identidades fueron completamente cegados durante todo el proceso de análisis proteómicos.

fueron seleccionados de biomarcadores de selección

biomarcadores con una estrategia diseñados para identificar los analitos con el rendimiento más alto en la clasificación de los casos de NSCLC de los controles en todos los sitios de estudio y que fueron menos afectados por variables preanalíticas. En el primer paso de este análisis, eliminamos analitos que mostraron variación inesperada en comparación con los controles internos, debido a, por ejemplo, la inestabilidad de la muestra. En este proceso, se optó por un conjunto de analitos que obtuvieron buenos resultados en un total de seis analiza la formación clasificador de Bayes ingenuo (NB). En primer lugar hemos dividido el conjunto de entrenamiento en dos poblaciones distintas para controlar la posible variabilidad biológica entre ellos: (1) todos los casos y los controles con nódulos benignos identificados por CT; y (2) todos los casos y todos los otros controles fumador (estado nódulo desconocido). Para cada población, se compararon los casos a los controles en los análisis de la formación de tres NB diseñado para controlar la variabilidad preanalítica de potencial entre los sitios de estudio. Los análisis de los tres NB comenzó con un conjunto único de biomarcadores potenciales con base en los siguientes criterios: (1) los casos frente a los controles KS≥0.3 para todas las comparaciones dentro de cada uno de los cuatro sitios de estudio; (2) casos frente a los controles KS≥0.3 para comparar todos los sitios combinados; (3) se cumplieron ambos criterios uno y dos. Para cada análisis, se utilizó un algoritmo de búsqueda hacia adelante codicioso para seleccionar subconjuntos de biomarcadores potenciales, construir clasificadores NB (véase más adelante), y marcamos su rendimiento para la clasificación de cáncer de pulmón y controles utilizando el conjunto de entrenamiento. En este proceso, este enfoque meta-heurística busca de manera eficiente el espacio clasificador para identificar biomarcadores potenciales que realizan mejor en la clasificación. Se utilizó una simple medida de rendimiento diagnóstico de los clasificadores, la suma numérica de la sensibilidad + especificidad, y se midió la frecuencia con la que los biomarcadores potenciales fueron seleccionados por el algoritmo voraz para su inclusión en los paneles del clasificador con la sensibilidad + especificidad ≥1.7. Este paso produce un conjunto de biomarcadores potenciales para cada uno de los seis análisis paralelos. Seleccionamos el conjunto final de biomarcadores como la unión de estos seis juegos.

Métodos estadísticos

La estadística KS es una medida no paramétrica de la diferencia entre dos distribuciones. La estadística KS de dos muestras es: donde y son distribución empírica acumulada para dos poblaciones de valores

El clasificador de Bayes ingenuo asume la independencia entre las muestras, y los modelos de las distribuciones de las clases de entrenamiento para hacer predicciones [27. ]. Utilizamos las distribuciones normales para modelar nuestros datos. Sin embargo, las características de nuestros datos contienen a menudo las distribuciones con colas pesadas estimación modo de máxima verosimilitud de los parámetros de la distribución se realiza mal. Por lo tanto, modelamos nuestras distribuciones como distribuciones log-normal y utilizado el algoritmo de Gauss-Newton para ajustar los datos.

Hemos construido clasificadores bayesianos utilizando conjuntos de biomarcadores potenciales identificados como se ha descrito anteriormente. Se utilizó un modelo paramétrico para capturar la distribución de las proteínas subyacente para un estado dado. El modelo paramétrico más simple para la función de densidad de probabilidad (pdf) para una sola proteína es una distribución normal, completamente descrito por una media y la varianza u σ
2 (Ec. 1). (1)

Muchos distribuciones de proteínas se observaron de forma normal con respecto al logaritmo de la concentración. Los cdfs numéricos pueden estar en forma de una distribución normal de las concentraciones de registro de X (Ec. 2). (2)

Los modelos se ajustan bien a los datos. modelos más complejos de las funciones de distribución de probabilidad se pueden utilizar cuando sea necesario, pero la esencia del modelo proporcionan una buena descripción de nuestros datos.

Para combinar varios marcadores, se utilizó una distribución normal multivariante para modelar la función de densidad de probabilidad (pdf ) para cada clase. Para n marcadores, el pdf multivariante se da por la siguiente ecuación (Ec. 3). (3)

donde x es un vector de n componentes de los niveles de proteína, μ es un vector de n-componente de la proteína media niveles, Σ es la matriz de covarianza y nxn

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]