Extracto
El cáncer de pulmón es la neoplasia más letal, y un diagnóstico precoz es la mejor manera para mejorar la supervivencia. Los pacientes sintomáticos que asisten pulmonar Los servicios pueden ser diagnosticados con cáncer de pulmón temprano si los individuos de alto riesgo se separan rápidamente de individuos sanos y pacientes con patologías respiratorias benignas. Se realizaron búsquedas de una prueba de suero no invasiva conveniente definir qué pacientes deben someterse a exámenes clínicos más inmediatos. Seis moléculas asociadas a cáncer (HB-EGF, EGF, EGFR, sCD26, VEGF, y calprotectina) fueron investigados en este estudio. Los marcadores se midieron en el suero por ELISA específicos, en una población no seleccionada, que incluyó 72 pacientes con cáncer de pulmón de diferentes tipos histológicos y 56 sujetos de control (individuos sanos y pacientes con patologías pulmonares benignas). Impulsado regresión y análisis de los bosques al azar se llevaron a cabo para la selección de los mejores biomarcadores candidatos. Se observó una notable capacidad discriminatoria para EGF, sCD26, y especialmente para calprotectina, estas tres moléculas que constituye un panel de marcadores que cuenta con una sensibilidad del 83% y una especificidad de 87%, resultando en una tasa de errores de clasificación asociado de 15%. Por último, un algoritmo deriva por regresión logística y un nomograma permitió la generación de las puntuaciones de clasificación en términos del riesgo de un paciente de sufrir cáncer de pulmón. En conclusión, se propone una prueba no invasiva para identificar pacientes con alto riesgo de cáncer de pulmón a partir de una población no seleccionada de asistir a un servicio pulmonar. La eficacia de este panel de tres marcador debe ser probado en una población mayor de cáncer de pulmón
Visto:. Blanco Prieto-S, Vázquez-Iglesias L, Rodríguez-Girondo M, L Barcia-Castro, Fernández-Villar A, Botana-Rial MI, et al. (2015) Suero calprotectina, CD26 y EGF establecer un grupo especial para el diagnóstico de cáncer de pulmón. PLoS ONE 10 (5): e0127318. doi: 10.1371 /journal.pone.0127318
Editor Académico: Rossella Rota, Ospedale Pediatrico Bambino Gesú, ITALIA
Recibido: 7 de noviembre de 2014; Aceptado: April 13, 2015; Publicado: 18 de mayo de 2015
Derechos de Autor © 2015 Blanco-Prieto et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Disponibilidad de datos: Todos los datos relevantes están dentro del apoyo de sus archivos de información en papel y
financiación:. Esta investigación fue apoyada por PS09-00405 proyecto del Instituto de Salud Carlos III, el agrupar de Inbiomed 2012/273, y la financiación del FEDER DXPCTSUG-Feder (CN 2011/024). S. Blanco-Prieto fue apoyado por una beca del Programa Nacional de Formación de Profesorado Universitario (FPU del Ministerio español de Ciencia e Innovación). M. Rodríguez Girondo reconoce el apoyo financiero de la subvención MTM2011-23204 (soporte incluido FEDER) del Ministerio de Ciencia e Innovación y INBIOMED 2009-063 de la Xunta de Galicia española. Las muestras utilizadas en este trabajo pertenecen al Biobanco del CHUVI (RETIC-FIS-ISCIII RD09 /0076/00011): perfil
Conflicto de intereses:. Los autores han declarado que no existen intereses en competencia
Introducción el cáncer de
pulmón (LC) es la neoplasia más mortales que representan el 18% del total de muertes de cáncer [1]. La clasificación histológica de los tumores de pulmón incluye dos grupos principales: el cáncer de pulmón de células pequeñas (SCLC) y el cáncer de pulmón de células no pequeñas (NSCLC), lo que representa el 75-80% de los cánceres de pulmón de nuevo diagnóstico [2]. Al momento del diagnóstico una proporción importante de pacientes muestra la extensión del tumor y un muy mal pronóstico, con una supervivencia a los 5 años del 16% para el NSCLC [3]. Sin embargo, la supervivencia varía notablemente dependiendo de la etapa, del 52% en la enfermedad local a una dramática 4% para la etapa avanzada [4].
El Instituto Nacional del Cáncer realizó el Estudio Nacional de Exámenes de pulmón que mostró una disminución del 20% LC en la mortalidad de una población de alto riesgo a que se refiere el cribado con dosis bajas de tomografía computarizada (TC) [5]. En consecuencia, las directrices existentes de los Estados Unidos afirman que hay pruebas suficientes apoya la implementación del cribado con LC [6] CT. Por otro lado, se mantiene la incertidumbre dentro de Europa pendiente para la estimación combinado de mortalidad con base en los ensayos de cribado en curso [7]. La elección de los cuales deben ser examinados los grupos de riesgo también es dudosa. Los resultados preliminares del mayor ensayo de detección de cáncer de pulmón Europea, NELSON, han demostrado la distribución etapa favorable, con el 70,8% de los individuos que se diagnostican en estadio I, que se espera se traducirá en una reducción de la mortalidad [8].
Sin embargo, una de las principales preocupaciones de la detección LC con la TC es la alta tasa de resultados falsos positivos que hacen que esta tecnología los procedimientos de diagnóstico adicionales de coste-efectiva, lo que implica [9]. Como consecuencia, los modelos de predicción de riesgo que incorporan los biomarcadores genéticos y moleculares para el diagnóstico precoz están ganando interés para preseleccionar a los pacientes a ser sometido a una dosis baja de TC [10, 11].
Recientemente, los paneles de marcadores séricos para definir alta se han reportado poblaciones de Alto Riesgo para LC y específicamente para el NSCLC. Planque
et al
. [12] estableció un modelo con varios calicreınas, mientras que otros autores han proyectado conjuntos de biomarcadores con una implicación documentado en LC [13-15].
analizaron los niveles de 6 marcadores candidatos en muestras de suero recogidas de cáncer de pulmón los pacientes y los comparó con un grupo control compuesto por dos controles sanos y personas con afecciones benignas de pulmón. Las moléculas seleccionadas son marcadores asociados con el cáncer que cubren una amplia gama de funcionalidades implicadas en el desarrollo y progresión del cáncer: la forma soluble del receptor del factor de crecimiento epidérmico (sEGFR) [16]; dos de los ligandos que se unen al EGFR: factor de crecimiento epidérmico (EGF) y de unión a heparina Factor de Crecimiento Epidérmico (HB-EGF); el factor de crecimiento endotelial vascular (VEGF) como uno de los principales ejecutores de la angiogénesis [17]; sCD26, la forma soluble de CD26, una actividad de serina proteasa de cojinete glicoproteína de superficie celular y que participan en la regulación inmune y el cáncer [18-20]; y una molécula asociada con la inflamación, calprotectina (CAL) [21], hasta reguladas en varios tipos de cáncer, incluyendo cáncer de pulmón [22].
El objetivo de nuestro estudio es la obtención de una novela y precisa panel de marcadores para discriminantes pacientes con alto riesgo de LC. Se midieron los niveles séricos de los seis analitos, y se aplicó un procedimiento estadístico de dos pasos para derivar un algoritmo de clasificación óptima. Se determinó una puntuación de clasificación para cada paciente, lo que mejorará la selección de pacientes para procedimientos adicionales de diagnóstico.
Materiales y Métodos
Muestras Clínicas
Los individuos prospectivamente matriculados en el presente estudio son pacientes con síntomas respiratorios que asisten al Servicio pulmonar del Complejo Hospitalario Universitario de Vigo (España) entre mayo de 2007 y noviembre de 2010.
Ocho ml de sangre periférica se recogieron en tubos estériles que contienen heparina y gelosa, en la primera visitar. Las muestras se centrifugaron a 3000 rpm durante 15 minutos, y el suero se almacenó a -20 ° C hasta su análisis. datos y suero de pacientes se obtuvieron en total conformidad con las prácticas clínicas-éticas del Gobierno español y de la Declaración de Helsinki, y el Comité Ético de Investigación Clínica de Galicia para la aprobó el estudio. consentimiento informado por escrito se proporcionó a los individuos y se justificaba el anonimato.
Clínica trabajo de diagnóstico siguió las recomendaciones de las guías clínicas actuales [23-25]. El diagnóstico de LC se logró mediante la evaluación histológica de los tumores siguiendo los criterios de la OMS en 1999 [26]. En escena se determina de acuerdo con la 5
ª edición del sistema TNM en uso en el momento en que el estudio se llevó a cabo [27]. Los pacientes con recaída o progresión de un cáncer diagnosticado previamente y administración de tratamiento quimio o radioterapia fueron excluidos del estudio. El grupo de cáncer incluyó 72 casos de cáncer de pulmón: la edad media de los pacientes fue de 71 años (rango 47-88), 58 fueron hombres y 14 mujeres, y el tabaquismo se produjo en aproximadamente el 90%. CPNM representó 64 casos, mientras que 8 fueron diagnosticados como SCLC. Dentro del tipo NSCLC, adenocarcinoma fue el subtipo histológico predominante (34 pacientes) y estadio IV fue la etapa más frecuente (28 casos; estadios I y III 17 casos cada uno y 2 tumores en estadio II).
El grupo de control consistía en 56 individuos separados en dos grupos: un subgrupo de control incluyó a pacientes con patologías benignas del pulmón, tales como enfermedades infecciosas (n = 31) y un paciente con enfermedad pulmonar intersticial el otro subgrupo consistió en controles sanos (n = 24) e incluido pacientes que han sido controlados clínicamente basándose en los síntomas respiratorios como tos, disnea o dolor torácico, pero sin sintomatología específica para LC. La mediana de edad de esta cohorte de control fue de 60 años (rango 24-88), compuesto por 33 hombres y 23 mujeres, y presentando el 64% de los controles de los hábitos de fumar. Características clínicas y patológicas de los pacientes de LC y los individuos sin LC se resumen en la Tabla S1.
Medición de suero biomarcadores Concentración
La medición de las concentraciones de biomarcadores se llevó a cabo utilizando inmunoenzimático disponible comercialmente (ELISA) ensayos, de acuerdo con los protocolos sugeridos por el fabricante respectivo. HB-EGF, ensayos de EGF y EGFR se adquirieron de amp I +; D Systems (Minneapolis, MN); sCD26 y VEGF de eBioscience (Irlanda, Reino Unido) y el ensayo de CAL de HyCult Biotecnología (Uden, Países Bajos). Ambas muestras estándar y de suero se analizaron por duplicado. Las lecturas de absorbancia se recogieron en un lector de placas Envision Multilabel (Perkin Elmer).
Métodos Estadísticos
Evaluación individual de biomarcadores.
Las variables continuas se presentan como mediana (rango), y las variables categóricas como frecuencias (porcentajes). Las pruebas no paramétricas de Mann-Whitney y Kruskal-Wallis se utilizaron para evaluar las diferencias en la concentración de cada biomarcador entre los grupos de LC y de control, y para realizar comparaciones por pares entre los controles y los casos subgrupos. Curvas características de funcionamiento (ROC) y se calcularon también la correlación de Pearson entre los niveles de biomarcadores.
P-valores
& lt; 0,05 se consideraron estadísticamente significativos y corregidos por el método de Holm [28] para prevenir la inflación del error tipo I debido a las múltiples pruebas en el análisis de subgrupos (teniendo en cuenta al mismo tiempo los subgrupos definidos por la puesta en escena LC y los subtipos de control). Los análisis univariados se realizaron utilizando el software estadístico SPSS 15.0 (SPSS Inc., Chicago, IL) y R (Wirtschafts Universität, Wien, Austria).
El análisis multivariado Selección del panel.
concentraciones de marcadores eran log
10-transformado antes del análisis multivariado para reducir la asimetría. Se utilizó un procedimiento de dos etapas, que combina la reducción variable y el ajuste del modelo mediante regresión logística.
regresión Impulsado [29, 30] y los bosques aleatorios [31] se llevaron a cabo para la reducción del número de marcadores. Se utilizó un enfoque impulsar descenso de gradiente funcional, donde el problema de ajuste se reinterpreta como la minimización empírica de una función de pérdida pre-definido. La minimización se consigue de forma repetida (m iteraciones) que se ajusta árboles de regresión a los gradientes negativos de la función de pérdida.
Random bosques se basan en la agregación de arranque. A saber, numerosos árboles de regresión se cultivan para cada subconjunto de biomarcadores y cada árbol se utiliza para predecir la pertenencia al grupo para cada observación. Estos son considerados como "votos" para que los miembros del grupo y una observación dada se asignaron al grupo con el mayor número de votos.
En ambos métodos, se consideraron 1.000 árboles y error fuera de la bolsa (fuera de banda) las tasas se obtuvieron considerando la formación de conjuntos con el 75% de los casos y exámenes conjuntos que contienen el 25% restante. Para la regresión impulsado, m actúa como un parámetro de ajuste y se determina por la reducción al mínimo de la tasa de error de fuera de la bolsa (OOB). Del mismo modo, en los bosques al azar, los árboles se montan en los conjuntos de entrenamiento y se utilizan posteriormente para predecir la pertenencia al grupo de los casos de prueba de 25%. Nos reinstalado cada modelo 1.000 veces y se informó de un ranking de los biomarcadores en función de su importancia relativa mediana [32].
Colocamos todos los posibles modelos de regresión logística basado en los biomarcadores de más alto rango. Varios índices de rendimiento se calcularon y compararon entre los modelos: el criterio de información de Akaike (AIC), el criterio de información bayesiano (BIC) y el error cuadrático medio (MSE) como medida de la falta de ajuste (valores más bajos indican un mejor ajuste) y el área bajo la curva ROC (AUC) como una medida de la discriminación. Mientras AIC y BIC modelo penalizan en complejidad, favoreciendo modelos más simples, MSE y enfoque AUC en la capacidad de predicción en sí, favoreciendo modelos más complejos.
Se utilizó predicciones fuera de banda y nosotros proporcionamos los valores promedio de más de 1.000 repeticiones. Todos los modelos de regresión logística fueron la edad y el sexo de ajustar los factores de confusión potenciales. Finalmente, se proporciona una representación gráfica nomograma.
Para evaluar la capacidad de diagnóstico del panel indicado como mejor de acuerdo a los índices antes mencionados (AIC, BIC, MSE y AUC), se proporcionaron los términos de sensibilidad y especificidad. La sensibilidad se refiere al porcentaje de pacientes con cáncer de pulmón que resultan positiva con la prueba, en otras palabras la capacidad de la prueba para detectar la enfermedad; la especificidad es el porcentaje de individuos no cancerosos en los que la prueba es negativa
.
Todos los análisis estadísticos multivariados se realizaron con el software estadístico R (Wirtschafts Universität, Wien, Austria).
resultados
Análisis de marcadores séricos en pacientes con cáncer de pulmón y en los sujetos control
las concentraciones en suero, junto con los análisis estadísticos univariados comparando grupos de control y LC para cada uno de los seis marcadores biológicos se presentan en la Tabla 1. Es significativo aumento de las concentraciones séricas de EGF (
p Hotel & lt; 0,001), sEGFR (
p = 0,037
) y CAL (
p Hotel & lt; 0,001) fueron encontrados en pacientes con CP en comparación con el grupo de control, mientras que sCD26 se redujo (
p
& lt; 0,001). Curiosamente, sólo sCD26 (
p = 0,045
) y CAL niveles (
p Hotel & lt; 0,001) en patologías benignas conservadas distinción significativa entre los niveles de LC, mientras que para el EGF esta distinción no alcanzó significación (
p = 0,100
).
El potencial utilidad clínica de estos 6 analitos como biomarcadores para LC se evaluó mediante análisis univariante curva ROC (Tabla 1). capacidad discriminatoria notable fue encontrado por EGF y sCD26, con un área bajo la curva (AUC) de 0,701 y 0,711, respectivamente; CAL exhibió el perfil más prometedor, con una AUC de 0,781.
La correlación entre los marcadores se valoró también revela que varias moléculas fueron ligeramente correlacionadas entre sí (datos no mostrados). Sólo para sCD26 y CAL con VEGF, la correlación era & gt;. 0.3
Análisis de marcadores séricos de acuerdo con la clasificación de tumores
Los niveles de los marcadores también se analizaron en pacientes con CPNM (89% de casos de LC) de acuerdo con la extensión del tumor (Tabla 2). Entre los marcadores discriminantes significativas, los niveles de EGF y CAL ya fueron estadísticamente distinguibles de los controles sanos y benignos en las primeras etapas I-II (
p Hotel & lt; 0,001 y
p = 0,002
, respectivamente). Estos marcadores también muestran diferencias significativas entre las etapas NSCLC III-IV pacientes y controles (p
= 0,012 para el EGF y
p Restaurant & lt; 0,001 para CAL), a pesar de EGF presentan niveles inferiores notables en etapas avanzadas, en comparación con las fases anteriores. Por otro lado, no se encontraron diferencias estadísticamente significativas entre los niveles de sCD26 en las primeras etapas y los de los controles (
p
= 0,116), pero difieren de manera efectiva en etapas diseminadas en relación con los controles (
p
. & lt; 0,001) guía empresas
Para los restantes marcadores, la estratificación por la extensión del tumor no dio como resultado diferencias con el grupo de control, con la única excepción de VEGF. Cuando se estratificó por el estadio del tumor, sEGFR perdió su discriminación por parte de los controles, tanto en las primeras etapas I-II, y en estadios avanzados III y IV (
p = 0,375
para ambas comparaciones). A la inversa, para VEGF el aumento pronunciado en sus niveles con progresión de la enfermedad llevó a niveles significativamente más altos en etapas progresivas III-IV que los del grupo control (
p
= 0,028).
Tabla
S2 proporciona un análisis más profundo de los niveles de los marcadores en etapas NSCLC individuales. Para los marcadores que resultaron discriminadores significativas entre los sujetos control y pacientes LC generales, sCD26 y CAL mostraron una tendencia bastante homogénea a un empeoramiento de sus niveles con la progresión de NSCLC, lo que representó para la diferenciación de finales de NSCLC en relación con los controles en el caso de sCD26. Sorprendentemente, la tendencia de los niveles de EGF era el contrario, con los niveles en las fases avanzadas se acercan a las exhibidas por los sujetos de control.
Aunque un análisis detallado de acuerdo con la extensión del tumor no era posible en el grupo de SCLC debido a la muestra reducida tamaño, hubo una notable diferencia entre los niveles de enfermedad limitada y extendida para HB-EGF (111.00
frente
236,00 pg /ml), EGF (78.37
frente
447,90 pg /ml) y CAL (97.32
frente
313.00 ng /ml). niveles similares fueron encontradas por etapas limitadas y extendidos en el caso de sEGFR (41.96
frente
35,22 ng /ml), sCD26 (339.00
frente
294.00 ng /ml) y VEGF (530,82
frente
493,76 pg /ml).
Una representación gráfica de los perfiles de biomarcadores individuales considerando todos los subgrupos de pacientes se presenta como caja de parcelas en la figura 1.
caja de parcelas de los niveles de los biomarcadores seis candidatos en los subgrupos de suero de los controles y los pacientes con cáncer de pulmón. Las líneas horizontales representan los valores medios.
Comparación de biomarcadores con los parámetros demográficos
Los niveles de HB-EGF, EGFR, VEGF y CAL no mostraron ninguna relación con los parámetros demográficos. EGF (
p = 0,004
) y sCD26 (
p = 0,014)
niveles variaron significativamente por género; Además, los niveles de sCD26 disminuyó progresivamente con la edad (
p
= 0,001). Únicamente EGF correlacionada con la condición de fumador, con niveles notablemente superiores en los fumadores (
p = 0,011
) (Tabla 3).
.
La selección de un Multi- Panel marcador para la detección del cáncer de pulmón
el uso de los métodos de impulsar y bosques aleatorios, cada marcador fue clasificado por orden de importancia para predecir LC (Tabla 4). Ambos métodos permiten una clasificación de los marcadores que mayormente contribuyen a la distinción entre el cáncer y los sujetos de control. Según el método de impulsar, CAL mostró importancia relativa superior, seguido de sCD26 y EGF con una importancia relativa similar; azar forestal coincide principalmente en su ranking. A la luz de estos resultados hemos elegido CAL, sCD26 y EGF como los biomarcadores de interés para la detección de LC.
A continuación, hemos construido todos los posibles modelos de regresión logística basados en combinaciones de estos tres marcadores y el género y la edad como potenciales variables de confusión (Tabla 5). Varios índices de rendimiento se aplicaron a investigar cuál es el modelo que mejor se comporta. Mientras BIC es más conservadora y se identifica el modelo con CAL solo como el óptimo (el más bajo valor de BIC), AIC identifica el modelo con tres marcadores como el óptimo (que muestra el valor más bajo AIC), de acuerdo con la más alta AUC y la más baja predicción de MSE.
Clasificación Algoritmo
Como se deriva de los índices de rendimiento, un panel de marcadores valiosa que podría ser útil para el diagnóstico de LC fue establecido, constituido por CAL, sCD26 y EGF. El modelo de regresión logística asociada genera un algoritmo para calcular una puntuación de clasificación (
p
) para cada paciente, dada por la probabilidad estimada de la presentación de LC, como una función de los biomarcadores seleccionados (CAL, sCD26 y EGF), se define de la siguiente manera: Donde X
1, ..., X
i son la forma logarítmica transformado (base 10), las concentraciones de los marcadores, α
0 es la constante específica del modelo y α y β son los coeficientes para variables demográficas (edad y sexo) y cada uno de los biomarcadores seleccionados, respectivamente.
Rendimiento diagnóstico del panel seleccionado de marcadores
Con el objetivo de estimar los parámetros de diagnóstico del seleccionado marcador de tres algoritmo de clasificación en nuestra población de pacientes, los valores para la puntuación de clasificación
p
fueron elaborados para los individuos evaluados en nuestro estudio. Diferentes puntos de corte para
p
con las sensibilidades y especificidades asociadas fueron propuestos (Tabla 6). El umbral óptimo para la discriminación de los cancerosos de pacientes no cancerosos fue 0,559, lo que significa que un paciente con una puntuación más alta se considera que tiene cáncer de pulmón y un paciente con una puntuación inferior a 0,559 se considera que no tiene cáncer, esta línea de corte lleva una sensibilidad del 83% y una especificidad del 87%.
Impacto de Demografía y variables clínicas de clasificación errónea por el Modelo de Predicción
la tasa global de errores de clasificación para el panel de tres marcadores, para una línea de corte fija de 0.559, fue 15%. a continuación, se llevó a cabo un examen de los grupos individuales para evaluar el papel de las variables demográficas y clínicas de los casos la clasificación incorrecta. El panel dio una mayor tasa de errores de clasificación de los no fumadores (26%) que los fumadores (16%), debido (al menos en parte) el efecto de confusión de fumar en los valores de EGF. En cuanto a la estadificación, errores de clasificación en las primeras etapas I-II fueron altamente equivalentes a los presentados en etapas avanzadas III-IV, 11 y 13%, respectivamente. casos de SCLC fueron clasificados erróneamente en un grado mayor, 50% (4/8 casos), que los casos de NSCLC (12%). Cuando se observan únicamente la cohorte compuesta de controles sanos, sólo un sujeto estaba mal clasificada de los 24 probados (4%), mientras que 6 de 32 pacientes con afecciones pulmonares benignos fueron clasificados erróneamente (19%).
Predicción nomograma
el nomograma es una forma sencilla de interpretar un panel de marcadores multivariante y visualizar los diferentes perfiles de los pacientes que producen a diferentes valores de la puntuación de clasificación asociado
p
. La figura 2 muestra un nomograma para el panel que incluye CAL, sCD26 y los niveles de EGF (log transformado). Para obtener la puntuación de un paciente dado, los valores correspondientes para cada marcador se encuentran en el eje correspondiente y verticalmente relacionadas con los "puntos" eje que atribuye puntos a la variable en función de sus niveles. Tenga en cuenta que CAL es el marcador asociado con el mayor número de puntos, lo que significa que es la variable de mayor importancia para calcular la puntuación
p
. Una vez calculada la contribución en puntos de cada variable, que se suman, y el eje del total de puntos pueden estar directamente relacionados con la puntuación de clasificación
p
eje de abajo.
multivariable de regresión logística modelo- nomograma basado para definir puntuación de cáncer de pulmón
p
basado en calprotectina, sCD26 y la concentración de EGF (log transformado), sexo y edad.
Discusión
Nuestro objetivo era para identificar marcadores séricos candidato para constituir un panel y proponer un modelo de clasificación para ser utilizado en la habitual población sintomática no seleccionada visitando los Servicios pulmonares para la selección de aquellos pacientes susceptibles de ser sometido a procedimientos de diagnóstico. Inicialmente se incluyeron 6 moléculas:. HB-EGF, EGF, sEGFR, VEGF, sCD26 y CAL para investigar su potencial como marcadores de diagnóstico en LC
sEGFR, que comprende sólo el dominio extracelular del EGFR, se encuentra en la sangre [ ,,,0],33, 34] y, potencialmente, puede reflejar los cambios en el crecimiento del tumor. Dos de los ligandos que se unen a EGFR también se seleccionaron para este estudio: EGF y HB-EGF. Tanto EGFR en suero y EGF demostraron una buena capacidad de diagnóstico en pacientes de LC en un estudio anterior [35], mientras que el papel de HB-EGF en LC sólo se ha evaluado en términos de respuesta al tratamiento de EGFR [36]. VEGF como un mediador de la angiogénesis [17], ha sido evaluado ampliamente como un factor pronóstico en LC [37, 38]. sCD26, la forma soluble de la transmembrana de la proteasa de la dipeptidil peptidasa IV (DPP-IV) [18] se informó a bajos niveles en tumores sólidos [20] y se sugiere como un ensayo sensible significativo para el diagnóstico precoz y el cribado de CCR [39]. Perteneciente a la familia de proteínas de unión S100 calcio, CAL es una proteína inmunogénica expresada abundantemente y liberado por los fagocitos, ejerciendo propiedades antimicrobianas y pro-inflamatorias [21]. Una función en el desarrollo del cáncer se ha sugerido debido a su regulación en diversos tumores como el de pulmón [22].
A partir de nuestros resultados podemos concluir que el EGF, sCD26 y CAL mostraron la capacidad de discriminación más alto de malignidad pulmonar . EGF demostró un rendimiento relativamente bueno en el diagnóstico LC con niveles aumentaron significativamente en comparación con el grupo control. En un estudio anterior (Lemos
et al
. [35]), que describe los niveles estadísticamente más bajos de EGF en el suero de los pacientes con CPNM que en los controles. Estos resultados aparentemente contradictorios son debido a las diferencias en las cohortes de control y pacientes. Aquí incluimos patologías benignas, y los individuos sanos fueron los sintomáticos, mientras que en el trabajo anterior se trataba de donantes sanos. Por otra parte, el grupo del paciente en el primer estudio incluyó a pacientes con NSCLC avanzado principalmente. Por otra parte, la dependencia de los niveles de EGF sobre el género y la condición de fumador no se informó en ese estudio.
Los resultados en cuanto a sCD26 en el diagnóstico de LC también fueron prometedores. El papel de CD26 en la carcinogénesis no es unívoca. Por un lado, se informa de las actividades pro-oncogénicos que median en la metástasis de pulmón [40]. Por otro lado, se demostró un papel supresor sobre el cáncer de pulmón [41], como re-expresión de CD26 invierte el fenotipo maligno de las células de cáncer de pulmón de células no pequeñas. En nuestro estudio, sCD26 experimentaron una reducción significativa en su nivel en los pacientes con cáncer en comparación con los individuos de control. Tal Ya se ha observado una reducción [42] y, así mismo, una asociación con la edad avanzada y los niveles más bajos sCD26 se encontró; también, una disminución significativa en la actividad de DPPIV con la edad en una población de sujetos sanos anteriormente había sido descrito [43]. De Chiara
et al
. [44] sCD26 en suero medidos en una gran cohorte y reportados niveles medios globales de 522 ng /ml (rango de 118 a 3062), de acuerdo a los niveles de nuestra cohorte de control. De manera similar, se observaron concentraciones ligeramente superiores en las mujeres y una modesta disminución de los niveles a lo largo de décadas.
CAL se refiere al heterodímero formado por las proteínas S100A8 y S100A9, y es un mediador de diversos procesos dentro de la inflamación crónica siendo altos niveles característico para las condiciones inflamatorias. Expresión diferencial de CAL se ha demostrado para representar un paso clave que contribuye al desarrollo y progresión del cáncer en los tumores malignos de la vejiga, piel, mama, gástrico, colorrectal, pulmón, páncreas, próstata y carcinomas esofágicos escamosas [21, 22].
en un trabajo previo de una alta precisión de CAL para predecir malignidad en pacientes con derrame pleural exudativo se ha demostrado [45]. los niveles de CAL en los derrames LC causando (255,4 ng /ml) fueron similares a la descrita aquí en el suero. Por el contrario, mucho más altos niveles medios en los derrames pleurales benignos (2,627.1 ng /ml) se encontraron en comparación con los niveles medios en suero (141,93 ng /ml), lo que evidencia la diferente naturaleza de los fluidos analizados. Se informó de un tejido más fuerte expresión de S100A8 y S100A9 en tumores malignos de pulmón en comparación con los tejidos pulmonares periféricas y adyacentes benignos [46], de acuerdo con nuestros datos.
Uno de los principales requisitos de un marcador tumoral es su capacidad para detectar la enfermedad en las primeras etapas. los niveles de EGF y CAL ya están alterados en las etapas I y II del CPCNP en comparación con los controles, mientras que sCD26 presentó una disminución acentuada, aunque no significativa. Un análisis similar en pacientes con CPCP no pudo realizarse debido al bajo número de individuos; sin embargo, los pacientes con enfermedad limitada exhibieron niveles de EGF y CAL inferiores a los del grupo de control que podrían indicar un cierto grado de dificultad en la clasificación de estos pacientes. En general, estos resultados sugieren la utilidad del panel en las campañas de cribado. Este hecho pone de manifiesto la principal limitación de nuestro estudio, el tamaño relativamente pequeño de nuestra cohorte que se opone a las comparaciones como el antes mencionado, lo que justifica más estudios a gran escala para validar estos hallazgos. Lo mismo se aplica para la generación del modelo de clasificación, aunque en este caso los procedimientos estadísticos en ambos pasos se repitieron 1000 veces y los parámetros resultantes promedio, lo que evita la sobreestimación y asegura la reproducibilidad del modelo en las poblaciones futuras.
Para llegar a un algoritmo de clasificación clínicamente significativo para LC basado en marcadores más discriminativos se realizó una estrategia estadística de dos pasos. Impulsar y métodos forestales aleatorios permitir la clasificación de los biomarcadores de acuerdo a los índices de importancia de las variables relativas a partir de la influencia relativa media en todos los árboles generados [32]. Ambos, impulsar y métodos azar forestal, confirmó la superioridad del CAL, sCD26 y EGF. En un segundo paso, se utilizó el panel de biomarcadores para adaptarse a modelos de regresión logística para derivar una regla de clasificación (óptimo) para la asignación de diagnóstico de un paciente. De acuerdo con los índices de rendimiento aplicadas, incluyendo el panel de CAL, sCD26 y EGF se estableció como el más informativo. El modelo incluyó el género y la edad para corregir los factores de confusión potencial, especialmente en el caso de sCD26, cuyos niveles están influenciados por la edad. Desde fumadores faltan datos para algunos individuos esta variable no se podía considerar en el análisis.
Debe tenerse en cuenta la fuerza de CAL tanto en los modelos de regresión univariante, en el que el preferido es el que incorpora CAL solo, y teniendo en cuenta la combinación de marcadores, lo que refuerza CAL como el biomarcador más importante para el diagnóstico de LC.
Aplicabilidad del correspondiente algoritmo permite obtener una puntuación mediante la introducción en el modelo de las concentraciones de marcadores propios del paciente. Si el resultado
p
puntuación es superior a la de corte fijo, el individuo será clasificado como LC con una sensibilidad y especificidad en relación con este punto de corte. Además, proporcionamos una representación nomograma del modelo multivariado óptima para una mejor interpretación del sistema de puntuación, lo que permite comprobar la posible combinación de valores de los biomarcadores que están asociados con un valor específico de la puntuación
p
.
El panel de tres marcadores mostró una tasa de errores de clasificación global del 15%. Dentro de los errores de clasificación, SCLC fue la histología mal clasificada con más frecuencia, pero el número de pacientes es demasiado pequeño para extraer una conclusión definitiva.