Extracto
La enfermedad pulmonar intersticial (ILD) eventos han sido reportados en el cáncer de pulmón de células no pequeñas japonesa (NSCLC) los pacientes que reciben inhibidores de la tirosina quinasa de EGFR. Se investigaron los biomarcadores proteómicos de conocimientos sobre mecánica y una mejor predicción de ILD. el plasma se recogió sangre de 43 pacientes con CPNM gefitinib tratada en desarrollo ILD aguda (confirmado por examen de diagnóstico ciego) y 123 controles seleccionados al azar en un estudio de casos y controles anidados dentro de un estudio de cohorte farmacoepidemiológico en Japón. Hemos generado mediciones ~ 7 millones de espectrometría de masas tándem (MS /MS) con amplio control de calidad y validación, la producción de uno de los mayores conjuntos de datos de cáncer de pulmón proteómica hasta la fecha, la incorporación de diseño riguroso estudio, definición fenotipo, y la evaluación de procesamiento de la muestra. Después de la alineación, la escala y el ajuste por lotes de medición, se identificaron 41 péptidos picos que representan a 29 proteínas que predicen mejor ILD. péptido multivariante, proteínas y modelado de predicción logra vía ILD comparable a las variables clínicas previamente identificados; la combinación de los dos proporcionan una cierta mejora. La vía de respuesta de fase aguda estaba representada fuertemente (17 de 29 proteínas, p = 1,0 × 10
-25), lo que sugiere un papel clave con utilidad potencial como un marcador para el aumento del riesgo de eventos LDI agudas. Validación mediante transferencia Western mostró correlación para las proteínas identificadas, lo que confirma que los resultados robustos se pueden generar a partir de una plataforma de MS /MS implementar el control de calidad estricto
Visto:. Nyberg M, Ogiwara A, Harbron CG, Kawakami T, K Nagasaka , Takami S, et al. (2011) proteómico biomarcadores para la enfermedad pulmonar intersticial aguda en cáncer de pulmón Los pacientes japoneses Tratados con gefitinib. PLoS ONE 6 (7): e22062. doi: 10.1371 /journal.pone.0022062
Editor: Scott A. Coonrod, Universidad de Cornell, Estados Unidos de América
Recibido: 28 Marzo, 2011; Aceptado: June 14, 2011; Publicado: 20 Julio 2011
Derechos de Autor © 2011 Nyberg et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este estudio fue financiado por AstraZeneca y realizado en colaboración por investigadores de la Academia, AstraZeneca y medicina Proteoscope Company. Todas las partes que colaboran participaron en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, y la preparación del manuscrito
Conflicto de intereses:. FN, CGH, ISP, MCS y CIG son empleados de AstraZeneca y acciones propias en la compañia. AO, los conocimientos tradicionales, K. Nagasaka, ST, KW, HKT, MO, Y. Kyono, TD, Y. Komatsu, MK, SA, y TN son /eran empleados de Medicina Proteoscope Co., Ltd. TH es un empleado de Chiesi Farmaceutici. TH y GMV son empleados anteriores de AstraZeneca. MF ha recibido honorarios de AstraZeneca. K. Nakata, YO, SK, y HK han declarado que no existen conflictos de intereses.
Introducción
La enfermedad pulmonar intersticial (ILD) afecta al parénquima pulmonar o región alveolar [1]. Cuando se asocia con el tratamiento farmacológico, se puede presentar precipitadamente como daño alveolar difuso aguda (DAD), a veces con consecuencias mortales [2]. Los pacientes a menudo tienen "vidrio esmerilado" aparición de disnea y radiología torácica graves espectáculos. No hay tratamiento específico disponible, pero la terapia de apoyo incluye oxígeno, corticoides, o ventilación asistida. ILD eventos agudos pueden desarrollar
de novo, sino una condición crónica ILD existente aumenta considerablemente el riesgo [3], como se ha observado en estudios recientes de pacientes con fibrosis pulmonar idiopática (FPI), la forma crónica más común [4 ].
ILD, especialmente IPF, es un conocido co-morbilidad en pacientes con cáncer de pulmón no microcítico (CPNM) [5]. ILD eventos agudos han sido reportados con muchas terapias contra el cáncer de pulmón a velocidades de hasta ~ 10% [6] - [11]. ILD es reconocido como más común en Japón que en otros lugares, tanto en la población y entre los pacientes con NSCLC [5], [6], [12], [13], aunque no está claro por qué.
tirosina de EGFR inhibidores de la quinasa (TKIs) son un tratamiento establecido para NSCLC avanzado. A diferencia de gran parte de la quimioterapia, por lo general son bien tolerada y sin efectos secundarios citotóxicos. El gefitinib EGFR TKI (IRESSA) fue aprobada en 2002 en Japón para el tratamiento de NSCLC avanzado. Aunque se observaron algunas reacciones adversas tipo EPI en los ensayos clínicos y el uso clínico compasivo, sólo después de la aprobación hizo un número creciente de informes espontáneos de ILD aparece en Japón como la droga se hizo más ampliamente disponibles.
En ese momento, mejor se necesita con urgencia comprensión de ILD: incidencia de referencia en los diferentes tratamientos, factores de riesgo y la posible asociación de gefitinib con el riesgo de ILD. Un equipo académico independiente junto con científicos de AstraZeneca, por tanto, diseñó y llevó a cabo una cohorte y de casos y controles anidados estudio farmacoepidemiológico de EPI en pacientes con CPNM japoneses tratados con gefitinib o quimioterapia, con resultados clínicos se informó anteriormente [3]. Como uno de los componentes sub-estudio exploratorio, los pacientes tratados con gefitinib (ambos casos LDI posteriores y control de los pacientes) fueron muestreados para la proteómica de plasma, con dos objetivos principales: 1) para identificar predictores de proteómica de ILD que en última instancia podrían desarrollarse en una medicina personalizada de diagnóstico para identificar a los pacientes en mayor riesgo de EPI; 2) aumentar la comprensión de los mecanismos subyacentes al desarrollo de eventos agudos LDI.
El uso de un enfoque de múltiples biomarcadores tales como la proteómica (el estudio simultáneo de grandes partes del proteoma humano para dar una visión global de la expresión diferencial de las proteínas en la sangre o tejido), en lugar de simplemente un único biomarcador convencional, potencialmente aumenta el poder predictivo tanto a través de una mayor solidez derivada de múltiples mediciones y la oportunidad de combinar información de múltiples procesos biológicos. Para apoyar la generación de alta calidad de la misma, se combinaron en una forma novedosa de varios componentes clave del estudio: robusto diseño del estudio, las definiciones fenotípicas bien definidas, procedimientos de toma de muestras cuidadosas, cromatografía líquida estable avanzada (LC) espectrometría de masas -tandem (MS /EM) basado en métodos de separación y detección de péptidos, análisis estadísticos que incorporan información proteómica y clínica, los métodos rigurosos para la anotación de la base de datos de proteínas de péptido picos detectados, y la interpretación biológica usando software de minería de la literatura, además de un amplio control de calidad y validación, se informa a continuación.
Resultados
Características de la población estudiada
la cohorte no aleatorizado incluyó 3.166 pacientes japoneses con avanzado /recurrente CPNM que fueron seguidos durante 12 semanas después de iniciar el gefitinib (n = 1.872 periodos de tratamiento ) o quimioterapia (n = 2551). Desde el sub-cohorte tratada gefitinib, 103 casos sospechosos de LDI (79 posteriormente confirmados y 24 rechazadas por la Junta de Revisión de Casos [CRB]), así como 252 controles, se registraron en el estudio de casos y controles. Proteómica muestras de este sub-estudio se obtuvieron de 43 casos confirmados de LDI, 123 sujetos de control, y 15 casos diagnosticados inicialmente LDI CRB-rechazada (Tabla 1). Características clínicas de los casos y los controles se describen en la Tabla S1.
El análisis exploratorio de los datos de LC-MS /MS obtenidos en condiciones de calidad controlada revela la variación lote grande que necesita ser controlada en los análisis estadísticos posteriores
evaluación de la calidad del procesamiento de la muestra y la generación de datos
Después del agotamiento de inmunoafinidad, albúmina de suero restante fue & lt; 8% para todas las 181 muestras de referencia (Tabla S2). La hidrólisis tríptica posterior dio como resultado una porción de la proteína no digerida restante que van desde 3,0% a 32,3% (media 15,3%) (Tabla S2). La variación de estos pasos de procesamiento fue independiente del estado del caso /control (datos no mostrados).
mediciones LC-MS /MS para los 181 muestras de referencia individuales se llevaron a cabo en 11 lotes, con 19 y 20 muestras de lotes 1 y 3 repiten en lotes 10 y 11, respectivamente (Tabla 1), lo que resulta en 220 mediciones proteómica discretos. Cuatro de los 11 lotes inicialmente no cumplía los criterios de control de calidad (coeficiente de variación [CoV] & gt; 20% para cualquiera de los seis péptidos de control entre las tres muestras de control dentro de lotes) en la primera serie de mediciones, pero pasaron los criterios de medición repetida. Un resumen de control de calidad de los experimentos de lotes aceptables se da en la figura 1A.
(A) Reproducibilidad de 6 picos de control para las 3 muestras de control de calidad estándar, representa como "+", en el análisis de cada lote (intensidad de pico, eje de la izquierda). Los coeficientes de variación (%, eje derecho) entre las muestras de control 3 en cada lote se representan como puntos unidos por una línea. (B) La reproducibilidad de las intensidades de péptidos de 39 muestras con análisis duplicados en diferentes lotes de análisis. La correlación parcial, después de la eliminación de las diferencias entre lotes, representada frente a la intensidad normalizada media para cada péptido. péptidos de mayor intensidad muestran una alta reproducibilidad en sus intensidades entre lotes repetidos.
Figura 1B muestra una representación gráfica de las correlaciones parciales entre las muestras duplicadas en los lotes 1 y 10, 3 y 11, después de tener ningún efecto por lotes , en contra de la intensidad normalizada promedio sobre el conjunto completo de la muestra para cada señal. Los péptidos con intensidades medias más altas muestran una mayor reproducibilidad entre lotes como se evidencia por lo general altas correlaciones parciales.
Análisis exploratorio de datos de intensidad de la señal MS.
A continuación, se utilizó un análisis de componentes principales (PCA) para explorar los datos con el fin de identificar las principales fuentes de variación. La Figura 2A muestra un gráfico de este análisis, con cada muestra de color de acuerdo a lote. Las mediciones del mismo lote tienden a agruparse juntos, separados de otros lotes, lo que implica que las mayores diferencias entre las muestras surgen de la transformación por lotes.
(A) Parcela de dos primeros componentes principales del análisis de componentes principales de la datos proteómicos completos de todos los lotes de análisis 11 (numeradas 1-11 en secuencia de tiempo). Cada muestra está representada por un solo punto, con la gama de puntos dentro de cada lote que se muestra por un polígono que une los puntos extremos en ese lote. (B) gráficas de los dos primeros componentes principales para los repetidos lotes de muestras (1 y 10, 3 y 11). Las muestras individuales se representan mediante una línea, que conecta las dos repeticiones en diferentes lotes. (C) La reproducibilidad de un ejemplo de péptidos expresados diferencialmente entre los dos experimentos de lotes duplicados de análisis proteómico. Las intensidades de la primera y segunda carreras para cada muestra replicada se representan frente a la otra. Las muestras de color por lotes (batch 1 repitieron como lote 10 - azul; lote 3, que se repite como lote 11 - rojo). Teniendo en cuenta entre-secuencia de diferencias que hay una buena correlación entre carreras repetidas.
Figura 2B muestra los resultados de PCA en los pares de lotes repetidos (1 y 10, 3 y 11), con muestras duplicadas unidos por una línea, representada frente a los dos primeros componentes principales. Las líneas son generalmente horizontal y paralela, una vez más lo que sugiere que la mayor fuente de variabilidad o las mayores diferencias generales en perfiles entre muestras (primer componente principal) se refiere a la variabilidad entre lotes, y que el orden de las muestras en el segundo componente principal, es decir, en la siguiente mayor fuente de variabilidad o diferencias globales entre las muestras, se encuentra en un fuerte acuerdo entre los lotes repetidos. Después de permitir que las diferencias consistentes entre lotes, por tanto, estos resultados confirman que las diferencias entre la muestra son reproducibles con el método utilizado.
Mientras que la Figura 2B compara resultados resumidos sobre todos los péptidos medidos, la figura 2C muestra los resultados de la ejecución repetida de una péptido ejemplo. Aunque existen grandes diferencias entre los lotes, dentro de cada lote existe una alta correlación entre las intensidades para el mismo tema en las tandas repetidas. De los 41 picos de péptidos expresados diferencialmente se utilizan para identificar las proteínas enumeradas en la Tabla 2, 25 (61%) muestran una correlación parcial después de eliminar el efecto de lote mayor que 0,8 y todos muestran una correlación parcial en exceso de 0,35.
claras diferencias en los patrones de péptidos y proteínas entre los casos y controles LDI
Los análisis posteriores destinadas a identificar péptidos y proteínas que efectivamente discrimina entre los casos y controles, por lo que rechazaron los casos fueron excluidos ahora. muestras repite en los lotes 10 y 11 fueron excluidos, y dadas las grandes diferencias entre los lotes identificados en los análisis exploratorios, también se excluyó el sujeto de control se mide en lote 10, dejando 43 casos confirmados de LDI y 122 controles con una medición de la muestra cada uno.
identificación de discriminar péptidos y proteínas.
Figura 3 muestra los resultados de la (péptido individual) univariado análisis utilizando análisis de covarianza (ANCOVA), se muestra como histogramas de los valores de p para la comparación entre los casos y controles. Teniendo en lote como una covariable análisis, para eliminar la variación entre lotes, aumenta sustancialmente la potencia del análisis, la identificación de aproximadamente el doble de muchos péptidos que muestran expresión diferencial estadísticamente significativa al nivel del 5%. S1 y S2, explorar y explicar esta relación en más detalle. Además la contabilidad de la orden de la hornada dentro de sólo disminuye ligeramente el número de péptidos significativos, lo que sugiere que cualquier efecto de orden dentro del lote es marginal y los intentos de modelar no va a aumentar el poder
.
La figura muestra el efecto sobre la distribución de los valores de p para la expresión diferencial de incluir la información de procesamiento de análisis y variables clínicas.
por otro lado, teniendo en cuenta las variables clave clínicos (estado [PS] OMS rendimiento, historia de tabaquismo, el alcance de la normalidad la cobertura de pulmón en la TC, y la gravedad de ILD preexistente) en el análisis reducen constantemente el número de péptidos se detectó como diferencialmente expresado, lo que refleja que gran parte de la información transportada en los péptidos más significativos es información duplicar llevado por las variables clínicas ( Figura 3). Figura S3 muestra un ejemplo de esto, donde los niveles más altos de péptido, una mayor puntuación de estado de funcionamiento y el estado del caso están asociados unos con otros, y gran parte del aumento de la intensidad de péptidos de los casos en comparación con los controles se puede explicar por su asociación con mayor puntuación estado funcional, por lo que la intensidad del péptido es la adición de mucha menos información cuando se considera en combinación con esta variable clínica.
con base en el valor de p, las 100 principales picos de ambos los análisis incluyendo y excluyendo las variables clínicas fueron identificado. Estos picos se restringieron posteriormente a 41 de acuerdo con los siguientes criterios: 1) tiempo de retención LC normalizada entre 5 y 75 min, y 2) análisis completo
m /z
valor del ion precursor entre 450 y 1.500. A continuación, se seleccionaron péptido identificaciones incluidos en los 41 picos de péptidos utilizando los siguientes criterios: 1) una mascota de iones puntuarán más que el valor umbral determinada identidad con la secuencia de aminoácidos del péptido individuo; y 2) & gt; 3 muestras con la identificación de péptidos correspondiente. Esto dio lugar a 45 péptido identificaciones válidas de 28 de los 41 picos, incluyendo dos péptidos de la lisozima de pinchos (Tabla S3). Los 43 péptidos derivados de plasma representados 27 identificaciones distintas con 2 identificaciones duales de proteínas estrechamente relacionadas, para un total de 29 proteínas. Estos se enumeran en la Tabla 2, con más detalle en relación con su identificación que se da en la Tabla S3.
respuesta de fase aguda identificado como una vía importante probabilidades de estar involucrados en los eventos agudos LDI
Este conjunto de proteínas a continuación, se utilizó en el análisis de la interpretación biológica, utilizando el sistema de Ingenuity Pathway Analysis (IPA). La vía más importante encontrado cuando se superponen las proteínas en las vías canónicas curada Ingenio fue la vía de señalización de la respuesta de fase aguda, con la que 17 de las 29 proteínas podría estar asociado (p = 1,0 × 10
-25). Otras vías que muestran un alto grado de sobreposición con la lista de proteínas incluyen las vías del complemento y de coagulación, pero los valores de p fueron menos significativo debido al menor número de proteínas implicadas (Figura 4).
Las vías más significativas de una análisis de la vinculación de los identificaron 29 proteínas del estudio a las vías curada en el sistema Ingenuity Pathway Analysis se muestran, ordenados de acuerdo a la relación entre el número de marcadores de proteínas que se pueden asociar con la vía y el número de proteínas en la vía.
Introducción de las 29 proteínas en IPA, se formaron 5 redes. La red más significativo contiene 24 de las 29 proteínas (Figura 5). Las proteínas añadidas a la red por la herramienta para conectar las proteínas marcadoras incluyen IL1 y NF-kappa B, lo que sugiere que estas proteínas también podrían estar involucrados en la generación del patrón observado. La combinación de las dos redes con las puntuaciones más altas añade, además, IL1-beta, HNF1A, HNF4A, HNF6 (ONECUT1), y CEBPB como componentes centrales (Figura S4).
Mayor red de puntuación genera la entrada de los identificaron 29 proteínas en el sistema Ingenuity Pathway Analysis, con las proteínas identificadas en el estudio sombreado gris y proteínas de unión identificados por no sombreada Ingenuity Pathway Analysis. Formas oscuras azules y líneas = proteínas identificadas como predictores en este estudio y las interacciones entre ellos. formas grises y líneas = proteínas identificadas por el ingenio para generar la red y las interacciones entre ellos. líneas de color azul claro = interacciones entre proteínas identificadas por el ingenio para generar la red y las proteínas identificadas en el estudio. Figura S4A muestra esta figura con las relaciones de interacción etiquetados. Las proteínas identificadas en el estudio e incluidos en la red: SERPINA1 = alfa-1-antitripsina; SERPINA3 = alfa-1-antiquimotripsina; SERPINC1 = antitrombina-III; APOA1 = apolipoproteína A-I; APOB = apolipoproteína B-100; APOC3 = apolipoproteína C-III; C3 = C3 del complemento; C4A, C4B = complemento C4-A; complementar C4-B; C9 = componente del complemento C9; GSN = gelsolina; HBA2 = alfa de hemoglobina; HBB, HBD = hemoglobina beta /delta; HP = haptoglobina; HPR = proteína relacionada con haptoglobina-; HRG = glicoproteína rica en histidina; KLKB1 calicreína plasmática =; región III-V de la cadena kappa IGKC = Ig Ti; RBP4, Rbp = proteína de unión a retinol 4; APCS = suero amiloide P-componente; TF = serotransferrin; TTR = transtiretina. Las proteínas identificadas en el estudio y no incluidos en la red: ORM1 = glicoproteína alfa-1-ácido 1; A1BG = alfa-1B-glicoproteína; LRG1 = rica en leucina alfa-2-glicoproteína; ARMC2 = armadillo proteína 2 de repetir que contienen; AHSG = alfa-2-HS-glicoproteína; ITIH4 = inhibidor de inter-alfa-tripsina H4 cadena pesada.
La validación de los datos de MS /MS muestra una buena reproducibilidad y razonable acuerdo con Western blot
Dentro de la plataforma MS /MS allí un fuerte acuerdo entre ejecuciones repetidas de las mismas muestras después de tener efectos lotes, como se describió anteriormente (Figura 2C).
Validar con otro método, la Tabla 2 muestra la correlación de la intensidad derivada de la MS /MS y occidental Blot (WB) para una selección de 9 proteínas. Teniendo en cuenta que el BM dirige a la proteína intacta, mientras que la presente MS /MS puede detectar péptidos derivados de las proteínas intactas, estos 9 proteínas muestran bastante fuerte nivel de acuerdo entre las tecnologías, con 6 de los 9 proteínas que exhiben una correlación superior a 0,7 . Diagramas de dispersión que comparan las intensidades de proteínas de MS /MS y WB se muestran en la Figura S5 y las imágenes BM en la figura S6.
Predicción del ILD utilizando proteínas y clínicos de datos
fenotipo de modelado basado en múltiples marcadores peptídicos .
Figura 6A muestra el poder predictivo basado en dejar uno de las cruzadas a cabo la validación de los modelos construidos usando una variedad de diferentes números de péptidos en combinación. mejoras sustanciales en la predicción al azar se obtuvieron de sólo unos pocos péptidos, y aumentar el número de péptidos más no mejoró sustancialmente las predicciones del modelo. El poder predictivo del modelo incluso disminuyó cuando se utiliza muy muchos péptidos.
(A) a partir de péptidos, para diferente número de péptidos incluidos en el modelo de predicción de proteómica, y (B) a partir de los datos clínicos, datos proteómicos y una combinación de los datos clínicos y proteómicos.
Por robustez, se compararon los métodos de modelización multivariante alternativos. Uso de los bosques aleatorios en lugar de mínimos cuadrados parciales análisis discriminante (PLS-DA) y de regresión logística en el marco de modelado produjo aproximadamente el mismo nivel de predicción como se evidencia por el área bajo la curva (detalles no mostrados).
Un subgrupo análisis de restricción del conjunto de los casos a los que tienen el patrón ILD aguda DAD (20 de los 43 casos) se vio obstaculizado por el tamaño pequeño de la muestra y fue incapaz de mejorar la capacidad de predicción global.
fenotipo de modelado basado en múltiples marcadores peptídicos y los datos clínicos.
Figura 6B compara el poder predictivo, basado en la licencia-un-out validación cruzada, para los modelos construidos en los datos clínicos /radiológicos solos utilizando una regresión logística, datos péptido solo, y una combinación. Ambos tipos de datos solo proporcionan predicción similar. Algunas mejoras se obtuvo mediante la combinación de los dos tipos de datos, pero era mucho menos que aditivo. Esto es consistente con los resultados del análisis de péptidos individuales, lo que sugiere que los péptidos que discriminan llevan en parte información disponible también de las variables clínicas /radiológicos.
Modelado de fenotipos a base de proteínas y los datos clínicos.
Figura 7 muestra los valores de p para distinguir los casos y los controles obtenidos a partir de las proteínas (es decir, la puntuación péptido constituyente combinado), todos sus péptidos constituyentes, y la medida de la intensidad vía de fase aguda combinada (es decir, la puntuación combinada de los 16 incluye proteínas constituyentes) . Para la mayoría de las proteínas, la intensidad de proteína estimada es más importante que la mayor parte de las intensidades de péptidos medidos asociados con esa proteína, pero sólo mejora sobre el significado de los mejores péptidos para unas pocas proteínas. A medida que se obtuvieron estos resultados dentro del mismo conjunto de datos que se utilizó para identificar y seleccionar los péptidos constituyentes, algunos exceso de montaje podría estar ocurriendo, y la intensidad de la expresión de proteínas que incorpora información de muchos péptidos puede ser una medida más fuerte para aplicarla en un contexto más amplio . La medida de intensidad vía de fase aguda combinado muestra una respuesta más importante que cualquiera de las proteínas constituyentes. Un cuadro similar se obtiene si tenemos en cuenta la información adicional proporcionada por las medidas de péptidos, proteínas y las vías en la parte superior de las variables clínicas conocidas en la predicción del estado de ILD (Figura S7).
valores de p para las proteínas se muestran por las estrellas rojas, los valores de p para los péptidos individuales se muestran por puntos, y la distribución de estos para cada proteína se muestra mediante el gráfico de cajas. En cada diagrama de caja, los lados superior e inferior de la caja representan los valores cuartiles superiores e inferiores (Q3 y Q1), respectivamente. La barra de negro en cada cuadro representa el valor de la mediana. El valor de p para la vía de fase aguda está representado por la línea discontinua; diagramas de caja para las proteínas en la vía de respuesta de fase aguda están sombreados. A1AG1 = glicoproteína alfa-1-ácido 1; A1AT = alfa-1-antitripsina; A1BG = alfa-1B-glicoproteína; A2GL = rica en leucina alfa-2-glicoproteína; AACT = alfa-1-antiquimotripsina; ANT3 = antitrombina-III; APOA1 = apolipoproteína A-I; APOB = apolipoproteína B-100; APOC3 = apolipoproteína C-III; ARMC2 = armadillo proteína 2 de repetir que contienen; CO3 = C3 del complemento; CO4 = complementar C4-A; complementar C4-B; CO9 = componente del complemento C9; FETUA = alfa-2-HS-glicoproteína; GELES = gelsolina; HBA = alfa de hemoglobina; HBB, HBD = hemoglobina beta /delta; HPT = haptoglobina; HPTR = proteína relacionada con haptoglobina-; HRG = glicoproteína rica en histidina; ITIH4 = inhibidor de inter-alfa-tripsina H4 cadena pesada; KLKB1 calicreína plasmática =; región III-V de la cadena kappa KV3 = Ig Ti; RETBP = proteína de unión a retinol 4; SAMP = suero amiloide P-componente; TrFE = serotransferrin; TTHY = transtiretina.
Figura 8A muestra la intensidad de la vía de respuesta de fase aguda representa frente a una puntuación clínica variable combinada medir la probabilidad de que un sujeto es un caso calculada a partir de una regresión logística de casos y controles en contra de la variables clínicas de la OMS PS, historia de tabaquismo, la extensión de la cobertura pulmonar normal en la TC, y la gravedad de la EPI preexistente. Esta muestra ambas fuentes de información que contribuye a la predicción de resultados ILD, aunque estas dos medidas están bastante fuertemente correlacionadas, de modo que mucha de la información se duplica. Figura 8B considera las implicaciones para la predicción de ILD, mostrando las curvas características de funcionamiento del receptor (ROC) para las variables clínicas, la intensidad vía de fase aguda, y la combinación de las dos fuentes de información. Esto muestra niveles comparables de poder predictivo de las variables clínicas y las intensidades de la vía de fase aguda, y algún beneficio potencial de la combinación de ellos juntos, lo que, sin embargo, es limitado, lo que refleja su correlación.
(A) Parcela de la fase aguda la intensidad de la respuesta frente a la puntuación clínica variable combinada medir la probabilidad de que un sujeto que está siendo un caso calcula a partir de un modelo de predicción de la condición de caso-control basado únicamente en las variables clínicas de la OMS PS, historia de tabaquismo, la extensión de la cobertura pulmonar normal en la TC, y la gravedad de ILD preexistente, con gráficos de caja comparación de la distribución de estas medidas en los casos y controles. En cada diagrama de caja, los lados superior /inferior derecha y /izquierda del cuadro representan los valores cuartiles superiores e inferiores (Q3 y Q1), respectivamente. La barra de negro en cada cuadro representa el valor de la mediana. características (B) Curva de eficacia diagnóstica de las predicciones con validación cruzada de los datos clínicos, la intensidad de la respuesta de fase aguda y una combinación de los datos clínicos y la intensidad de la respuesta de fase aguda.
Discusión
presentamos aquí los resultados de un análisis proteómico aplica a un estudio farmacoepidemiológico a gran escala y demostrar que con una considerable atención al diseño del estudio y procedimientos experimentales a lo largo de todo el proceso necesario para generar datos de alta calidad, es posible derivar un conocimiento valioso, tanto desde el científica y una perspectiva de diagnóstico. Sin embargo, hay numerosas fuentes potenciales de variación de los datos y el sesgo en este proceso. La integridad de todos los pasos del proceso es fundamental para la generación de datos y la falta de utilidad para garantizar una alta calidad en cualquiera de ellos puede poner en peligro la validez y el valor de todo el estudio.
Aspectos metodológicos
diseño del estudio y preparación de la muestra.
Hemos aplicado el fenotipo cuidadosa crítica de diagnóstico cegado para asegurar un diagnóstico exacto ILD, y medidas para garantizar que serían capturados todos los casos de ILD se producen en la cohorte de fuente incorporados. Los controles fueron seleccionados de la población real de la generación de los casos, lo que garantiza la comparabilidad entre los casos y controles, para que contraste visible se atribuye al estado del caso. Las tasas de participación fueron altas (& gt; 90%) y similar para los casos y los controles [3], lo que hace poco probable que el sesgo de selección. proteómica muestras se obtuvieron después de consentimiento informado separada de aproximadamente la mitad de todos los casos y los controles tratados con gefitinib. Medidas para garantizar que los datos proteómicos de alta calidad para nuestra investigación epidemiológica a gran escala incluyen la asignación al azar de las muestras procesadas, una cuidadosa evaluación de la calidad de la preparación de muestras y protocolos de preparación optimizados para garantizar la estabilidad en todos los procedimientos para un gran número de muestras. Hemos descrito previamente la estrategia general que hemos decidido utilizar en el estudio basado en una serie de rondas de la fase piloto experimentales [14].
efectos lotes experimentales de medición.
Dos dimensiones-gel de poliacrilamida La electroforesis es una tecnología común convencional que se utiliza para el análisis de proteínas en el suero /plasma [15], [16]. Actualmente, LC-MS /MS se ha convertido en ampliamente aceptada para alta resolución a nivel de perfiles proteoma de una mezcla de péptidos compleja [17]. Los avances recientes en esta metodología, incluyendo la mejora de la estabilidad de la separación de péptidos y de detección ha permitido comparación de la intensidad de iones entre los perfiles de LC-MS /MS [18]. Nuestro sistema de análisis de proteómica aplicada LC-MS /MS después de la depleción de inmunoafinidad de las más abundantes proteínas constituyentes en el plasma sanguíneo, y el tratamiento de la enzima proteolítica de la muestra de plasma empobrecido.
Se identificó que la LC-MS /MS proceso de medición tiene errores de medición sistemáticos, como era de esperar, que habíamos tomado medidas para eliminar mediante la introducción de procesamiento por lotes con el control de calidad, el diseño de la orden de procesamiento de la muestra para minimizar los efectos de los errores sistemáticos, y luego eliminar los efectos de lotes en el análisis estadístico. La consideración de los efectos de lotes en el análisis estadístico pareció mejorar el proceso de detección de picos exigentes, y por lo tanto nos basamos nuestra última etapa de identificación de proteínas en este enfoque de análisis
algoritmos de alineación -. Guiada interna estándar perfil óptimo de alineación ( i-OPAL)
con el fin de hacer posible la cuantificación comparativa entre muestras, las mediciones de las muestras tienen que ser alineados -. es decir, la correspondencia de las señales de iones debe ser identificado. Se han propuesto varios métodos para esto, por ejemplo, basado en isótopos estables de etiquetado [19] - [21], utilizando la identificación comparativa [22], [23], o con la comparación directa de las respectivas señales de iones de péptido [18]. El método i-OPAL pertenece a la última categoría. A pesar de la resolución relativamente baja precisión y la masa de
m /z
medición, el instrumento de tipo MS-trampa de iones permite una medición estable a largo plazo sin realizar ninguna operación de calibración [24], [25]. En consecuencia, el
m /z
valores son comparables directamente en una amplia serie de muestras sin mayores transformaciones.
hallazgos biológicos e implicaciones
mecanismos biológicos potenciales eventos agudos LDI subyacentes.
En nuestro mapeo IPA a las vías biológicas canónicas, proteínas de fase aguda salió como la señal más fuerte, seguido de las vías del complemento y de coagulación.