Extracto
Antecedentes
Informes recientes indican que
in vitro
drogas pantallas combinadas con perfiles de expresión génica (GEP) de líneas celulares de cáncer pueden generar firmas informativos que predicen el resultado clínico de la quimioterapia. En el mieloma múltiple (MM) una gama de nuevos fármacos se han introducido y ahora desafiar a la terapia convencional, incluyendo altas dosis de melfalán. En consecuencia, la generación de firmas predictivos de respuesta a melfalán puede tener un impacto clínico. La hipótesis es que las pantallas de melfalán y GEPs de líneas celulares de cáncer de células B en combinación con estadísticas multivariantes pueden proporcionar información clínica predictivo.
Materiales y Métodos
GEPs basado microarrays y una pantalla de inhibición del crecimiento de melfalán 59 líneas celulares de cáncer fueron descargados de la base de datos del Instituto Nacional del cáncer. datos equivalentes se generaron durante 18 líneas celulares de cáncer de células B. análisis discriminante lineal (LDA), se utilizaron los mínimos cuadrados parciales dispersas (SPL) y comparaciones por pares de línea celular de datos para construir firmas de resistencia de ambos paneles de líneas celulares. Un índice de resistencia a melfalán se definió y calculó para cada paciente MM en un conjunto de datos clínicos disponibles públicamente establecidos y evaluados a posteriori por riesgos proporcionales de Cox y el análisis de supervivencia de Kaplan-Meier.
Principales conclusiones
Tanto la línea celular paneles realizados bien con respecto a la validación interna del enfoque SPLS pero sólo el panel de células B fue capaz de predecir un riesgo significativamente mayor de recaída y muerte con el aumento de índice de resistencia en los conjuntos de datos clínicos. Las líneas celulares más sensibles y resistentes, MOLP-2 y RPMI-8226 LR5, respectivamente, tuvieron un alto apalancamiento, lo que sugiere que sus genes expresados diferencialmente que poseen valor predictivo importante.
Conclusión
La presente estudio presenta un índice de resistencia a melfalán generada por análisis de un panel de células B de líneas celulares de cáncer. Sin embargo, el índice de resistencia necesita ser validado y funcionalmente correlacionados con biomarcadores MM conocidos en conjuntos de datos independientes con el fin de comprender mejor el mecanismo que subyace a la preparación para la resistencia melfalán
Visto:. Boegsted M, Holst JM, Fogd K , Falgreen S, Sørensen S, Schmitz A, et al. (2011) Generación de un Indice de resistencia melfalán predictivo de detección de drogas de líneas celulares de cáncer de células B. PLoS ONE 6 (4): e19322. doi: 10.1371 /journal.pone.0019322
Editor: Venugopalan Cheriyath, Clínica de Cleveland, Estados Unidos de América
Recibido: 2 Julio, 2010; Aceptado: April 1, 2011; Publicado: 29 Abril 2011
Derechos de Autor © 2011 Boegsted et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. La investigación con el apoyo de MSCNET, un programa de traslación estudio de las células madre del cáncer de mieloma múltiple apoyado por la Unión Europea FP6 y Chepre, un programa de estudio de quimiosensibilidad en el linfoma maligno por firmas genómicas con el apoyo de la Agencia danesa para la Ciencia, Tecnología e Innovación, así como Det Obelske Familiefond y Karen Elise Jensen Fonden. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
el agente de alquilación, melfalán, es la columna vertebral de la terapia actual en MM. Desde los años 1990, melfalán se ha usado en la terapia de dosis alta (HDT) seguido de trasplante autólogo de células madre (ASCT) [1], y, como tal, mejora la tasa de respuesta, así como evento prolongada supervivencia libre (EFS) y la supervivencia global ( OS) [2]. A pesar de que los últimos años se ha producido una mejora considerable, la supervivencia global sigue siendo pésimo y la enfermedad se considera incurable - principalmente debido a una enfermedad resistente al tratamiento inicial o de la resistencia inducida que resulta en una recaída de la enfermedad. enfermedad resistente al tratamiento y la recaída temprana se considera asociados con el desarrollo de la resistencia a melfalán que es un fenómeno complejo que no está completamente entendido [3]. Una posible estrategia para mejorar el conocimiento acerca de la resistencia es el uso combinado de nuevas tecnologías, incluyendo GEP y de detección de drogas en un modelo de línea celular de cáncer de células B malignas preclínica [4].
La idea fundamental de los estudios recientes sobre el resistencia a los medicamentos ha sido categorizar líneas celulares en grupos sensibles, resistentes e intermedias en base a experimentos de respuesta a la dosis del fármaco y, posteriormente, para generar un clasificador genética o la firma con base en el análisis de microarrays. Los datos disponibles públicamente desde el panel de línea celular NCI60 generada por el Instituto Nacional del Cáncer (NCI) han sido ampliamente utilizadas en este tipo de estudios para varios tipos de cáncer y los regímenes de tratamiento. Sin embargo, el enfoque sigue siendo controvertida [5], [6]. Varios autores han argumentado que el rendimiento podría ser mejorado por un panel de líneas celulares específicas. Este enfoque fue utilizado por Lee et al. [7] y Liedtke et al. [8] para los tumores de vejiga y cáncer de mama, respectivamente. El enfoque de éxito de Lee et al. [7] se basó en la selección de las expresiones de genes para las líneas de células específicas de órganos que se correlacionan con la expresión de genes en material del paciente antes de desarrollar su clasificador mediante un algoritmo de clasificación errónea posterior-penalizado. Sin embargo, Liedtke et al. [8] fueron incapaces de predecir el resultado de la respuesta de la quimioterapia con un enfoque basado en el análisis discriminante lineal diagonal (DLDA) para la clasificación.
El concepto de este estudio es que la resistencia melfalán en MM puede ser estudiado en una modelo preclínico de líneas celulares de cáncer de células B malignas mediante la combinación de las pantallas de drogas y GEPs y generar una firma gen de resistencia, que clínicamente puede ser validada por la predicción del resultado de tumores analizados antes de melfalán de dosis alta y ASCT. Esta estrategia implica la generación de datos intensivos en el laboratorio y se logró mediante el uso de la gestión de datos y análisis estadístico avanzado [5], [6]. En el presente estudio, hemos puesto en marcha por la reproducibilidad de secuencias de comandos todo el flujo de análisis de datos en R y Bioconductor.
En resumen, los objetivos específicos de este estudio fueron desarrollar un índice gen de resistencia a melfalán por el uso de 1) la a disposición del público panel de línea celular NCI60 o 2) un panel de líneas celulares de cáncer de células B y 3) apoyar el concepto aunque microarrays disponibles "on-line" y conjunto de datos clínicos de los pacientes con MM tratados con melfalán doble dosis alta [9].
Materiales y Métodos
La línea celular NCI60 Panel
El método de pantalla de línea celular NCI60 es desarrollado por el NCI y sirve para detectar un gran número de sustancias para la actividad citotóxica. El panel se compone de 59 líneas celulares derivadas de los tipos de cáncer distintos [10], [11]. Los datos de expresión de genes y datos de sensibilidad quimioterapia están disponibles al público. Para obtener más información, consulte la sección de información en línea a continuación. En el presente estudio se utilizó el IG
50 valor como se define por el NCI [12].
Cáncer de células B Líneas celulares y condiciones de cultivo
El panel BCell constaba de 13 células MM líneas, 1 plasmocitoma línea (PC) de células y 4 difusa líneas celulares grandes linfoma de células B (DLBCL). Las líneas celulares se cultivaron en condiciones estándar a 37 ° C; en una atmósfera humidificada de 95% de aire /5% de CO
2 con el medio apropiado, suero fetal bovino (FBS) y 1% de penicilina /estreptomicina adición. Véase la Tabla S1. Las líneas celulares se mantuvieron durante un máximo de 20 pasajes para minimizar cualquier efecto de cultivo a largo plazo. Penicilina /estreptomicina 1%, RPMI1640, IMDM y FBS se adquirieron de Invitrogen. Las líneas celulares KMM-1 y KMS-11 se obtuvieron a partir JCRB (Colección japonesa de Recursos Biológicos de investigación), y KMS-12-PE, KMS-12-BM, LP-1, MM1S, MOLP-2, MOLP-8, el NCI -H929, OPM-2, RPMI-8226, T-266, AMO-1, DB, HT y SU-DHL-4 de DSMZ (Deutsche Sammlung von Mikroorganismen und Cultivos Celulares). La línea celular MM1S fue proporcionada por Steven T. Rosen [13], RPMI-8226 LR5 por William S. Dalton [14] y la OCI-LY7 por Hans Messner [15].
Experimentos melfalán de dosis de respuesta
el número de células en el cultivo se determina por medidas de absorbancia (reactivo Solución CellTiter 96 Aqueous One, Promega) tal como se describe por el fabricante. La relación lineal entre la absorbancia y la celda número se obtuvo por las células sembradas en placas de 96 pocillos con el medio apropiado a concentraciones que oscilan entre 15-60000 células /pocillo. Las líneas de células 18 se incubaron durante 24 horas antes de la adición de 18 concentraciones crecientes de melfalán en triplicado. Todos los pozos fueron sembrados con células, pero los efectos de frontera se habían eludido mediante la inclusión de los pozos no fronterizos sólo para el análisis. El melfalán se resolvió en etanol resultando en una concentración final de etanol de 0,06% en el medio. El número relativo de células se midió 48 horas después de la adición de melfalán usando el reactivo CellTiter y Optima-Fluostar (BMG LABTECH) a 492 nm. Para lograr una alta reproducibilidad, todo el experimento se repitió al menos dos veces la utilización de nuevas poblaciones de congelación de las líneas de células individuales.
Análisis de microarrays ARN
Todas las BPA se realizaron utilizando la plataforma Affymetrix microarrays y procedimientos estándar . El ARN total se extrajo usando reactivo Trizol Invitrogen combinado con Qiagen RNeasy Mini kit. La calidad fue verificada por Agilent 2100 Bioanalyzer. Las muestras se prepararon para la hibridación de Affymetrix GeneChip HG-U133 Plus 2,0 arrays después de las instrucciones del fabricante y CEL archivos fueron generados por Affymetrix GeneChip de comandos del software de la consola (AGCC) y se depositan en el Omnibus (GEO) repositorio NCBI Gene Expression. Los datos cumplen con los requisitos de ser compatible con MIAME. Para obtener más información, consulte la sección de información en línea.
Arkansas y Hummel cohortes de pacientes con DLBCL MM y
datos de expresión génica, EFS, y utilizar los datos de 565 pacientes diagnosticados de MM evolutivos o sintomáticos son disponible públicamente. Para obtener más información, consulte la sección de información en línea. El conjunto de datos se conoce como los "datos de Arkansas" [16]. Los pacientes fueron reclutados por el Instituto de mieloma para la Investigación y Terapia de la Universidad de Arkansas, Facultad de Ciencias Médicas, y eran parte de un estudio más amplio con el fin de investigar si la talidomida en combinación con HDT puede prolongar la supervivencia entre los pacientes con MM [9 ]. Los 565 pacientes fueron tratados de acuerdo a la terapia total de dos (TT2) o la terapia total de tres (TT3) protocolo que incluye melfalán doble de dosis alta y TACM.
El conjunto de datos conocidos como los "datos de Hummel" [17] fue utilizado en el presente estudio para probar la especificidad de la índice de resistencia identificado. Los 87 pacientes fueron diagnosticados con DLBCL y recibieron un (ciclofosfamida, doxorrubicina, vincristina y prednisona) el tratamiento de inducción CHOP. están a disposición del público la expresión génica y de datos, así OS (para más información, véase la Sección de Información en Línea).
Análisis estadístico
La documentación completa del análisis estadístico es proporcionado por un documento Sweave, consulte texto S1. Sweave es una característica en el lenguaje de programación R estadístico que permite la integración de código R en látex y con ello se realiza un análisis de datos reproducibles y la investigación [18]. Todos los análisis estadísticos se realizaron con R [19] versión 2.12.1 y un número de Bioconductor [20] paquetes. Información detallada de la sesión está contenida en el texto S1.
Análisis melfalán Respuesta a la dosis.
Los valores de absorbancia se originan a partir de los experimentos de respuesta a la dosis se corrigieron fondo y un promedio de más repeticiones. Las posibles valores atípicos entre las concentraciones de células se eliminaron por triplicado prueba de Grubbs "[21] (aproximadamente el 0,5%, véase el texto S1). curvas de inhibición de crecimiento relativo se calcularon para cada concentración en relación con el control sin tratar, después de lo se modeló una curva de crecimiento lineal a trozos. A través de la inspección visual, cinco valores extremos fueron retirados (Figura S1). El GI
50 valores de las líneas de células en el panel de BCell se define como el primer punto en que la curva de crecimiento cae por debajo del nivel de 50%. Los datos fueron promediados sobre las mediciones de la línea de células replicadas para realizar este análisis. La incertidumbre de la IG
50 valores se evaluó mediante el sub-muestreo de los pozos replicados con el reemplazo y un nuevo cálculo de toda la GI
50 valores 200 veces. El logaritmo de 10 veces de la GI
50 valores se transformó en el registro
10 M-escala para ambos paneles de líneas celulares y se usa como índice de resistencia a melfalán - en lo que sigue denota el índice NCI60 y el índice de BCell, respectivamente . Como un medio para distinguir entre los sujetos sensibles, intermedias y resistentes a las líneas celulares (o individuos) en una población, se optó por el criterio de Havaleshko et al. [22], donde un sujeto es resistente si su índice de resistencia excede el 75 percentil de la población. Del mismo modo, definimos un sujeto a ser sensible si su índice de resistencia fue menor que el 25 percentil de la población. Los sujetos restantes se caracterizan por tener una resistencia intermedia.
Microarray Pre-procesamiento.
Los archivos CEL-BCell y los NCI60 CEL-archivos descargados se corrigieron fondo y normalizado por las justas. RMA función del paquete affy. Todas las matrices se normalizaron RMA-pasaron el control de la calidad estadística proporcionada por los arrayQualityMetrics función en el arrayQualityMetrics R-paquete [23]. Como se analizó el panel NCI60 en la matriz de HG-U133A y BCell en el 2,0 array HG-U133 Plus, foco estaba en las sondas solamente presentes en la matriz de HG-U133A. Los datos de Arkansas también con corrección de fondo y se normalizaron con just.rma.
Expresiones diferencial.
Después de la filtración no específica de los datos de expresión génica, las líneas celulares fueron clasificados como resistentes, intermedios o sensibles de acuerdo con su IG
50 valores. Las transcripciones que expresaban diferencias significativas entre los grupos de las líneas celulares más sensibles y más resistentes se determinaron mediante pruebas F moderados como se aplica en el paquete limma Bioconductor [24]. Se consideró que los genes con un valor de p inferior a 0,05 para tener un valor predictivo. Los valores de P fueron elegidos deliberadamente en lugar de tasas de falso descubrimiento ya que el objetivo era construir un clasificador de resistencia y no para detectar los genes expresados diferencialmente. Los genes expresados diferencialmente se escala para tener una media cero y desviación estándar. Un clasificador fue construido por los genes escala y el análisis discriminante lineal (LDA) tal como se aplican en el paquete R-SDA [25]. Para evitar dificultades invirtiendo grandes matrices de covarianza, se eligió un máximo de 400 genes en SDA.
multivariado de regresión.
Los genes se filtran de acuerdo con la detección segura de la independencia (SIS), es decir, todos los genes eran ordenadas de acuerdo con el coeficiente de correlación de Pearson entre la expresión génica y el índice de resistencia. Todos los genes, para los que el valor P de la prueba de correlación de cero era superior a 0,05, se consideraron para la reducción de la dimensionalidad por SPLS [26]. Para obtener escasez, SPLS penaliza a los vectores de entrada transformadas al obligar a los pequeños coeficientes a ser cero. La formulación SPLS pura contiene cuatro parámetros de ajuste, sin embargo, de acuerdo con Chun et al. [26], un simple formulación de regresión SPLS, que sólo depende de un parámetro
η
, es el control de la escasez de la solución y el número de componentes ocultos
K
. Para determinadas opciones del parámetro de regularización
η
y los componentes ocultos
K Francia El rendimiento fue evaluada por la licencia-un-a cabo las validaciones cruzadas. La configuración óptima de los parámetros fue elegido para ser el conjunto que minimiza el error de predicción cuadrático medio (MSPE). Una vez que los parámetros óptimos se han elegido internamente de las líneas celulares, el índice de resistencia se puede predecir para los sujetos a través de una combinación lineal de las expresiones de genes a escala con los coeficientes estimados por SPLS [27]. El análisis SPLS y las predicciones se realizan con los niveles de presión sonora R-paquete proporcionados por Chun et al. [26].
Filtrado independiente.
Es bien sabido que el filtrado independiente aumenta la potencia de detección de alto rendimiento experimentos [28]. Para investigar si el filtrado independiente aumentaría la precisión y error de predicción, un filtrado inespecífica, dejando de lado los genes con una baja variación en las expresiones de genes y NCI60 BCell, se llevaron a cabo con la nsFilter función del paquete genefilter Bioconductor. Los valores de corte variaron entre 0% y 100% y elegimos el valor de corte, que ha obtenido mejores resultados con respecto a la precisión de validación cruzada para la LDA y MSPE para SPLS. Con el fin de investigar si algún poder predictivo se mantuvo después de la filtración, la validación cruzada se realizó para los parámetros elegidos.
análisis de supervivencia.
análisis de supervivencia, la prueba del rango logarítmico y de riesgos proporcionales de Cox modelos de Kaplan-Meier se calcularon con las funciones de la survfit R-paquete. Una relación no lineal entre la respuesta predicha a tratamiento y el índice de resistencia se observó y la relación se estimó por splines cúbicos restringidos (RCS) por medio de la Diseño R-paquete [29]. El nivel de significación se fijó a 0,05 y las razones de riesgo (HR) se dan con intervalos de confianza del 95%.
Información en línea para
Los detalles sobre la información requerida y depositado en línea se describen a continuación.
La expresión génica de datos BCell.
CEL archivos para los microarrays de línea celular 18 se han depositado en http://www.ncbi.nlm.nih.gov/geo/bajo GEO adhesión número GSE22759. Los datos cumplen los requisitos para ser compatible con MIAME
La expresión génica de datos NCI60
CEL-archivos para los microarrays de líneas celulares NCI60 fueron descargados de http:.. //www.ncbi.nlm .nih.gov /geo /GEO bajo el número de acceso GSE5720 al seleccionar el subconjunto de los datos procedentes de la matriz HG-U133A. se utiliza en la presente A21 réplica estudio - La línea celular IGROV1 se proporciona en dublicates. Los datos cumplen los requisitos para ser compatible con MIAME. Nótese que hemos renormalizado los CEL archivos como se describe en los Materiales y Métodos sección.
Los Datos NCI60 DTP.
Se obtuvieron los datos de frecuencia de líneas de células tumorales humanas DTP (agosto de 2008) de liberación mediante la descarga de los archivos cancer60gi50.lis desde el sitio web: http://dtp.nci.nih.gov/docs/cancer/cancer_data.html. Las partes de la secuencia de comandos para la extracción de la respuesta al fármaco NCI60 han sido desarrollados por Kevin Coombes y Keith Baggerly y pueden ser descargados desde el sitio web http://bioinformatics.mdanderson.org/Supplements/ReproRsch-Chemo/.
El Arkansas expresión de genes y los datos clínicos.
archivos
CEL para los datos de expresión génica y la información clínica están disponibles en http://www.ncbi.nlm.nih.gov/geo/bajo el número de acceso GEO GSE24080. Los datos cumplen los requisitos para ser compatible con MIAME. Los CEL archivos están renormalizado como se describe en los Materiales y Métodos sección
La Expresión Génica Hummel y los datos clínicos
CEL archivos e información clínica están disponibles en http:.. //Www. ncbi.nlm.nih.gov/geo/bajo el número de acceso GEO GSE4475. Los datos cumplen los requisitos para ser compatible con MIAME. Los CEL archivos están renormalizado como se describe en los Materiales y Métodos sección.
Resultados
El Índice de Resistencia Panel NCI60
En un breve resumen, se descargaron los datos de respuesta a la dosis de melfalán . Un gráfico de los datos se ve en la Figura S2. Las líneas celulares mostraron 59 GI
50 valores que van -5,77 a -3,99 en el registro
10 M /ml escala -. La línea más sensible a ser SR y la línea celular A498 más resistentes siendo
el desarrollo de la B-célula índice de resistencia
dosis respuesta de los experimentos se llevaron a cabo, y las parcelas de los datos, así como curvas ajustadas se ilustra en la Figura 1A. Las líneas celulares mostraron 18 GI
50 valores que van -6,02 a -4,13 en el registro
10 M /ml escala - la línea más sensible a ser MOLP-2 y la línea de células más resistentes siendo RPMI-8226 LR5 . Figura 1B muestra los diagramas de caja de la media GI
50 valor a partir de curvas de dosis-respuesta re-muestreados para todas las 18 líneas celulares de cáncer de células B. Como no se detectó ninguna distinción clara entre un grupo resistente y sensible de líneas celulares, el 25% /50% /25% de división se describe en los Materiales y Métodos sección se eligió, es decir, las cinco líneas celulares con el IG más bajo
50 valores denotado fueron sensibles y las cinco líneas celulares con el más alto GI
50 valores se denotan resistentes.
A) de media curvas de dosis-respuesta para cada línea celular. B) Diagrama de cajas de 200 GI resampled
50 valores para cada línea celular. Las líneas celulares se clasifican de acuerdo a su IG estimada
50 valor.
Clasificador Sobre la base de LDA
En el panel NCI60, un clasificador basado LDA se construyó como se indica en el la sección de materiales y Métodos, para más detalles véase el texto S1. El clasificador basado LDA mostró una pobre validación interna (Figura S3). La precisión óptima (determinada por la licencia-un-out validación cruzada) de 0,6 se obtuvo para el panel BCell a una velocidad de filtración de 0,95, en cuyo caso la prueba F moderado dio 159 genes (Tabla S2). LDA se utiliza para combinar los 159 genes para desarrollar un clasificador. El clasificador mostró que el 60% de precisión global de una sola licencia fuera de validación cruzada para las líneas celulares a partir del cual se desarrolló.
Cross-validación del modelo SPLS
Después de las etapas de filtrado inespecíficos fueron alcanzado, SPLS se utilizó para lograr filtrado específico. Con el fin de evitar el exceso de ajuste y de ruido genes que contribuyen, el número de componentes y probesets ocultos fueron elegidos por dejar uno de las cruzadas a cabo la validación. El número óptimo de componentes y probesets se encontraron en los valores en que se alcanzó el mínimo MSPE. Para el panel NCI60, se observó una validación interna razonable (Figura S4). Para el panel BCell, dos componentes ocultos y 19 probesets siempre la mejor MSPE (Figura S5). La influencia de una sola línea celular en el modelo de predicción fue investigado por el trazado del valor de resistencia predicho procedente de la licencia-un-out-validación cruzada frente al índice de resistencia medido (Figura S6). Las líneas celulares más sensibles y resistentes MOLP-2 y RPMI-8226 LR5, respectivamente, resultaron ser puntos de apalancamiento altos.
Estabilidad Evaluación
Para ver cómo regresión SPLS hace frente a ruido, la Panel BCell se utilizó para seleccionar 20 probesets al azar entre los 100 probesets con la asociación marginal más alta (valor absoluto del coeficiente de correlación de Pearson) con el índice de resistencia. A fin de mantener la estructura de dependencia entre los probesets intacta, estos fueron perturbados todo al azar, a excepción de los 20 probesets. Los coeficientes de las probesets se muestran como una función del parámetro de regularización
η
en la Figura S7. Para este ejemplo, el número óptimo de componentes mínimos cuadrados parciales dispersas era
K = página 3 y el parámetro de regularización óptimo fue
η = 0,83
. Once probesets fueron elegidos, lo que demuestra una sensibilidad media del 55%, una especificidad del 99% y una tasa de falso descubrimiento del 63%. El experimento se repitió 100 veces y dio en medio de una sensibilidad del 54%, una especificidad del 99% y una tasa de falso descubrimiento del 67%.
Comparación de las líneas celulares más sensibles y resistentes
Debido a la gran influencia de la línea celular más sensible, MOLP-2, y la línea de células más resistentes, se hizo RPMI-8226 LR5, una comparación directa de estas dos líneas celulares. Esto se hizo mediante la clasificación de los genes de acuerdo con su diferencia absoluta en la expresión génica y la elección de (arbitrariamente) los 100 genes con las más altas expresiones diferenciales absolutos. Un índice de resistencia de predicción se construye tomando la diferencia en la expresión de los genes como el peso. Los genes y sus pesos se muestran en la información de apoyo (Tabla S3).
Validación externa en muestras clínicas
SSC y la SG fueron elegidos como puntos finales con la hipótesis de que la resistencia a melfalán se correlaciona con estos puntos finales. Para los paneles NCI60 y BCell, los modelos de LDA y niveles de presión sonora, así como el modelo que consiste en las dos líneas celulares influyentes en el panel BCell fueron utilizados para estimar el índice de resistencia melfalán para cada uno de los pacientes de Arkansas.
Para las predicciones basadas LDA basados en el panel NCI60 se observó ninguna diferencia significativa con respecto al sistema operativo y EFS para los grupos sensibles, intermedios y resistentes predichos de pacientes (Figura S8 y S9). Para las predicciones basadas NCI60 y SPLS no se encontraron diferencias significativas para los grupos sensibles, intermedias y resistentes previstos, así como el registro predicho riesgo relativo de sistema operativo y EFS de los datos de los pacientes Arkansas. Véase la Figura 2A y C y Figura 3A y C, respectivamente.
Curvas de supervivencia
A) Kaplan Meier en base a NCI60. B) curvas de supervivencia de Kaplan Meier basado en BCell.