Extracto
El cáncer y las células sanas tienen distintas distribuciones de propiedades moleculares y por lo tanto responden de manera diferente a los medicamentos. medicamentos contra el cáncer idealmente matan las células cancerosas al tiempo que limita el daño a las células sanas. Sin embargo, la varianza inherente entre las células, tanto en las poblaciones de células sanas cáncer y aumenta la dificultad de la acción del fármaco selectivo. Aquí formalizamos un marco de clasificación basado en la idea de que un fármaco contra el cáncer ideal debe discriminar al máximo entre el cáncer y las células sanas. Más específicamente, esta discriminación debe realizarse sobre la base de marcadores de células medibles. Dividimos el problema en tres partes, que exploramos con ejemplos. Primeros marcadores moleculares, deben discriminar las células cancerosas de las células sanas a nivel de una sola célula. En segundo lugar, los efectos de las drogas deben ser estadísticamente predichas por estos marcadores moleculares. En tercer lugar, los medicamentos deben ser optimizados para un rendimiento de clasificación. Encontramos que los niveles de expresión de un puñado de genes suficientes para discriminar bien entre las células individuales en el cáncer y tejido sano. También encontramos que la expresión del gen predice la eficacia de algunos medicamentos contra el cáncer, lo que sugiere que estos fármacos para el cáncer actúan como clasificadores subóptimas utilizando perfiles de genes. Finalmente, formulamos un marco que define un fármaco óptimo, y predice cócteles de medicamentos que pueden atacar el cáncer con mayor precisión que los fármacos individuales solos. La conceptualización de medicamentos contra el cáncer como la solución de un problema de discriminación en el espacio de alta dimensión de marcadores moleculares promete informar el diseño de nuevos fármacos contra el cáncer y los cócteles de medicamentos
Visto:. Lawlor PN, Kalisky T, R Rosner, Rosner MR, Kording KP (2014) Conceptualización de medicamentos contra el cáncer como clasificadores. PLoS ONE 9 (9): e106444. doi: 10.1371 /journal.pone.0106444
Editor: Sui Huang, Instituto de Biología de Sistemas, Estados Unidos de América
Recibido: 6 Enero, 2014; Aceptado: August 4, 2014; Publicado: 23 Septiembre 2014
Derechos de Autor © 2014 Lawlor et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación: Pl. Era apoyo de los Institutos nacionales de Salud 5P01NS044393. KK fue apoyada por los Institutos Nacionales de Salud R01NS063399. RR y la RM fueron apoyados por la Universidad de Chicago Consejo de la Mujer. CT fue financiado por la Fundación Machiah. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
El objetivo central de tratamiento del cáncer es matar tejido canceroso y deja intacto el tejido sano. Por lo tanto, los medicamentos eficaces contra el cáncer deben distinguir entre las células cancerosas y las células sanas. Además, el tratamiento óptimo del cáncer también debe ser sólido a la variabilidad biológica tal como tumor y la heterogeneidad de las células sanas [1]. La combinación de estas ideas, podemos enmarcar el problema del cáncer en una forma que equilibra la posible superposición de propiedades saludables y celulares de cáncer con la necesidad de matar células de cáncer de variantes agresivas (Fig. 1). Mientras que la necesidad de separar el cáncer de las células sanas subyace en el tratamiento del cáncer de corriente, a nuestro conocimiento no ha sido matemáticamente formalizada. El desarrollo de un marco matemático se abre la posibilidad de traducir ideas de la ciencia computacional en nuevos enfoques para el tratamiento del cáncer
Lo ideal sería que, fármacos contra el cáncer realizan un cálculo sobre las células:. Matar (si es canceroso) o de no matar (si está saludable).
medicamentos contra el cáncer por lo tanto deben ser concebidos como la realización de un cálculo sobre las células. Por ejemplo, para los medicamentos tóxicos, dianas celulares conducen a un solo resultado (matar o no matar) durante el tratamiento. Matemáticamente, podemos decir que el efecto de un fármaco es un mapeo de un conjunto de propiedades (objetivos de la célula) en un estocástico, resultado binario (la célula vive o muere) - esto es exactamente la definición de un clasificador en los campos de las estadísticas y la máquina de aprendizaje [2]. En ese sentido, cualquier fármaco contra el cáncer es en realidad un clasificador (Fig. 2). Sin embargo, la aplicación de la palabra "clasificador" a esta muerte selectiva no es sólo semántica. En su lugar, se refiere a un método matemático formal y la caja de herramientas derivadas del aprendizaje automático, que puede contribuir al desarrollo de fármacos.
Esto ilustra cómo se puede combinar la información de dos marcadores celulares para construir un clasificador que separa las dos poblaciones (canceroso y las células sanas) mejor que cualquiera de los dos marcadores por separado.
Muchos algoritmos computacionales se han desarrollado para resolver problemas de clasificación, y existe una literatura rica en los campos de la estadística y de aprendizaje automático con respecto a los métodos eficaces para la clasificación [2 ]. Estos campos de cálculo ofrecen una amplia gama de enfoques incluyendo mediciones cuantitativas de rendimiento, algoritmos eficientes para grandes conjuntos de datos y los métodos para la mejora de los clasificadores. Por ejemplo, mucha investigación se ha dirigido cómo combinar clasificadores débiles con el fin de construir mejores clasificadores, lo que sugiere que estos métodos pueden adaptarse a la combinación de fármacos (Fig. 2). aprendizaje automático, en la definición de la búsqueda de clasificadores como optimizadores, ofrece una forma limpia de la descripción de una búsqueda dirigida a una meta. Este documento está destinado a aclarar la equivalencia de la búsqueda de clasificadores y la búsqueda de fármacos contra el cáncer.
Los datos del nuevo desarrollo ómicas enfoques faciliten la aplicación de la teoría del clasificador para la optimización de drogas. Microarrays y la tecnología de secuenciación, por ejemplo, le permitan percibir simultáneamente información sobre miles de celular
marcadores Network - mediciones que caracterizan el estado o el fenotipo de la célula, como la expresión de genes. Algunos de estos marcadores deben distinguir las células cancerosas de las células sanas, ayudando en la clasificación exacta y la orientación del cáncer. Es importante destacar, sin embargo, no todos los marcadores son dianas de fármacos moleculares. Molecular
¿Cuáles son los objetivos de moléculas que realmente utilizan medicamentos contra el cáncer para alterar las células. Pero enterrado en los miles de marcadores mensurables es un subconjunto de los marcadores que
refleja o se correlacionan con fotos de las dianas moleculares de las drogas. Por ejemplo, la expresión de genes que están aguas abajo de una diana de fármaco puede correlacionarse bien con la eficacia de dicho medicamento. la biotecnología emergentes nos permite medir estos marcadores celulares y los analizamos por herramientas estadísticas como aprender a comprender mejor el cáncer de la máquina.
A pesar de medicamentos contra el cáncer no se han caracterizado formalmente como clasificadores, aprendizaje automático se ha aplicado ampliamente para muchos aspectos de la biología del cáncer. Un grupo ha estimado el resultado del cáncer de mama mediante el uso de la máquina de aprendizaje para crear un algoritmo de predicción de 70 genes [3], mientras que nosotros y otros han utilizado la máquina de aprendizaje, en combinación con las vías de señalización discretas, para predecir la supervivencia libre de metástasis [4]. Otros han tratado de distinguir entre diferentes tipos de cáncer usando muchos tipos de algoritmos que incluyen máquinas de vectores soporte (SVM) [5], [6], Análisis de Componentes Principales [7], [8] y redes neuronales artificiales [9]. Sin embargo, otros predicen quimiosensibilidad sobre la base de la expresión de genes [10], [11] y las redes de señalización [12]. Sin embargo, aunque todos estos enfoques han dado pasos impresionantes y son útiles en la práctica clínica, estas ideas no se han combinado para producir un enfoque basado en los principios de diseño de fármacos contra el cáncer.
A continuación se propone un marco para el diseño de tratamientos contra el cáncer que se extiende a las ideas existentes mediante la conceptualización clasificador. En primer lugar resumimos el enfoque y, a continuación, como ejemplo práctico, llevamos a cabo un análisis de los datos experimentales para demostrar cómo se puede hacer esto en principio. El enfoque general se resume a continuación:
Un marco para tratar el cáncer
La formalización de medicamentos contra el cáncer como clasificadores deben informar a la forma en que tratamos el cáncer. Hay tres partes esenciales de este enfoque que primero resumimos en un nivel alto, y luego demostramos a partir de datos experimentales disponibles en la actualidad: 1) se define específicamente el objetivo que debe lograrse mediante la clasificación - es decir, que las células que matan, que las células que salir, y cómo decir la diferencia entre los dos; 2) Comprender las herramientas de tratamiento a nuestra disposición; y 3) utilizar de forma óptima las herramientas de tratamiento para lograr el objetivo clasificación definida. Hemos resumido las definiciones y las hipótesis relacionadas con este marco en la Tabla 1.
Definición del objetivo (Parte I)
El primer paso es discriminar entre las células cancerosas y sanas. Debido a que este es el objetivo del tratamiento del cáncer, es importante especificar concretamente este objetivo. Para ello, utilizamos las matemáticas de los algoritmos de clasificación en conjunto con las mediciones de marcadores de células. El clasificador responde a las siguientes preguntas: ¿cuánto se diferencian las células cancerosas de las células sanas y que los marcadores biológicos pueden distinguirlos? Se hace esta pregunta teniendo en cuenta explícitamente la heterogeneidad de ambas poblaciones. Los marcadores podrían incluir la expresión de genes, proteínas de superficie, etc. Debido a distinguir entre las células cancerosas y saludable requiere tomar en cuenta la heterogeneidad en cada población, nos hemos centrado en los marcadores de células individuales en vez de poblaciones celulares cuando sea posible.
algoritmos que clasifican en este contexto están diseñados para dar la máxima separación de las células cancerosas de las células sanas en términos de estos marcadores distintivos. Por lo tanto, podemos decir que los resultados de la clasificación describen lo que una hipotética actuación "óptima" de drogas en estos marcadores podría lograr. Parte I de los resultados demuestra cómo se podría definir este objetivo óptimo uso de la expresión génica en células individuales y explora el número de marcadores de células y son necesarios para lograr este objetivo.
Descripción de las herramientas de tratamiento a nuestra disposición (Parte II)
El siguiente paso es entender cómo las herramientas de tratamiento disponibles nos permiten utilizar los marcadores distintivos de las células cancerosas. Debemos esforzarnos para aproximar el fármaco óptimo mediante el diseño de nuevos fármacos o la combinación de los fármacos existentes. Aquí nos centramos en el segundo.
Las drogas idealmente debería apuntar a las propiedades que distinguen de cáncer, pero la mayoría de los fármacos utilizados en la clínica no hacer esto perfectamente. Además, sus mecanismos de acción diferentes. Por lo tanto, puede ser posible predecir cómo se deben combinar los medicamentos existentes para producir resultados más deseables. En realidad hacer esta predicción dependería de las acciones relativas a las drogas las propiedades distintivas de cáncer. Por ejemplo, si las células cancerosas se diferencian de las células sanas principalmente a través de tres marcadores distintos, tres fármacos
conocido
para utilizar por separado cada marcador único como un clasificador teóricamente podría combinarse. Parte II de los resultados demuestra esta idea mediante la exploración de la relación entre la acción del fármaco y propiedades moleculares (expresión génica).
De manera óptima el uso de herramientas de tratamiento (Parte III) guía
El último paso consiste en utilizar la matemática de clasificación para preguntar cómo nuestras herramientas disponibles (por ejemplo, fármacos) permiten que logremos nuestro objetivo. A partir de la primera parte, sabemos cómo distinguir las células cancerosas de las células sanas. A partir del segundo, sabemos cómo nuestros medicamentos se relacionan con marcadores moleculares. Ahora podemos usar estas dos ideas para optimizar el tratamiento, haciendo coincidir las capacidades de clasificación de los medicamentos con el objetivo de clasificación especificado.
Aquí vamos a centrarse de nuevo en la optimización de las combinaciones de fármacos. Un enfoque sería para predecir las combinaciones de fármacos que discriminan entre el cáncer y las células sanas mejor que cualquiera de los fármacos solos. Parte III de los resultados demuestra un enfoque que, en condiciones ideales, podrían lograr este objetivo
.
Una limitación de este estudio es que los datos actualmente disponibles para este tipo de análisis es limitado y no es ideal. Por lo tanto, con el fin de ilustrar las tres partes del marco de clasificación con datos de muestras biológicas reales, hemos sustituido o redefinido fenotipos de células cuando los datos de célula deseado es deficiente.
Resultados
Parte I : Definición del objetivo de clasificación con las mediciones moleculares
Si fármacos contra el cáncer actúan como clasificadores que utilizan marcadores mensurables como entrada, se pueden utilizar algoritmos de clasificación estándar para explorar la posibilidad de resolver el problema de clasificación de cáncer en comparación con las células sanas. En teoría, es posible que exista una óptima fármaco (o la combinación de fármacos) que logra este objetivo en la práctica. Esto implicaría que un fármaco tal mataría las células cancerosas dejando las células sanas en la mayor medida posible. Vamos a utilizar esta noción de un fármaco óptimo como una guía para el análisis de tratamiento. En la práctica, los fármacos actuales o combinaciones de fármacos deben ser elegidos para parecerse al fármaco óptimo. Reconocemos que cada tumor es diferente, pero nuestro objetivo es ilustrar un método para distinguir canceroso del tejido no canceroso en un contexto. Este enfoque también se puede aplicar a otros tipos de cáncer.
Para determinar si es teóricamente posible para resolver este problema, es necesario un conjunto de datos de las células con tanto estado cáncer conocido y marcadores medidos. Se utilizó una sola célula de datos de la transcripción derivadas de colon [13]. Este conjunto de datos incluye tanto un número limitado de marcadores (45 genes), y un número limitado de los subtipos de colon de tejido y las células (& lt; 200 células). Por lo tanto, nos centramos en distinguir entre células sanas y cancerosas de un tejido subtipo: células madre similares. Debido a que estas células son tan similares - como se señala en la publicación original - esta elección sirvió para que el problema de clasificación más difícil. Por tanto, este conjunto de datos nos permitió probar el poder del enfoque de clasificación.
Puede este problema de clasificación se resolverá? En otras palabras, pueden los datos de transcripción de una sola célula predecir estado celular (canceroso o no)? Para responder a esta pregunta se utilizó un algoritmo estándar de clasificación, el regularizado GLM [14], [15]. Prueba de lo bien que tales algoritmos clasificadores de trabajo nos permite dar un límite superior de lo bien que un fármaco real podría funcionar si se utiliza la expresión de genes por sí solo.
En primer lugar, quisimos medir la precisión potencial de esta clasificación. En la clasificación hay diferentes tipos de errores que uno puede hacer. Por ejemplo, es fácil de producir un medicamento que mata todas las células cancerosas, pero también mata todas las células sanas. Esta droga tendría 100% de positivos verdaderos (células de cáncer de muertos), sino también el 100% de falsos positivos (células sanas muertas). Por lo tanto, para caracterizar completamente una estrategia de clasificación se debe analizar la relación de los dos tipos de errores. La medida estándar de la precisión de la clasificación es la característica de funcionamiento del receptor de trama (ROC). En esta gráfica la proporción de verdaderos positivos se representa como una función de la proporción de falsos positivos (Fig. 3) para cuantificar la sensibilidad y la especificidad. El área bajo esta curva (AUC) da una medida general de la clasificación de rendimiento con un valor máximo de 1 para una prueba perfecta. El AUC para nuestro algoritmo de clasificación fue ~0,9, lo que indica que las células sanas y cancerosas pueden también clasificarse. Por lo tanto, es teóricamente posible para resolver este tipo de cáncer en particular frente al problema de clasificación saludable para las células individuales con alta precisión utilizando los niveles de expresión de sólo un conjunto pequeño (~ 45) de los genes.
Cuando se mide la precisión de la clasificación de células cancerosas o como sano, hay que considerar dos tipos de errores: los falsos positivos y falsos negativos (o de manera más convencional, verdaderos positivos). Esto se ilustra por la curva característica de funcionamiento del receptor (ROC). Las líneas indican los valores medios, y las barras de error indican bootstrap intervalos de confianza del 95%. La exactitud se midió usando la validación cruzada; y el valor de probabilidad se determinó usando el control de reproducción aleatoria.
A continuación pregunta
cuántos marcadores celulares
un fármaco óptimo necesitaría para clasificar con precisión las células. En otras palabras, ¿cuál es el número mínimo de marcadores de un fármaco óptimo debe tener en cuenta para establecer la diferencia entre las células sanas y cancerosas? Se encontró que un número relativamente pequeño de genes - aproximadamente el mejor 10 (clasificados en orden de magnitud de ajuste de parámetros) - bastó para clasificar una célula cancerosa o como sano con una alta precisión (Figs 3, 4.). Se incluyó la capacidad de predicción del clasificador saturada poco después de las 10 mejores genes. Así, sólo un pequeño número de marcadores celulares proporcionan la mayor parte de la información utilizada para clasificar una célula cancerosa o como saludable.
clasificación de rendimiento se midió como el área bajo la curva (AUC) de la curva ROC. Un clasificador ideal sería lograr una AUC de 1, mientras que un clasificador al azar sería lograr un of.5 AUC. Cada línea de color representa un número diferente de células usadas para entrenar el clasificador, que muestra que el rendimiento mejora a medida que se utilizan más células. Las líneas indican los valores medios y las áreas sombreadas indican bootstrap intervalos de confianza del 95%. La exactitud se midió usando la validación cruzada; y el valor de probabilidad se determinó usando el control de reproducción aleatoria.
La capacidad de medir la expresión génica de las células individuales plantea la cuestión de si es más importante la medición más células o más genes. Para responder a esto, se cuantificó la importancia relativa de aumentar el número de células medido frente al número de genes medidos por célula. Entrenamos el clasificador con el número de células que van de dos en total (uno, saludable de las células de un tumor) a 180 células totales (95% de las células). Como el anterior, que mide el desempeño del clasificador, excepto que lo hicimos para cada escenario de entrenamiento. de nuevo se encontró que el rendimiento saturado después de un pequeño número de genes para cada escenario de entrenamiento. Es importante destacar que, también encontramos que el rendimiento siguió mejorando con el número de células de formación cada vez mayor hasta que se utilizaron aproximadamente 80 (Fig. 4). Por lo tanto, las mediciones de por lo menos se requieren decenas de células para dar cuenta de la variación en una población simplificada del tumor y las células sanas.
En esta sección, nos han demostrado cómo llevar a cabo un análisis que definir qué tratamiento óptimo - el "fármaco ideal" - podría lograr. Con un conjunto de datos experimentales hemos demostrado que es posible resolver el problema con precisión el cáncer de clasificación. Este tipo de análisis también podría identificar los marcadores que distinguen el cáncer de las células sanas. Para el conjunto de datos limitados que elegimos, parecía que la solución del problema de clasificación era posible con aproximadamente 10 y 80 marcadores de las células. Sin embargo, estas cifras varían según la población de células tumorales, así como los marcadores particulares analizaron
Parte II:. Clasificación por medicamentos contra el cáncer reales
En la primera parte de los resultados que han explorado la posibilidad de un medicamento contra el cáncer óptimo que distingue entre las células sanas y cancerosas. En esta segunda parte del estudio, vamos a demostrar
si
y
cómo
las herramientas a nuestra disposición (en este ejemplo, los medicamentos actuales) podemos clasificar las células. Esto nos ayudará a comprender cómo utilizar los medicamentos actuales para abordar el desempeño del medicamento óptimo
.
En concreto, en el siguiente ejemplo, nos preguntamos cómo fármacos contra el cáncer
realmente
relacionarse con marcadores moleculares. Para responder a esta pregunta, lo ideal sería utilizar células individuales. Esto es difícil con las células individuales, sin embargo, ya que el tratamiento y la medición marcador tanto potencialmente destruir la célula. Una posible solución es permitir la replicación limitada de células individuales con el fin de analizar el estado de marcador de un conjunto de células hijas mientras se determina al mismo tiempo la eficacia del fármaco utilizando otras células hijas. Sin embargo, incluso estos dos conjuntos exhibirán heterogeneidad con el tiempo. Puesto que los datos de expresión génica para tales poblaciones que han sido tratados con fármacos no están actualmente disponibles, el sustituto más cercano se establece líneas celulares que tienen un origen clonal y son en gran medida genéticamente homogéneo. Por lo tanto, hemos utilizado las líneas celulares como sustitutos de las células individuales para preguntar cómo las drogas se relacionan con marcadores moleculares.
Debido a que nuestros resultados anteriores sugieren que necesitamos decenas de células para resolver el problema de clasificación, optamos por analizar un tipo de tejido con muchas líneas celulares establecidas. Por ello, utilizó 45 líneas celulares de cáncer de mama luminal y basal, al igual que se caracterizan por Gray et al [12]. Se midió aproximadamente 19.000 genes en estas líneas de cáncer de mama utilizando microarrays, así como las respuestas quimioterapéuticos de esas líneas para cada uno de 74 fármacos. Estas líneas son una buena representación de la gama de fenotipos de células que se encuentran en el cáncer de mama y por lo tanto representan más varianza de un tumor real. No obstante, estas líneas celulares nos permitieron preguntamos como marcadores de células relacionadas con la sensibilidad a los fármacos.
Se utilizó un algoritmo para predecir si fármacos contra el cáncer matan a las células de una línea celular específica sobre la base de sus marcadores. En particular, se estimó la sensibilidad de drogas de estas líneas celulares. De hecho, algunos aspectos de las respuestas de drogas eran predecibles. Por ejemplo, se predijo la respuesta al fármaco quimioterapéutico Lapatinib, un inhibidor de tirosina quinasa que bloquea la señalización por tanto el receptor de EGF y HER2 /neu. Se obtuvo un R
2 valor de ~ 0,5. Sin embargo, la baja R
2 Valor muestra que nuestra predicción del comportamiento de drogas no era fuerte. Esto podría ser debido al pequeño tamaño del conjunto de datos, pero también puede implicar que no todos los marcadores pertinentes, se midieron, o, alternativamente, que la relación no es lineal y no capturados por métodos de aprendizaje automático lineales. Mientras que los marcadores moleculares, tales como la expresión de genes no captan toda la variabilidad, ellos parecen jugar un papel en la predicción de la respuesta a los fármacos. Por lo tanto, los marcadores celulares predicen un cierto grado de comportamiento de drogas cuando son tratados como entradas a un clasificador.
También queríamos saber cuántos genes es suficiente para predecir el comportamiento real de drogas. Para ello, se midió el comportamiento del fármaco en función del número de genes. Lapatinib necesario sólo un pequeño número de genes (~ 5) alcance su pico precisión (Fig. 5). Por lo tanto, un pequeño número de marcadores celulares predecir si o no drogas reales matan una célula. Esto es importante porque muestra que no necesariamente tienen que considerar muchos miles de genes en el diseño de terapias.
respuesta a los fármacos se predijo usando marcadores moleculares (expresión génica). La exactitud de la predicción de la quimiosensibilidad, medida como R
2, que representa la cantidad de variación explicada. Las áreas sombreadas indican bootstrap intervalos de confianza del 95%. La exactitud se midió utilizando la validación cruzada.
Si las drogas actúan como clasificadores utilizando un pequeño número de propiedades, a continuación, un medicamento puede ser caracterizada por el trazado de su efecto en función de las propiedades. por tanto, se seleccionaron los dos genes (SLC5A8 y PERLD1) que estaban mejor en conjunto para predecir el efecto de lapatinib través de las líneas celulares. Utilizando interpolación simple rejilla y rutinas de extrapolación que trazan el efecto del fármaco como un mapa de calor (Fig. 6). Este tipo de visualización muestra que incluso los dos genes pueden capturar el comportamiento complejo de un medicamento contra el cáncer.
actividad de drogas es, hasta cierto punto predecible utilizando marcadores moleculares.
Se analiza la actividad del fármaco como que se refiere a los marcadores moleculares (es decir, las características fenotípicas de una célula), pero tales marcadores no son necesariamente molecular
objetivos
(es decir, los componentes celulares tales como proteínas cuyas funciones están alteradas por un fármaco). Idealmente, los datos experimentales también incluirían mediciones de los marcadores más susceptibles de constituir realmente objetivos de medicamentos tales como los receptores tirosina quinasa que son el objetivo de lapatinib. Aunque las transcripciones de genes que analizamos no son el blanco directo de la droga de clasificación, todavía predicen la respuesta al fármaco y son por lo tanto útiles. Por lo tanto, este enfoque podría ser utilizado con
cualquier
tipo de marcador molecular o blancos.
En esta sección, hemos demostrado la manera de entender el comportamiento de las drogas reales dentro de nuestro marco. En nuestro ejemplo, relacionamos la eficacia del fármaco a los marcadores moleculares que, en teoría, le permite a uno preguntarse cómo las drogas reales se relacionan con los marcadores distintivos de las células cancerosas. Esto será importante para la siguiente sección en la que nos preguntamos cómo combinar de manera óptima las drogas. En este conjunto de datos, sin embargo, nos encontramos con que los marcadores medidos predicen la respuesta subóptima de drogas. En el futuro, los datos recogidos de muchas más poblaciones de células y se necesitarán una variedad de tipos de marcadores para hacer predicciones convincente clínicamente
Parte III:. La optimización del tratamiento del cáncer
En las dos secciones anteriores hemos han demostrado cómo un medicamento contra el cáncer óptima podría clasificar las células cancerosas como si no, y que los marcadores celulares predecir en cierta medida el comportamiento de un fármaco real. En esta sección, combinamos estas dos ideas para delinear un posible enfoque para optimizar el tratamiento del cáncer. Buscamos
pares de drogas
que clasifican las células cancerosas cuando se combina mejores que cualquier fármaco solo.
Demostramos este enfoque conceptual a partir de datos de expresión génica y mediciones de sensibilidad de drogas desde el mismo panel de cáncer de mama líneas celulares [12]. Por desgracia, no hemos podido obtener datos similares para líneas de células no cancerosas. Por lo tanto hemos hecho dos ajustes para mostrar que es posible, en principio, estos tipos de análisis: 1) nos trataron de nuevo cada línea celular clonal como un sustituto de una sola célula; y 2), se utilizó la capacidad de discriminar entre dos subclases de tejido como el objetivo de clasificación en lugar de distinguir saludable de las células cancerosas. En particular, hemos utilizado los subtipos de tipo basal y luminal de cáncer de mama, que
más o menos
corresponden a las agresivas (más metastásico) y el cáncer (menos metastásico) menos agresivo. Somos conscientes de que la situación real es más compleja de lo que esta simplificación; sin embargo, esta distinción es, en última instancia arbitraria y simplemente sirve para demostrar nuestro enfoque utilizando una verdadera diferencia fenotípica. Teniendo en cuenta esta definición, y estos datos, nos preguntamos si era posible encontrar dos fármacos que discriminan entre el luminal y basal-al igual que los subtipos de cáncer de mama mejor que cualquiera de los fármacos solos.
drogas reales no discriminan entre sano y perfectamente células cancerosas. Sin embargo, podemos utilizar la máquina de aprendizaje para describir cómo combinar los medicamentos con el fin de aproximar mejor el fármaco óptimo. Esto se inspira en el enfoque conocido en el aprendizaje de máquina llamada impulsar [16], en el que se añaden funciones adicionales para un clasificador para permitir progresivamente un mejor rendimiento. Más específicamente, dado el objetivo de clasificación (fármaco óptimo) de la Parte I y el comportamiento real de las drogas 'de la Parte II, podemos determinar qué par de fármacos mejor aproximación del fármaco óptimo. Para ello, volvemos a utilizar el marco GLM para enmarcar el tratamiento deseado en forma de una combinación de fármacos. A continuación, iterar a través de posibles combinaciones de dos medicamentos para determinar qué par se comporta mejor. Esta idea nos permite determinar la mejor combinación de fármacos para la clasificación.
Se han encontrado varias combinaciones de fármacos que se aproximaba el fármaco óptimo. Una combinación particular incluye los medicamentos lestaurtinib y GSK461364 (figura 7;. Comparar la Fig. 2). Estos medicamentos juntos proporcionan una mejor clasificación de cada fármaco por separado (Fig. 8). Así, nuestro método proporciona un mecanismo para la elección de fármacos adicionales en una forma que debería permitir a las células diana cancerosas más eficazmente. Estos resultados suponen que los fármacos actúan de manera independiente y antes de una respuesta adaptativa al tratamiento. Otras estrategias para abordar esta cuestión, se presentan en la discusión.
Una mejor discriminación entre las poblaciones de células se logra mediante la inclusión de un fármaco adicional. La línea de umbral de clasificación se muestra, en realidad, representa un gradiente relacionados con "probabilidad de la muerte celular", que se indica mediante el sombreado. Véase el texto para una descripción completa.
Precisión (AUC) alcanzado por ambos fármacos juntos es mejor que cualquiera de los fármacos solos.
En esta sección hemos demostrado cómo optimizar el tratamiento utilizando el marco de la clasificación. Destacamos una vez más que estamos utilizando los datos biológicos subóptimos como ejemplos para aclarar la naturaleza de nuestro enfoque, no producen predicciones clínicamente relevantes. serán necesarios conjuntos de datos más grandes y más exhaustivos para hacer esto posible. Por otra parte, hemos hecho simplificaciones improbables generalizar a la práctica clínica. Por lo tanto, estos resultados no deben tomarse como una recomendación clínica. Sin embargo, este análisis muestra que el uso del marco de clasificación para optimizar el tratamiento tiene en cuenta la variación inherente en fenotipos y podría influir en la elección de un tratamiento para discriminar entre células cancerosas y saludables.
Discusión
El enfoque para tratar el cáncer
En este estudio, hemos argumentado que el empleo de medicamentos contra el cáncer como clasificadores proporciona un marco conceptual para el diseño de estrategias óptimas de tratamiento para el cáncer. medicamentos óptimos utilizan dianas moleculares para eliminar células cancerosas y reducir al mínimo el daño a las células sanas. Se consideró que este problema como uno que podría abordarse con herramientas de aprendizaje automático y demostramos cómo esto podría informar a una estrategia para tratar el cáncer. Se demuestra que una clase de marcadores moleculares, la expresión de genes, fue suficiente para resolver este problema de optimización bastante bien el uso de los conjuntos de datos examinados. También mostramos cómo incorporar la variación intrínseca celular en el análisis y reconocer los fármacos actuales, clasificadores subóptimas. Por último, sugerimos maneras de utilizar el marco de clasificación para derivar las estrategias de desarrollo de drogas que llevan a cabo lo más cerca posible a un medicamento óptimo.
Optimización del tratamiento contra el cáncer mediante la combinación de fármacos de acuerdo con los principios de clasificación es relativamente sencillo si los fármacos combinados no lo hacen afectarse mutuamente. Por ejemplo, puede ser que un segundo medicamento no interfiere significativamente con el mecanismo molecular de la primera, y
viceversa
cuando se administra de forma simultánea. Si los efectos de los fármacos individuales son aditivos, la capacidad de un fármaco particular para clasificar las células cancerosas no se vería afectada por otro fármaco. Por lo tanto el clasificador compuesto - la combinación de fármacos - clasificaría a las células cancerosas con mayor precisión que cualquier fármaco solo. También es posible que débiles interacciones no lineales entre los fármacos todavía podrían producir un clasificador compuesto superior que cualquiera de los fármacos solos. Suponiendo linealidad coloca un
límite superior de lo bien que podrían trabajar combinaciones de fármacos.
¿Qué pasa si nos encontramos con un segundo fármaco que se debe mejorar la clasificación, pero no es aditivo con el primer medicamento? Esta dependencia no lineal es muy probable que sea importante. Una solución sería utilizar el medicamento de forma iterativa-más próximo al óptimo hasta que encontremos uno que no interactúa significativamente con el primer fármaco. Por lo tanto, la elección del mejor fármaco adicional para una combinación puede requerir consideraciones teóricas y empíricas. Este método no puede garantizar que una determinada combinación de fármacos funciona, pero en cambio propone una manera más eficiente para seleccionar las combinaciones de medicamentos para la prueba.