Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Predicción de fármacos contra el cáncer mediante productos químicos Química Interactions

PLOS ONE: Predicción de fármacos contra el cáncer mediante productos químicos Química Interactions


Extracto

Cáncer, que es la principal causa de muerte en el mundo, coloca una gran carga para el sistema sanitario. En este estudio, un modelo para la predicción fue construido para predecir una serie de indicaciones medicamento contra el cáncer basados ​​en las interacciones químicas-químicas. De acuerdo con las puntuaciones de confianza de sus interacciones, se obtuvo el orden desde el cáncer más probable que la menos una para cada fármaco consulta. La precisión de la predicción para 1
er de la formación de datos era 55.93%, evaluado mediante la prueba de la navaja de bolsillo, mientras que fue 55.56% y 59.09% en un conjunto de datos de prueba y validación de un conjunto de datos de pruebas independiente, respectivamente. El método propuesto superó en un método popular basado en descriptores moleculares. Por otra parte, se comprobó que algunos fármacos son eficaces para las indicaciones previstas "erróneas", lo que indica que algunas indicaciones de fármacos "equivocadas" eran en realidad indicaciones correctas. Alentados por los resultados prometedores, el método puede convertirse en una herramienta útil para la predicción de las indicaciones drogas

Visto:. Lu J, Huang G, Li H-P, Feng K-Y, Chen L, Zheng M-Y, et al. (2014) Predicción de fármacos contra el cáncer mediante interacciones químicas-químicas. PLoS ONE 9 (2): e87791. doi: 10.1371 /journal.pone.0087791

Editor: Lukasz Kurgan, Universidad de Alberta, Canada |
Recibido: 4 de octubre de 2013; Aceptado: 31 de diciembre de 2013; Publicado: 3 Febrero 2014

Derechos de Autor © 2014 Lu et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este estudio fue financiado por el Programa Nacional de Investigación básica de China (2011CB510101, 2011CB510102), la Fundación Nacional de Ciencias de China (61202021, 31371335, 61373028), el Programa de Innovación de la Comisión de Educación Municipal de Shanghai (12ZZ087, 12YZ120), la concesión de "la Primera -clase disciplina de Universidades en Shanghai ", Fundación de Desarrollo de la Educación de Shanghai (12CG55), el Fondo de Investigación Científica de Hunan Provincial de Ciencia y Tecnología Departamento (2011FJ3197), la Fundación Nacional de Ciencia de Hunan (Grand: 11JJ5001), y el Fondo de Investigaciones Científicas de Hunan Departamento provincial de Educación (Grant: 11C1125). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

el cáncer es la principal causa de muerte en los países desarrollados y en desarrollo [1]. Sólo en 2008, había 12,7 millones de nuevos casos de cáncer y 7,6 millones de muertes por cáncer en todo el mundo [1]. Mientras tanto, la cantidad de medicamentos recientemente aprobados disminuyó continuamente a pesar de un aumento de R & amp; D inversiones [2]. R & amp; D de un fármaco requiere pruebas experimentales integral, que a menudo cuesta millones de dólares, involucra varios miles de animales, y lleva muchos años en completarse. Sin embargo, como consecuencia, no hay muchos productos químicos han sufrido el grado de prueba necesaria para apoyar las evaluaciones de riesgo para la salud precisos o cumplir con los requisitos reglamentarios para la aprobación de medicamentos. Por lo tanto, es muy atractiva para desarrollar métodos de predicción rápidos, fiables, y que participan no animales-,
por ejemplo
usando relaciones estructura-actividad (SAR), para predecir las actividades contra el cáncer de productos químicos.

Algunos estudios pioneros indican que las proteínas interactivas son más propensos a compartir las mismas funciones que los no interactivos [3], [4], [5]. Del mismo modo, los compuestos interactivos son también más propensos a compartir propiedades comunes [6], [7], [8]. PUNTADA (Herramienta de Búsqueda para las interacciones de sustancias químicas, http://stitch.embl.de/~~number=plural) es una base de datos conocida que contiene la información de las interacciones de las proteínas y los productos químicos [9], [10]. Proporciona tres categorías de compuestos interactivos: (1) los que participan en las mismas reacciones; (2) los que comparten estructuras o actividades similares, y (3) los que tienen las asociaciones de literatura, tal como la unión al mismo objetivo [9]. En este estudio, hemos intentado construir un modelo de predicción del consumo de drogas indicación mediante la cuantificación de la interacción química-química de cada par de compuestos interactivos. En pocas palabras, las drogas y sus correspondientes indicaciones (
es decir
, 8 tipos de cánceres) se extrajeron de KEGG (Kyoto Enciclopedia de genes y genomas, http://www.genome.jp/kegg/) [11], una base de datos conocida tratar con genomas, los caminos enzimáticos y químicos biológicos, y DrugBank [12], otra base de datos que contiene información detallada de las drogas y su información de destino. Entonces, la puntuación de cada indicación del compuesto consulta se obtuvo de las puntuaciones de confianza de las interacciones entre el compuesto de consulta y sus compuestos interactivos utilizando las indicaciones de los compuestos interactivos. Y se obtuvo el orden de la indicación más probable que la menos para cada fármaco. Por último, la calidad de predicción del modelo se evaluó mediante la prueba de la navaja de bolsillo y algunos otros parámetros.

Además de construir un modelo de predicción efectiva, otro objetivo de nuestro estudio es investigar la capacidad de reposicionamiento de medicamentos de nuestro modelo. reposicionamiento de drogas,
es decir.
encontrar nuevos usos de fármacos ya existentes, es una estrategia alternativa para el desarrollo de fármacos, ya que tiene el potencial de acelerar el proceso de aprobación de medicamentos. Varios medicamentos, tales como la talidomida, el sildenafil, el bupropión y fluoxetina, se han colocado de nuevo con éxito a las nuevas indicaciones [13], [14]. enfoques experimentales para el reposicionamiento de drogas suelen emplear cribado de alto rendimiento (HTS) para poner a prueba las bibliotecas de medicamentos contra dianas biológicas de interés. Más recientemente, varios
modelos in silico
se desarrollaron para abordar las cuestiones de reposicionamiento de fármacos. Iorio
et al.
Predicho y validado nuevos modos de acción de fármacos y drogas de reposicionamiento de las respuestas de la transcripción [15]. El grupo de Butte reportó dos ejemplos exitosos de reposicionamiento de fármacos basados ​​en datos de expresión de genes relacionados con enfermedades y medicamentos [16], [17]. Cheng
inferencia basada en la red y col.
Fusionó la inferencia basada en la similitud de drogas (DBSI), basada en la similitud de destino inferencia (TBSI) y (NBI) los métodos de asociación de fármacos diana y reposicionamiento de drogas [18]. En nuestro estudio, de acuerdo con la hipótesis de que los fármacos interactivos son más propensos a atacar la misma indicación, se investigó la posibilidad de reposicionamiento de algunos fármacos predichos "erróneas" mediante la recuperación de referencias, y se intentó proponer indicaciones alternativas para algunos fármacos.

Materiales y Métodos

Materiales

La información de 98 medicamentos que pueden tratar los cánceres que se recuperó de KEGG enfermedad en KEGG [11]. Estos medicamentos pueden tratar los siguientes 10 tipos de cánceres:

Los cánceres del sistema nervioso

Los cánceres del sistema digestivo

Los cánceres de los tejidos hematopoyético y linfoide

los cánceres de mama y de los órganos genitales femeninos

los cánceres de tejidos blandos y hueso

los cánceres de piel

los cánceres del sistema urinario y órganos genitales masculinos

los cánceres de los órganos endocrinos

los cánceres de cabeza y cuello

los cánceres de pulmón y la pleura

Debido a que algunos medicamentos no tienen información de las interacciones químicas-químicos, que éstos descartados drogas, lo que resulta en 68 fármacos. Después de eso, se encontró que los cánceres de la piel '' y 'Los cánceres de cabeza y cuello' no contenían, 3 y 4 fármacos, respectivamente. No es suficiente para establecer un modelo de predicción efectiva con sólo unas pocas muestras, por lo tanto fueron abandonados estos dos tipos de cánceres. Como resultado, se obtuvieron 68 medicamentos, que comprende el conjunto de datos de referencia S. Estos medicamentos 68 se clasificaron en 8 categorías de manera que los medicamentos que pueden tratar un tipo de cánceres comprenden una categoría. Los códigos de los 68 medicamentos y sus indicaciones se pueden encontrar en la Tabla S1. El número de medicamentos en cada categoría se enumeran en la columna 5 de la Tabla 1. Por conveniencia, se utilizó etiquetas para representar cada tipo de cánceres. Por favor, véase la columna 1 y 2 de la Tabla 1 para la correspondiente de las etiquetas y los cánceres. Se observa en la Tabla 1 que la suma del número de medicamentos en cada categoría es mucho más grande que los diferentes fármacos en S, lo que indica que algunos fármacos pueden pertenecer a más de una categoría,
es decir
algunos medicamentos pueden tratar con mayor de un tipo de cáncer. En detalles, 50 medicamentos pueden tratar sólo un tipo de cáncer, mientras que 18 medicamentos pueden tratar al menos dos tipos de cánceres. Por favor refiérase a la Figura 1 para una trama de la serie de fármacos contra el número de cánceres que se pueden tratar. Por lo tanto, es un problema de clasificación multi-etiqueta que debe asignar a cada fármaco a los mencionados 8 categorías en orden descendente. El clasificador única que proporciona un cáncer que un fármaco candidato puede tratar consulta no es una opción óptima. Similar a la situación cuando se trata de proteínas y compuestos con múltiples atribuciones [7], [19], el método propuesto también es necesario proporcionar una serie de cánceres de candidatos, que van desde el cáncer más probable que el menos probable.


Para evaluar mejor el método propuesto, el conjunto de datos de referencia S se divide en un conjunto de datos de entrenamiento S
tr y una prueba de validación de datos S
te,
es decir
S = S
tr∪S
te y S
tr∩S
te = O, en donde los medicamentos que sólo pueden tratar exactamente un tipo de cáncer y la mitad de los medicamentos que pueden tratar por lo menos dos tipos de cánceres Compuesto S
tr, mientras que S
te contenía los medicamentos de descanso en S. El número de medicamentos en cada categoría para el S
tr y S
te aparece en la columna 3 y 4 de la Tabla 1, respectivamente.

Además, para poner a prueba la generalización del método propuesto, se extrajeron 59 compuestos farmacológicos de DrugBank [12], que no están en el conjunto de datos de referencia
S
. Después de excluir a los compuestos de fármacos sin información de las interacciones químicas-químicos, se obtuvieron 44 fármacos, que comprende el conjunto de datos de pruebas independiente S
ite. El número de medicamentos en cada categoría de S
ite aparece en la columna 6 de la Tabla 1 y la información detallada de estos compuestos de medicamentos, incluyendo sus códigos y las indicaciones se pueden encontrar en la Tabla S2.

Química-químico interacciones

En los últimos años, la información de interacciones químicas-químicas está penetrando en la predicción de diversas atribuciones de compuestos [7], [8], [20]. La idea básica es que los compuestos interactivas son más propensos a compartir funciones comunes que los no interactivos. En comparación con la información sobre la base de la estructura química, que incluye otras propiedades esenciales de compuestos, tales como compuestos actividades, reacciones, y así sucesivamente.

La información de compuestos interactivos ha sido descargado de puntadas (chemical_chemical.links.detailed. v3.1.tsv.gz) [9]. En el archivo obtenido, cada interacción consta de dos compuestos y cinco tipos de calificaciones titulada "similitud", "Experimental", "Base de Datos", "minería de textos» y «Combined_score '. En detalle, los primeros cuatro tipos de puntuaciones se calculan en base a las estructuras compuestas, las actividades, las reacciones, y co-ocurrencia en la literatura, respectivamente, mientras que el último tipo de cuenta 'Combined_score' integra los citados cuatro anotaciones. Por lo tanto, se utiliza en este estudio para indicar la interactividad de dos compuestos,
es decir
. Dos compuestos son compuestos interactivos si y sólo si el 'combined_score' de la interacción entre ellos es mayor que cero. De hecho, el valor de 'combined_score' también indica la fuerza de la interacción,
es decir.
La probabilidad de ocurrencia de la interacción. Por lo tanto, se denomina como la puntuación de confianza en este estudio. Para mayor comodidad, se denota la puntuación de confianza de la interacción entre los
c

1 y
c

2 por. En particular, si
c

1 y
c

2 son compuestos no interactivas, se pone a cero.

112 compuestos de la droga fueron investigados en este estudio como "materiales", y 1.393 interacciones químicas-químicas cuyas puntuaciones fueron mayores que la confianza se obtuvieron cero descrito en la Sección. Entre las interacciones que las puntuaciones son mayores que cero, 50 de ellos pertenecían a la etiqueta 'similitud', 4 pertenecían a 'Experimento', 114 pertenecían a 'base de datos', y 1.352 pertenecían a 'minería de textos ». Es necesario señalar que algunas interacciones con otros medicamentos tenían dos o más de dos tipos de puntuaciones. En lo que se refiere a la cantidad de interacciones químicas-químicas, la etiqueta de 'minería de textos "más contribuyó a la construcción del método de predicción se describe en la sección" El método basado en la interacción química-químicas ".

método de la predicción

El método basado en la interacción química-químicas.

La biología de sistemas se ha aplicado ampliamente en las predicciones de propiedades de las proteínas y compuestos, y se considera que es más eficiente que algunos métodos convencionales [7], [20], [21], [22]. En este estudio, se intenta clasificar los medicamentos contra el cáncer en los mencionados 8 categorías en función de las interacciones químicas.

Supongamos que hay n

drogas en el conjunto de entrenamiento, decimos. Los cánceres que se pueden tratar se representa como sigue: (1) donde T es el operador de transposición y

(2) Para un fármaco consulta, que el cáncer se puede tratar puede ser determinada por sus compuestos interactivos en. Para evaluar la probabilidad de que se puede tratar el cáncer, se calculó una puntuación de la siguiente manera: (3)

mayor puntuación de indica que es más probable que el fármaco consulta puede tratar el cáncer. Y sugiere que la probabilidad de que el fármaco consulta puede tratar el cáncer es cero, ya que no existen compuestos interactivos en que pueden tratar el cáncer.

Como se ha mencionado en la sección "Materiales", para predecir qué tipos de cáncer, un medicamento puede tratar es una problema de clasificación multi-etiqueta. Un clasificador fiable debe proporcionar no sólo el cáncer más probable, sino también una serie de cánceres candidatos, que van desde el más probable a la menos probable. De acuerdo con los resultados de la ecuación. 3, es fácil de organizar los cánceres candidatos usando el orden decreciente de las puntuaciones correspondientes. Por ejemplo, si los resultados de la ecuación. 3 son: (4)

que significa que hay tres tipos de cáncer de candidatos, donde el cáncer más probable es que se puede tratar, seguido de y. Por otra parte, se llama la 1
st predicción de orden, y es la 2
nd predicción de orden, y así sucesivamente.

El Método basado en el Molecular Descriptores

Para comparar nuestro método con otros métodos, se construyó el método basado en descriptores moleculares como sigue. La optimización de la estructura de cada compuesto de fármaco se realizó usando el método AM1 semi-empírica implementado en AMPAC 8,16 [23]. 454 descriptores incluidos,,, electrostática, y descriptores cuántica-químicas geométricas topológicas constitucionales fueron calculadas por Codessa 2.7.2 [24]. Para codificar cada compuesto fármaco con eficacia, los descriptores con valores que faltan se descartaron, resultando en 355 descriptores,
es decir
cada compuesto fármaco
d
puede ser representado por un vector 355-D (dimensión) que puede ser formulado como sigue: (5) donde T es el operador de transposición. En consecuencia, la relación de los dos fármacos
d

1 y
d

2 puede calcularse mediante la siguiente fórmula: (6) donde es el producto escalar de y, mientras y es el módulo de y, respectivamente

al igual que en el método basado en la interacción química-químicas, la puntuación que un fármaco consulta puede tratar el cáncer se puede calcular mediante la siguiente fórmula:. (7)

el procedimiento de descanso es la misma que la del método basado en la interacción química-químicos, que también proporciona una serie de cánceres candidatos que pueden tratar, que van desde el más probable al menos uno.

Validación y Evaluación

prueba de la navaja de bolsillo es uno de los métodos más populares para evaluar el desempeño de los clasificadores. Durante la prueba, cada muestra se destaca uno por uno y predijo por el clasificador entrenado por las muestras de descanso en el conjunto de datos. El procedimiento de prueba está abierta, evitando de este modo un problema arbitraria [7]. Por lo tanto, el resultado obtenido mediante la prueba de la navaja de bolsillo es siempre único para un determinado conjunto de datos. En vista de esto, muchos investigadores lo han adoptado para evaluar la precisión de sus clasificadores en los últimos años [25], [26], [27], [28], [29].

Tal como se describe en la Sección "método de predicción", los métodos de este estudio puede proporcionar una serie de cánceres candidatos para un medicamento consulta dada. El
j-ésimo
precisión de la predicción fin se calcula mediante la siguiente fórmula [7], [8] :( 8) donde
N
es el número total de medicamentos en el conjunto de datos y es la número de fármacos tales que su
j-ésimo
predicciones son los verdaderos cánceres que se pueden tratar. Es obvio que mide la calidad de la
j-ésimo
predicción de orden. Si los verdaderos cánceres que un fármaco consulta puede tratar se colocan en orden inferior, se considera como un resultado óptimo predicho. Por lo tanto, alta con un bajo número de pedido
j
y baja con el número de orden superior
j
indican un buen rendimiento del clasificador. . Es el indicador más importante del rendimiento del clasificador

Para evaluar los métodos más a fondo, se calculó la precisión de la predicción sobre el cáncer para el
i-ésimo orden
predicción de la siguiente manera: (9 ) donde
N
j
es el número de medicamentos que pueden tratar el cáncer en el conjunto de datos y es el número de fármacos de manera que su
i-ésimo
predicción fin se predijo correctamente para el tratamiento de .
cáncer
Además, se tomó otra medida, que fue adoptada en algunos estudios anteriores [6], [7], [8] y se puede calcular de la siguiente manera: (10) donde
m
representa el primer
m
predicciones que se toman en consideración, es el número de las predicciones correctas de la
i-th
compuesto de drogas entre sus primeros
m
predicciones ,
n
i
es el número de cánceres que el
i-
º compuesto de fármaco puede tratar. Es fácil deducir que significa que la proporción de todos los cánceres verdaderos que las muestras en el conjunto de datos pueden tratar cubiertos por los primeros
m
predicciones de cada muestra en ella. Se puede ver en la figura 1 que los diferentes compuestos de fármacos pueden tener un número diferente de tipos de cáncer que pueden tratar. En vista de esto, el parámetro
m
en la ecuación. 10 por lo general toma el valor de los más pequeños, pero no menos que el número medio de cánceres que los compuestos de fármacos en el conjunto de datos se pueden tratar. Se puede calcular

(11) En términos generales, mayor puede indicar un mejor rendimiento del método.

Resultados y Discusión

Tal como se describe en la sección "Materiales", el punto de referencia S conjunto de datos se divide en un conjunto de datos de entrenamiento S
tr y un conjunto de datos de pruebas de validación S
te, que contenía 59 drogas y 9, respectivamente. Además, un conjunto de datos de prueba S
ite independiente que contiene 44 medicamentos se construyó para probar la generalización del método. El método predicho introducido en la sección "El método basado en la interacción química-químicas" se utiliza para hacer la predicción. Los resultados predichos detallados se dan de la siguiente manera.

Comportamiento del método Sobre la base de las interacciones químicas-químicas en la formación de datos

En cuanto a los 59 fármacos en el conjunto de datos de entrenamiento S
tr, el predictor fue realizado y evaluado por la prueba de la navaja de bolsillo. Figura en la columna 2 de la Tabla 2 son los 8 precisión de la predicción calculados por la ecuación. 8, de la que podemos ver que el 1
st exactitud de predicción de orden era 55.93%, mientras que la exactitud 2
nd predicción orden fue 22.73%. También se observa desde la columna 2 de la Tabla 2 que los predicción de precisión en general, siguieron una tendencia descendente con el aumento del número de pedido, lo que indica que el método propuesto arregló los cánceres candidatos en la formación de datos bastante bien. En detalle, para cada predicción fin, se calculó la precisión de cada tipo de cáncer según la Ec. 9, ellas en fila 2-9 de la Tabla 3. Se puede observar que la mayoría de la exactitud 0.00% ocurrieron cuando el orden de predicción fue alta, lo que indica que para cada tipo de cáncer, se predice mejor con número de orden inferior de las predicciones. El número medio de cánceres que las drogas en S
tr pueden tratar fue de 1,31 (77/59), calculado por la ecuación. 11. Esto significa que la tasa de éxito promedio sería sólo de 16,38% si los hacen predicción mediante conjeturas al azar,
es decir
asignar al azar una indicación de cáncer a cada muestra, que es mucho más bajo que el orden 1
st precisión de la predicción obtenida por nuestro método. Debido a que el número promedio de los cánceres de un medicamento puede tratar es de 1.31, las 2 primeras predicciones de orden de cada muestra en S
tr se tomaron para calcular la proporción de verdaderos cánceres que muestras en S
tr pueden tratar cubiertos por estas predicciones de acuerdo con la Ec. 10, obteniendo una proporción de 61,04%.

Comportamiento del método Sobre la base de las interacciones químicas-químicas en la Prueba de validación de datos

En cuanto a los medicamentos 9 en la validación datos de prueba S
te, sus cánceres candidatos fueron predichas por el método descrito en la sección "el método basado en la interacción química-químicas" en base a la información de las drogas en el S
tr. 8 precisión de la predicción calculados por la ecuación. 8 fueron listadas en la columna 3 de la Tabla 2. Se puede observar que el 1
st precisión de la predicción orden era 55.56%, mientras que el
nd orden 2 uno era del 66,67%. También se observa de la Tabla 2 que la precisión de predicción de este conjunto de datos fueron generalmente mayores que las de la formación de datos, debido al hecho de que los medicamentos en S
te pueden tratar dos o más de dos tipos de cáncer, mientras que la mayoría de las drogas en S
tr sólo pueden tratar un tipo de cáncer. Del mismo modo, se calculó la precisión de cada tipo de cáncer para el 1
er, 2
nd, ..., 8
º predicción de orden por la Ec. 9. Fila 10-17 de la Tabla 3 que aparece. El número medio de cánceres que las drogas en S
te pueden tratar fue de 3,78 (34/9), lo que indica que si los hacen predicción mediante conjeturas al azar, la tasa de éxito promedio sería 47,22%, lo que es significativamente menor que el 1
ª y 2
nd precisiones de orden que se indica en la columna 3 de la Tabla 2. Esto sugiere que el rendimiento del método en el conjunto de datos de prueba de validación es bastante buena. Dado que el número promedio de los cánceres que las drogas en S
te puede tratar fue de 3,78, las 4 primeras predicciones de orden de cada muestra en S
te fueron considerados. De acuerdo con la Ec. 10, 61,76% de los cánceres verdaderos se predijo correctamente por los primeros 4 predicciones de orden.

Comportamiento del método Sobre la base de las interacciones químicas-químicos en el conjunto de datos de prueba independiente

Los cánceres de candidatos de los 44 drogas en el conjunto de datos de pruebas independiente S
ite también fueron predichas por nuestro predictor en base a la información de medicamentos en S
tr. 8 precisión de la predicción se obtuvieron y se enumeran en la columna 4 de la Tabla 2, a partir del cual podemos ver que el 1
st exactitud de predicción de orden era 59.09%, mientras que la precisión 2
nd predicción orden fue 29,55%. Para evaluar mejor el método, la predicción precisiones para cada tipo de cáncer para los 8 predicciones orden fueron calculados por la ecuación. 9 y que figuran en la fila 18-25 en la Tabla 3. El número medio de cánceres que las drogas en S
ite pueden tratar fue de 1,32 (58/44), lo que sugiere que si los hacen predicción mediante conjeturas al azar, la tasa de éxito promedio haría al 16.5%, lo cual es mucho menor que la precisión de la predicción para 1
er obtenido por nuestro método. Debido a que el número medio de indicaciones de fármacos fue de 1,32, la primera predicción 2 fin de cada muestra en S
ite fue considerado. De acuerdo con la Ec. 10, 67.24% de los cánceres verdaderos se predijo correctamente por los 2 primeros predicciones de orden.

Comparación con otros métodos

Para indicar la eficacia de nuestro método para la predicción de drogas indicaciones de cáncer, algún otro métodos fueron construidos para hacer la comparación.

El método basado en descriptores moleculares descritos en la sección "El método basado en descriptores moleculares" se llevó a cabo en el S
tr con su rendimiento evaluado mediante la prueba de la navaja de bolsillo. Las 8 precisión de la predicción calculan por la ecuación. 8 fueron enumerados en la columna 2 de la Tabla 4, a partir del cual podemos ver que el 1
er orden precisión de la predicción era del 41,38%. Es mucho más baja que la precisión de la predicción para 1
er de 55,93% obtenido por el método basado en la interacción química-químicas. Además, por los medicamentos en S
te y S
ite, sus indicaciones de cáncer fueron predichas por los descriptores moleculares en S
tr. Los precisión de la predicción se enumeran en la columna 3 y 4 en la Tabla 4. En detalle, el 1
er orden precisión de la predicción de S
te y S
ite fueron 55.56% y 44.19%, respectivamente. En comparación con los precisión de la predicción de 55,56% sobre el S
te y 59,09% en S
ite mediante interacciones químicas, que se lleva a cabo en el mismo nivel en el S
te, y las interacciones químicas son mucho mejores que los descriptores químicos en S
ite. Además, se consideró que los primeros 2-orden, 4-orden y 2-orden predicciones sobre el S
tr, S
TE, y S
ite debido al número medio de cánceres que los medicamentos en estos conjuntos de datos puede tratar. La proporción de cánceres verdaderos que las muestras en S
tr, S
te, y S
ite podemos tratar prevista en estas predicciones eran 51,39%, 58,82% y 49,12%, respectivamente, que eran todos más baja que la proporciones de 61,04%, 61,76% y 67,24%, correspondiente, respectivamente, obtenido por el método basado en las interacciones químicas-químicas. Por lo tanto, el método basado en las interacciones químicas fue superior a la del método basado en descriptores moleculares.

Como se ha descrito en las tres secciones anteriores, el rendimiento de nuestro método fue mucho mejor que la de las conjeturas al azar , que asignó al azar a una indicación de cáncer a un fármaco consulta. A continuación, se aplicó otro método de conjeturas al azar para evaluar nuestro método desde un aspecto diferente. Para cualquier consulta de drogas
D
q
, se seleccionaron al azar un compuesto de drogas en el conjunto de entrenamiento, dicen
d
, y asignados verdaderos cánceres que
d
puede tratar a
D
q
,
es decir
los cánceres predichos de
D
q
eran iguales que los verdaderos cánceres que
d
puede tratar. Puesto que no hay información de la orden en los cánceres de candidatos previsto para cada muestra, las medidas previstas por la sección "Validación y evaluación" no puede evaluar el desempeño de este método. Por lo tanto, recordar y precisión [30], [31] fueron empleados para evaluar su desempeño, que puede ser computada por. (12) donde es el número de cánceres predichos correctos para el compuesto de drogas -th
i
, representa el número de cánceres que el
I
compuesto fármaco-ésimo puede tratar, representa el número de cánceres pronosticados para el
i
compuesto fármaco-ésima, y ​​
N es
número total de muestras analizadas.

el método conjetura al azar descrito en el párrafo anterior se llevó a cabo en el S
tr con su rendimiento evaluado mediante la prueba de la navaja de bolsillo. La precisión y la recuperación fueron 15.29% y 16.88%, respectivamente. Para los resultados previstos sobre S
tr por las interacciones químicas-químicas, recogieron el 1
st predicción de orden de cada muestra, obteniendo precisión del 55,93% y el retiro del mercado de 42,86%, que eran mucho más altos que el método conjetura al azar .

es fácil ver que nuestro método depende profundamente en las puntuaciones de confianza de las interacciones químicas-químicas. Para probar la importancia de estos resultados, hemos intercambiado al azar las puntuaciones de confianza de algunas interacciones. Sobre la base de las permutaciones aleatorias, los datos se evaluaron mediante la prueba de la navaja de bolsillo en el conjunto de datos de entrenamiento S
tr. El 1
exactitud st predicción orden era 23.73%, mientras que las otras precisión de la predicción de 2
ª, 3
er, ..., 8
th predicción orden eran 18,64%, 11,86%, 18,64%, 20,34%, 15,25%, 13,56%, 8,47%, respectivamente. Se observa que el 1
er orden precisión de la predicción obtenida por permutación aleatoria fue mucho menor que el 55,93% obtenido por las interacciones químicas. Por otra parte, los 8 precisión de la predicción no se siguieron una tendencia descendente con el aumento del número de pedido, lo que indica que los cánceres candidatos no estaban dispuestos también. Esto implica que las puntuaciones de confianza son muy importantes para las predicciones.

Discusión

26 1
er orden predicciones eran "mal" en la formación de datos, es decir, las indicaciones de cáncer predichos de estos fármacos no se registraron en KEGG. Estos 26 drogas y sus predicciones 1 de orden
st estaban disponibles en el cuadro S3. Sin embargo, algunas referencias informaron que 23 de estos 26 fármacos eran realmente eficaz para sus indicaciones "erróneas", y fue la misma con 3 de los 4 fármacos en el conjunto de datos de prueba de validación (Ver Tabla S3 para los detallados 4 fármacos y su 1
st predicción de orden) y 13 de los 18 fármacos en el conjunto de datos de pruebas independiente (Ver Tabla S3 para detallados 18 fármacos y su
predicción de orden 1 st). Por lo tanto, esperamos que nuestro modelo de predicción puede proporcionar alguna información de reposicionamiento de fármacos. En los siguientes párrafos, que citamos algunas referencias para apoyar a nuestros resultados predichos.

veintitrés pares pronosticada errónea de Drogas y Indicación en la formación de datos

cisplatino-cánceres de tejidos hematopoyético y linfoide.

El cisplatino (KEGG ID: D00275) ", de la penicilina del cáncer", es ampliamente prescrito para muchos tratamientos contra el cáncer, como el de testículo, ovario, vejiga, pulmón, cánceres de estómago y el linfoma [32], [33 ], [34]. Prasad
et al.
Investigó el efecto del cisplatino sobre el linfoma de Dalton, y concluyó que el cisplatino puede inducir la regresión completa de la ascitis del linfoma de Dalton en ratones [35].

ifosfamida Los cánceres de hematopoyético y tejidos linfoides.

ifosfamida (D00343) se puede utilizar para el tratamiento de células germinales cáncer testicular, cáncer cervical, cáncer de pulmón de células pequeñas, linfoma no Hodgkin, y así sucesivamente [36]. Extranodal natural killer /linfoma de células T, tipo nasal (ENKL) es de Epstein-Barr neoplasias linfoides asociados a virus, y los pacientes con estadio IV, en recaída o refractario ENKL tienen un pronóstico desalentador. Yamaguchi
et al.
Exploró una nueva sonrisa régimen, incluyendo el esteroide dexametasona, metotrexato, ifosfamida, L-asparaginasa, y etopósido, y concluyó que la sonrisa era eficaz para este tipo de enfermedad [37], [38] .

lomustina-cánceres de tejidos hematopoyético y linfoide.

la lomustina (D00363) es un componente de la quimioterapia de combinación para el tratamiento de los tumores cerebrales primarios y metastásicos, y también se utiliza como tratamiento secundario para refractaria o una recaída de la enfermedad de Hodgkin [39]. Por otra parte, estudios previos indicaron que lomustina puede considerarse para el tratamiento de linfoma canino en perros [40], [41], [42], [43], aunque indujo común, pero no amenaza la vida toxicidad [44].

mitotano-cánceres del sistema urinario y los órganos genitales masculinos.

el mitotano (D00420) es el fármaco de primera línea para el carcinoma metastásico de la corteza suprarrenal [45], [46], [47], y también utilizado para la terapia adyuvante después de la extirpación del tumor primario [48]. Sin embargo, el tratamiento con mitotano puede provocar algunos efectos secundarios, tales como la insuficiencia suprarrenal y el hipogonadismo masculino [49].

procarbazina-cánceres de tejidos hematopoyético y linfoide.

La procarbazina (D00478) se utiliza para tratar leucemias humanas [50].

El conocimiento de la salud

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]