Extracto
Los microARN (miARN) han demostrado ser prometedores biomarcadores para predecir el pronóstico del cáncer. Sin embargo, el procesamiento y el modelado de datos de expresión de genes miARN inadecuada o mal optimizado pueden afectar negativamente al rendimiento de predicción. Aquí, proponemos una solución integral para la selección de biomarcadores miARN y la construcción de modelos de predicción. Este trabajo presenta el uso de una cascada de redes neuronales, una constitución en cascada de pequeñas unidades de redes neuronales artificiales, para evaluar la expresión de los genes miARN y la evolución del paciente. Un conjunto de datos de microarrays miARN del carcinoma nasofaríngeo fue recuperado de la Expresión Génica Omnibus para ilustrar la metodología. Los resultados indicaron una relación no lineal entre la expresión de los genes miARN y el riesgo de muerte del paciente, lo que implica que la comparación directa de los valores de expresión es inadecuada. Sin embargo, este método lleva a cabo la transformación de los valores de expresión de los genes miARN en una puntuación miARN, que mide el riesgo de muerte de forma lineal. correlación de Spearman se calculó entre las puntuaciones de miARN y estado de supervivencia para cada miARN. Por último, una firma de nueve miARN se ha optimizado para predecir el riesgo de muerte después de carcinoma nasofaríngeo mediante el establecimiento de una cascada de redes neuronales que consta de 13 unidades de redes neuronales artificiales. El área bajo la ROC fue de 0,951 para el conjunto de validación interna y tenía una precisión de la predicción de 83% para el conjunto de validación externa. En particular, se encontró que la cascada de la red neuronal establecida para tener una fuerte inmunidad contra la interferencia de ruido que perturbe los valores de expresión de los genes miARN. Este estudio proporciona un método eficiente y fácil de usar que tiene como objetivo maximizar la aplicación clínica de miRNAs en la evaluación del riesgo de pronóstico de los pacientes con cáncer de
Visto:. Zhu W, X Kan (2014) de red neuronal de Cascade Optimiza MicroARN Selección biomarcador de pronóstico del cáncer nasofaríngeo. PLoS ONE 9 (10): e110537. doi: 10.1371 /journal.pone.0110537
Editor: Raffaele A. Calogero, Universidad de Turín, Italia |
Recibido: 7 Agosto, 2014; Aceptado: September 15, 2014; Publicado: 13 Octubre, 2014
Derechos de Autor. © 2014 Zhu, Kan Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio , siempre que el autor original y la fuente se acreditan
disponibilidad de datos:. los autores confirman que todos los datos que se basan los resultados son totalmente disponible sin restricciones. Todos los datos relevantes se encuentran dentro del apoyo de sus archivos de información en papel y
Financiación:. Este trabajo fue apoyado por la Fundación Nacional de Ciencias Naturales de China (Nº 31301136). La fuente de financiación no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
Los microARN (miRNA) pertenecen a una clase de pequeños ($ ~ $ 22 nt) moléculas de ARN no codificantes endógenas. MiRNAs juegan un papel vital en la regulación de la expresión del mRNA y los niveles de proteína de ajuste posttranscriptionally [1], [2]. Hay pruebas sustanciales que se ha demostrado que los miRNAs pueden servir como dianas terapéuticas prometedoras para el tratamiento del cáncer clínica en un futuro próximo [3] - [5]. Mientras tanto, las posibles aplicaciones clínicas de los biomarcadores de diagnóstico y pronóstico son también ampliamente estudiados y sugieren fuertemente la utilidad de la medición de tejido de la biopsia miRNAs circulante y [6] - [8]. Debido a las innovaciones tecnológicas continuas en los últimos años, los métodos de alto rendimiento como los microarrays miARN han tenido éxito en la identificación de biomarcadores potenciales de miles de miRNAs maduros en los seres humanos [9], [10]. Como resultado, estos esfuerzos han dado lugar a una creciente acumulación de datos de expresión de miRNA en la expresión pública de genes de Omnibus (GEO) de bases de datos [11].
Detección simultánea de muchos miRNAs genera un enorme conjunto de datos de los datos biológicos que requiere análisis computacional significativo. Aunque las tecnologías actuales de detección de miRNA ya están muy bien establecidos, todavía no existe un método ampliamente reconocido para analizar la enorme cantidad de datos obtenidos por métodos de alto rendimiento [12]. La gran mayoría de los estudios anteriores supone una relación lineal entre la expresión de los genes miARN y fenotipo de la enfermedad [13] - [15]. Esto dio lugar a una amplia aplicación de métodos estadísticos sencillos tales como Estudiante de
t-test
o el análisis de varianza para la comparación entre los grupos de valores de expresión de los genes miARN. Sin embargo, esta hipótesis no ha sido probado en concreto, o demostrado ser válida. Alternativamente, en lugar de una relación lineal, especuló que una asociación no lineal puede ser posible entre la expresión de los genes miARN y fenotipo de la enfermedad. Esta suposición se basa principalmente en el conocimiento de que miRNAs juegan papeles multifacéticos y complejos en muchos procesos biológicos [16]. Si la relación no lineal es válida, puede implicar que el procesamiento de los datos de expresión de miARN tradicional, analizar y modelar con métodos lineales son insuficientes.
La selección inadecuada de los métodos estadísticos o de modelado puede perjudicar el rendimiento potencial de miRNAs como biomarcadores y dar como resultado la discriminación de los pacientes [17], [18]. Proponemos una manera viable para hacer frente a este problema a través de la transformación de los valores de expresión de los genes miARN en una variable lineal antes de establecer un modelo de diagnóstico o pronóstico. El uso de este método propuesto, el presente estudio tiene como objetivo proporcionar una solución integral y genérica para la selección de biomarcadores miARN y la construcción de modelos de predicción. En los últimos años, el modelado artificial red neural (ANN) se ha aplicado con éxito en el diagnóstico de cáncer y la gestión de [19] - [21]. En este documento, se estableció un nuevo método de modelado de redes neuronales artificiales (ANN) para este propósito: la cascada de la red neuronal (NNC), una cascada extensible y piramidal de pequeñas unidades ANN. Cada unidad tiene ANN pequeña arquitectura de red simple y se limita a tratar con una sola tarea, tales como la transformación de datos, integración de datos, o la salida de predicción. En teoría, un modelo NNC puede acomodar simultáneamente y procesar grandes cantidades de información en paralelo. Incluso si una sola entrada tiene pobre rendimiento predictivo, siempre y cuando se da información de entrada suficiente, está garantizada una predicción final precisa. El número de parámetros de entrada incluido en el modelo depende de los requisitos de precisión colocados en la predicción final.
Para ilustrar mejor nuestro método, hemos desarrollado un modelo de pronóstico Centro Nacional de Nutrición para la evaluación del riesgo de muerte en pacientes con carcinoma nasofaríngeo (NPC) utilizando un conjunto de datos de expresión de miARN recuperado de GEO (conjunto de datos ID: GSE32960). Nuestros resultados sugieren una asociación no lineal entre la expresión de los genes miARN y el riesgo de muerte de los pacientes con diagnóstico de NPC. El modelo establecido NNC mostró una buena predicción de rendimiento mediante la identificación precisa a los pacientes de alto riesgo, incluso en el caso en que los niveles de expresión de los genes miARN se alteraron de manera artificial. En resumen, este esfuerzo tiene como objetivo mejorar la utilidad analítica de miRNAs como biomarcadores clínicos para lograr un diagnóstico preciso y el tratamiento del cáncer individualizada. Nuestro éxito el análisis de casos de NPC pronóstico utilizando el novedoso modelo NNC sugiere que este modelo también será aplicable a diagnóstico y pronóstico de otras enfermedades humanas
Materiales y Métodos
Datos de la expresión de los genes miARN:. Adquisición y pre-procesamiento
El conjunto de datos de expresión de miARN para los pacientes con NPC (GSE32960) fue recuperado de GEO. Sólo se incluyeron los 312 NPC muestras en nuestro estudio. Hemos descargado los valores de expresión de microarrays que se procesan para 873 miRNAs para cada muestra y se registró el estado de supervivencia (vivo: 0 o muerto: 1) del paciente correspondiente. Los valores de microarrays de expresión original de cada miARN se normalizaron luego como números entre 0 y 1 según lo calculado a
MAX_VALUE y MIN_VALUE son los valores mínimo y máximo de expresión de los genes miARN original, y en toda la colección de muestras, respectivamente. Después de eso, las muestras se dividieron al azar en dos grupos: un conjunto de entrenamiento del modelo (n = 208) y un conjunto externo de validación (n = 104). Para las muestras en el conjunto de entrenamiento, el software STATISTICA ANN Redes Neuronales (SNN, Release 4.0E) se utilizó para construir unidades de RNA, que transforman los valores de expresión de los genes miARN miARN en puntuaciones para cada uno de los 873 miRNAs. Las unidades ANN tienen tres capas: la variable de entrada, variables de salida, y una función para conectar los dos. Se utilizaron los valores de expresión de los genes miARN normalizados importados como la variable de entrada y el estado de supervivencia como la variable de salida. Para la capa media, se aplicó la versión avanzada de la herramienta Solver problema Inteligente (IPS) para construir una función de base radial (RBF) -Ann con 11 unidades ocultas. valores de salida de la red se conocen como las puntuaciones miARN, que se consideran asociados linealmente con el riesgo de muerte de los pacientes. El no paramétrico de Spearman coeficiente de correlación (Spearman R) se calculó para evaluar la relación lineal entre los miARN normalizados partitura y estado de supervivencia para cada paciente.
miARN selección de biomarcadores y la construcción de modelos ANN
biomarcadores putativo miRNAs fueron clasificados y seleccionados sobre la base de los valores r de Spearman. En este estudio, hemos elegido para conservar únicamente los nueve miRNAs con los más altos valores de I y descartar los otros. Los normalizadas miARN expresión los valores y las puntuaciones de miARN normalizados de tres miRNAs con los mejores valores de Spearman R (miR-29c, miR-34c-5p, y miR-93) fueron utilizadas para construir los modelos de redes neuronales no transformadas (UNN) y se transformaron red neuronal (TNN), respectivamente. Ambos modelos tienen la misma arquitectura de red (3-11-1). Todas las puntuaciones de miARN de los nueve miRNAs fueron utilizadas para la construcción del nuevo modelo de ANN, lo que hemos llamado la cascada de la red neuronal (NNC). Un NNC se compone de muchas unidades Ann. Cada unidad es un modelo ANN ANN independiente. En un modelo de Centro Nacional de Nutrición, se utilizaron las nueve unidades primarias ANN para los nueve seleccionados miRNAs para transformarlos de los niveles de expresión de los genes miARN en puntuaciones miARN. Cada unidad tenía una arquitectura de red 1-11-1. Después de eso, una unidad de ANN secundaria con un marco 3-11-1 se construyó entonces para integrar las salidas de las tres unidades de transformación de datos. Se necesita un total de tres de estas unidades secundarias para los nueve miRNAs. Por último, una unidad de ANN terciario fue construida para combinar las salidas de las tres unidades de RNA secundarias anteriores. La salida final es una predicción numérica del riesgo de muerte de los pacientes con NPC en base a sus miARN firmas de expresión génica. En particular, hemos llamado a todos los resultados de los modelos como puntuaciones miARN, independientemente de su origen a partir de las unidades de RNA o los modelos compuestos. Además, se proporcionó una descripción detallada de la construcción de modelos Centro Nacional de Nutrición en el texto S1.
Interno y validación externa
El método de validación cruzada retención se utilizó para llevar a cabo la validación interna de cada unidad ANN mediante el uso de la ajustes por defecto de la herramienta a IPS. Las 208 muestras modelo de entrenamiento fueron divididos aleatoriamente en tres grupos, incluyendo conjunto de entrenamiento, aparato de verificación, y el conjunto de las pruebas en una proporción de 02:01:01. La regresión lineal se utilizó para evaluar la consistencia de los productos de la capacitación y el conjunto de prueba. los coeficientes de correlación similares para los conjuntos de entrenamiento y prueba implica la unidad ANN dado tiene buena capacidad de generalización y
viceversa. Por otra parte, un conjunto independiente que consistía en 104 muestras se utilizó para realizar la validación externa de los precisión de la predicción del modelo de Centro Nacional de Nutrición. Además de regresión lineal, un receptor de funcionamiento característico (ROC) análisis de la curva también se realizó para evaluar los efectos de predicción de los modelos UNN, TNN, y NNC usando el software MedCalc (versión 13.0). El valor predictivo positivo (PV) en cada criterio de puntuación de miARN se calcula y se utiliza para estimar la probabilidad de mal pronóstico para los 104 pacientes en el grupo de validación externa.
El análisis estadístico
de Student
t-test
se utilizó para las comparaciones entre los dos grupos de estatus de supervivencia de los pacientes con NPC desde varios aspectos, incluyendo la expresión de los genes miARN, la puntuación de miARN, y la probabilidad de mal pronóstico. El análisis del área bajo la curva ROC (curva ROC) se utilizó para comparación de cada actuación de predicción de riesgo por miARN decenas de diferentes miRNAs, la expresión de los genes miARN, y las puntuaciones de la misma miARN o productos finales de diferentes modelos de RNA [22]. Las diferencias se consideraron estadísticamente significativas cuando
p
. & Lt; 0,05 para todos los métodos estadísticos utilizados en este estudio
Resultados
Nueve miRNAs fueron seleccionados como NPC biomarcadores pronósticos de la 873 miRNAs medidos
en primer lugar, se normalizaron y se procesan los valores de expresión de los genes miARN originales que se han descargado desde el conjunto de datos GEO de la expresión génica en pacientes con NPC (GSE32960). A continuación, las 312 muestras de pacientes fueron divididos aleatoriamente en un conjunto de entrenamiento del modelo y un conjunto de validación externa en una proporción de 02:01. En el conjunto de entrenamiento del modelo, se aplicó pequeños modelos de RNA con arquitectura de red de 1-11-1 para convertir los valores de expresión de los genes miARN miARN en las puntuaciones para cada miARN analizados. El software GraphPad Prism 6.0 a continuación, se utilizó para calcular el Spearman R entre las puntuaciones de los genes miARN y el estado de supervivencia de los pacientes de cada uno de los 873 miRNAs. Por último, entre los 873 miRNAs, nueve miRNAs con los más altos valores de r de Spearman se destacaron: el miR-93, miR-29c, miR-34c-5p, miR-202, miR-145-estrella, miR-1292, miR-26a, miR-30e, y miR-15b (en orden de valor R de Spearman descendente). La puntuación de miR-93 miARN mostró la mejor correlación lineal con el estado de la supervivencia (Figura 1A, Spearman R = 0,3091). Comparativamente, se encontró que la puntuación de let-7 estrellas miARN no estar relacionado con la supervivencia de los pacientes NPC (Figura 1B, Spearman R = 0,0075). Este resultado fue confirmado por nuestro análisis ROC (Figura 1C). La curva ROC del modelo de predicción mediante la puntuación de miARN miR-93 fue significativamente mayor que la del modelo de predicción mediante la puntuación de miRNA let-7e-estrella (
p = 0,0001
). Además, se calculó AUROCs para las otras ocho miRNAs que fueron seleccionados como biomarcadores potenciales para la APN pronóstico. Una relación de correlación rigurosa se reveló entre los valores de Spearman R y los de AUROCs (Figura 1D). Este resultado sugiere que el cálculo de Spearman R o AUROC conduce a una eficacia similar en la capacidad de detectar biomarcadores preferidos de los experimentos de microarrays miARN.
A) Existe una relación lineal significativa entre las normalizadas de miR-93 las puntuaciones y el estado de la supervivencia del paciente. Spearman R = 0,3091;
p Hotel & lt; 0,0001. B) No se encontró relación lineal significativa entre las puntuaciones normalizadas let-7e-estrella y el estado de la supervivencia del paciente. Spearman R = 0,0075;
p Hotel & lt; 0,895. C) Comparación entre la curva ROC los modelos de predicción de riesgo de muerte con el marcador de miR-93 y let-7e-estrella. Se observó una diferencia significativa (
p
= 0,0001). D) Se encontró una relación de correlación lineal de Spearman perfecta entre los valores de R y AUROCs (n = 9).
p
. & Lt; 0,0001
Expresión de nueve candidatos biomarcadores miRNAs se relaciona linealmente con el estado de supervivencia
Los diagramas de dispersión se elaboraron para ilustrar la relación entre la expresión de los genes miARN y puntajes miARN (Figura 2A). Como resultado, no se detectó ninguna relación lineal entre la expresión de los genes miARN y miARN calificaciones de las nueve candidatos biomarcadores miARN seleccionados. A medida que la puntuación de miARN es una variable lineal evaluar el riesgo de muerte de los pacientes con NPC, este resultado indica una relación no lineal entre la expresión de los genes miARN y estados de supervivencia de los pacientes. Este hallazgo también implica que la comparación directa entre pacientes de expresión de los genes miARN puede no ser adecuado para predecir el pronóstico. El miARN miR-15b se utilizó para examinar más a fondo este punto. De acuerdo con el valor R de Spearman, miR-15b fue seleccionado como uno de los nueve biomarcadores miARN preferidos que indican la APN pronóstico. Sin embargo, no se encontró ninguna diferencia en la expresión de miR-15b entre los dos grupos de pacientes con diferentes estados de supervivencia por el estudiante de
t-test
(Figura 2B). Por el contrario, nuestro método de transformación de los valores de expresión de genes miARN en la partitura miARN nos permitió distinguir correctamente entre los dos grupos de pacientes (Figura 2C). En comparación con la expresión de los genes miARN, la puntuación miARN dio una predicción positiva, lo que fue verificado por el análisis ROC (Figura 2D). Resultados similares se observaron también en el miR-34c-5p, miR-145-estrella, miR-202 y miR-1292 (Figura S1).
A) Ilustración de la relación entre la expresión de los genes miARN y miARN normalizado normalizado puntuaciones de los nueve biomarcadores miARN seleccionados. B) No se observó diferencia significativa en la expresión de miR-15b normalizada entre los pacientes con estados de supervivencia de "vivo" y "muerto". La media ± SEM;
p = 0,61
. C) Las puntuaciones de miARN miR-15b fueron significativamente diferentes cuando se compararon los pacientes con estados de supervivencia de "vivo" y "muerto". La media ± SEM;
p Hotel & lt; 0,0001. D) Comparación entre la curva ROC los modelos de predicción de riesgo de muerte utilizando la expresión de los genes miARN y anota miARN de miR-15b, respectivamente. Se encontró una diferencia significativa (
p = 0,0011
).
El modelo NNC mostró la mejor predicción del riesgo de muerte del paciente
En este estudio, hemos construido tres ANN modelos para demostrar aún más la importancia de la transformación lineal de los valores de expresión de los genes miARN en una puntuación de miARN. El modelo UNN fue un modelo ANN tradicional con un marco 3-11-1 red construida usando los valores de expresión normalizados de miARN miR-29c, 34c-miR-5p, andmiR-93 como variables de entrada. Con el mismo marco de la red, el modelo utilizado TNN las puntuaciones normalizadas de estos tres genes miARN miRNAs como variables de entrada. análisis ROC revela un mejor rendimiento de predicción del modelo TNN que la del modelo UNN (Figura 3A). El último modelo de ANN construimos era un modelo NNC, que tenía el marco de red más complejo, la incorporación de 13 unidades de RNA como se muestra en la Figura 3B. El modelo NNC tiene una curva ROC de 0,951, lo que indica que este modelo tiene la mejor capacidad predictiva para distinguir pacientes con diferentes estados de supervivencia (Figura 3A). La validación interna indica que tiene una buena capacidad de generalización para la predicción del pronóstico de los pacientes más allá del conjunto de entrenamiento de modelos (Figura 3B)
UNN: red neuronal no transformada;. TNN: transformó red neuronal; NNC: neuronal cascada de red. Tr y Te representan los coeficientes de correlación entre la variable de salida y la puntuación de miARN conjunto de entrenamiento y las pruebas que figuran en cada unidad de ANN, respectivamente.
El modelo NNC mostró una fuerte inmunidad contra la expresión de los genes miARN perturbado
Gráficos de dispersión muestran más claramente el efecto discriminativo de diferente ANN modelos (Figura 4A). En comparación con UNN o TNN, es fácil identificar que NNC tuvo el mejor desempeño, a pesar del hecho de que los tres modelos podían distinguir significativamente a los pacientes con la condición de supervivencia de "muerto" de los que tienen el estado "vivo" (
p Hotel & lt; 0,0001). El alto rendimiento predictivo de NNC se confirmó cuando se prueba en los 104 pacientes utilizados para la validación externa (Figura 4B). Un análisis más detallado ROC mostró que la precisión de la predicción fue del 83% para la identificación de pacientes de alto riesgo mediante el modelo de NNC establecido aquí. Teniendo en cuenta la diversidad de los pacientes reales en la clínica, también se investigó la capacidad anti-interferencia de diferentes modelos mediante la sustitución de los miARN miR-93 los valores de expresión con los de let-7e estrellas. En este estudio, la puntuación let-7e estrellas miARN había demostrado ninguna relación con el riesgo de muerte de los pacientes diagnosticados de la APN (Figura 1B y C). El resultado de este intercambio se encontró que la UNN no podría sobrevivir si los miR-93 los valores de expresión resultaron gravemente perturbadas (Figura 4C). No hay diferencia significativa en las puntuaciones de los genes miARN entre dos grupos de pacientes en este modelo (
p
= 0,20). Comparativamente, los otros dos modelos, especialmente el modelo de Centro Nacional de Nutrición, todavía mostraron un rendimiento robusto para distinguir el estado de los pacientes.
Las comparaciones de las puntuaciones de miARN se realizaron entre pacientes con diferentes estados de supervivencia en el conjunto de entrenamiento del modelo (A) y la conjuntos de validación externos con aportación de expresión de miR-93 normal (B) y con el miR-93 de entrada de la expresión alterada (C). UNN: red neuronal no transformada; TNN: transformó red neuronal; NNC:. Neuronal cascada red
Además, se evaluó la probabilidad de una mala prognosisfor cada paciente con la APN. La probabilidad media de los pacientes con la condición de supervivencia "vivo" fue de 0,50, lo que indica que todavía existe el riesgo de muerte para este grupo de pacientes (Figura 5A). En comparación con UNN o TNN, NNC estimado con mayor precisión el riesgo de muerte de los pacientes con la condición de supervivencia de "muerto", incluso en la situación en la que la expresión de miR-93 se vio seriamente perturbado (Figura 5B). Este hallazgo sugiere que el modelo NNC puede tener una fuerte inmunidad contra la interferencia de ruido causado por factores desconocidos.
A) normal miR-93 de entrada expresión. B) Entrada de la expresión de miR-93 Disturbed. UNN: red neuronal no transformada; TNN: transformó red neuronal; NNC: neuronal cascada de red. Todos los datos se expresan como media ± SEM.
Discusión
MiRNAs son ampliamente cree que son la clase más prometedora de sustancias endógenas de biomarcadores diagnósticos y pronósticos clínicos para el cáncer [23]. Esta convicción ha llevado a los investigadores de todo el mundo para llevar a cabo las enfermedades específicas de perfiles de expresión de los genes miARN en un extenso campo de la investigación del cáncer [24], [25]. En este estudio, se intenta por primera vez para presentar un método genérico para la traducción de los datos de expresión de genes miARN en lenguaje clínicamente relevantes, tales como la posibilidad de tener cáncer o el riesgo de mal pronóstico debido a que sufre de cáncer. En pocas palabras, un modelo computacional se construyó mediante la integración de muchas unidades ANN pequeña de función única en un sistema de red en cascada. Lo nombramos la cascada de la red neuronal. Hemos demostrado que la cascada de la red neural fue eficiente para identificar el riesgo de muerte de los pacientes con diagnóstico de NPC.
La piedra angular teórica para el modelo NNC establecido aquí es la suposición de que los genes miARN expresión no puede ser linealmente asociada con indicadores fenotipo clínico . Esta hipótesis es razonable y realista, dada la complejidad de la participación de miRNAs en la biología humana [16], [26], [27]. Sobre la base de esta hipótesis, la expresión de los genes miARN debería transformarse en una variable lineal antes de usarlo para evaluar la posibilidad de consecuencias clínicas, como que si un paciente tiene un alto riesgo de muerte por cáncer. Nuestros resultados apoyan la validez de la hipótesis. Encontramos una relación no lineal entre la expresión de los genes miARN y el riesgo de muerte de los pacientes con NPC. Este hallazgo implica la importancia de los genes miARN pre-procesamiento de datos de expresión antes de tomar decisiones clínicas basadas en miARN se hacen
A diferencia de las redes neuronales artificiales tradicionales utilizados previamente en el diagnóstico y manejo [19] - el cáncer. [21], el Centro Nacional de Nutrición hizo no utilice directamente la expresión de los genes miARN. Más bien, el Centro Nacional de Nutrición primera transforma la expresión de genes miARN en una puntuación miARN, una variable lineal para evaluar el fenotipo clínico. Como resultado, la puntuación de los genes miARN en lugar de la expresión de los genes miARN se utilizó para el propósito de la selección de potenciales biomarcadores miARN y toma de decisiones final. En el modelo de NNC, la transformación e integración de datos y la salida de predicción final se logró por etapas. Esto asegura la simplificación de cálculo global de la operación del modelo. Otra ventaja de la NNC es que cada miARN se le asigna un canal independiente para la entrada de información. Por un diseño de este tipo, si se necesitan más miRNAs para una mejor predicción, se puede ampliar la escala del modelo NNC sin aumentar la complejidad de la red de una sola unidad. Esto hace que el modelo de NNC libremente expansible de acuerdo con requisitos específicos. Los datos de expresión de diferentes miRNAs pueden ser considerados como diversa información que contribuya a nuestro conocimiento existente del riesgo de muerte de los pacientes. En nuestro estudio, la inclusión de más miRNAs se tradujo en mejores predicciones. La TNN que contiene tres miRNAs y tenía una curva ROC de 0,862. En contraste, el modelo de NNC tenía una AUROC de 0.951, que contenía 9 miRNAs. Sin embargo, también es posible que un modelo más grande NNC para NPC pronóstico podría contener más de nueve miRNAs. Los nueve miRNAs utilizados en el modelo NNC aquí simplemente sirven como ilustración de la metodología.
Nuestros resultados de la validación externa de la UNN y TNN indican que la transformación lineal de los genes miARN expresión mejora notablemente el efecto de predicción del modelo. Es importante destacar que este procedimiento no aumentó el número de biomarcadores miARN requeridos, lo que implica la ventaja de utilizar una estructura en cascada de RNAs. Además, hemos encontrado que la constitución ANN en cascada tuvo un desempeño más robusto que el modelo tradicional de ANN, donde la variabilidad no explicada en la expresión de miR-93 causó una unidad mal funcionamiento ANN. Aunque no puede estimar el grado de dicha interferencia en el pronóstico de la enfermedad en los entornos clínicos reales, sigue siendo posible que esta variabilidad será un factor importante que impide modelos de predicción basada en los genes miARN en la práctica. La comparación de los modelos TNN y NNC sugiere que la inclusión de más miRNAs aumentaría la solidez del modelo ANN establecida contra el ruido.
En conclusión, nuestro estudio proporciona un método racional y factible para la selección de biomarcadores miARN y la predicción establecimiento modelo . La ventaja de una construcción en cascada de pequeñas unidades de redes neuronales artificiales se refleja en varios aspectos, incluida la capacidad escalable y flexible combinación de insumos de expresión de los genes miARN, una mejor predicción de la estabilidad robusta, y mayores oportunidades para el modelado significativa si el número de biomarcadores miARN no esté limitado. En el futuro, se deben realizar más intentos para validar aún más la aplicación de nuestro enfoque mediante la traducción de los datos de expresión de genes miARN en información clínicamente relevante para el diagnóstico y pronóstico del cáncer.
Apoyo a la Información
Figura S1.
comparación de la expresión de los genes miARN y anota miARN entre los dos grupos de pacientes con diferentes estados de supervivencia. A) miR-26a; B) miR-29b; C) miR-30e; D) miR-34c-5p; E) miR-93; F) miR-145 estrellas; G) miR-202; H) miR-1292. Todos los datos se expresan como media ± SEM
doi:. 10.1371 /journal.pone.0110537.s001 gratis (TIF)
Texto S1.
Un procedimiento paso a paso para la construcción de modelos NNC
doi:. 10.1371 /journal.pone.0110537.s002 gratis (DOCX)