Extracto
La predicción de la estadificación del cáncer en cáncer de próstata es un procedimiento para estimar la probabilidad de que el cáncer se ha diseminado antes del tratamiento se da al paciente. Aunque importante para determinar el tratamiento más adecuado y la estrategia de gestión óptimo para los pacientes, puesta en escena continúa presentando desafíos importantes para los clínicos. resultados de los ensayos clínicos, tales como el nivel de pretratamiento del antígeno prostático específico (PSA), la biopsia patrón de tumor más frecuente (patrón primario de Gleason) y el segundo patrón de tumor más frecuente (Secundaria patrón de Gleason) en biopsias de tejido, y el estadio T clínica puede ser utilizado por los médicos para predecir el estadio patológico de cáncer. Sin embargo, no todos los pacientes proporcione resultados anormales en todas las pruebas. Esto influye de manera significativa la capacidad de predecir con eficacia la etapa del cáncer de próstata. En esto hemos desarrollado un modelo de inteligencia computacional neuro-difuso para la clasificación y la predicción de la probabilidad de que un paciente con enfermedad confinada-Organ (TOC) o extra-prostática Enfermedad (ED) utilizando un conjunto de datos de paciente con cáncer de próstata obtenido a partir del Genoma del Cáncer Atlas (TCGA ) Red de Investigación. La entrada del sistema constaba de las siguientes variables: los patrones de biopsia primaria y secundaria de Gleason, los niveles de PSA, la edad al momento del diagnóstico, y el estadio T clínica. El rendimiento del sistema neuro-difuso se comparó con otros enfoques basados en la inteligencia computacional, a saber, la Red Neuronal Artificial, Fuzzy C-Means, máquinas de vectores soporte, los clasificadores de Bayes ingenuo, y también el AJCC pTNM Staging nomograma que se utilizan comúnmente por los médicos . Una comparación de los puntos óptimos característica de funcionamiento del receptor (ROC) que se identificaron utilizando estos enfoques, reveló que el sistema neuro-difuso, en su punto óptimo, devuelve el mayor área bajo la curva ROC (AUC), con un bajo número de falsos positivos (FPR = 0,274, TPR = 0,789, AUC = 0,812). El enfoque propuesto es también una mejora sobre el nomograma de clasificación AJCC pTNM (
FPR
= 0,032,
TPR
= 0,197,
AUC
= 0,582).
Visto: Cosma G, G Acampora, Brown D, Rees RC, Khan M, Pockley AG (2016) Predicción de la etapa patológica en pacientes con cáncer de próstata: Modelo Neuro-Fuzzy. PLoS ONE 11 (6): e0155856. doi: 10.1371 /journal.pone.0155856
Editor: Daotai Nie, Escuela de Medicina de la Universidad del Sur de Illinois, Estados Unidos |
Recibido: 14 Julio, 2015; Aceptado: 5 Mayo de 2016; Publicado: Junio del 3, 2016
Derechos de Autor © 2016 Cosma et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Disponibilidad de datos:. El conjunto de datos y el código están disponibles al público en Figshare: https://figshare.com/account/articles/3369901 DOI: 10.6084 /m9.figshare.3369901
Financiación:. Este estudio fue financiado por la puesta en clínica NHS Nottingham City la asignación del grupo de INDH Financiación de la Investigación de Capacidad (Número de contrato: CCG /NTU /02 /RCF /13-14). Los autores también desean agradecer el apoyo financiero de la Fundación John y Lucille van Geest y el iNet Salud y Biociencias, una iniciativa financiada por el FEDER gestionados Medilink East Midlands. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:. El estudio fue financiado en parte por el iNet Salud y Biociencias, una iniciativa financiada por el FEDER gestionados por la fuente comercial Medilink East Midlands. No hay patentes, productos en desarrollo, o los productos comercializados que declarar. Esto no altera la adhesión de los autores a todas las políticas de PLoS ONE sobre los datos y compartir materiales, como se detalla en línea en la guía para los autores.
Introducción
predicción La estadificación del cáncer es un proceso para la estimación la probabilidad de que la enfermedad se ha extendido antes del tratamiento se le da al paciente. Evaluación estadificación del cáncer se produce antes (es decir, en la fase de pronóstico) y después (es decir, en la fase de diagnóstico) se extirpa el tumor-las etapas clínicas y patológicas, respectivamente. La etapa de evaluación clínica se basa en los datos obtenidos de las pruebas clínicas que están disponibles antes del tratamiento o la extirpación quirúrgica del tumor. Hay tres pruebas de estadificación clínica primaria para el cáncer de próstata: la prueba de antígeno prostático específico (PSA), que mide el nivel de PSA en la sangre; una biopsia que se utiliza para detectar la presencia de cáncer en la próstata y para evaluar el grado de agresividad del cáncer (los resultados se dan usualmente en la forma de la primaria y los patrones de Gleason secundaria); y un examen físico, a saber, el examen rectal digital (DRE), que puede determinar la existencia de la enfermedad y posiblemente proporcionar información suficiente para predecir el estadio del cáncer. Una limitación de la prueba de PSA es que los niveles anormalmente altos de PSA pueden no necesariamente indicar la presencia de cáncer de próstata, ni podrían niveles normales de PSA reflejar la ausencia de cáncer de próstata. La estadificación patológica puede ser determinada después de la cirugía y el examen del tejido tumor extirpado, y es probable que sea más precisa que la clasificación clínica, ya que permite una visión directa de la extensión y naturaleza de la enfermedad. Más información sobre los ensayos clínicos se proporciona en la siguiente subsección
Médico Antecedentes
.
Dado el potencial poder pronóstico de las pruebas clínicas, una variedad de sistemas de predicción de estadificación del cáncer de próstata se han desarrollado. La capacidad de predecir el estadio patológico de un paciente con cáncer de próstata es importante, ya que permite a los médicos determinar mejor las estrategias de tratamiento y manejo óptimos. Este es un beneficio considerable del paciente, ya que muchas de las opciones terapéuticas pueden estar asociados con significativos a corto y largo plazo los efectos secundarios. Por ejemplo, la prostatectomía radical (PR): extirpación quirúrgica de la glándula de la próstata: ofrece la mejor oportunidad para la curación de la enfermedad cuando se localiza el cáncer de próstata, y la predicción precisa del estadio patológico es fundamental para determinar qué pacientes se beneficiarían más de este enfoque [1-3]. Actualmente, los médicos utilizan nomogramas para predecir un resultado clínico pronóstico para el cáncer de próstata, y estos se basan en métodos estadísticos como la regresión logística [4]. Sin embargo, la estadificación del cáncer continúa presentando desafíos importantes para la comunidad clínica.
Los nomogramas de estadificación del cáncer de próstata que se utilizan para predecir la fase patológica del cáncer se basan en los resultados de los ensayos clínicos. Sin embargo, la exactitud de los nomogramas es discutible [5, 6]. Briganti et al. [5] sostiene que los nomogramas son herramientas precisas y que "la medicina personalizada reconoce la necesidad de ajustes, de acuerdo con las características de la enfermedad y de acogida. Es tiempo de abrazar la misma actitud en otras disciplinas de la medicina. Esto incluye oncología urológica, donde nomogramas, regresión de los árboles, tablas de búsqueda y redes neuronales representan las principales herramientas capaces de proporcionar predicciones individualizados ". Dr. Joniau en [5] sostiene que los datos utilizados para la elaboración de los nomogramas son subjetivos y, en cierta medida, sesgada por los protocolos institucionales sobre los cuales se seleccionan los pacientes para un tratamiento dado. Dr Joniau establece que uno de los inconvenientes de los nomogramas es que varios nomogramas se han ideado para la estimación del riesgo y es difícil determinar qué nomograma proporcionará la estimación del riesgo más fiable para un paciente particular. Se hace hincapié en que a pesar de nomogramas permiten la evaluación del riesgo más precisa, esta estimación del riesgo es una "instantánea en un continuo riesgo". Aunque esto podría permitir predicciones personalizadas, sino que también hace difícil las decisiones de tratamiento [5].
Los sistemas de predicción de cáncer que tienen en cuenta diversas variables para la predicción de un resultado requerir métodos computacionales inteligentes para los resultados de predicción eficientes [7]. Aunque los enfoques de inteligencia computacional se han usado para predecir los resultados de cáncer de próstata, muy pocos modelos para la predicción de la fase patológica del cáncer de próstata existir. En esencia, los modelos de clasificación basados en inteligencia computacional se utilizan para tareas de predicción. La clasificación es una forma de análisis de datos que extrae modelos clasificador que describen clases de datos, y utiliza estos modelos para predecir etiquetas de categorías (clases) o valores numéricos [8]. Cuando se utiliza el clasificador para predecir un valor numérico, en oposición a una etiqueta de clase, que se conoce como un predictor. La clasificación y la predicción numérica son los dos tipos de problemas de predicción [8], y los modelos de clasificación son ampliamente adoptados para analizar los datos del paciente y extraer un modelo de predicción en el entorno médico.
enfoques de inteligencia computacional, y, en particular, basada en fuzzy enfoques, se basan en modelos matemáticos que han sido desarrolladas especialmente para hacer frente a la incertidumbre y la imprecisión que se encuentra típicamente en los datos clínicos que se utilizan para el pronóstico y el diagnóstico de enfermedades en los pacientes. Estas características hacen de estos algoritmos una plataforma adecuada en la cual basar nuevas estrategias para el diagnóstico y la estadificación del cáncer de próstata. Por ejemplo, no todas las personas diagnosticadas con cáncer de próstata exhibirá resultados anormales en todas las pruebas, como consecuencia de lo cual, las diferentes combinaciones de resultados de la prueba pueden conducir al mismo resultado.
La capacidad del difusa, y especialmente neuro-fuzzy enfoques, para predecir el estadio patológico de cáncer de próstata no se ha evaluado lo más ampliamente la red neuronal artificial utilizada con mayor frecuencia (ANN) y otros enfoques. Sin embargo, los enfoques difusos se han aplicado a otros escenarios de cáncer de próstata. Benechi et al. [9] han aplicado el Co-Active Neuro-Fuzzy sistema de inferencia (CANFIS) para predecir la presencia de cáncer de próstata; Keles et al. [10] propuso un sistema neuro-difuso para predecir si una persona tiene cáncer o hiperplasia prostática benigna (BPH, un agrandamiento benigno de la próstata). Çinar [11] diseñó un sistema experto basado en clasificador para el diagnóstico precoz del cáncer de próstata, ayudando de este modo el proceso de toma de decisiones e informar a la necesidad de una biopsia. Castanho et al. [12] desarrolló un sistema experto difuso-genética que combina PSA sérico preoperatorio, el estadio clínico, y el grado de Gleason de la biopsia para predecir la fase patológica del cáncer de próstata (es decir, si se limita o no limita-).
Saritas et al. [13] ideado un enfoque ANN para el pronóstico del cáncer que se puede utilizar para ayudar a las decisiones clínicas relacionadas con la necesidad de una biopsia. Shariat et al. [14] han realizado una revisión crítica de herramientas de predicción de cáncer de próstata y llegado a la conclusión de que las herramientas de predicción pueden ayudar en los procesos de toma de decisiones complejas, y que pueden proporcionar estimaciones individualizadas, basadas en la evidencia de estado de la enfermedad en pacientes con cáncer de próstata.
Por último, Tsao et al. [15] desarrollaron un modelo ANN para predecir el cáncer de próstata estadificación patológica en 299 pacientes antes de la prostatectomía radical, y encontraron que el modelo ANN fue superior en la predicción de órganos enfermedad confinada en el cáncer de próstata que un modelo de regresión logística. Tsao et al. [15] También se comparó su modelo de ANN con las Tablas de Partin, y se encontró que el modelo ANN predice con mayor precisión el estadio patológico de cáncer de próstata
.
En este documento se propone un modelo neuro-difuso para predecir la fase patológica del cáncer de próstata . Las entradas del sistema comprenden las siguientes variables: el patrón más común de tumor (patrón primario de Gleason), el segundo patrón más común (Secundaria patrón de Gleason), los niveles de PSA, la edad al momento del diagnóstico y estadificación T clínica. El modelo neuro-difuso construye automáticamente reglas difusas a través de un proceso de formación que se aplica a los registros de pacientes existentes y conocidos y de estado. Estas reglas se utilizan para predecir la etapa del cáncer de próstata de pacientes en un conjunto de validación. El modelo hace uso del sistema de inferencia Neuro-Fuzzy adaptativo que también se utiliza para optimizar el rendimiento predictivo. El resultado para cada registro del paciente es una predicción numérica del «grado de pertenencia 'de cada paciente en la enfermedad confinada-órgano y clases extra-prostática enfermedad.
Antecedentes Médicos
Esta sección describe las variables utilizadas para el diagnóstico.
antígeno prostático específico (PSA).
la prueba de antígeno prostático específico (PSA) es una prueba de sangre que mide el nivel de antígeno prostático específico en la sangre. Aunque tienen limitaciones, la prueba de PSA es actualmente el mejor método para identificar un mayor riesgo de cáncer de próstata localizado. los valores de PSA tienden a aumentar con la edad, y los niveles de PSA total (ng /ml) recomendadas por el Programa de Gestión de Riesgo de cáncer de próstata son los siguientes [16]: 50-59 años,
PSA
≥ 3,0; 60-69 años,
PSA
≥ 4,0; y el 70 y el excedente,
PSA Hotel & gt; 5.0. Los niveles anormalmente altos de PSA y criados pueden, pero no necesariamente, indicar la presencia de cáncer de próstata. El Estudio Europeo de detección del cáncer de próstata reveló que el cribado reduce significativamente la muerte por cáncer de próstata, y que un hombre que se somete a la prueba de PSA tendrá su riesgo de morir por cáncer de próstata reduce en un 29% [17, 18] y [19]. Sin embargo, también hay que señalar que una prueba normal PSA no necesariamente excluye la presencia de cáncer de próstata.
Patrones primaria y secundaria de Gleason.
Se utiliza una muestra de tejido (biopsia) para detectar la presencia de cáncer en la próstata y para evaluar su agresividad. Los resultados de la biopsia de próstata normalmente se proporcionan en forma de la puntuación de Gleason. Para cada muestra de biopsia, los patólogos examinar el patrón tumor más común (patrón primario Gleason) y el segundo patrón más común (Secundaria patrón de Gleason), con cada patrón de ser dado un grado de 3 a 5. Estos grados después se combinan para crear el Gleason puntuación (un número que va de 6 a 10) que se utiliza para describir cómo anormal aparece la arquitectura glandular con un microscopio. Por ejemplo, si el patrón más común de tumor es de grado 3, y el siguiente patrón de tumor más común es el grado 4, la puntuación de Gleason es 3 + 4, o 7. Una puntuación de 6 se considera como enfermedad de bajo riesgo, ya que representa poco peligro de convertirse en agresivos; y una puntuación de 3 + 4 = 7 indica un riesgo intermedio. Debido a que el primer número representa la mayoría de tejido anormal en la muestra de biopsia, un 3 + 4 se considera menos agresivo que un 4 + 3. Las puntuaciones de 4 + 3 = 7, u 8 a 10 indican que la arquitectura glandular es cada vez más anormales y se asocia con enfermedad de alto riesgo que es probable que sea agresivo.
etapas clínicas y patológicas.
la etapa clínica es una estimación de la etapa del cáncer de próstata, y esto se basa en los resultados de el examen rectal digital (DRE). El estadio patológico se puede determinar si un paciente ha tenido una cirugía y por lo tanto está basado en el examen del tejido extirpado. La estadificación patológica es probable que sea más preciso que la estadificación clínica, ya que puede proporcionar una visión directa de la extensión de la enfermedad. En la etapa clínica, hay cuatro categorías para describir la extensión local de un tumor de próstata (T1 a T4). La estadificación clínica y patológica utilizar las mismas categorías, a excepción de que la categoría T1 no se utiliza para la estadificación patológica. En resumen, las etapas T1 y T2 describir un cáncer que es probablemente limitada al órgano, T3 describe el cáncer que empieza a propagarse fuera de la próstata, y T4 describe un cáncer que probablemente ha comenzado a extenderse a los órganos cercanos. Categoría T1 es cuando el tumor no se puede sentir durante el tacto rectal o verse con imágenes como la ecografía transrectal (ETR). Categoría T1 tiene tres subcategorías: cáncer T1a se encuentra por accidente durante una resección transuretral de la próstata (RTUP), que se han realizado para el tratamiento de la hiperplasia benigna de próstata y el cáncer está presente en no más del 5% del tejido extirpado; cáncer T1b se encuentra durante una RTUP, pero está presente en más de 5% del tejido extirpado, y el cáncer T1c se encuentra en una biopsia con aguja que se ha realizado debido a un nivel elevado de PSA. Categoría T2 es cuando el tumor se puede palpar durante un tacto rectal o visto con imágenes, pero todavía parece estar confinado a la glándula prostática. Categoría T2 tiene tres subcategorías: cáncer T2a está en la mitad o menos de un solo lado (izquierdo o derecho) de la próstata; cáncer T2b es en más de un medio de sólo un lado (izquierdo o derecho) de la próstata; y el cáncer de T2c está en ambos lados de la próstata. Categoría T3 tiene dos subcategorías: T3a cáncer se extiende fuera de la próstata, pero no a las vesículas seminales; y el cáncer T3b se ha propagado a las vesículas seminales. Finalmente, el cáncer de categoría T4 se ha convertido en los tejidos cercanos a la próstata (aparte de las vesículas seminales), tales como el esfínter de la uretra, el recto, la vejiga y /o la pared de la pelvis.
El TNM puesta en escena es el sistema más utilizado para la estadificación del cáncer de próstata y tiene como objetivo determinar el grado de:
tumor primario (estadio T), Francia
la ausencia o presencia de afectación de los ganglios linfáticos regionales (estadio N ), y
la ausencia o presencia de metástasis a distancia (fase M) guía empresas
el sistema TNM ha sido aceptada por la Unión Internacional contra el cáncer (UICC) y el American Joint Committee sobre el cáncer (AJCC). La mayoría de los centros médicos usan el sistema TNM como su principal método para la información del cáncer. El TNM clínico y patológico TNM se proporcionan en las Tablas 1 y 2 respectivamente. Una vez que se determinan la T, N, y M, se le asigna una etapa de I, II, III, o IV, con la etapa I ser temprano y ser el estadio IV de la enfermedad avanzada. Al determinar las etapas T, N y M, un pronóstico se puede hacer acerca de la etapa anatómica del cáncer utilizando las agrupaciones se muestra en la Tabla 3, donde se le asigna una etapa de I, II, III, o IV a un paciente, con la etapa I ser temprano y estadio IV es la enfermedad avanzada [20]. Las etapas I, II, son las etapas del cáncer de órganos confinado, mientras que las fases III y IV son etapas extra-prostática. sistemas TNM han pasado por varias mejoras con el fin de "mejorar la uniformidad de la evaluación del paciente y mantener una evaluación clínicamente relevante" [20]. En la más reciente American Joint Committee on Cáncer (AJCC) [21], la puntuación de Gleason y el PSA se han incorporado en la fase de grupos de pronóstico del cáncer /3.
I Métodos -Neuro-Fuzzy Modelo
la lógica difusa es una extensión de la lógica de varios valores que se ocupa de aproximada, en lugar de razonamiento fija y exacta. razonamiento fija es la lógica binaria tradicional donde las variables pueden tomar valores verdadero o falso. La lógica difusa se inicia con el concepto de un conjunto difuso [22], que es un conjunto sin una frontera nítida y claramente definida. Un conjunto difuso puede contener elementos sólo con un grado parcial de los miembros, y por lo tanto permite grados de verdad, por lo que la lógica difusa aplicable a los escenarios médicos que se consideran para involucrar a la complejidad, la incertidumbre y vaguedad. La lógica difusa se ha combinado con varias metodologías de computación flexible, incluyendo neuro-computación, lo que llevará a los sistemas neuro-difuso poderosos.
El sistema neuro-difuso propuesto en este documento (una combinación de algoritmos basados en lógica difusa que se ilustra en la figura 1) predice el estadio patológico de cáncer (es decir, el resultado del diagnóstico), utilizando los datos que se obtienen de las pruebas clínicas preoperatorias que se realizan en la fase de pronóstico. Al igual que con el sistema TNM, nuestro sistema neuro-difuso propuesto predice si un paciente tiene una enfermedad limitada al órgano (TOC, el estadio patológico pT2) o enfermedad extra-prostática (ED, el estadio patológico & gt;
PT página 2).
los datos clínicos utilizados para la predicción de la etapa del cáncer patológica son típicamente afectadas por la imprecisión, debido principalmente al hecho de que no todos los pacientes presentan resultados anormales en todos los ensayos clínicos. Esto plantea un problema cuando se trata de predecir la progresión del cáncer y por lo tanto, decidir sobre la mejor estrategia de tratamiento para los pacientes. Por lo tanto, la lógica difusa es un enfoque adecuado para este tipo de predicción clínica, ya que puede ser utilizado para modelar razonamiento en humanos escenarios reales el clínico consideraría los datos y dar una estimación en lugar de una respuesta definitiva. El sistema neuro-difuso hará una predicción acerca de un paciente en particular y devolver un valor que representa el "grado de pertenencia" del cáncer del paciente en el juego extra-prostática. El marco propuesto se ilustra en la figura 1 y se describe en las subsecciones que siguen
El modelo neuro-difuso comprende dos etapas principales:. El aprendizaje y la predicción. En el
etapa de aprendizaje, el modelo entrena a sí mismo utilizando los registros de pacientes para los que se conoce el estadio patológico, y en el
etapa de predicción
el modelo predice el estadio patológico usando el conocimiento que se ha obtenido durante la etapa de aprendizaje. Las siguientes subsecciones describen los procesos que intervienen en las fases de aprendizaje y de predicción.
Sistema de Entradas
En el
etapa de aprendizaje, el predictor neuro-difusa aprende (es decir, los trenes en sí) a partir de datos de registro de pacientes existentes con el fin de crear el conocimiento que será utilizado (durante el
etapa de predicción
) para hacer predicciones sobre los datos nuevos, y nunca antes vistas,. Durante la etapa de aprendizaje, el sistema toma como datos de entrada en relación con las características clínicas de cada paciente (es decir, la edad al momento del diagnóstico, el PSA, la biopsia patrón primario de Gleason, patrón de Gleason secundaria biopsia y estadio T clínica) y conocidos los resultados de la etapa patológicas (es decir, las salidas conocidas) que se han obtenido durante el diagnóstico. El sistema representa las entradas como una matriz
Una Red de tamaño
n
×
m
, donde
n
es el número total de registros de pacientes, y
m
es el número total de las características clínicas (es decir, entradas del sistema,
m
= 5). El sistema representa los objetivos en la forma de un
n
× 1 vector de T, donde cada celda
t
i
sostiene el estadio T patológico (pT) valor para cada registro del paciente.
en el
etapa de predicción
, el sistema sólo requiere como entrada un 1 ×
m Gráficos vectoriales celebración de los resultados de las características clínicas del paciente (es decir, la edad al momento del diagnóstico, el PSA, la biopsia Gleason patrón primaria, secundaria patrón de Gleason de la biopsia, y la etapa clínica T), y el sistema devolverá un valor que representa la probabilidad de que el paciente tenga la enfermedad extra-prostática (es decir, los resultados de la etapa patológica).
datos Normalización
las variables estadio patológico (pT) la edad, nivel de PSA, estadio T clínica y deben agruparse antes de que se introducen en el predictor más difusa. La normalización de los valores se describe en los
Resultados
Sección. El proceso de normalización se lleva a cabo con el fin de garantizar una distribución equilibrada entre los datos y para eliminar los valores extremos de los datos que podrían afectar al rendimiento del algoritmo de predicción.
Fuzzy C-Means
Formalmente , dejar que
Un
= [
v
1,
v
2
v
3, ...,
v
n
] ser la matriz [casos de registro de pacientes] [-by- características clínicas] y dejar que 2 ≤
C Hotel & lt;
n
sea un número entero, donde
c
es el número de grupos (es decir, las clases) y
n
es el número total de casos de registro de pacientes. En esta aplicación particular, el cáncer de próstata,
c = 2
ya que tenemos dos grupos: Confinado-Órgano de Enfermedades (OCD) y la enfermedad extra-prostática (ED). Los Fuzzy C-Means (FCM) algoritmo devuelve una lista de centros de grupo
X =
x
1, ...,
x
c
y una matriz de miembros de
T
=
μ
i, k
∈ [0, 1];
i
= 1, ...,
n
;
k
= 1, ...,
c
, donde cada elemento
μ
ik
sostiene la composición total de un punto de datos
v
k gratis (es decir, archivo de historias clínicas) que pertenece al grupo
c
i
. FCM actualiza los centros de los cúmulos Confinado-Organ la enfermedad y la enfermedad extra-prostática, y los grados de pertenencia para cada punto de datos, lo que representa un registro de paciente, moviendo de forma iterativa los centros de los conglomerados a la ubicación correcta dentro de un conjunto de datos. Esencialmente, este proceso de iteración se basa en la minimización de una función objetivo que representa la distancia desde cualquier punto de datos dado a un centro de la agrupación ponderado por grado de pertenencia de ese punto de datos. La función objetivo para FCM es una generalización de la ecuación (1) (1) donde
μ
ik
representa el grado de pertenencia de la historia clínica del paciente
v
i
en el
ITH
racimo;
x
i
es el centro de la agrupación de grupo borrosa
i
; || * || es la distancia euclídea entre los
ITH
clúster y
j
punto de datos; y
m
∈ [1, ∞] es un exponente de ponderación. Las condiciones necesarias para la función (1) para llegar a su mínimo se muestran en funciones (2) y (3). (2) (3)
Sugeno-Yusukawa Método
Una colección de Takagi se generan -Sugeno-Kang (TSK) las normas [23], una para cada grupo, para determinar la pertenencia a un registro del paciente a un grupo determinado. Se genera este tipo Sugeno-Sistema de Inferencia Difusa (FIS) utilizando el algoritmo de agrupamiento FCM. El número de grupos derivados del proceso de agrupación determina el número de reglas y funciones de pertenencia en el FIS generado. La estructura FIS mapas de entradas a través de funciones de pertenencia de entrada y los parámetros asociados, y luego a través de funciones de pertenencia de salida y los parámetros asociados a las salidas. La salida de la FIS se introduce en el modelo adaptativo Neuro-Fuzzy sistema de inferencia (ANFIS) [24], que sintoniza entonces los parámetros de la FIS utilizando los datos de entrenamiento de entrada /salida con el fin de optimizar el modelo de predicción.
adaptativo-Neuro Inferencia difusa Sistema
El sistema de inferencia de adaptación Neuro-Fuzzy (ANFIS) [24] combina redes neuronales artificiales y algoritmos de lógica difusa. ANFIS crea un sistema de inferencia borrosa con funciones de pertenencia que se generan por el aprendizaje de retropropagación de adaptación. La arquitectura de un Tipo-3 ANFIS, que es el ANFIS utilizado en el modelo propuesto, se explica en [24]. La siguiente es una breve descripción de ANFIS y se basa en [25]. ANFIS se compone de cinco capas. En la capa 1, cada nodo genera un grado de pertenencia de una variable lingüística (en el escenario de cáncer de próstata, variables lingüísticas son las clases de estadificación, enfermedad confinada-Organ es decir, y la enfermedad extra-prostática) utilizando una función de pertenencia. La función de pertenencia de Gauss se utiliza dentro del modelo neuro-difuso. Capa 2 calcula la fuerza de disparo de cada regla, y la capa 3 calcula la relación de la fuerza de disparo de cada regla al total de todas las concentraciones de disparo. En la capa 4, la contribución de cada regla hacia la salida global se calcula, y, por último, la capa 5 calcula la salida total como la suma de la contribución de cada regla. Durante el proceso de aprendizaje, ANFIS adapta los parámetros asociados a las funciones de pertenencia y les sintoniza utilizando un vector de gradiente que, dado un conjunto de parámetros, mide el rendimiento del sistema sobre la base de qué tan bien los datos modela de entrada y salida. ANFIS se ha utilizado en conjunción con FCM, y por lo tanto el FIS de regresar de la agrupación FCM se introduce en el ANFIS, y los parámetros de la FIS están sintonizados usando los datos de entrenamiento de entrada /salida con el fin de optimizar el modelo de predicción.
el proceso de formación se detiene cuando se alcanza el número designado época, o se logre el objetivo de error. El rendimiento de ANFIS se evalúa usando la matriz de valor eficaz errores cuadrados (diferencia entre la salida FIS y la salida de datos de entrenamiento) en cada época. Por lo tanto, el grado de pertenencia de un registro de pacientes en un grupo determinado (por ejemplo, enfermedad extra-prostática), determina qué tan cerca una predicción es que el siguiente grupo (enfermedad confinada-órgano, por ejemplo). En términos simples, dejar que
c
a
y
c
b
sea clúster extra-prostática Enfermedad y el grupo nización la enfermedad confinada, respectivamente, un registro de paciente
v
k
puede pertenecer al grupo
c
a
tal que
v
k
∈
c
a
, o puede pertenecer en la zona de intersección entre dos grupos de tal manera que
v
k
∈
c
a
∧
v
k ∈
c
b
.
neuro-Fuzzy predictor
El predictor neuro-difusa toma como entrada un vector
X
i Red de tamaño 1 ×
m
, donde
m
es el número total de características clínicas, por lo tanto, 1 × 5 y el registro del paciente que está agrupado organoconfinada la enfermedad o la enfermedad extra-prostática, mediante el algoritmo FCM agrupación [26]. Los predeterminada Takagi-Sugeno-Kang (TSK) las normas [23] A continuación se aplican con el fin de evaluar el grado de pertenencia de la historia clínica del paciente a un grupo determinado. La salida es un valor numérico que representa la probabilidad de que un paciente que pertenece a la agrupación extra-prostática Enfermedades. Este valor es particularmente útil cuando se decide sobre el tratamiento adecuado para ser ofrecido al paciente. Por ejemplo, el tratamiento podría ser diferente si un paciente se predice que tienen la enfermedad limitada al órgano con un valor que se inclina más hacia la enfermedad extra-prostática.
Métodos II-Inteligencia Computacional Otros Enfoques
Artificial clasificador de red neuronal
una red neuronal artificial (ANN) puede ser entrenado para reconocer patrones en los datos, y este es un enfoque adecuado para resolver problemas de clasificación que implican dos o más clases. Para el cáncer de próstata problema de predicción puesta en escena, la ANN está entrenado para reconocer los pacientes que han limitado al órgano o la enfermedad de la enfermedad extra-prostática. El reconocimiento de patrones a la red neural utilizada era una red de alimentación directa de dos capas, en el que la primera capa tiene una conexión de la entrada de red y está conectada a la capa de salida que produce la salida de la red. Un
log-sigmoide función de transferencia
se ha incrustado en la capa oculta, y un
función de transferencia softmax
fue incrustada en la capa de salida.
Una neurona tiene R número de entradas donde R es el número de elementos en un vector de entrada. Deje un vector de entrada X un registro de paciente
X
i
perteneciente a una enfermedad confinada-Organ clase o extra-enfermedad prostática. Cada entrada
X
i
se pondera con un peso adecuado
w
. La suma de las entradas ponderadas y el sesgo forma la entrada a la función de transferencia de
f
. Las neuronas pueden utilizar una función de transferencia diferenciable
f
para generar su producción. La función sigmoide-Log que genera salidas entre 0 y 1 como entrada neta de la neurona va de negativo a positivo se utilizó el infinito. La función de transferencia neural Softmax se utilizó para calcular la producción de una capa a partir de su entrada de red. funciones Softmax convertir un valor en bruto en una probabilidad posterior, lo que proporciona una medida de seguridad. 0,05).