Extracto
Los avances en las tecnologías de microarrays de ADN han hecho los perfiles de expresión génica a un candidato importante en la identificación de diferentes tipos de cánceres. Los métodos tradicionales de identificación de cáncer basados en el aprendizaje utilizan muestras marcadas para entrenar a un clasificador, pero no son convenientes para la aplicación práctica ya que las etiquetas son bastante caros en la comunidad de investigación clínica del cáncer. Este documento propone un método semi-supervisado proyectiva no negativo matriz de factorización (Semi-PNMF) para aprender un clasificador eficaz de ambas muestras etiqueta y etiqueta, aumentando así el rendimiento posterior clasificación de cáncer. En particular, semi-PNMF aprende conjuntamente un subespacio no negativo a partir de muestras etiqueta y etiqueta concatenados e indica las clases por las posiciones de las entradas máximas de sus coeficientes. Debido semi-PNMF incorpora información estadística de la gran cantidad de muestras sin etiqueta en el subespacio aprendido, se puede aprender más representativos subespacios y aumentar el rendimiento de clasificación. Hemos desarrollado una regla de actualización multiplicativo (MUR) para optimizar Semi-PNMF y demostró su convergencia. Los resultados experimentales de cáncer de clasificación para dos conjuntos de datos de múltiples clases de perfiles de expresión génica del cáncer muestran que la semi-PNMF supera a los métodos representativos
Visto:. Zhang X, Guan N, Jia Z, X Qiu, Luo Z (2015) Semi -Supervised proyectiva factorización no negativo matriz de clasificación para el cáncer. PLoS ONE 10 (9): e0138814. doi: 10.1371 /journal.pone.0138814
Editor: Ramin Homayouni, Universidad de Memphis, Estados Unidos