Extracto
La agrupación de análisis es una herramienta importante en el estudio de los datos de expresión génica. La agrupación jerárquica (BHC) algoritmo bayesiano puede inferir automáticamente el número de grupos y utiliza la selección del modelo bayesiano para mejorar la calidad de la agrupación. En este trabajo, presentamos una extensión del algoritmo de BHC. Nuestra BHC (GBHC) algoritmo de Gauss representa los datos como una mezcla de distribuciones gaussianas. Utiliza distribución normal-gamma como un conjugado antes en la media y la precisión de cada uno de los componentes gaussianos. Hemos probado GBHC más del 11 por cáncer y 3 conjuntos de datos sintéticos. Los resultados en los conjuntos de datos de cáncer muestran que en la agrupación de la muestra, GBHC en promedio produce una partición de la agrupación que es más concordante con la realidad del terreno que los obtenidos de otros algoritmos de uso común. Por otra parte, con frecuencia GBHC infiere el número de grupos que a menudo cerca de la realidad del terreno. En la agrupación de genes, GBHC también produce una partición de la agrupación que es más biológicamente posible que varios otros métodos del estado de la técnica. Esto sugiere GBHC como una herramienta alternativa para el estudio de la expresión génica datos
La aplicación de GBHC está disponible en https://sites.google.com/site/gaussianbhc/
Visto:. Sirinukunwattana K , Savage RS, Bari MF, Snead DRJ, Rajpoot NM (2013) Bayesiano agrupación jerárquica para estudiar el cáncer de la Expresión génica de datos con Desconocida Estadística. PLoS ONE 8 (10): e75748. doi: 10.1371 /journal.pone.0075748
Editor: Ferdinando Di Cunto, Universidad de Turín, Italia