Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Wrangling Phosphoproteomic de datos para dilucidar cáncer de vías de señalización

PLOS ONE: Wrangling Phosphoproteomic de datos para dilucidar cáncer de vías de señalización


Extracto

La interpretación de los conjuntos de datos biológicos es esencial para la generación de hipótesis que guían la investigación, sin embargo, los métodos modernos de análisis global desafío nuestra capacidad de discernir patrones significativos y luego transmitir los resultados de una manera que puede ser apreciado fácilmente . datos proteómicos es especialmente difícil porque los detectores de espectrometría de masas a menudo pierden péptidos en muestras complejas, lo que resulta en conjuntos de datos de baja densidad de población. Usando el lenguaje de programación R y las técnicas del campo de reconocimiento de patrones, hemos ideado métodos para resolver y evaluar grupos de proteínas relacionadas por su patrón de expresión en diferentes muestras de conjuntos de datos proteómicos. Examinamos los datos de tirosina phosphoproteomic de muestras de cáncer de pulmón. Se calcularon diferencias entre las proteínas a base de Pearson o Spearman y correlaciones sobre distancias euclidianas, mientras que se trata de grandes cantidades de datos que faltan. Las diferencias fueron utilizados como vectores de características de agrupamiento y visualización de algoritmos. La calidad de los agrupamientos y visualizaciones fueron evaluados internamente basa en los datos primarios y externamente sobre la base de la ontología de genes y las redes de interacción de proteínas. Los resultados muestran que el t-distribuido vecino estocástico incrustación (t-SNE) seguido por mínimos grupos que abarcan métodos de árboles datos proteómicos dispersos en grupos significativos de manera más eficaz que otros métodos, tales como
k-means
y clásica escalamiento multidimensional. Además, nuestros resultados muestran que el uso de una combinación de correlación de Spearman y la distancia euclidiana como una representación disimilitud aumenta la resolución de las agrupaciones. Nuestros análisis muestran que muchos de estos grupos contienen uno o más tirosina quinasas, e incluyen efectores conocidos, así como proteínas con interacciones conocidas. La visualización de estas agrupaciones como las redes dilucidado vías de transducción de señal de tirosina quinasa previamente desconocidos que impulsan el cáncer. Nuestro enfoque se puede aplicar a otros tipos de datos, y se puede adoptar fácilmente porque se emplean paquetes de software de código abierto

Visto:. Grimes ML, Lee WJ, van der Maaten L, P Shannon (2013) Wrangling Phosphoproteomic Datos para dilucidar cáncer vías de señalización. PLoS ONE 8 (1): e52884. doi: 10.1371 /journal.pone.0052884

Editor: Jorge Sans Burns, Hospital de la Universidad de Modena y Reggio Emilia, Italia

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]