Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: dbCerEx: Una base de datos a través de Internet para el Análisis de Cáncer Cervical Transcriptomes

PLOS ONE: dbCerEx: Una base de datos a través de Internet para el Análisis de Cáncer Cervical Transcriptomes


Extracto

Antecedentes

Los cánceres cervicales se clasifican las dolencias segundos más peligrosa entre las mujeres en todo el mundo. En las últimas dos décadas, las tecnologías de microarrays se han aplicado al estudio de los genes implicados en el progreso malignidad. Sin embargo, en la mayoría de los estudios de microarrays publicados, sólo se informaron unos pocos genes dejando más bien una gran cantidad de datos no usados. Además, los datos de RNA-Seq se ha vuelto más estándar para el análisis del transcriptoma y se aplica ampliamente en estudios de cáncer. Existe una creciente demanda de una herramienta para ayudar a los investigadores experimentales que están dispuestos a explorar la terapia génica contra el cáncer de cuello de útero, pero que carecen de conocimientos informáticos para acceder y analizar los datos de expresión de genes de alto rendimiento.

Descripción

La base de datos dbCerEx está diseñado para recuperar y la expresión génica proceso de datos de muestras de cáncer cervical. Incluye el Genoma amplia perfiles de expresión de las muestras de cáncer de cuello uterino, así como una utilidad web para el grupo de genes con patrones de expresión similares. Esta característica ayudará a los investigadores llevar a cabo más investigaciones para descubrir nuevas funciones de genes.

Conclusión

La base de datos dbCerEx está disponible gratuitamente para uso no comercial en http://128.135.207.10/dbCerEx/, y será actualizada e integrada con más funciones que sean necesarias

Visto:. Zhou L, Zheng W, M Luo, Feng J, Z Jin, Wang y, et al. (2014) dbCerEx: Una base de datos a través de Internet para el Análisis de Cáncer Cervical Transcriptomes. PLoS ONE 9 (6): e99834. doi: 10.1371 /journal.pone.0099834

Editor: I. King Jordan, Instituto de Tecnología de Georgia, Estados Unidos de América

Recibido: 12 Noviembre 2013; Aceptado: 19-may de 2014; Publicado: 11 Junio ​​2014

Derechos de Autor © 2014 Zhou et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este estudio con el apoyo de la Nacional de Ciencias Naturales Funda de China (Programa nº 31.202.013), Fondo de Investigación Especializada para el Programa de Doctorado de Educación Superior de China (Programa No 20120146120007), Fondos de Investigación Fundamental para las Universidades central (Programa No.2011QC075). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:. La empresa comercial (Yichang Humanwell Pharmaceutical Co., Ltd.,), junto con cualquier otra relativa al empleo, consultoría, patentes, productos en desarrollo o los productos comercializados, etc., han declarado que no hay intereses en competencia y divulgación de información financiera. Esto no altera la adhesión de los autores a PLoS ONE políticas en los datos y materiales de uso compartido.

Introducción

Los cánceres cervicales representan los casos de muerte por cáncer ginecológico segunda mayor cantidad en todo el mundo, y esta situación es peor en los países en desarrollo debido a la falta de programas organizados de detección adecuados. Se cree que las infecciones por virus del papiloma humano (VPH) son las principales causas de cáncer de cuello uterino invasivo [1].

conjunto- perfiles de expresión del genoma ha revolucionado la forma en que estudiamos la enfermedad y la biología básica. Desde 1997, el número de resultados publicados sobre la base de un análisis de datos de microarrays de expresión génica ha pasado de 30 a más de 5.000 publicaciones por año [2]. tecnologías de microarrays de ADN apuntan a mediciones simultáneas de la expresión de miles de genes en un solo experimento. En los últimos años, esta tecnología ha facilitado una mejor comprensión de las características moleculares complejas y heterogéneas de cánceres y ayudó a mejorar el tratamiento de los cánceres. Por ejemplo, HOXC10 gen en un principio se identificó a pertenecer a los 171 genes significativamente hasta reguladas en el carcinoma de células escamosas del cuello uterino (SCC) con respecto a las muestras de cuello uterino normal de microarrays de ADN, que más tarde fue identificado como un mediador clave de la invasión en el cáncer de cuello de útero [3]. Las muestras de ARN del archivo de los 25 pacientes se hibridó con chips de micromatriz de Stanford para construir un sistema de calificación de siete genes [4]. Este patrón de expresión génica podría ayudar a identificar a los pacientes con cáncer de cuello uterino que pueden ser tratados con radioterapia sola. Se seleccionaron los perfiles de expresión específicos de genes candidatos para identificar subtipos históricos de cáncer de cuello uterino [5]. Además, numerosos biomarcadores candidatos y dianas terapéuticas se han identificado en otros tipos de cáncer.

Sin embargo, para la mayoría de los estudios de microarrays publicados, solamente subconjuntos de genes se han reportado para demostrar la hipótesis de los autores. Los microarrays de datos completos se almacenan de manera poco sistemática y útil sólo para aquellos con experiencia computacional. Además, los datos de RNA-Seq se ha vuelto más estándar para el análisis del transcriptoma y se aplica ampliamente en estudios de cáncer. Mientras que para la mayoría de los investigadores experimentales, también permanecen dificultades para utilizar estas bases de datos de microarrays cáncer y los datos de RNA-Seq para resolver cuestiones biológicas. Por ejemplo, si un nuevo gen de interés se una correlación patrón de expresión (positivo o negativo) con un gen relacionado con la apoptosis, indica que ellos pueden compartir el mismo mecanismo de regulación, que podría proporcionar la propuesta potencial de investigación para el nuevo gen.

a continuación presentamos dbCerEx, una base de datos de perfiles de expresión de genes generadas a partir de experimentos de microarrays de ADN y los datos de RNA-Seq. La base de datos está provisto de una utilidad basada en web integrado, que ha hecho de los datos de fácil acceso para la comunidad de investigación del cáncer de cuello uterino. De acuerdo con este método, los investigadores experimentales podrían identificar nuevos genes relacionados con el cáncer de cuello uterino y explorar las relaciones entre ellos.

Construcción y contenido

microarrays y RNA-Seq datos

La los datos de microarrays de expresión (archivos de matriz GSE) y la anotación de la plataforma (archivos GPL) fueron recuperados de la base de datos gene Expression Omnibus (GEO) [6] a través de un [7] /paquete de Bioconductor [8] 'GEOquery' R [9]. Los datos de RNA-Seq fueron recuperados de Genoma del Cáncer Atlas (TCGA) Portal de Datos [10], que contiene información clínica, los datos de caracterización y análisis de secuencias genómicas de alto nivel de los genomas tumorales. a continuación, los datos fueron log (base 2) transforma y la mediana centrado. Para evitar el error de cálculo durante el cálculo, la fila que contiene el valor "NA" se omitiría
.
Los experimentos se procesaron a través de varias plataformas (Tabla 1). Para hacer que los datos de expresión de búsqueda, independientemente de las plataformas, las sondas se reasignan a los símbolos oficiales de genes. Sin embargo, en lugar de gen información de asignación de símbolo, algunos archivos GPL proporcionan sólo NCBI GenBank [11] o NCBI Refseq [12] Números de Acceso mapeo de las sondas. Para resolver este problema, el 'gene2refseq' y los archivos '' gene2accesion fueron recuperados de la NCBI servidor ftp a través de ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/. Un script en Perl se utiliza para asignar los símbolos de genes para estas GenBank o RefSeq números de acceso, y, finalmente, a las sondas de microarrays. Los archivos planos de expresión génica se almacenaron para acceder a más tarde.

predefinidas conjunto de genes

Una característica importante de esta base de datos es que permite a los usuarios buscar candidatos de genes similares a los genes que están estudiando basado en los patrones de expresión. Basándose en este método, los investigadores pueden encontrar mecanismos entre estos genes, que pueden llegar a ser un enfoque prometedor para descubrir nueva función de genes. Los conjuntos de genes predefinidas en las bases de datos fueron recuperados de diversas fuentes y se dividen en dos categorías principales: ontología de genes (GO) [19] y la vía. Como se muestra en la Tabla 2, el conjunto consta de GO proceso biológico, funciones moleculares y los componentes celulares. Mientras que el conjunto Camino consiste en KEGG [20], BioCarta (www.biocarta.com) y Reactome [21]. especie humana de los conjuntos de genes se utilizaron en este trabajo.

Expresión génica análisis de conglomerados

El algoritmo de agrupamiento jerárquico no supervisado se introdujo para encontrar los genes similares basados ​​en los patrones de expresión. Este intento fue procesada utilizando una combinación de medidas de distancia y los vínculos. En este estudio, la distancia del gen X a gen y define como 1-r
xy, donde r
xy representa la correlación de Pearson de gen X e Y:

Base de datos Implementación

La base de datos dbCerEx es una utilidad basada en la web que combina un sistema de MySQL (http://www.mysql.com/) base de datos [MySQL 5.5.32 (Community Server) con el motor InnoDB]. La interfaz Web de cliente se ve reforzada por un marco java script, Bootstrap 2.3.1 (http://getbootstrap.com/). El aplicaciones (PHP) http://www.php.net/[versión 5.3.10] recibir la consulta del usuario, están conectados a la base de datos para recopilar datos, llamar a los scripts de Perl y R externos para procesar estadística analizar y generar HTML páginas que muestran los resultados.

Utilidad y discusión

La base de datos dbCerEx es proporcionada por una interfaz basada en la web. Los usuarios pueden iniciar la búsqueda mediante la introducción de un gen de interés en el campo de entrada superior y, a continuación, haga clic en el botón 'Buscar'. Una lista de genes se mostrará en una nueva página para todos los genes relacionados con la palabra clave gen de entrada. Los usuarios pueden seleccionar un gen de la lista de acuerdo con la descripción que hacer análisis de la expresión.

Al hacer clic en un gen, un resumen general incluyendo el nombre completo, sinónimos y enlaces externos tales como HNGC, Entrez Gene, Ensembl. se le aparecen MIM y GENECARD para este gen. En la misma página, los usuarios pueden configurar los parámetros de análisis de la expresión en el cáncer de cuello uterino. Los usuarios pueden introducir un gen de interés fijado por la mano o de la lista de genes tales como KEGG, BioCarta, Reactome y Gene Ontología. Los usuarios pueden seleccionar el conjunto de datos a partir de los precompilados cervicales cáncer de conjuntos de datos de expresión de microarrays y RNASeq, o simplemente proporcionar un número de GEO adhesión. Al hacer clic en el botón Consulta envíe, se mostrarán las muestras para el conjunto de datos seleccionado. Los usuarios pueden seleccionar todas o algunas muestras interesados ​​para hacer el análisis de expresión.

Un mapa de calor que muestra el agrupamiento jerárquico de los genes y las muestras se mostrará (Figura 1). Además, un mapa de calor que incluye los genes significativamente correlacionados positiva o negativamente con el gen interesado será también ofreció (Figura 2). La correlación de Pearson y el valor p se le aparecen como una tabla en el lado derecho del mapa de calor.

Los genes que tienen correlación de Pearson significativa con el gen de interés fueron seleccionados para trazar un mapa de calor. Las muestras están en la columna, y se ordenan por la expresión del gen de interés.

Conclusión

Presentamos dbCerEx, una base de datos que contiene los perfiles de expresión de genes del cáncer de cuello uterino. Además, se proporciona una nueva herramienta para la búsqueda de similitud de la expresión génica dentro de ciertos conjuntos de genes interesados. Se cree que dbCerEx es una potente plataforma para la bioinformática descubrimiento de que trae los datos de microarrays de datos de cuello uterino cáncer y RNA-Seq, y el análisis de la comunidad de investigación sobre el cáncer cervical con fácil acceso.

disponibilidad y las necesidades

El sitio web de la base de datos dbCerEx está disponible de forma gratuita como una aplicación web en:. http://128.135.207.10/dbCerEx/

El conocimiento de la salud

Mantener la buena lucha! Consejos para ganar contra Cancer

TIP! Detectar el cáncer temprano es fundamental para luchar

Mieloma múltiple Vida Expectancy

espero queda el tiempo suficiente para ver a estos pequeños

La carga en las placas de amianto En comparación con contenido en fibras de asbesto Lungs

puede ser mortal cuando se rompen en pequeños pedazos y inha

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]