Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Dar prioridad a mutaciones potencialmente druggable con dGene: una herramienta de anotación para el cáncer de Secuenciación del Genoma Data

PLOS ONE: Dar prioridad a mutaciones potencialmente druggable con dGene: una herramienta de anotación para el cáncer de Secuenciación del Genoma Data


Extracto

Un objetivo importante de la secuenciación del genoma del cáncer es identificar mutaciones u otras alteraciones somáticas que pueden ser objetivo de selectiva y fármacos específicos. dGene es una herramienta de anotación diseñado para identificar rápidamente los genes pertenecientes a una de las diez clases druggable que están dirigidos con frecuencia en el desarrollo de fármacos contra el cáncer. Estas clases fueron ampliamente pobladas por la combinación y la curaduría manualmente los datos de múltiples bases de datos especializadas y generales. dGene fue utilizado por el proyecto cáncer de pulmón de células escamosas del Genoma del Cáncer Atlas, y aquí una vez más demostrar su utilidad a partir de datos de secuenciación del genoma de cáncer de mama recientemente publicados. dGene está diseñado para ser usado por ningún investigador de cáncer y sin la necesidad de apoyo de un especialista en bioinformática. Una descripción completa de dGene y opciones para su aplicación se proporcionan aquí

Visto:. Kumar RD, Chang LW, Ellis MJ, Bose R (2013) Dar prioridad a mutaciones potencialmente druggable con dGene: una herramienta de anotación para el cáncer de Secuenciación del Genoma Datos. PLoS ONE 8 (6): e67980. doi: 10.1371 /journal.pone.0067980

Editor: Patrick Tan, Duke-Universidad Nacional de Singapur Escuela de Medicina de Graduados, Singapur

Recibido: 27 Febrero, 2013; Aceptado: 24 de mayo de 2013; Publicado: 27 Junio ​​2013

Derechos de Autor © 2013 Kumar et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. El apoyo financiero para este trabajo fue proporcionada por subvenciones del NIH R01CA095614 y U01HG00651701 (a MJE), y el Edward Mallinckrodt, Jr. Foundation y el "Breast Cancer Research Fund Ohana (RB). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

estudios de secuenciación del genoma del cáncer están ahora analizando 50 a 500 pacientes por estudio y están documentando miles de mutaciones somáticas [1], [2]. Se necesitan nuevas herramientas para la anotación y análisis para predecir la relevancia funcional de estas alteraciones genéticas y orientar las investigaciones posteriores. A continuación, se introduce una herramienta basada en los genes druggable que, en combinación con otras medidas de anotación y filtrado, puede priorizar rápidamente un gran conjunto de mutaciones en un conjunto más enfocado que puede ser probado en estudios funcionales
.
Esta herramienta , al que llamamos dGene (colección de genes druggable), se basa en el concepto del genoma druggable introducido por Hopkins y el novio en el año 2002 [3]. Identificaron clases de proteínas que potencialmente se pueden unir fármacos de moléculas pequeñas y propusieron que los genes modificadores de la enfermedad que pertenecen a una clase druggable deben ser priorizadas para el desarrollo de drogas [3], [4]. Este conjunto de genes druggable se basó en la observación de que la FDA aprobó las drogas y compuestos en desarrollo no se dirigen el genoma humano de manera uniforme, con algunas clases de genes, tales como los receptores de proteína G acoplados (GPCR) y las proteínas quinasas, siendo más frecuentemente blanco de pequeñas moléculas.

dGene se suma a su trabajo mediante la ampliación y actualización del conjunto de clases druggable en base a los esfuerzos de desarrollo de fármacos actuales, poblando las clases de forma integral y el mantenimiento de la calidad a través de curación manual. En este artículo, se describe la justificación y la construcción de dGene, demostrando su utilidad en un conjunto publicado recientemente de cáncer de mama datos de la secuencia de todo el exoma [2] de todo el genoma y y dar instrucciones para el uso de dGene.

Resultados

dGene está diseñado como una herramienta de anotación y filtrado para dar prioridad a las mutaciones para la evaluación funcional (Fig. 1a). El paso inicial en su diseño fue la selección de un conjunto de clases de genes que son altamente druggable y relevantes para la biología del cáncer. Las clases fueron seleccionados en base a esquemas anteriores del genoma druggable [3], [4] y adicionales de sondeo de la literatura sobre todo, con un énfasis particular en la biología del cáncer. Por ejemplo, mientras que los transportistas y los canales iónicos son ampliamente druggable, que han sido excluidos de dGene debido a la falta de relevancia establecido en la tumorigénesis. La versión actual de dGene está construido alrededor de diez clases de genes (Tabla 1). Se demuestra la validez de este enfoque mediante el examen de un grupo de 299 medicamentos sometidos a ensayos clínicos para el cáncer de pulmón [5]. Hemos observado que más del 60% de estos fármacos proteínas que se encuentran dentro de las 10 clases en dGene dirigido (Fig. 1b).

A, farmacobilidad sirve como una pantalla racional en una tubería hipotética para reducir una lista de genes en bruto de un número experimentalmente viable. B, fármacos contra el cáncer de pulmón en la tubería clasificados según el tipo de destino, con algunos tipos de objetivos considerados ampliamente druggable e incluido en dGene. C, NHR requiere un flujo de trabajo sencillo. Russ
et al, España 2005 y NucleaRDB [6] proporcionó información. Un gen mapeado a ni el gen ni sinónimos lista NCBI. Seis genes fueron identificados en una sola fuente y se revisaron manualmente contra UniProt y Gene Ontología (GO) [9], [10]. Ninguno pudo ser confirmada como los NHR, dejando a la clase final con 48 miembros. D, El flujo de trabajo elaborada por proteasas es análoga a la de los NHR y otras clases. Debido a UniProt sirve como entrada, curación implicó la búsqueda de bibliografía primaria, además de consulta de GO.

Cada una de las 10 clases dGene fue llena exhaustivamente el uso de fuentes adaptadas incluyendo bases de datos especializadas y artículos de revisión. Para una clase dada, los resultados de varias fuentes se reconcilian a través de la lista y las entradas únicas para una sola fuente de genes NCBI fueron confirmados en bases de datos como UniProt o la literatura primaria. receptores nucleares de hormonas (NHR) ilustran un caso sencillo con fuentes bien curada [6] que requiere poco escrutinio adicional (Fig. 1c). A modo de comparación, las proteasas requieren un flujo de trabajo elaborada con fuentes adicionales especializados [7] y un mayor grado de curación manual incluyendo búsquedas bibliográficas primarias (Fig. 1d). La lista final incluye dGene 2257 genes de las diez clases (Tabla 1 y Tabla S1), y saca de una variedad de fuentes especializadas y generales [6] - [14]. dGene es totalmente modular y ampliable: Más información del futuro o de genes clases de interés pueden ser fácilmente añadidos

El filtro dGene recientemente ha sido utilizado por Atlas del Genoma del Cáncer (TCGA) proyecto cáncer de pulmón de células escamosas de analizar mutaciones somáticas encontró. en 178 casos de cáncer de pulmón de células escamosas; detalles se pueden encontrar en esa publicación [1]. Para ilustrar aún más la utilidad de dGene, se optó por un estudio reciente genómico de los 77 receptores de estrógenos positivos de cáncer de mama como un caso de prueba [2]. El conjunto de datos consta de 46 cánceres de mama que se sometieron a secuenciación del genoma completo, más de 31 tipos de cáncer que se sometieron a secuenciación del exoma, denotado por "BRC" y "CSB" códigos de los pacientes, respectivamente. dGene identificado 368 variantes de nucleótido único (SNV) fuera de 2.622 total que se produce en 255 genes druggable (Fig. 2a-b). Exigir la recurrencia en pacientes múltiples reduce el conjunto de genes aún más (Fig. 2c). Los 37 genes que son tanto druggable y presente en al menos 2 pacientes se enumeran en la Figura 2d. El archivo de entrada y el archivo de salida dGene de este análisis se proporcionan (cuadros S2 y S3).

A, 368 SNVS ocurrieron en los genes que se consideran druggable de 2622 un total de eventos. B, 2199 genes tenían al menos un SNV, de los cuales 255 son considerados druggable. C, La detección de los genes alterados comúnmente reduce aún más la lista de objetivos. D, 37 entradas dGene presente en al menos 2 de cada 77 muestras, organizado por clase y los pacientes afectados.

Los resultados dGene proporcionan nueva información sobre este conjunto de datos del genoma del cáncer.
PIK3CA
está mutado en 37/77 muestras, pero un paciente adicional (BRC44) tenía una deleción en marco KPDL567 en PIK3R1, una subunidad reguladora que se une PIK3CA. Esta eliminación se produce en la interfase de unión PIK3R1-PIK3CA y puede alterar PI3-quinasa de señalización [15]. dGene sugiere la importancia de esta mutación tanto a través de su relación con PIK3CA y farmacobilidad potencial. mutaciones adicionales se pusieron de relieve de manera similar; por ejemplo, el
TEX14
(nombres: testículo-expresó la proteína quinasa SUGEN 14 o 307) y
INSRR gratis (receptor relacionado con el receptor de la insulina) tirosina quinasas son dos objetivos de medicamentos relativamente nuevos. TEX14 ha sido implicada en el mieloma múltiple y el cáncer de mama [16], [17], y INSRR ha sido implicada en los cánceres epiteliales de ovario y neuroblastomas [18], [19]. Es probable que ambos druggable, pero tampoco ocurrió a alta frecuencia y no se pusieron de relieve en un análisis global del conjunto de datos. Con el fin de demostrar el valor de los resultados dGene, la comparación se hizo con los resultados de una base de datos de medicamentos existentes, la PharmGKB (La farmacogenómica Base de Conocimiento) busca. dGene identificado más genes que PharmGKB de este conjunto de datos de cáncer de mama (Figura S1, Tabla S4), incluyendo la identificación de 4 tirosina quinasas y quinasas 13 S /T que estaban mutadas de forma recurrente en estos genomas del cáncer de mama (Fig. 2D).

Figura 2d ilustra también dos advertencias en el uso de dGene. Las mutaciones en
MAP3K1
se encuentran en 9/77 pacientes, y la mayoría de estos eventos son la pérdida de función de las mutaciones [2].
MAP3K1 de búsqueda: 's presencia en el análisis de la producción dGene demuestra que dGene no proporciona ninguna información sobre si una mutación es la ganancia de función, la pérdida de función, o funcionalmente silenciosa. Dada una lista de los símbolos de genes, dGene sólo actúa como un filtro. La presencia de
La titina
y dos genes del colágeno (
COL28A1
y
COL6A3
) ilustran cómo los genes muy grandes, que contienen con frecuencia componentes druggable y tienden a ser frecuentemente mutado, se continuar filtrando a través dGene. La presencia de un gen en la salida dGene no garantiza relevancia biológica de una mutación dada.

dGene se puede aplicar a cualquier conjunto de datos que contiene una lista de los símbolos de genes. Para ilustrar esto hemos analizado el número de copias (CN) de datos de genes del receptor de estrógenos 46 cánceres de mama positivos que se sometieron a secuenciación del genoma completo (codificado "BRC") [2]. Los datos NC primas implicadas 19.528 genes a través de casi 150.000 eventos, incluyendo tanto focales y cambios amplios NC. Como una pantalla inicial, sólo los eventos por debajo del 20
th o por encima del 80
percentil fueron considerados (0,7 × 1,5 × y cambios, respectivamente), dejando 54.301 eventos en los 16.924 genes (Tabla S5). Filtrado contra dGene reduce aún más el conjunto de 5421 cambios en NC 1752 genes druggable (Figura 3a-c y la Tabla S6). Las pérdidas NC en la familia PTEN revelaron una novela de observación (Figura 3d).
TPTE2
(nombres: phosphoinositide transmembrana 3-fosfatasa y homólogo de tensina 2 o TPIP) es el miembro más comúnmente perdido PTEN familia, con pérdidas NC observado en 14/46 pacientes, que es una frecuencia 3,5 veces mayor que los
PTEN
pérdidas NC (4/46). La literatura sobre TPTE2 es limitado y que indica que TPTE2 puede inhibir el crecimiento celular y iniciar la apoptosis, similar al supresor de tumores PTEN [20], [21], [22]. Se identificó este nuevo hallazgo de la pérdida TPTE2 CN porque dGene pone de manifiesto la asociación entre los miembros de la familia de PTEN de un gran candidato alteración CN establecer
.
A, se detectaron 5421 VNC en 1752 genes druggable a través de la muestra. El 20
º (0,7 ×) y 80
º (1,5 ×) percentiles sirvieron como puntos de corte. B, Las ganancias solamente (& gt; 1,5 ×). C, pérdidas sólo (& lt; 0,7 veces). D, Visualización de los valores de la familia de la CNV PTEN.
TPTE2
es el más frecuentemente alterado. Los puntos de corte están relajados a & lt; 0,85 x y & gt;. 1.15 × para fines de visualización

Discusión

Hemos desarrollado una versión actualizada del genoma druggable mediante la identificación de clases de genes altamente druggable, poblar las clases utilizando hasta a la fecha y recursos específicos, y confirmar manualmente los resultados. Nuestra colección de genes druggable, dGene, está diseñado específicamente para su uso contra las listas de mutaciones generadas por la secuenciación del genoma del cáncer, a pesar de que se puede utilizar para analizar cualquier lista de genes humano. También hemos demostrado que, en combinación con los criterios de filtrado adicionales, dGene puede destacar rápidamente mutaciones en dianas terapéuticas biológicamente plausibles y clínicamente.

Las limitaciones de dGene son que está sesgado hacia el modelo de "adicción oncogén" del cáncer y consecución de los objetivos de bien descritos, fármacos de moléculas pequeñas. Mientras dGene no contiene actualmente los genes implicados en la reparación del ADN, las proteínas de la superficie celular, u otros posibles objetivos farmacológicos, clases adicionales se acomodan fácilmente debido a la modularidad de dGene. dGene también hace ningún intento para identificar las mutaciones ya sea como pérdida o ganancia de función; sin embargo, dGene se puede combinar con las puntuaciones de impacto funcionales (tales como tamizar o mutación Evaluador) para identificar las mutaciones que son tanto probable druggable y probablemente funcional [23], [24]. dGene pretende ser una herramienta de fase de descubrimiento para dirigir experimentos hacia genes contra la cual rápidamente se podrían desarrollar inhibidores de moléculas pequeñas.

Al igual que con todos los recursos a base de datos, la actualización de dGene será de la mayor importancia. dGene clases tienden a ser bien estudiada, como lo demuestra el hecho de que 2108 fuera de las 2.257 entradas se pueden encontrar en SwissProt, una colección revisado manualmente las anotaciones de proteínas [9]. Por lo tanto, anticipamos dGene siendo bastante estable, y se comprometen a proporcionar actualizaciones anuales. Por otra parte, debido a dGene es fácilmente ampliable, podemos integrar fácilmente nuevas clases de genes como el conocimiento de los avances de la biología del cáncer y clases de genes adicionales están dirigidos.

dGene está diseñado para ser utilizado por los investigadores del cáncer y no requiere el apoyo de un bioinformática especialista. dGene está actualmente alojado como una herramienta basada en la web a través del Instituto del Genoma de la Universidad de Washington (dgidb.genome.wustl.edu). Allí, los usuarios pueden filtrar las listas de genes contra dGene (a través de la página "Búsqueda Categorías", o descargar el archivo completo dGene texto delimitado por tabuladores (a través de las "descargas" de página), que se pueden importar en diversos paquetes estadísticos y de uso, personalizar como es necesario. la funcionalidad adicional de la página web incluye la anotación de entradas dGene con información específica de drogas cuando estén disponibles (M. Griffith y Griffith OL, manuscrito en preparación). en resumen, dGene proporciona un filtro rápido para identificar genes druggable en diez clases de estudios de genómica del cáncer, y está disponible actualmente para su uso a través de una página web construida profesionalmente.

Métodos

Rellenar clases de genes

Las clases se poblaron con genes humanos a través de un proceso de inclusión de bases de datos especializadas y las revisiones , la normalización de la lista de genes NCBI, y el manual de curación de los genes que se producen en una sola fuente. Figura 1c y 1d representan el proceso completo para los receptores nucleares de hormonas (un caso simple) y proteasas (un caso complejo), mientras que la Tabla 1 resume el conjunto de fuentes especializadas utilizadas para cada clase. Los comentarios y las bases de datos fueron identificados por búsqueda en la literatura y pueden no ser exhaustiva. manual de curación de los genes sugeridos por los genes asegurado una sola fuente se clasificaron correctamente. Para las clases donde UniProt /ontología de genes no haya sido necesario como fuentes de entrada, se llevó a cabo una comprobación simple en contra de la clasificación UniProt /GO. En los casos en que UniProt /GO se presentó como entrada a la clase (como fue el caso de proteasas), se llevó a cabo la inspección de la alineación de la literatura y la secuencia de referencia.

Durante la curación manual, el sesgo fue hacia la inclusión. Los genes se queda en su respectiva clase si bien mostraron una homología de secuencia a un miembro conocido, o si la evidencia experimental sugiere que tenía la funcionalidad adecuada. Pseudogenes y genes que codifican productos no funcionales se incluyeron si mostraron homología con un miembro de la clase incluida.

Un reto frecuente en la consolidación de fuentes dispares era la mezcla de identificadores de genes y proteínas incompatibles. Asignación a la lista NCBI Human Gene (url: ftp://ftp.ncbi.nih.gov/gene/DATA/GENE_INFO/Mammalia/Homo_sapiens.gene_info.gz, consultado el 3 de julio de 2012) facilita las comparaciones entre las fuentes. La lista de genes NCBI humana representa la colección total de genes humanos reconocidos en la base de datos NCBI, así como anotaciones en vigor, y se actualiza a diario. La lista de genes NCBI proporciona un formato estándar para todas las entradas dGene -15 columnas, incluyendo el NCBI Geneid, símbolo oficial, y lo más importante, una lista de sinónimos utilizados en la literatura. Para cada entrada de un 16
ª columna, clase, se ha añadido. Mapeo se llevó a cabo mediante la conversión de la proteína nombres de nombres de genes con la Herramienta de conversión de genes ID David [25], y mediante la búsqueda en los sinónimos proporcionados en el archivo de NCBI términos que no aparecen como símbolo oficial.

aplicación de dGene de muestras de cáncer de mama
77
Las anotaciones de mutación primas analizadas en este trabajo utilizado números de identificación de genes hasta a la fecha. Las mutaciones en los genes que también aparecen en dGene se filtraron a una tabla separada, y el término de la clase dGene se adjuntan como una nueva columna. Agregación con el paciente y la categoría que permitió la producción de la figura 2a. se requiere la agregación a paciente y el gen para la producción de la Figura 2b-d. Los datos se analizaron NC primas de la misma manera, con los resultados representados en la figura 3.

Descargas de Software
El análisis se realizó en R 2.15.1 para Windows. Mapas de calor se producen en R utilizando el paquete de base, mientras que las figuras y tablas adicionales fueron producidos con Microsoft Excel y PowerPoint.

Apoyo a la Información
Figura S1.
doi: 10.1371 /journal.pone.0067980.s001 gratis (PDF) sobre Table S1.
doi: 10.1371 /journal.pone.0067980.s002 gratis (CSV)
Tabla S2.
doi: 10.1371 /journal.pone.0067980.s003 gratis (XLS) sobre Table S3.
doi: 10.1371 /journal.pone.0067980.s004 gratis (XLS) sobre Table S4.
doi: 10.1371 /journal.pone.0067980.s005 gratis (XLS) sobre Table S5.
doi: 10.1371 /journal.pone.0067980.s006 gratis (XLS) sobre Table S6.
doi: 10.1371 /journal.pone.0067980.s007 gratis (XLS)

Reconocimientos

Los autores agradecen a Obi Griffith, Malaquías Griffith, Robert Pufahl, Li Ding, y Rob Mitra útil para los debates y lectura crítica de este manuscrito. Los autores, además, gracias a Malaquías Griffith y Obi Griffith para proporcionar acceso a través de dGene dgidb.genome.wustl.edu.

El conocimiento de la salud

¿Qué es la radiocirugía CyberKnife

? Recibir un diagnóstico de cáncer es un acto muy emotivo.

Christopher Hayden Crane

Christopher Hayden Crane ha logrado muchas cosas notables a

Cómo vencer el cáncer: incluso si los tratamientos Mainstream Didnt

Las personas diagnosticadas con cáncer suelen tener que sufr

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]