Extracto
La gran variedad de recursos en silico y datos de alta perfiles de rendimiento disponible actualmente en la investigación de ciencias de la vida ofrecen la posibilidad de ayudar a cáncer gen y el proceso de descubrimiento de fármacos. Aquí nos proponemos aprovechar estos recursos para desarrollar una herramienta, TARGETgene, para identificar de manera eficiente los conductores de mutación, las posibles dianas terapéuticas y fármacos candidatos en el cáncer. La sencilla interfaz gráfica de usuario permite una rápida, intuitiva mapeo y análisis a nivel de sistemas. Los usuarios pueden buscar, seleccionar, y explorar los genes diana identificados y compuestos de interés (por ejemplo, nuevos genes de cáncer y sus procesos biológicos enriquecidos), y validar las predicciones utilizando genes de referencia definidos por el usuario (por ejemplo, los genes diana detectados en las pantallas de RNAi), y el cáncer curada genes a través de TARGETgene. Las capacidades de alto nivel de TARGETgene también se ponen de manifiesto a través de dos aplicaciones en este documento. Las predicciones en estas dos aplicaciones fueron entonces satisfactoriamente validados por varias maneras, incluyendo los genes del cáncer conocidos, resultados de pantallas de RNAi, anotaciones función de genes, y los genes diana de los fármacos que se han utilizado o en ensayo clínico en los tratamientos del cáncer. TARGETgene está disponible gratuitamente desde el sitio web Biomédica Simulaciones de recursos (http://bmsr.usc.edu/Software/TARGET/TARGET.html)
Visto:. Wu CC, D'Argenio D, Asgharzadeh S, triche T (2012) TARGETgene: una herramienta para la identificación de dianas terapéuticas potenciales en cáncer. PLoS ONE 7 (8): e43305. doi: 10.1371 /journal.pone.0043305
Editor: Ying Xu, de la Universidad de Georgia, Estados Unidos de América
Recibido: 19 Abril, 2012; Aceptado: 18 Julio 2012; Publicado: 31 Agosto 2012
Copyright: © Wu et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyada por los Institutos nacionales de Salud (NIH) de subvención P41-EB001978 (DD), Departamento de Defensa de subvención W81XWH-07-1-0580 (TT) de Estados Unidos, con el niño de Investigación de Desarrollo Profesional de la Salud NIH Premio Programa K12-CA60104 (a SA). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
El uso intensivo de agentes citotóxicos en las terapias multimodales ha mejorado la supervivencia libre de enfermedad a cinco años e incluso dio lugar a la cura en algunos pacientes con cáncer. Este éxito puede estar asociado con toxicidades graves y una mayor incidencia de cánceres secundarios. La aparición de las terapias dirigidas dirigidas contra genes /proteínas desreguladas o mutados en las células malignas representa un cambio de paradigma en el tratamiento del cáncer, con menos dependencia de las drogas que matan a las células normales así como células tumorales. Los ejemplos incluyen las terapias contra el cáncer de mama HER2 sobreexpresados (como trastuzumab y lapatinib) terapia, c-Kit enfocadas, a BCR-ABL leucemias defectuosos (Gleevec), y VEGF /compuestos VEGF-R-dirigido para inhibir la angiogénesis canceroso (tales como bevacizumab) . Mientras que las tecnologías de alto rendimiento tales como microarrays y secuenciación de próxima generación que ahora se pueden utilizar para identificar cientos o miles de genes candidatos que se expresan o mutado en cancerosos frente a tejidos normales diferencialmente, es difícil para priorizar posibles dianas terapéuticas del cáncer de un número tan grande de genes candidatos.
Un estudio sistemático de las vías de regulación complejas es necesario para comprender los mecanismos de oncognesis para descubrir los conductores de mutación o el desarrollo de terapias eficaces. Se han encontrado varias vías para ser desregulado en las células cancerosas debido a la sobre-expresión o represión de algunos elementos de control [1]. Sin embargo, las conclusiones de las vías hasta la fecha han sido muy limitados. La gran variedad de técnicas de alto rendimiento y los recursos de datos de dominio público, más recientemente disponibles, ofrece la posibilidad de comprender los mecanismos celulares a nivel de sistemas y así ayudar en el descubrimiento de fármacos [2] - [5]. Varios enfoques estadísticos rigurosos han sido desarrollados para inferir las redes celulares y moleculares a través de un análisis integrado de estos recursos [6] - [10]. También hemos introducido previamente un Relevancia Vector Machine (RVM) basado en conjunto enfoque, diseñado para problemas de aprendizaje a gran escala, y lo utilizó para integrar múltiples fuentes de datos heterogéneas para construir una red de genes humanos que pueden revelar las relaciones funcionales entre genes [11 ]. Los rendimientos de modelo de conjunto basada en la mejora de rendimiento de RVM en problemas de aprendizaje a gran escala con valores perdidos enormes en comparación con Naïve Bayes, el método más popular utilizado para predecir las interacciones proteína-proteína y las interacciones genéticas [6] - [10].
Varios conceptos también han conducido al desarrollo de enfoques basados en la red para predecir nuevos genes de enfermedades en las redes moleculares [12], [13], [14]. Genes asociados con fenotipos de enfermedad similares tienden a ser grupo en una red molecular. De este modo, los genes que se encuentran para ser asociados con genes relacionados con la enfermedad conocidos en las redes son a su vez más probabilidades de estar involucrados en el mismo proceso de la enfermedad [12]. Además, en vista de la complejidad en los cánceres, las posibles dianas terapéuticas pueden ser los genes /proteínas que tienen un papel crítico en la regulación de múltiples vías o el mantenimiento de esos fenotipos malignos [15]. Se ha informado recientemente de que los genes asociados con el cáncer son más propensos a ser proteínas que actúan como centros de señalización, enviando o recibiendo señales a través de múltiples vías [16], [17]. el uso más amplio de estos conceptos y redes moleculares construidos sería promovido por la disponibilidad de herramientas que permitan una fácil identificación de posibles dianas terapéuticas para cánceres específicos
.
El uso más amplio de este tipo de redes moleculares construidos y los enfoques basados en la red se promovería por la disponibilidad de herramientas que permitan una fácil identificación de potenciales dianas terapéuticas para cánceres específicos. Por tanto, este informe introduce el TARGETgene herramienta de software que utiliza una red construida gen que integra múltiples datos genómicos y proteómicos usando el modelo basado en la RVM [11] para permitir a los usuarios identificar convenientemente potenciales dianas terapéuticas para un cáncer particular. La red no sólo contiene información interacción molecular directa, sino también las relaciones funcionales entre genes más amplios. Además, mediante la integración de información sobre drogas objetivo compilado a partir de bases de datos públicas disponibles recientemente, como DrugBank [18], PharmGKB [19] y la base de datos diana terapéutica [20], TARGETgene permite la identificación de posibles candidatos a fármacos para tratamientos contra el cáncer. Los usuarios pueden buscar, seleccionar y guardar los genes & amp objetivo identificados; medicamentos de interés (por ejemplo, la selección de nuevos genes del cáncer) a través de TARGETgene. A través de la integración de recursos de varias bases de datos públicas, TARGETgene también permite a los usuarios explorar las funciones moleculares, literatura relacionada, y los procesos biológicos enriquecidas de sus genes diana seleccionados. Por otra parte, TARGETgene también proporciona una forma para que los usuarios validen sus predicciones utilizando genes de referencia definidos por el usuario (por ejemplo, los genes diana detectados en las pantallas de RNAi), y los genes del cáncer curada. En este informe, las capacidades de alto nivel de TARGETgene se demuestran a través de dos aplicaciones en este trabajo: identificación de potenciales dianas terapéuticas de los genes expresados diferencialmente y la identificación de los conductores de mutación. Las predicciones en estas dos solicitudes fueron satisfactoriamente validadas de varias maneras, incluyendo los genes del cáncer conocidos, resultados de RNAi, sreens función anotaciones de genes, y los genes diana de los fármacos que se han utilizado o en los ensayos clínicos.
Métodos
Construcción de gen-gen red funcional Relación
Diecisiete datos genómicos y proteómicos heterogéneos fueron integrados mediante el modelo de conjunto basada en RVM reportados en [11] con el fin de construir una red funcional de genes (como se detalla en la sección 1 del Texto S1). Los nodos en esta red representan todos los genes del genoma humano, y la asociación funcional entre cualesquiera dos de ellos se cuantifica por un gen de par probabilidad de ligamiento que pueden revelar la tendencia de los genes para operar en las mismas o similares vías. Por lo tanto, esta red no sólo contiene información interacción molecular directa, sino también las relaciones genéticas más amplia funcionales en las vías. Esta red se puede aplicar para investigar diversas cuestiones biológicas en la salud y la enfermedad, incluyendo la exploración de las funciones de genes, la comprensión de los mecanismos celulares complejas, y la identificación de posibles dianas terapéuticas. TARGETgene utiliza esta red de genes para mapear y analizar las posibles dianas terapéuticas en el ámbito de los sistemas.
La identificación de objetivos potenciales utilizando los enfoques basados en la red
Sobre la base de la red de genes construidos, TARGETgene identifica potenciales dianas terapéuticas utilizando una de las dos métricas basadas en la red: 1) puntuación concentrador o 2) puntuación asociación entre genes de semillas (como se detalla en la sección 2 del Texto S1). Dos medidas de centralidad, la centralidad de grado ponderada y la centralidad del vector propio ponderada, previstas en TARGETgene puede cuantificar la tendencia de un gen para ser un centro de operaciones en la red específica de tumor que se genera mediante la asignación de genes candidatos en un tumor a la red de genes construidos. TARGETgene también permite a los usuarios identificar genes importantes para el cáncer o potenciales dianas terapéuticas asociándolos con los genes de semillas definidas por el usuario (por ejemplo, conocidos genes del cáncer) en la red de genes. Más específicamente, la importancia de cada gen candidato se calcula como la suma de su asociación funcional directa con esos genes de semillas. Todos los genes candidatos se clasifican en función de su puntuación de concentrador o su puntuación de semilla de asociación entre genes. Esos genes altamente clasificados en la predicción se identifican como posibles genes del cáncer importante y por lo tanto posibles dianas terapéuticas. Información-blanco de la droga luego se asigna a los genes candidatos. Fármacos cuyo objetivo genes son altamente clasificado en la predicción también pueden ser considerados como posibles terapias.
Información general sobre TARGETgene
La interfaz gráfica de usuario de TARGETgene consta de cuatro paneles principales de trabajo, incluyendo entrada, Implementación , gene, y los paneles de la droga (Figura 1A y 1B). El Panel de entrada permite a los usuarios definir el tipo de cáncer (en la actualidad: el cáncer de mama, cáncer de colon, sarcoma de Ewing, glioblastoma, cáncer de pulmón, cáncer de ovario y cáncer de próstata) y genes candidatos, así como la clasificación de métrica (puntuación o semilla centro deseado puntuación de asociación de genes) como se ilustra en la Figura 1A. El Equipo de Ejecución permite al usuario generar nuevas predicciones, guardar los resultados y cargar los resultados existentes. El panel de genes incluye información sobre todos los genes candidatos, incluida su rango en las predicciones, así como el número de citas del cáncer de la literatura. información de la cita literatura sobre el cáncer de genes fue compilada de Entrez Gene (ftp://ftp.ncbi.nih.gov/gene/). A través de este panel, el usuario también puede buscar, seleccionar los genes diana identificados (por ejemplo, la selección de nuevos genes de cáncer), y explorar sus funciones, literatura citada, así como los procesos biológicos enriquecidos. Además, TARGETgene permite a los usuarios validar sus predicciones utilizando genes de referencia definidos por el usuario (por ejemplo, los genes diana detectados en las pantallas de RNAi), y los genes del cáncer curada a través de este panel. Por último, la información de destino de drogas y compilados a partir de varias bases de datos públicas, tales como DrugBank [18], PharmGKB [19] y la base de datos diana terapéutica [20], también se integran para TARGETgene por informar de esos fármacos /compuestos que podrían tener acción en el objetivos identificados por TARGETgene. El Grupo de Drogas listas de nombres genéricos, tipos de drogas (aprobados o experimentales), el número de genes candidatos conocidos por ser el blanco de los medicamentos identificados, mejor clasificado nombre de gen diana, y las enfermedades de los medicamentos identificados relacionados. La lista de medicamentos es ordenado por su más alto clasificado gen diana. TARGETgene también es personalizable y se puede generar la lista de medicamentos seleccionados en base a las filas de sus objetivos o tipo de droga. Además, los usuarios pueden explorar la información más general sobre los medicamentos identificados de interés a través de varios enlaces externos.
A. El diseño de la arquitectura. B. La principal interfaz gráfica de usuario
Resultados
Para ilustrar el uso de TARGETgene, lo hemos aplicado a dos ejemplos:. 1) identificación de potenciales dianas terapéuticas entre miles de diferencialmente genes expresados identificados por exón matriz; 2) la identificación de los genes mutados conductor de secuenciación y copiar datos de número de
Ejemplo 1:. La identificación de dianas terapéuticas potenciales de los genes expresados diferencialmente
En este ejemplo, TARGETgene Se aplicó a su vez a cada uno de tres tipos de cáncer: cáncer de mama HER2-positivo, cáncer de colon, de pulmón y adenocarcinoma. conjuntos de datos de exones humanos en la plataforma Affymetrix para los tres tipos de cáncer se recogieron del Centro Nacional para la Información Biotecnológica Expresión Génica Omnibus (GEO) [21]. análisis de datos posteriores se realizaron utilizando Partek Genómica Suite de 6,3 (más detalle en la sección 3.1 del Texto S1). Finalmente, 5203, 5153 y 6203 genes expresados diferencialmente fueron identificados en estudios de casos de cáncer de colon, de mama y cáncer de pulmón, respectivamente. genes expresados diferencialmente en cada tipo de cáncer se clasifican en base todo su puntuación cubo (grado de centralidad ponderada) en una red específica de tumor, que se generó mediante la asignación de los genes expresados diferencialmente en cada tipo de cáncer a la red funcional de genes construidos. La lista completa clasificación de los genes de cada uno de los tres tipos de cáncer se puede obtener ejecutando TARGETgene utilizando la lista de genes candidatos almacenados en los ficheros de ejemplo (incluido en el paquete de TARGETgene) y seleccionando la centralidad de grado ponderada clasificación de opción (sección 3.1 del texto listas S1 los 10 genes superiores de más alto rango para cada uno de los tres tipos de cáncer como se muestra en los paneles de genes de TARGETgene). Los resultados muestran que un número de genes del cáncer importantes para cada tipo de cáncer son altamente clasificado por TARGETgene, como AKT1 (Puesto#1), SRC (puesto n º 10), y ErbB2 (rango#25) en el cáncer de mama. Además, también se ubica TARGETgene varios genes altamente (en el 10% superior), que recientemente fueron identificados como genes relacionados con el cáncer en cada tipo de cáncer. Por ejemplo, en el cáncer de mama se informó recientemente ADAM12 (rango#153) y MAP3K6 (rango#205) que se asocia con la oncogénesis del cáncer de mama [22], [23]. Por otra parte, muchos genes que nunca han sido identificados en estos tipos de cáncer también se clasifican altamente. Estos genes podrían ser objeto de más
in vitro en
y
in vivo
estudio para evaluar su importancia este tipo de cáncer. Varios de estos también han sido identificados por las pantallas de RNAi (como se detalla en el siguiente apartado).
Las evaluaciones de predicción.
Los genes clasificados resultantes de TARGETgene también se validan mediante anotaciones funcionales de genes y varias de referencia conjuntos de genes, incluyendo el conjunto de genes del cáncer curados, el conjunto de genes citados en la literatura cáncer, y el conjunto de genes diana detectados por las pantallas de RNAi. De servicio (ROC) y AUC característica del receptor se utilizan para estas evaluaciones de referencia. En cada evaluación, los conjuntos de genes de referencia se tratan como casos positivos, mientras que otros genes se tratan como ejemplo negativo.
Los genes del cáncer curada descargados de la base de datos CancerGenes [24] se utilizó por primera vez para evaluar si están altamente calificados por TARGETgene. La figura 2A muestra la predicción de rendimiento de TARGETgene para cada tipo de cáncer. Los altos valores de AUC de la predicción de TARGETgene en cada tipo de cáncer (AUC & gt; 0,85) indican que la mayoría de los genes del cáncer conocidos tienden a ser altamente clasificado. Además, los genes que se citan en la literatura para cada tipo de cáncer también se utilizan para la evaluación. genes de referencia en cada tipo de cáncer puede determinarse basándose en el número de citas diferentes de corte. A medida que el número de citación de corte utilizados aumenta también lo hacen los valores de AUC TARGETgene resultantes (Figura 2B muestra el resultado de cáncer de mama, los resultados de los otros dos casos se muestran en la sección 3.2.1 del Texto S1), lo que indica que los genes con más citas también tienen una clasificación más alta TARGETgene. Los resultados de correlación de Spearman en los tres tipos de cáncer también muestra una correlación significativa entre filas generadas por TARGETgene y número de la literatura cita (la sección 3.2.1 del Texto S1). Esto proporciona evidencia adicional de que los genes altamente clasificados según TARGETgene también se citan en la bibliografía más cáncer; es decir, que probablemente juegan un papel más importante en estos tipos de cáncer, en comparación con los genes clasificados bajar.
La verdadera tasa positiva se denota tasa de TPR y falso positivo se denota FPR en la figura. A. Evaluación mediante comisariada genes del cáncer. B. Evaluación utilizando genes citados por la literatura citada por cáncer con diferentes valores de corte se cita Número de 1, 5 y 10 (sólo el caso del cáncer de mama se muestra). C. Evaluación utilizando genes diana detectados por RNAi pantallas de viabilidad celular.
alto rendimiento pantallas de RNAi han sido recientemente demostrado ser una herramienta prometedora para descubrir nuevas dianas para el tratamiento de varios tipos de cáncer [25]. Por lo tanto, los objetivos eficaces de cada tipo de cáncer detectado por la viabilidad celular RNAi que se han descargado desde GenomeRNAi [26] se aplican también para evaluar el rendimiento de las predicciones de TARGETgene. Las fuentes de datos de RNAi pantallas utilizadas en este trabajo se resumen en la sección 3.2.3 del Texto S1. El resultado se muestra en la Figura 2C. La alta AUC en cada tipo de cáncer indica que los objetivos más afectadas identificadas en las pantallas de RNAi en todo el genoma tienden a ser altamente clasificado por TARGETgene. Algunos de los genes diana de ARNi que son altamente calificados por TARGETgene han demostrado que desempeñan un papel importante en la oncogénesis en cada uno de los tres tipos de cáncer, tales como AKT1 (# 1) en el cáncer de mama. Específicamente, algunos de estos genes diana sólo recientemente se han encontrado para ser asociado con estos tres tipos de cáncer. Por ejemplo, en el cáncer de mama, PIK3R2 (fosfoinositida-3-quinasa, subunidad reguladora 2 beta) y ECT2 (células epiteliales transformación de secuencia 2 oncogén) tienen un rango TARGETgene de 37 y 272, y con un cambio de 3,31 y 4,94 veces en la expresión de genes de los tejidos de cáncer de mama, respectivamente. PIK3R2 se ha demostrado que se asocia funcionalmente con PTEN no fosforilada y el complejo de PTEN asociada en algunas líneas celulares de cáncer de mama HER2-amplificado [27]. ECT2 Recientemente se ha informado a participar con los mecanismos para activar RhoB después de estrés genotóxico, facilitando de este modo la muerte celular después del tratamiento con agentes que dañan el ADN en el cáncer de mama [28]. Lo más interesante, también se encontró que varios nuevos objetivos (es decir, sin citación relacionada con el tipo específico de cáncer basado en PubMed en diciembre de 2010) detectada por RNAi pantallas son también altamente clasificado por TARGETgene. Para ejemplos en cáncer de mama, la CASK (calcio /calmodulina dependiente de la proteína serina quinasa) y CIT (rho-que interactúan, serina /treonina quinasa 21) se clasifican 161 y 115, y con un cambio de 2,88 y 3,06 veces en la expresión de genes de cáncer de mama tejidos, respectivamente. La CASK se ha encontrado para ser asociado con la tumorigénesis de esófago [29]. CIT codifica una serina /treonina-proteína quinasa que las funciones en la división celular. [30]. Estos resultados proporcionan apoyo en los modelos de líneas celulares para la capacidad de TARGETgene para identificar nuevas dianas terapéuticas en el cáncer. Esto también sugiere la posibilidad de combinación de RNAi y pantallas basadas en la red adoptada por TARGTgene para la identificación de objetivos terapéuticos (mayor discusión en la sección de discusión).
gorila, una herramienta de análisis de genes de enriquecimiento de ontologías, se aplicó [31] para identificar los términos de GO enriquecidos que aparecen densamente en la parte superior de las listas de genes clasificados de TARGETgene para cada uno de los tres tipos de cáncer. Muchos de los términos GO proceso identificadas son conocidos los procesos biológicos relacionados con el cáncer, como la regulación de la muerte celular, la regulación de la proliferación celular, la regulación de la migración celular. Curiosamente, varios procesos biológicos relacionados con las nuevas características de los cánceres [32] son también identificados, tales como daños en el ADN, el estrés oxidativo, evadir la vigilancia inmune, estrés metabólico, el estrés mitótico, y el estrés proteotoxic. Estos resultados indican que los genes altamente clasificados según TARGETgene están implicados en múltiples procesos y vías biológicas relacionadas con el cáncer. Además, a menudo se proponen varios tipos de moléculas, tales como quinasas de señalización, los receptores tirosina quinasas y factores de transcripción como posibles dianas moleculares en el cáncer [33] - [36]. Por ejemplo, la fosforilación de proteínas ha demostrado ser una importante fuerza motriz en la señalización celular [37]. También encontramos que muchos quinasa, los receptores, y la transcripción función términos GO relacionada con el factor se enriquecen en los genes altamente clasificados en TARGETgene (sección 3.2.2 del Texto S1). Más detalles acerca de estas anotaciones funcionales se puede encontrar en el archivo S1.
Integración del objetivo predicciones e Información de Drogas de destino.
Después de la cartografía de la información de fármacos /compuestos y sus objetivos para el gen clasificado listas de TARGETgene, el Grupo de Drogas ayuda a identificar los compuestos que ya se han aprobado o están actualmente en ensayos clínicos para el tratamiento de cada uno de los tres tipos de cáncer. Otros fármacos y compuestos identificados por TARGETgene que aún no han sido utilizados en ensayos clínicos, han demostrado también un efecto anti-cáncer y por lo tanto podría ser considerado como posible nuevo fármaco para estos tipos de cáncer. La Tabla 1 enumera algunos de estos fármacos y compuestos cuyos genes se sobreexpresan dirigida y altamente calificados por TARGETgene en Cáncer de Mama (resultados de pulmón y el cáncer de colon se pueden encontrar en la sección 3.3 del Texto S1). Trastuzumab y lapatinib se han aprobado para el cáncer de mama HER2 positivo, y su objetivo principal es ERRB2 muy altamente calificados por TARGETgene (y hasta regulado). Varias otras drogas cuyos objetivos son altamente calificados por TARGETgene, tales como dasatinib, UCN-01, celecoxib, flavopiridol, y vorinostat, ya han estado en ensayos clínicos para el tratamiento del cáncer de mama. Por otra parte, otros compuestos de la droga /han demostrado tener efectos anti-tumorales y podrían ser considerados como potenciales nuevos fármacos para el tratamiento del cáncer de mama, tales como Alsterpaullone y olomoucina. Además, dos compuestos de origen natural, la melatonina y vitamina D (calcidiol), también se identifican por TARGETgene. La melatonina, un compuesto natural que se encuentra en los organismos, puede regular los ritmos circadianos de varias funciones biológicas. Recientemente, un ensayo clínico que incluyó un total de 643 pacientes con cáncer que utilizan la melatonina encontró una reducción en la incidencia de la muerte [38]. Un estudio también mostró que las mujeres con bajos niveles de melatonina tienen un mayor riesgo de cáncer de mama [39]. receptores de vitamina D se han encontrado hasta en el 80% de los cánceres de mama, y los polimorfismos del receptor de la vitamina D se han asociado con diferencias en la supervivencia [40], [41], [42]. Los compuestos activos de vitamina D (calcidiol; calcitriol) también han sido identificados por sus efectos antiproliferativos en células de cáncer de mama [43], [44], aunque los mecanismos detalle aún no están claros. En resumen, estos resultados proporcionan alguna evidencia, además, que los genes que están altamente calificados por TARGETgene pueden ser potenciales dianas terapéuticas
Ejemplo 2:. La identificación de genes mutados en el cáncer de controladores
Los números grandes de mutaciones de genes se han descubierto de próxima generación secuenciación [65]. Un reto importante, sin embargo, es distinguir genes mutados conductor que promueven el crecimiento del cáncer de genes de mutación de pasajeros que no juegan un papel en la progresión del cáncer. Varios intentos se han hecho a genes mutados de forma recurrente identificados como controladores [66], [67], [68], pero hasta ahora estos esfuerzos han sido incapaces de detectar muchos conductores a no ser que se mutan en significativamente altas frecuencias. Por ejemplo, los grupos de genes en una vía que son mutados mutuo exclusivamente. Las diferentes combinaciones de mutaciones en el mismo de señalización importante o vía de reglamentación todo puede generar una perturbación significativa y causan el desarrollo del cáncer, pero estas combinaciones aparecerá exclusivamente en una muestra dada.
Las mutaciones de genes de cubo en redes moleculares son capaces de dyregulating las funciones regulares de muchos genes y sus vías, debido a la capacidad de los genes de cubo de alterar directa o indirectamente otros componentes de la célula durante sus extensas interacciones. De acuerdo con ello, los genes mutados de cubo pueden ser conductores de la progresión del cáncer. En este ejemplo, se aplicó TARGETgene para identificar posibles genes conductor mutado a partir de los genes mutados aproximadamente 500 en el genoma de glioblastoma multiforme (GBM) [69]. Con el fin de identificar aquellos genes cuyas mutaciones tendrán los impactos más significativos en otro gen, elegimos todos los genes en el genoma como genes de semillas y luego TARGETgene clasificamos todos los genes mutados en base a su asociación con todos los genes en el genoma. Se utilizó un conjunto de genes en las vías básicas identificadas de GBM [68] para la validación. Se encontró que estos genes en las vías básicas de validación tienden a ser altamente clasificado por TARGETgene (AUC = 0,94; Figura 3). Varios de estos genes de la ruta de base determinados genes son bien conocidos GBM, como el EGFR (# 1), TP53 (# 22), y PTEN (# 27). Es de destacar, que dos de los genes identificados por TARGETgene son nuevos genes GBM (es decir, no se encontraron citas bibliográficas GBM), incluyendo, CCND2 (# 66) y SPRY2 (# 68). Esto indica que los genes altamente clasificado en la predicción TARGETgene pueden ser conductores oncogénicos o potenciales dianas terapéuticas. En el Panel de Drogas, TARGETgene también enumera algunos medicamentos aprobados que se dirigen en esos genes altamente clasificados identificados por TARGETgene, algunos de los cuales han sido utilizados para el tratamiento del GBM o están actualmente en ensayos clínicos de GBM (resultados no mostrados). Todos los resultados se pueden regenerar mediante el uso de un archivo los genes candidatos Ejemplo2 en el paquete TARGETgene y selección de asociación con todos los genes en el genoma.
Predicción de rendimiento
TARGETgene se evalúa por los genes en las vías principales identificados.
Discusión
identificación de dianas terapéuticas potenciales
sobre la base de los resultados en los dos ejemplos presentados, los genes del cáncer más estudiados, incluyendo aquellos que han demostrado beneficio clínico (por ejemplo, erbB2 TOP2 y en la Tabla 1), son altamente clasificado en las predicciones de TARGETgene en cada uno de los tres tipos de cáncer. Más notablemente, TARGETgene también identificó varios genes altamente clasificados que son nuevas en cada uno de los tres tipos de cáncer. Aunque la mayoría de la aprobación de nuevos fármacos para terapias de cáncer objetivo se dirigen contra unos pocos objetivos existentes, tales como EGFR, ABL1, sólo un pequeño número de compuestos son en desarrollo contra nuevos objetivos [25]. Esto indica que muchos objetivos potenciales permanecen sin descubrir o undrugged. Los enfoques previos utilizados para identificar y validar nuevas dianas en enfermedades son limitadas debido a alto costo, baja el rendimiento y el tiempo necesarios [25]. El enfoque basado en la red de genes como se implanta en TARGETgene es capaz de identificar con eficacia y de forma global dianas terapéuticas del cáncer importante. Lo más importante, los conjuntos de datos biológicos utilizados para construir la red de genes están todos en el ámbito público. Además, aunque algunos estudios han estimado que el tamaño del genoma humano "druggable" para ser alrededor 10~20% del proteoma humano (es decir, el número de las posibles dianas proteicas para el diseño de moléculas pequeñas de drogas en química médica) [70], [71], el desarrollo de terapias basadas en RNAi puede permitir la terapia dirigida de prácticamente cualquier gen [72]. Por lo tanto, los objetivos (hasta reguladas o mutados) identificadas por el enfoque basado en la red de genes en TARGETgene, todos sean posibles dianas terapéuticas que utilizan la terapia basada en RNAi. Sin embargo, la mayor parte de los objetivos previsto por TARGETgene todavía tienen que ser validados en modelos no clínicos y en última instancia en los pacientes.
En los dos ejemplos presentados, los genes hub se identifican como importantes genes relacionados con el cáncer o potenciales dianas terapéuticas usando una medida ponderada grado centralidad. A pesar de las predicciones en los tres tipos de cáncer fueron validados satisfactoriamente en varias formas, se espera que las predicciones basadas en este método a estar sesgados hacia los genes bien conectados en la red. Por ejemplo, algunos genes hub cuello de botella [73] con sólo unas pocas conexiones directas a otros nodos, sino que actúan como conectores clave de la red, no pueden identificarse utilizando la medida en grados centralidad ponderado. El vector propio medida ponderada central que puede dar cuenta de la importancia global de un gen en la red construida es un enfoque para abordar este problema. La red gen construido utilizado en este estudio, sin embargo, no sólo contiene información directa molecular interacción sino también las relaciones funcionales (no dirigida) gen-gen más amplias, reduciendo así el problema de sesgo de selección antes mencionado cuando se utiliza la centralidad de grado ponderado. Observamos que la predicción de rendimiento comparables entre la centralidad de grado ponderado y el vector propio medida ponderada central, el apoyo a este punto (resultados no mostrados). Sin embargo, los genes que no han sido bien estudiados hasta la fecha, pero pueden ser importantes en la progresión del cáncer no será identificado por el TARGETgene, porque se sabe poco acerca de su función. Esta es una limitación actual de TARGETgene para la identificación de objetivos, que se pueden mejorar como datos de más de genómica y proteómica se generan e integrado para construir una red de genes más completa que se incluirán en las futuras versiones de TARGETgene.
Combinación de predicciones de TARGETgene y RNAi pantallas
pantallas
ARNi tienen la capacidad de identificar los genes críticos que controlan relacionada con el cáncer (o relacionada con la enfermedad) fenotipos sin necesidad de utilizar ninguna información biológica antes. pantallas de RNAi por lo tanto se puede esperar que sea una herramienta poderosa para identificar y validar nuevas dianas en el proceso de descubrimiento de fármacos [25]. El enfoque basado en la red de genes adoptada por TARGETgene, sin embargo, no clasificar algunos de los objetivos fijados por RNAi pantallas altamente. Hay varias razones para la diferencia entre el objetivo predicho utilizando RNAi y el enfoque basado en la red de genes en TARGETgene. El uso de pantallas de RNAi tiene varias limitaciones significativas. En primer lugar, las pantallas de RNAi sólo pueden llevarse a cabo en líneas celulares, por lo tanto la importancia de los objetivos debe ser validado en ensayos clínicos. En segundo lugar, los reactivos de ARNi tienen efectos fuera de la meta, lo que resulta en la inhibición de genes que no son los objetivos que darían lugar a la fenotipo específico [25]. A pesar de que es posible reducir el impacto de estos efectos mediante extensas validaciones, sólo unos pocos objetivos se finalizan y por lo tanto generan muchos falsos negativos (es decir, muchos genes que deberían ser objetivos, pero no son detectados). Por el contrario, la detección basada en la red de genes en TARGETgene se puede utilizar para identificar posibles dianas terapéuticas que utilizan directamente los datos del paciente.