Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: S-Score: un sistema de puntuación para la identificación y priorización de genes cancerígenos predichos

PLOS ONE: S-Score: un sistema de puntuación para la identificación y priorización de genes cancerígenos predichos


Extracto

Un nuevo método, que permite la identificación y priorización de los genes del cáncer predichos para futuros análisis, se presenta. Este método genera una puntuación específica para un gen llamado el "S-Score" mediante la incorporación de datos de diferentes tipos de análisis, incluyendo la detección de mutaciones, estado de metilación, el número de copia variación y de perfiles de expresión. El método se aplicó a los datos de los Atlas del Genoma del Cáncer y permitió la identificación de nuevos oncogenes conocidos y potencialmente y supresores de tumores asociados con diferentes características clínicas que incluyen más corto plazo de la supervivencia en pacientes con cáncer de ovario y subtipos hormonales en pacientes con cáncer de mama. Además, por primera vez, se realizó una búsqueda en todo el genoma de los genes que se comportan como oncogenes y supresores de tumor en diferentes tipos de tumores. Prevemos que la puntuación S se puede utilizar como un método estándar para la identificación y priorización de los genes del cáncer de estudios de seguimiento

Visto:. JES de Souza, Fonseca AF, Valieris R, Carraro DM, Wang JYJ, Kolodner RD, et al. (2014) S-Score: un sistema de puntuación para la identificación y priorización de genes cancerígenos predichos. PLoS ONE 9 (4): e94147. doi: 10.1371 /journal.pone.0094147

Editor: Gil Ast, Universidad de Tel Aviv, Israel

Recibido: 12 Noviembre 2013; Aceptado: March 13, 2014; Publicado: 7 Abril 2014

Derechos de Autor © 2014 de Souza et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este estudio fue apoyado por el CNPq subvención 483775 /2012-6 a SJS y por los Institutos nacionales de Salud de subvención GM26017 a RDK. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

la disponibilidad de diferentes tecnologías "ómicas" y el reciente desarrollo de la próxima generación de secuenciación han aportado nuevas perspectivas al campo de la investigación del cáncer [1]. El proyecto Atlas del Genoma del Cáncer (TCGA), por ejemplo, ha generado grandes cantidades de datos mediante la aplicación de las diferentes tecnologías "ómicas" para estudiar órgano in situ muestras de cáncer específicos [2] - [5]. Los datos del TCGA incluyen mutaciones somáticas, la expresión génica, la metilación y la variación del número de copias, que junto con la información clínica de los pacientes representan un recurso importante para el desarrollo de nuevas estrategias para intervenciones diagnósticas y terapéuticas, así como proporcionar datos de referencia para estudios más detallados de genes y las vías específicas [2] - [5].

Estos datos de todo el genoma se han utilizado para identificar los genes que están alterados en el cáncer. Estas alteraciones suelen ocurrir en los genes supresores de tumores como p53 o como oncogenes KRAS. Las alteraciones de genes supresores de tumores por lo general conducen a la pérdida de la función de las respectivas proteínas, mientras que las alteraciones en oncogenes conducen a un aumento o actividad alterada, ya sea debido a una mayor expresión o activación de mutaciones. A pesar de que existen genes que se alteran con frecuencia en el cáncer, un sorprendente ejemplo de ello es la p53, una de las principales conclusiones de los primeros estudios a gran escala es que el proceso tumorigénico es impulsado por alteraciones en una variedad de genes, tanto individualmente como en combinación, dependiendo del contexto individual del paciente, entre otros factores [2] - [7]

Una cuestión importante en el análisis de estos "ómicas" conjuntos de datos es la forma de medir el impacto de todas las alteraciones genéticas encontradas. en una cohorte de muestras. Lo que se requiere para un estudio de este tipo de impacto es una puntuación de genes específicos que es tanto cualitativo (que indica si un gen es un supresor, un oncogén, cualquiera o ambos) y cuantitativo (que indica la frecuencia de las alteraciones para ese gen en un conjunto dado de tumores). Los intentos anteriores para generar puntuaciones para los genes del cáncer han utilizado un único tipo de datos, ya sea la frecuencia de mutación o patrón de expresión [6], [8]. Más recientemente, Volgestein et al. [1] propuso una estrategia que tenga en cuenta tanto el tipo de mutaciones somáticas (missense recurrente para los oncogenes y la inactivación de las mutaciones de los supresores de tumores) y su frecuencia (que adoptaron una regla del 20%, es decir, los tipos de mutaciones tenían que aparecer en al menos 20% de las muestras analizadas). Aunque esta estrategia puede identificar de manera eficiente las mutaciones del conductor más comunes en los tumores, que no explora todo el espectro de alteraciones genéticas /epigenéticos que generan la heterogeneidad genética característica en los tumores. Otro enfoque ha implicado el cálculo del número de muestras no redundantes en la que se altera un gen o grupo de genes. Aunque esta estrategia se ha utilizado ampliamente, como por ejemplo en el CBio del Genoma del Cáncer Portal [9], que no discrimina entre las alteraciones oncogénicas y supresor de tumores y no permite que el usuario proporcione diferentes pesos para el tipo de alteración genética que se encuentra.

a continuación se propone la puntuación S, que integra información sobre el estado de la mutación, patrón de expresión, el estado de metilación y número de copia para producir un único valor directamente proporcional a la frecuencia en la que un determinado gen se altera en un tipo de cáncer. El valor crítico de este método es que facilita la identificación de los genes del cáncer predichos, órdenes de los rangos que dan prioridad a ellos para el futuro análisis en profundidad e indica que cuenta (por ejemplo, la mutación, expresión, metilación, copiar cambio de número y combinaciones de los mismos) debe investigarse más a fondo. Como prueba de principio, se aplicó aquí el método de puntuación S a los datos obtenidos del proyecto Atlas del Genoma del Cáncer (TCGA) para los tumores GBM, colorrectal, de ovario y de mama.

Material y Métodos

fuente de datos

expresión puntuaciones z, metilación y logís- CNV (variación del número de copias) se obtuvieron datos desde el portal CBio mediante el paquete de CGDS-R, que proporciona un conjunto básico de funciones para la consulta de la Genómica del cáncer servidor de datos (CGDS) a través de la plataforma de R estadística (http://cran.r-project.org/web/packages/cgdsr/index.html). datos de mutación somática se obtuvo de la base de datos COSMIC [10] y de una compilación local de todos mutaciones somáticas que se encuentran en la literatura. Los umbrales para todos los tipos de datos se discuten a continuación. Los datos clínicos para todas las muestras se obtuvieron de la página web TCGA (https://tcga-data.nci.nih.gov/tcga/tcgaHome2.jsp).

amplificación de la CNV y la eliminación

putativa número de copias pide a las muestras se determinaron utilizando logís- [9]. Los umbrales logís- publicados utilizados en el presente estudio fueron: eliminación homocigótica, & lt; = -2; eliminación, & gt; -2 A & lt; = -1; neutra & gt; -1 A & lt; 1; ganancia, & gt; = 1 a & lt; 2; y la amplificación, & gt; = 2. Boxplots se generaron utilizando ggplot2, una herramienta gráfica para el paquete estadístico R.

Se utilizó el análisis de la expresión

Los datos de expresión desde el portal CBio en el análisis presentado aquí [9]. El nivel de expresión dado es la expresión relativa de un gen dado en comparación con la expresión de ese gen en una población de referencia (ya sean muestras normales adyacentes o tumores que son diploides para ese gen). Arriba y abajo-regulación se infiere por la Z-score de que el nivel de expresión, es decir, el número de desviaciones estándar de la media de expresión en la población de referencia. Los mismos datos de expresión se utiliza en el cálculo de la puntuación S en la Figura 1 y también como un conjunto de datos independiente en la Figura 2.

transversales líneas grises indican un umbral de puntuación Z igual a 3. GBM, glioblastoma; OV, cáncer de ovario; BRCA, el cáncer de mama; y COADREAD, el cáncer colorrectal.

Cada punto de datos corresponde a una muestra. (A) Diagrama de dispersión que muestra la expresión (eje Y) y el estado de metilación (eje X) para TMEM101 en el conjunto de los tumores de ovario de TCGA. (B) Diagrama de dispersión que muestra la expresión (eje Y) y copia el estado número para FBXO25 para el cáncer de ovario de TCGA. Sobre la base de los valores logís-, las muestras se dividieron en diferentes categorías (eje X). Métodos para ver los umbrales de logís-. (C) Diagrama de dispersión que muestra la expresión (eje Y) y copia el estado número para ACTR5 en los tumores de colon de TCGA. Sobre la base de los valores logís-, las muestras se dividieron en diferentes categorías (eje X).

Las mutaciones somáticas

Para calcular la puntuación S, sólo se consideran mutaciones sin sentido (ns variables en el ecuaciones presentadas en el texto) que se encuentran para el gen correspondiente en dicho tipo de tumor. La variable se estratificó a dos situaciones posibles: cuando sólo se consideraron las mutaciones sin sentido que se producen en muestras tumorales de TCGA y donde se consideraron las mutaciones sin sentido que se producen en el mismo tipo de tumor (todos los ejemplos disponibles en la cósmica). se utilizó para los datos presentados en las Figuras 3 y 4, mientras que se utilizó para el análisis que se presenta en la Figura 1, la Figura 5 y en la Tabla 1.

Una parcela mapa de calor que muestra genes con S-puntuaciones significativamente diferentes entre corto plazo y largo pacientes de supervivencia -term con tumores ováricos. El azul es indicativa de negativo puntuación S, mientras que el amarillo es indicativo de S-puntuación positiva.

Comparación de S-score para los 50 primeros oncogenes y supresores tumorales top 50 entre ER-PR y ER + PR + subtipos de cáncer de mama. Cada punto de datos es un gen. Ejes X e Y representan los S-calificaciones de ER + PR + y ER-PR-subtipos, respectivamente.

Genoma en todo el análisis de los genes que se comportan como supresor de tumores en un tipo de tumor y en el oncogén un tipo de tumor diferente. Sesenta y siete genes con puntuación S & lt; -2,5 en un tipo de tumor y la puntuación S & gt; 2,5 fueron seleccionados en un tipo de tumor diferente y se presenta un mapa de calor que muestra su puntuación S para todos los tipos de tumores. El azul representa S-resultados negativos, mientras que el amarillo representa S-puntuación positiva

Resultados y Discusión

La puntuación S está dada por la ecuación#1:. (1) donde, (2) y (3)

donde, España
= número de mutaciones sin sentido para el gen respectivo.

= número de muestras en las que el gen respectivo está metilado .

= número total de muestras para el análisis de metilación informativos.

= número de muestras en las que se elimina el gen respectivo

= número total de muestras informativas para el análisis de la CNV.

= número de muestras en las que se amplifica el gen respectivo.

= número de muestras en las que el gen correspondiente se sobreexpresa.

= número total de muestras informativo para el análisis de la expresión génica.

= número de muestras en las que el gen respectivo está bajo-expresó.

= índice para la amplificación.

= índice para la sobre-expresión.

= índice de mutaciones sin sentido.

= índice de metilación.

= índice de supresiones.

= índice para los menores de expresión.

En el caso de & lt; 1 y & gt; 1, a continuación, (4)

En el caso de & lt; 1 y & gt; 1, entonces (5)

En caso y son tanto más pequeño que 1 , entonces . A lo largo de este informe, el registro es una representación de log
2.

El uso de registro en la ecuación#1 permite la puntuación S en un rango de negativo (indicativo de actividad de los genes del tumor reducido suprimir o) a positivo (valores indicativos de oncogén o aumento de la actividad de genes). La puntuación S como la relación entre (ecuación#2) y (ecuación#3) también tiene como objetivo dar más valor a aquellos genes que presentan un patrón exclusivo de cualquiera supresor de tumores o actividad oncogén en un respectivo tipo de tumor. Otra cuestión importante a destacar es que cada tipo de datos, la CNV, la mutación, expresión y metilación, es tratada de forma independiente y tiene un peso proporcional dada por el índice numérico asociado a cada tipo de datos
.
El método de puntuación S fue probada usando datos del proyecto TCGA para cuatro tipos de tumores: de glioblastoma (GBM), tumor colorrectal, tumor de mama y tumor de ovario. Un parámetro crítico en el cálculo de la puntuación S es el índice numérico utilizado para cada tipo de datos. Para encontrar los mejores valores del índice para los parámetros en las ecuaciones#2 y#3, se probaron dos valores para cada índice. En todos los escenarios, se da más peso a mutaciones sin sentido debido al hecho de que este tipo de alteración por lo general conduce a una disminución significativa en la función de la proteína respectiva. Además, en todos los escenarios de la metilación no se utilizó debido a problemas de control de calidad.

Una lista de 138 genes del cáncer identificados por Volgestein et al [1] se utilizó como punto de referencia para evaluar qué conjunto de índices que seleccionar más conocida oncogenes y supresores de tumores. Aunque esta lista se compiló a partir de datos de varios tipos de tumores y aquí sólo se han analizado cuatro tipos de tumores, creemos que nuestro análisis es lo suficientemente amplio como para tal prueba. Para cada tipo de tumor analizado aquí el número de genes con S-score & lt; -2 o & gt; 2 se calculó para cada escenario (Tabla S1). Para la prueba de un posible enriquecimiento, una simulación de Monte Carlo, donde se llevó a cabo fueron seleccionados al azar de 138 conjuntos de genes (de todos los genes humanos conocidos con una puntuación S para el tumor respectiva) y el número de S-puntuaciones extremas calculadas. Entre todos los escenarios de prueba, el que tiene un valor más alto para las mutaciones sin sentido (= 5) y un valor de 0,5 para todos los demás índices promovió el enriquecimiento más significativo de los genes del cáncer conocidos para todos los tipos de tumores (Tabla S1). Además, para evitar cualquier sesgo debido a un umbral arbitrario (S-score & lt; -2 o & gt; 2), se utilizó un nuevo umbral para cada tipo de tumor se define como el S-score con una puntuación Z de 2 (media de todos los S-resultados más o menos dos desviaciones estándar) (Tabla S2). El mismo conjunto de índices, como con el análisis anterior, mostró el mayor enriquecimiento de los genes del cáncer conocidos. Este conjunto de índices (= 5; = 0,5; = 0,5; 0,5 = y = 0,5). A continuación se usó para todos los otros estudios

Para obtener más información sobre la capacidad predictiva del método de puntuación S, una estrategia diferente de referencia se realizó para definir el "valor predictivo positivo" y "valor predictivo negativo" para cada tipo de tumor. Un millar de juegos al azar de 50 genes fueron seleccionados de la lista de 138 genes de Volgestein et al. [1] y se utilizaron para calcular el número medio de verdaderos positivos y falsos negativos. En una manera similar, se seleccionaron mil conjuntos aleatorios de 50 genes de todos los genes humanos (menos los genes del cáncer 138) se seleccionaron y se utilizaron para calcular el número medio de verdaderos negativos y falsos positivos para cada tipo de tumor. Estos valores se muestran en la Tabla S3 Cabe mencionar, sin embargo, que la lista de los genes del cáncer de Volgestein et al. [1] no es el estándar de oro para este tipo de análisis, ya que contiene varios genes que son o bien los oncogenes o supresores en diferentes tipos de tumores que los que aquí se analizan. Estas características probablemente subestiman la capacidad predictiva del método de puntuación S.

Estos análisis anteriores muestran que el método de puntuación S es capaz de identificar
de buena fe
oncogenes y supresores de tumores. Los datos mostrados en la Tabla 1 confirma que la compilación de los genes del cáncer de Volgestein et al. [1] está sesgada hacia los S-puntuaciones extremas (& gt; 2 o & lt; -2). Cuando un umbral normalizado se utiliza (S-resultados representan la S-puntuación media de más o menos dos desviaciones estándar) el mismo patrón se observa (Tabla S4).

Figura 1 traza la distribución de los S-anota para todos los genes humanos en cada tipo de tumor. Esos genes humanos con S-resultados que eran extremos positivos o negativos (puntuación Z & gt; 3) en al menos un tipo de tumor se enumeran en la Tabla S5. Como confirmación de este método, supresores tumorales y oncogenes conocidos anteriormente muestran valores S-score extremas para estos tipos de tumores. En GBM, por ejemplo, el gen de la más alta puntuación S es EGFR. Otros genes con altos S-resultados positivos incluyen los que se asigna al mismo locus como EGFR (como SEC61G, LANCL2 y ECOP) y por lo tanto se amplifica junto con EGFR. Mientras que estos genes no son necesariamente causalmente implicados en el proceso tumorigénico, representan alteraciones genéticas de buena fe en el tipo de tumor, que podrían ofrecer nuevas oportunidades terapéuticas y de diagnóstico, según lo informado por genes pasajeros eliminados en los tumores [11], y como tal deben ser reportados . La eficacia de nuestro método también se ilustra en el otro extremo de la distribución de S-score. Entre los genes con los S-resultados más negativos son bien conocidos los genes supresores tumorales como CDKN2A (S la puntuación más negativa para el GBM), PTEN, NF1 y RB1. Los S-puntuaciones de todos los genes humanos en los cuatro tipos de tumores se presentan en la Tabla S6.

Una utilidad del sistema S-Score es que permite una fácil identificación de genes de interés para el análisis adicional. Por ejemplo, considere los genes FBXO25 (S-score = -3.18 en el cáncer de ovario), TMEM101 (S-Puntuación = -1.6 en cáncer de ovario) y ACTR5 (S-score = 3,69 en el cáncer de colon) que se clasifican por nuestro análisis como supresor, supresor putativo y oncogén, respectivamente. Evaluación de las parcelas de expresión en comparación con el número de copias o la metilación de estos genes, según el caso (Figura 2) identifica fácilmente estos genes como teniendo una fracción de identificación de los casos TCGA asociados con la reducción de número de copias y la expresión reducida (gen supresor de candidatos), la reducción de expresión y aumento de la metilación (candidato gen supresor de silenciado) y el aumento de número de copias y la expresión aumentada (oncogén candidato), respectivamente. Para ilustrar la utilidad de tales parcelas de estrategia para oncogenes y supresores conocidos se proporcionan como Figuras S1-S3. Este tipo de clasificación más detallada a continuación, facilitar los estudios de seguimiento, proporcionando una priorización de los genes, basado en la puntuación, para su posterior análisis. Ninguno de los tres genes anteriormente han sido identificados previamente como estado involucrado en el desarrollo de los respectivos tipos de tumores.

La puntuación S también permite una comparación directa entre las muestras clasificadas de manera diferente de acuerdo con una actividad biológica y /o clínica parámetro. Para ilustrar esta aplicación, las muestras en los datos de cáncer TCGA de alto grado serosos de ovario se dividieron en cuartiles de acuerdo con la supervivencia global. A continuación, calcula la puntuación S para todos los genes humanos utilizando las muestras que pertenecen a la primera (supervivencia más corta) y la última (la supervivencia más larga) cuartil de la distribución de supervivencia. Una comparación de S-resultados calculados a partir de los dos grupos nos permitió identificar los oncogenes putativos (con S-resultados positivos) y los genes supresores de tumor putativo (con S-resultados negativos) asociadas ya sea con el menor o mayor supervivencia (Figura 3). Varios de los genes identificados son conocidos marcadores para la supervivencia. Por ejemplo, la inhibición CDC42 se ha asociado con una mayor supervivencia en ratones con xenoinjertos de cáncer de próstata [12]. Otro ejemplo es CANX cuya regulación a la baja se ha asociado con una mayor supervivencia en pacientes con GBM [13]. Por otra parte, las variantes genéticas de RGS12 se han asociado con la supervivencia en la fase tardía de cáncer no microcítico de pulmón de células [14]. Otro gen interesante es TJP2 cuya sobreexpresión se ha relacionado con la supervivencia a largo plazo en GBM [15], de acuerdo con el patrón que se muestra en la Figura 3.

Entre los genes identificados por este sistema de puntuación para asociarse con la supervivencia, los más interesantes son los que tienen las clasificaciones opuestos (puntuaciones positivas y negativas) en el menor o la supervivencia más prolongada cuartiles. Hemos encontrado que glucoronidasa B (GUSB) tuvo una puntuación positiva (3,04, indicativo de oncogén) para el grupo de supervivencia más corta y una puntuación negativa (-1.40, indicativo de supresor de tumores) para el grupo de supervivencia más larga. Glucuronidasas son conocidos por estar involucrados en la propagación de las células tumorales del sitio primario [16] y GUSB ha sido recientemente incluido en una firma para predecir la metástasis de los ganglios linfáticos en el cáncer cervical [17]. El método de puntuación S confirma la idea de que GUSB tiene una función oncogénica en los tumores más agresivos (supervivencia más corta). Sin embargo, su negativo S-score en los tumores menos agresivos indica que la pérdida de GUSB también podría impulsar el desarrollo de cáncer de ovario con los tumores resultantes de ser menos agresivos. Un hallazgo interesante en nuestro análisis es la asociación de RAD23B y XPC, ambos con S-resultados negativos, con supervivencia a corto plazo (Figura 3). Las proteínas codificadas por estos genes forman un complejo implicado en la reparación del ADN dañado. Un número de otros genes con los opuestos S-resultados en la supervivencia de los grupos de mínimo y uno máximo se presenta en la Figura 3. Estos genes pueden representar potenciales biomarcadores de pronóstico, así dianas para el desarrollo de nuevas terapias.

Para explorar más a fondo el potencial del sistema de puntuación S para identificar los genes relacionados con diferentes parámetros clínicos, los pacientes con cáncer de mama a partir de la cohorte TCGA se dividieron de acuerdo con dos subtipos hormonales: ER + PR + y ER-PR (ER: receptor de estrógeno; PR: receptor de progesterona ). Los datos de los pacientes de cada subtipo se utilizaron para calcular los S-puntuaciones de todos los genes humanos. Mientras que los oncogenes en los dos subtipos son básicamente los mismos, se observa una discordancia mucho mayor para los genes supresores de tumor. Esto se muestra en el gráfico de dispersión en la figura 4, que contiene los 50 primeros oncogenes supresores putativo y 50 putativo (clasificados según la ER + PR + subtipo). Si bien todos los oncogenes en el ER + PR + subtipo (S-score alrededor de 4) también se clasifican como oncogenes en el subtipo ER-PR (S-score que van desde 1,42 a la 5,50), los supresores tumorales en el ER + PR + (S -score en torno a -4) tienen una clasificación diferente en el subtipo ER-PR (S-puntuación que oscila entre -4.85 a la 2.69) con. De hecho, una gran fracción de los supresores en el subtipo ER + PR + se clasificaron como oncogenes en el otro subtipo (Figura 4). Estos resultados sugieren que las diferencias en las características biológicas y clínicas entre estos dos subtipos de cáncer de mama puede ser debido a diferencias en sus genes supresores de tumores. Estas firmas de genes representan una oportunidad para el desarrollo de objetivos para nuevas aproximaciones diagnósticas, pronósticas y terapéuticas.

El método de puntuación S también fue utilizado en una búsqueda en todo el genoma de los genes que pueden comportarse como supresor tumoral en una tipo y oncogenes en un tipo de tumor diferente. En los últimos años se ha demostrado que algunos genes de presentar dicho patrón. NOTCH1, por ejemplo, es un oncogén conocido por las células T de la leucemia linfoblástica aguda [18] - [19] sino que también presenta actividad supresora de tumores en tumores de la piel [20] y hepatocarcinoma [21]. El uso de un conjunto de criterios estrictos (S-score & gt; 2,5 en un tipo de tumor y S-score & lt; -2,5 en un tipo de tumor diferente), encontramos 65 genes que mostraron actividades supresoras oncogénicos y tumorales en diferentes tipos de tumores (entre los cuatro tipos analizadas aquí). Nuestro análisis identificó como un gen LMO7 comportarse como supresor de tumores y oncogenes. Este gen se ha informado de que las reguladas en el cáncer de pulmón [22] y ratones que carecen de este gen tienen una mayor susceptibilidad al cáncer de pulmón espontánea [23]. Por otra parte, el gen parece ser un oncogén tanto de mama [24] y el cáncer de hígado [25]. Otro candidato interesante es USP12, un gen que codifica para una deubiquitinase. Recientemente, USP12 ha demostrado ser un regulador positivo de la actuación del receptor de andrógenos de una manera pro-proliferativa en el cáncer de próstata [26]. USP12 también puede actuar como un supresor de tumores, regulando negativamente la activación de AKT y promoviendo así la apoptosis [27]. Se necesitan más análisis para explorar a fondo todos los genes que se muestran en la Figura 5. Es importante destacar que NOTCH1 no ha aparecido en nuestra lista debido al hecho de que no hemos utilizado los datos de leucemia en nuestros estudios
.
inconveniente del método S-score, que es una limitación en cualquier intento de establecer este tipo de sistema de puntuación, es la falta de un índice para la activación de mutaciones que se producen en oncogenes. Por ejemplo, la activación de mutaciones en KRAS son conocidos por ser un factor determinante para muchos tipos de tumores [28]. Aunque la puntuación S para KRAS fue positiva para tres de cada cuatro tumores analizados aquí, nuestro método no fue capaz de medir el impacto de estos tipos de mutaciones activadoras en oncogenes. Una posibilidad sería el uso de mutaciones sin sentido, como sostiene Volgestein et al. [1]. Un problema con mutaciones sin sentido, sin embargo, es la forma de evaluar su impacto en el nivel de proteínas, ya sea que están activando, inactivando o neutral. Aunque existen herramientas computacionales destinados para inferir el efecto de una mutación sin sentido a nivel de proteínas, seguimos pensando que su rendimiento en general es pobre [29]. Sin embargo, a medida que mejoramos nuestra comprensión de la naturaleza de las mutaciones sin sentido, este tipo de alteraciones genéticas se pueden incorporar en el cálculo de la puntuación S.

Para hacer que el sistema de puntuación S más útil a la comunidad, una portal web se proporciona en http://www.bioinformatics-brazil.org/S-score con las puntuaciones en todo el genoma disponibles para su descarga, así como un sistema de recuperación de consultas personalizadas. Además, los usuarios pueden modificar los valores de todos los parámetros en las ecuaciones#2 y#3 y generar S-puntuaciones de todos los genes humanos conocidos. Una lista de todas las muestras del TCGA de cada tipo de tumor utilizada en este estudio se ofrece como Tabla S7.

Apoyo a la Información
Figura S1.
Expresión X parcela para la metilación de MGMT conocido supresor de tumores. Cada punto de datos representa una muestra de GBM. Los datos muestran el silenciamiento de MGMT en varias muestras de GBM
doi:. 10.1371 /journal.pone.0094147.s001 gratis (TIF)
figura S2.
expresión x número de copias parcela variación para el CDKN2A conocido supresor de tumores. Cada punto de datos representa una muestra de GBM. Categorías de la variación del número de copias fueron definidos por la clasificación logís-. Homdel = homocigotos supresión; Hetloss = pérdida de heterocigosis
doi:. 10.1371 /journal.pone.0094147.s002 gratis (TIF)
Figura S3.
Expresión X parcela número de copias variación para el oncogén ErbB2 conocido. Cada punto de datos representa una muestra de tumor de mama. Categorías de la variación del número de copias fueron definidos por la clasificación logís-. Hetloss = pérdida de heterocigosis; . Amp = amplificación
doi: 10.1371 /journal.pone.0094147.s003 gratis (TIF)
Tabla S1.
Selección de índices para los parámetros en las ecuaciones S-score. Cada fila representa un escenario de valores para los índices. El número entre paréntesis corresponde al número de genes por encima del umbral (S-score & gt; 2 o S-score & lt; -2) en el conjunto real de 138 genes de Volgestein et al. [1]. Los números en cada celda se corresponden con el número de juegos de simulación en el que el número de genes con S-puntuaciones por encima del umbral es igual o mayor sea el número correspondiente en el conjunto real (número en paréntesis)
doi:. 10.1371 /revista. pone.0094147.s004 gratis (DOCX)
Tabla S2.
Selección de índices para los parámetros en las ecuaciones S-score. Cada fila representa un escenario de valores para los índices. Número entre paréntesis corresponde al número de genes por encima de los (valores de S-puntuación correspondiente a la media, más o menos dos desviaciones estándar) de umbral en el conjunto real de 138 genes de Volgestein et al. [1]. Los números en cada celda se corresponden con el número de juegos de simulación en el que el número de genes con S-puntuaciones por encima del umbral es igual o mayor sea el número correspondiente en el conjunto real (número en paréntesis)
doi:. 10.1371 /revista. pone.0094147.s005 gratis (DOCX) sobre Table S3.
Mil juegos al azar de 50 genes fueron seleccionados de la lista de 138 genes de Volgestein et al. [1] y se utilizaron para calcular el número medio de verdaderos positivos y falsos negativos. Valor predictivo positivo (VPP) se calculó mediante la siguiente ecuación: verdaderos positivos /verdaderos positivos + falsos positivos. En una manera similar, se seleccionaron mil conjuntos aleatorios de 50 genes de todos los genes humanos (menos los genes del cáncer 138) y se utilizan para calcular el número medio de verdaderos negativos y falsos positivos para cada tipo de tumor. El valor predictivo negativo se calcula mediante la siguiente ecuación: verdadero negativo verdadero negativo /+ falso negativo
doi:. 10.1371 /journal.pone.0094147.s006 gratis (DOCX) sobre Table S4.
genes del cáncer conocidos tienen S-puntuaciones extremas. Número de genes (juego real) con S-resultados superiores a la media más dos desviaciones estándar (puntaje z = 2) o más pequeño que el promedio de dos desviaciones estándar de menos (puntuación Z = -2) en la lista de genes del cáncer de Volgestein 138 et Alabama. [1]. Los números en la fila "10.000 conjuntos simuladas" corresponden al promedio en número de genes con S-score por encima o por debajo del umbral de 10.000 conjuntos que contienen 138 genes seleccionados al azar. Entre paréntesis es el intervalo correspondiente a la media +/- 2 × desviación estándar. P-valor de la diferencia entre las series reales y simulados se muestra en la última fila
doi:. 10.1371 /journal.pone.0094147.s007 gratis (DOCX) sobre Table S5.
Correlación entre la puntuación Z y S-score para el tumor de BRCA. Cada hoja de cálculo listas de todos los genes humanos con S-resultados que eran extremos positivos o negativos (Z-score & gt; 3)
doi:. 10.1371 /journal.pone.0094147.s008 gratis (XLSX) sobre Table S6 .
S-puntuaciones de todos los genes humanos. Para cada uno de los cuatro tipos de tumores analizados aquí, todos los genes humanos están ordenados alfabéticamente con sus correspondientes S-resultados
doi:. 10.1371 /journal.pone.0094147.s009 gratis (XLSX) sobre Table S7.
de identificación de todas las muestras TCGA utilizados en este estudio. número de identificación para todas las muestras del TCGA utilizados en este estudio
doi:. 10.1371 /journal.pone.0094147.s010 gratis (XLS)

Reconocimientos

Los autores son endeudarse a Raimundo Furtado Neto para ayudar en la optimización del algoritmo de puntuación S.

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]