Extracto
descubrimiento marcador de cáncer es un tema emergente en la proteómica cuantitativa de alto rendimiento. Sin embargo, la tecnología ómicas suele generar una larga lista de candidatos marcadores que requiere un proceso de filtrado dependiente de trabajo con el fin de pantalla para los marcadores potencialmente útiles. Específicamente, varios parámetros, tales como el nivel de sobreexpresión del marcador en el tipo de cáncer de interés, que se relaciona con la sensibilidad y la especificidad del marcador entre los grupos de cáncer, son las consideraciones más importantes. de perfiles de expresión de la proteína sobre la base de imágenes de tinción inmunohistoquímica (IHC) es una técnica comúnmente utilizada durante tales procedimientos de filtrado. Para investigar sistemáticamente la expresión de la proteína en el cáncer diferente en comparación con los tejidos normales y tipos de células, Human Protein Atlas es un recurso más amplio, ya que incluye a millones de imágenes de alta resolución IHC con anotaciones de expertos-curada. Para facilitar el filtrado de candidatos potenciales biomarcadores de grandes conjuntos de datos ómicas, en este estudio hemos propuesto un sistema de puntuación para cuantificar IHC anotación de los tejidos normales emparejados cancerosos /y tipos de células cancerosas /normal. Hemos calculado integral las puntuaciones de todos los anticuerpos ensayados 17219 depositados en el Human Protein Atlas basa en sus imágenes IHC acumulados y obtuvieron puntajes 457110 cubren 20 tipos diferentes de cáncer. Las pruebas estadísticas demuestran la capacidad del enfoque de puntuación propuesto para dar prioridad a las proteínas específicas del cáncer. Los 100 candidatos potenciales marcadores fueron priorizados para los 20 tipos de cáncer con significancia estadística. Además, un modelo de estudio se llevó a cabo de 1482 proteínas de membrana identificados a partir de una comparación cuantitativa de los tejidos normales y cancerosos adyacentes apareados de pacientes con cáncer colorrectal (CRC). El enfoque de puntuación propuesto demostró priorización exitosa e identificó cuatro marcadores de CRC, incluyendo dos de los más utilizados, a saber CEACAM5 y CEACAM6. Estos resultados demuestran el potencial de este método de puntuación en términos de descubrimiento y desarrollo marcador de cáncer. Todas las puntuaciones calculadas están disponibles en http://bal.ym.edu.tw/hpa/
Visto:. Chiang SC, Han CL, Yu KH, Chen YJ, Wu KP (2013) Priorización de cáncer los candidatos marcadores Basado en las imágenes de tinción inmunohistoquímica depositados en el Human Protein Atlas. PLoS ONE 8 (11): e81079. doi: 10.1371 /journal.pone.0081079
Editor: Chien-Sheng Chen, Universidad Nacional Central, Taiwán
Recibido: 13 Julio, 2013; Aceptado: 8 Octubre 2013; Publicado: 26 Noviembre 2013
Derechos de Autor © 2013 Chiang et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por la Universidad de Yang-Ming, Academia Sinica (Proyecto de Investigación en Nanociencia y Tecnología), y el Consejo Nacional de Ciencia de Taiwán. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
proteómica cuantitativa se ha utilizado ampliamente en el descubrimiento de marcador de cáncer con un cierto grado de éxito [1] - [7]. Este tipo de estudio por lo general genera una enorme cantidad de datos que deben ser analizados adicionalmente con el fin de identificar marcadores candidatos. Aunque no existe una forma estándar para detectar marcadores de cáncer de grandes conjuntos de datos proteómicos [8], estos esfuerzos han aportado una serie de posibles marcadores de cáncer [9] - [11]. A pesar de que diversos enfoques se han desarrollado, los biomarcadores de minería de datos proteómicos de alto rendimiento se basa principalmente en los cambios veces en la expresión de proteínas entre los grupos normal y el cáncer [12]. Se espera que un buen marcador de cáncer a ser altamente sobreexpresado en el grupo de cáncer apropiado, y el grado de la sobreexpresión tiene que ser a la vez importante y específica para el cáncer de interés.
Un método que es capaz de definir el cáncer -especificidad de una proteína para el cáncer de interés es por lo tanto indispensable. Para crear un índice de este tipo de cáncer especificidad, necesitamos tener información sobre la expresión de las diversas proteínas en individuos sanos y en pacientes con diferentes tipos de cáncer. La adquisición de estos datos proteómicos, sin embargo, es de recursos y tiempo a los grupos de investigación académica en pequeña escala. Afortunadamente Human Protein Atlas (HPA) está disponible; esta anota exhaustivamente un gran número de genes y proteínas expresadas en varios tipos de tejidos normales y de cáncer [13] - [15]. HPA es una base de datos basada en anticuerpos. Mediante la aplicación de microarrays de tejidos y técnicas de tinción inmunohistoquímica (IHC), HPA ha acumulado integral millones de imágenes de alta resolución con anotaciones de expertos-curada. tinción IHC es considerada como una técnica eficaz en la investigación proteómica [16], [17]. Sobre la base de estas imágenes, especialmente los que utilizan la tinción IHC, el HPA se ha utilizado de manera efectiva en una serie de estudios para el descubrimiento de marcador del cáncer [18] - [24]. El enfoque utilizado con el HPA en estos estudios, sin embargo, implicado consultas manuales. Desde la anotación de las imágenes IHC es ordinal y denotado por barras de gradiente, la adquisición de los niveles de expresión de proteínas de la HPA es poco intuitivo y de trabajo intensivo. Por otra parte, al examinar las barras del gradiente de las anotaciones de IHC, juicio subjetivo entra en juego y esto puede hacer que la interpretación del nivel de expresión de proteínas por los investigadores inconsistentes a través de diferentes imágenes. De acuerdo con ello, una manera sistemática para cuantificar proteínas de datos de expresión de la HPA, lo que permitiría a la especificidad de las proteínas del cáncer que se define sobre la base de las anotaciones IHC de HPA, se convierte en esencial.
En este estudio, hemos propuesto un enfoque de puntuación basado en la anotación de las imágenes IHC de la HPA. El enfoque de puntuación tiene en cuenta los niveles de expresión de una proteína en los tejidos normales /de cáncer y la importancia /especificidad de cualquier sobreexpresión de la proteína en el tejido de cáncer. Sobre la base del mecanismo de puntuación propuesto, que exhaustivamente priorizado todos los anticuerpos ensayados en el HPA (17219 anticuerpos en la versión HPA 10,0) durante 20 diferentes tipos de cánceres. Un análisis estadístico de los resultados se llevó a cabo por el de una muestra
t-test
y esto demostró que el enfoque de puntuación propuesto es capaz de identificar las proteínas que se sobreexpresan en tejidos de cáncer, y determinar con precisión cuando tal sobreexpresión es significativo y específico para el cáncer de interés. También usamos una cohorte muestra de 1482 proteínas [25] para evaluar la eficacia del enfoque de puntuación propuesto. El sistema de puntuación, en combinación con los cambios veces la proteína, fue capaz de identificar cuatro candidatos marcador para el cáncer colorrectal a partir de la cohorte muestra. Los cuatro candidatos marcadores seleccionados incluyeron CEACAM 5 y CEACAM6, que son los marcadores más utilizados para el cáncer colorrectal en la actualidad; que se utilizan principalmente para la monitorización de pronóstico [26]. Los otros dos candidatos marcadores seleccionados, campamento y ANXA4, también se han notificado a ser marcadores potenciales para el cáncer colorrectal [27] - [29]. Los resultados de la evaluación demuestran el potencial del enfoque de puntuación propuesto cuando se aplica para el descubrimiento de marcador de cáncer. Todas las puntuaciones calculadas están disponibles para su consulta a través de un sitio web, "HPA Scoring" en http://bal.ym.edu.tw/hpa/.
Materiales y Métodos
El IHC imágenes de HPA
en este estudio, inmunohistoquímica (IHC) tinción imágenes de la versión HPA 10,0 lanzado el 12 de septiembre de 2012 (http://www.proteinatlas.org/) se utilizaron para dar prioridad a los genes o proteínas representadas por anticuerpos. entrada de datos en el HPA se indexan utilizando sus nombres de genes. En la versión HPA 10,0, hay 14012 genes, los perfiles de expresión de proteínas de las cuales se miden utilizando anticuerpos 17219 en 46 tipos de tejidos humanos normales, 20 tipos de tejido de cáncer, y 47 líneas celulares humanas. HPA versión 10.0 ha acumulado integral millones de imágenes de alta resolución IHC con anotaciones de expertos-curada, entre los cuales 5.108.055 se han utilizado en este estudio.
Validación de datos
Una cohorte de 1482 proteínas de membrana expresada en tumor emparejados y tejidos normales adyacentes de 28 pacientes diagnosticados con cáncer colorrectal se utilizó como nuestro conjunto de datos de validación [25] (Tabla S1). La información clínica en los 28 pacientes se presenta en la Tabla S2. Este conjunto de datos fue creada originalmente para detectar marcadores potenciales para el cáncer colorrectal.
Cartografía del cáncer y tejidos normales
El sistema de puntuación propuesto se basa principalmente en el uso de las diferencias de expresión de proteínas entre el cáncer y tejidos normales. Por lo tanto había una necesidad de un mapa de la relación entre los diversos tipos de cáncer y sus tejidos normales emparejados. Estas asignaciones, que se extraen de la HPA, se enumeran en la Tabla 1. Un tipo de cáncer se puede definir en un número de diferentes asignaciones de si está emparejado ya sea con más de un tipo de células en un tejido normal (por ejemplo, cáncer de cuello uterino se empareja con célula glandular y células epiteliales escamosas de cuello del útero, del útero) o se combina con más de un tipo de tejido normal (por ejemplo, cáncer colorrectal se empareja con el tejido del colon y el recto). Las diferentes asignaciones se analizaron de forma independiente cuando se aplica nuestro enfoque. Tenga en cuenta que no hay ninguna asignación definida para el cáncer de ovario debido a la falta de tinción IHC resultados de la HPA para tejido de ovario normal. Además, dado que el carcinoma hepatocelular y colangiocarcinoma son totalmente diferentes tipos de cáncer, que eran considerados como diferentes tipos de cáncer en nuestras asignaciones, aunque todos ellos fueron clasificados como cáncer de hígado en el HPA. Eventualmente, 27 asignaciones se definieron para 20 tipos de cáncer utilizando el HPA. Tenga en cuenta que no investigó los subtipos de cáncer, como el carcinoma lobular y carcinoma de los conductos, que son los cánceres de mama, ya que en estos casos el número de muestras de tejido en el HPA es bastante limitada. Nuestro enfoque es orientado por anticuerpos; cada anticuerpo en el HPA se utiliza para evaluar no más de 12 pacientes con un cierto tipo de cáncer. Si clasificamos aún más los correspondientes 12 imágenes IHC en diferentes subtipos de cáncer, que sería muy difícil sacar cualquier conclusión a partir de la evidencia estadística significativa que se basa únicamente en & lt; 10 imágenes IHC. Nos gustaría hacer hincapié en que mirar en los subtipos de cáncer es un aspecto muy importante del descubrimiento marcador de cáncer. Haremos nuestro esfuerzo en esta dirección cuando el HPA u otra base de datos es capaz de proporcionar un número suficiente de imágenes IHC de diferentes subtipos de cáncer.
diferencias de expresión como se detecta por anticuerpos en relación con el cáncer y el mapeado tejidos normales
para una asignación dada y un anticuerpo dado, nuestro objetivo fue determinar la expresión diferencia (
ED
) de la proteína diana entre el cáncer y emparejado muestras de tejido normal. Los niveles de expresión de una proteína en los tejidos se determinan basándose en las anotaciones proporcionadas por el HPA. Cada gen en el HPA se anota; este consiste en una información de genes y proteínas resumen, el anticuerpo y el antígeno, y una gama de diferentes tipos de perfiles de expresión. En este estudio, las anotaciones
Intensidad
y
Cantidad
para la tinción IHC se utilizan para definir el nivel de expresión de una proteína en los tejidos. La anotación
Intensidad
representa el nivel de tinción de anticuerpos. La anotación
Cantidad
representa la fracción de células teñidas positivamente. Puesto que una proteína puede ser reconocida por más de un anticuerpo debido a múltiples sitios de unión, ciertos genes en el HPA se evalúan utilizando más de un anticuerpo. Dado que los anticuerpos utilizados para crear el HPA no son todos de la misma calidad, la evaluación de los resultados de estos anticuerpos pueden ser inconsistentes. Para abordar esta cuestión, nuestro enfoque propuesto está diseñado para ser el fin de superar las inconsistencias en la calidad de los anticuerpos orientado por anticuerpos. Diferentes anticuerpos para un producto determinado gen son considerados como entradas de datos distintas y procesan por separado.
Para la proteína diana, su expresión en los tejidos se caracteriza por las anotaciones
Intensidad
y
Cantidad
. Las dos anotaciones se transforman en primer lugar de forma ordinal de forma numérica. Los cuatro valores fuerte, moderado, débil y negativos que se utilizan para describir
Intensidad
se transforman en 3, 2, 1, y 0, respectivamente. La transformada
Intensidad
se denota por
I
. Del mismo modo, los cinco valores de & gt; 75%, 75% -25%, & lt; 25%, poco común y negativos que se utilizan para describir
Cantidad
se transforman en 75, 50, 25, 5 y 0 , respectivamente. La transformada
Cantidad
se denota por
Q
. El factor básico que define la expresión de una proteína en los tejidos A continuación se calcula utilizando
I
×
Q
(Figura 1A).
Inicialmente, los niveles de expresión de proteínas (A) y la diferencia de expresión (
ED
) entre el tejido canceroso y el tejido normal de todos los anticuerpos que cubren todas las asignaciones se calculan. (B) La importancia del objetivo
ED
con respecto a la cartografía de interés se determina por una distribución z acumulativa. (C) La especificidad del objetivo
ED
con respecto a la cartografía de interés se determina por otra distribución z acumulativa. (D) El resultado del anticuerpo con respecto a la cartografía de interés se determina sobre la base de su nivel de expresión de proteína en tejido de cáncer y la importancia y la especificidad de su
ED
.
para el tipo de célula normal, no importa cuántas veces se utiliza el anticuerpo para realizar la tinción IHC, HPA sólo informa de un par de
Intensidad
y
Cantidad
puntuaciones. Por lo tanto, tenemos sólo un par de
I
y
Q
valores para el tipo normal de las células. La expresión de la proteína en el tipo celular normal,
ein gratis (expresión en condiciones normales), por lo tanto, se define de la siguiente manera: Por ejemplo, sólo hay un par de
Intensidad
y
Cantidad gratis (moderada, & gt; 75%) cuando se utiliza el HPA034966 anticuerpo para la tinción inmunohistoquímica de las células glandulares de tejido mamario normal, por lo tanto, tienen
ein
= 2 x 75 = 150. en general, el los valores de
ein
tendrá un rango de 0 a 225.
a diferencia de la situación de tejido normal, para un tipo de cáncer determinado, la HPA informa de un par de
Intensidad
y
Cantidad
cada vez que el anticuerpo se utiliza para realizar la tinción IHC. En consecuencia, por lo general tienen varios pares de
I
y
Q
valores para un tipo de cáncer determinado. Así, la expresión de una proteína en un tipo de cáncer determinado,
EiC gratis (expresión en el cáncer), se define como el promedio de expresión de la proteína en los tejidos de los pacientes diagnosticados con este tipo de cáncer: donde
n
es el número de pacientes ensayados con diagnóstico de este cáncer. Por ejemplo, se utilizó el anticuerpo HPA034966 para llevar a cabo la tinción IHC en 12 pacientes con cáncer de mama y como resultado, el HPA proporciona 12 pares de
Intensidad
y
Cantidad
puntuaciones; estos son: (Strong, & gt; 75%), (Moderado, & gt; 75%), (Strong, & gt; 75%), (Strong, & gt; 75%), (Moderado, & gt; 75%), (Moderado , & gt; 75%), (Moderado, & gt; 75%), (Moderado, & gt; 75%), (Moderado, & gt; 75%), (Moderado, & gt; 75%), (Moderado, & gt; 75% ), y (moderada, & gt; 75%). Por lo tanto, tenemos
EiC
= (3 × 75 × 75 + 2 + 3 × 75 × 75 + 3 + 2 + 2 × 75 × 75 × 75 + 2 + 2 + 2 × 75 × 75 × 2 + 75 + 2 x 75 + 2 x 75) /12 = 2025/12 = 168,75. En general, los valores de
EiC
también tendrá un rango de 0 a 225.
Finalmente, la diferencia de expresión,
ED
, de un anticuerpo dado para una asignación dada se define como
ED
=
EiC CD -.
ein gratis (Figura 1A)
puntajes de anticuerpos en relación con mapeo del tejido
para un anticuerpo dado y una asignación dada, se espera que el anticuerpo para recibir una puntuación más alta si (1) la proteína diana se sobreexpresa en el tejido de cáncer, y (2) el grado de la sobreexpresión es significativo y específico para la asignación. La puntuación del anticuerpo a la asignación se determina usando, por tanto, los pasos siguientes (Figura 1): Read
Determinar la expresión de la proteína y ED de todos los anticuerpos. En la etapa inicial, primero determinamos los niveles de expresión de proteínas
EiC
y
ein Opiniones de todos los anticuerpos en HPA para todas las asignaciones. La diferencia la expresión
ED Red de anticuerpos se determina utilizando
EiC CD -
ein gratis (Figura 1A). Tenga en cuenta que este paso inicial puede ser considerado como el "inicialización del sistema" y se realiza una sola vez; la calculada
EiC de búsqueda: 's,
ein
' s, y
ED de búsqueda: 's permanecer constante para la puntuación de todos los anticuerpos.
Determinar el significado ED de la diana. Nos gustaría saber si el
ED Red de anticuerpo diana es significativo en relación con el mapeo de interés. El
ED
valores de todos los anticuerpos frente a este mapeo se normalizaron por la transformación z-score para eliminar el sesgo inter-experimento, donde μ
g
y σ
g ¿Cuáles son la media y la desviación estándar de todos estos
ED de búsqueda: 's, respectivamente. El
importancia de la
ED Red de anticuerpo diana para el mapeo,
SG
, se define por la distribución acumulativa z
SG
=
P gratis (
Z
≤
z
g gratis (
ED
)) (Figura 1B).
SG
puede ser considerado como el rango del anticuerpo diana entre todos los anticuerpos con respecto a la asignación de intereses. El valor de un
SG
estará dentro del rango de 0 a 1.
Determinar la especificidad de los servicios de urgencias de destino. También queremos saber si el objetivo
ED
es específico para el mapeo de interés. El
ED de búsqueda: 's del anticuerpo diana de todas las asignaciones están normalizados por la transformación z-score para eliminar el sesgo inter-experimento, donde μ
p
y σ
p ¿Cuáles son la media y la desviación estándar de todos estos
ED de búsqueda: 's, respectivamente. El
especificidad de la
ED Red de anticuerpo diana para el mapeo,
SP
, se define por la distribución acumulativa z
SP
=
P gratis (
Z
≤
z
p gratis (
ED
)) (Figura 1C).
SP
puede ser considerado como el rango de la correlación de destino entre todos los mapeos con el anticuerpo correspondiente al objetivo. El valor de un
SP
también estará dentro del rango de 0 a 1.
Determinar la puntuación del anticuerpo diana. La puntuación de un anticuerpo diana dada en relación con una asignación dada de interés se define como (Figura 1D). El valor de un
Puntuación
estará dentro del rango de 0 a 225.
Resultados y Discusión
Hemos calculado integral las puntuaciones de todos los anticuerpos usados en el HPA para cada uno de los 27 asignaciones y esto dio lugar a 457110 puntuaciones. En lugar de resumir estos en un archivo complementario plana enorme, todas las puntuaciones calculadas están disponibles en un sitio web que permite realizar consultas (http://bal.ym.edu.tw/hpa/) (Figura 2). El sitio web, que alcanzaron el HPA, ofrece dos modos de consulta: una consulta por el nombre de genes y una consulta por tipo de cáncer. Para un nombre determinado gen, que alcanzaron el HPA enumera la puntuación y el rango de los anticuerpos utilizados para cada asignación (Figura 2A). Para una asignación dada de un tipo de cáncer, que alcanzaron el HPA informa de una lista de genes, las entradas en las que están ordenadas según la puntuación de anticuerpo (Figura 2B). En la siguiente parte del estudio, se realiza una verificación de si es o no el enfoque de puntuación propuesto es capaz de identificar anticuerpos que satisfacen los siguientes criterios. En primer lugar, que la proteína capturada se sobreexpresa en el tejido de cáncer de objetivo, y, en segundo lugar, que el grado de la sobreexpresión es significativo y específico para el cáncer. En la segunda parte de esta verificación, también hemos utilizado el cáncer colorrectal como modelo de la enfermedad y se aplica un método de descubrimiento marcador de cáncer específicamente usando nuestro método de puntuación propuesto para el conjunto de datos de cáncer colorrectal
.
(A) El resultado de consulta por el nombre de genes. (B) El resultado de la consulta por la asignación de un tipo de cáncer.
La capacidad del sistema de puntuación para identificar las proteínas abundantes en tejidos de cáncer
Para cada asignación, se elige la 100 mejores anticuerpos de acuerdo con su
Partituras
, y realizar una sola muestra de
t-test
con el fin de verificar si la media
EiC Red de estos anticuerpos es 100 o no estadística superior a la de todos los anticuerpos ensayados. La única muestra de
t-test
menudo se utiliza para medir la diferencia media entre una muestra y una población conocida significar. Aplicamos la de una muestra de
t-test
porque podemos determinar el promedio
EiC Red de todos los anticuerpos ensayados, a saber, la media poblacional. Las significaciones estadísticas de la
EiC
las diferencias de medias entre los anticuerpos Top100 y todos los anticuerpos ensayados para cada asignación se enumeran en la Tabla 2. De acuerdo con el
p
-valores reportados por la de una muestra
t-test
, los 27
EiC
significa diferencias son estadísticamente significativas. Los resultados de estas pruebas demuestran la capacidad de nuestro sistema de puntuación para identificar las proteínas abundantes en tejidos de cáncer.
El significado y el cáncer de la especificidad de la
ED Red de anticuerpos de alta clasificación
con el fin de asegurarse de que el sistema de puntuación propuesto es capaz de identificar las proteínas que se sobreexpresan significativamente en los tejidos de cáncer, realizamos una sola muestra de
t-test
para verificar si es o no el promedio
ED
de los 100 anticuerpos es estadística superior a la de todos los anticuerpos ensayados. Las significaciones estadísticas de la
ED
las diferencias de medias entre los 100 mejores anticuerpos y todos los anticuerpos ensayados se enumeran en la Tabla 3. De acuerdo con el
p
-valores reportados por la sola muestra de
t-test
, todos los 27
ED
significan diferencias son estadísticamente significativas. Los resultados de las pruebas demuestran la capacidad de nuestro enfoque de puntuación para identificar las proteínas que son altamente expresado en el cáncer de interés. Tenga en cuenta que los 100 mejores anticuerpos tienen una tendencia en marcha regulada (positivo
ED
medio de la muestra) para todas las 27 asignaciones. Esto contrasta con los resultados para la mayoría de los anticuerpos ensayados, que muestran una tendencia hacia abajo-regulada en tejidos de cáncer (22 de las 27 asignaciones tienen un negativo
ED
media poblacional).
los anticuerpos Top100 de cada asignación también se utiliza para verificar si es o no el enfoque de puntuación propuesto es capaz de identificar las proteínas cuya sobreexpresión es específico del cáncer de interés. Para los 100 mejores anticuerpos de una asignación específica, su promedio
ED
se determina para cada una de las 27 asignaciones. Los 27
ED
medios obtenidos se organizan en un mapa de calor con gran
ED
los valores de color en azul oscuro y pequeño
ED
los valores de color en azul claro (Figura 3) . La entrada (
i
,
j
) en el mapa de calor representa el promedio
ED
de los 100 anticuerpos de la
j-ésimo de mapeo
calculado para el
i-ésimo
mapeo. La columna más a la derecha, todos, muestra el promedio de
ED
valores de todos los anticuerpos ensayados calculados para cada una de las 27 asignaciones; es decir, las entradas situadas dentro de esta columna son de población
ED
medios. Por consiguiente, el mapa montón tiene las dimensiones 27 por 28. Las entradas de color azul oscuro, situados a lo largo de la diagonal revelan que la media
ED
de los anticuerpos seleccionados para un mapeo son específicas para que la cartografía. En contraste, la mayoría de las entradas en el mapa montón tienen promedio
ED Opiniones de los anticuerpos seleccionados de un mapeo que son similares a la población
ED
quiere decir que si se prueban para otra asignación. Cada fila en el mapa montón confirma la observación de que para un determinado mapeo, de la media
ED
valores de los anticuerpos seleccionados para esta asignación son más altas que la de los anticuerpos seleccionados para otras asignaciones. Cada columna en el mapa de calor también está de acuerdo con otra observación, es decir, que para los 100 anticuerpos seleccionados para una asignación específica, su promedio
ED
sólo es significativo para el mapeo seleccionado y es similar a la media poblacional para otras asignaciones. Los resultados de esta evaluación demuestran que el
ED Red de anticuerpos de alta clasificación es específica para el cáncer de interés.
En este mapa de calor, gran
ED ¿Cuáles son los valores de color azul oscuro y pequeño
ED
valores son de color azul claro. La entrada (
i
,
j
) en el mapa de calor representa el promedio
ED
de los 100 anticuerpos de la
j-ésimo de mapeo
calculado para el
i-ésimo
mapeo. La columna más a la derecha, todos, muestra el promedio de
ED Red de todos los anticuerpos ensayados calculados para cada una de las 27 asignaciones.
En resumen, el enfoque de puntuación propuesto muestra un gran potencial como medios de identificación de proteínas abundantes y específicos de cáncer en los tejidos.
la aplicación del enfoque de marcador de cáncer descubrimiento
en esta sección utilizamos una cohorte de evaluación para demostrar cómo se puede utilizar el método de puntuación propuesto para detectar posibles marcadores para el cáncer. La cohorte consta de 1482 hasta reguladas proteínas de membrana de 28 pacientes que habían sido diagnosticados con cáncer colorrectal [25]. Aplicamos las tres reglas de filtrado con el fin de seleccionar posibles marcadores de cáncer de esta cohorte. Normas similares a las dos últimas se enumeran a continuación han sido ampliamente utilizados en el descubrimiento de biomarcadores.
Regla 1. Una proteína con anticuerpo puntuación de 100, ya sea en el mapeo colorrectal y coma o la asignación de colon-recto se selecciona.
Regla 2. un hasta reguladas proteína con una media veces el cambio se selecciona 2.
Regla 3. una proteína con un factor de cambio 2 en más de 14 pacientes hasta reguladas se selecciona.
las proteínas seleccionadas por estos criterios fueron luego analizados mediante el
biomarcador filtro proporcionado por el IPA (Ingenuity Systems, http://www.ingenuity.com). Cada proteína con potencial de aplicación de biomarcadores o enfermedad es anotado por el IPA durante este proceso
.
Se evaluaron ocho combinaciones de criterios de filtrado. Cada una de las combinaciones toma en consideración diferentes combinaciones de las diversas reglas de filtrado. Los resultados de la filtración se muestran en la Figura 4. Estas reglas que se utilizan para detectar los genes están marcados un signo más en la figura 4A y en caso contrario se marcan con un signo menos. Para cada combinación, el número de genes filtrados, los genes con la anotación de biomarcador, y los genes con la anotación de la enfermedad también se enumeran en la Figura 4A. Especial atención se debe prestar a la combinación 1. En esta combinación, simplemente contienen todas las proteínas 1482 contra el version10.0 HPA para ver cuántos genes relacionados están en el índice en el HPA; En concreto, no se aplican las reglas de filtrado explícitas para seleccionar posibles marcadores. Hay 1114 genes indexadas, entre los que 244 genes tienen anotación de biomarcadores y 914 genes tienen la anotación de la enfermedad de la IPA. El resultado de la combinación 1 forma nuestra población de la muestra. Las proporciones de los biomarcadores anotadas y los genes relacionados con la enfermedad a los genes filtradas de cada combinación se muestran en la Figura 4B. La proporción de los resultados del filtrado a nuestra población de muestra se muestra en la Figura 4C. A saber, las proporciones de los genes filtradas a todos los 1114 genes indexadas, los biomarcadores filtrados a los 244 marcadores anotados, y los genes relacionados con enfermedades filtrados a los 914 genes relacionados con enfermedades anotadas; estos se enumeran en la Figura 4C. La Figura 4C es un diagrama de panel que tiene dos paneles; el superior tiene un eje que cubre la gama completa de datos, mientras que el inferior tiene un eje que se centra en los datos dentro del rango de 0% -25%.
(A) Las reglas que se utilizan para genes de pantalla están marcados con un signo más y por otra parte hay un signo menos. Para cada combinación, se enumeran el número de genes filtradas, los genes con la anotación de biomarcadores y genes con la anotación de la enfermedad. (B) Se muestran las proporciones de biomarcadores anotados y los genes relacionados con la enfermedad a los genes filtradas de cada combinación. se muestra (C) La proporción de los resultados de la filtración a nuestra población de la muestra. Esta figura es un diagrama de panel que tiene dos paneles; el superior tiene un eje que cubre la gama completa de datos, mientras que el inferior tiene un eje que se centra en los datos dentro del rango de 0% -25%.
A continuación, aplicamos Combinaciones 2, 3 y 4, para evaluar el efecto de la regla 1, regla 2, y la Regla 3, respectivamente. Combinación 2, a saber, el artículo 1 solo, permite un cierto grado de éxito en el descubrimiento de biomarcadores; la proporción de los biomarcadores anotado a los genes filtrada se incrementó de 21,9% a 29,8% (Figura 4B). Por otra parte, la combinación 2 tiene la capacidad de detectar genes relacionados con la enfermedad y la proporción de los genes relacionados con la enfermedad anotado a los genes filtrada se incrementó de 82,0% a 87,5% (Figura 4B). La aplicación de Combinación 2 reduce el tamaño de la muestra a 15,1%, pero mantiene el 20,5% de los biomarcadores anotados y el 16,1% de los genes relacionados con enfermedades anotadas (Figura 4C). La aplicación de la combinación 3, a saber, el artículo 2 solo, de manera uniforme encoge el tamaño de la muestra, los biomarcadores anotadas, y los genes relacionados con la enfermedad anotados (4,3%, 4,1%, 4,2%, Figura 4C). La proporción de los biomarcadores anotados y los genes relacionados con la enfermedad a los genes filtradas también se mantiene al mismo nivel que los de la población de la muestra (20,8%
vs
21,9%;. 79.2
vs
. 82,0%, Figura 4B). El efecto de la aplicación Combinación 3 es algo así como un muestreo aleatorio. La combinación 4, a saber, la regla 3, solo, tiene mejor capacidad de detección de biomarcadores entre las tres reglas de filtrado; la proporción de los biomarcadores anotado a los genes filtrada se incrementó de 21,9% a 35,3% (Figura 4B). La aplicación de la combinación 4 uniformemente reduce el tamaño de la muestra y los genes relacionados con la enfermedad anotados (3,1% y 3,0%), pero mantiene el 4,9% de los biomarcadores anotados (Figura 4C). Parece que el Régimen aplicable 1 y 3 son ambas estrategias eficaces cuando se realiza el descubrimiento de biomarcadores.
También evaluar el desempeño de las combinaciones que utilizan dos reglas de filtrado juntos. Combinación 5 se aplica reglas 1 y 2, 6 Combinación aplica las reglas 1 y 3, y la combinación 7 se aplica las reglas 2 y 3. Todas las tres combinaciones encoger dramáticamente el tamaño de la muestra a una escala que es adecuado para la validación de laboratorio húmedo; aplicar Combinaciones 5, 6, 7 y genera 13, 8, y 14 genes filtradas, respectivamente (Figura 4A). Combinación 6 conserva la mayor parte de los biomarcadores. La proporción de biomarcadores anotado a genes filtrada se incrementó de 21.9% a 75% (Figura 4B). Combinaciones 5 y 7 producir resultados similares en cuanto a la identificación de biomarcadores anotadas, mientras que la combinación 5 tiene una mejor capacidad de detección de genes relacionados con la enfermedad. La proporción de los genes relacionados con la enfermedad anotado a los genes filtrada es 92,3% cuando se aplica Combinación 5 pero sólo 64,3% cuando se aplica la combinación 7 (Figura 4B). La evaluación de los resultados están de acuerdo con nuestra observación de que el artículo 1, en combinación con el artículo 3 es capaz de detectar con eficacia los biomarcadores potenciales.