Extracto
Antecedentes
No ha habido mucho interés en la diferenciación de las muestras enfermas y normales usando biomarcadores derivados de los estudios de espectrometría de masas (MS). Sin embargo, la identificación de biomarcadores para enfermedades específicas ha visto obstaculizado por irreproducibilidad. Específicamente, un perfil de pico extraída de un conjunto de datos para la identificación de biomarcadores depende de un algoritmo de pre-procesamiento de datos. Hasta ahora, se ha llegado a un acuerdo ampliamente aceptada.
Resultados
En el presente trabajo, se determinó la consistencia de la identificación de biomarcadores usando expresados diferencialmente (DE) picos de perfiles de picos producidos por tres ampliamente utilizados promedio de algoritmos de procesamiento previo que dependen del espectro en base a los datos de SELDI-TOF MS para los cánceres de próstata y de mama. Nuestros resultados revelaron dos factores importantes que afectan la consistencia de la identificación de los picos DE utilizando diferentes algoritmos. Un factor es que algunos picos DE seleccionados de un perfil de pico no se detectaron como picos en otros perfiles, y el segundo factor es que el poder estadístico de identificar DE picos en grandes perfiles de picos con muchos picos puede ser baja debido a la gran escala de las pruebas y pequeño número de muestras. Por otra parte, hemos demostrado que el poder de detección de picos DE en grandes perfiles se podría mejorar la tasa de falso descubrimiento estratificado (FDR) enfoque de control y que la reproducibilidad de la detección de pico DE este modo se podría aumentar.
Conclusiones
la comparación y evaluación de algoritmos de procesamiento previo en términos de reproducibilidad puede dilucidar la relación entre los diferentes algoritmos y también ayudar en la selección de un algoritmo de tratamiento previo. Los picos DE seleccionados de perfiles de picos pequeños con unos picos para un conjunto de datos tienden a ser detectado de forma reproducible en grandes perfiles de picos, lo que sugiere que un algoritmo de tratamiento previo adecuado debe ser capaz de producir picos suficiente para la identificación de biomarcadores útiles y reproducibles.
Visto: Zou J, Hong G, Guo X, Zhang L, C Yao, Wang J, et al. (2011) Cáncer reproducible descubrimiento de biomarcadores en SELDI-TOF MS con diferentes algoritmos de procesamiento previo. PLoS ONE 6 (10): e26294. doi: 10.1371 /journal.pone.0026294
Editor: William C. S. Cho, Hospital Queen Elizabeth, Hong Kong
Recibido: Junio 7, 2011; Aceptado: September 24, 2011; Publicado: 14 Octubre 2011
Derechos de Autor © 2011 Zou et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por la Fundación Nacional de Ciencias Naturales de China (30970668, 81071646, 91029717) (http://www.nsfc.gov.cn/Portal0/default106.htm), Excelente Fundación Juvenil de la provincia de Heilongjiang (JC200808) (http: //jj.hljkj.cn/qn/), Fundación de Ciencias Naturales de la provincia de Heilongjiang de China (QC2010012) (http://jj.hljkj.cn/zr/index.htm), y el Fondo de Investigación Científica del Departamento de Educación Provincial de Heilongjiang (11541156). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
tecnologías proteómicas basadas en la espectrometría de masas (MS) [1] se han convertido en cada vez más el método de elección para la identificación de biomarcadores que son útiles para diferenciar muestras enfermas y normales [2], [3], [4] . Sin embargo, similar a los estudios de microarrays [5], [6], el uso de técnicas de MS para identificar biomarcadores de la enfermedad se ha visto obstaculizado por irreproducibilidad [7], [8]. Por ejemplo, los biomarcadores identificados en cuatro estudios de cáncer de próstata son muy diferentes [8]. Recientemente, Callesen
et al
. [7] mostraron que se detectaron sólo 10 de 207 biomarcadores reportados en 15 estudios de cáncer de mama basados en MS en más de 2 estudios. Este irreproducibilidad plantea cuestiones acerca de la importancia biológica y las implicaciones clínicas de los biomarcadores detectados.
Muchos factores, tales como los procedimientos de procesamiento y funcionamiento de la muestra para los experimentos, pueden afectar a la reproducibilidad de los biomarcadores de la enfermedad [9], [10] , [11], [12], [13], [14], [15]. Es importante destacar que, el algoritmo de pre-procesamiento de datos elegida para producir perfiles de picos pueden afectar en gran medida la identificación de biomarcadores [16]. Algunos estudios han tratado de encontrar el algoritmo óptimo de tratamiento previo para los picos la detección de [17], [18], [19]. Sin embargo, hasta ahora, se ha llegado a ningún acuerdo ampliamente aceptado. Por ejemplo, en base a los datos simulados con picos verdaderos predefinidos, Marcelo Cruz-
et al
. [17] y Emanuele
et al
. [18] evaluaron varios algoritmos en términos de sensibilidad (definida como la proporción de verdaderos picos que fueron identificados correctamente) y especificidad (definida como la tasa de falso descubrimiento (FDR)). Estos dos estudios llegaron a conclusiones diferentes sobre los tres algoritmos que evalúan tanto, que eran MassSpecWavelet [20], Cromwell [21] y el software comercial producido por Ciphergen Biosystems. Cruz-Marcelo
et al
. [17] informó de que estos algoritmos ofrecen una alta sensibilidad mínima FDR, mientras que Emanuele
et al
. [18] mostró que tenían una baja sensibilidad y un bajo FDR. Este conflicto puede haber sido introducida por las diferencias en sus datos de simulación, que en general tienden a estar condicionadas por situaciones específicas. Una solución para evitar el sesgo es adoptar datos reales en lugar de los datos simulados. Desafortunadamente, con datos reales, la sensibilidad y FDR de un algoritmo no puede ser evaluada porque los verdaderos picos son desconocidos. Sin embargo, los algoritmos de pre-procesamiento pueden ser comparados en términos de reproducibilidad de pico de detección mediante la evaluación de solapamiento de pico. En particular, la reproducibilidad es una medida crítica para la validación de descubrimientos biológicos que es distinta de la sensibilidad y especificidad [6], [22], [23], [24].
En este estudio, el uso de la próstata real y el cáncer de mama datos, primero evaluó la reproducibilidad de la detección de pico entre los tres algoritmos de pre-procesamiento ampliamente utilizados que detectan picos dependen en el espectro promedio de todos los espectros (ver
Métodos
), incluyendo SpecAlign [25], MassSpecWavelet [ ,,,0],20] y Cromwell [21]. Más importante aún, se evaluó además la reproducibilidad de la detección de picos expresados diferencialmente (DE) (a menudo definido como biomarcadores), que ha sido un foco de la comunidad biológica, pero no se han evaluado completamente, ya sea con datos simulados o reales. Nuestros resultados indican que el número de picos detectados para un conjunto de datos varía dramáticamente dependiendo del algoritmo de pre-procesamiento. Nuestros resultados también revelaron dos factores importantes que afectan a la consistencia de la identificación de los picos DE utilizando diferentes algoritmos de pre-procesamiento. El primer factor es que un perfil de pico puede carecer DE picos encontrados en otro perfil, que puede afectar la reproducibilidad antes de la selección de De picos. El segundo factor es que un perfil pico grande con muchos picos puede sufrir de bajo poder estadístico para identificar DE picos debido a la gran escala de la prueba junto con el número reducido de la muestra [26], [27], [28], [29] . Afortunadamente, nuestros resultados indican que el poder de perfiles de picos grandes se puede aumentar mediante el enfoque de control de FDR estratificado [30]. En consecuencia, DE picos seleccionados de perfiles de picos pequeños tienden a ser detectado de manera reproducible en perfiles de picos grandes. Con base en el análisis de este estudio, se sugiere que un algoritmo de tratamiento previo adecuado debe ser capaz de producir picos suficientes para la identificación de biomarcadores útiles y reproducibles.
Materiales y Métodos
conjuntos de datos de cáncer
Los datos de cáncer de próstata, que se ha descargado de http://www.evms.edu/vpc/seldi/, consistió en los espectros de duplicado de 168 cáncer y 81 muestras de suero normales medida por SELDI-TOF MS (IMAC fichas -3), con la carga de masa-(
m /z
) relación que oscila de 0 a 200 kDa [31]. Las muestras de sangre de los diagnosticados en estadio I-IV pacientes fueron adquiridos por el Departamento de Urología, Eastern Virginia Medical School y las muestras de hombres sanos se obtuvieron de las clínicas de detección gratuitas abiertas al público en general (ver detalles en [31]). Las muestras de suero se obtuvieron a partir del tejido de próstata Virginia Center y el Banco de fluidos corporales. Los datos de cáncer de mama, que se ha descargado de http://bioinformatics.mdanderson.org/pubdata.html, consistió en los espectros de duplicado para 26 cáncer y 14 muestras de plasma normal medida por SELDI-TOF MS (chip IMAC-Cu), con el
m /z
relación que varía de 10 a 100 kDa [32]. Las muestras de sangre fueron obtenidas de pacientes con carcinoma de mama en estadio I-III diagnosticados y voluntarios sanos (ver detalles en [32]). Las muestras de plasma se llevaron a cabo en el Centro de Mama Nellie B. Connally en la Universidad de Texas MD Anderson Cancer Center
.
Para cada par de espectros duplicado, los dos espectros fueron pre-procesados por separado y luego se promedian para producir una perfil de consenso. Teniendo en cuenta las limitaciones de ruido de medición y detección, que sólo se utiliza esos picos en el
m /z
rango de 1-10 kDa para el cáncer de mama y de 2-40 kDa para el cáncer de próstata en nuestros análisis como en los documentos originales [31 ], [32].
algoritmos pre-procesamiento de datos
Como se ilustra en la Figura 1, los datos de SELDI-TOF-MS son por lo general pre-procesado de múltiples etapas que incluyen la eliminación de ruido (suavizado), la línea de base resta, la normalización, la detección de pico, el agrupamiento de picos y cuantificación de pico [17]. Los tres algoritmos analizados en este estudio detectan picos de acuerdo con el espectro promedio de todos los espectros, y los procedimientos de pre-procesamiento se describen a continuación. Los ajustes de parámetros específicos usados para cada algoritmo se pueden encontrar en el texto S1.
(A) Espectro de Raw. (B) Espectro de alisado. La base estimada a partir del espectro suavizado se representa como la línea gris. (C) espectro normalizado. La línea base se resta de la espectro alisado. Entonces, el espectro de la línea de base-resta se normaliza. Los picos detectados en base al espectro normalizado aparecen en círculos.
(1). SpecAlign [25] preprocesa los datos de la siguiente manera: a) de suavizado espectro usando el filtro Savitzky Golay-; b) restando el nivel de referencia estimado por una sobria, media móvil; c) las intensidades de cambio de escala a valores positivos por lo que el valor mínimo 0; d) la normalización de las intensidades de dejar que todos los espectros tienen la misma corriente de iones total; e) la generación de un espectro de la media; f) el uso de la transformada rápida de Fourier (FFT) /asignación de picos método combinado para alinear los picos detectados de espectros individuales a los identificados en el espectro de la media; y g) los picos de picking. La relación altura predeterminada que sirvió como la relación señal-ruido (SNR) fue de 1,5.
(2). El paquete MassSpecWavelet para la detección de pico [20] en combinación con el paquete de proceso para la cuantificación de pico [33] (denotado RSU /PRO). MassSpecWavelet se ha informado que tienen una alta sensibilidad con un FDR baja para la detección de pico [17]. Sin embargo, no cuantifica los picos detectados. Así, con base en el trabajo de Cruz-Marcelo
et al
. [17], se utilizó proceso para cuantificar los picos detectados por MassSpecWavelet. MassSpecWavelet detecta picos utilizando la transformación wavelet continua sobre el espectro promedio de todos los espectros. Para cada espectro, el proceso de resta la línea de base, que se estima por interpolación lineal, a continuación, normaliza las intensidades utilizando el área mediana bajo las curvas de todos los espectros, y, finalmente, cuantifica los picos detectados de espectros individuales por el máximo local en el intervalo predefinido . La SNR por defecto para la detección de pico era 3.
(3). Cromwell [21] pre-procesa los datos mediante a) la computación un espectro promedio; b) eliminación de ruido del espectro medio por el wavelet discreta no diezmada transformar; c) la corrección de intensidades para el espectro promedio restando la línea de base, que se estima por una curva monótona mínimo; d) la búsqueda de picos con intensidades máximas locales para el espectro medio; e) repetir b) y c) para cada espectro, la normalización de las intensidades de corriente de iones con total medio, y la cuantificación de las intensidades de pico utilizando el máximo dentro de los intervalos que definen picos en el espectro de la media; y f) extraer los picos con una SNR definida por el usuario. El valor por defecto SNR se fijó en 5, de acuerdo con la recomendación de los desarrolladores.
La salida de un algoritmo de tratamiento previo es un perfil de pico para el conjunto de datos, que se compone de los picos detectados y sus correspondientes intensidades en cada espectro. Para simplificar, los perfiles de picos producidos por SpecAlign, RSU /PRO y Cromwell se denotan perfil SpecAlign, RSU /perfil PRO y el perfil Cromwell, respectivamente.
Dos picos con un
m /z
relación diferencia dentro de un rango de desplazamiento puede corresponder a la misma molécula biológica [17], [34]. En este estudio, hemos utilizado los rangos de desplazamiento de ± 0,1%, ± 0,2% y ± 0,3%, y los resultados fueron similares. Para simplificar, sólo presentamos los resultados basados en el rango de cambio de uso común de ± 0,3% [17],.
Debido a que los objetivos de optimización para la detección de picos no están definidos en datos reales, los ajustes de parámetros predeterminados para la pre algoritmos -Procesamiento se utilizan para la detección de picos en la mayoría de aplicaciones. Sin embargo, algunos estudios pueden sintonizar la SNR para encontrar más o menos picos [17], [18], [35], [36]. Por lo tanto, de manera similar sintonía la SNR en nuestro estudio para comparar los algoritmos de procesamiento previo. Además, debido a que una SNR más baja puede detectar picos más verdaderas y útiles, hemos considerado principalmente la menor de las dos SNR al comparar un algoritmo con otro (ver detalles en el
Discusión
).
la detección de picos y dE índices de consistencia
de Student
t-test
se utilizó para evaluar la significación de las diferencias entre la intensidad significa del cáncer y las muestras normales. Para la corrección de múltiples ensayos, se utilizó el procedimiento Benjamini-Hochberg para controlar el FDR en un nivel determinado [37].
La consistencia de dos listas de pico se midió por el PO (porcentaje de solapamientos) Resultado [38] . Suponiendo lista 1 con
l
1 picos y la lista 2 con
l
2 picos comparten
k
picos, entonces la puntuación PO de la lista 1 ( o 2) a la lista 2 (o 1) es
PO
12 =
k
/
l
1 (o
PO
21 =
k
/
l
2). Debido a que la puntuación de PO depende de la longitud de la lista, también se calculó la puntuación normalizada PO (
n
PO), que se define como la proporción de la puntuación observada más allá de la posibilidad de la puntuación máxima correspondiente potencial más allá del azar [38 ] :( 1) (2) donde E (PO
12) (o E (PO
21)) se calcula como el promedio de las puntuaciones de pedido
12 (o PO
21) para 1.000 pares de las listas de pico (con longitudes de
l
1 y
l
2) extraídos al azar de las dos primas
m /z
listas. Entre las calificaciones de las 1.000 parejas al azar de las listas de pico, el
p-valor
de observar la puntuación PO por azar se calculó como la proporción de la puntuación no inferior a la puntuación observada.
el PO (
n
PO) puntuación entre dos listas de de picos se calculó por el mismo método que se ha descrito anteriormente, excepto que un pico dE se define como siendo compartido por dos listas sólo si se reguló en el misma dirección en los dos perfiles de picos [38]. E (PO) se evaluó usando DE listas de pico extraídos al azar de los dos perfiles de picos. A continuación, presentamos el PO (
n
PO) puntuación de la lista más corta a la lista más larga y evaluar el grado de que la lista más corta está cubierto por la lista más larga.
Nos indican el PO (
n
PO) puntuación de los picos detectados por el algoritmo
Un
a los detectados por el algoritmo
B Opiniones como PO
AB (
n
PO
AB), mientras PO
dE
AB (
n
PO
dE
AB) es para de picos
estratificado FDR enfoque de control.
En las pruebas a gran escala con múltiples ajustes actuales de prueba, la potencia podría disminuir a medida que el número de pruebas se incrementa [27], [30], [39]. Para aumentar la potencia, un enfoque estratificado control de FDR se ha propuesto [24]. Como prueba de principio, analizamos si la consistencia de la detección de pico DE se puede aumentar mediante la mejora de la capacidad de identificar DE picos en los perfiles de los picos grandes usando el enfoque de control de FDR estratificado, que se basa en la suposición de que los picos con el gran cambio veces ( FC) Los valores pueden ser más propensos a ser verdaderos picos dE [40]. En primer lugar, hemos aplicado el k-means clustering algoritmo de particionar los picos en
k
grupos, reduciendo al mínimo la suma de la distancia euclídea al cuadrado entre el valor de FC para cada pico y su más cercano centro de la agrupación [41]. La óptima
k
fue elegida como la partición que resulta en una máxima media de los valores de la silueta, que mide la similitud de un pico es para otros picos en su propio grupo en comparación con los de otros grupos [42]. Entonces, en un nivel particular de control de FDR, se seleccionaron DE picos en cada grupo. Ya que no hay superposición entre los descubrimientos de diferentes grupos, el FDR de los resultados integrados sigue siendo menor que el FDR nivel determinado [30].
Resultados
La reproducibilidad de la detección de pico
a continuación, los resultados para cada algoritmo se basa en la SNR por defecto a menos se indique lo contrario. Para el conjunto de datos de cáncer de próstata, 31 y 53 picos fueron detectados por SpecAlign y RSU /PRO, respectivamente, y todos ellos fueron incluidos en los 420 picos detectados por Cromwell. Además, se evaluó la reproducibilidad de la detección de pico utilizando el mismo número de picos por la disminución de la SNR de uno de los dos algoritmos. Sin embargo, incluso utilizando las SNR más bajas de 1 y 0,1 permisible para SpecAlign y RSU /PRO, respectivamente, sólo se detectaron 130 y 90 picos. La mayoría fueron incluidos en los picos detectados por Cromwell con PO
SC (
n
PO
Carolina del Sur) y PO
MC (
n
PO
MC) marca tan alto como 1 (1) y 0,93 (0,93), respectivamente (Figura 2A). Para la comparación entre SpecAlign y RSU /PRO, el PO
SM (
n
PO
SM) fue de 0,84 (0,84). Cuando la SNR se redujo a 1,27, SpecAlign detecta el mismo número de picos (53) como MSW /PRO, pero la puntuación se redujo a 0,74 (0,73) (Figura 2A).
(A) para el cáncer de próstata y (B) para el cáncer de mama. Se evaluó la reproducibilidad entre un algoritmo (
x
eje y etiqueta) con diversas SNR y otro (título) con la SNR por defecto. Las SNR por defecto para SpecAlign, RSU /PRO y Cromwell fueron de 1,5, 3 y 5, respectivamente. Los triángulos rellenos representan el número de picos (derecha
y
eje x) detectada por el algoritmo, que se muestra por el
x
eje y etiqueta. Todo PO (
n
PO) las puntuaciones fueron significativamente más altos de lo esperado por azar (
p Hotel & lt; 2,2E-11).
Para el conjunto de datos de cáncer de mama , 19 y 47 picos fueron identificados por SpecAlign y RSU /PRO, respectivamente, y todos ellos fueron incluidos en los 287 picos detectados por Cromwell. Por otra parte, como se muestra en la Figura 2B, incluso después de la disminución de la SNR a los valores más bajos permisibles para SpecAlign y RSU /PRO, sólo 104 y 52 picos, respectivamente, se han detectado, y todos ellos fueron detectados por Cromwell. La puntuación coherencia entre SpecAlign y RSU /PRO no fue alta, con un pedido
SM (
n
PO
SM) La puntuación de 0,68 (0,68). Después de la SNR se redujo a 1.181, SpecAlign detectó el mismo número de picos (47) como RSU /PRO, y el PO
SM (
n
PO
SM) puntuación se redujo a 0,55 (0,55 ) (Figura 2B).
los resultados anteriores sugieren que cuando se utiliza la SNR por defecto para cada algoritmo en estos dos conjuntos de datos, y SpecAlign RSU /PRO tienden a ser menos sensibles a la detección de pico de Cromwell. Todos los picos detectados también tienden a ser detectado por Cromwell. Cromwell todavía podría capturar casi todos los picos detectados por SpecAlign y RSU /PRO cuando la SNR de los dos últimos algoritmos menos sensibles se redujeron.
La reproducibilidad de la detección de pico DE
A continuación, se evaluó la reproducibilidad de identificación de los picos en los perfiles de dE pico producido por diferentes algoritmos de pre-procesamiento. Para el conjunto de datos de cáncer de próstata, se seleccionaron 27 y 24 picos DE de la SpecAlign y RSU /perfiles PRO, respectivamente, con un control de FDR 10%. La mayoría de estos también estaban presentes en los 229 DE picos identificados a partir del perfil Cromwell, y el PO
DE
SC (
n
PO
DE
Carolina del Sur) y PO
DE
MC (
n
PO
DE
MC) las puntuaciones fueron 0,81 (0,62) y 0,96 (0,92), respectivamente. Aunque todos los picos en el perfil SpecAlign se incluyeron en el perfil Cromwell, más de 10% de los picos DE seleccionados no se incluyeron en los picos DE encuentran en el perfil Cromwell. Después de las relaciones SNR se redujeron para SpecAlign y MSW /PRO, la coherencia entre la DE picos de estos dos perfiles de picos y los del perfil Cromwell disminuyó ligeramente (Figura 3A y 3B). La coherencia entre los 27 y 24 DE picos detectados en el SpecAlign y los RSM /perfiles PRO fue relativamente baja, con un pedido
DE
EM (
n
PO
DE
MS) La puntuación de 0,54 (0,31). Sin embargo, después de la SNR se redujo de SpecAlign, la puntuación aumentó a 0,79 (0,61) a medida que más picos fueron incluidos en el perfil SpecAlign ampliada y se detectaron como DE picos (Figura 3C).
(A), ( B), (C) para el cáncer de próstata y (D) para el cáncer de mama. Se evaluó la reproducibilidad entre un algoritmo (
x
eje y etiqueta) con diversas SNR y otro (título) con la SNR por defecto. Las SNR por defecto para SpecAlign, RSU /PRO y Cromwell son 1,5, 3 y 5, respectivamente. Los picos DE fueron seleccionados con un control FDR 10%. Los diamantes negros representan el número de picos (DE derecha
y
eje y) detectados utilizando el algoritmo mostrado por el
x
eje y etiqueta. Todo PO
DE (
n
PO
DE) las puntuaciones fueron significativamente más altos de lo esperado por azar (
p Hotel & lt; 7.0E-3) guía empresas.
Para el conjunto de datos de cáncer de mama, con un control de FDR 10%, sólo se seleccionaron 2 dE picos del perfil SpecAlign, y que se incluyeron en los picos 8 dE seleccionados a partir del perfil de RSU /PRO con un pedido
dE
SM (
n
PO
dE
SM) La puntuación de 1 (1). Después de la SNR se redujo para SpecAlign, se observaron resultados similares (Figura 3D). Sin embargo, no hay picos DE fueron seleccionados a partir del perfil Cromwell.
Dos factores principales afectan a la consistencia de la identificación de los picos DE
Nuestro análisis reveló dos factores importantes que pueden afectar a la consistencia de la identificación de los picos DE usando diferentes algoritmos de pre-procesamiento. El primer factor es que algunos picos DE seleccionados de un perfil de pico no se pueden incluir en otro perfil de pico. Por ejemplo, para el conjunto de datos cáncer de próstata, con un control de FDR 10%, 11 de los 24 De picos identificados a partir del perfil MSW /PRO no se incluyeron en el perfil SpecAlign. Cabe destacar que, después de la SNR de SpecAlign disminuyó a 1,27, 6 de estos 11 DE picos fueron incluidos en el perfil seleccionado como SpecAlign y DE picos, lo que condujo a una mayor reproducibilidad (Figura 3C). Obviamente este factor afecta en gran medida la consistencia de identificación de los picos DE. El segundo factor es que el poder estadístico de la identificación de los picos de DE en diferentes perfiles de picos varía. Por lo tanto, algunos picos compartidas por dos perfiles de picos pueden ser detectados como DE picos en un perfil, pero no en otro. El poder estadístico puede verse afectada por muchas variables, tales como la cuantificación de pico, el número de picos para las pruebas, el tamaño de la muestra, la proporción de verdaderos positivos y el nivel de control FDR [6], [26], [27], [28 ]. Aquí, se analizaron principalmente los efectos de la cantidad de pruebas y tamaño de la muestra en el poder.
En primer lugar, se utilizó un ejemplo para ilustrar el efecto de la serie de pruebas. En el conjunto de datos de cáncer de mama, en un nivel de control FDR 10%, no se detectaron picos DE en todo el perfil Cromwell, que consistía de 287 picos. Sin embargo, cuando se considera una sub-perfil del perfil Cromwell compuesto por todos los picos incluido en el perfil de RSU /PRO, se detectaron 6 DE picos y todos fueron incluidos en los picos 8 DE identificados en el perfil de RSU /PRO. Cabe destacar que el
t-test
p
-valor de corte para declarar significación basada en el procedimiento Benjamini-Hochberg FDR [37] era 0,013, pero se redujo a 0,0003 en todo el perfil Cromwell, que dio lugar a potencia cero para la búsqueda dE picos (es decir, no se encontraron picos dE). Del mismo modo, cuando se considera un subperfil del perfil Cromwell compuesto de todos los picos del perfil de SpecAlign, se detectaron 2 DE picos en el nivel de control FDR 10%, y eran idénticos a los picos 2 DE identificados a partir del perfil SpecAlign.
Para ilustrar el efecto del tamaño de la muestra, que muestra al azar subconjuntos en los distintos niveles del tamaño de muestra del conjunto de datos de cáncer de próstata de 249 muestras. En cada nivel de tamaño de la muestra, se muestrearon aleatoriamente 100 subconjuntos con las proporciones de las muestras normales y de cáncer en cada subconjunto celebrada idénticos a los del conjunto de datos en bruto. A medida que el tamaño de la muestra aumenta, el número de DE picos seleccionados con un control de 10% FDR en el perfil del pico producido por cada algoritmo de pre-procesamiento aumentado, lo que indica que el poder de detectar picos DE aumentó (figura 4). Por consiguiente, la consistencia de los picos DE seleccionados utilizando los diferentes algoritmos de procesamiento de pre-aumenta considerablemente.
El valor predeterminado SNR se utilizó para cada algoritmo de pre-procesamiento. En cada tamaño de la muestra, se calculó el número medio de De picos detectados a un control de FDR 10% basado en 100 subconjuntos muestreadas al azar. Los cuadrados rellenos, triángulos y rombos representan el número promedio de picos (DE derecha
y
eje y) se detecta utilizando SpecAlign, RSU /PRO y Cromwell, respectivamente.
Mejora de reproducibilidad por aumentar el poder estadístico
Tal como se muestra anteriormente para el conjunto de datos de cáncer de mama, la completa falta de poder estadístico para identificar dE picos en algunas grandes perfiles de picos es un factor importante que afecta a la consistencia de la detección de pico dE. Como prueba de principio, hemos demostrado que la capacidad de encontrar DE picos en el perfil de cáncer de mama Cromwell podría mejorarse mediante el enfoque estratificado de control de FDR, que puede aumentar la consistencia entre los picos DE identificados y los seleccionados del SpecAlign y MSW /perfiles profesionales. El uso de las k-medias algoritmo de agrupamiento como se describe en el
Métodos
, los 287 picos detectados en el perfil Cromwell se agruparon en 2 grupos. Un grupo contenía 259 picos con valores bajos de FC, y el otro grupo contenía 28 picos con valores altos de FC. Con un nivel de FDR estratificada de 10%, se detectaron un total de 16 DE picos, que incluía la mayor parte de los picos DE detectadas en los perfiles SpecAlign y RSU /PRO utilizando las SNR por defecto con un pedido
DE
SC (
n
PO
dE
MC) y PO
dE
MC (
n
PO
dE
MC) de 1 (1) y 0,75 (0,74), respectivamente. Al bajar la SNR para SpecAlign y MSW /PRO, resultados similares se obtienen generalmente (Figura 5). Sin embargo, después de la SNR se redujo a 1 para SpecAlign, el PO
DE
SC (
n
PO
DE
SC) fue de sólo el 0,5 (0,47). Este resultado indica que el enfoque estratificado de control FDR puede aumentar en gran medida el poder de detección, pero todavía hay cierto margen de mejora.
Uso de Cromwell en el valor predeterminado SNR, el enfoque estratificado de control FDR detecta DE 16 picos en el 10% nivel. Para SpecAlign y RSU /PRO, se utilizó el enfoque simple de control de FDR para seleccionar DE picos. Todo PO
DE (
n
PO
DE) Las puntuaciones fueron significativamente más altos de lo esperado por azar (
p Hotel & lt; 0,013). Para una descripción detallada de las figuras ver la leyenda de la Figura 3.
Sin embargo, con el perfil Cromwell cáncer de próstata, los enfoques simples y estratificados de control FDR tenían la misma potencia (es decir, que detecta la misma DE picos). Este resultado puede deberse a que el poder del enfoque simple de control de FDR para identificar DE picos ya era alta.
Comparación con biomarcadores reportados en el estudio del cáncer de mama inicial
Un total de 5 De picos eran reportado en el estudio original del conjunto de datos de cáncer de mama [32]. En resumen, el tratamiento previo procedimiento utilizado en el documento original incluye el filtro Savitzky-Golay, resta la línea de base, la normalización de la misma corriente de iones total y los picos de extracción con SNR no menos que 3,0, y los picos DE fueron seleccionados con un
t-estadística
puntaje & gt; 3,5. Se evaluó si estos 5 DE picos podrían ser reproducidos utilizando los tres algoritmos de procesamiento previo con sus SNR por defecto. Cuando se utilizó el algoritmo SpecAlign, se detectaron solamente 2 de estos 5 DE picos como picos y luego detectados como DE picos en el control de FDR 10%. Utilizando el /algoritmo de RSU PRO, los 5 DE picos fueron identificados como picos y luego se detectan como DE picos. Usando el algoritmo de Cromwell, se detectaron los 5 DE picos como los picos, pero ninguno fue seleccionado como un pico DE FDR en el nivel del 10%, por el simple enfoque de control de FDR. Sin embargo, los 5 DE picos fueron incluidos en la feria 16 de picos seleccionados utilizando el algoritmo de Cromwell en el FDR nivel de 10% cuando se usa el control FDR estratificado.
Discusión
La reproducibilidad es de fundamental importancia para la validación de los descubrimientos biológicos de alto rendimiento de datos. En los estudios de EM, los algoritmos de pre-procesamiento pueden afectar en gran medida el descubrimiento de biomarcadores. Utilizando los datos biológicos para el cáncer, nuestro estudio mostró que el número de picos identificados en un conjunto de datos varía dependiendo del método de pre-procesamiento. También reveló que la consistencia de la identificación de los picos DE se ve afectada por dos factores importantes, la ausencia de algún DE picos en otro perfil de pico y la potencia estadística reducida de identificación de los picos DE en los perfiles con un gran número de picos, pero un pequeño número de muestras . Nuestros resultados indican que el DE picos seleccionados de perfiles de picos pequeños tienden a ser detectado de forma reproducible en grandes perfiles cuando se logra la suficiente potencia para identificar DE picos en grandes perfiles a través de enfoques estadísticos potentes, tales como el enfoque de control de estratificado FDR. Los análisis de este estudio podrían extenderse a otras tecnologías proteómicas basadas en MS. Por ejemplo, para la espectrometría de masas tándem (MS /MS), el uso de diferentes algoritmos de procesamiento previo para la detección de pico y diferentes motores de búsqueda de proteínas que emparejan podría producir perfiles de proteínas variadas [43]. Por lo tanto, los dos factores revelados en este estudio también podrían afectar a la consistencia de la detección de biomarcadores en estudios de MS /MS
.
Sobre la base de un estudio de simulación, Marcelo Cruz-
et al
. [17] sugiere que la combinación de MassSpecWavelet y el proceso ofrece una alta sensibilidad con un FDR baja para la detección de pico. Sin embargo, sobre la base de nuestro análisis de la reproducibilidad de pico y pico de detección DE basado en dos conjuntos de datos reales, el /algoritmo PRO RSU (es decir, la combinación de MassSpecWavelet y proceso) tendía a detectar un menor número de picos de Cromwell, lo que indica que podría ser menor sensible para la detección de pico y podría perder algunos picos dE detectable mediante el uso de Cromwell.