Extracto
Antecedentes
Hay dos maneras de que los métodos estadísticos pueden aprender a partir de datos biomédicas. Una forma es aprender clasificadores para identificar enfermedades y para predecir los resultados utilizando el conjunto de datos de entrenamiento con diagnóstico establecido para cada muestra. Cuando la formación de datos no está disponible la tarea puede ser a la mía por la presencia de grupos significativos (clusters) de muestras y para explorar la estructura de datos subyacente (aprendizaje no supervisado).
Resultados
Hemos investigado la perfiles proteómicos de la fracción citosólica de las muestras de hígado humano utilizando electroforesis bidimensional (2DE). Las muestras fueron resecados tras el tratamiento quirúrgico de las metástasis hepáticas en el cáncer colorrectal. Sin supervisión agrupación jerárquica de imágenes de gel 2DE (n = 18) reveló un par de grupos, que contiene 11 y 7 muestras. Anteriormente se utilizaron las mismas muestras para medir perfiles bioquímicos basados en actividades enzimáticas P450 dependiente de citocromo y también se encontró que las muestras se divide claramente en dos grupos bien separados por análisis de conglomerados. Resultó que los grupos de actividad enzimática casi se adaptan perfectamente a los grupos identificados a partir de los datos proteómicos. De los 271 puntos reproducibles en nuestros geles 2DE, se seleccionaron 15 para distinguir los grupos citosólica de hígado humano. El uso de MALDI-TOF péptido masiva de huellas dactilares, se identificaron 12 proteínas de los spots seleccionados, incluyendo las especies asociadas al cáncer conocidos.
Conclusiones /Importancia
Nuestros resultados destacan la importancia de análisis de agrupamiento jerárquico de proteómica datos, y mostró la concordancia entre los resultados de los enfoques bioquímicos y proteómica. Agrupación de las muestras de hígado humano y /o pacientes en diferentes grupos puede proporcionar ideas sobre posible mecanismo molecular del metabolismo de fármacos y crea una base para un tratamiento personalizado
Visto:. Petushkova NA, Pyatnitskiy MA, VA Rudenko, Larina OV , Trifonova OP, Kisrieva JS, et al. (2014) La aplicación de la agrupación jerárquica de Análisis de los patrones de proteínas en la asociada a cáncer de hígado humano. PLoS ONE 9 (8): e103950. doi: 10.1371 /journal.pone.0103950
Editor: Silvia Mazzuca, Università della Calabria, Italia |
Recibido: 26 Febrero, 2014; Aceptado: 4 Julio 2014; Publicado: 1 Agosto 2014
Derechos de Autor © 2014 Petushkova et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. El trabajo fue apoyado por el Ministerio de Educación y Ciencia de la Federación de Rusia, Estado Contrato No. 16.522.12.2002. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:. Se emplean dos autores también por una empresa comercial Postgen Tech LLC, pero no lo hicieron recibir pagos o servicios de la empresa para cualquier aspecto de la obra presentada (incluyendo, pero no limitado a las subvenciones, la junta de supervisión de datos, diseño del estudio, la preparación de manuscritos, análisis estadístico, etc.). Esto no altera la adhesión de los autores a PLoS ONE políticas en los datos y materiales de uso compartido.
Introducción
Las metástasis hepáticas por lo general daña progresivamente la función hepática y son altamente maligno y refractarios a las terapias convencionales [1] . La comprensión de los mecanismos moleculares y biológicas del cáncer colorrectal puede permitir el desarrollo de nuevas estrategias terapéuticas para prevenir y tratar las metástasis hepáticas [2], [3]. Además, las terapias basadas en moleculares pueden extender el tiempo hasta la recurrencia después de la resección hepática curativa y pueden prolongar la supervivencia del paciente. El desarrollo de estrategias más eficaces y menos tóxicos contra el cáncer también permitirá la personalización de los regímenes terapéuticos de acuerdo con las características moleculares de los pacientes individuales [4]
.
Los estudios proteómicos de muestras de hígado pueden ayudar a identificar los marcadores de proteínas específicas para metástasis [5]. Uno de los procedimientos más utilizados para la caracterización de los componentes proteicos de los sistemas biológicos es de dos dimensiones-electroforesis en gel de poliacrilamida (2DE) en combinación con espectrometría de masas. Típicamente, 2DE se utiliza para comparar los cambios en el nivel de proteína, modificación, y la degradación entre las muestras tratadas y no tratadas [6]. cambios proteómicos pueden ser reveladas por análisis de imagen gel después de la visualización mediante tinción e identificación de especies de proteínas con expresión alterada o en estados posteriores a la traducción [7].
La mayoría de los estudios basados en el análisis 2DE de los perfiles de proteínas en el cáncer colorrectal son realizado en lisado de tejido de adenocarcinoma colorrectal, mucosa de colon normal adyacente, y metástasis hepáticas [8] - [10]. Tal estrategia se limita en gran medida a las proteínas abundantes (por ejemplo, proteínas estructurales, enzimas glucolíticas, anexinas, catepsinas, y proteínas de choque térmico) que se sobreexpresan en varios tipos de cáncer [8]. Sin embargo, estas proteínas pueden dificultar la identificación de proteínas de baja abundancia, como las proteínas de membrana, que desempeñan un papel fundamental en la señalización celular, interacciones célula-célula, la comunicación y los mecanismos de transporte, y son dianas de medicamentos [11]. enfoques específicos asociados con el aislamiento de subproteomas material clínico, como la secretoma, proteasoma, la fracción de la membrana plasmática, la matriz nuclear, etc., han surgido recientemente. Fraccionamiento subcelular combinado con técnicas de espectrometría de masas es un enfoque poderoso para descubrir novela, abundantes, proteínas colorrectales asociada específicos bajos y biomarcadores candidatos [8]. Por ejemplo, se observaron 1687 puntos de proteínas en geles de gran formato (24 x 33 cm) de una fracción de proteína soluble de tejidos cancerosos y normales de la mucosa y se demostró que la intensidad de ≥96% manchas de proteínas se dispersa dentro de las diferencias de 2 veces y & gt; 90,5% dentro de las diferencias 1,5 veces [12]. Por una fracción citosólica de hígado humano en 17 × 24 cm, geles 2 veces menor número de puntos de proteínas (911 puntos) fueron emparejados [13]. análisis de imagen 2DE mostraron que el número de manchas de proteínas se modificaron significativamente en el cáncer primario y lesiones metastásicas hepáticas. Según se informa, la fracción de membrana de cáncer primario y metástasis hepáticas demostró pérdida de contenido de proteína (es decir, el número de manchas de proteínas emparejado en geles 2DE) en comparación con la fracción de membrana de mucosa colorrectal normal [10]. Muto et al. [12] informaron de que generalmente el proteoma de tejido normal puede ser más homogénea que la de los tejidos tumorales.
Anteriormente, hemos descrito un método para discriminar muestras microsomales hepáticas en ciertas clases sobre la base de perfiles bioquímicos [14]. En este informe, un diseño experimental para comparar los perfiles bioquímicos y proteómica se presenta (Figura 1). En la primera etapa de este enfoque, se obtuvo el perfil bioquímico. Se incluyó 12 parámetros, a saber, actividad de NADPH citocromo P450 reductasa, el contenido de citocromo P450 y P450 monooxigenasa actividades dependiente de citocromo 10 con sustratos marcadores. Puramente de análisis estadístico no supervisado de los perfiles bioquímicos de microsomas de hígado humano se derivó de que los patrones del sistema de monooxigenasa hepática formaron dos grupos bien separados (Figura 1, A). Se demostró que al menos 6 variables fueron significativamente diferentes entre los dos principales grupos de muestras microsomales de hígado humano que tiene
p
-valor & lt; 0,05 con la corrección de Bonferroni. Además, se encontró que los cambios en la actividad de reductasa P450 NADPH-citocromo comprenden el factor principal, responsable de la separación de los perfiles bioquímicos entre dos grupos de pacientes [14].
(A) El perfil incluye 12 parámetros, a saber, actividad de NADPH citocromo P450 reductasa, el contenido de citocromo P450 y P450 monooxigenasa actividades dependiente de citocromo con sustratos marcadores (Petushkova et al., 2010). (B) El perfil incluye imágenes 2DE.
Para correlacionar el perfil de proteínas HLC, según lo definido por la Eco-2D, con actividades bioquímicas del sistema microsomal que previamente usadas recolectadas muestras de hígado morfológicamente normales que rodean las metástasis hepáticas de cáncer de colon cáncer. ultracentrifugación protocolo se empleó para producir fracciones de citosol del hígado y microsomales humanos a partir de la misma muestra de hígado. El presente estudio se realizó para comparar los grupos de muestras obtenidas de acuerdo con la actividad bioquímica microsomal (Figura 1, A) con los respectivos perfiles proteómicos citosólicos (Figura 1, B). Por otra parte, se mostraron interesados en la identificación de proteínas solubles, que pueden ser de alguna manera relacionada con la actividad de la membrana citocromos P450.
Materiales y Métodos
Los procedimientos éticos
todas las muestras de hígado residual tras el análisis histológico fueron aprobados por el Departamento de Anatomía Patológica del Centro de Investigación Nacional de Cirugía, de la Academia rusa de Ciencias médicas (Moscú, Rusia). El consentimiento informado se obtuvo de todos los pacientes. Las personas que aceptaron participar en el estudio según el comité de ética de la institución local del Centro de Investigación Nacional de Cirugía. Las muestras se han descrito en las publicaciones anteriores [14], [15].
Químicos
2- [4- (2-hidroxietil) piperazin-1-il] etanosulfónico, phenylmethanesulfonylfluoride (PMSF ), 2,5-dihidroxibenzoico, ácido etilendiaminotetraacético (EDTA), nicotinamida adenina dinucleótido fosfato, ditionito de sodio, tripsina, y desoxicolato de sodio se adquirieron de Sigma-Aldrich (St. Louis, MO, EE.UU.); acetonitrilo y ácido trifluoroacético se adquirieron en ICN Pharmaceuticals Inc. (Costa Mesa, CA, EE.UU.); Coomassie Brilliant Blue R-250 se adquirió de Fluka (Seelze, Alemania). tripsina modificada (nº de catálogo. V511C) se obtuvo de Promega (Madison, WI, EE.UU.). Otros productos químicos fueron adquiridos de Reakhim-Penza, LLC (Penza, Rusia).
2.3 Las muestras de tejido y preparación
Las fracciones de proteínas solubles hepáticas humanas se prepararon en nuestro estudio anterior (almacenada a -80 ° C antes de su uso) de las masas resecadas y descartadas de los tejidos del hígado de los alrededores, que fueron tomadas de pacientes (n = 23) sometidos a cirugía hepática [14]. Las muestras de hígado morfológicamente normal (3-10 g,) se obtuvieron a partir del borde distal de la resección, al menos 5 cm de la tumor. Las muestras fueron diagnosticados por histopatología.
Como consistido con las condiciones del experimento, que no tomar en consideración cualquier información personalizada acerca de los pacientes o en relación con el tratamiento del paciente. Sin embargo, la recogida de muestras se realizó de acuerdo a las siguientes instrucciones: (1) todos los pacientes estaban bajo severa enfermedad del cáncer, lo que llevó a la cirugía del hígado tal vez después de una quimioterapia previa; (2) no se llevó a cabo la radioterapia antes de la cirugía; (3) no hay evidencia de endocrina o metabólica; (4) no se detectó ninguna infección grave; (4) las necesidades dietéticas de los pacientes fueron manejados por el Centro de Investigación Nacional de Cirugía a un nivel relativamente uniforme; como resultado, la influencia de la dieta exógeno en perfiles metabólicos se limitó al nivel más bajo. Las muestras resecados se colocaron inmediatamente en hielo antes de la obtención de la fracción microsomal de hígado humano [14] y HLC. Todos los procedimientos de preparación se realizaron a 0-4 ° C. Las muestras de hígado se homogeneizaron en dos volúmenes de tampón de homogeneización, que contiene 1 mM EDTA, ditiotreitol 1 mM (DTT), PMSF 0,1 mM, y KCl 150 mM usando un vaso Potter Elvehjem homogeneizador con una mano de mortero de teflón (Sartorius Stedim Biotech GmbH, Goettingen, Alemania). El homogeneizado se centrifugó hígado sucesivamente a 10.000 ×
g
durante 20 min y 105.000 ×
g
durante 70 minutos. El sedimento (fracción microsomal) se analizó como se describe en nuestro estudio anterior [14]. En el presente estudio, se utilizó el sobrenadante como la fracción HLC. La concentración de proteína de las muestras de HLC se estimó mediante el ensayo de Bradford [16] con albúmina de suero bovino como estándar.
fraccionamiento previo de las muestras de HLC antes de la electroforesis bidimensional en gel de poliacrilamida
alícuota de HLC (200 l, 13,2 ± 5,6 mg de proteína) se mezcló con 1 ml de ácido tricloroacético al 10% frío (TCA) en acetona (v /v), que contiene 0,07% de mercaptoetanol. Después de un 3-h de incubación a -18 ° C, la mezcla se centrifugó a 20.000 ×
g
de 10 min (4 ° C). El sobrenadante se desecha y el sedimento se disolvió en 5 ml de acetona fría, que contiene 0,07% mercaptoetanol, y se centrifugó como se ha descrito anteriormente. El sobrenadante se desecha y el sedimento resultante se utiliza para la separación de proteínas por medio de la 2DE.
Two dimensional-electroforesis en gel de poliacrilamida (2DE)
2DE de las proteínas HLC se realizó como se describe por el fabricante (Bio -Rad, Hercules, CA, EE.UU.). Para cada muestra HLC, el pellet resultante se disolvió en 200 l de tampón de rehidratación (4 M urea, tiourea 2 M, 4% 3 - [(3-colamidopropil) dimetilamonio] -1-propano sulfonato, DTT 50 mM, y 0,5 % Ampholine). Las proteínas se cargaron por rehidratación pasiva a 11 cm, no lineal, inmovilizado, gradiente de pH (IPG, pH 3-10) tiras durante la noche (14 h) a 50 V y durante otros 30 min a 250 V. El enfoque isoeléctrico (IEF) fue realizado utilizando la celda Protean IEF (Bio-Rad) con un gradiente de 250 a 5500 V aplicado para un total de 35.000 V · h. Todos los pasos de IEF se realizaron a 20 ° C. Después de IEF, las tiras de gel IPG se equilibraron en tampón de equilibrado (50 mM Tris-HCl, pH 6,8, 6 M urea, 2% de dodecil sulfato de sodio (SDS), 20% de glicerol) que contiene 1% de DTT y se agitaron durante 30 min a 50 rpm en un agitador orbital [17]. Las tiras IPG se transfirieron entonces a la solución de equilibrado, que contiene 2,5% de acrilamida, y se agitaron durante 30 minutos más antes de la separación en un gel de poliacrilamida (135 × 80 × 1,0 mm, gel de almacenamiento 4%, y 12% de gel de resolución). La separación en la segunda dimensión se realizó usando el Cell Mini-Protean Dodeca (Bio-Rad) y tampón Tris-glicina (base Tris 25 mM y glicina 192 mM), que contiene 0,1% de SDS, a la hora de 150 V. Run fue de aproximadamente 60 min y sobre la salida de azul de bromofenol en el búfer, la separación electroforética se consideró completa.
visualización de proteínas y análisis de imágenes
los geles se sometieron a tinción de plata [18], las imágenes fueron adquiridas utilizando gel un densitómetro calibrado GS-800 (Bio-Rad) y subido a la imagen digital GelEditor software de análisis patentada. Está escrito en Java y herramientas supportsl para cargar las imágenes, detección de puntos automatizado basado en Laplaciano de filtro de Gauss, detección de puntos manual, adecuación de los perfiles de proteínas, y una opción para guardar los informes (Figura S1). La intensidad de mancha en el gel se calcula como la suma de los píxeles en una posición detectada manualmente. El software GelEditor puede ser libremente descargado desde www.bioinformatics.ru/geleditor.zip.
En la digestión-gel
Las manchas de proteínas (~ 3 mm
3) se escindieron del gel usando modificado de 250 mu l consejos y se destiñó con 50 l de 100 mM K [
Fe (CN) 6] (v /v)
3 y tiosulfato de sodio 100 mM en una proporción de 01:01 por pieza gel a temperatura ambiente durante 30 min. Después, las piezas de gel se lavaron con agua a temperatura ambiente y se agitaron durante 15 min a 50 rpm en un agitador orbital. El procedimiento se repitió tres veces. A continuación, las piezas de gel se lavaron dos veces con 150 l de mM NH 50
4HCO
3 en 50% de acetonitrilo a 37 ° C, se agitó durante 15 min a 50 rpm en un agitador orbital, y se incubaron durante 15 min en solución de deshidratación (100% de acetonitrilo). Después se eliminó el acetonitrilo y las piezas de gel se secó, 8 ± 2,0 l de solución de tripsina (25 ng /l modificado tripsina en 50 mM de bicarbonato de amonio) se añadió y la mezcla se incubó a 37 ° C durante la noche. Después, se añadieron 15 l de ácido trifluoroacético 0,7% a cada pieza de gel y las muestras se incubaron durante 2 h a temperatura ambiente. Los péptidos trípticos extraídos se utilizaron para el análisis de espectrometría de masas.
láser asistida por matriz de desorción-ionización de espectrometría de masas de tiempo de vuelo (MALDI-TOF MS)
Cada mezcla de péptidos proteolíticos (1 l) fue descubierta en una diana de MALDI (600/384 chip de ancla; Bruker Daltonik GmbH, Bremen, Alemania) en tres repeticiones y se seca al aire. Para la ionización, (01:01 v /v) se utilizó una solución de 2,5-dihydrobenzoic ácido (3 mg /ml) en acetonitrilo y ácido trifluoroacético 0,7%. Los espectros de masas en el
m /z
rango de 600-4000 fueron adquiridos de forma manual utilizando el software FlexControl (Bruker Daltonik GmbH) en el modo de extracción de reflexión /retardada con un voltaje de aceleración de 25 kV y un retardo de 135 ns utilizando la MS analizador de MALDI-TOF Ultraflex II (Bruker Daltonik GmbH). Todos los espectros de masas representa un promedio de 100 señales de disparos de láser desde una ubicación en un punto de la muestra. A partir de cada punto de la muestra, se adquirieron los espectros de masas 4-6. fluidez láser se ajustó por encima del umbral de desorción de la matriz para obtener la mejor resolución y la más alta precisión de la medición de masa. Las señales con una relación S /N & gt; 6 y un máximo de 100 picos por espectro se utilizaron para construir las listas de pico con el algoritmo de SNAP (software FlexAnalysis versión 2.0;. Bruker Daltonik GmbH) e internamente calibrados con los productos de la tripsina autolisis (
m /z 842.5094
y 2211.1046 Da, respectivamente). Pico listas resultantes se utilizaron para buscar la base de datos UniProt /Swiss-Prot (UniProt liberar 2012_09 - 11 de septiembre de 2012). La identificación por huellas másicas de péptidos (PMF) se realizó utilizando el software Mascot (Matrix Science, Inc., Boston, MA, EE.UU.). Durante la búsqueda de base de datos, se permite un máximo de una escisión perdida, se utilizó una tolerancia de masa de 80 ppm, y las modificaciones de variables, tales como la oxidación de metionina y la modificación de cisteína con acrilamida, se tuvieron en cuenta. La tolerancia apropiada m /z (80 ppm) se calcula como la desviación máxima masa basado en distribución estadística de errores masivos en todos los espectros y su desviación estándar.
El análisis estadístico
El conjunto de datos inicial consistió 19 muestras (geles 2DE), cada una caracterizada por manchas en promedio 271 ± 99 /proteínas características (Tabla S1). Gel no. 6 se utilizó como el maestro de gel para la alineación manual in situ a punto. Ya que estábamos interesados en comparar los resultados con los conocimientos previos sobre los perfiles bioquímicos medidos para las mismas muestras [14], también se excluyeron no.4 gel porque en nuestro estudio previo se considera como un valor atípico; así que teníamos una colección de 18 imágenes de gel. Para asegurar la reproducibilidad estudio y disminuir la sensibilidad al ruido, se analizaron sólo las diferencias cualitativas entre los geles en términos de presencia /ausencia de una determinada proteína puntos. Cada gel se repitió tres veces y la mejor réplica fue seleccionado por inspección visual de la calidad de la separación. último conjunto de datos se presenta como una matriz D binario que consta de 18 filas (geles de imágenes) y 389 columnas (puntos) en donde
D
ij
= 1 si
j-ésimo punto de
estaba presente en
i-ésimo
de gel, de lo contrario
D
ij
= 0. Para la agrupación de gel, se utilizó el método de Ward. Métrica de distancia entre dos vectores binarios se definió como el número de bits, donde los vectores difieren (también conocida como distancia de Hamming). Todos los cálculos y los gráficos se realizaron con lenguaje estadístico R (www.r-project.org). El código fuente de la secuencia de comandos de análisis de datos se puede encontrar en el análisis de datos de secuencias de comandos S1. Para medir la similitud entre dos agrupamientos de datos, se calculó el índice de Rand ajustado cuyo valor está en el rango entre -1 y 1, donde 1 corresponde con la perfecta concordancia entre las particiones.
Resultados y Discusión
En nuestros experimentos fueron llevados todas las muestras de una categoría de pacientes: tratamiento quirúrgico de las metástasis hepáticas derivadas de cáncer de colon (Figura 1). Por lo tanto, nuestro objetivo no era encontrar diferencias entre la norma y el cáncer, sino más bien para explorar el interior de la estructura de datos de un grupo, que describe el sistema de hígado de drogas-metabolización humana y la fracción de citosol (presente estudio). En el estudio anterior sobre el metabolismo de fármacos [14] A pesar del tamaño relativamente modesto de la muestra (n = 22), sin duda, nuestra resultados confirmaron la presencia de dos grupos de datos. Hemos calculado criterios silueta de ancho para la validez del clúster, que mostraron que la presencia de las dos agrupaciones se confirmó con la confianza muy alta (p & lt; 0,0001). Por lo tanto la heterogeneidad revelado dentro de un grupo igualmente tratadas de pacientes fue de un fondo para la investigación proteómica Actualmente informado.
análisis 2DE de HLC
Los estudios sobre tejidos hepáticos humanos han llevado a cabo para identificar si hay grupos de muestras distintivas en sus proteomas. El proteoma HLC se caracterizó por una colección representativa de 19 muestras separadas por 2DE en geles de formato medio en tres repeticiones, por tanto, se examinaron un total de 58 imágenes 2DE. Los mejores réplicas 2DE fueron seleccionados de las carreras técnicas de acuerdo a la calidad de separación (Figura S2). Las imágenes representativas seleccionadas se convirtieron en las listas de spots y agrupados adicionalmente usando el método no supervisado. Consistentemente con nuestro trabajo previo con microsomas hepáticos aquí hemos utilizado un enfoque sin supervisión porque la información clínica con respecto a las muestras de hígado resecado no estaba disponible.
también el rechazo de muestras debido a la escasa separación 2DE calidad debido a peculiaridades en la preparación de muestras (figura 2). Las imágenes 2DE típicas del gel teñido-Ag de ninguna de las muestras. 6 antes y después de fraccionamiento previo con TCA en acetona (ver Materiales y Métodos) se muestran en la Figura 2,
a
y
b
. Sin fraccionamiento previo, 2DE de la fracción citosol dificulta la separación de manchas de proteínas (Figura 2
un
). Figura 2
b
es una imagen maestro de gel representativo que muestra la separación de proteínas a partir de tejido hepático humano después de la precipitación con TCA /acetona. Esta práctica se emplea a menudo para eliminar los contaminantes, ya que minimiza la degradación de proteínas [19], pero la precipitación con TCA /acetona era insuficiente para obtener imágenes de gel apropiadas de los números de muestra HLC. 20-23, por lo que estas muestras excluidos de los nuevos análisis. En total, 687 puntos de proteínas se resolvieron en un gel 2DE teñido con plata de la muestra n ° 6 HLC, carrera técnica#1, usando la herramienta de software de detección de puntos de GelEditor. Además de la tinción de plata basado en el protocolo de Shevchenko et al. [18] La tinción con azul de Coomassie también se probaron en este estudio y se detectaron aproximadamente 100 solamente manchas de proteínas en el mismo no.6 gel (Figura 2
c
).
30 g de la humana fracción de proteína soluble en el hígado (HLC) se separó mediante Eco-2D y visualizado por tinción con plata (
a
y
b
) o tinción de Coomassie Brilliant Blue (
c
):
un CD - HLC antes de pretratamiento con ácido tricloroacético en acetona;
b
y
c -
HLC después del tratamiento previo. Uso de la tinción de Coomassie cerca de 100 puntos de proteínas podrían ser revelados, pero el uso de etiquetado tinción de plata hasta 687 puntos de proteínas fueron detectados automáticamente. Spots nn. 14, 25, 34, 36, 48, 56, 62, 63, 66, 210, 214, 219, 247, 252, 275, 276, 279, 301, 321, 322, y 408 son comunes para todos los geles 2DE de 19 hígado muestras de citosol humanos.
Las imágenes de gel obtenidos fueron examinados para caracterizar reproducibilidad lugar y la variabilidad. Hemos observado que el 96% de las manchas de proteínas se encontraban en el límite inferior del límite de detección de tiosulfato de plata con una intensidad normalizada & lt; 0.02 unidades relativas. Se observó una intensidad media de 0,02-0,04 unidades de 2% de los puntos, mientras que el 1% de los puntos era de alta abundancia con intensidad relativa de & gt;. 0,1 unidades
Además, se seleccionó el maestro de gel como el mejor gel con el mayor número de puntos y el rango mínimo de dispersión de la intensidad media de cada punto. El maestro de gel correspondió a la muestra no 6. Para estimar la variación técnica de nuestra configuración experimental, se realizó cuatro carreras independientes replicativa de HLC muestra n. 6 en diferentes momentos. En primera etapa de análisis se utilizó número de puntos como una medida aproximada de la reproducibilidad gel. Se detectaron un total de 449, 420, 444, y 406 puntos de proteínas en estas carreras en las gamas de pI 3,5-10,0 y MW 10-250 kDa. El número medio de manchas observado fue 430 ± 20, que fue comparable a los datos anteriores obtenidos a partir de la fracción citoplásmica de los hepatocitos humanos primarios en líneas celulares HepG2 y Hep2B [20]. Los geles restantes contenían suficientemente menor número de puntos, como se muestra en la Figura 3 para 19 muestras HLC. En toda la serie, el número medio de manchas de proteínas detectadas manualmente fue de 271 ± 99 (media ± SD, n = 58). Las cantidades eran puntuales de tres veces menor en comparación con los resultados observados anteriores de análisis de la fracción citosólica de muestras de tejido hepático humano [13], [21], [22]. La diferencia en el número de punto era probablemente debido a la configuración de la 2DE, ya que utilizamos 11 cm tiras IPG en lugar de 17 cm, utilizadas por Wimmer et al. [13] y Kim et al. [23], y así los gradientes de isoelectroenfoque fueron más cortos. Kim et al. [23] analizaron tumoral y no tumoral regiones de tejidos de cáncer de hígado resecado por la identificación de las proteínas citosólicas utilizando 2DE y MALDI-TOF-MS. Utilizaron la tinción de plata para la detección de proteínas en los geles y se observaron hasta 1060 puntos y se identificaron 127 proteínas; También informaron de que un problema con la variabilidad de las intensidades de terreno se decidió utilizar intensidades normalizadas.
Los geles que pertenecen al grupo 1 se muestran en las columnas blancas. Los geles que pertenecen a grupo 2 se muestran en las columnas grises. Gel que elimina de todo el procesamiento posterior se muestra en la columna sombreada.
Para evaluar la variabilidad de gel a gel, se compararon los puntos entre los cuatro replicados imágenes de gel obtenida de la muestra no. 6 utilizando la función manual de punto a juego del software GelEditor patentada (Figura S1). Cada réplica se alineó manualmente a la imagen principal, que contenía un número máximo de puntos. Se encontró que 102 puntos estaban presentes en al menos tres repeticiones, 80 puntos emparejados de la mitad de los geles, mientras que el 58 manchas estaban presentes en el gel maestro solamente. Por último, el 47% de los puntos (209 puntos) acertó los cuatro imágenes 2DE replicados.
Para determinar la reproducibilidad de la Eco-2D, se investigó carreras técnicas de la muestra HLC 6, analizamos las intensidades normalizadas de cada punto, y trazan los uno contra el otro en una X-y y un cuantil - (Q-Q) parcelas cuantil [24]. Las parcelas X-Y para la muestra n ° 6, carrera técnica#1 (maestro de gel) en comparación con la misma muestra, ejecución técnica#2 muestran un coeficiente de correlación de Pearson r = 0,797 (Figura 4
a
). Se realizó este análisis para todas las cuatro carreras técnicas del gel de 6 y se determinó la media de coeficiente de correlación de Pearson, que era igual de 0,72 ± 0,06 (media ± 95% intervalo de confianza). La magnitud del coeficiente de correlación r & gt; 0,7 sugiere una correlación fuerte, mientras que las parcelas Q-Q se utilizaron como una herramienta gráfica para la comparación de dos distribuciones de la otra. Dos conjuntos de datos se consideran idénticos si los puntos en las parcelas Q-Q se encuentran cerca de una línea de regresión
y = x
. Como se muestra en la Figura 4b este criterio se cumplió perfectamente para las proteínas HLC
terreno intensidades normalizadas de dos carreras técnicas del gel de la parcela Y No.- y cuantil-cuantil. - Parcela (Q Q). El X - Y diagrama muestra una fuerte correlación entre las intensidades de terreno con un coeficiente de correlación de Pearson r = 0,797 (a). Q - Q diagrama muestra una alta similitud entre la distribución de las intensidades de terreno (b). La intensidad de cada punto emparejado en el gel se normalizó por la intensidad total de puntos coincidentes dentro de este gel.
Las manchas altamente reproducibles (209) fueron utilizados para estimar la variación de la intensidad punto a través de cuatro repeticiones por muestra de HLC no 6. En el coeficiente de histograma variación (CV) de distribución (véase la figura 5), 65% de las manchas se caracteriza por un CV & lt; 0,6. Este grado de variación entre los geles replicados fue comparable a la CV observó entre el tejido normal vs. diversas etapas del cáncer [9], [25]. Por ejemplo, Shi et al. [9] observado un CV promedio de 62-69% en 1223 características contado a partir de 18 perfiles de punto 2D-DIGE entre los diferentes grupos de la muestra (mucosa normal del colon, cáncer colorrectal primario y metástasis hepáticas). Los autores encontraron que los dos tumores primarios y secundarios muestran un grado significativamente más alto de variaciones de volumen de detectar que el colon normal.
intensidad de cada punto emparejado en el gel se normalizó por la intensidad total de puntos emparejados dentro de este gel.
en general, el CV depende del tipo de material biológico, así como los enfoques de preparación de muestras y detección de puntos [26], [27]. En la tinción con plata, los puntos coincidentes preparan y se ejecutan bajo idénticas condiciones varían en intensidad; Por lo tanto, es difícil de lograr la reproducibilidad incluso con repeticiones paralelas [26]. Por lo tanto, como nuestros geles fueron poco reproducible en las intensidades de las manchas a juego, que no usamos los valores de intensidad para un análisis más detallado, pero convirtieron los puntos en formato binario: o hay un lugar, o no
3.2. agrupamiento no supervisado de los geles y las muestras microsomales
Se utilizó el análisis de conglomerados para separar los geles y elucidar los grupos en nuestra colección de muestras de hígado. Inicialmente, manchas en cada gel 2DE fueron cotejados con las manchas de la maestro de gel (no. 6 No. 1) utilizando script de Perl (Datos Análisis de secuencias de comandos S2). Nuestros resultados fueron formateados en una mesa en la que las filas indican los puntos de proteínas y las columnas representan muestras HLC. Si la mancha de proteína estaba presente en el gel y el gel de HLC maestro, el valor de la celda se fijó en "1", de lo contrario si el lugar estaba ausente en el próximo gel de HLC, se establece en "0". Se realizó el análisis de agrupamiento jerárquico de la matriz de datos utilizando el método de Ward, junto con la distancia de Hamming métrica. La agrupación de los geles 2DE de las muestras de HLC se visualizó como un dendrograma (Figura 6
a
). Dos grupos principales se distinguen claramente: el primero (grupo no 1.) Fue formado por geles nn. 1-3, 5 y 7-13, mientras que el segundo (cluster no. 2) incluyó geles nn. 6 carrera técnica#3, y 14-19. Por lo tanto, el método de Ward dio dos grupos de muestras de hígado. Curiosamente, el histograma de la figura 3 preliminarmente señaló la existencia de dos grupos de las muestras de HLC. El número medio de manchas de proteínas manualmente detectado en geles de racimos nos. 1 y 2 fueron 219 ± 72 y 342 ± 91 (media ± DE), respectivamente; Sin embargo, la diferencia en el número de manchas fue estadísticamente insignificante (
p & gt;
0,05, n = 18)..
Dos grupos principales se pueden ver
de acuerdo con nuestros datos anteriores, los microsomas hepáticos humanos también segregados en dos grupos [14]: el primero contenía las muestras N. 1-3, 5-12, y 23, mientras que el segundo contenía las muestras N. 13 a 22 (Figura 1A). Por lo tanto, no había una correlación entre la agrupación muestra surgió de los dos enfoques experimentales absolutamente diferentes.
El índice Rand era 0,58, lo que indica una coincidencia significativa [27] entre los datos bioquímicos y proteómicos. Se encontró una ligera diferencia entre la composición del grupo de las muestras HLC y el sistema microsomal hepático humano (droga-metabolización). Estos cambios fueron particularmente a las muestras N HLC. 6 y 13, asignado a agruparse nn.