Extracto
Antecedentes
cáncer no microcítico de pulmón no microcítico (CPNM) se presenta como una enfermedad progresiva que abarca precancerosa, preinvasora, localmente invasivos y lesiones metastásicas. Identificación de las vías biológicas que reflejan estas etapas progresivas, y los genes expresados de forma aberrante asociados con estas vías, sería concebible mejorar enfoques terapéuticos para esta enfermedad devastadora.
Metodología /Principales conclusiones
A través de la construcción y el análisis de las bibliotecas SAGE, hemos determinado los perfiles de transcriptoma para el carcinoma in situ preinvasora (CIS) y el carcinoma de células escamosas invasivo (SCC) de la pulmón, y los comparo con los perfiles de expresión generadas tanto desde el epitelio bronquial y metaplasia precancerosas y lesiones displásicas utilizando
Ingenuity Pathway Analysis
. La expresión de genes asociados con el desarrollo epidérmico, y la pérdida de la expresión de genes asociados con la biología mucociliar, son características predominantes de CIS, en gran parte compartidas con lesiones precancerosas. Además, la expresión de genes asociados con el metabolismo xenobiótico /desintoxicación es una característica notable de CIS, y se mantiene en gran medida en el cáncer invasivo. Genes relacionados con la fibrosis del tejido y la respuesta inmune fase aguda son característicos del fenotipo invasivo SCC. Por otra parte, los datos presentados aquí sugieren que la remodelación tisular /fibrosis se inicia en las primeras etapas de la CEI. Además, este estudio indica que la alteración en el estado número de copias representa un mecanismo plausible para la expresión diferencial de genes en la CEI y SCC invasivo.
Conclusiones /Importancia
Este estudio es el primer informe de a gran escala de perfiles de expresión de la CEI del pulmón. Imparcial de perfiles de expresión de estas lesiones pre-invasores e invasivos proporciona una plataforma para nuevas investigaciones sobre los eventos genéticos moleculares correspondientes a las etapas tempranas del desarrollo del CPCNP escamoso. Además, hasta los genes regulados detectados en las diferencias extremas entre la CEI y cáncer invasivo puede tener potencial para servir como biomarcadores para la detección temprana
Visto:. Lonergan KM, Chari R, Coe BP, Wilson IM, Tsao MS, Ng RT, et al. (2010) transcriptoma Perfiles de carcinoma in situ e invasivo de células no pequeñas cáncer de pulmón Según lo revelado por SAGE. PLoS ONE 5 (2): e9162. doi: 10.1371 /journal.pone.0009162
Editor: Eric J. Bernhard, Instituto Nacional del Cáncer, Estados Unidos de América
Recibido: 4 de octubre de 2009; Aceptó 7 de enero de 2010; Publicado: 11 Febrero 2010
Derechos de Autor © 2010 Lonergan et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan
Financiación:. Este trabajo fue apoyado por fondos del Genoma Canadá /Genoma Columbia británica, Instituto de Investigación Sociedad canadiense del cáncer (CCS#20485) y los Institutos canadienses de Salud de Canadá (MOP200113 y RP 86731). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
Introducción
el cáncer de pulmón se estima para infligir la tasa de mortalidad por cáncer más alta en los Estados Unidos en 2009 [1]. terapias moleculares dirigidas dirigidas hacia las vías de transducción de señales activas en la proliferación celular, la diferenciación, la apoptosis y la angiogénesis, se han utilizado en el tratamiento del cáncer de pulmón de células no pequeñas (NSCLC), pero con resultados variados y, a menudo decepcionantes [2], [ ,,,0],3], [4], [5], [6]. A medida que la orientación simultánea de múltiples vías de señalización ha demostrado mejoras en la respuesta clínica [6], más el conocimiento de las vías biológicas que participan en el desarrollo del cáncer de pulmón, junto con la identificación de genes expresados de forma aberrante dentro de estas vías, se esperaría para facilitar el desarrollo de la novela de intervención terapéutica [7], [8].
el carcinoma in situ (CIS) del pulmón, son lesiones escamosas preinvasoras del CPNM, con frecuencia asociados con histológico, citológico y aberraciones genéticas, y la progresión a cáncer invasivo normalmente sobreviene [9], [10], [11], [12]. A medida que estas lesiones hora son óptimamente visible en las vías aéreas centrales por broncoscopia fluorescente o VIDA (pulmón de imágenes fluorescentes endoscopia) [13], [14], los estudios experimentales y clínicos son poco frecuentes (Figura 1). Aunque se han reportado muchos estudios de perfiles de expresión de los tumores en estadio avanzado de pulmón [15], [16], la fase inicial (CEI y localmente invasivos) lesiones siguen siendo en gran parte inexplorado. el análisis genético molecular de las lesiones preinvasoras, libre de ruido de fondo asociado con tumores avanzados comúnmente estudiados, es esencial para la identificación de genes clave y las vías moleculares que subyacen a principios de los acontecimientos en la transformación neoplásica y el desarrollo del cáncer correspondiente. La comprensión de estas primeras aberraciones es esencial para la pronta intervención terapéutica de esta enfermedad devastadora.
La broncoscopia utilizando A. luz blanca para la detección de lesiones de la CEI (indicada por la flecha), o B. VIDA (pulmón-imaginar endoscopia fluorescente ) para la detección de las lesiones de la CEI (indicada por la flecha). C. sección histológica la identificación de una lesión de la CEI en el epitelio bronquial, tipificado por la estratificación extensa escamosas.
Los grandes estudios de expresión génica con frecuencia emplean tecnologías de microarrays. Estudios recientes ponen de relieve el valor de las matrices hechas a la medida, con el objetivo de selección basado en el conocimiento previo de la expresión génica, para reflejar con más precisión el transcriptoma del tejido de interés; aplicado específicamente para el estudio de NSCLC [17]. SAGE (análisis en serie de la expresión génica) ofrece un enfoque basado en la secuencia, no sesgada al análisis exhaustivo del transcriptoma, sin conocimiento previo de expresión necesaria [18]. Por otra parte, la información obtenida a partir del análisis SAGE potencialmente contribuye al diseño de los microarrays más apropiadas para la investigación centrada y con fines de diagnóstico.
En un estudio anterior, hemos descrito la transcriptomes de epitelio bronquial humo dañado y parénquima pulmonar a través de SAGE [19]. Aquí extendemos nuestro análisis a la etapa de pre-invasiva sin explorar en el desarrollo del cáncer de pulmón, y presenta el primer informe del gran escala de perfiles de expresión de carcinoma in situ del pulmón. Además, describimos transcriptomes para el carcinoma invasivo de células escamosas (SCC), y metaplásico precanceroso y lesiones displásicas (PC), derivados de la construcción y el análisis de múltiples bibliotecas SAGE, culminando en más de 22 megabases de información de la secuencia. A través de la utilización de los
genes Ingenuity Pathway Analysis
, hemos identificado asociados con el desarrollo epidérmico y el metabolismo de xenobióticos /desintoxicación como componentes de las lesiones de la CEI, y los genes asociados con la respuesta inmune y la remodelación tisular /fibrosis como componentes de SCC invasivo. Además, encontramos genes asociados con la diferenciación mucociliar que las reguladas tanto en las lesiones de la CEI y PC. Se discute la relevancia potencial de estas aberraciones de la transcripción a las primeras etapas del desarrollo del cáncer de pulmón, y presentar una imagen del transcriptoma de la CEI hasta ahora desconocido.
Materiales y Métodos
Declaración de Ética
Este estudio fue aprobado por la Universidad de Junta Ética de Investigación Columbia Cancer Agency Columbia británica-británica (UBC-BCCA REB). Se obtuvo consentimiento escrito de todos los sujetos.
Los especímenes
epitelial bronquial (BE) muestras de cepillado se describió anteriormente [19]. Las muestras de biopsia incluyen lesiones precancerosas (PC) (metaplasia, displasia), lesiones de carcinoma in situ (CIS), y el tejido tumoral de un carcinoma de células escamosas invasivo (SCC). PC y los especímenes de la CEI se obtuvieron mediante broncoscopia autofluorescent (Figura 1). Todas las biopsias (a excepción de los que se utilizan en la construcción de bibliotecas CIS-3, SCC-5, y SCC-6) se recogieron en el ARN
después
® [Applied Biosystems (Ambion Inc., Canadá)] y se almacenó a - 85 ° C. La biopsia utilizado en la construcción de la biblioteca de CIS-3 se ha incrustado en los medios de octubre, y se almacenó a -85 ° C. Para la construcción de bibliotecas de SCC-5 y SCC-6, el ARN fue aislado de tejido tumoral de ocho individuos por isotiocianato de guanidinio y extracción con fenol /cloroformo. Todos los sujetos que contribuyen a este estudio eran fumadores actuales o anteriores (Tabla 1).
SAGE biblioteca de la construcción y el procesamiento de la secuencia
Con la excepción de la construcción de bibliotecas de SCC-5 y SCC -6, cada muestra (biopsia o cepillado bronquial como se describe anteriormente [19]) fue recuperado de ARN
después
® (u OCT para la biblioteca CIS-3), y se homogeneizaron en lisis /solución de enlace. Para las bibliotecas SCC-5 y SCC-6, el RNA se agruparon en cuatro ejemplares en la misma cantidad, y ~19 g de ARN total se sumergieron en la lisis /unión y la solución utilizada para la construcción de cada biblioteca. Los lisados resultantes se utilizaron directamente para la construcción de bibliotecas SAGE según el protocolo MicroSAGE, utilizando
Nla
III como la enzima de anclaje y
Bsm
FI como la enzima de marcado (www.ncbi.gov/SAGE ). Este enfoque se muestra para producir bibliotecas SAGE altamente reproducibles [19]. En promedio, 10
5 etiquetas SAGE, excluyendo enlazador y duplicar ditags, se secuenciaron por biblioteca; todos los datos en bruto SAGE ha sido depositada en GEO (Tabla 1). Para la normalización, el recuento de etiquetas se ampliaron a 10
6 etiquetas para cada biblioteca, es decir, como etiquetas por millón (TPM).
Cluster análisis
Para evaluar el grado de similitud entre el pulmón SAGE bibliotecas generadas en este estudio (dos bibliotecas de PC, cinco bibliotecas de la CEI, y seis bibliotecas SCC invasivos) y los generados en un estudio previo (14 BE bibliotecas, y dos bibliotecas parénquima pulmonar), se utilizó el análisis de conglomerados. Para este análisis, los 300 etiquetas más abundantes fueron retenidos de cada biblioteca, produciendo una lista combinada de 1128 etiquetas únicas. Los datos fueron log
10 transformado y agrupado utilizando
Génesis
, utilizando un algoritmo de promedio de vinculación y una distancia métrica euclidiana [20]. Para las etiquetas con un recuento de cero, los datos no se transformó, y se mantuvo como cero.
Expresión diferencial análisis
A menos que se indique lo contrario, la expresión diferencial de genes se definió por una diferencia mínima de tres veces (redondeado a un decimal) en los recuentos promedio normalizados de etiquetas (TPM) entre dos conjuntos de datos que se comparan. Además, se requiere un recuento de etiqueta normalizada media mínima de 40 TPM en el sobre-expresión de conjunto de datos. Tag-a-gen mapeo fue de acuerdo a la base de datos SAGE Genie 17 de septiembre de 2009 Versión [21] (cgap.nci.nih.gov/SAGE). A medida que la última versión de SAGE Genie no se alinea automáticamente a las transcripciones mitocondrial, se utilizó un enfoque de mapeo manual para identificar estas transcripciones.
Análisis de los datos
Los conjuntos de datos de genes expresados diferencialmente se analizaron principalmente a través de la uso de
Análisis ingenio Pathway gratis (IPA), versión 8.0 (Ingenuity® Systems, www.ingenuity.com).
Análisis funcional de la totalidad de los conjuntos de datos
identificaron las funciones y /o enfermedades que eran más significativo para el conjunto de datos biológicos. Los genes del conjunto de datos que se asociaron con las funciones y /o enfermedades biológicas en el ingenio Pathways Knowledge Base se consideraron para el análisis (IPA elegibles asigna identificadores).
análisis de la vía canónica de conjuntos de datos completos
identificaron las vías de la biblioteca API de las vías canónicas que eran más significativo para el conjunto de datos, basados en genes dentro del conjunto de datos que se asocia con una vía canónica en la base de conocimientos Ingenuity Pathways.
Análisis de Toxicidad lista de conjuntos de datos completos
identificaron las listas Tox de la biblioteca API de listas Tox que eran más significativo para el conjunto de datos. Los genes del conjunto de datos que se asociaron con una lista se consideraron para el análisis. Para cada uno de estos análisis, la importancia de la asociación entre los genes en el conjunto de datos y la función biológica asignado y /o enfermedad /vía canónica lista /toxicidad, se midió mediante la prueba exacta de Fischer para calcular un valor de p para determinar la probabilidad de que la asociación se explica por pura casualidad.
Mi Rutas
es una representación gráfica de las relaciones biológicas entre los productos de genes, que son apoyados por al menos una referencia de la literatura, a partir de un libro de texto, ni de información canónica almacenada en la base de conocimientos Ingenuity Pathways. Los genes se muestran utilizando diversas formas que representan la clase funcional del producto génico, como se indica en la leyenda dentro de las cifras específicas.
aislamiento de ARN a partir de muestras clínicas
Para el análisis cuantitativo de RT-PCR, el ARN emparejado por el tumor y el parénquima pulmonar normal se obtuvieron de los tejidos extirpados. En pocas palabras, se cortaron varias secciones de cada tumor, con la primera y la última de una serie teñidas con H & amp; E para la inspección por parte de un patólogo pulmonar. Después de confirmar el diagnóstico y la evaluación de la heterogeneidad del tumor con revisión de la patología, capturamos aquellas partes del tumor con un mínimo de células de cáncer de 70%. Se extrajo ARN de tejido tumoral tanto microdissected y a partir de tejido normal asociado con el
RNeasy
kit (Qiagen, Mississauga, ON, Canadá). En total, se utilizó el ARN de muestras de parénquima nueve tumorales emparejado y normales para el análisis de RT-PCR. Además, se extrajo el ARN como se describe anteriormente [19], a partir de seis cepillado bronquial que representan tres actuales y ex fumadores, tres para el análisis de RT-PCR cuantitativa.
RT-PCR análisis
Para cuantitativa RT-PCR (qPCR), aproximadamente 1 g de RNA total se convirtió en cDNA utilizando la alta capacidad de cDNA Archivo kit (cat#4322171, Applied Biosystems), y los genes específicos de PCR cuantitativa se realizó mediante PCR TaqMan universal Master Mix y los cebadores TaqMan (cat#4326708; Applied Biosystems), según las recomendaciones del fabricante. Beta-actina se utilizó como control endógeno (código de producto de imprimación 4352935E). códigos de los productos de cebadores para genes de prueba fueron los siguientes: ECE2 (Hs00981189_g1), MAGEA9 (Hs00245619_s1), MAGEA11 (Hs00377815_m1), CLDN1 (Hs00221623_m1), CKS1B (Hs01029137_g1), POSTN (Hs00170815_m1), ARTN (Hs00754699_s1), SFRP2 (Hs00293258_m1), UBE2S (Hs00819350_m1), C19orf48 (Hs00364147_m1), FBXO27 (Hs00381091_m1), MCM2 (Hs00170472_m1), NTS (Hs00175048_m1), SLC6A8 (Hs00373917_g1), y SLC2A1 (Hs00197884_m1, Hs00892681_m1). Las reacciones se ejecutan en un sistema de detección de PCR en tiempo real iCycler iQ (Bio-Rad Laboratories (Canadá) Ltd., Mississauga, ON, Canadá). La expresión diferencial se determinó utilizando el método CT delta-delta. Para los pares de parénquima tumorales /normales, se calcularon los cambios de plegado para cada par. Al comparar los tumores de los cepillados, se calcularon comparando los cambios veces cada tumor a la expresión media de las seis muestras BE. El tumor promedio durante el cambio normal de parénquima veces y el tumor promedio durante BE cambio veces se presentan para cada gen.
dosis de genes determinación
muestras de carcinoma in situ utilizados para el número de copias de perfiles eran recogido en 10% de formalina tamponada. Microdisección se realizó en secciones de parafina para obtener células cancerosas. Por lo general mayor de 20 secciones en serie eran necesarios para producir suficiente material. ADN fue aislado de las células recogidas por proteinasa K extracción con fenol /cloroformo como se ha descrito anteriormente [22]. matriz ruta análisis de todo el genoma suelo de baldosas CGH se realizó utilizando la versión 2 SMRT matriz como se describe anteriormente [23], [24]. Esta plataforma es adecuada para el perfil de formalina parafina material fijado incrustado [22], [23], [25], [26], [27], [28], [29], [30]. la segmentación del genoma y el estado del número de copias se ha realizado mediante aCGH-Smooth en los datos de imagen matriz y se visualizaron utilizando el software SIGMA [31], [32], [33], [34]. elementos de la matriz de pérdida se les asignó un valor de -1, retiene elementos un valor de 0, y ganaron elementos de un valor de 1. Veinte muestras de la CEI fueron perfilados en total, y un umbral para el número de copias ganancia /pérdida de genes específicos se fijó en 20 %. El umbral del 20% se impuso en un esfuerzo para reducir la detección de eventos no esenciales o al azar debido a la inestabilidad genómica fondo inherente a las muestras, y por lo tanto la selección para aquellos eventos que se producen con algún grado de regularidad.
microarray Pública comparaciones de datos
los datos de expresión de microarrays de 53 tumores epidermoides primarios fue recuperado del cáncer de pulmón de conjunto de datos en el NCBI, número de acceso GEO GSE3141 [35]. los datos de microarrays de expresión para 67 cepillado bronquial recuperados de una población mixta de los fumadores actuales y anteriores, se perfilan internamente. Todos los datos de microarrays se normalizaron RMA [36].
Resultados y Discusión
SAGE ofrece un enfoque imparcial y completa de perfiles de expresión, limitado sólo por la profundidad de la secuencia elegida por el investigador y ofertas una oportunidad sin precedentes para el descubrimiento de transcripción. Esto está en marcado contraste con el análisis de microarrays, donde el perfil de expresión y el alcance de análisis está predeterminado por el diseño de destino empleando normalmente un número limitado de los genes más comúnmente se caracteriza [17]. En un estudio anterior, hemos descrito la transcriptomes de epitelio bronquial humo dañado y parénquima pulmonar a través de SAGE [19]. Aquí extendemos nuestro análisis a la zona inexplorada del desarrollo del cáncer de pulmón en estadio temprano, y presenta el primer informe del gran escala de perfiles de expresión génica de carcinoma in situ (CIS) del pulmón. La comprensión de la genética molecular que rigen las etapas preinvasoras es fundamental para facilitar la detección precoz y la intervención terapéutica inmediata antes de la progresión a cáncer invasivo se produce. En el estudio actual, se presenta un análisis comparativo, con énfasis en los genes sobreexpresados en la CEI y transcriptomes cáncer invasivo, con relación a transcriptomes no cancerosas del pulmón incluyendo epitelio bronquial (BE), y lesiones precancerosas (PC: escamosa la metaplasia y displasia).
Veintisiete SAGE bibliotecas de pulmón que constan de 3,997,729 etiquetas de secuencias totales (~ 40 megabases de secuencia de ADN de alta calidad) fueron analizados en este estudio. pulmonar normal está representado por 14 bibliotecas epiteliales bronquiales (BE-BE-1 a 14) [19], [37]. etapa precáncer es representado por dos bibliotecas de derivados de metaplasia escamosa (Met) y displasia escamosas (Dys). carcinoma de células escamosas del pulmón está representado por cinco bibliotecas de carcinoma in situ (CIS-1 a través de CIS-5), y seis bibliotecas de carcinoma invasivo (SCC-1 a través de SCC-6) (detallado en la Tabla 1 y la Tabla 2). (Se hace notar que los especímenes que comprenden la SER, PC, CIS, y los conjuntos de datos de SCC eran de una población mixta de fumadores y exfumadores.) Estos datos han identificado más de 129.000 etiquetas únicas secuencias /posibles transcripciones en las lesiones de la CEI, y casi 140.000 único etiquetas de secuencias potenciales /transcripciones en invasiva CPCNP escamoso.
análisis de las 300 etiquetas más abundantes en BE, CIS y SCC SAGE conjuntos de datos
el análisis de conglomerados.
El análisis de conglomerados produjo agrupación prevista de bibliotecas SAGE, en el que conste de probar la calidad. Para este análisis, los 300 etiquetas más abundantes fueron retenidos de cada biblioteca, produciendo una lista combinada de 1128 etiquetas únicas. análisis de ligamiento media de la agrupación en función de las etiquetas SAGE 1128 más abundantes, revela que todas las bibliotecas de cáncer (tanto CIS y SCC invasivo), el grupo juntos y por separado de la BE bibliotecas (Figura 2A). Observamos algunas agrupaciones de las bibliotecas de SCC invasivos (cuatro de seis). Se observa la agrupación similares cuando se utiliza la parte superior o top 500 1000 etiquetas únicas por biblioteca (datos no mostrados).
A. El análisis de agrupamiento de las bibliotecas SAGE pulmón. Todas las bibliotecas SAGE de este estudio, incluyendo cinco bibliotecas de carcinoma in situ (CIS-1 a través de CIS-5), seis bibliotecas de carcinoma de células escamosas invasivos (SCC-1 a través de SCC-6), una biblioteca de metaplasia escamosa (Met), y una biblioteca escamosas displasia (Dys), así como 14 bibliotecas epiteliales bronquiales (BE-1 a través de BE-14), y dos bibliotecas parénquima pulmonar SAGE normales (LP-1, LP-2; adhesión GSE3708) generados en un estudio anterior [19 ], [37], se analizaron mediante análisis de conglomerados utilizando un algoritmo de promedio de vinculación. Las 300 etiquetas más abundantes fueron retenidos de cada biblioteca, y el análisis se basó en 1128 etiquetas únicas en total. En el dendrograma, longitud de la rama representa la distancia. B-D. IPA análisis funcional de los genes más abundantes en la CEI BE, y los conjuntos de datos de cáncer invasor. asignaciones de etiqueta a génica para las 300 etiquetas más abundantes de los BE, CIS, y conjuntos de datos de SCC, se utilizaron para el análisis de IPA núcleo, que consiste en 220, 231, y 233 IPA elegibles asignan identificadores, respectivamente. Los tres conjuntos de datos se muestran juntos usando comparaciones básicas de la API, y las cinco funciones más importantes dentro de
fisiológica desarrollo del sistema y la función
se muestran para cada uno de los tres conjuntos de datos. Los datos de la B se clasifican de acuerdo con la más alta significación en BE, los datos en C se clasifica según más alta significación en la CEI, y los datos en D se clasifican de acuerdo con la más alta significación en SCC invasivo. La línea naranja indica el límite umbral de significación, preestablecido en un valor de p de 0,05. Para obtener una lista completa de las etiquetas /asignan identificadores utilizados para este análisis véase la Tabla S1.
Ingenio vía de análisis.
Para caracterizar y comparar las epiteliales bronquiales y cáncer transcriptomes, que computated promedio de los recuentos normalizados de etiquetas para BE (14 bibliotecas), la CEI (5 bibliotecas), y SCC invasivo (6 bibliotecas) de datos, y posteriormente seleccionados los más abundantes 300 etiquetas únicas de cada conjunto de datos para el análisis (Tabla S1). Las etiquetas de cartografía de los genes mitocondriales codificadas por los genes y la proteína ribosomal, se encontraron en frecuencias similares dentro de las 300 etiquetas más abundantes, en los tres conjuntos de datos de BE, CIS, y SCC, en ~ 8% y ~ 18%, respectivamente. Se utilizó el análisis de componente principal de
Análisis Ingenuity Pathway gratis (IPA) para categorizar estos genes en función de las funciones biológicas. Sólo aquellas moléculas que tienen al menos una anotación funcional en la base de conocimientos IPA califican para el análisis, y se incluyeron 220 (BE), 231 (CIS), y 233 genes elegibles (SCC) del IPA. Estos análisis revelan que los genes dentro de la categoría de
Cabello y Desarrollo de la piel y la función ¿Cuáles son altamente expresado en el CIS transcriptoma en relación con ambos BE y SCC, y los genes dentro de las categorías de
hematológica desarrollo del sistema y la función
y
la trata de células inmunes ¿Cuáles son altamente expresado en el transcriptoma SCC en relación con ambos CIS y BE. Por lo tanto, la alta expresión de genes asociados con el desarrollo epidérmico se identifica aquí como un rasgo característico de la transcriptoma CIS, y la alta expresión de genes asociados con el movimiento celular como un rasgo característico de la transcriptoma SCC. Ver Figura 2B-D para un resumen de estos análisis.
Una característica notable de ambos conjuntos de datos de la CEI y SCC es la abundancia de las etiquetas de cartografía de la región constante de cadenas pesadas de inmunoglobulina. De hecho, la etiqueta SAGE para IGHG1 es la etiqueta más abundante en ambas la CEI y los conjuntos de datos de cáncer invasor (Tabla S1). expresión Aunque es posible que la expresión de estas cadenas de inmunoglobulina se origina a partir de la infiltración de tejido linfoide y estroma circundante, estudios previos han demostrado de constante de cadena pesada y regiones variables de las inmunoglobulinas en las células epiteliales de cáncer de mama [38], [39], [40], y la expresión de IgG cadenas pesadas y ligeras en varias células cancerosas epiteliales incluyendo SCC de pulmón [41]. Estas cadenas de inmunoglobulina pueden representar autoanticuerpos de células de cáncer, y estimular el crecimiento de una manera autocrina /paracrina [40]. Curiosamente, la abundancia de las etiquetas de cartografía a la inmunoglobulina transcripciones de cadena pesada de lesiones preinvasivas CEI del pulmón, en contraste con la relativamente baja de detección tanto en BE y metaplasia precancerosas y lesiones displásicas (que se detallan en las tablas siguientes), sugiere que la regulación de éstos transcripciones pueden tener relevancia para la iniciación del NSCLC.
cambios de expresión génica común a carcinoma in situ y las lesiones precancerosas
la transición de un epitelio bronquial sana a cáncer invasivo se cree que proceder a través de la progresión de histológicos y genéticos anomalías: Be to PC a la CEI a SCC, donde representa PC lesiones precancerosas (metaplasia escamosa y displasia). La metaplasia escamosa es un componente transitorio de la cicatrización de heridas normal del epitelio bronquial, y por lo general se resuelve en un epitelio re-diferenciada compuesta de células ciliadas y secretoras seudoestratificadas, restaurando la función bronquial [42]. (El uso del término PC aquí no implica una progresión obligatoria para el cáncer, sino que se refiere a las lesiones /anomalías que a pesar de la progresión frecuente con el cáncer, son considerados como precursores de cáncer.) Por el contrario, las lesiones de la CEI demuestran una frecuencia de regresión bajo con una alta incidencia de progresión a cáncer invasivo [43], [44] y se caracterizan por una más amplia estratificación de tipos de células escamosas en comparación con PC [9], [11], [12]. Mediante la identificación de cambios de expresión génica común a ambos PC y la CEI en relación con SER, nos centramos en los eventos genéticos que ocurren temprano y persisten a través de la CEI. De acuerdo con nuestros criterios de selección (diferencia mínima de tres veces en medio de la abundancia etiqueta normalizada; mínima de abundancia etiqueta normalizada promedio de 40 TPM en la sobre-expresión de conjunto de datos), se encontraron 868 etiquetas SAGE ser igualmente expresado diferencialmente en PC y la CEI en relación con BE, que consta de 190 etiquetas de hasta reguladas, y 678 etiquetas de abajo-regulados (Figura 3A).
Criterios para la expresión diferencial de genes se definió como una diferencia mínima de tres veces en el recuento de etiquetas medio normalizado, y con una mínima abundancia etiqueta media de 40 TPM en los que sobre-expresan conjuntos de datos. Las flechas hacia arriba indican hasta reguladas cambios de expresión génica; Las flechas hacia abajo indican reguladas por los cambios de expresión génica; valores numéricos se refieren al número de etiquetas expresados diferencialmente. Áreas de intercepción reflejan cambios de expresión génica en común entre los dos conjuntos de datos. A. Expresión cambia en el carcinoma in situ y las lesiones precancerosas en relación con SER. B. Expresión cambios en el cáncer de conjuntos de datos en relación tanto con el epitelio bronquial y conjuntos de datos precancerosas. BE: epitelio bronquial; PC: precáncer; CIS: carcinoma-in-situ; SCC:.. El carcinoma de células escamosas invasivo
regulados hasta los cambios de expresión
Aproximadamente el 35% de las etiquetas hasta reguladas en la CEI con respecto a ser (190 de 529 etiquetas) eran encontrado que son comúnmente hasta reguladas en las lesiones de PC, y aproximadamente el 25% de las etiquetas hasta reguladas en las lesiones de PC relativo que se han encontrado (190 de 754 etiquetas) para ser igualmente hasta reguladas en la CEI (Figura 3A). Véase la Tabla S2 para una descripción de estas etiquetas hasta reguladas en la PC y el CIS. análisis funcional IPA (basado en 143 elegibles asigna IDs) indica que aproximadamente el 35% de estos comúnmente regulados hasta genes están asociados con el desarrollo epidérmico y trastornos asociados, como se describe en la Tabla 3. Además de los genes descritos en la Tabla 3, una revisión de la literatura identificado otros genes dentro de la PC /CIS hasta reguladas conjunto de datos que se asocia con el desarrollo epidérmico, incluyendo SBSN, CNFN, CRCT1, miembros adicionales de la familia pequeña rico en prolina de las proteínas (SPRR2E y SPRR3), y miembros adicionales de la familia S100A de proteínas de unión a calcio. Muchos de estos genes se codifican ya sea dentro del complejo de la diferenciación epidérmica locus (EDC) en 1q21 [45], [46] o dentro de un locus conservada en 19q13 [47], y especificar los componentes de la envoltura celular córnea, una estructura que proporciona barrera la protección de la epidermis y el epitelio interno en respuesta a insultar o lesiones [48], [49].
vía IPA representación gráfica de los genes comúnmente hasta reguladas en la CEI y PC pariente que sea, se presenta en la Figura 4. Teniendo en cuenta las interacciones moleculares identificados por el IPA, asociaciones funcionales entre las cadherinas y desmosómicas catenina ocupan un lugar destacado dentro de la PC /conjunto de datos CIS-regulada de manera ascendente. Desmosomas son uniones de adhesión intercelular que proporcionan la integridad mecánica para el epitelio, y los estudios indican que las cadherinas desmosómicas modulan la diferenciación de queratinocitos epidérmica y la morfogénesis [50]. Este análisis también sugiere que una cascada de señalización mediada por miembros de la familia de proteínas 14-3-3, puede ser activo aquí. 14-3-3 sigma (SFN) media la diferenciación de queratinocitos y la estratificación de la epidermis [51]. El diagrama de vía también sugiere que los aspectos específicos de la diferenciación terminal de los queratinocitos pueden estar mediados por la AP-1 factor de transcripción FOSL2, que puede tener un papel adicional en la remodelación de la matriz extracelular. De hecho, FOSL2 ha sido identificado como un mediador de la fibrosis pulmonar [52]. Una consideración de los genes asociados con la HIF1A factor de transcripción en las lesiones de PC /CEI, es sugerente de una remodelación respuesta /profibrotic a las condiciones de crecimiento de hipoxia [53], [54], [55]. De hecho, un enlace funcional entre la hipoxia y la fibrosis se documenta en la literatura [56], [57], [58]. La expresión de otros genes identificados aquí, tales como NCF1 (la subunidad reguladora de la NADPH oxidasa), y el hemo HMOX1 enzima catabólica, también es indicativo de una respuesta al estrés relacionado con el oxígeno y la remodelación tisular /fibrosis [59], [60], [ ,,,0],61], [62]. Se hace notar que el análisis adicional IPA identificó
fibrosis hepática /hepática activación de las células estrelladas
y
14-3-3-señalización mediada
categorías significativas dentro de
Canónica de Rutas
, y identificado
fibrosis hepática
como la categoría más importante dentro de
Listas de toxicidad gratis (datos no mostrados).
155 genes (IPA asigna identificadores) se representan de 190 SAGE Etiquetas hasta -regulated en ambos CEI y PC con respecto a ser. (Ver Tabla S2 para los datos de la etiqueta.) Los productos génicos están colocados de acuerdo a la localización subcelular. Sólo las conexiones directas (es decir, el contacto físico directo entre dos moléculas) entre los productos de los genes individuales se muestran para mayor claridad de la presentación; líneas indican las interacciones de unión proteína-proteína, y las flechas se refieren a "los actos de" interacciones tales como la proteólisis, la expresión y la proteína-ADN /ARN interacciones. Los genes asociados con el desarrollo epidérmico (véase la Tabla 3) se resaltan.
El análisis adicional de ontología de genes utilizando el
herramienta ACCEDA
anotación [63], el desarrollo epidérmico identificado de manera similar como un componente importante del transcriptoma de frecuencia hasta los genes regulados en las lesiones de la CEI y PC, en relación con SER (Figura S1 a, Tabla S3).
regulados hacia abajo los cambios de expresión.
la mayoría de las etiquetas de abajo regulado en relación cis sea, se encontró que eran comúnmente las reguladas en las lesiones de PC (678 etiquetas de cada 904 etiquetas), y viceversa (678 etiquetas, de 912 etiquetas de abajo-regulada en PC en relación con BE) (Figura 3A) .