Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Aplicación de multi-SNP Enfoques bayesiano LASSO y AUC-RF para detectar Principales efectos de los Inflamatoria-variantes genéticas asociadas con el cáncer de vejiga Risk

PLOS ONE: Aplicación de multi-SNP Enfoques bayesiano LASSO y AUC-RF para detectar Principales efectos de los Inflamatoria-variantes genéticas asociadas con el cáncer de vejiga Risk


Extracto

La relación entre la inflamación y el cáncer está bien establecido en varios tipos de tumores, incluyendo cáncer de vejiga. Se realizó un estudio de asociación entre las 886 variantes de genes inflamatorios y riesgo de cáncer de vejiga en 1.047 casos y 988 controles del cáncer de vejiga Español (SBC) /Estudio EPICURO. Una exploración preliminar con el método de regresión logística univariante ampliamente utilizado no identificó ningún SNP significativa después de la corrección de múltiples ensayos. Además, se aplica dos métodos más completos para capturar la complejidad de la susceptibilidad genética del cáncer de vejiga: Umbral bayesiano LASSO (BTL), un método de regresión regularizada, y el ABC-Random Bosque, un algoritmo de aprendizaje automático. Ambos enfoques exploran el efecto conjunto de marcadores. BTL análisis identificó una firma de 37 SNPs en 34 genes que muestran una asociación con el cáncer de vejiga. AUC-RF detecta un subconjunto de predicción óptima de 56 SNPs. 13 SNPs fueron identificados por ambos métodos en la población total. Utilizando los recursos del estudio de cáncer de vejiga de Texas que fueron capaces de replicar el 30% de los SNPs evaluados. Las asociaciones entre SNPs inflamatorias y el cáncer de vejiga se reexaminaron entre los no fumadores para eliminar el efecto del tabaco, uno de los factores de riesgo ambiental más fuerte y más frecuente para este tumor. Un SNP-9 de la firma fue detectado por BTL. Aquí mostramos, por primera vez, un conjunto de SNP en los genes inflamatorios asociados de forma conjunta con el riesgo de cáncer de vejiga. Estos resultados destacan la importancia de la compleja estructura de la susceptibilidad genética asociada con el riesgo de cáncer

Visto:. De Maturana EL, Y vosotros, Calle ML, Rothman N, V ​​Urrea, Kogevinas M, et al. (2013) Aplicación de multi-SNP Enfoques bayesiano LASSO y AUC-RF para Detectar Principales efectos de los Inflamatoria-variantes genéticas asociadas con el riesgo de cáncer de vejiga. PLoS ONE 8 (12): e83745. doi: 10.1371 /journal.pone.0083745

Editor: Chuhsing Kate Hsiao, Universidad Nacional de Taiwán, Taiwán

Recibido: 25 Junio, 2013; Aceptado: 7 de noviembre de 2013; Publicado: 31 de diciembre 2013

Derechos de Autor © 2013 de Maturana y col. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. El trabajo fue parcialmente apoyado por el Fondo de Investigación Sanitaria del Instituto de Salud Carlos III (G03 /174, 00/0745, PI051436, PI061614, PI09-02102, G03 /174 y Sara Borrell beca para ELM) y el Ministerio de Ciencia e Innovación (MTM2008 -06747-C02-02 y FPU beca premio a VU), España; AGAUR-Generalidad de Cataluña (Grant 2009SGR-581); Fundacióla Maratóde TV3; Red Temática de Investigación Cooperativa en Cáncer (RTICC); Asociación Española Contra el Cáncer (AECC); UE-FP7-201663; y RO1- CA089715 y CA34627; el Instituto Nacional de Bioinformática Español (www.inab.org); y por el Programa de Investigación Intramural de la División de Epidemiología del Cáncer y Genética, Instituto Nacional del Cáncer, EE.UU.. MD Anderson apoyo para este proyecto incluyó U01 CA 127615 (XW); R01 CA 74880 (XW); P50 CA 91846 (XW, CPD); Fondo para sillas de Betty B. Marcus en la Prevención del Cáncer (XW); UT Fondo Fiduciario de Investigación (XW) y R01 CA 131335 (JG). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

el cáncer de vejiga (BC) es la quinta neoplasia más común en términos de incidencia en los países industrializados, que representan aproximadamente el 5-7% y 2-2,5% de los tumores malignos recién diagnosticados en hombres y mujeres, respectivamente. BC es uno de los cánceres más prevalentes debido a su naturaleza crónica [1]. Tabaco y la exposición ocupacional a aminas aromáticas son los dos factores de riesgo ambientales mejor establecidos [2], [3]. Además, una fuerte evidencia de la influencia de las variantes genéticas comunes en el desarrollo antes de Cristo se ha adquirido en los últimos años [4], [5]. La susceptibilidad genética a BC se ha investigado en relación a los genes que codifican enzimas implicadas en el metabolismo de xenobióticos, apoptosis, control del ciclo celular, la angiogénesis y la inflamación [4]. En cuanto a este último proceso, hay evidencia de que las células inflamatorias, citocinas proinflamatorias, quimiocinas y contribuyen a la inmunosupresión, el crecimiento del cáncer y la progresión [6]. Una relación entre la inflamación crónica y BC es apoyado por las asociaciones encontradas entre los
Schistosoma haematobium Opiniones y carcinoma de células escamosas [7] y, de forma menos constante, entre el carcinoma de células uroteliales y otros tipos de infección del tracto urinario [8]. Además, el efecto protector del uso a largo plazo de medicamentos no esteroides anti-inflamatorios observados en algunos estudios de casos y controles apoya un papel de la inflamación en este tipo de cáncer [9], [10].

La mayor asociación estudios se han centrado en la detección de efectos principales mediante el uso de una prueba de alelo o basado en el genotipo para cada polimorfismo de un solo nucleótido (SNP) por separado. Sin embargo, se sabe que los rasgos complejos, incluyendo aC, se explican por múltiples loci con más bien pequeños efectos individuales [11]. Por lo tanto, esta simple estrategia probablemente capturar sólo una pequeña proporción de la varianza genética total de la enfermedad conferida por todas las variantes [12]. Por lo tanto, las estrategias para evaluar al mismo tiempo múltiples SNPs y se necesitan sus efectos de interacción. métodos estadísticos estándar, tales como la regresión logística no son muy adecuadas para este fin. Este nivel de complejidad genética representa un reto estadístico en estudios de asociación, debido al alto número de coeficientes de regresión (
p
) en comparación con el tamaño de la muestra (
n
). algoritmos de aprendizaje automático proporcionan alternativas para la realización de análisis-SNP múltiples [13]. Estos algoritmos son muy atractivas ya que son modelo de libre-especificación y pueden capturar información oculta. Random Bosque (RF), un algoritmo de clasificación propuesta por Breiman [14] que se puede utilizar para identificar las variables más importantes relacionados con la enfermedad, también se ha aplicado con éxito a los datos del genoma de ancho [15]. Recientemente, un algoritmo para la selección de variables se ha propuesto (AUC-RF): identifica el conjunto de variables con la precisión de predicción más alta mediante la optimización de la AUC (área bajo la curva ROC) de una secuencia de bosques aleatorios [16]. Otros métodos para hacer frente a los problemas de regresión sobresaturados [17] que están ganando reconocimiento son los métodos de regresión regularizados, como cresta de regresión [18], lo mínimo absoluto de contracción y de Selección de Operador (LASSO) [19], y su versión bayesiana [20] . Estos métodos son penalizados procedimientos de probabilidad donde se añaden funciones de sanciones adecuados para el diario de probabilidad negativo para reducir el tamaño de forma automática efectos espurios (efectos de las covariables redundantes) hacia cero, mientras que la estimación de manera efectiva los relevantes. La versión bayesiana de LASSO ofrece varias ventajas sobre la cresta de regresión o el lazo clásica. Como otros modelos bayesianos, que proporciona medidas de incertidumbre acerca de las estimaciones y predicciones, y, como consecuencia, los errores estándar válidos, que puede ser problemática para el LASSO frequentist [21]. Además, se produce la contracción-marcador específico de las estimaciones del efecto, a diferencia de regresión contraída, y supera la limitación principal de LASSO, que admite como máximo
n -1
coeficientes de regresión no nulos [22].

Hasta el presente, los estudios de asociación de todo el genoma completo (GWAS) analizan individualmente un gran número de SNPs, la mayoría de ellos ubicados en regiones que no están asociados con el rasgo de interés mientras que otros en LD con la variante causal. Este enfoque no es satisfactorio para los rasgos afectados por un gran número de variantes /genes [12]. Una estrategia alternativa es la vía de análisis, que trata de la evaluación conjunta de un subconjunto de SNPs con un efecto funcional potencial en el fenotipo de interés.

El objetivo principal de este estudio fue evaluar si los SNPs en los genes relacionados con la inflamación desempeñar un papel en el desarrollo de BC en un estudio de casos y controles a gran escala realizado en España y, posteriormente, para identificar un patrón de esas variantes (firma) asociados con el riesgo antes de Cristo mediante la aplicación de dos métodos estadísticos se han desarrollado recientemente, el umbral bayesiano LASSO modelo (BTL) y AUC-RF. Para evaluar la solidez de la estrategia, los resultados pertinentes también fueron analizados en un estudio independiente, el estudio del cáncer de vejiga de Texas.

Resultados

Resumen de las estadísticas

La Tabla 1 muestra las características de casos y controles para el conjunto de la muestra y de la subpoblación no fumador. En general, el estudio incluyó 1.047 casos y 988 controles con los datos de genotipos de 886 SNPs en 194 genes inflamatorios. El subconjunto no fumador consistió en 424 individuos, de los cuales 147 eran casos de CM. La edad media de los pacientes al momento del diagnóstico fue de 68 y 70 años (rangos de 22-80 años) de la población total y los no fumadores, respectivamente. En general, el tabaquismo fue más frecuente en los casos que en los controles (86%
vs.
72%) y en los hombres que en las mujeres (87%
vs
. 22%). En consecuencia, el porcentaje de hombres fue diferente en ambos grupos de individuos:. 87% y el 35% para el estudio total y para los no fumadores, respectivamente

Población total análisis

La aplicación del umbral de LASSO bayesiano proporciona para cada SNP su posterior probabilidad de estar asociado con BC. En la Figura 1, se muestra la distribución de la probabilidad posterior de cada SNP, clasificados en orden decreciente. Se consideraron SNPs estar asociado a BC si la probabilidad posterior de ser mayor /menor que 0 era & gt; 80%. Esta estrategia identificó 37 SNPs en 34 genes que muestran una asociación con BC. La más alta probabilidad posterior (es decir, la asociación, más relevante) fue 96,07% para
CASP3-
rs3087455, mientras que el menor era 51.98% de
TLR2
rs3804100. El SNPs con un alelo menor de protección fueron:
CASP3-
rs3087455,
CCR3-
rs3091312,
CASP9-
rs2020902,
IL17A-
rs8193036,
MAP3K7-
rs150126,
IL6R-
rs8192284,
BLNK-
rs3789928,
SCARB1-
rs4765621,
FOS
rs7101,
TBK1-
rs10878176,
BIRC5-
rs744120,
LY96-
rs17226566,
AICDA-
rs11046349,
MAP2K4-
rs4791489,
IL15-
rs17461269,
CD14_IK-r
s2569190,
JAK3-
rs11888 y
TNFRSF10A
-rs4871857. Los medios de posterior o varió de 0,81 a la 0,93 cuando se compara la menor con los genotipos homocigotos comunes (Tabla 2). Los SNPs con el alelo menor asociado con un mayor riesgo de CM fueron:
PRF1-
rs10999426,
IL7R-
rs1494555,
ABCA1-
rs2230806,
IFNAR2-
rs2236757,
MASP1-
rs710459,
BLNK-
rs12357751,
MAP3K3-
rs7209435,
BLNK-
rs10882755,
TLR2
rs3804099,
SOCS6-
rs723279,
IL17C-
rs899729,
TLR4-rs2737191
,
FOS
rs1063169,
ABCC4-
rs3765535,
PARP4-
rs13428,
BIRC3-
rs11602147,
IL21R-
rs8049804,
FADD
-rs7939734 y
ICAM1-
rs5498. Los medios posteriores de RUP variaron desde 1,10 hasta 1,20, al comparar la menor con genotipos homocigotos comunes. Todos los SNPs detectados estaban en equilibrio de Hardy-Weinberg en la población control. Los modelos de regresión logística de un solo SNP produjeron
los valores de p Hotel & lt; 0,05 para 17 de ellos (de un total de 32, véase la Tabla S1) con un mínimo
p CD -
valor
de 0,0021, no corregida por múltiples pruebas. El OR estimada correspondiente al 37 SNPs en firmas era & gt; 4,92 (véanse las figuras S1 y S2 para más detalles). El intervalo del 95% para el quirófano cuando se compara la combinación más alta genotipo de riesgo con la protección más alta osciló entre 31.2-629.4. La amplia gama del intervalo de credibilidad muestra el gran error asociado con la estimación. Media posterior, mediana y moda de la distribución posterior asimétrica fueron 206,5, 123,5 y 63,8, respectivamente.

La línea de puntos indica el punto de punto de corte de 80% por encima del cual se consideraron los SNP.



ABC-RF considerado las variables tanto genéticos y no genéticos y detecta un subconjunto óptimo de 59 factores, incluyendo 56 SNPs (Tabla S2). Todas las covariables ambientales, a excepción de género, se clasificaron en primer lugar: el tabaquismo fue clasificada como la variable más relevante, con una disminución del índice de Gini promedio (ODM) de 11.55, seguido por región geográfica con una importancia relativa del 35,2%. La edad de la paciente fue clasificado en el tercer lugar con una importancia relativa del 19,4%, seguido de SNPs. La Tabla 3 muestra los 12 SNPs más importantes detectados por este método. Su importancia relativa varió de 20,8% para
JAK3
-rs2286662 al 14,4% para
AKR1C3
-rs1937845.

Trece SNPs en
CASP3
,
PRF1
,
IL7R
,
ABCA1
,
IL6R
,
MASP1
,
SCARB1
,
TLR2
,
IL17C
,
MAP2K4
,
CD14_IK
,
FADD
, y
ICAM1
fueron identificados como relevante tanto por BTL y el ABC-RF se acerca (en negrita los SNP en la Tabla 2; véase también la figura 2a.). Entre ellos, 6 SNPs encuentran en
CASP3
,
PRF1
,
IL7R
,
ABCA1
,
IL6R
y
CD14_IK
tenía un
p-valor Hotel & lt; 0,05 por regresión logística con la mortalidad (véase la Tabla 2, para más detalles). La importancia de ninguno de ellos llevó a cabo después de la corrección de Bonferroni para múltiples ensayos [23]. A pesar del hecho de que ninguna asociación significativa se encontró después de realizar el único marcador análisis, la clasificación de los SNP altamente correlacionado con la obtenida a partir de los resultados basados ​​en BTL probabilidad posterior (correlación de Spearman, rho = 0,78).

(A ) Número de SNPs detectados por cada método en la población total. (B) Número de SNPs detectados por cada método en el subconjunto no fumador. (C) Número de SNPs comunes detectados por BTL en la población y no fumador total de subconjunto, con posterior probabilidades de al menos 80% y 75% de tener un efecto diferente de 0. (D) Número de SNPs detectados por AUC-RF tanto en la población total y el subconjunto no fumador.

los genotipos se utilizó para 17/37 SNPs con una probabilidad posterior superior al 80% en la fase de descubrimiento estaban disponibles a partir del estudio TXBC y esta información para los propósitos de replicación. Además, 13 SNPs en alta LD con SNPs detectados por BTL en la fase de descubrimiento se incluyeron en los análisis de fase 2. Tabla S3 muestra la parte posterior probabilidades de ser mayor /menor que 0 y la posterior media de las RUP obtenidos en el conjunto de replicación. Dos SNPs (
IL6R-
rs4129267 y
TBK1-
rs10878182) en alto LD con
IL6R
-rs8192284 y
TBK1-
rs10878176 detectaron en el descubrimiento estudio de BTL tenía posterior probabilidades de tener un efecto no nulo superior al 90%. El OR de estos SNP eran sustitutos de riesgo, mientras que los identificados en el estudio fueron el descubrimiento de protección. Cinco nuevos SNPs (
IL21R-
rs9930086 - en alto LD con
IL21R
-rs8049804, y
MAP3K3-
rs7209435, rs8193036-IL17A, FADD-rs7939734, y TLR2 rs3804099) mostraron posterior probabilidades & gt; 70%, el umbral considerado para la replicación. Las RUP de estos 5 SNPs fueron de la misma magnitud y dirección como las que se encuentran en el estudio de descubrimiento.

No fumador análisis de subconjunto

El consumo de tabaco es el factor de riesgo ambiental más fuerte y más frecuente de C. y se pueden modificar los efectos de SNPs en los genes relacionados con la inflamación. Por lo tanto, se realizó el análisis de asociación entre los no fumadores para eludir su efecto. En tal contexto, BTL detectó sólo dos SNPs relevantes (
BCL10-
2.647.396 y
NFKBIA-
rs696) asociado con el riesgo de CM con una probabilidad posterior de al menos el 80%. Los dos SNPs también fueron detectados por AUC-RF (véase la figura 2b). Cuando nos extendió la probabilidad posterior (≥75%), el número de SNPs detectados por ambos enfoques se incrementó hasta 8 en 8 genes (véase la Tabla 4). O posterior significa varió de 01.12-01.16 para los SNPs que muestran un mayor riesgo de BC, al comparar los dos genotipos homocigotos, y desde 0.89-0.91 para los que tienen un efecto protector. El análisis de regresión logística univariante arrojó resultados significativos para los 8 SNPs con un mínimo
p CD -
valor Red de 0,0032, no corregida por múltiples pruebas. El o la densidad media posterior correspondiente a la 9 SNPs-firma detectada por BTL era 2,73, con una probabilidad posterior de 99% de ser & gt;. 1 y un rango entre 1,35 y 6,66 como 95% intervalo de credibilidad (véase la figura S3)


ABC-RF detecta un subconjunto óptimo de 93 variables relacionadas con BC, 90 de los cuales eran SNPs (Tabla S4). Al contrario de los hallazgos en la población total, el sexo era la covariable más importante relacionado con AC entre los no fumadores, y la edad y la región estaban en la tercera y cuarta posición, respectivamente.

SNPs comunes entre total y no fumador conjuntos de datos

Figuras 2C y 2D muestran el número de SNPs detectados por tanto BTL y el ABC-RF en el estudio SBC /EPICURO tanto para toda la población y las personas no fumadoras. No hubo SNPs comunes detectados por BTL para aquellos conjuntos de población con posterior probabilidades mayores que 80%. Sin embargo, cuando la probabilidad posterior aplicada era ≥75%, se detectaron tres SNPs en ambos conjuntos de datos:
MAP2K4-
rs4791489,
PRF1
-rs10999426 y
BCL10
-rs2647396.

Cuando se enfoca en los resultados AUC-RF, 24 SNPs (
ABCA1-
rs2230806,
AICDA-
rs2580874,
ALOX5-
rs1369214,
BCL10-
rs2647396,
CD2
rs3136701,
CD4
rs2707210,
FADD-
rs7939734,
FASLG-
rs929087,
H2AFX-
rs640603,
H2AFX-
rs643788,
IKBKB-
rs3747811,
IL15RA-
rs2296135,
IL21R-
rs2189521,
JAK3-
rs2286662,
MAP2K4-
rs4791489,
MASP1-
rs710459,
NFKBIA-
rs696,
OPRD1-
rs204076,
PRF1-
rs10999426,
relaciones
rs11820062,
relaciones
rs1466462,
SCARB1-
rs4765621,
TBK1
-rs10878178 y
TMED7-
rs2052834) se identificaron en ambos conjuntos de datos, lo que representa el 43% y el 27% de los SNPs seleccionados en el total de sujetos y no fumador, respectivamente.

Discusión

Como todos los complejos enfermedades, BC no es un trastorno único /gen SNP. Por el contrario, muchos SNPs con pequeños efectos pueden conducir al deterioro de las vías clave involucrados en su fisiopatología. La identificación de tales SNP-firmas representa un desafío analítico que requiere la aplicación de nuevos enfoques estadísticos completos. Para nuestro conocimiento, este es el primer estudio en BC el análisis de un gran número de SNPs con BTL que se ha identificado un subconjunto de ellos contribuyendo conjuntamente a este fenotipo con una magnitud correspondiente de riesgo, mucho mayor que la proporcionada por el tabaquismo (OR = 5 [ ,,,0],2]), el principal factor de riesgo para BC.

Trece SNPs en 13 genes fueron identificados por tanto BTL y AUC-RF, que puede ser considerado como una validación interna. SNPs en
CASP3
,
IL6R
,
SCARB1
,
MAP2K4
y
CD14_IK
mostraron un efecto protector, mientras que los de
PRF1
,
IL17R
,
ABCA1
,
MASP1
,
TLR2
,
IL17C
,
FADD Opiniones y
ICAM1
se asocia con un mayor riesgo de BC. Cada SNP mostró un pequeño efecto individual que no podría haber sido identificado por regresión logística, el enfoque analítico común usado en los GWAS, después de aplicar la corrección de Bonferroni para múltiples pruebas conservadora.

Nos encontramos previamente publicados evidencias sobre la asociación de varios de estos SNPs /genes con el riesgo de cáncer a pesar del hecho de que esta información no se usa para la selección SNP. Entre ellos,
SCARB1
codifica el receptor scavenger clase B de genes de tipo I, un receptor de superficie celular que se une a lipoproteínas de alta densidad (HDL-C) y media en la captación de HDL-C [24], [ ,,,0],25].
SCARB1
-rs4765621 mapas para el intrón 1 y se ha asociado con un mayor riesgo de CM en combinación con
SLC23A2
-rs12479919,
AKR1C3
-rs2275928 y
PLA2G6 -
rs2016755 [26]. Este SNP se encuentra en desequilibrio de ligamiento con
SCARB1
-rs4765623 que se ha asociado con el carcinoma de células renales [27].
MAP2K4
codifica una doble especificidad Ser /Thr proteína quinasa. desequilibrios alélicos en este gen han sido reportados en los tumores de vejiga [28]. Además, deleciones y mutaciones de la
MAP2K4
se han descrito en pancreático humano, pulmón, mama, testículo, y las líneas celulares de cáncer colorrectal, lo que sugiere un papel supresor de tumor [29].
MAP2K4-
rs4791489 se encuentra 1226 pb aguas abajo del gen y este es el primer estudio en reportar una asociación con un fenotipo.
IL7R
codifica el receptor de IL-7, una citoquina implicada en la diferenciación de células T y la activación.
IL7R
variación se ha relacionado con enfermedades inflamatorias crónicas y cáncer:
IL7R
-rs1494555 se ha asociado con un mayor riesgo de cáncer gástrico [30], neoplasias hematológicas - mediante la interacción con un alto índice de masa corporal - [31], y el cáncer de pulmón de células no pequeñas en donde fue detectado por ambos regresión y forestales al azar pruebas de logística [31]. Este SNP conduce a una Ile
sustitución 138Val para los que no existe evidencia funcional.
CD14
juega un papel importante en las vías de transducción de señales activadas por patógenos y en la producción de citoquinas inflamatorias [32].
CD14_IK-
rs2569190 se ha asociado con el cáncer de próstata en los afroamericanos [33], y con las arterias coronarias y las enfermedades cerebrovasculares [34], [35].
PRF1
codifica para perforina 1, una de las principales proteínas tóxicas de gránulos citolíticos y un efector clave en T-por células y natural citólisis mediada por células killer. Sus alteraciones causan hemofagocítico familiar Linfohistiocitosis tipo 2 (HPLH2), un trastorno autosómico recesivo poco frecuente y letal de la primera infancia.
PRF1
-rs10999426 se ha agrupado con otros genes asociados con las células T citotóxicas en un estudio de cáncer colorrectal: una alta expresión de los genes de racimo citotóxicos se asoció con una supervivencia libre de enfermedad prolongada [36]. Soluble interleucina-6-receptor-α-subunidad (

IL-6R) es una potente citoquina que juega un papel importante en la respuesta inmune. expresión de genes alterados se ha asociado con el mieloma múltiple, las enfermedades autoinmunes y el riesgo de cáncer de próstata [37]. El SNP
IL6R
-rs7529229, en desequilibrio de ligamiento con
IL6R
-rs8192284, también se ha relacionado con el riesgo de mieloma múltiple [37].

más centrado en el evaluación de los no fumadores para descartar el potencial efecto modificador del tabaco sobre la asociación entre variantes genéticas y el riesgo de cáncer de vejiga. Sólo dos polimorfismos asociados con BC fueron detectados por ambos métodos analíticos:
NFKBIA-rs696
y
BCL10-rs2647396
.
NFKBI
está implicado en la respuesta al estrés, regula
de la COX-2
y citoquinas proinflamatorias, y es un importante mediador de la oncogénesis [38]. El
NFKBIA-rs696
homocigosis se ha asociado con una peor supervivencia en pacientes suecos con cáncer colorrectal [39]. Otros estudios han asociado la supresión de
NFKBIA
con glioblastoma multiforme [40] y las muestras de linfoma de Hodgkin [41].
NFKBIA-
rs696 está en desequilibrio de ligamiento con rs8904, una variante que se ha asociado con la intensidad del dolor en pacientes con cáncer de pulmón [42].
BCL10
, asociado con la protección de BC en nuestro estudio, juega un papel importante en las NF-kappaB y STAT vías de señalización [40], se ha propuesto para participar en el carcinoma de páncreas [43] y
MALT
linfomas como parte de la t (1,4) (p22, q32) [44].
BCL10-rs2647396
es intrónica y ninguna función es conocida por este polimorfismo.

El uso de una población independiente y SNPs de sustitución en alto LD con los identificados en el estudio descubrimiento, aplicamos el mismo asociación con SNPs en
IL6R
y
TBK1
ha identificado por BTL. El hecho de que las RUP obtenidos en el estudio de replicación estaban en dirección opuesta a los detectados en el estudio descubrimiento puede explicarse utilizando SNPs sustitutas. Greene
et al.
Recientemente demostrado con datos simulados que las diferencias en la frecuencia de alelos también pueden proporcionar un efecto alélica inversed en un estudio de la replicación [45]. Cuando el umbral de la probabilidad posterior se redujo a 70%, también se repitió la asociación de cinco SNPs adicionales. En general, hemos sido capaces de replicar el 30% de los SNPs seleccionados por BTL disponibles en el estudio TXBC, una cifra que es notable si se considera que AC es causada en gran medida por factores ambientales y que ambos estudios provienen de diferentes áreas geográficas y de los centros con distinta patrones de referencia de pacientes (en el estudio de SBCS mayoría de los centros son los hospitales generales, mientras que el estudio se llevó a cabo TXBC en el MD Anderson Cancer Center). Otras causas propuestos para la falta de replicación son heterogeneidad genética, las interacciones medioambientales, los efectos dependientes de la edad, el poder estadístico inadecuado, y las interacciones gen-gen, la última explicación que apunta a una mayor complejidad de la arquitectura genética subyacente [45]. No hemos intento de replicar SNPs identificados por el AUC-RF ya que este método depende en gran medida de las variables iniciales examinados. Lamentablemente, los datos de una serie de los SNPs originales consideradas en la fase de descubrimiento no estaban disponibles en el estudio utilizado para la replicación.

El presente estudio tiene varias fortalezas importantes. Es importante destacar que, se aplica enfoques analíticos innovadores que se ocupan de la complejidad biológica del fenotipo. Asociación análisis se llevaron a cabo mediante la aplicación de un modelo de regresión regularizado (BTL) y un método de selección de variables no paramétrico (AUC-RF), además del único marcador de regresión logística no condicional, que se utiliza en la mayoría de los estudios de asociación. Los dos primeros métodos superar la principal limitación de este último, ya que consideran toda la información genética en forma conjunta. La aplicación de regresión logística individuo tiene sentido bajo el supuesto de que sólo unos pocos genes afectan la predisposición genética [12], lo que ciertamente no es el caso de BC. BTL considera, a priori, que la mayoría de los SNPs tienen un pequeño (si lo hay) efecto sobre el desarrollo de la enfermedad, y realiza una contracción marcador específico de las estimaciones del efecto [20]. Este enfoque permite hacer frente a la "pequeña
n
grande
p"
problema y evita sobreajuste. De los Campos et al [22] sugiere que este método como una alternativa interesante para realizar regresiones sobre los marcadores en virtud de un modelo aditivo. Se consideraron como asociada a BC los SNPs con una probabilidad posterior & gt; 0,8 de tener un mayor efecto (menor que) 0, como en [45]. Otros criterios, como la puntuación Bayesiano LOD & gt; 3,2 [46] o "heredabilidad del marcador" & gt; 0,5% [47], se han utilizado en las aplicaciones anteriores de BL. La elección de estos criterios es arbitraria porque no han sido comparados formalmente todavía. Por el contrario, el ABC-RF no asume ninguna modelo y considera todas las posibles interacciones entre las covariables incluidas en el análisis. Se proporciona una medida de la importancia de la variable, aunque no indica si el efecto de esta variable es de protección o de riesgo. También es importante hacer hincapié en que las variables seleccionadas con AUC-RF no están necesariamente asociados significativamente con el rasgo; más bien, ellos representan la combinación de genotipos que mejor predice el indicador de la enfermedad y por lo tanto digno de mayor investigación. Dimos prioridad a los SNPs seleccionados por ambos métodos, aunque SNPs seleccionados por sólo uno de ellos no debe ser descartada, dada la distinta naturaleza y los supuestos de cada enfoque. Otras fortalezas metodológicas del estudio son el gran tamaño de la muestra, las altas tasas de participación, y la alta calidad de la información sobre las exposiciones y genotipado del /Estudio EPICURO SBC.

Sin embargo, algunas limitaciones deben tenerse en cuenta al interpretar estos resultados. Es posible que los marcadores de susceptibilidad potencialmente informativos no fueron seleccionados para el genotipado. Además, el etiquetado incompleta de los genes seleccionados puede ser el resultado de la utilización de una versión anterior HapMap para seleccionar etiqueta SNPs. Por lo tanto, los genes con SNP sin resultados relevantes en este estudio no deben tomarse en consideración como potencialmente asociado con BC. En cuanto a las limitaciones de los enfoques utilizados, BTL solamente asume un modo aditivo de la herencia y se consideraron no hay interacciones. Un inconveniente común de los métodos basados ​​en el aprendizaje de máquina, tales como AUC-RF, es que se suelen identificar un conjunto de SNP que produce la más alta precisión de la clasificación, pero no necesariamente se corresponde con una fuerte asociación con la enfermedad. De hecho, los enfoques basados ​​en el aprendizaje de máquinas tienden a introducir falsos positivos, ya que la inclusión de muchos SNPs aumenta la precisión de clasificación [48].

La gran diferencia en las estimaciones de riesgo de acuerdo con BTL entre el total y el no fumador conjuntos de datos sugiere un posible efecto modificador del tabaco sobre el SNP-firma en BC riesgo. Si bien los resultados de poca potencia estadística no pueden ser descartadas, un gran fumador * evaluación de la interacción SNPs teniendo en cuenta todos los SNPs incluidos en el estudio se debe realizar. Este análisis requiere de una mayor innovación metodología y gran infraestructura computacional.

En conclusión, informamos aquí el efecto conjunto de varias variantes en los genes inflamatorios fuertemente asociados con el riesgo antes de Cristo. El uso de enfoques de evaluación multi-SNP para explorar la heredabilidad oculta de enfermedades complejas es muy prometedora en el campo de análisis de asociación. Si bien la aplicación de estos métodos a nivel de todo el genoma es sencillo, la gran demanda computacional representa la principal limitación y pocos estudios que se han aplicado a todo el genoma de datos en asociación [15] o la configuración de predicción [49] hasta el presente. El nuestro es uno de los primeros estudios que aplican tales metodologías a un gran conjunto de SNPs en la investigación del cáncer.

Materiales y Métodos

Ética declaración

Consentimiento informado, se obtiene a partir de la participantes en el estudio. El estudio fue aprobado por el Consejo Directivo del Instituto Nacional del Cáncer, los Comités de Ética de cada hospital participante, MD Anderson Cancer Center, y el Colegio Baylor de Medicina de Revisión Institucional.

Estudio de la población

la población que se considera en este análisis proviene del estudio EPICURO cáncer /español vejiga. Se trata de un estudio de casos y controles de base hospitalaria llevado a cabo en el período 1998-2001 en 18 hospitales en cinco zonas de España (Asturias, área metropolitana de Barcelona, ​​Vallès /Bages, Alicante y Tenerife), tal como se describe en otro lugar [50]. casos elegibles tenían entre 21-80 años y recién diagnosticados de un histológicamente confirmado carcinoma de células transicionales de la vejiga urinaria basado en el sistema de la OMS y la Sociedad Internacional de Patología Urológica [51] de 1998. 0,0001.

El conocimiento de la salud

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]