Extracto
La acumulación de pruebas indica que la microbiota intestinal afecta el desarrollo del cáncer colorrectal, pero los estudios anteriores han variado en la población, los métodos técnicos y asociaciones con cáncer. La comprensión de estas variaciones es necesaria para las comparaciones y para el potencial de puesta en común entre los estudios. Por lo tanto, se realizó la secuenciación de todo el genoma escopeta en muestras fecales de 52 pre-tratamiento de los casos de cáncer colorrectal y 52 controles emparejados de Washington, DC. Se compararon los resultados de un estudio publicado previamente 16S ARNr a la taxonomía metagenómica derivados dentro de la misma población. Además, los genes metagenome-predicho, módulos y vías en el Washington, DC casos y controles se compararon con los casos y controles reclutados en Francia cuyos individuos fueron procesados utilizando la misma plataforma. Las asociaciones entre la presencia de heces Fusobacterias,
Fusobacterium
, y
Porphyromonas
con cáncer colorrectal detectada por 16S rRNA fueron reproducidas por la metagenómica, mientras que la mayor abundancia relativa de clostridios en los casos de cáncer basado en 16S rRNA se meramente límite basado en la metagenómica. Esto demostró que en el mismo conjunto de muestras, la mayoría, pero no todas las asociaciones taxonómicas se observaron con ambos métodos. Teniendo en cuenta las asociaciones de cáncer significativas con la abundancia relativa de los genes, módulos y las vías en un conjunto de datos metagenómica francés publicado recientemente, asociaciones estadísticamente significativas en el Washington, se detectaron población CC para cuatro de los 10 genes, tres de los nueve módulos, y siete de 17 vías. En total, el estado del cáncer colorrectal en el estudio de Washington, DC se asoció con un 39% de los metagenome-predijo genes, módulos y vías identificadas en el estudio francés. Más comparaciones dentro y entre las poblaciones son necesarios para identificar las fuentes de las asociaciones de variación y las enfermedades que se pueden reproducir a pesar de estas variaciones. Los estudios futuros deben tener tamaños de las muestras o los datos de agrupación más grande en todos los estudios para tener poder suficiente para detectar las asociaciones que son reproducibles y significativa después de la corrección de múltiples ensayos
Visto:. Vogtmann E, Hua X, G Zeller, Sunagawa S, Voigt AY, Hercog R, et al. (2016) y el cáncer colorrectal microbioma intestinal humana: La reproducibilidad con todo el genoma escopeta secuenciación. PLoS ONE 11 (5): e0155362. doi: 10.1371 /journal.pone.0155362
Editor: John Parkinson, Hospital for Sick Children, Canada |
Recibido: 17 Noviembre 2015; Aceptado 27 de abril de 2016; Publicado: 12 May, el año 2016
Este es un artículo de acceso abierto, libre de todos los derechos de autor, y puede ser reproducido libremente, distribuir, transmitir, modificar, construir, o de otra forma utilizado por cualquier persona para cualquier propósito legal. El trabajo está disponible bajo la advocación de dominio público Creative Commons CC0
Disponibilidad de datos:. Los datos de secuenciación metagenómica escopeta está disponible en la base de datos europea Archivo de nucleótidos con el número de acceso PRJEB12449 (http://www.ebi.ac .uk /ENA /datos /view /PRJEB12449). Debido a las restricciones de privacidad, los metadatos completa puede ponerse a disposición de los investigadores calificados poniéndose en contacto con el Dr. Rashmi Sinha (
[email protected])
Financiación:. Este proyecto fue apoyado por el Programa de Investigación Intramural del Nacional del Cáncer Instituto. GZ, SS, AYV, RH, y PB recibió fondos a través del proyecto CancerBiome (Consejo Europeo de Investigación de referencia del proyecto 268985)
Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia
abreviaturas: índice de masa corporal, índice de masa corporal; CRC, cáncer colorrectal; DC Distrito, de Columbia; HMP, Proyecto del microbioma humano; motu, unidad taxonómica operativa Metagenomic; OTU, unidad taxonómica operativa; WGSS, Todo el genoma de escopeta secuenciación
Introducción
El microbioma humano es objeto de una creciente área de la investigación, ya que está probablemente relacionado con la salud humana y la enfermedad. Hay pruebas de que el microbioma juega un papel en el cáncer colorrectal desarrollo o la progresión (CRC), potencialmente a través de las vías inflamatorias o metabolitos microbianos cancerígenos [1], y asociaciones microbianas con CRC se han sugerido en un número de estudios [2-9] . Por ejemplo, con la secuenciación de próxima generación del gen universal de 16S bacteriano rRNA en el ADN extraído de las heces, nuestro grupo ha demostrado que, en comparación con los controles de la misma, los casos de CCR tienen una menor diversidad de la comunidad, bajan ligeramente la abundancia relativa de clostridios, y una mayor presencia de
Fusobacterium
y
Porphyromonas
[2]. Del microbioma anterior y los estudios de CRC, algunos utilizados 16S rRNA secuenciación de genes [2, 4, 5, 7, 9], mientras que otros utilizan todo el genoma de escopeta secuenciación metagenómica /escopeta (WGSS; [3, 6, 8]). WGSS produce no sólo los perfiles de composición bacteriana y la diversidad, pero también estima el potencial funcional del microbioma [10].
Se realizó escopeta secuenciación metagenómica de muestras fecales de un estudio de casos y controles CRC llevada a cabo en la década de 1980 en Washington, DC, que se analizaron previamente por secuenciación de genes 16S rRNA [2]. Sometiendo las mismas muestras a un método de secuenciación diferentes, hemos sido capaces de comparar las asociaciones 16S rRNA previamente observados con los datos de secuenciación metagenómica escopeta. Además, mediante el uso de esta tecnología, hemos sido capaces de investigar la asociación microbiana a nivel de genes con CCR que no era posible en los datos de secuenciación del gen 16S rRNA, y se compararon las asociaciones a nivel de genes con los detectados en un estudio caso-control francés anterior estudio que aplica la tubería misma extracción de ADN metagenómica y la plataforma de secuenciación y bioinformática [8].
Materiales y Métodos
primaria población de estudio
las muestras de heces se recogieron en un CRC estudio de casos y de control que se ha descrito previamente en detalle [11] y la descripción del análisis de la respectiva estudio secuenciación de genes 16S rRNA se publicó anteriormente [2]. En pocas palabras, los casos de CCR y controles emparejados que estaban esperando una cirugía para condiciones no oncológicas y no gastrointestinales fueron reclutados desde 1985 hasta 1987 en Washington DC, Estados Unidos. Antes de la cirugía u otro tratamiento, los participantes recogieron todas las heces durante un período de dos días y los guardaron en hielo seco. En el laboratorio, las muestras fueron secadas por congelación, se agruparon, y se almacenan de forma continua a partir de entonces a -40 ° C. Para el estudio actual metagenomic escopeta, se seleccionaron muestras de 52 casos y 52 controles (población WGSS DC). Los casos y controles fueron agrupados por sexo e índice de masa corporal (IMC; & lt; 20 kg /m
2 o ≥ 20 kg /m
2). Asociaciones en el análisis WGSS DC se compararon con los de la anterior 16S rRNA estudio secuenciación de genes (16S población DC), que incluyó 47 casos de CCR y 94 sujetos de control del mismo estudio los padres. Todos los 47 casos de CCR de 16S DC se incluyeron en el WGSS DC y los 52 controles en WGSS DC se incluyeron en los 94 controles de 16S DC. Los participantes proporcionaron
Población La validación independiente
Se incluyeron los datos de un estudio publicado anteriormente (población F consentimiento informado por escrito y este estudio fue aprobado por la Oficina de Sujetos Humanos de Investigación de los Institutos Nacionales de Salud. ) como un conjunto de validación independiente [8]. En resumen, los casos de CCR y controles elegidos al azar fueron reclutados desde 2004 hasta 2006 en París, Francia. Con anterioridad a la colonoscopia, se recogió una muestra de materia fecal fresca y congelada a -20 ° C dentro de las cuatro horas de la extracción. Población F incluyó 53 casos de CCR, 15 casos adenoma grandes y pequeños 27 casos de adenoma, y 61 controles normales. Dado que los controles de Washington DC pueden tener también incluye pequeñas adenomas no diagnosticados, el caso de control de comparación fijar de población F incluyó 53 casos de CCR y 88 controles (es decir, 27 pequeños adenomas y 61 controles normales) y excluidos los datos de los 15 adenomas grandes .
también incluimos a disposición del público de escopeta metagenomic datos de 292 participantes METAHIT [12, 13] y 94 del Proyecto del microbioma humano (HMP) Fase I participantes [14] para la comparación de la diversidad global, riqueza y uniformidad con nuestra muestras.
extracción de ADN y secuenciación de todo el genoma escopeta
se descongelaron las muestras de heces liofilizadas de WGSS DC, se resuspendieron en solución salina tamponada con fosfato, y una alícuota fue enviado a la Genómica instalación, Laboratorio Europeo de Biología Molecular en Heidelberg, Alemania en hielo seco. Los métodos para la extracción de ADN, la preparación de la biblioteca, y la secuenciación shotgun de todo el genoma se han descrito en detalle [8] y fueron los mismos para la población WGSS DC y la población F. En resumen, el ADN se extrajo de las muestras fecales utilizando el aislamiento de ADN GNOME Kit (MP Biomedicals) con modificaciones menores. escopeta secuenciación de todo el genoma del ADN extraído se llevó a cabo utilizando el Illumina HiSeq 2000/2500 (Illumina, San Diego, EE.UU.). Las muestras fueron secuenciados con una longitud de 100 pb de lectura para las secuencias de gama emparejado en el Centro de Genómica, Laboratorio Europeo de Biología Molecular, Heidelberg, Alemania, con una profundidad de secuenciación selectiva de 5 GBP.
Bioinformática
la estrategia general para el tratamiento bioinformático de los datos de secuenciación de todo el genoma se ha descrito anteriormente en detalle [8] y fue el mismo para ambos WGSS DC y población perfiles de abundancia taxonómicas F. resumen en el NCBI categoría taxonómica que van desde especies de phylum y unidades taxonómicas operacionales metagenomic (motu) [15, 16] fueron creados usando MOCAT [17]. MOCAT también se utilizó para anotar funcionalmente los genes extraídos de los conjuntos de metagenómica a la base de datos KEGG (versión 62) [18]. índices ecológicos diversidad (Shannon, riqueza de especies, y la uniformidad de la comunidad) se calcularon sobre la base de motu abundancias relativas y muestrean a 2000 inserciones utilizando el paquete de software de R vegana [19]. Un participante de la población WGSS DC y cuatro participantes de la población F fueron excluidos debido a la cobertura de lectura inferior.
El análisis estadístico
Se comparó la diversidad de Shannon, riqueza y uniformidad de la población WGSS DC, la población F , muestras MetaHIT, y HMP Fase I y probados diferencias de casos y controles en la población WGSS DC y la población F utilizando el test de Kruskal Wallis. Entonces, tanto para la población de estudio primaria (población WGSS DC: 52 casos frente a 52 controles) y la población independiente de validación (población F: 53 casos frente a 88 controles), la prueba de las asociaciones entre el estado del caso /control y tanto la abundancia relativa y la presencia /ausencia de los diferentes niveles taxonómicos y categorías de genes (es decir, genes, módulos y vías). Un modelo de regresión logística con ajuste por edad, sexo e índice de masa corporal (IMC) fue utilizado y los valores de p se calcularon en base a la prueba de Wald (S1 Tabla). Tres casos de CCR de la población WGSS DC faltaban los datos de IMC por lo incluimos estos valores utilizando medios específicos del sexo de los casos de CCR. Para la comparación con el estudio 16S DC, también se calculó un modelo de regresión logística ajustados para una prueba de chi-cuadrado de dos caras Wald y una prueba no paramétrica de Wilcoxon de dos lados de la presencia /ausencia y abundancia relativa de taxones específicos, respectivamente. Hemos generado gráficos QQ del log (valor de p observado) frente al log (valores de p menores de una distribución normal) dentro WGSS DC y la población F para todos los niveles taxonómicos y categorías de genes para determinar asociaciones potencialmente estadísticamente significativas después de la corrección para comparaciones múltiples. Para los datos de categoría de genes en la población F, se utilizó la corrección de Bonferroni del valor p para determinar la significación estadística (es decir, p & lt; 0,05 /número de pruebas) y se consideró un valor de p & lt; 0,05 lleguen a ser competentes para los análisis de reproducibilidad en WGSS DC. Todos los análisis estadísticos se realizaron utilizando R (versión 3.0.0).
Resultados
Características de los 52 casos de CCR y 52 controles de población WGSS DC se presentan en la Tabla 1. Ellos fueron bien adaptado por sexo y el IMC. Sin embargo, los casos de CCR tuvieron una mayor proporción de los negros no hispanos (23,1% de los casos y el 5,8% en los controles), el nivel de educación más bajo (15,4% de los casos y el 3,8% de los controles tenían una educación inferior a la escuela secundaria), y más actual los fumadores (13,5% de los casos y el 3,8% de los controles). Dentro de los casos de CCR, el 28,8% de los casos tenían cáncer en el colon derecho y el 34,6% tenía cáncer en el colon izquierdo. La mayoría de los CCR eran invasores sin metástasis conocidos (40,4%), pero el 34,6% eran metastásico.
asociaciones de cáncer colorrectal en el WGSS DC frente 16S DC
En las anteriores 16S análisis de secuenciación de genes rRNA en esta población (16S DC), la presencia de 4 taxa y la abundancia relativa de 3 taxones se asociaron significativamente con el estado del caso CRC con valores de p de tasas ajustadas por falso descubrimiento de menos de 0,05. Como se ve en la Tabla 2, que reproduce una asociación significativa entre la presencia de los filos Fusobacterias y el estado del caso CRC (p = 0,003), específicamente que el 76,9% de los casos y el 48,1% de los controles tenían detectable Fusobacterias. Esto reproduce la asociación de Fusobacterias con el estado del caso en el análisis de 16S DC; aunque la detección fue menor (36,2% de los casos y 16,0% de los controles, la Tabla 2). En comparación con el 16S DC, el WGSS también tuvo mayor tasa de detección prevalente para otros taxones, y se reproduce una asociación significativa entre la presencia de
Fusobacterium gratis (p = 0,006) y
Porphyromonas gratis (p = 0,032) con la condición de caso CRC. La asociación entre
Atopobium
y CRC de la 16S DC no se reproduce en el WGSS (Tabla 2). Como se ve en la Tabla 3, que no se reproducían las asociaciones entre la abundancia relativa de taxones específicos y el estado del caso CRC, aunque la asociación entre la abundancia relativa de clostridios tendió a ser menor en los casos (p = 0,092). En particular, la abundancia relativa de Clostridia estimado en el WGSS fue dos veces menor para ambos casos y controles en comparación con que en el estudio 16S DC. En la población WGSS DC, la clase con una mayor abundancia relativa fue Bacteroidia, que tenía una abundancia relativa de 53,2% en los casos y 50,9% en los controles (Tabla S1).
asociaciones de cáncer colorrectal en el WGSS DC frente población F
en la población WGSS DC, no hubo diferencias significativas entre los casos de CCR y controles para la diversidad de Shannon, la riqueza, o en la regularidad basado en Motus, aunque en general los controles tenían ligeramente más alta diversidad alfa en comparación con los casos (Fig 1). diversidad de Shannon, riqueza y uniformidad fueron similares para la población WGSS DC, la población F, y las muestras METAHIT, mientras que las muestras de HMP tendían a tener un poco menor diversidad de Shannon, riqueza y uniformidad.
Las diferencias estadísticas entre el cáncer colorrectal casos y controles fueron probados mediante la prueba de Kruskal-Wallis.
estado de los casos de CCR en la población F [8] está fuertemente asociada a la abundancia relativa de muchos genes metagenome derivados de KEGG, módulos y las vías ( como se ve por la fuerte desviación de la línea 45 ° grado en la figura 2), pero esto no se observó en la población WGSS DC. Por la presencia de genes KEGG, módulos y vías, había poca evidencia de cualquier asociación con el estado del caso CRC, ya sea en la población de estudio (figura 2). Dado que se detectaron asociaciones para la abundancia relativa de los datos a nivel de genes solamente en la población F, hemos intentado reproducir una asociación estadísticamente significativa después de la corrección de Bonferroni de la población F con los datos WGSS DC sin corrección para comparaciones múltiples.
a diferencia de la evaluación global (Fig 2), cuando se considera las asociaciones significativas entre la abundancia relativa de genes KEGG (p & lt; 0,05 /8028), los módulos (p & lt; 0,05 /485), y las vías (p & lt ; 0,05 /318) dentro de la población F, se reprodujeron las asociaciones de cáncer (p & lt; 0,05) en el WGSS DC para cuatro de los 10 genes: aminometiltransferasa (K00605), triptofanasa (K01667), péptido metionina sulfóxido reductasa msrA /MSRB (K12267) y proteína de la membrana putativa (K01421) (Tabla 4). Del mismo modo, la WGSS DC reproducida asociaciones de cáncer para tres de nueve módulos: leucina degradación, leucina = & gt; acetoacetato + acetil-CoA (M00036), citrato de ciclo, la oxidación segundo carbono, 2-oxoglutarato = & gt; oxaloacetato (M00011), y metionina biosíntesis, actividad, creencia abandon = & gt; homoserina = & gt; metionina (M00017) (Tabla 5). Fuera de los 17 asociaciones vía estadísticamente significativas en la población F, la WGSS DC reproducida asociaciones con siete vías: ciclo de citrato (ko00020), el metabolismo del ácido lipoico (ko00785), valina, leucina, y la degradación de isoleucina (ko00280), esclerosis lateral amiotrófica (ko05014 ), la biosíntesis de lisina (ko00300), la degradación de geraniol (ko00281), y el metabolismo del nitrógeno (ko00910) (Tabla 6). No hay asociaciones significativas adicionales con CCR fueron encontrados en el WGSS DC
Discusión
Este estudio tiene dos objetivos principales:. 1) para comparar los 16S previamente observados rRNA genes asociaciones con datos de todo el genoma escopeta secuenciación metagenómica; y 2) investigar la asociación microbiana a nivel de genes con CCR en diferentes poblaciones. Para el primer objetivo, el enfoque de la metagenómica reproduce algunas de las asociaciones observadas anteriormente en el análisis del gen 16S rRNA, más notablemente mayor probabilidad de detectar los taxones en el filo Fusobacterias y
Fusobacterium
género entre los casos de CCR. Una gran diferencia entre los dos estudios fue la sensibilidad para la detección de taxones. Por ejemplo, se detectó la phyla Fusobacteria en 36.2% de los casos y 16,0% de los controles en el estudio de genes 16S rRNA, pero utilizando metagenómica escopeta de todo el genoma, Fusobacteria se detectó en el 76,9% de los casos y 48,1% de los controles . No está claro lo que puede hacer que las diferencias entre los resultados de 16S rRNA y WGSS, pero puede ser debido a la gen de la región 16S rRNA variable de secuenciado, la profundidad de la secuenciación, la asignación bioinformático de taxonomía, o diferencias técnicas. Estas variaciones en la detección de la presencia y abundancia relativa de taxones demuestran una importante diferencia al comparar la secuenciación del 16S rRNA de todo el genoma escopeta estudios de metagenómica y debe ser estudiada con más detalle en el futuro.
Para nuestro segundo objetivo, la WGSS DC hizo reproducir algunos de los específicos, estadísticamente significativas genes, módulos y vías detectados en la población F, con la condición de caso CRC [8]. Dos módulos relacionados con las vías y se identificaron en los modelos independientes: M00011 (ciclo de citrato, la oxidación segundo carbono, 2-oxoglutarato = & gt; oxalacetato) y ko00020 (citrato de ciclo /ciclo de Krebs); y M00036 (degradación leucina, leucina = & gt; acetoacetato + acetil-CoA) y ko00280 (valina, leucina, isoleucina y la degradación). Es posible que estas, y otras capacidades funcionales están relacionados con CRC, pero se necesitan más estudios. diversidad de Shannon, riqueza y uniformidad basado en la metagenómica escopeta de todo el genoma no se asociaron con el estado del caso CRC en el WGSS DC, pero estas estimaciones fueron similares a los de la población y MetaHIT F.
Nuestra reproducibilidad de significación estadística asociaciones de un estudio anterior [8] proporciona información importante sobre los datos futura puesta en común, dadas las grandes diferencias entre estos dos conjuntos de datos. Nuestras muestras se recogieron en los años 1980 en los Estados Unidos, mientras que las muestras de población F se recogieron en la década de 2000 en Francia. Existe alguna evidencia de que el almacenamiento de las muestras fecales a bajas temperaturas mantiene la estructura de la comunidad microbiana [20, 21], sin embargo, a nuestro entender, esto no ha sido probado para las muestras almacenadas durante casi 30 años. Y teniendo en cuenta el trabajo previo que sugiere que las asociaciones microbianas con diabetes tipo 2 pueden variar según la población [22, 23], aunque estas diferencias pueden ser impulsadas por la metformina utiliza [24], es alentador que algunas de las asociaciones eran robustas entre las poblaciones en el Estados Unidos y Francia de diferentes años. Además, las muestras fecales en nuestro estudio se recogieron antes de la hospitalización y tratamiento de todos los movimientos intestinales en el transcurso de dos días y después se secaron por congelación. Esto contrasta con los métodos para la población F, donde las muestras se recogieron 2 semanas a 3 días antes de la colonoscopia, pero siempre antes de la limpieza intestinal, y eran una parte alícuota de un movimiento de intestino que se congeló el plazo de cuatro horas. La liofilización de las muestras fecales se ha encontrado para afectar potencialmente a las abundancias relativas de los distintos grupos taxonómicos de las muestras de heces infantiles [25], por lo que es tranquilizador para replicar algunos resultados entre los diferentes métodos de almacenamiento. Además, las muestras WGSS parecía tener medidas de diversidad similares en comparación con otro estudio metagenomic escopeta, MetaHIT, que también incluyó una población y colecciones diferentes. Como se ha visto en estudios de asociación del genoma humano, se necesitan grandes tamaños de muestra para detectar asociaciones que sobreviven a la corrección de múltiples ensayos. Con estas diferencias en el período de tiempo de la recolección, la población y la recogida de muestras, las similitudes en las asociaciones entre microbianas datos taxonómicos y de nivel de genes con el estado del caso CRC proporciona cierto apoyo a la puesta en común de datos a través de estudios heterogéneos. El trabajo adicional se ha realizado para evaluar los métodos de recolección ideales para las futuras recogidas fecales [26-30] y el efecto de los procedimientos de manipulación y procesamiento de laboratorio bioinformático de los datos [31] que pueden proporcionar información adicional para la puesta en común de datos de bajada o meta-análisis.
Otros estudios anteriores han investigado las asociaciones entre el microbioma fecal y CRC [32]. Al igual que en nuestros hallazgos, varios estudios no detectó una diferencia global entre los casos y los controles de CRC para las medidas de la diversidad de la comunidad [4, 5, 9]. Sin embargo, un estudio observó que los casos de CCR habían aumentado gen y riqueza género comparación con los controles [3], mientras que otro estudio detectó reduce riqueza gen y la diversidad de genes alfa en los casos de CCR en comparación con los controles, aunque la asociación no fue estadísticamente significativa después del ajuste para fecal recogida de muestras después de la colonoscopia [6]. De acuerdo con nuestros resultados, la mayoría de los estudios anteriores encontraron que los casos de CCR eran más propensos a tener niveles detectables o más altos de
Fusobacterium
en comparación con los controles [3, 5-7, 9], mientras que sólo algunos estudios detectaron niveles más altos o la detección de
Porphyromonas
en los casos de CCR en comparación con los controles [3, 5, 7]. En un estudio de todo el genoma metagenomic escopeta anterior, el módulo y M00036 KEGG vías ko00280 y ko00910 se encontraron para ser enriquecido significativamente en los casos de CCR en comparación con los controles [6] similar a lo que fue detectado en este estudio. En el otro estudio anterior metagenómica de todo el genoma escopeta, nuestros hallazgos para KEGG vías ko00020, ko00280, ko00281, ko00300, ko00785 fueron confirmados, pero una asociación para KEGG vía ko00910 estaba en la dirección opuesta a lo que hemos observado [3]. En resumen, hemos confirmado algunas asociaciones observadas en la investigación anterior, pero todos los estudios anteriores (16S y secuenciación de todo el genoma escopeta) tenía baja potencia. Por otra parte, estos estudios anteriores no han sido capaces de ajustar adecuadamente los factores de confusión potenciales, lo que podría explicar parte de la variabilidad entre los estudios. Debido a las múltiples comparaciones en los análisis microbioma, la puesta en común de datos será crucial para superar la limitada potencia en estos análisis.
El estudio actual no está exento de limitaciones. En primer lugar, todas las muestras fecales se recogieron en sección transversal, por lo que no es posible determinar si los cambios microbianos ocurrieron antes del desarrollo de cáncer o si se debían al desarrollo del cáncer. Además, este estudio tuvo un relativamente pequeño tamaño de la muestra y, por tanto, que tuvieron el poder suficiente para detectar muchas asociaciones estadísticamente significativas después de la corrección de múltiples ensayos. Por último, nuestros controles sanos fueron hospitalario controles de espera de cirugía electiva basan y pueden no representar a la población en general en ese momento. Sin embargo, nuestro estudio también tiene sus puntos fuertes. Hemos sido capaces de aprovechar los recursos existentes de muestras que fueron recogidas hace más de 30 años y para reproducir las asociaciones con el CRC de un estudio actual. Nuestra muestra fecal era una colección de dos días que puede ser más representativa de la microbiota intestinal típica. También hemos sido capaces de utilizar otras fuentes de datos existentes para la comparación.
En este estudio, hemos sido capaces de utilizar todo el genoma escopeta secuenciación metagenómica para reproducir una serie de hallazgos significativos en la misma población que se evaluó a través de 16S rRNA secuenciación de genes [2]. El estudio actual también reproduce algunas asociaciones significativas a nivel de genes con CCR a partir de un estudio de metagenómica de todo el genoma escopeta previo de los pacientes en Francia [8]. Los estudios futuros puesta en común de datos a través del tiempo, la población, y el método de recogida de muestras le ayudará a superar algunos de los problemas de energía estadísticos enfrentan los estudios epidemiológicos de la microbiota y será clave para la identificación de asociaciones importantes que pueden estar implicados en la detección o prevención del CCR. Además, ya que todos los estudios actuales son de sección transversal, es imperativo que los estudios de cohorte prospectivos incluyen una colección de muestras de heces con el fin de estudiar el efecto de la microbiota intestinal humana en los resultados adversos para la salud, como el CRC.
Apoyo información sobre Table S1. la abundancia relativa media o la detección de las tareas taxonómicas (es decir, filo, clase, orden, familia, género, especie, específicos, motu) y las categorías de genes (es decir, genes, módulo, y la vía) para la población WGSS DC y la población F.
Cada ficha representa un nivel taxonómico o cesión de genes específicos. La abundancia relativa media o la media de detección (presencia /ausencia) se presenta en los casos y controles, y se proporciona el valor p de una prueba de Wald de ajustar por edad, sexo e índice de masa corporal (IMC)
doi:. 10.1371 /revista .pone.0155362.s001 gratis (XLS)
Reconocimientos
Este proyecto fue apoyado por el Programa de Investigación Intramural del Instituto Nacional del cáncer. Una parte del análisis de datos estaba llevando a cabo utilizando los recursos computacionales de los Institutos Nacionales de Salud de clúster HPC Biolobo (http://hpc.nih.gov). GZ, SS, AYV, RH, y PB recibió fondos a través del proyecto CancerBiome (Consejo Europeo de Investigación de referencia del proyecto 268985).