When should I choose shotgun metagenomics over 16S amplicon sequencing?

Choose shotgun metagenomics when you need species- or strain-level identification, when you need to know the functional capacity of the community, or when you need to capture fungi, viruses, and other non-bacterial microbes alongside bacteria.

What is shallow shotgun metagenomics, and how does it compare to 16S?

Shallow shotgun metagenomics generates 0.5 to 1 gigabase per sample — enough for species-level taxonomic profiling and detection of abundant functional genes. It costs more than 16S but less than standard shotgun, providing species-level resolution that 16S does not.

Can shotgun metagenomics replace culturing?

No. Metagenomics tells you what genes are present but not which microbes are viable or metabolically active. Metagenomics and culturing are complementary. Metagenomics can identify targets for isolation; culturing can validate functional predictions from metagenomic data.

How much does host DNA matter in clinical samples?

It matters enormously. Tissue biopsies, skin swabs, and saliva can contain over 90% human DNA. Without host depletion, most reads map to the human genome rather than the microbiome, dramatically reducing effective microbial sequencing depth.

How many samples do I need for a metagenomics study?

For case-control gut microbiome studies, 30 to 50 subjects per group is a practical minimum. For longitudinal studies where each subject serves as their own control, smaller numbers are feasible. For environmental surveys, even a few well-chosen samples can provide valuable data.

What kind of bioinformatic support will I need?

For sequencing-only, you need a bioinformatician comfortable with Linux, scripting, and server/cloud resources. For full-service, CD Genomics handles the entire computational workflow and delivers analyzed results — no command line required.

What is the turnaround time for a typical metagenomics project?

For 50 to 100 samples, expect 4 to 6 weeks for library preparation and sequencing, plus 2 to 4 weeks for full bioinformatic analysis. Expedited timelines are available for time-sensitive projects.

Can I integrate metagenomics with other omics data?

Yes. Metagenomics is frequently combined with metabolomics to link microbial gene content to metabolite profiles, or with metatranscriptomics to distinguish actively expressed genes. CD Genomics offers multi-omics integration services.

Services de séquençage métagénomique pour la recherche sur le microbiome à l'échelle clinique : métagénomique par shotgun, viromique et analyse des communautés microbiennes.

Une équipe de recherche menant un essai d'intervention diététique avec 200 participants collecte des échantillons de selles à quatre moments différents. Ils souhaitent savoir non seulement quelles bactéries sont présentes, mais aussi ce que ces bactéries font — quels chemins métaboliques elles portent, si elles abritent des gènes de résistance aux antibiotiques, et comment l'écosystème microbien évolue en réponse à l'alimentation. Un autre groupe, qui suit une épidémie de maladie respiratoire inexpliquée dans un hôpital, doit identifier chaque pathogène potentiel — bactérien, viral et fongique — dans des échantillons de lavage bronchoalvéolaire, sans savoir à l'avance ce qu'ils recherchent. Une troisième équipe surveille les communautés microbiennes des eaux souterraines près d'un ancien site industriel, à la recherche de changements qui signalent des progrès en bioremédiation.

Ces trois projets ont un point commun : ils ont besoin de plus qu'une liste de genres bactériens. Ils ont besoin du contenu génomique complet de chaque microbe dans leurs échantillons. C'est ce que la séquençage métagénomique par shotgun fournit.

Contrairement au séquençage d'amplicons 16S rRNA, qui lit un seul gène marqueur pour identifier les bactéries présentes, la métagénomique par shotgun fragmente et séquence tout l'ADN d'un échantillon — bactérien, archéen, fongique, viral et même d'origine hôte. Le résultat n'est pas seulement un recensement de qui est là, mais un catalogue de ce que la communauté est génétiquement capable de faire. CD Genomics propose Services de séquençage métagénomique couvrant l'ensemble du spectre — des études de cohorte à faible coût avec des techniques de tir à la carabine aux métagénomiques profondes avec des génomes assemblés à partir de métagénomes, et de la viromique ADN à l'analyse multi-omique intégrée.

Ce guide couvre quand la métagénomique par shotgun est l'outil approprié, comment concevoir un projet qui répond à votre question sans gaspiller de budget, et à quoi s'attendre de la soumission d'échantillons jusqu'à la livraison bioinformatique.

Figure 1: Comparison of 16S amplicon sequencing versus shotgun metagenomics, highlighting differences in taxonomic resolution (genus vs.
species/strain), functional profiling capability, and coverage of non-bacterial microbes including fungi and viruses.

Au-delà du 16S — Ce que le métagénomique par shotgun déverrouille

Le gène 16S rRNA est la base de l'écologie microbienne depuis des décennies. Il est peu coûteux, les bases de données sont matures et le flux de travail est simple. Mais le 16S a des limites strictes. Il vous indique quelles bactéries sont présentes, généralement au niveau du genre. Il ne vous dit rien sur ce que ces bactéries peuvent faire. Il omet complètement les champignons, les virus et les protozoaires. Et il est aveugle aux éléments génétiques mobiles — plasmides, intégrons, transposons — qui propagent la résistance aux antibiotiques entre les espèces.

La métagénomique shotgun supprime ces limites en séquençant tout. Fragmenter tout l'ADN d'un échantillon et séquencer les morceaux sans cibler un gène spécifique signifie que vous capturez chaque génome présent. Le retour sur investissement se présente sous trois formes.

D'abord, résolution taxonomique au niveau des espèces et des souches. Parce que les lectures en mode shotgun sont réparties sur l'ensemble des génomes plutôt que sur un seul gène, vous pouvez distinguer Escherichia coli d'Escherichia albertii, ou suivre un ribotype spécifique de Clostridioides difficile à travers un service hospitalier. Pour la recherche clinique, le suivi au niveau des souches est important : il permet de distinguer un commensal inoffensif d'une souche toxigène portant les gènes tcdA et tcdB.

Deuxièmement, profilage fonctionnel direct. Au lieu de prédire les voies métaboliques à partir des données 16S en utilisant des outils comme PICRUSt2 — qui infèrent la fonction en consultant ce que des parents proches sont connus pour faire — la métagénomique par shotgun lit les gènes réels. Vous obtenez les voies KEGG présentes dans votre échantillon, les enzymes actives sur les glucides (CAZy), les gènes de résistance aux antibiotiques (CARD, ResFinder) et les facteurs de virulence. Vous pouvez voir si une communauté intestinale est enrichie en gènes de synthèse de butyrate ou si un échantillon de sol contient de nouvelles bêta-lactamases. Ce n'est pas une prédiction. C'est une mesure (1, 7).

Troisièmement, couverture dans tous les domaines de la vie. Une bibliothèque de séquençage shotgun unique capture simultanément des bactéries, des archées, des champignons, des virus à ADN et des eucaryotes microbiens. Pour les échantillons où la fraction fongique ou virale est importante — études sur le mycobiome intestinal, écologie des phages, réseaux trophiques des sols agricoles — le séquençage 16S à lui seul laisse de côté la plupart de la biologie.

Le compromis est le coût. La métagénomique par shotgun coûte environ deux à quatre fois plus par échantillon que le séquençage d'amplicons 16S, car il faut des millions de lectures par échantillon plutôt que des dizaines de milliers. Mais l'écart de coût se réduit. La métagénomique par shotgun peu profonde, qui génère environ un demi-gigabase de données par échantillon — soit environ trois millions de paires de lectures — fournit désormais une résolution taxonomique au niveau des espèces et un profilage fonctionnel de base à un coût approchant celui du 16S. Pour les études de cohorte où les données 16S au niveau du genre sont insuffisantes mais que le shotgun profond est trop coûteux pour des centaines d'échantillons, le shotgun peu profond est le terrain d'entente émergent.

CD Genomics Séquençage d'amplification 16S/18S/ITS Le service offre une approche ciblée pour les projets où le profilage bactérien au niveau du genre répond aux besoins de recherche, tandis que nos services de métagénomique par shotgun ajoutent la dimension fonctionnelle et multi-royale lorsque la question de recherche l'exige.

Métagénomique par shotgun pour la recherche sur le microbiome intestinal

L'intestin humain abrite l'écosystème microbien le plus intensément étudié sur Terre. La métagénomique par shotgun a transformé la recherche sur le microbiome intestinal d'un exercice de catalogage — "qu'est-ce qui vit dans l'intestin ?" — en une science mécaniste qui pose la question : "que produisent ces microbes et comment cela affecte-t-il l'hôte ?"

Ce que les données Shotgun apportent aux études sur le microbiome

Une enquête 16S sur des échantillons de selles d'une cohorte de patients atteints de maladies inflammatoires de l'intestin révélera que Faecalibacterium est appauvri chez les patients atteints de la maladie de Crohn. C'est utile. Une analyse métagénomique par shotgun des mêmes échantillons indiquera que les souches de Faecalibacterium perdues portent les gènes de synthèse du butyrate via la voie de l'acétyl-CoA, que l'appauvrissement est corrélé à une réduction du butyrate fécal mesuré par métabolomique, et que les Faecalibacterium restants chez les patients sont une souche différente de celle des témoins sains — une souche avec une mutation dans un gène clé de la kinase du butyrate. C'est exploitable (3, 4).

Cette résolution fonctionnelle est importante pour les études d'intervention. Lorsqu'un probiotique, un prébiotique ou une intervention diététique modifie la communauté intestinale, la métagénomique shotgun capture le changement dans deux dimensions simultanément : quelles espèces changent en abondance et quels chemins métaboliques sont gagnés ou perdus. Pour les essais de supplémentation en fibres alimentaires, vous pouvez mesurer directement si les gènes de dégradation des glucides complexes — les familles CAZy qui décomposent l'arabinoxylane ou l'amidon résistant — augmentent en abondance. Pour les études de transplantation de microbiote fécal, vous pouvez suivre si les souches de donneurs s'implantent et si la capacité fonctionnelle du microbiome du receveur converge vers celle du donneur.

CD Genomics fournit Services de séquençage métagénomique pour des études sur le microbiome intestinal à des échelles allant d'expériences pilotes de 20 sujets à des cohortes cliniques de 500 sujets, avec des pipelines bioinformatiques standardisés qui fournissent des profils taxonomiques, des annotations fonctionnelles et un suivi au niveau des souches à partir d'échantillons de selles, de biopsies et de lavages.

Conception d'étude efficace

L'erreur la plus courante en métagénomique intestinale est le manque de puissance. La variation interindividuelle de la composition du microbiome intestinal est énorme : deux personnes en bonne santé peuvent différer autant dans leurs profils microbiens qu'une personne en bonne santé et une personne malade. Une étude avec dix sujets par groupe est peu susceptible de trouver quoi que ce soit, sauf les effets les plus importants. Trente à cinquante sujets par groupe est un minimum plus réaliste pour une comparaison cas-témoin. Pour les études longitudinales où chaque sujet sert de contrôle à lui-même — avant et après l'intervention — des nombres plus petits sont réalisables car la variation entre les sujets est éliminée.

Une deuxième considération de conception est l'ADN hôte. Les échantillons de selles sont indulgents : généralement moins d'un pour cent des lectures correspondent au génome humain. Mais les échantillons de biopsie, les grattages muqueux et les tissus peuvent contenir plus de quatre-vingt-dix pour cent d'ADN hôte. Sans déplétion de l'hôte avant le séquençage, la majeure partie de votre budget de données est consacrée à la lecture du génome humain, et non du microbiome. Les options incluent la lyse différentielle des cellules humaines avant l'extraction de l'ADN, ou des kits commerciaux de déplétion de l'hôte qui méthylent ou clivent sélectivement l'ADN humain. Pour les échantillons de biopsie à faible biomasse microbienne, CD Genomics peut intégrer la déplétion de l'ADN hôte dans le flux de travail standard de préparation des échantillons.

Figure 2: Step-by-step workflow diagram showing the shotgun metagenomics pipeline from sample collection, DNA extraction and library
preparation through sequencing to bioinformatic analysis and final data interpretation.

Figure 3: Illustration showing how a clinical cohort study progresses from patient sample collection through shotgun metagenomic sequencing
to functional insights: taxonomic composition, metabolic pathway abundance, and strain-level tracking of gut microbes.

Pour une exploration plus approfondie de la conception et de l'analyse des études sur le microbiome intestinal, consultez notre guide compagnon sur la métagénomique par shotgun pour les études sur le microbiome intestinal.

Métagénomique environnementale — Lire le système d'exploitation microbien de la Terre

Un seul gramme de sol agricole contient plus d'espèces microbiennes qu'il n'y a d'espèces de poissons dans l'océan — et la grande majorité n'a jamais été cultivée. La métagénomique environnementale est le seul moyen d'accéder à cette diversité, mais elle présente des défis que les échantillons de microbiome clinique ne posent pas : des acides humiques qui co-extraient avec l'ADN et inhibent les enzymes de séquençage, de l'ADN dégradé dû à l'exposition environnementale, et une poignée de taxons abondants qui peuvent dominer la production de séquençage et masquer les membres rares de la communauté. Mais les récompenses sont proportionnellement grandes : les métagénomes environnementaux sont la source de la plupart des antibiotiques connus, le moteur des cycles de nutriments mondiaux, et un système d'alerte précoce pour le stress des écosystèmes.

Ce que révèle la métagénomique environnementale

Un gramme de sol agricole produit généralement entre dix et cinquante millions de lectures de shotgun après filtrage de qualité. À partir de ces lectures, vous pouvez reconstruire la capacité de cycle de l'azote de la communauté — l'abondance relative des gènes de fixation de l'azote, de nitrification, de dénitrification et d'anammox. Vous pouvez évaluer si une communauté possède le potentiel génétique pour dégrader des polluants spécifiques — hydrocarbures pétroliers, solvants chlorés, pesticides. Et vous pouvez découvrir de la nouveauté : la métagénomique environnementale est la principale source de nouvelles enzymes, de nouveaux clusters de gènes biosynthétiques et de nouveaux phylums microbiens. Rien qu'en 2025, les génomes assemblés à partir de métagénomes d'échantillons environnementaux ont élargi l'arbre de vie bactérien connu de plusieurs phylums candidats qui n'ont jamais été cultivés.

Pour la surveillance environnementale, la métagénomique par shotgun détecte des changements de communauté que le 16S ne saisit pas. Une enquête 16S pourrait montrer que l'abondance relative des Proteobacteria a augmenté sur un site contaminé. Une analyse métagénomique des mêmes échantillons montrerait que cette augmentation est entraînée par des Betaproteobacteria spécifiques portant des gènes de catéchol dioxygénase pour la dégradation des hydrocarbures aromatiques — confirmant que le changement est une réponse fonctionnelle à la contamination, et non une fluctuation aléatoire.

Gestion des défis des échantillons environnementaux

L'extraction d'ADN environnemental est plus difficile que l'extraction de selles ou de salive. Les filtres de sol, de sédiment et d'eau contiennent des inhibiteurs de PCR — acides humiques, métaux lourds, polysaccharides complexes — qui co-purifient avec l'ADN. Des kits d'extraction spécialisés incluant des étapes de suppression des inhibiteurs sont essentiels. Pour les échantillons à faible biomasse — eaux souterraines profondes, eaux océaniques oligotrophes, carottes de glace polaires — le risque de contamination par les réactifs de laboratoire et l'environnement noyant le véritable signal biologique est élevé. Les contrôles négatifs — blancs d'extraction et blancs de préparation de bibliothèque séquencés aux côtés des véritables échantillons — ne sont pas optionnels. Ils sont le seul moyen de distinguer un véritable signal microbien de la contamination par les réactifs.

CD Genomics propose Services de séquençage métagénomique adapté aux échantillons environnementaux, avec des protocoles d'extraction validés pour les matrices de sol, de sédiment, d'eau douce, marines et d'environnements extrêmes, y compris l'élimination des inhibiteurs et les flux de travail de contrôle négatif.

Au-delà de la surveillance de la pollution, la métagénomique environnementale stimule la découverte. La majorité des nouveaux antibiotiques développés au cours de la dernière décennie trouvent leurs origines dans des clusters de gènes biosynthétiques d'abord identifiés dans des métagénomes de sol. L'exploration de métagénomes — le scan computationnel de contigs assemblés à la recherche de clusters de gènes susceptibles de produire des métabolites secondaires — est devenue une alternative systématique à la découverte traditionnelle de produits naturels basée sur la culture. Cette approche peut être appliquée à des milliers d'échantillons et ne nécessite pas que les organismes soient cultivables. Un seul gramme de sol peut produire des dizaines de nouveaux clusters de gènes biosynthétiques, dont chacun pourrait coder un nouveau composé antimicrobien ou anticancéreux.

Figure 4: Overview of environmental metagenomics applications across soil, water, and sediment showing how shotgun sequencing reveals
microbial diversity, biogeochemical gene catalogs, and biosynthetic gene clusters for natural product discovery.

Pour un traitement complet de la métagénomique environnementale, de la stratégie d'échantillonnage à l'annotation fonctionnelle, consultez notre guide sur la métagénomique environnementale — Sol, Eau et Sédiment.

Viromique — Séquençage de la fraction virale

Les virus sont les entités biologiques les plus abondantes sur Terre. Dans l'océan, il y a environ dix virus pour chaque cellule bactérienne. Dans l'intestin humain, le virome — la communauté de virus, dominée par les bactériophages — est estimé contenir plus de gènes uniques que le microbiome bactérien. Et dans les échantillons cliniques, identifier un pathogène viral lorsque vous ne savez pas quel virus rechercher est le problème de diagnostic le plus difficile dans la recherche sur les maladies infectieuses.

Viromes d'ADN et d'ARN

La métagénomique par shotgun de l'ADN total capture les virus ADN — bactériophages, herpèsvirus, adénovirus, papillomavirus — aux côtés des génomes bactériens et fongiques. Mais de nombreux virus cliniquement et écologiquement importants possèdent des génomes à ARN : influenza, SARS-CoV-2, norovirus, rotavirus, et la vaste diversité des phages à ARN. La capture du virome ARN nécessite une étape de préparation de bibliothèque distincte qui reverse-transcrit l'ARN en ADN complémentaire avant le séquençage. Une analyse complète du virome implique donc souvent deux bibliothèques : une bibliothèque d'ADN pour les virus et phages ADN, et une bibliothèque d'ARN pour les virus ARN.

Les bactériophages dominent la plupart des viromes. Dans l'intestin humain, la communauté de phages est très spécifique à chaque individu — votre profil de phages intestinaux est plus unique que votre profil bactérien — et remarquablement stable dans le temps. Les phages influencent la dynamique de la communauté bactérienne intestinale par la prédation, et ils médiatisent le transfert horizontal de gènes en déplaçant l'ADN entre les hôtes bactériens. Lorsqu'une communauté intestinale est perturbée par des antibiotiques, les populations de phages fleurissent souvent, et les gènes de résistance aux antibiotiques codés par les phages qu'ils portent peuvent se propager à travers la communauté bactérienne en récupération.

Détection de virus sans amorces cibles

L'avantage clé de la viromique métagénomique par rapport aux panneaux PCR ciblés est que vous n'avez pas besoin de deviner quels virus rechercher. Un panel respiratoire teste pour vingt ou trente agents pathogènes connus. La métagénomique par shotgun séquence tout — connu et inconnu — et identifie les virus en faisant correspondre les lectures avec des bases de données de génomes viraux. Pour les enquêtes épidémiques où l'agent causal est inconnu, pour les études de recherche sur l'encéphalite ou la septicémie où le dépistage des agents pathogènes basé sur la culture et la PCR a été épuisé, et pour la surveillance environnementale où des virus nouveaux émergent des réservoirs animaux, cette approche non ciblée est le seul moyen de capturer l'ensemble du tableau.

Le défi est la sensibilité. Les acides nucléiques viraux peuvent représenter moins de 0,01 % de l'ADN ou de l'ARN total dans un échantillon clinique. Les stratégies d'enrichissement — filtrer les échantillons pour éliminer les cellules bactériennes et hôtes par taille, dépléter l'ADN de l'hôte ou utiliser des sondes de capture ciblant des séquences virales conservées — peuvent augmenter la fraction virale de plusieurs ordres de grandeur. CD Genomics intègre des protocoles d'enrichissement viral dans son flux de travail de séquençage du virome pour les échantillons où la charge virale est supposée être faible.

Pour un traitement approfondi des méthodes de séquençage du virome et de leurs applications, consultez notre guide sur la métagénomique virale et le séquençage du virome.

La recherche sur la thérapie par les phages est un autre domaine où la viromique prend de l'ampleur. Alors que les infections bactériennes multirésistantes dépassent le développement de nouveaux antibiotiques, les phages — des virus qui infectent et tuent des bactéries spécifiques — offrent une alternative qui ne favorise pas la résistance aux antibiotiques. L'identification des phages thérapeutiques commence par le dépistage des viromes environnementaux ou cliniques à la recherche de phages ciblant le pathogène d'intérêt. La viromique métagénomique est le moteur de découverte qui alimente ce processus.

Figure 5: Virome sequencing workflow showing DNA and RNA viral library preparation, virus-like particle enrichment strategies, and the
bioinformatic pipeline for identifying known and novel viruses from metagenomic data.

Planification d'un projet de métagénomique — Décisions pratiques

Les décisions qui déterminent si un projet de métagénomique réussit sont prises avant que le premier échantillon n'entre dans le séquenceur. Les plus importantes sont simples.

Profondeur de séquençage : Combien de données par échantillon ?

La profondeur de séquençage est mesurée en gigabases par échantillon — la quantité totale d'ADN séquencé. Pour un échantillon de selles humain typique, voici ce que chaque niveau de profondeur fournit.

La métagénomique par shotgun peu profonde, à environ 0,5 à 1 gigabase par échantillon, fournit des profils taxonomiques au niveau des espèces et détecte les gènes fonctionnels les plus abondants. C'est le choix économique pour les études sur de grandes cohortes où l'objectif principal est d'identifier les différences de composition entre les groupes.

La métagénomique standard des fusils de chasse, à 5 à 10 gigabases par échantillon, ajoute un profilage fonctionnel complet — vous voyez l'ensemble des voies KEGG, des familles CAZy et des gènes de résistance aux antibiotiques. Elle fournit également une couverture suffisante pour assembler des génomes assemblés à partir de métagénomes — des génomes provisoires d'espèces microbiennes individuelles reconstruits de manière computationnelle à partir des données de séquençage de la communauté mixte.

La métagénomique profonde, à 20 gigabases ou plus par échantillon, est réservée aux projets nécessitant des génomes presque complets de membres rares de la communauté, une caractérisation complète du virome ou la découverte de nouveaux clusters de gènes biosynthétiques. Le séquençage profond de quelques échantillons représentatifs complète souvent le séquençage peu profond de l'ensemble de la cohorte.

La profondeur adéquate est le minimum qui répond à votre question. Séquencer plus profondément que nécessaire augmente les coûts sans apporter d'informations supplémentaires. Notre équipe peut vous aider à estimer la profondeur requise en fonction de votre type d'échantillon et de vos objectifs de recherche.

Figure 6: Decision matrix comparing sequencing depth tiers (shallow, standard, deep shotgun) against research applications, showing
trade-offs between cost, taxonomic resolution, functional coverage, and recommended sample sizes.

ADN hôte — Le tueur silencieux de budget

Pour les échantillons de tissus humains, de salive, de prélèvements cutanés ou de biopsies, l'ADN de l'hôte peut consommer la majorité de vos lectures de séquençage. Si quatre-vingt-dix pour cent de vos lectures se cartographient sur le génome humain, vous avez effectivement payé pour dix fois moins de données microbiennes que vous ne le pensiez. La déplétion de l'hôte — éliminer l'ADN humain avant la préparation de la bibliothèque — est fortement recommandée pour tout échantillon où les cellules hôtes sont censées dépasser en nombre les cellules microbiennes. Les options incluent la centrifugation différentielle, la lyse sélective des cellules humaines et des kits commerciaux qui utilisent des nucléases spécifiques à la méthylation pour dégrader l'ADN humain tout en laissant l'ADN microbien intact.

Bioinformatique — Ce que vous obtenez et ce dont vous avez besoin

Après le séquençage, les données brutes passent par un pipeline bioinformatique qui élimine les lectures de faible qualité, filtre tout ADN hôte restant, puis attribue des identités taxonomiques et des annotations fonctionnelles aux lectures restantes. Les livrables standard comprennent un rapport taxonomique interactif montrant la composition de la communauté au niveau des phylums jusqu'aux espèces, un profil fonctionnel cartographiant les gènes aux voies KEGG et à d'autres bases de données, ainsi que des analyses de diversité qui quantifient les différences entre les groupes d'échantillons.

Pour les projets nécessitant une analyse personnalisée — suivi au niveau des souches, reconstruction de génomes assemblés à partir de métagénomes, ou intégration avec des données de métabolomique ou de métatranscriptomique — CD Genomics offre un support bioinformatique sur mesure. Le piège le plus courant est de sous-estimer les ressources informatiques nécessaires pour de grands projets de métagénomique. L'assemblage de métagénomes à partir de cinquante échantillons à une profondeur standard nécessite une mémoire et une puissance de traitement substantielles, et essayer d'exécuter ces analyses sur un ordinateur portable est une recette pour la frustration. L'analyse basée sur le cloud ou l'accès à des ordinateurs haute performance est la norme pratique.

Options de coût et de service

Une fois que le design expérimental est établi — nombres d'échantillons, profondeur de séquençage et portée de l'analyse — la question suivante est pratique : quel est le coût, et quel modèle de service correspond aux capacités de votre laboratoire ?

Les coûts du séquençage métagénomique sont dominés par trois facteurs : le nombre d'échantillons, la profondeur de séquençage par échantillon et le niveau d'analyse bioinformatique requis. Comprendre comment ces leviers interagissent fait la différence entre un projet qui respecte le budget et un qui ne le fait pas.

Séquençage uniquement vs. Service complet

Le séquençage seul signifie que vous fournissez de l'ADN extrait, et que le prestataire de services s'occupe de la préparation de la bibliothèque, du séquençage et de la livraison des fichiers de données brutes. Vous gérez toute l'analyse en aval vous-même ou par le biais d'un service de bioinformatique séparé. C'est la solution la plus économique pour les laboratoires disposant d'une expertise bioinformatique interne et d'une infrastructure informatique.

Le service complet inclut l'extraction d'ADN à partir de vos échantillons, la préparation de la bibliothèque, le séquençage et l'analyse bioinformatique complète — du contrôle de qualité à l'annotation taxonomique et fonctionnelle jusqu'aux figures prêtes pour publication. Le service complet coûte plus cher par échantillon mais élimine le besoin de personnel spécialisé et de matériel informatique. Pour les groupes de recherche clinique qui génèrent des données sur le microbiome mais n'emploient pas de bioinformaticiens dédiés, le service complet est généralement la voie la plus efficace.

Entre ces deux extrêmes, CD Genomics propose des forfaits de services modulaires. Vous pouvez nous envoyer de l'ADN extrait tout en demandant une analyse bioinformatique complète. Vous pouvez nous demander d'effectuer une déplétion de l'hôte sur vos échantillons de tissu pendant que vous vous occupez de l'analyse des données. L'objectif est d'adapter le niveau de service aux capacités déjà présentes dans votre laboratoire, afin que vous ne payiez que pour ce dont vous avez besoin.

Établir un budget pour un projet de métagénomique

Pour une étude de métagénomique sur des selles humaines typiques, voici un cadre de coût approximatif. Au niveau du séquençage shotgun peu profond — environ un gigabase par échantillon — vous pouvez vous attendre à payer environ cent à deux cents dollars par échantillon pour la préparation de la bibliothèque et le séquençage, avec une analyse bioinformatique ajoutant proportionnellement. Le séquençage shotgun à profondeur standard coûte environ deux à trois fois plus cher pour le séquençage, reflétant les données supplémentaires générées. Ce sont des chiffres indicatifs à des fins de budgétisation. Les prix réels dépendent du nombre d'échantillons, du type d'échantillon, de la profondeur requise et de l'étendue de l'analyse.

Pour mettre ces chiffres en contexte : une étude de tir aléatoire peu profonde de 50 échantillons sur un cohort d'intervention diététique, avec une analyse bioinformatique standard — profilage taxonomique plus annotation fonctionnelle KEGG — se situe généralement dans une fourchette de budget total qui est compétitive avec le séquençage profond d'amplifications 16S à des tailles de cohort similaires, tout en offrant une résolution au niveau des espèces et une détection directe des gènes fonctionnels que le 16S ne peut pas fournir. Pour la planification budgétaire, les variables clés sont le nombre d'échantillons — le multiplicateur dominant — la profondeur de séquençage par échantillon et l'étendue de l'analyse.

La manière la plus efficace de contrôler les coûts est d'investir dans une bonne conception d'étude dès le départ. Cinq erreurs courantes gonflent les budgets : séquencer trop d'échantillons au-delà de ce que la question nécessite, sous-séquencer un pilote et devoir recommencer la cohorte complète, oublier de budgétiser le stockage des données et les coûts de calcul, sauter l'épuisement de l'hôte et gaspiller des lectures sur l'ADN humain, et ne pas inclure de contrôles négatifs qui détectent la contamination avant qu'elle ne ruine une course de séquençage.

L'équipe de consultation de projet de CD Genomics travaille avec vous durant la phase de conception expérimentale pour aligner la stratégie de séquençage avec le budget. Pour les études de cohorte où la métagénomique par shotgun peu profonde fournit des informations suffisantes pour l'analyse principale, nous pouvons concevoir une approche par étapes : séquençage peu profond sur l'ensemble de la cohorte, suivi d'une métagénomique approfondie sur un sous-ensemble d'échantillons sélectionnés en fonction des résultats initiaux. Pour les projets qui combinent la métagénomique au niveau communautaire avec le séquençage du génome entier au niveau des isolats — par exemple, un dépistage métagénomique suivi du séquençage du génome entier d'isolats cultivés d'intérêt — CD Genomics Séquençage du génome complet les services fournissent la vue complémentaire au niveau de l'isolement.

Pour un contexte plus large sur la manière dont la métagénomique s'intègre dans le paysage de la génomique microbienne, consultez notre Hub de services de séquençage d'amplicons, qui couvre les approches 16S, 18S, ITS et de codage-barres ADN. Pour les projets qui combinent la métagénomique avec des génomes bactériens isolés, notre Guide de séquençage du génome bactérien complet couvre l'assemblage de novo, le re-séquencement et la détection de mutations à partir de cultures pures.

FAQ

Quand devrais-je choisir la métagénomique par shotgun plutôt que le séquençage d'amplification 16S ?

Choisissez la métagénomique shotgun lorsque vous avez besoin d'une identification au niveau des espèces ou des souches, lorsque vous devez connaître la capacité fonctionnelle de la communauté — quels gènes et voies sont présents — ou lorsque vous devez capturer des champignons, des virus et d'autres microbes non bactériens aux côtés des bactéries. Choisissez le 16S lorsque votre question se limite à "quelles bactéries sont présentes, et comment leurs abondances diffèrent-elles entre les groupes," et que le budget est la contrainte principale.

Qu'est-ce que la métagénomique par shotgun peu profonde et comment se compare-t-elle à la méthode 16S ?

La métagénomique par shotgun peu profond génère moins de données par échantillon — généralement de 0,5 à 1 gigabase — ce qui est suffisant pour le profilage taxonomique au niveau des espèces et la détection des gènes fonctionnels les plus abondants. Cela coûte plus cher que le 16S mais moins que le shotgun standard, et cela fournit une résolution au niveau des espèces que le 16S ne propose pas, en plus de la détection directe d'un sous-ensemble de gènes fonctionnels. Pour les études sur de grandes cohortes où la taxonomie au niveau des espèces est importante mais où un profilage fonctionnel approfondi n'est pas nécessaire, c'est le compromis économique émergent.

La métagénomique par shotgun peut-elle remplacer la culture ?

Non. La métagénomique vous indique quels gènes sont présents dans un échantillon, mais elle ne vous dit pas quels microbes sont viables, lesquels sont métaboliquement actifs, ou comment ils se comportent isolément. La métagénomique et la culture sont complémentaires. Une enquête métagénomique peut vous indiquer quels organismes cibler pour l'isolement, et la culture peut valider les prédictions fonctionnelles faites à partir des données métagénomiques — par exemple, confirmer qu'une souche de Bacteroides portant un locus de prédiction d'utilisation de polysaccharides se développe effectivement sur ce polysaccharide.

Quelle est l'importance de l'ADN de l'hôte dans les échantillons cliniques ?

Cela a une importance énorme. Les biopsies tissulaires, les écouvillons cutanés et les échantillons de salive peuvent contenir plus de quatre-vingt-dix pour cent d'ADN humain. Sans déplétion de l'hôte, la plupart des lectures de séquençage se cartographient sur le génome humain plutôt que sur le microbiome, réduisant considérablement la profondeur de séquençage microbien effective. Pour les échantillons où l'ADN de l'hôte est censé dépasser cinquante pour cent, la déplétion de l'hôte devrait faire partie du flux de travail standard.

Combien d'échantillons ai-je besoin pour une étude de métagénomique ?

Cela dépend de la taille de l'effet que vous recherchez et de la variabilité interindividuelle dans votre population. Pour les études cas-témoins sur le microbiome intestinal humain, trente à cinquante sujets par groupe est un minimum pratique. Pour les études longitudinales où chaque sujet sert de contrôle à lui-même, des nombres plus petits sont réalisables. Pour les enquêtes environnementales où l'objectif est de caractériser un site plutôt que de comparer des groupes, même quelques échantillons bien choisis peuvent fournir des données précieuses — mais la réplication biologique est toujours préférable à la réplication technique.

Quel type de soutien en bioinformatique aurai-je besoin ?

Si vous choisissez le service de séquençage uniquement, vous aurez besoin d'un bioinformaticien ou d'un chercheur ayant des compétences en informatique capable d'exécuter des contrôles de qualité, des classifications taxonomiques et des pipelines d'annotation fonctionnelle. Une expérience avec la ligne de commande Linux, une compréhension de base du scripting et l'accès à un serveur ou à des ressources de cloud computing sont les minimums requis. Si vous choisissez le service complet, CD Genomics gère l'ensemble du flux de travail computationnel et livre les résultats analysés — aucune ligne de commande n'est requise.

Quel est le délai de traitement pour un projet de métagénomique typique ?

Pour un projet standard de cinquante à cent échantillons, prévoyez quatre à six semaines entre la réception des échantillons et la livraison des données analysées pour la préparation de la bibliothèque et le séquençage, plus deux à quatre semaines supplémentaires pour une analyse bioinformatique complète. Des délais accélérés sont disponibles pour les projets sensibles au temps. Les études de cohortes importantes avec des centaines d'échantillons nécessitent un temps de séquençage proportionnellement plus long, mais bénéficient d'un traitement par lots qui maintient un délai de traitement par échantillon gérable.

Puis-je intégrer la métagénomique avec d'autres données omiques ?

Oui. La métagénomique est souvent combinée avec la métabolomique pour relier le contenu génétique microbien aux profils de métabolites, ou avec la métatranscriptomique pour distinguer les gènes activement exprimés de ceux simplement présents dans la communauté. CD Genomics propose des services d'intégration multi-omiques qui corrèlent les profils fonctionnels métagénomiques avec des données métabolomiques ou métatranscriptomiques provenant des mêmes échantillons, offrant une vue systémique de la fonction de la communauté microbienne.

Références :

Zhang L, Chen F, Zeng Z, et al. Avancées en métagénomique et son application aux microorganismes environnementaux. Frontières en microbiologie. 2021;12:766364. doi:10.3389/fmicb.2021.766364
Blanco-Miguez A, Beghini F, Cumbo F, et al. Étendre et améliorer le profilage taxonomique métagénomique avec MetaPhlAn 4. Biotechnologie de la Nature2023 ; 41(11) : 1633-1644. doi:10.1038/s41587-023-01688-w
Almeida A, Nayfach S, Boland M, et al. Un catalogue unifié de 204 938 génomes de référence du microbiome intestinal humain. Biotechnologie de la nature. 2021;39(1):105-114. doi:10.1038/s41587-020-0603-3
Kim N, Ma J, Kim J, et al. Métagénomique résolue par le génome : un changement de donne pour la médecine du microbiome. Médecine expérimentale et moléculaire. 2024;56:1501-1512. doi:10.1038/s12276-024-01262-7
Nayfach S, Roux S, Seshadri R, et al. Un catalogue génomique des microbiomes de la Terre. Biotechnologie de la Nature. 2021;39(4):499-509. doi:10.1038/s41587-020-0718-6
Gregory AC, Zablocki O, Zayed AA, et al. La base de données du virome intestinal révèle des schémas de diversité du virome dépendants de l'âge dans l'intestin humain. Cellule Hôte & Microbe. 2020;28(5):724-740.e8. doi:10.1016/j.chom.2020.08.003
Meyer F, Fritz A, Deng ZL, et al. Évaluation critique de l'interprétation du métagénome : le deuxième tour de défis. Méthodes de la Nature. 2022;19(4):429-440. doi:10.1038/s41592-022-01431-4
Gu W, Miller S, Chiu CY. Séquençage métagénomique clinique de nouvelle génération pour la détection des agents pathogènes. Revue Annuelle de Pathologie. 2019;14:319-338. doi:10.1146/annurev-pathmechdis-012418-012751
Camarillo-Guerrero LF, Almeida A, Rangel-Pineros G, Finn RD, Lawley TD. Expansion massive de la diversité des bactériophages intestinaux humains. Cellule. 2021 ; 184(4) : 1098-1109.e9. doi:10.1016/j.cell.2021.01.029
Jimenez-Arroyo C, Molinero N, Sabater C, Margolles A, Delgado S, Ruas-Madiedo P. Étude du microbiome intestinal humain par métagénomique : avancées récentes et défis pour une mise en œuvre clinique. Maladies Infectieuses et Microbiologie Clinique (édition anglaise)2025;43(6):322-331. doi:10.1016/j.eimce.2025.03.007

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.

Services connexes

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.