Pourquoi des lectures longues pour la métagénomique ?
Si vous réalisez une métagénomique par shotgun à lectures courtes (Illumina), vous connaissez les limites. Les lectures courtes (2×150 pb ou 2×300 pb) fragmentent les génomes en milliers de contigs. Le résultat : des génomes assemblés à partir de métagénomes fragmentés (MAGs), une résolution taxonomique au niveau du genre au mieux, et une annotation fonctionnelle des gènes qui s'arrête souvent au niveau du domaine — car le contexte complet des gènes est perdu.
Les longs articles résolvent ces problèmes :
Classification au niveau des espèces et des souches sans assemblage. Chaque lecture HiFi de PacBio couvre suffisamment du gène 16S rRNA, ou d'une région marqueur spécifique à une espèce, pour permettre une classification directe au niveau de l'espèce. Pour de nombreux génomes bactériens, une seule lecture HiFi peut couvrir un opéron entier ou un élément génétique mobile, préservant ainsi le contexte génomique que les courtes lectures fragmentent.
MAGs de meilleure qualité. Les MAGs circulaires basés sur HiFi (cMAGs) surpassent systématiquement les MAGs à lecture courte en termes de complétude, de contamination et de N50. Les lectures ultra-longues de Nanopore peuvent encore améliorer la continuité des MAGs pour les communautés les plus complexes.
Clusters de gènes complets et contexte des ARG. Les clusters de gènes biosynthétiques (BGC) et les gènes de résistance antimicrobienne (ARG) s'étendent souvent sur 10 à 50 kb — bien à l'intérieur d'une seule lecture HiFi. Lorsque vous pouvez capturer un BGC complet ou un cassette ARG en une seule lecture, vous savez exactement à quelle espèce il appartient, quels sont les gènes voisins et s'il se trouve sur un plasmide ou un chromosome.
Applications du séquençage métagénomique à longues lectures
Là où les lectures longues apportent le plus de valeur par rapport à la métagénomique à lectures courtes.
Microbiologie environnementale
Profil des communautés microbiennes du sol, de l'eau, des sédiments et des environnements extrêmes à une résolution au niveau des espèces. Suivre les espèces clés, les guildes fonctionnelles et les distributions des voies biogéochimiques.
Recherche sur le microbiome humain
Résoudre la composition du microbiome intestinal, oral, cutané et vaginal au niveau des souches. Lier des souches spécifiques à des métabolites, des phénotypes hôtes ou des états pathologiques — une résolution que le profilage à courte lecture au niveau du genre ne peut pas fournir.
Surveillance de la résistance antimicrobienne (RAM)
Capture des cassettes ARG complètes en lectures longues uniques. Identifiez simultanément l'espèce hôte, le contexte plasmidique et les gènes de résistance co-localisés — essentiel pour suivre la transmission des ARG.
Microbiologie industrielle et agricole
Optimiser les consortiums de fermentation, rechercher de nouvelles enzymes et BGC, et surveiller les microbiomes du sol ou de la rhizosphère pour des organismes de biocontrôle et de promotion de la croissance des plantes.
Flux de travail de séquençage métagénomique à lecture longue
- Échantillonnage et contrôle qualité: Quantification de l'ADNg et vérification de la pureté (Qubit, spectrophotométrie). A260/280 1,8–2,0, A260/230 ≥2,0. ≥2 μg d'ADN métagénomique de haute qualité. Épuisement de l'ADN hôte disponible pour les échantillons cliniques.
- Préparation de la bibliothèqueConstruction de bibliothèque SMRTbell avec sélection de taille (PacBio) ou préparation rapide/ligation (Nanopore). Multiplexage par codes-barres pour des projets multi-échantillons.
- SéquençagePacBio Sequel II/IIe ou Revio pour la métagénomique HiFi. Oxford Nanopore PromethION ou GridION pour la métagénomique ONT à grande échelle. Séquençage SMRT de PacBio | Séquençage par nanoporeCiblez 5 à 10 Gbp par échantillon pour le profilage des espèces, 10 à 20 Gbp pour les MAGs.
- Appel de base et contrôle qualité: PacBio CCS → HiFi (≥3 passages, QV ≥30). Nanopore : appel de base Dorado. QC : rendement, longueur de lecture N50, score Q, équilibre des codes-barres.
- Bioinformatique: Taxonomie (Kraken2/Bracken), annotation fonctionnelle (KEGG, eggNOG, CAZy, CARD), binning de MAG (HiFi-MAG, metaMDBG pour HiFi ; metaFlye pour ONT), analyse comparative.
- Livraison: Longs fichiers (FASTQ/BAM), rapport de QC, tableaux de taxonomie, résultats d'annotation, MAGs (FASTA), rapport d'analyse.

Exigences d'échantillon
| Type d'échantillon | Montant recommandé | Minimum | Notes |
|---|---|---|---|
| ADN métagénomique | ≥2 μg, ≥30 ng/μL | 1 μg | A260/280 1,8–2,0 ; traité avec de la RNase |
| Sol / Sédiment | 6 g | 2 g | Geler immédiatement ; éviter de décongeler |
| Contenu fécal / Contenu intestinal | 5 g | 2 g | Tube stérile ; −80°C |
| Membrane de filtre à eau | 6 membranes | 2 membranes | 0,22–0,45 μm ; −80 °C |
| Ecouvillons | 10 à 20 écouvillons | 6 écouvillons | Utiliser un tampon de préservation |
| Tissu | 2 g | 1 g | Congélation instantanée dans de l'azote liquide (N₂) |
| Liquide de fermentation | 6–10 mL (pellet ≥2 g) | 2 mL (pellet ≥1 g) | Expédier des granulés sur de la glace carbonique |
- Expédiez tous les échantillons sur de la glace carbonique (−80°C) ou des packs de glace (−20°C pour l'ADN). Incluez la date de collecte, la méthode d'extraction et les inhibiteurs connus. Contactez-nous pour des échantillons à faible biomasse, FFPE ou difficiles. Également disponible : Séquençage ultra-long par nanopore pour les communautés les plus complexes.
Analyse bioinformatique
Standard (inclus)
- Traitement de la lecture : CCS → HiFi (PacBio) ou appel de bases (Nanopore), démultiplexage
- Exécuter le contrôle qualité : rendement, longueur de lecture N50, distribution des scores de qualité, équilibre des codes-barres.
- Profilage taxonomique : Kraken2/Bracken, résolution au niveau des espèces
- Annotation fonctionnelle : KEGG, eggNOG, CAZy, CARD
- Analyse de la diversité alpha et bêta ; test de l'abondance différentielle
Options supplémentaires
- Binning MAG et évaluation de la qualité (CheckM2)
- Métagénomique comparative à travers des conditions ou des séries temporelles
- Prédiction de clusters de gènes biosynthétiques (BGC) (antiSMASH)
- Construction de bases de données personnalisées ; intégration multi-omiques

Livrables
| Catégorie | Livrables |
|---|---|
| Données brutes | Lectures HiFi ou lectures ONT (FASTQ/BAM), démultiplexées par échantillon |
| Rapport de contrôle qualité | Rendement, longueur de lecture N50, distribution du score Q, nombre de passes CCS, attribution de code-barres |
| Taxonomie | Tableaux d'abondance au niveau des espèces et des genres (TSV), graphiques à barres empilées, graphiques Krona |
| Fonction | Abondance des voies KEGG, annotation eggNOG/COG, familles d'enzymes CAZy, profils ARG CARD |
| MAGs | MAGs binés (FASTA), rapport de qualité CheckM2 (complétude, contamination, hétérogénéité des souches) |
| Comparatif | Diversité alpha/bêta, PCoA/NMDS, abondance différentielle (DESeq2/ALDEx2), cartes thermiques |
| Rapport de projet | Méthodes, paramètres, résultats, graphiques prêts à l'emploi |
Besoin d'aide pour interpréter vos données de métagénomique ? Explorez notre Services de bioinformatique ou Analyse des données génomiques options.
Métagénomique à lecture longue vs métagénomique à lecture courte — Comparaison des plateformes
Quelle approche convient à votre projet de métagénomique ? Voici comment PacBio HiFi, Oxford Nanopore et la métagénomique à lecture courte (Illumina) se comparent sur les dimensions qui comptent pour l'analyse des communautés microbiennes.
| Dimension | Lecture courte (Illumina) | PacBio HiFi | Oxford Nanopore |
|---|---|---|---|
| Longueur de lecture | 2×150 pb ou 2×300 pb | ~15–20 ko HiFi | Routine de 10 à 100 Ko ; ultra-long jusqu'à plus de 2 Mo |
| Précision de pré-lecture | ≥99,9 % | QV ≥30 (≥99,9%) | Q10–Q20 brut; dépendant de la profondeur |
| Résolution taxonomique | Genre (nombre de copies 16S distordu) | Espèce, souvent souche — directement à partir des lectures brutes | Espèce/souche avec une profondeur suffisante |
| Taxonomie sans assemblage | Non — nécessite un assemblage préalable. | Oui — CCS lit directement classifier | Nécessite de la profondeur ou un consensus |
| qualité MAG | Fragmenté, de nombreuses chimères | cMAGs circulaires, plus de complétude | Contigs plus longs ; plus de polissage |
| Capture complète d'opéron / BGC | Dépendant de l'assemblage, souvent cassé | Capture en lecture unique (15 à 20 kb couvre la plupart des opérons) | Capture à lecture unique ; ultra-long couvre les plus grands clusters |
| Identification de l'hôte ARG | Niveau contig, hôte généralement inconnu | niveau de lecture: espèce hôte + contexte plasmidique | Niveau de lecture ; plus long = plus de contexte |
| Surveillance en temps réel | Non | Non | Oui — arrêter de courir lorsque les données sont suffisantes |
| Déploiement sur le terrain | Non | Non | Oui (MinION) |
| Maturité en bioinformatique | Le plus mature | Outils HiFi matures (HiFi-MAG, metaMDBG) | Écosystème métagénomique ONT en pleine expansion |
Choix rapide
- Prioriser l'exactitude taxonomique et la qualité des MAG PacBio HiFi
- Besoin de métagénomique en temps réel ou déployable sur le terrain. Nanopore
- Ciblez les plus grands plasmides, prophages ou clusters multi-opérons. Nanopore ultra-long
- Le meilleur des deux : HiFi pour la taxonomie/MAGs + ONT ultra-long pour le contexte structurel
- Métagénomique à lecture courte sur un pipeline familier Illumina (seulement au niveau du genre)
CD Genomics propose les trois plateformes. Nous vous aidons à choisir en fonction du type d'échantillon, de la complexité de la communauté et de la résolution cible.
Résultats de la démo

Classification taxonomique au niveau des espèces — Les lectures HiFi se classifient directement au niveau des espèces et des souches sans assemblage.

Évaluation de la qualité cMAG — MAGs circulaires HiFi : meilleure complétude, moins de contamination que les MAGs à lecture courte

Distribution de longueur de lecture HiFi — Des lectures de 15 à 20 kb capturent des opérons complets et des cassettes de gènes de résistance aux antibiotiques dans des molécules uniques.
FAQ sur le séquençage métagénomique à lecture longue
1. Pourquoi utiliser des lectures longues plutôt que des métagénomiques à courtes lectures ?
Les longues lectures fournissent une taxonomie au niveau des espèces et des souches directement à partir des lectures brutes - aucune assemblage n'est nécessaire. La métagénomique à courtes lectures s'arrête généralement au niveau du genre et nécessite un assemblage pour l'annotation fonctionnelle, ce qui introduit des chimères et des fragmentations. Les longues lectures capturent également des opérons complets et des cassettes de gènes de résistance aux antibiotiques (ARG) dans des lectures uniques, préservant le contexte génomique.
2. PacBio HiFi contre Nanopore — lequel est le meilleur pour la métagénomique ?
Les deux ont des atouts. HiFi vous offre une précision par lecture plus élevée (QV ≥30), ce qui se traduit par une classification taxonomique plus précise et des MAGs de meilleure qualité. Nanopore peut produire des lectures ultra-longues utiles pour les grands plasmides et les prophages, et prend en charge le séquençage en temps réel et portable. Pour la plupart des projets, HiFi est le premier choix pour la taxonomie et les MAGs ; Nanopore ajoute de la valeur lorsque le contexte structurel ultra-long ou la capacité sur le terrain sont importants.
3. Les longues lectures peuvent-elles classifier au niveau des espèces ou des souches sans assemblage ?
Oui. Parce que les lectures HiFi mesurent entre 15 et 20 ko et que la qualité de lecture est ≥30, une seule lecture peut couvrir suffisamment du gène 16S rRNA ou des marqueurs spécifiques à une espèce pour une classification directe. C'est un avantage clé par rapport aux courtes lectures, qui nécessitent un assemblage avant la taxonomie.
4. Quels types d'échantillons acceptez-vous ?
Sol, sédiment, eau (filtrée), fèces, contenus intestinaux, écouvillons, tissu, liquides de fermentation et ADN métagénomique extrait. Consultez le tableau des exigences d'échantillons pour les quantités et les conditions d'expédition. Contactez-nous pour des échantillons à faible biomasse, FFPE ou difficiles.
5. Combien de données ai-je besoin par échantillon ?
Typiquement 5 à 10 Gbp par échantillon pour le profilage taxonomique au niveau des espèces. Pour une récupération de MAG de haute qualité à partir de communautés complexes, 10 à 20 Gbp. Nous évaluons la couverture lors de la consultation de projet en fonction de votre type d'échantillon et de la complexité attendue de la communauté.
6. Quels services de bioinformatique proposez-vous ?
La livraison standard comprend le profilage taxonomique (Kraken2/Bracken), l'annotation fonctionnelle (KEGG, eggNOG, CAZy, CARD), l'analyse de la diversité et les tests d'abondance différentielle. Options supplémentaires : binning de MAG et QC (CheckM2), prédiction de BGC, construction de bases de données personnalisées et intégration multi-omiques.
7. Pouvez-vous réaliser à la fois des métagénomiques PacBio HiFi et Nanopore sur le même projet ?
Oui. La métagénomique hybride PacBio + Nanopore est une stratégie puissante : utiliser HiFi pour une taxonomie précise et des MAGs de haute qualité, et les lectures ultra-longues de Nanopore pour capturer de grands plasmides, des prophages et des régions génomiques complexes. Nous concevons des flux de travail hybrides lors de la consultation de projet.
8. En quoi cela diffère-t-il du séquençage d'amplicons 16S ?
Le séquençage d'amplicons 16S cible uniquement le gène de l'ARNr 16S et fournit au mieux une taxonomie au niveau du genre — aucune information fonctionnelle. Le séquençage métagénomique à longues lectures capture tout l'ADN dans l'échantillon, fournissant une taxonomie au niveau des espèces ET une annotation des gènes fonctionnels (voies métaboliques, ARGs, BGCs) à partir du même ensemble de données.
Étude de cas — La métagénomique à longues lectures révèle la composition du microbiome au niveau des espèces dans l'estuaire de San Francisco
Mise en avant des publications en libre accès
La décomposition d'un microbiome d'estuaire de San Francisco à l'aide de la métagénomique à longues lectures révèle une dominance au niveau des espèces et des souches, des picoeucaryotes aux virus.
Journal : mSystèmes (ASM), 2024 | DOI : 10.1128/msystems.00242-24
Contexte
Les microbiomes estuariens sont des écosystèmes hautement complexes façonnés par des apports dynamiques d'eau douce et marine. Comprendre leur composition au niveau des espèces et des souches est essentiel pour prédire les réponses des écosystèmes aux changements environnementaux, mais la métagénomique à lectures courtes échoue souvent à résoudre les espèces et souches étroitement liées en raison d'assemblages fragmentés.
Méthodes
Cette étude a appliqué le séquençage métagénomique à lecture longue d'Oxford Nanopore (~150 Gbp au total) sur des échantillons d'eau provenant de l'estuaire de San Francisco. Les données à lecture longue ont été analysées à l'aide d'une combinaison de classification taxonomique (Kraken2/Bracken), de génération de génomes assemblés à partir de métagénomes (MAG) (Flye + metaMDBG) et de profilage au niveau des souches. Des données à lecture courte (Illumina) et à lecture longue ont été générées à partir des mêmes échantillons pour une comparaison directe des plateformes.
Résultats
- Environ 500 espèces bactériennes et archéennes identifiées au niveau de résolution des espèces.
- 68 MAGs de haute qualité récupérés, y compris plusieurs provenant de lignées mal caractérisées.
- ~40 000 populations virales détectées, avec des lectures longues permettant une récupération complète du génome viral.
- Des modèles de dominance au niveau des espèces et des souches résolus qui étaient ambigus dans les données de lectures courtes.
- Génomes pico-eucaryotes assemblés directement à partir de données métagénomiques, révélant une diversité cachée.
Figure 2 de mSystems, 2024. Composition taxonomique au niveau des espèces par séquençage métagénomique à longues lectures.
Conclusion
Cette étude démontre que le séquençage métagénomique à longues lectures fournit une résolution au niveau des espèces et des souches qui est inaccessible aux approches à courtes lectures, en particulier pour les microbiomes environnementaux complexes. La capacité de récupérer des MAGs complets et des génomes viraux à partir d'une seule séquence longue démontre la puissance de la métagénomique Nanopore pour le profilage complet des écosystèmes — la même approche que nous appliquons dans notre service de séquençage métagénomique à longues lectures.
Référence
- La décomposition d'un microbiome d'estuaire de San Francisco à l'aide de la métagénomique à longues lectures révèle une dominance au niveau des espèces et des souches, des picoeucaryotes aux virus. mSystèmes, 2024. Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
Publications connexes
Voici des publications de chercheurs qui ont utilisé nos services de séquençage métagénomique :
Dynamique de la structure des nutriments et des communautés microbiennes à l'interface eau-sédiment dans un lac extrêmement acide
Journal : Frontières en Microbiologie
Année : 2024
Acide indole-3-propionique, un métabolite du microbiote intestinal et délire postopératoire
Journal : Annales de chirurgie
Année : 2023
DOI : 10.1097/SLA.0000000000005886
Abondance et distribution phylogénétique de huit enzymes clés du cycle biogéochimique du phosphore dans les sols de prairies
Journal : Microbiologie Environnementale
Année : 2023
Voir plus articles publiés par nos clients.
