CD Genomics a encore optimisé le processus pour dépasser les références de PacBio en termes de production et de longueur de lecture afin de soutenir le séquençage métagénomique à longues lectures, de réduire certaines erreurs d'épissage et d'améliorer efficacement la résolution du profilage des communautés microbiennes.
L'introduction du séquençage métagénomique à lecture longue
Métagénomique est défini comme l'analyse génétique directe des génomes contenus dans un échantillon environnemental. Le domaine a d'abord débuté par le clonage de l'ADN environnemental, suivi du criblage de l'expression fonctionnelle, puis a été rapidement complété par le séquençage de l'ADN environnemental. Les échantillons microbiens proviennent de presque partout. Les exemples incluent les microenvironnements à l'intérieur et sur le corps humain dans des états sains et malades, des échantillons de sol, des racines de plantes, des environnements marins, des stations d'épuration, des zones urbaines, etc.
Dans les expériences de métagénomique, l'ADN génomique total isolé de l'environnement est séquencé. Cela permet au chercheur d'identifier les gènes possédés et les processus métaboliques réalisés par ces communautés microbiennes, y compris les organismes non cultivables présents dans l'environnement.
Bien que de nombreux microorganismes naturels ne puissent pas être isolés, cultivés ou clonés, une certaine biodiversité microbienne a été négligée lors de la préparation des échantillons et du séquençage. Maintenant, CD Genomics propose un service de séquençage métagénomique à lecture longue sur le système PacBio SMRT, dans une méthode sans culture, qui peut séquencer des milliers d'organismes en parallèle, réduire certaines erreurs d'assemblage et améliorer efficacement la résolution de l'identification des communautés microbiennes. Le séquençage métagénomique à lecture longue aide également les chercheurs à générer de nouvelles perspectives sur les fonctions et les voies du microbiome, essayant de comprendre et d'élucider les relations entre les microbes et leur habitat/hôte.
L'analyse des données est basée sur les lectures CCS de molécules uniques de la plus haute qualité, sans besoin d'assemblage pour la classification au niveau des espèces, l'analyse fonctionnelle et l'étude de l'enrichissement des voies, ce qui pourrait restaurer l'information sur la communauté microbienne dans l'environnement. Le séquençage métagénomique par longues lectures est un moyen puissant d'obtenir des génomes microbiens avec la plus grande précision et fiabilité.
Caractéristiques clés et avantages du séquençage métagénomique à longues lectures
- Longueurs de lecture moyennes les plus longues, avec environ 50 % des lectures dépassant 50 kb, ce qui dépasse la taille des éléments répétitifs dans le génome bactérien moyen.
- Pas d'amplification de l'ADN.
- Précision de consensus maximale, faible biais de contexte de séquençage
- Nouveaux programmes et pipelines d'analyse bioinformatique
- Personnel bien expérimenté
Applications du séquençage métagénomique à longues lectures
Microbiologie environnementale :
- Étudier la diversité microbienne et les fonctions écologiques dans le sol, l'eau et d'autres échantillons environnementaux.
- Explorer les rôles et les interactions des communautés microbiennes au sein des écosystèmes.
Recherche sur le microbiome humain :
- Étudier la composition microbienne et les fonctions à travers les sites du corps humain (par exemple, intestin, cavité buccale, peau).
- Examinez les relations entre le microbiote et les états de santé ou de maladie, tels que le syndrome métabolique ou les maladies inflammatoires de l'intestin.
Microbiologie industrielle :
- Optimiser les structures et fonctions des communautés microbiennes dans la fermentation et le bioprocédé.
- Développer et sélectionner de nouveaux microbes et enzymes pour des applications industrielles.
Sciences agricoles :
- Étudier l'impact des communautés microbiennes du sol sur la croissance et la santé des cultures.
- Développer des engrais microbiens et des agents de biocontrôle pour améliorer la productivité agricole et la durabilité.
Flux de travail de séquençage métagénomique à lecture longue
Notre équipe d'experts compétents met en œuvre une gestion de la qualité rigoureuse à chaque étape pour garantir des résultats complets et précis. Voici un aperçu du flux de travail typique pour le séquençage métagénomique à longues lectures :

Spécifications de service
Exigences d'échantillon
|
|
Cliquez |
Stratégie de séquençage
|
| Analyse bioinformatique
Nous proposons plusieurs analyses bioinformatiques personnalisées :
|
Pipeline d'analyse

Livrables
- Les données de séquençage originales
- Résultats expérimentaux
- Rapport d'analyse des données
- Détails sur le séquençage métagénomique en lecture longue pour votre rédaction (personnalisation)
Le système PacBio est très robuste et rentable et devrait être la plateforme de choix dans séquençage métagénomique, en particulier pour les échantillons complexes et les communautés microbiennes à faible diversité. CD Genomics sera votre meilleur partenaire en séquençage métagénomique à longues lectures. Veuillez nous contacter pour plus d'informations et un devis détaillé.
Des résultats partiels sont montrés ci-dessous :

1. Pourquoi des lectures de séquençage plus longues sont-elles préférables pour les études de métagénomique ?
Des lectures de séquençage plus longues offrent plusieurs avantages pour métagénomique études, renforçant à la fois l'exactitude et l'exhaustivité des analyses génomiques :
- Assemblage génomique amélioré : La longueur étendue des lectures de séquençage améliore considérablement la résolution des régions génomiques complexes, telles que les séquences répétées et les variations structurelles au sein des génomes microbiaux. Cela conduit à des assemblages génomiques plus contigus et précis par rapport aux assemblages dérivés de lectures plus courtes.
- Capture de gènes et d'opérons en longueur complète : L'augmentation de la longueur des lectures améliore la probabilité de capturer des gènes et des opérons en longueur complète dans une seule lecture. Cela facilite des annotations fonctionnelles et des analyses de voies plus précises, permettant une meilleure compréhension des fonctions et des interactions microbiennes.
- Résolution améliorée de la diversité microbienne : En couvrant plusieurs régions variables au sein des génomes microbiens, des lectures plus longues permettent une identification et une classification plus précises des espèces et des souches microbiennes au sein de communautés complexes. Cette résolution améliorée est cruciale pour l'étude de la diversité microbienne et des dynamiques des écosystèmes.
- Réduction des assemblages chimériques : Les lectures courtes peuvent souvent entraîner des assemblages chimériques, où des séquences de différents génomes sont incorrectement combinées. Le contexte de séquence plus large fourni par des lectures plus longues atténue ce problème, réduisant les erreurs d'assemblage et améliorant l'exactitude globale des données génomiques.
- Aperçus sur la structure génomique microbienne : Des lectures plus longues fournissent des informations précieuses sur les structures génomiques des microbes, y compris les clusters de gènes, les éléments génétiques mobiles et les réarrangements génomiques. Ces aperçus sont essentiels pour comprendre l'évolution microbienne, l'adaptation et les mécanismes sous-jacents aux fonctions microbiennes dans divers environnements.
2. Comment le séquençage métagénomique à longues lectures gère-t-il des communautés microbiennes complexes ?
Séquençage à lecture longue La technologie peut couvrir des régions répétitives et des structures génomiques complexes plus efficacement que les technologies de séquençage à court read. Cette capacité réduit les erreurs d'assemblage et améliore l'exactitude des reconstructions de génomes microbiens au sein de diverses communautés microbiennes.
3. En quoi le séquençage à longues lectures diffère-t-il du séquençage à courtes lectures ?
Le séquençage à lecture longue génère des lectures s'étendant sur des milliers à des dizaines de milliers de paires de bases, contrairement au séquençage à lecture courte, qui produit des lectures typiquement comprises entre 50 et 300 paires de bases de long. Les longueurs de lecture étendues inhérentes au séquençage à lecture longue confèrent un avantage distinct pour élucider des architectures génomiques complexes, des séquences répétitives et des structures de transcrits complètes.
4. Comment le séquençage à long lecteur améliore-t-il la qualité des données ?
Séquençage à lecture longue utilise des molécules d'ADN ou d'ARN natives, évitant les biais ou les erreurs introduites lors de l'amplification synthétique. Cela peut également surmonter les erreurs d'assemblage courantes dans le séquençage à lecture courte, en particulier dans les régions avec des séquences répétitives, améliorant ainsi l'exactitude et l'exhaustivité des données.
5. Quels sont les défis du séquençage à longues lectures ?
Malgré ses avantages, le séquençage à long terme fait face à des défis tels que des coûts élevés, des exigences complexes en matière d'analyse de données et des demandes techniques pour la préparation des échantillons. Certaines études peuvent nécessiter des technologies complémentaires pour obtenir des données génomiques complètes ou transcriptomique information.
Découverte des microbiomes de la phyllosphère du riz à l'aide du séquençage métagénomique à longues lectures
Journal : Communications Biology
Facteur d'impact : 6,548
Publié : 27 mars 2024
Contexte
La phyllosphère abrite des communautés microbiennes diverses connues sous le nom de microbiome des plantes, essentielles à la croissance et à la santé des plantes grâce à l'absorption des nutriments et à la résistance aux maladies. Influencée par la génétique de l'hôte, les mécanismes de défense, les facteurs environnementaux et les activités humaines, la complexité du microbiome impacte de manière imprévisible la santé des plantes. Séquençage de nouvelle génération révèle la diversité microbienne et le potentiel fonctionnel, mais fait face à des biais. La métagénomique à longues lectures surmonte les limitations, permettant une reconstruction complète du génome et l'identification de nouveaux éléments génétiques tels que les plasmides et les bactériophages. Appliquée aux microbiomes de riz, elle a révélé de nouvelles perspectives, soulignant son potentiel pour la recherche sur le microbiome des plantes.
Matériaux et Méthodes
Préparation des échantillons
- Plantes de riz
- Enrichissement cellulaire bactérien
- Extraction d'ADN
Séquençage
- Séquençage de l'ARNr 16S
- Construction des bibliothèques SMRTbell
- Séquençage métagénomique à lecture longue
- Assemblée
- Annotation génétique
- Classification des contigs circulaires
- Analyse de la composition microbienne
- Fonction génique prédite
- Analyse statistique
Résultats
Les auteurs ont utilisé PacBio Sequel II pour séquencer l'ADN microbien associé aux feuilles, générant 140 Gbp de données avec une longueur de lecture moyenne de 17 kpb et une taille de bibliothèque moyenne de 15 kpb. Ils ont assemblé 26 067 contigs (N50 = 128 kpb), y compris 142 contigs circulaires. Plus de la moitié étaient de haute qualité (>5 profondeurs de lecture), représentant 80 % des lectures et >90 % des nucléotides dans des contigs ≥50 kpb. Tous les contigs ≥1 Mbp étaient de haute qualité, confirmant la fiabilité pour étudier la composition et les fonctions de la communauté bactérienne dans le microbiome phyllosphérique du riz.
Tableau 1. Résumé des résultats d'assemblage

L'étude a utilisé la métagénomique à longues lectures pour analyser la composition microbienne en utilisant des gènes 16S rRNA. Ils ont identifié 669 gènes 16S rRNA sur 561 contigs, dont beaucoup représentent potentiellement de nouvelles espèces bactériennes. L'analyse taxonomique a révélé 463 séquences avec une identité ≥97 % par rapport à des taxons connus, identifiant 59 espèces bactériennes. La comparaison avec des données d'amplicons 16S rRNA de pleine longueur et de séquençage à courtes lectures a mis en évidence une abondance plus élevée d'Actinobacteria dans le métagénome à longues lectures, soulignant son exactitude dans l'identification des communautés microbiennes dans la phyllosphère du riz.
Fig. 1 : Vue d'ensemble de la phylogénie des gènes 16S rRNA détectés dans le métagénome.
Fig. 2 : Abondance relative des gènes 16S rRNA détectés dans le métagénome, comparée aux séquences d'amplicons complets de gènes 16S rRNA et aux lectures courtes.
L'étude a identifié 2 046 382 gènes prédits, dont 364 262 annotés à l'aide de la base de données COG. Methylobacterium dominait des catégories fonctionnelles telles que le métabolisme des acides aminés et le transport des glucides. Ils ont reconstruit 142 contigs circulaires, y compris des chromosomes bactériens et un mégaplasmide. De nouvelles espèces ont été découvertes, et des plasmides divers, des bactériophages et des éléments liés au T4SS VirB/VirD4 ont été caractérisés, révélant une vaste diversité microbienne et un potentiel génétique dans la phyllosphère du riz grâce à la métagénomique à longues lectures.
Fig. 3 : Caractéristiques des contigs circulaires (n = 142).
La métagénomique en lecture longue a révélé le génome complet de Candidatus Saccharibacteria bactérie RRA8490, phylogénétiquement liée à la microflore buccale humaine. RRA8490 différait significativement des souches connues (identité d'acides aminés de 52,2 à 54,2 %), manquant de gènes de synthèse d'acides aminés et d'acides gras mais codant pour des voies de métabolisme du glucose, des mécanismes de production d'ATP, des pili de type IV et le complexe cytochrome oxydase (CyoABCDE) pour l'adaptation.
Fig. 4 : Métabolisme prédit de RRA8490, une nouvelle souche potentielle dans le Candidatus Saccharibacteria phylum.
Conclusion
Cette étude a utilisé l'extraction enzymatique d'ADN et le séquençage métagénomique à longues lectures pour profiler de manière exhaustive le microbiote des plantes. La méthode a révélé des plasmides et des bactériophages divers, et a caractérisé un génome de Candidatus Saccharibacteria adapté à la phyllosphère du riz. Ces résultats soulignent l'utilité du séquençage à longues lectures pour comprendre l'écologie microbienne associée aux plantes.
Référence
- Masuda S, Gan P, Kiguchi Y, et al. Découverte des microbiomes de la phyllosphère du riz à l'aide du séquençage métagénomique à longues lectures. Biologie des communications, 2024, 7(1) : 357.
Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :
Les communautés bactériennes de Cassiopea dans les Florida Keys partagent des taxons bactériens majeurs avec les microbiomes coralliens.
Journal : bioRxiv
Année : 2024
Production d'une protéine semblable à une bactériocine PEG 446 à partir de Clostridium tyrobutyricum NRRL B-67062
Journal : Probiotiques et Protéines Antimicrobiennes
Année : 2024
Démêler le rôle des pathobiontes des espèces de Bacteroides dans les maladies inflammatoires de l'intestin
Journal : bioRxiv
Année : 2023
Une ressource génomique au niveau des chromosomes pour étudier les mécanismes de virulence et l'évolution du pathogène de la rouille du café, Hemileia vastatrix.
Journal : bioRxiv
Année : 2022
Streptomyces buecherae sp. nov., un actinobactérie isolée de plusieurs espèces de chauves-souris
Journal : Antonie Van Leeuwenhoek
Année : 2020
Voir plus articles publiés par nos clients.