Why are longer sequencing reads preferable for metagenomics studies?

Longer sequencing reads offer several advantages for metagenomics studies, bolstering both the accuracy and comprehensiveness of genomic analyses: Enhanced Genome Assembly: The extended length of sequencing reads significantly improves the resolution of complex genomic regions, such as repetitive sequences and structural variations within microbial genomes. This leads to more contiguous and accurate genome assemblies when compared to the assemblies derived from shorter reads. Full-Length Gene and Operon Capture: The increased read length enhances the probability of capturing full-length genes and operons within a single read. This facilitates more precise functional annotations and pathway analyses, enabling a better understanding of microbial functions and interactions. Improved Resolution of Microbial Diversity: By spanning multiple variable regions within microbial genomes, longer reads allow for more precise identification and classification of microbial species and strains within complex communities. This improved resolution is crucial for studying microbial diversity and ecosystem dynamics. Reduction of Chimeric Assemblies: Short reads can often result in chimeric assemblies, where sequences from different genomes are incorrectly combined. The greater sequence context provided by longer reads mitigates this issue, reducing assembly errors and enhancing the overall accuracy of the genomic data. Insights into Microbial Genomic Structure: Longer reads provide valuable insights into the genomic structures of microbes, including gene clusters, mobile genetic elements, and genomic rearrangements. These insights are essential for understanding microbial evolution, adaptation, and the mechanisms underpinning microbial functions in various environments.

How does Long-Read Metagenomic Sequencing handle complex microbial communities?

Long-read sequencing technology can span repetitive regions and complex genomic structures more effectively than short-read technologies. This capability reduces assembly errors and improves the accuracy of microbial genome reconstructions within diverse microbial communities.

How does long-read sequencing differ from short-read sequencing?

Long-read sequencing generates reads spanning thousands to tens of thousands of base pairs, in contrast to short-read sequencing, which produces reads typically between 50 and 300 base pairs in length. The extended read lengths inherent in long-read sequencing confer a distinct advantage in elucidating complex genomic architectures, repetitive sequences, and complete transcript structures.

How does long-read sequencing improve data quality?

Long-read sequencing uses native DNA or RNA molecules, avoiding biases or errors introduced during synthetic amplification. It can also overcome assembly errors common in short-read sequencing, particularly in regions with repetitive sequences, thus enhancing data accuracy and completeness.

What are the challenges of long-read sequencing?

Despite its advantages, long-read sequencing faces challenges such as high costs, complex data analysis requirements, and technical demands for sample preparation. Some studies may require complementary technologies to obtain comprehensive genomic or transcriptomic information.

Séquençage métagénomique à lecture longue

CD Genomics a encore optimisé le processus pour dépasser les références de PacBio en termes de rendement et de longueur de lecture afin de soutenir le séquençage métagénomique à longues lectures, de réduire certaines erreurs d'épissage et d'améliorer efficacement la résolution du profilage des communautés microbiennes.

L'introduction du séquençage métagénomique à longues lectures

Métagénomique est défini comme l'analyse génétique directe des génomes contenus dans un échantillon environnemental. Le domaine a d'abord commencé par le clonage de l'ADN environnemental, suivi du criblage d'expression fonctionnelle, puis a été rapidement complété par le séquençage de l'ADN environnemental. Les échantillons microbiens proviennent de presque partout. Les exemples incluent des microenvironnements à l'intérieur et sur le corps humain dans des états sains et malades, des échantillons de sol, des racines de plantes, des environnements marins, des stations d'épuration, des zones urbaines, etc.

Dans les expériences de métagénomique, l'ADN génomique total isolé de l'environnement est séquencé. Cela permet au chercheur d'identifier les gènes présents et les processus métaboliques réalisés par ces communautés microbiennes, y compris les organismes non cultivables dans l'environnement.

Alors que de nombreux microorganismes naturels ne peuvent pas être isolés, cultivés ou clonés, une certaine biodiversité microbienne a été négligée lors de la préparation des échantillons et du séquençage. Désormais, CD Genomics propose un service de séquençage métagénomique à longues lectures sur le système PacBio SMRT, dans une méthode sans culture, qui peut séquencer des milliers d'organismes en parallèle, réduire certaines erreurs d'épissage et améliorer efficacement la résolution de l'identification des communautés microbiennes. Le séquençage métagénomique à longues lectures aide également les chercheurs à générer de nouvelles perspectives sur les fonctions et les voies du microbiome, en essayant de comprendre et d'élucider les relations entre les microbes et leur habitat/hôte.

L'analyse des données est basée sur les lectures CCS de molécules uniques de la plus haute qualité, sans besoin d'assemblage pour la classification au niveau des espèces, l'analyse fonctionnelle et l'étude de l'enrichissement des voies, ce qui pourrait restaurer l'information de la communauté microbienne dans l'environnement. Le séquençage métagénomique à longues lectures est un moyen puissant d'obtenir des génomes microbiens avec la plus grande précision et fiabilité.

Caractéristiques clés et avantages du séquençage métagénomique à longues lectures

Les longueurs de lecture moyennes les plus longues, avec environ 50 % des lectures dépassant 50 kb, ce qui dépasse la taille des éléments répétitifs dans le génome bactérien moyen.
Pas d'amplification de l'ADN.
Précision de consensus la plus élevée, faible biais de contexte de séquençage
Nouveaux programmes et pipelines d'analyse bioinformatique
Personnel bien expérimenté

Applications du séquençage métagénomique à lecture longue

Microbiologie environnementale :

Étudier la diversité microbienne et les fonctions écologiques dans le sol, l'eau et d'autres échantillons environnementaux.
Explorer les rôles et interactions des communautés microbiennes au sein des écosystèmes.

Recherche sur le microbiome humain :

Étudier la composition microbienne et les fonctions à travers les sites du corps humain (par exemple, intestin, cavité buccale, peau).
Examinez les relations entre le microbiote et les états de santé ou de maladie, tels que le syndrome métabolique ou les maladies inflammatoires de l'intestin.

Microbiologie industrielle :

Optimiser les structures et les fonctions des communautés microbiennes dans la fermentation et le bioprocédé.
Développer et sélectionner de nouveaux microbes et enzymes pour des applications industrielles.

Sciences agricoles :

Étudier l'impact des communautés microbiennes du sol sur la croissance et la santé des cultures.
Développer des engrais microbiens et des agents de biocontrôle pour améliorer la productivité agricole et la durabilité.

Flux de travail de séquençage métagénomique à lecture longue

Notre équipe d'experts compétents met en œuvre une gestion de la qualité rigoureuse à chaque étape pour garantir des résultats complets et précis. Voici un aperçu du flux de travail typique pour le séquençage métagénomique à longues lectures :

The Workflow of Long-Read Metagenomic Sequencing.

Spécifications du service

	Exigences d'échantillon ADN génomique ≥ 2 µg, Concentration ≥ 30 ng/µL Tissu ≥ 2 µg, Quantité minimale : 1 g Liquide interstitiel ≥6-10 mL, sédiment 2g, Quantité minimale : 2 mL, sédiment Échantillons environnementaux ≥6g, Quantité minimale : 2 g Membrane de filtre à eau ≥6, Quantité minimum : 2 Les échantillons d'ADN doivent avoir un rapport OD260/280 aussi proche que possible de 1,8 à 2,0. Tout l'ADN doit être traité avec de l'ARNase et ne doit montrer aucune dégradation ni contamination. Remarque : Les montants d'échantillons sont indiqués à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.
Cliquez	Stratégie de séquençage Plateformes PacBio bibliothèque de 20 K
	Analyse bioinformatique Nous proposons plusieurs analyses bioinformatiques personnalisées : Prédiction génique Catalogue de gènes non redondants Annotation fonctionnelle : KEGG, eggNOG, CAZy. Annotation taxonomique Voie, Carte thermique, ACP, Regroupement. … (plus sur demande) Remarque : Les données de sortie et les contenus d'analyse recommandés affichés sont uniquement à titre de référence. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Pipeline d'analyse

The Data Analysis Pipeline of Long-Read Metagenomic Sequencing.

Livrables

Les données de séquençage originales
Résultats expérimentaux
Rapport d'analyse des données
Détails sur le séquençage métagénomique en lecture longue pour votre rédaction (personnalisation)

Le système PacBio est très robuste et rentable et devrait être la plateforme de choix dans séquençage métagénomique, en particulier pour les échantillons complexes et les communautés microbiennes à faible diversité. CD Genomics sera votre meilleur compagnon pour le séquençage métagénomique à longues lectures. Veuillez nous contacter pour plus d'informations et un devis détaillé.

Résultats de la démo

Les résultats partiels sont affichés ci-dessous :

The Long-Read Metagenomic Sequencing Results Display Figure.

FAQs sur le séquençage métagénomique à lecture longue

1. Pourquoi les lectures de séquençage plus longues sont-elles préférables pour les études de métagénomique ?

Des lectures de séquençage plus longues offrent plusieurs avantages pour métagénomique études, renforçant à la fois l'exactitude et l'exhaustivité des analyses génomiques :

Assemblage génomique amélioré : La longueur étendue des lectures de séquençage améliore considérablement la résolution des régions génomiques complexes, telles que les séquences répétées et les variations structurelles au sein des génomes microbiens. Cela conduit à des assemblages génomiques plus contigus et précis par rapport aux assemblages dérivés de lectures plus courtes.
Capture de gènes et d'opérons en longueur complète : L'augmentation de la longueur des lectures accroît la probabilité de capturer des gènes et des opérons en longueur complète dans une seule lecture. Cela facilite des annotations fonctionnelles et des analyses de voies plus précises, permettant une meilleure compréhension des fonctions et des interactions microbiennes.
Amélioration de la résolution de la diversité microbienne : En couvrant plusieurs régions variables au sein des génomes microbiens, des lectures plus longues permettent une identification et une classification plus précises des espèces et des souches microbiennes au sein de communautés complexes. Cette amélioration de la résolution est cruciale pour l'étude de la diversité microbienne et des dynamiques des écosystèmes.
Réduction des assemblages chimériques : Les courtes lectures peuvent souvent entraîner des assemblages chimériques, où des séquences de différents génomes sont incorrectement combinées. Le contexte de séquence plus large fourni par des lectures plus longues atténue ce problème, réduisant les erreurs d'assemblage et améliorant l'exactitude globale des données génomiques.
Aperçus sur la structure génomique microbienne : Des lectures plus longues fournissent des informations précieuses sur les structures génomiques des microbes, y compris les grappes de gènes, les éléments génétiques mobiles et les réarrangements génomiques. Ces aperçus sont essentiels pour comprendre l'évolution microbienne, l'adaptation et les mécanismes sous-jacents aux fonctions microbiennes dans divers environnements.

2. Comment le séquençage métagénomique à longues lectures gère-t-il des communautés microbiennes complexes ?

Séquençage à lecture longue La technologie peut couvrir des régions répétitives et des structures génomiques complexes plus efficacement que les technologies de séquençage à court read. Cette capacité réduit les erreurs d'assemblage et améliore la précision des reconstructions de génomes microbiens au sein de communautés microbiennes diverses.

3. En quoi le séquençage à longues lectures diffère-t-il du séquençage à courtes lectures ?

Le séquençage à lecture longue génère des lectures s'étendant sur des milliers à des dizaines de milliers de paires de bases, contrairement au séquençage à lecture courte, qui produit des lectures généralement comprises entre 50 et 300 paires de bases de longueur. Les longueurs de lecture étendues inhérentes au séquençage à lecture longue confèrent un avantage distinct pour élucider des architectures génomiques complexes, des séquences répétitives et des structures de transcrits complètes.

4. Comment le séquençage à longues lectures améliore-t-il la qualité des données ?

Séquençage à lecture longue utilise des molécules d'ADN ou d'ARN natifs, évitant les biais ou les erreurs introduites lors de l'amplification synthétique. Cela peut également surmonter les erreurs d'assemblage courantes dans le séquençage à lecture courte, en particulier dans les régions à séquences répétitives, améliorant ainsi l'exactitude et l'exhaustivité des données.

5. Quels sont les défis du séquençage à longues lectures ?

Malgré ses avantages, le séquençage à longues lectures fait face à des défis tels que des coûts élevés, des exigences complexes en matière d'analyse de données et des demandes techniques pour la préparation des échantillons. Certaines études peuvent nécessiter des technologies complémentaires pour obtenir des données génomiques complètes ou transcriptomique information.

Études de cas sur le séquençage métagénomique à lecture longue

Découverte des microbiomes de la phyllosphère du riz à l'aide du séquençage métagénomique à longues lectures

Journal : Communications Biology

Facteur d'impact : 6,548

Publié : 27 mars 2024

Contexte

La phyllosphère abrite des communautés microbiennes diverses connues sous le nom de microbiome des plantes, essentielles à la croissance et à la santé des plantes grâce à l'absorption des nutriments et à la résistance aux maladies. Influencé par la génétique de l'hôte, les mécanismes de défense, les facteurs environnementaux et les activités humaines, la complexité du microbiome impacte de manière imprévisible la santé des plantes. Séquençage de nouvelle génération révèle la diversité microbienne et le potentiel fonctionnel, mais fait face à des biais. La métagénomique à longues lectures surmonte les limitations, permettant une reconstruction complète des génomes et l'identification de nouveaux éléments génétiques tels que les plasmides et les bactériophages. Appliquée aux microbiomes de riz, elle a révélé de nouvelles perspectives, soulignant son potentiel pour la recherche sur les microbiomes des plantes.

Matériaux et Méthodes

Préparation des échantillons

Plantes de riz
Enrichissement cellulaire bactérien
Extraction d'ADN

Séquençage

Séquençage de l'ARNr 16S
Construction des bibliothèques SMRTbell
Séquençage métagénomique à lecture longue

Analyse de données

Assemblée
Annotation génétique
Classification des contigs circulaires
Analyse de la composition microbienne
Fonction génique prédite
Analyse statistique

Résultats

Les auteurs ont utilisé PacBio Sequel II pour séquencer l'ADN microbien associé aux feuilles, générant 140 Gbp de données avec une longueur de lecture moyenne de 17 kpb et une taille de bibliothèque moyenne de 15 kpb. Ils ont assemblé 26 067 contigs (N50 = 128 kpb), y compris 142 contigs circulaires. Plus de la moitié étaient de haute qualité (>5 profondeurs de lecture), représentant 80 % des lectures et >90 % des nucléotides dans des contigs ≥50 kpb. Tous les contigs ≥1 Mbp étaient de haute qualité, confirmant la fiabilité pour étudier la composition et les fonctions de la communauté bactérienne dans le microbiome de la phyllosphère du riz.

Tableau 1. Résumé des résultats d'assemblage

L'étude a utilisé la métagénomique à lecture longue pour analyser la composition microbienne en utilisant les gènes 16S rRNA. Ils ont identifié 669 gènes 16S rRNA sur 561 contigs, dont beaucoup représentent des espèces bactériennes potentiellement nouvelles. L'analyse taxonomique a révélé 463 séquences avec une identité ≥97 % par rapport à des taxons connus, identifiant 59 espèces bactériennes. La comparaison avec les données d'amplicons 16S rRNA de pleine longueur et de séquençage à lecture courte a mis en évidence une abondance plus élevée d'Actinobacteria dans le métagénome à lecture longue, soulignant son exactitude dans l'identification des communautés microbiennes dans la phyllosphère du riz.

Fig. 1: Phylogenetic overview of detected 16S rRNA genes in the metagenome. (Masuda et al., 2024) Fig. 1 : Aperçu de la phylogénie des gènes d'ARNr 16S détectés dans le métagénome.

Fig. 2: Comparison of relative abundance of 16S rRNA genes in the metagenome, full-length amplicon sequences, and short reads. (Masuda et al., 2024) Fig. 2 : Abondance relative des gènes 16S rRNA détectés dans le métagénome, comparée aux séquences d'amplicons en longueur complète des gènes 16S rRNA et aux lectures courtes.

L'étude a identifié 2 046 382 gènes prédits, dont 364 262 annotés à l'aide de la base de données COG. Methylobacterium dominait des catégories fonctionnelles telles que le métabolisme des acides aminés et le transport des glucides. Ils ont reconstruit 142 contigs circulaires, y compris des chromosomes bactériens et un mégaplasmide. De nouvelles espèces ont été découvertes, et divers plasmides, bactériophages et éléments liés au T4SS VirB/VirD4 ont été caractérisés, révélant une vaste diversité microbienne et un potentiel génétique dans le phyllosphère du riz grâce à la métagénomique à lecture longue.

Fig. 3: Properties of circular contigs (n = 142). (Masuda et al., 2024) Fig. 3 : Caractéristiques des contigs circulaires (n = 142).

La métagénomique en lecture longue a révélé le génome complet de Candidatus Saccharibacteria bactérie RRA8490, phylogénétiquement liée à la microflore buccale humaine. RRA8490 différait significativement des souches connues (identité des acides aminés de 52,2 à 54,2 %), manquant de gènes de synthèse des acides aminés et des acides gras mais codant pour des voies de métabolisme du glucose, des mécanismes de production d'ATP, des pili de type IV et le complexe cytochrome oxydase (CyoABCDE) pour l'adaptation.

Fig. 4: Predicted metabolic profile of RRA8490, a putative novel strain in the Candidatus Saccharibacteria phylum. (Masuda et al., 2024) Fig. 4 : Métabolisme prédit de RRA8490, une nouvelle souche potentielle dans le Candidatus Saccharibacteria phylum.

Conclusion

Cette étude a utilisé l'extraction enzymatique d'ADN et le séquençage métagénomique à longues lectures pour profiler de manière exhaustive le microbiote des plantes. La méthode a révélé des plasmides et des bactériophages divers, et a caractérisé un génome de Candidatus Saccharibacteria adapté à la phyllosphère du riz. Ces résultats soulignent l'utilité du séquençage à longues lectures pour comprendre l'écologie microbienne associée aux plantes.

Référence

Masuda S, Gan P, Kiguchi Y, et al. Découverte des microbiomes de la phyllosphère du riz à l'aide du séquençage métagénomique à longues lectures. Biologie des communications, 2024, 7(1) : 357.

Publications connexes

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

Les communautés bactériennes de Cassiopea dans les Keys de Floride partagent des taxons bactériens majeurs avec les microbiomes coralliens.

Journal : bioRxiv

Année : 2024

Je suis désolé, mais je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Production d'une protéine semblable à une bactériocine PEG 446 à partir de Clostridium tyrobutyricum NRRL B-67062

Journal : Probiotiques et Protéines Antimicrobiennes

Année : 2024

Démêler le rôle des pathobiontes des espèces de Bacteroides dans les maladies inflammatoires de l'intestin

Journal : bioRxiv

Année : 2023

Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.

Une ressource génomique au niveau des chromosomes pour étudier les mécanismes de virulence et l'évolution du pathogène de la rouille du café, Hemileia vastatrix.

Journal : bioRxiv

Année : 2022

Je suis désolé, mais je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.

Streptomyces buecherae sp. nov., un actinomycète isolé de plusieurs espèces de chauves-souris

Journal : Antonie Van Leeuwenhoek

Année : 2020

Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir et je serai heureux de vous aider.

Voir plus articles publiés par nos clients.