Un guide complet des génomes assemblés par métagénome

L'avènement des génomes assemblés à partir de métagénomes (MAGs) a transformé la génomique microbienne, car il permet la reconstruction spécifique de génomes individuels à partir de données métagénomiques. Les MAGs donnent accès à des organismes microbiens non cultivés qui peuvent être des ressources potentielles, soulignant que cette pratique est capable d'exploiter une infinité de formes de vie non assignées qui ne peuvent pas être cultivées par des méthodes de culture traditionnelles. Cette approche a permis d'étudier des écosystèmes complexes comme le sol, les océans et le microbiome humain - où des milliers d'espèces vivent et interagissent.

Les MAGs sont générés à partir de jeux de données métagénomiques en assemblant des lectures courtes ou longues disponibles à l'aide de technologies couramment utilisées, permettant un séquençage à haut débit, et en organisant les contigs en unités au niveau du génome à l'aide d'approches computationnelles. Ces génomes sont extrêmement utiles pour déchiffrer le potentiel métabolique, la fonction écologique et les relations évolutives des microbes dans les écosystèmes gérés et naturels. Et à mesure que le séquençage devient de plus en plus abordable et accessible, les MAGs s'avèrent être un outil essentiel pour déchiffrer la vie microbienne. Ils servent de base pour séparer des interactions microbiennes compliquées, identifier de nouvelles voies et explorer les capacités fonctionnelles des communautés microbiennes. Ce pouvoir révolutionnaire d'examiner les génomes sans processus de culture a des conséquences considérables pour la biologie environnementale, la santé humaine et les usages industriels.

Les MAGs supplémentaires aident à résoudre le problème de la "matière noire microbienne" car ils reconstruisent des génomes d'espèces d'organismes qui n'ont pas été cultivés en laboratoire. Ces découvertes ont également élucidé des processus écologiques et évolutifs, mettant en évidence de nouvelles lignées microbiennes et des voies métaboliques. La résolution des génomes à partir de communautés microbiennes mixtes a également permis aux chercheurs d'en apprendre davantage sur les relations symbiotiques et la compétition entre microorganismes. Ici, nous avons présenté une revue intégrée sur les MAGs afin de fournir une brève introduction à la compréhension et à l'application des MAGs.

Qu'est-ce que la reconstruction MAG ?

La reconstruction MAG fait référence à l'assemblage de données métagénomiques en fragments de génome. Cependant, en raison de la complexité et de l'hétérogénéité des communautés microbiennes, ce processus est encore compliqué.

  • Séquençage métagénomiqueDans séquençage métagénomiquel'ensemble de la séquence de matériel génétique d'un échantillon est séquencé. Cette méthode caractérise la diversité génomique des communautés microbiennes complètes, englobant les bactéries, les archées, les virus et les eucaryotes. Comme la métagénomique n'isole pas les organismes individuels, elle reflète une vue plus holistique du paysage génétique de l'écosystème.
  • Assemblage et BinningL'assemblage métagénomique fait référence à la construction de séquences contiguës (contigs) à partir de lectures de séquençage brutes. Ces contigs sont ensuite répartis dans des bacs basés sur la séquence et la couverture qui reflètent des génomes préliminaires d'espèces individuelles. Dans le cas de données de séquençage métagénomique par tir aléatoire mixte, le regroupement est essentiel pour extraire le matériel génétique des organismes individuels ayant participé à l'expérience, en particulier dans des environnements microbiens hyper-divers.
  • Évaluation de la qualitéCes métriques incluent la complétude, la contamination et la fragmentation du génome pour évaluer la qualité des MAGs. Des MAGs de bonne qualité sont au moins à 90 % complets avec moins de 5 % de contamination, ce qui les rend utiles pour les analyses fonctionnelles et les études comparatives. Ces métriques sont évaluées par des logiciels tels que CheckM et BUSCO qui effectuent l'indexation de la récupération des orthologues à copie unique et des niveaux de contamination génomique.

Over view of MAGSchéma d'analyse du métagénome (Goussarov, G. et al. 2022).

Défis actuels

  • Complexité communautaireIl existe des milliers d'espèces avec des abondances différentes dans une communauté microbienne, rendant l'assemblage et le regroupement difficiles. La récupération du génome est biaisée en faveur des espèces à forte abondance, ce qui entraîne une sous-représentation des organismes à faible abondance dans les données. Cela nécessite une optimisation minutieuse des stratégies d'échantillonnage et de la profondeur de séquençage.
  • Éléments répétitifsLes éléments répétés à l'intérieur et entre les génomes compliquent l'assemblage approprié des contigs. Les éléments transposables ou les opérons conservés, par exemple, introduisent des ambiguïtés dans le mappage des lectures et le lien des contigs. Des algorithmes tels que Flye et Canu, qui combinent des données de séquençage à longue lecture, ont bien fonctionné pour résoudre ces régions.
  • ContaminationLa présence d'artefacts de séquençage et de signaux chevauchants provenant d'espèces étroitement liées peut introduire de la contamination dans des MAGs très similaires. Cela nuit encore aux annotations fonctionnelles et aux analyses en aval. Ces bacs peuvent être affinés en utilisant des outils supplémentaires tels que MetaWRAP, qui élimine davantage les contaminants et affine les bacs génomiques.
  • Exigences informatiquesLa vaste nature dimensionnelle des ensembles de données métagénomiques nécessite des ressources informatiques de haute dimension pour l'assemblage, le regroupement et le raffinement. Les ensembles de données contenant des milliards de lectures nécessitent des systèmes à haute mémoire et des processus parallèles pour être gérés. L'utilisation de plus en plus répandue des solutions de cloud computing et des pipelines optimisés rend possible l'échelle de la reconstruction des MAG.

Technologies et méthodologies computationnelles

Le succès de la reconstruction des MAG a donc été propulsé par des innovations matérielles et algorithmiques en constante évolution. Avec des plateformes de séquençage spécifiques et des logiciels d'analyse de données, tous ces éléments contribuent à la génération de MAGs de haute qualité.

Plateformes de séquençage

Les outils émergents ont fourni des stratégies pour aborder les problèmes dans les MAGs. Par exemple, le séquençage Illumina a été appliqué dans des études métagénomiques en raison de son coût inférieur et de sa scalabilité aujourd'hui. Cependant, ses courtes lectures ont tendance à ne pas bien fonctionner dans les régions hautement répétitives.

  • Séquençage à long terme (PacBio et Nanopore)Produire des lectures qui peuvent s'étendre sur des dizaines de kilobases, ce qui est crucial pour couvrir les régions répétitives afin de mieux assembler des génomes complexes. Les lectures PacBio HiFi, par exemple, offrent de longues longueurs de lecture tout en garantissant une grande précision, permettant des améliorations tant en continuité qu'en exactitude dans les assemblages.
  • Approches hybridesLa fusion des lectures courtes et longues maximise l'exactitude et la continuité des assemblages, en particulier dans les communautés microbiennes complexes. Les approches hybrides tirent parti des capacités de correction d'erreurs des lectures courtes et des informations structurelles fournies par les lectures longues. MaSuRCA et SPAdes sont des outils couramment utilisés pour cela.

Outils d'assemblage

  • MEGAHIT et MetaSPAdes: Adapté aux données métagénomiques ; il fonctionne plutôt bien avec les ensembles de données à courtes lectures. MEGAHIT a été conçu pour des ensembles de données ultra-grands, tandis que MetaSPAdes offre une correction d'erreurs et un cadre de construction de graphes itératif pour l'assemblage métagénomique.
  • Flye et CanuDes outils spécialisés d'assemblage de longues lectures qui peuvent être utiles dans des métagénomes de faible complexité pour construire des séquences contiguës. Flye peut traiter des longues lectures bruyantes, donc gère les données Nanopore, tandis que Canu s'occupe des assemblages PacBio.

Algorithmes de binning

  • Méthodes basées sur la composition : MetaBAT et CONCOCT sont des exemples d'outils basés sur la composition qui regroupent les contigs en fonction de métriques de composition de séquence, y compris la teneur en GC et les fréquences de tétranucleotides. Ces méthodes sont efficaces pour distinguer les génomes dans des communautés de diversité intermédiaire.
  • Méthodes basées sur la couverture : Des outils comme MaxBin exploitent la couverture différentielle dans chaque échantillon pour améliorer la précision du regroupement. En examinant les différences de couverture, ces outils peuvent distinguer des génomes ayant des compositions de séquence identiques.
  • Méthodes hybrides : Certains algorithmes tels que DAS Tool combinent différentes méthodes de binning afin d'optimiser et d'améliorer la qualité des bins génomiques. Cette combinaison offre un meilleur rappel et une plus grande précision dans l'identification des bins génomiques, dans des ensembles de données très diversifiés.

Outils de raffinement

  • CheckM : Évaluer l'exhaustivité et la contamination pour évaluer la qualité des MAG. Il est précieux pour surveiller l'utilité des MAG dans les analyses en aval.
  • Outils d'assemblage : MetaWRAP et Anvi'o disposent de flux de travail pour la réassemblage et le raffinement des MAGs afin d'améliorer la précision et l'utilisabilité. Sur cette base, ces outils permettent la visualisation et l'exploration approfondie des données métagénomiques, facilitant ainsi une meilleure interprétation des résultats.

Demande pour des génomes assemblés à partir de métagénomes

Des sciences environnementales à la médecine, les MAG ont des applications transformantes dans de multiples disciplines. Ils sont la clé pour révéler à la fois la diversité microbienne non cultivée et pour clarifier les fonctions microbiennes, et ils jouent un rôle d'ouverture sur le futur chemin évolutif de notre planète.

Microbiologie environnementale

Les MAGs permettent d'étudier les assemblages microbiens dans divers environnements, y compris les sols, les milieux marins et les habitats extrêmes. Les chercheurs ont tissé des génomes à partir des données et ont cartographié les voies métaboliques qui exploitent le cycle des nutriments, la séquestration du carbone et la dégradation des polluants. Ainsi, les MAGs issus d'échantillons environnementaux comme les sédiments des grands fonds marins peuvent fournir de nouvelles perspectives sur la base génétique des processus biogéochimiques tels que le métabolisme du méthane et la dégradation des hydrocarbures. De telles perspectives peuvent éclairer les cycles biogéochimiques et les processus biotechnologiques.

Études sur le microbiome humain

Dans la santé humaine, les MAG fournissent des informations sur la structure et la fonction du microbiome humain. Ils ont joué un rôle crucial dans la découverte d'espèces microbiennes liées à des troubles tels que les maladies inflammatoires de l'intestin, l'obésité et le cancer. Les MAG révèlent également des gènes fonctionnels liés au métabolisme des médicaments et à la résistance, préparant ainsi le terrain pour la médecine personnalisée. Un exemple serait les analyses dérivées des MAG des microbiomes intestinaux, détectant des voies associées à la modulation immunitaire de l'hôte et aux troubles métaboliques.

Biotechnologie industrielle

Les MAGs améliorent l'étude des enzymes et des voies pertinentes pour l'industrie. Un exemple est l'utilisation des enzymes identifiées par les MAG impliquées dans la dégradation de la lignocellulose pour la production de biocarburants. Le minage génomique des MAGs a également conduit à la découverte de nouveaux composés antimicrobiens et de métabolites secondaires. Ces applications soulignent le rôle prometteur des MAGs dans la résolution de grands enjeux mondiaux tels que l'énergie durable et la résistance aux antibiotiques.

Liaison entre les perspectives évolutives et écologiques

Les MAGs fournissent des informations sur l'histoire évolutive et les rôles écologiques des microorganismes. Grâce à la génomique comparative des MAGs, il sera possible de retracer les origines évolutives de traits, tels que la résistance aux antibiotiques ou les relations symbiotiques. Les MAGs conservent également la capacité de fournir des informations sur les interactions microbiennes et la spécialisation des niches, essentielles pour une compréhension holistique des communautés dans lesquelles ils se trouvent. Les analyses des MAGs dérivés des microbiomes des récifs coralliens, par exemple, ont suggéré des rôles des microbes dans la santé des coraux et les réponses au stress.

Directions et innovations dans le futur

Les technologies et méthodologies émergentes dans le domaine de recherche MAG ont déjà suggéré des moyens de surmonter les limitations actuelles et d'élargir le champ des applications.

Développements dans les techniques de séquençage

L'amélioration des algorithmes de base-calling et l'utilisation du séquençage à ultra-longue lecture augmenteront à la fois la résolution et l'exhaustivité des MAGs. De plus, ces avancées permettront désormais la reconstruction de génomes plus difficiles et plus grands, tels que ceux des microbes eucaryotes. La poursuite de la réduction des coûts de séquençage, sans déclin de la qualité des données, augmentera l'accès à la reconstruction des MAG.

Intégration de données multi-omiques basée sur un modèle hydrique

L'intégration de la métagénomique avec la transcriptomique, la protéomique et la métabolomique offre une perspective plus holistique sur les communautés microbiennes. L'intégration des multi-omiques permet d'associer les génomes assemblés par métagénome (MAGs) avec des traits fonctionnels et phénotypiques pour fournir des éclairages sur la fonction des microbes dans les systèmes écologiques. Ce cadre peut être particulièrement utile pour interpréter les réponses microbiennes aux changements environnementaux et leurs rôles fonctionnels dans la génération de la stabilité des écosystèmes.

IA et apprentissage automatique

Utilisation d'algorithmes d'apprentissage automatique pour améliorer l'assemblage, le binning et l'annotation métagénomiques. Ces outils améliorent la précision de la reconstruction génomique et minimisent les goulets d'étranglement computationnels, facilitant ainsi l'identification de nouveaux génomes et gènes. Les approches de binning basées sur l'IA ont montré un potentiel pour révéler des motifs complexes présents dans ces ensembles de données, conduisant à une récupération améliorée de MAG de haute qualité dans des environnements plus compliqués.

Observatoires et bases de données internationaux

D'énormes quantités de données métagénomiques sont générées par des projets tels que le Projet Microbiome de la Terre et le Projet Microbiome Humain. Des flux de travail standardisés et des bases de données en accès libre sont nécessaires pour faciliter l'utilisation des MAGs. Ces initiatives favorisent la collaboration mondiale et le partage des données, accélérant les découvertes en génomique microbienne et en écologie.

Étude de cas : Reconstruction des MAGs du microbiome intestinal humain

Contexte

Le microbiome intestinal humain est un écosystème microbien complexe ayant des impacts profonds sur la santé et les maladies humaines. Malgré son importance, une proportion substantielle de sa diversité microbienne reste non cultivée et mal caractérisée. Les chercheurs ont pour objectif de reconstruire une haute qualité MAGs des métagénomes intestinaux humains pour mieux comprendre la composition, le potentiel métabolique et les rôles fonctionnels de ces microbes.

Méthodes

  • Collecte d'échantillons et séquençageDes échantillons fécaux provenant de diverses populations humaines ont été collectés pour obtenir une large représentation de la diversité microbienne intestinale. Séquençage métagénomique a été réalisé en utilisant la technologie Illumina pour des lectures courtes à haute profondeur et complété par Oxford Nanopore pour des lectures longues afin de résoudre des régions complexes.
  • Assemblage et BinningLes lectures métagénomiques ont été assemblées à l'aide de MEGAHIT pour l'assemblage de courtes lectures et de Flye pour l'intégration de longues lectures. Le regroupement du génome a été effectué en utilisant une combinaison de MetaBAT2 et MaxBin, tirant parti de la composition des séquences et de la couverture différentielle entre les échantillons pour séparer les génomes individuels.
  • Évaluation et amélioration de la qualitéCheckM a été utilisé pour évaluer la complétude et la contamination des MAGs. Des bins de haute qualité (>90 % de complétude, <5 % de contamination) ont été conservés, et un affinage manuel a été effectué à l'aide d'Anvi'o. Les annotations fonctionnelles ont été réalisées avec Prokka et le mapping sur la base de données KEGG.

Résultats

  • Récupération de génomes novateurs : Plus de 100 000 MAGs ont été reconstruits, y compris des milliers de génomes bactériens et archéens novateurs. Une part significative de ceux-ci représentait des taxons microbiaux précédemment non cultivés.
  • Aperçus fonctionnels : Des voies métaboliques clés ont été identifiées, y compris celles impliquées dans la dégradation des fibres, la production d'acides gras à chaîne courte et la biosynthèse des acides aminés. L'étude a également révélé des gènes microbiens liés au métabolisme des médicaments et à la résistance, mettant en évidence le rôle du microbiome dans la modulation de l'efficacité thérapeutique.
  • Analyse au niveau de la population : Des analyses comparatives ont révélé des différences de composition microbienne entre les populations, mettant en lumière l'impact de l'alimentation, de la géographie et du mode de vie sur la diversité du microbiote intestinal.

Genomic maps of four MAGsCartes génomiques de quatre MAGs complets assemblés (circularisés, sans lacunes) (CMAGs) (Jin, H. et al 2021).

Conclusion

Les MAGs ont ouvert la voie à la génomique microbienne de la majorité non cultivée de la vie. Les MAGs permettent un aperçu sans précédent de la diversité microbienne, de l'écologie et de la fonction en récupérant des génomes directement à partir d'échantillons environnementaux. Bien que l'assemblage et le regroupement ne soient pas sans défis, les approches et les outils d'assemblage de génomes évoluent continuellement pour fournir des MAGs de meilleure qualité et plus accessibles. Dans ce paysage en évolution, les MAGs deviendront de plus en plus essentiels pour résoudre des problèmes mondiaux, tels que ceux liés à la durabilité environnementale et à la santé humaine, établissant ainsi leur position dans l'ère génomique.

Références

  1. Goussarov, G., Mysara, M., Vandamme, P., & Van Houdt, R. (2022). Introduction aux principes et méthodes sous-jacents à la récupération des génomes assemblés à partir de métagénomes à partir de données métagénomiques. MicrobiologieOuverte, 11(3), e1298. Je suis désolé, mais je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
  2. Jin, H., You, L., Zhao, F., Li, S., Ma, T., Kwok, L. Y., Xu, H., & Sun, Z. (2022). Le séquençage métagénomique hybride et ultra-profond permet la caractérisation génomique et fonctionnelle des espèces à faible abondance dans le microbiome intestinal humain. Microbes intestinaux, 14(1), 2021790. Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique à traduire, veuillez le fournir ici.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut