Amélioration de la prédiction de la fonction du microbiome avec le séquençage complet 16s

L'utilisation de la technologie de séquençage d'amplicons de nouvelle génération a suscité des débats au sein de la communauté de recherche sur le microbiome en raison de ses limitations inhérentes, principalement sa courte longueur de lecture et la rareté d'informations qu'elle fournit. La précision taxonomique des gènes marqueurs est un facteur clé influençant directement la fiabilité et la crédibilité de la prédiction de la fonction du microbiome. Par conséquent, une question clé se pose : la prédiction de fonction basée sur les résultats de séquençage d'amplicons de nouvelle génération peut-elle être considérée comme crédible, et existe-t-il une alternative supérieure pour favoriser une recherche plus efficace et précise dans le domaine de la prédiction de fonction ?

Une étude récente a approfondi l'exactitude de la prédiction de fonction et a mis en lumière certaines préoccupations critiques liées à la validité biologique de la prédiction de fonction du microbiome. Cette étude a examiné le rôle de la composition taxonomique, en particulier lorsqu'elle est dérivée du séquençage à courte lecture, et a analysé des facteurs tels que la résolution taxonomique des gènes marqueurs, la variabilité intragénomique de ces gènes et la nature compositionnelle des données du microbiome. Elle a convaincu que le séquençage 16S en pleine longueur est sur le point de remplacer le séquençage à courte lecture comme méthode principale pour prédire la fonction du microbiome. Cette transition devrait inaugurer une nouvelle ère où le séquençage 16S en pleine longueur occupera le devant de la scène dans la prédiction de la fonction du microbiome, offrant une précision et une crédibilité accrues dans ce domaine de recherche critique.

Prédire le potentiel fonctionnel à partir des profils taxonomiques du microbiome générés par le séquençage d'amplicons à courte lecture.Prédire le potentiel fonctionnel à partir des profils taxonomiques du microbiome générés par le séquençage d'amplicons à courte lecture. (Heidrich et al., 2022)

Résolution taxonomique dans le séquençage 16S en pleine longueur

Dans le domaine de la recherche en microbiologie, le séquençage d'amplicons à courte lecture utilisant la plateforme Illumina est la technologie de choix prédominante. Le mode de séquençage PE300, générant des séquences de 2x300 paires de bases, est largement adopté. Dans ce domaine, le séquençage d'amplicons longs à courte lecture est principalement utilisé pour examiner les segments taxonomiquement informatifs de l'ARN ribosomal 16S (rRNA) bactérien et des loci d'espaceurs internes transcrits (ITS) fongiques. Cependant, le séquençage de régions partielles de ces gènes sur la plateforme Illumina présente souvent des limitations en matière de discrimination au niveau des espèces et peine à différencier des souches étroitement liées.

Des avancées récentes ont montré le potentiel du séquençage 16S en pleine longueur, réalisable grâce à des technologies de séquençage à longue lecture comme PacBio, pour améliorer significativement la résolution taxonomique. Le séquençage 16S en pleine longueur couvre de manière exhaustive toutes les neuf régions variables du gène 16S rRNA, fournissant ainsi une richesse d'informations dépassant celle du séquençage à région unique. Il promet une identification taxonomique précise au niveau des espèces et peut discerner efficacement les polymorphismes de séquence tout en localisant les positions taxonomiques.

De plus, le séquençage 16S en pleine longueur non seulement identifie avec précision les polymorphismes de séquence, mais permet également de localiser les variations au niveau des souches. Cette sensibilité accrue favorise la découverte de nouvelles espèces microbiennes et fournit une représentation plus fidèle des structures des communautés microbiennes au sein des échantillons.

Bien que le coût du séquençage 16S en pleine longueur reste relativement élevé, il est prévu qu'à long terme, cette technologie, qu'elle soit réalisée par séquençage d'amplicons à longue lecture ou reconstruction bioinformatique à partir de séquençage d'amplicons à courte lecture identifiés de manière unique, remplacera progressivement les méthodes de séquençage à courte lecture. Ce changement promet d'élever la résolution taxonomique et, par conséquent, de favoriser des prédictions plus précises des fonctions microbiennes.

Variabilité intragénomique des gènes marqueurs

Un autre défi dans l'analyse de la structure du microbiome à l'aide de données de séquençage d'amplicons réside dans les variations du nombre de copies des gènes marqueurs au sein des génomes microbiens. Cette variabilité est parfois mal interprétée comme une diversité allélique, ce qui peut introduire de la confusion dans l'analyse de la composition du microbiome. Parallèlement, la variabilité intragénomique au sein des gènes marqueurs entrave l'évaluation précise de l'importance relative des fonctions potentielles, ce qui peut conduire à une surestimation de la diversité au sein des profils fonctionnels potentiels.

Les limitations de la technologie de séquençage de nouvelle génération (NGS) deviennent évidentes dans son incapacité à identifier précisément la variabilité génétique intragénomique. Cela est principalement dû à la courte longueur de lecture de la technologie et à la couverture de séquençage restreinte. En revanche, le séquençage 16S en pleine longueur, caractérisé par sa couverture et sa précision supérieures, excelle dans l'identification précise des polymorphismes de séquence et la localisation des variations au niveau des souches.

La nature compositionnelle des données du microbiome

Un aspect critique à considérer est que le nombre de lectures de séquence générées par le séquençage de nouvelle génération (NGS) à partir d'un échantillon ne correspond pas directement au nombre de cellules bactériennes dans cet échantillon, ce qui rend problématique la traduction des lectures en abondance bactérienne. Le NGS ne révèle que la taille relative d'un segment spécifique de la communauté microbienne représenté par chaque unité taxonomique. Cette caractéristique assemble le jeu de données du microbiome NGS pour fournir des informations sur l'abondance relative des lectures de séquence, exprimées en proportions ou en fréquences de taxa dans une communauté microbienne. Cependant, il ne fournit pas d'informations sur l'abondance absolue des taxa, principalement parce que la taille globale (biomasse microbienne) de la communauté reste non divulguée.

Par conséquent, même si le profil fonctionnel prédit d'une communauté s'aligne avec sa fonction réelle, estimer l'ampleur du potentiel fonctionnel devient un défi redoutable en raison du manque de prise en compte de la taille totale de la population de la communauté. Diverses méthodes de quantification microbienne existent pour répondre à cette limitation, mais elles peuvent introduire une hétérogénéité supplémentaire des données.

Une approche alternative pour atténuer le problème de l'analyse des données compositionnelles microbiennes est l'utilisation de ratios. Cette méthode élimine les biais découlant de l'auto-chargement microbien et aide à surmonter les défis associés au biais d'amplification PCR, une source d'erreur bien reconnue qui peut déformer la composition de la communauté et les prédictions fonctionnelles.

Découvrir la véritable fonction du microbiote

Une autre approche plus complexe consiste à mesurer la fonction réelle du microbiote chaque fois que cela est possible. Cependant, cette entreprise n'est réalisable que dans des conditions spécifiques : la communauté microbienne doit être accessible, la fonction cible doit être activement engagée au moment de l'échantillonnage, et il doit y avoir une taille de population et un volume d'échantillon suffisamment grands disponibles pour l'analyse. Pour les microbiotes qui ne répondent pas à ces critères, des techniques supplémentaires telles que la PCR quantitative fluorescente en temps réel servent de compléments précieux pour caractériser quantitativement le potentiel génétique de certains gènes fonctionnels. Il est essentiel de reconnaître que ces potentiels génétiques ne correspondent pas nécessairement aux activités et processus microbiens réels.

Dans cette perspective, des techniques histologiques telles que la transcriptomique, la protéomique et la métabolomique s'avèrent instrumentales pour explorer le potentiel génétique qui a été traduit en action. Combiner la prédiction fonctionnelle avec la mesure de fonctions spécifiques représente une approche puissante pour obtenir des informations sur la fonctionnalité microbienne.

Référence :

  1. Heidrich, Vitor, et Lukas Beule. "Les amplicons à courte lecture sont-ils adaptés à la prédiction du potentiel fonctionnel du microbiome ? Une perspective critique." iMeta 1.3 (2022) : e38.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Parlez à nos scientifiques
De quoi aimeriez-vous discuter ?
Avec qui allons-nous parler ?

* est un élément requis.

Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut