Introduction aux variants de séquence d'amplicon

Ces dernières années, séquençage d'amplicons la technologie est devenue un outil essentiel pour l'étude des microbiomes, de l'oncologie et de la génétique. En réalisant un séquençage à haut débit de régions génétiques spécifiques, les chercheurs peuvent déchiffrer la structure, les fonctions et les changements dynamiques des communautés microbiennes à partir d'échantillons complexes. Dans l'analyse des données de séquençage d'amplicons, le tableau des variantes de séquence d'amplicon (ASV) est l'une des principales sorties de données, fournissant un aperçu détaillé des variations de séquence et servant de fondement essentiel pour les étapes suivantes. analyses bioinformatiques.

Actuellement, les pipelines analytiques grand public, tels que QIIME 2 et DADA2, excellent dans la génération de tableaux ASV. Cependant, il reste encore des possibilités d'amélioration dans des domaines tels que le traitement des données, l'annotation fonctionnelle et l'intégration inter-plateformes. Cet article explore la construction et les applications des amplicons, mettant en lumière les dernières avancées et les orientations futures dans ce domaine.

Qu'est-ce que les variants de séquence d'amplicon ?

Les variants de séquence d'amplicon (ASV) sont devenus une technique à haute résolution largement adoptée dans la recherche sur le microbiome. Contrairement aux méthodes conventionnelles basées sur les unités taxonomiques opérationnelles (OTU), les ASV détectent les variations de séquence au niveau d'un seul nucléotide, permettant une précision et une fiabilité accrues. Lors de l'analyse des données d'amplicon 16S rRNA, 18S rRNA ou ITS, les tableaux de caractéristiques ASV offrent des aperçus détaillés sur la composition microbienne et l'abondance des échantillons. Cela en fait un outil puissant pour examiner la diversité, prédire les rôles fonctionnels et faire progresser les études écologiques.

Variants de séquence d'amplicon vs OTUs

Les ASVs et les OTUs sont deux méthodes utilisées pour analyser les communautés microbiennes sur la base de données de séquençage, mais elles diffèrent dans leur approche. Les OTUs regroupent les séquences en fonction d'un seuil de similarité prédéfini, généralement 97 % d'identité, ce qui peut entraîner une perte de résolution. En revanche, les ASVs identifient les variations de séquence au niveau d'un seul nucléotide. La sélection de ASV ou OTU L'analyse des données de séquençage d'amplicons dépend des objectifs de recherche, de la conception expérimentale et des caractéristiques des échantillons.

Construction du tableau des variantes de séquence d'amplicon

1. Acquisition de données

La construction d'une table de caractéristiques ASV commence par des données de séquençage d'amplicons de haute qualité. Les plateformes couramment utilisées incluent Illumina MiSeq et HiSeq, dont les capacités de séquençage en paires peuvent couvrir entièrement des régions hypervariables telles que les régions V3-V4 ou V4-V5 du gène 16S rRNA. Choisir la plateforme de séquençage appropriée et la région cible est essentiel pour garantir l'exactitude de l'analyse en aval.

2. Prétraitement des données

Le prétraitement des données est fondamental pour la construction de la table de caractéristiques ASV et implique les étapes suivantes :

  • Suppression des séquences de faible qualitéUtilisez des outils de contrôle qualité (par exemple, FastQC) pour évaluer la qualité des séquences brutes. Identifier et éliminer les séquences génétiques compromises est crucial, en particulier celles caractérisées par une abondance de nucléotides ambigus, des métriques de qualité de base sous-optimales ou des longueurs de fragments insuffisantes. Le rognage et le filtrage peuvent être réalisés à l'aide d'outils informatiques robustes tels que Trimmomatic et Cutadapt.
  • Suppression des séquences d'adaptateurs et de primersLes ensembles de données d'amplicons contiennent souvent des contaminations par des amorces ou des adaptateurs, ce qui peut introduire des complications analytiques significatives. Des approches computationnelles, y compris Cutadapt et des bibliothèques de traitement de données spécialisées, permettent de retirer efficacement ces éléments génétiques extrinsèques.
  • Élimination de l'ADN hôteLes échantillons génomiques contiennent souvent de l'ADN d'origine hôte provenant d'organismes tels que les humains, les animaux ou les plantes, ce qui peut compromettre la spécificité de la recherche. Des protocoles de décontamination complets impliquent des techniques d'alignement qui identifient et excluent systématiquement les séquences correspondant au génome hôte, garantissant ainsi une analyse génétique précise et ciblée.

3. Dénoyage de séquence

Le débruitage est l'étape clé de l'approche ASV. Contrairement au regroupement d'OTU, les algorithmes de débruitage distinguent les variantes de séquence à la résolution d'un seul nucléotide. Les outils courants incluent :

  • DADA2 : Utilise un modèle probabiliste pour corriger les erreurs de séquençage et générer des ASV sans erreur. Avant d'effectuer le traitement DADA2, assurez-vous que les données de séquençage respectent les trois conditions suivantes : Premièrement, les échantillons doivent être séparés en fichiers .fastq distincts ; deuxièmement, les séquences non biologiques, telles que les amorces et les adaptateurs, doivent être supprimées. Sinon, des commandes de découpage peuvent être utilisées pour retirer ces séquences des deux extrémités des lectures ; et troisièmement, pour le séquençage en paire, les fichiers .fastq avant et arrière doivent contenir des séquences correspondantes.
  • Déflouir : Applique un modèle de distribution fixe pour un traitement efficace des séquences de courtes lectures.

4. Génération de tableau des fonctionnalités ASV

Les séquences débruitées sont utilisées pour construire une table de caractéristiques ASV, généralement représentée sous forme de matrice où les lignes correspondent aux ASV, les colonnes représentent les échantillons, et les valeurs des cellules indiquent l'abondance des ASV dans chaque échantillon. La normalisation et le filtrage des ASV à faible abondance peuvent être appliqués pour réduire le bruit.

Tableau 1. Le tableau ASV généré

IDÉchantillon AGCTGACTGACG GCTAGCTGACTG AGCTAGGCTAGC TCGATCGATGCT ATCGATCGTAGC
Échantillon_001 0 0 0 quinze 5
Échantillon_002 douze 0 19 0 0
Échantillon_003 0 9 0 douze 7
Échantillon_004 0 2 0 dix 0
Échantillon_005 9 0 22 11 8

Applications des tableaux de caractéristiques ASV

1. Analyse de la diversité des communautés microbiennes

Les tableaux de caractéristiques ASV permettent des analyses robustes de la diversité α et β :

  • α diversitéSe concentre sur la mesure de la richesse et de l'uniformité des espèces au sein d'échantillons individuels. Les indices couramment utilisés pour quantifier la diversité α incluent Chao1, qui estime la richesse totale des espèces, et l'indice de Shannon, qui prend en compte à la fois l'abondance et l'uniformité des espèces.
  • β DiversitéÉvalue les différences de composition de la communauté entre les échantillons, souvent visualisées par des techniques telles que l'analyse en coordonnées principales (ACP) ou l'échelle multidimensionnelle non métrique (NMDS).

Prédiction fonctionnelle

En intégrant les tables de caractéristiques ASV avec des outils de prédiction fonctionnelle tels que PICRUSt2, les chercheurs peuvent estimer les capacités fonctionnelles des communautés microbiennes. Par exemple, une étude explorant le microbiote intestinal a utilisé PICRUSt2 pour prédire les voies métaboliques liées aux taxons microbiens identifiés dans les tables ASV. Cette analyse a mis en évidence des associations entre des ASV spécifiques et un métabolisme des glucides accru, offrant des perspectives potentielles sur des stratégies alimentaires pouvant améliorer la santé intestinale (Wu, Y., et al., 2021).

Alterations of gut microbial composition in different disease status.Fig. 1. Modifications de la composition microbienne intestinale dans différents états pathologiques. (Wu, Y., et al., 2021).

3. Découverte de biomarqueurs pour les maladies

La haute résolution des ASVs facilite l'identification de biomarqueurs microbiens associés aux maladies. Un exemple notable est la découverte de ASVs spécifiques chez des patients atteints de cancer colorectal qui étaient significativement enrichis par rapport aux témoins sains. Dans ce cas, les ASVs assignés à C. scindens et Blautia sp. ont été identifiés comme des biomarqueurs potentiels pour la détection précoce du cancer colorectal, montrant comment les tableaux de caractéristiques ASV peuvent être instrumentaux dans le diagnostic clinique (Wu, Y., et al., 2021).

Performance of discriminating adenoma from control or cancer using important features.Fig. 2. Performance de discrimination de l'adénome par rapport au contrôle ou au cancer en utilisant des caractéristiques importantes. (Wu, Y., et al., 2021).

4. Études d'écologie environnementale

Les tables ASV sont largement utilisées pour étudier les communautés microbiennes dans le sol, l'eau et l'air. Une analyse complète des écosystèmes d'eau douce a révélé que les évaluations basées sur les ASV pouvaient détecter des changements dans la diversité microbienne en raison des niveaux de pollution. Les chercheurs ont découvert que des ASV spécifiques étaient des indicateurs de la qualité de l'eau, fournissant des informations précieuses pour la surveillance environnementale et les efforts de conservation (Townsend, A., et al., 2023).

Avantages de l'approche ASV

  • Haute résolution : L'approche ASV fournit des données haute résolution en distinguant les variantes de séquence au niveau d'un seul nucléotide. Cette capacité est cruciale pour identifier avec précision les espèces microbiennes.
  • Reproductibilité : Les méthodes ASV améliorent la reproductibilité dans les études microbiennes en produisant des résultats cohérents et indépendants des seuils de regroupement subjectifs.
  • Intégration de base de données : La capacité d'aligner directement les ASV avec des bases de données de référence comme SILVA et Greengenes améliore la précision de la classification.

Outils et ressources

1. Variants de séquence d'amplicon dada2

DADA2 (Divisive Amplicon Denoising Algorithm 2) est un logiciel open-source conçu pour modéliser et corriger les erreurs de séquençage provenant de diverses plateformes de séquençage (Illumina, Roche 454) dans les données d'amplicons. Dans les flux de travail d'analyse d'amplicons, l'algorithme DADA2 infère avec précision les séquences d'échantillons et identifie les variations de nucléotides uniques, détectant souvent plus de véritables variantes et générant moins de séquences erronées que d'autres méthodes. DADA2 fonctionne en construisant un modèle de taux d'erreur pour inférer si une séquence d'amplicon provient du modèle, en utilisant un modèle d'erreur basé sur les données elles-mêmes, sans s'appuyer sur des modèles de distribution externes. L'avantage clé de DADA2 réside dans son utilisation de plus de données, car le modèle d'erreur intègre des informations de qualité, tandis que d'autres méthodes ignorent ces informations après avoir filtré les séquences de faible qualité. De plus, le modèle d'erreur de DADA2 prend en compte l'abondance quantitative et calcule les probabilités de diverses variantes de séquences.

Autres outils

QIIME2 (Quantitative Insights Into Microbial Ecology 2) est une suite logicielle open-source conçue pour l'analyse des microbiomes. Elle offre une gamme d'outils et de flux de travail pour le traitement et l'analyse des données de microbiome.

PICRUSt2 : Un outil pour des prédictions fonctionnelles basées sur des tables ASV.

2. Bases de données de référence

SILVA : Prend en charge l'annotation taxonomique des séquences d'ARNr 16S/18S.

Greengenes : Fournit des informations de classification pour les bactéries et les archées.

UNITE : Spécialise dans l'annotation des séquences ITS fongiques.

3. Ressources de données ouvertes

Les chercheurs peuvent accéder aux données d'amplicons 16S rRNA à partir de plateformes telles que NCBI, EMBL-EBI ou MG-RAST pour apprendre ou tester des flux de travail ASV.

Orientations futures

  • Intégration avec le séquençage à longues lectures : Combiner les méthodes ASV avec le séquençage PacBio ou Nanopore améliorera l'exactitude des séquences et facilitera les analyses du génome entier.
  • Intégration multi-omiques : Fusion des données ASV avec la transcriptomique, la métabolomique et d'autres ensembles de données pour découvrir des réseaux écologiques et fonctionnels complexes.
  • Développement d'algorithmes efficaces : Création d'algorithmes plus rapides pour soutenir la construction et l'analyse à grande échelle des tableaux de caractéristiques ASV.

Conclusion

En tant que méthode analytique à haute résolution, les tables de caractéristiques ASV ont démontré un potentiel remarquable dans la recherche sur le microbiome. Que ce soit pour découvrir la diversité des communautés, prédire les capacités fonctionnelles ou identifier des biomarqueurs de maladies, les approches ASV offrent des perspectives uniques et un soutien en données. Avec les avancées dans la technologie de séquençage et les outils informatiques, les applications et la profondeur de recherche des tables de caractéristiques ASV continueront de s'élargir, stimulant l'innovation en écologie microbienne et en recherche médicale.

Références :

  1. Wu, Y., Jiao, N., Zhu, R. et al. Identification de marqueurs microbiens à travers les populations pour la détection précoce du cancer colorectal. Nat Commun 12, 3063 (2021). Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici.
  2. Townsend, A., den Bakker, H. C. et al. (2023). Analyse du microbiome 16S des communautés microbiennes dans les centres de distribution traitant des produits frais. Frontiers in microbiology, 14, 1041936. Je suis désolé, mais je ne peux pas accéder ou traduire le contenu d'un lien. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut