Comment fonctionne le séquençage par amplicon : de la conception des amorces à l'analyse des données

Introduction

Le séquençage d'amplicons a transformé la manière dont les chercheurs étudient la variation génétique, les communautés microbiennes et les mutations associées aux maladies. Chaque étape du flux de travail - de la conception des amorces aux pipelines bioinformatiques sophistiqués - nécessite une optimisation minutieuse pour garantir une haute qualité des données et une pertinence biologique.

Pour comprendre le concept de base et l'importance de cette technique, Qu'est-ce que le séquençage d'amplicon ?.

Cet article présente un aperçu détaillé du processus de séquençage des amplicons, mettant en évidence les pratiques essentielles dans la conception des amorces, l'amplification par PCR, la purification et la préparation des bibliothèques, le choix de la plateforme de séquençage et les stratégies avancées d'analyse des données. S'appuyant sur des études de cas réelles et des défis courants, nous fournissons des informations pratiques pour aider les chercheurs à obtenir des résultats de séquençage d'amplicons à la fois très efficaces et précis dans des domaines tels que la médecine de précision, la microbiologie et la surveillance environnementale.

Amplicon Sequencing workflow

Conception de primers pour le séquençage d'amplicons

1.1 Paramètres Clés dans la Conception de Primers

La conception efficace des amorces est une pierre angulaire du séquençage des amplicons réussi. Plusieurs paramètres clés doivent être soigneusement optimisés :

  • Température de fusion (Tm) : Tm représente la température à laquelle 50 % du duplex amorce-modèle se dissocie. Les valeurs idéales de Tm pour les amorces se situent entre 55 °C et 65 °C, avec une différence maximale de 5 °C entre les amorces directes et inverses pour garantir un hybridation synchronisée.
  • Contenu en GC : Un contenu en GC compris entre 40 % et 60 % équilibre la stabilité des amorces et minimise le risque de formation de structures secondaires complexes. Un contenu en GC excessivement élevé peut créer des structures secondaires fortes, tandis qu'un faible contenu en GC peut affaiblir l'affinité de liaison.
  • Formation de dimères d'amorce et complémentarité de l'extrémité 3' : Cela doit être évité, car cela peut entraîner une amplification non spécifique, consommer des réactifs et réduire l'efficacité de la PCR.

Les amorces doivent répondre à des exigences strictes en matière de spécificité, de stabilité structurelle et de formation minimale de structures secondaires. Les outils largement utilisés incluent Primer3, qui génère automatiquement des amorces en fonction de paramètres définis par l'utilisateur tels que la longueur, la Tm et la teneur en GC, et BLAST, qui évalue la spécificité des amorces en identifiant les hybridations potentielles hors cible.

Pour une explication détaillée des principes de conception de primers et des flux de travail, principes et flux de travail du séquençage des amplicons 16S/18S/ITS

1.2 Outils logiciels et optimisation des flux de travail

Les outils de conception de primers automatisés jouent un rôle essentiel dans les flux de travail de séquençage d'amplicons à haut débit.

  • Primer3 utilise des algorithmes sophistiqués pour générer rapidement des amorces optimales en tenant compte de plusieurs paramètres, y compris la longueur des amorces, la Tm et la teneur en GC.
  • Geneious propose une plateforme de bioinformatique complète qui intègre la conception de primers, l'alignement de séquences et des capacités d'annotation, simplifiant ainsi l'ensemble du flux de travail.

Les protocoles de laboratoire influencent considérablement la manière dont les outils et paramètres de conception sont appliqués. Un retour d'expérience expérimental en temps réel peut révéler des problèmes tels qu'une faible efficacité d'amplification ou une mauvaise spécificité. En ajustant les paramètres de conception des amorces en conséquence - par exemple, en modifiant les paramètres de Primer3 - les chercheurs peuvent améliorer de manière significative les taux de succès des amorces.

Une étude de cas en laboratoire utilisant des cadres de conception modulaire a montré que l'optimisation itérative basée sur les retours expérimentaux améliorait considérablement les performances de conception des amorces.

1.3 Étude de cas : Profilage de la communauté de Bifidobacterium

Une étude publiée dans Microorganisms (Lugli et al., 2019) a rapporté un cas où des amorces n'ont pas réussi à profiler avec précision les communautés de Bifidobacterium.

Les amorces initialement conçues manquaient de spécificité suffisante, entraînant une amplification non intentionnelle de l'ADN microbien non ciblé, ce qui a compromis l'analyse.

Ce cas met en évidence l'importance cruciale de la spécificité des amorces dans la recherche sur le microbiome. L'identification et la caractérisation précises de communautés microbiennes spécifiques dépendent fortement des performances des amorces. Le gène 16S rRNA, couramment utilisé pour la classification microbienne, contient à la fois des régions conservées et variables. Le choix de la région 16S rRNA appropriée est essentiel pour concevoir des amorces avec la spécificité nécessaire.

Primer design workflow showing Tm optimization, GC content balance, and specificity checks for amplicon sequencing.Considérations clés dans la conception de primers pour le séquençage d'amplicons, y compris la température de fusion, la teneur en GC et la spécificité.

2. Amplification par PCR : Création des amplicons

2.1 Optimisation des conditions de cyclage thermique

L'optimisation du cycle thermique est essentielle pour produire des amplicons de haute qualité. Un cycle PCR typique comprend trois étapes clés :

  • Dénaturation : Réalisée à 94-98°C pendant 15-30 secondes, cette étape sépare l'ADN double brin en brins simples, permettant aux amorces de se lier.
  • Recuitement : À 50-65°C pendant 20-40 secondes, les amorces se lient spécifiquement au modèle d'ADN simple brin.
  • Extension : Réalisée à 72°C, avec des temps d'extension généralement fixés à 1 minute par kilobase d'ADN cible.

Le choix de la polymérase ADN a un impact significatif sur les résultats de la PCR.

  • La polymérase Taq est largement utilisée en raison de sa haute stabilité thermique et de son efficacité catalytique.
  • Cependant, Taq manque d'activité d'exonucléase de correction 3'-5', ce qui peut introduire des erreurs lors de l'amplification.
    Pour les applications nécessitant une haute fidélité - telles que la construction de bibliothèques de séquençage de nouvelle génération (NGS) ou la détection de mutations à faible fréquence - des polymérases à haute fidélité comme Phusion ou Q5 sont préférées.

La composition du tampon joue également un rôle essentiel dans la performance des enzymes, fournissant généralement des ions essentiels tels que le magnésium et le potassium.

Le flux de travail PCR en cinq étapes de Thermo Fisher affine le cycle traditionnel en incluant la dénaturation initiale, l'hybridation des amorces, l'extension des amorces, les cycles d'amplification et l'extension finale, permettant un meilleur contrôle de la température et du temps pour une efficacité et une spécificité améliorées.

2.2 Atténuer le biais d'amplification

Le biais d'amplification est un problème courant dans la PCR, résultant de plusieurs sources :

  • Les régions riches en GC sont difficiles à dénaturer en raison de liaisons hydrogène fortes, ce qui entraîne une efficacité d'amplification réduite.
  • L'efficacité de liaison entre le primer et le modèle varie en fonction de la composition de la séquence.
  • Les structures secondaires de modèle peuvent entraver la progression de l'ADN polymérase.

Le réseau ARTIC a abordé ces défis dans son protocole de séquençage d'amplicons SARS-CoV-2 en utilisant un design de pool de primers multiplexés.

Pour mieux comprendre comment les stratégies d'amplification des gènes d'ARN ribosomal sont optimisées, voir Méthodes de séquençage d'amplicons 16S/18S/ITS.

Les amorces ont été divisées en plusieurs pools, chacun ciblant différentes régions du génome.

Cette stratégie réduit les interactions entre amorces, améliore l'uniformité entre les amplicons et minimise l'impact des régions difficiles à amplifier, telles que celles avec un contenu élevé en GC.

L'optimisation des séquences d'amorces et des conditions de réaction aide également à équilibrer l'amplification sur l'ensemble du génome, ce qui entraîne des données de séquençage plus précises.

2.3 Contrôle de qualité pour l'intégrité des amplicons

Un contrôle qualité (CQ) strict est essentiel pour garantir la pureté et l'intégrité des amplicons avant la préparation de la bibliothèque. Les méthodes de CQ courantes comprennent :

  • Électrophorèse sur gel d'agarose :
    Cette technique permet une évaluation visuelle de la taille et de la pureté des amplicons. Des bandes nettes et nettes correspondant aux tailles de fragments attendues indiquent une amplification de haute qualité avec des produits non spécifiques minimaux.
  • Analyse de courbe de fusion qPCR :
    Cette méthode surveille le comportement de fusion de l'ADN lors d'un chauffage progressif. Un pic de fusion unique et net suggère une haute spécificité, tandis que plusieurs pics indiquent une amplification non spécifique.

PCR amplification process diagram displaying denaturation, annealing, extension steps, and strategies to reduce amplification bias.Étapes d'amplification par PCR pour la génération d'amplicons, illustrant les phases de dénaturation, d'hybridation et d'extension.

3. Purification des amplicons et préparation de la bibliothèque

3.1 Méthodes de purification par billes magnétiques

La purification des amplicons PCR est une étape cruciale pour éliminer les contaminants et préparer de l'ADN de haute qualité pour le séquençage. Deux méthodes principales sont couramment utilisées : la purification par billes magnétiques et la purification par colonne, chacune ayant des avantages distincts.

  • La purification par billes magnétiques (par exemple, en utilisant des billes SPRI telles que les Agencourt AMPure XP) repose sur la liaison sélective des acides nucléiques à des particules magnétiques dans des conditions de tampon spécifiques.
    Des champs magnétiques sont ensuite utilisés pour séparer l'ADN des amorces, des dimères d'amorces, des sels et des enzymes.
    Cette méthode offre des taux de récupération élevés, une excellente élimination des impuretés et une forte compatibilité avec l'automatisation, ce qui la rend idéale pour les flux de travail à haut débit.
  • La purification par colonne implique la liaison de l'ADN à une membrane en silice par centrifugation, suivie d'étapes de lavage et d'élution successives.
    Bien que cette méthode soit efficace, elle est plus gourmande en main-d'œuvre et moins propice à l'automatisation.
    Cela peut également entraîner des taux de récupération des cibles plus bas et laisser des contaminants résiduels qui peuvent interférer avec les applications en aval.

En comparaison, la purification par billes magnétiques offre une efficacité de capture des cibles supérieure, une évolutivité et une reproductibilité, ce qui en fait le choix privilégié pour les projets de purification d'amplicons à grande échelle.

3.2 Stratégies de ligature d'adaptateurs et d'indexation

La préparation de la bibliothèque est une phase critique reliant les amplicons purifiés aux plateformes de séquençage.

En prenant le flux de préparation de bibliothèque Illumina Collibri comme exemple, deux stratégies importantes garantissent l'intégrité des échantillons et la précision du séquençage :

  • Ligation d'adaptateurs :
    Des adaptateurs spécifiques contenant des sites de liaison pour les amorces de séquençage et des indices spécifiques à l'échantillon sont attachés enzymatiquement aux deux extrémités des amplicons purifiés.
    Après la ligature, les bibliothèques subissent généralement un enrichissement par PCR et une sélection de taille pour amplifier les fragments correctement ligaturés et éliminer les adaptateurs résiduels ou les constructions incomplètes, garantissant ainsi la cohérence de la bibliothèque.
  • Indexation Duale Unique (UDI) :
    Dans cette stratégie, chaque échantillon reçoit une combinaison unique de deux indices (un à chaque extrémité), minimisant les artefacts de saut d'index et permettant une identification précise des échantillons lors du séquençage.

Pour les grands projets, plusieurs bibliothèques d'amplicons peuvent être combinées (multiplexées) pour le séquençage.

Par exemple, la conception du pool de primers ARTIC v3 pour le SARS-CoV-2 a utilisé plusieurs pools de primers pour amplifier différentes régions génomiques. Lors de la préparation de la bibliothèque, ces amplicons distincts provenant de différents échantillons sont regroupés proportionnellement et séquencés ensemble.

Cette approche maximise le débit de séquençage, améliore l'efficacité des coûts et maintient une précision spécifique aux échantillons.

Amplicon purification and library preparation flowchart highlighting magnetic bead cleanup, adapter ligation, and dual indexing steps.4. Sequencing the AmpliconsFlux de travail pour la purification des amplicons utilisant des billes magnétiques, suivi de la ligation des adaptateurs et de l'indexation duale unique pour la préparation de bibliothèques de séquençage.

4. Séquençage des amplicons

4.1 Plates-formes Illumina vs. Nanopore

Le séquençage d'amplicons peut être réalisé à l'aide de diverses plateformes de séquençage de nouvelle génération (NGS), les technologies Illumina et Nanopore étant deux des plus couramment utilisées.

Chacun offre des avantages distincts en fonction des objectifs du projet :

  • Le séquençage Illumina se spécialise dans le séquençage à haute précision avec des lectures courtes.
    Il offre une profondeur de couverture exceptionnelle, permettant plusieurs lectures redondantes des régions cibles, ce qui améliore la détection des mutations à faible fréquence.
    Cependant, la courte longueur de lecture peut limiter sa capacité à résoudre des régions hautement répétitives ou des variations structurelles complexes au sein des génomes.
  • Le séquençage par nanopore (par exemple, Oxford Nanopore Technologies) permet le séquençage à longues lectures, capable de lire des milliers de bases en un seul passage.
    Cet avantage permet aux chercheurs de mieux détecter les grandes variations structurelles, de phaser les mutations sur de longues distances génomiques et d'analyser plus efficacement les régions complexes.
    Le principal inconvénient des plateformes Nanopore est un taux d'erreur relativement plus élevé par rapport à Illumina, ce qui peut affecter l'exactitude de l'appel de variants.

En pratique, le choix entre Illumina et Nanopore dépend des priorités du projet :

Pour détecter des mutations ponctuelles rares, la profondeur et la précision d'Illumina offrent un avantage, tandis que pour résoudre des variations structurelles complexes, la capacité de lecture longue de Nanopore est indispensable.

Sequencing technology comparison infographic illustrating Illumina short-read and Nanopore long-read platforms for amplicon sequencing.Aperçu des options de séquençage pour les amplicons, comparant les plateformes de séquençage à court terme Illumina et les technologies de séquençage à long terme Nanopore.

4.2 Séquençage d'Amplicon Multiplexé dans la Surveillance des Eaux Usées

Le séquençage d'amplicons multiplexés a démontré une utilité remarquable dans la surveillance de la santé publique, en particulier pour le suivi des agents pathogènes viraux dans les échantillons environnementaux.

Une étude publiée dans Environmental Science & Technology Letters (Peccia et al., 2020) a démontré cette application en quantifiant l'ARN du SARS-CoV-2 dans les systèmes d'eaux usées municipales.

Comparé à la RT-qPCR traditionnelle, le séquençage d'amplicons multiplexé offre plusieurs avantages clés :

  • Sensibilité accrue à la détection du matériel génétique viral, même à faibles concentrations.
  • Accès simultané aux informations sur la charge virale et aux données de séquence génomique complètes.
  • Capacités d'alerte précoce en détectant les changements dans la prévalence virale au sein de la communauté.

Par exemple, les fluctuations des niveaux d'ARN viral dans les échantillons d'eaux usées ont montré une corrélation avec les augmentations ou diminutions des taux d'infection par la COVID-19 au sein des communautés locales.

De plus, les approches basées sur le séquençage ont permis aux chercheurs d'identifier des variants viraux émergents dans les eaux usées, facilitant ainsi la surveillance rapide de l'évolution et de la propagation des virus.

Cette stratégie de surveillance non invasive s'est révélée inestimable pour la détection précoce des épidémies, fournissant des données essentielles pour orienter les interventions de santé publique et protéger la santé des communautés.

5. Analyse des données : Interprétation des résultats de séquençage d'amplicons

5.1 Pipelines de bioinformatique pour l'appel de variants

L'interprétation précise des données de séquençage d'amplicons repose fortement sur des pipelines bioinformatiques robustes. Plusieurs outils sont couramment utilisés pour l'appel de variants et le profilage des communautés microbiennes :

  • QIIME2 est largement utilisé pour le regroupement des unités taxonomiques opérationnelles (OTU) basé sur des seuils de similarité de séquence.
    Il offre un flux de travail intuitif et modulaire, mais peut négliger des différences subtiles de séquence, ce qui pourrait entraîner une résolution communautaire moins précise.
  • Mothur offre un clustering plus sophistiqué en intégrant les relations évolutives dans l'analyse.
    Cela améliore la résolution taxonomique par rapport aux méthodes basées uniquement sur la similarité.

Cependant, à la fois QIIME2 et Mothur ont des limitations en ce qui concerne la correction des erreurs de séquençage.

Pour y remédier, DADA2 utilise une approche basée sur un modèle pour la correction des erreurs, permettant l'identification de variantes de séquences d'amplicons exactes (ASVs).

En éliminant le bruit introduit lors du séquençage, DADA2 améliore considérablement la précision des analyses de diversité en aval et des attributions taxonomiques.

L'intégration de DADA2 dans les flux de travail de séquençage d'amplicons est devenue de plus en plus courante, en particulier dans les études nécessitant un profilage des communautés microbiennes à haute résolution.

Si vous êtes intéressé par la transition des OTUs aux ASVs, introduction aux variants de séquence d'amplicon.

Comprendre les principales différences entre les analyses basées sur les OTU et celles basées sur les ASV est essentiel pour une interprétation précise de la diversité microbienne.

Pour une analyse plus approfondie des différences entre les sorties de séquençage, référez-vous à analyse de séquençage d'amplicons : OTU vs ASV.

5.2 Défis de la classification taxonomique

Malgré les avancées technologiques, des défis subsistent pour atteindre une classification taxonomique précise, en particulier lors de l'utilisation d'approches basées sur les amplicons.

Un exemple notable concerne la discrimination des sous-espèces de Bifidobacterium.

La région V4 de l'ARNr 16S, largement utilisée, offre une variation de séquence limitée entre des souches de Bifidobacterium étroitement apparentées.

En conséquence, une résolution au niveau des sous-espèces est souvent inatteignable, ce qui peut entraîner une mauvaise classification et une simplification excessive de la diversité microbienne.

Cette limitation découle du fait que la région V4 est fortement conservée parmi de nombreux taxons bactériens.

Ainsi, bien qu'il offre une bonne résolution au niveau du genre ou de l'espèce pour de nombreux organismes, il est insuffisant pour des distinctions taxonomiques plus fines dans certains groupes.

Pour surmonter cela, les chercheurs se tournent de plus en plus vers l'analyse de séquence multilocus (MLSA).

En analysant simultanément plusieurs loci génétiques, le MLSA fournit un ensemble de données plus riche sur la variation génétique, améliorant ainsi la capacité à différencier des sous-espèces étroitement liées.

L'application de l'AMLS permet une compréhension plus approfondie de la structure des communautés microbiennes, des rôles écologiques et des dynamiques fonctionnelles - particulièrement critique lors de l'étude de microbes bénéfiques tels que Bifidobacterium ou lors de l'examen d'échantillons environnementaux complexes.

6. Conclusion : Avancées et Perspectives Futures

Le séquençage des amplicons a apporté des contributions remarquables à la médecine de précision et à la surveillance environnementale au cours de la dernière décennie.

Dans la médecine de précision, cela permet la détection sensible de mutations à faible fréquence, facilitant le diagnostic précoce des maladies et le développement de stratégies de traitement personnalisées.

Cette approche ciblée améliore l'efficacité thérapeutique et optimise les résultats pour les patients.

Dans le suivi environnemental, le séquençage d'amplicons constitue un outil puissant pour suivre des agents pathogènes tels que le SARS-CoV-2 dans les eaux usées.

En surveillant les tendances de la charge virale et en détectant les variants émergents, les agences de santé publique peuvent réagir de manière proactive aux épidémies potentielles, renforçant ainsi la résilience de la santé communautaire.

En regardant vers l'avenir, plusieurs tendances émergentes sont prêtes à renforcer davantage les capacités du séquençage d'amplicons :

  • Conception de primers pilotée par l'IA :
    Des algorithmes d'intelligence artificielle sont appliqués pour automatiser et optimiser le développement de primers, en tenant compte des contextes de séquence complexes, en minimisant les effets hors cible et en augmentant significativement le taux de succès de l'amplification.
  • Séquençage d'amplicons à cellule unique :
    Les avancées en génomique unicellulaire ouvrent de nouvelles perspectives dans le séquençage d'amplicons.
    En analysant les variations génomiques au niveau des cellules individuelles, les chercheurs peuvent révéler l'hétérogénéité cellulaire qui serait autrement masquée dans les analyses en vrac.
    Cela a des implications profondes pour la compréhension de l'évolution du cancer, des interactions au sein des communautés microbiennes et de la biologie du développement.

À mesure que ces innovations mûrissent, le séquençage d'amplicons continuera d'élargir ses applications - offrant des aperçus biologiques plus profonds, améliorant les diagnostics cliniques et renforçant les systèmes de surveillance de la santé publique dans le monde entier.

Pour un aperçu complet des flux de travail de séquençage et des applications, le flux de travail et les applications du séquençage d'amplicons.

Références :

  1. Lugli, G. A., Milani, C., Turroni, F., Duranti, S., Mancabelli, L., Mangifesta, M., ... & Ventura, M. (2019). Dévoiler la biogéographie des bifidobactéries à travers le tube digestif des mammifères en utilisant une nouvelle approche de séquençage ciblé spécifique à un taxon. Microorganisms, 7(8), 328. Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique à traduire, veuillez le fournir et je serai heureux de vous aider.
  2. Quick, J., Grubaugh, N. D., Pullan, S. T., Claro, I. M., Smith, A. D., Gangavarapu, K., ... & Loman, N. J. (2017). Méthode de PCR multiplex pour le séquençage MinION et Illumina des génomes du virus Zika et d'autres virus directement à partir d'échantillons cliniques. Nature Protocols, 12(6), 1261-1276. Désolé, je ne peux pas accéder à des liens ou des contenus externes.
  3. Peccia, J., Zulli, A., Brackney, D. E., Grubaugh, N. D., Kaplan, E. H., Casanovas-Massana, A., ... & Omer, S. B. (2020). Les concentrations d'ARN du SARS-CoV-2 dans les boues d'épuration municipales primaires comme indicateur principal de la dynamique des épidémies de COVID-19. Environmental Science & Technology Letters, 7(7), 609-614. Je suis désolé, mais je ne peux pas accéder aux liens externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
  4. Milani, C., Lugli, G. A., Duranti, S., Turroni, F., Mancabelli, L., Ferrario, C., ... & Ventura, M. (2013). Les bifidobactéries exhibent un comportement social à travers le partage de ressources en glucides dans l'intestin. Microbiologie Appliquée et Environnementale, 79(23), 7470-7478. Je suis désolé, mais je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
  5. Tyler, A. D., Mataseje, L., Urfano, C. J., Schmidt, L., Antonation, K. S., Mulvey, M. R., & Corbett, C. R. (2018). Évaluation du dispositif de séquençage MinION d'Oxford Nanopore pour les applications de séquençage du génome entier microbien. Frontiers in Genetics, 9, 466. DOI : 10.1038/s41598-018-29334-5
  6. Callahan, B. J., McMurdie, P. J., Rosen, M. J., Han, A. W., Johnson, A. J. A., & Holmes, S. P. (2016). DADA2 : Inférence d'échantillons à haute résolution à partir de données d'amplicons Illumina. Nature Methods, 13(7), 581-583. Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique à traduire, veuillez le fournir et je serai heureux de vous aider.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut