Amorces de séquençage
Qu'est-ce qu'un amorce de séquençage ?
Les amorces de séquençage sont de courts oligonucléotides d'ADN utilisés dans les méthodes de séquençage de l'ADN. Ces amorces fournissent un point de départ pour la synthèse de l'ADN lors de la réaction de séquençage.
Amorces de séquençage dans le séquençage de Sanger
Dans Séquençage de Sanger, également connu sous le nom de séquençage par terminaison de chaîne, des amorces de séquençage sont utilisées pour initier la synthèse de l'ADN dans une molécule d'ADN modèle. Ces amorces sont complémentaires à une région spécifique du modèle d'ADN qui doit être séquencée. La réaction de séquençage implique l'incorporation de didéoxynucléotides (ddNTPs) marqués par fluorescence dans le brin d'ADN en croissance, ce qui termine l'élongation de la chaîne à chaque position, entraînant une série de fragments de longueurs variées. Ces fragments sont ensuite séparés par taille à l'aide d'une électrophorèse capillaire, et la séquence est déterminée en fonction de l'ordre des fragments terminés.
Amorces de séquençage en NGS
Dans séquençage de nouvelle génération des techniques, telles que le séquençage Illumina, des amorces de séquençage sont également utilisées pour initier la synthèse de l'ADN. Cependant, le processus de séquençage diffère du séquençage Sanger. Les plateformes de NGS utilisent un séquençage massivement parallèle, où de nombreuses réactions de séquençage sont réalisées simultanément de manière à haut débit. Les amorces de séquençage dans les méthodes de NGS contiennent généralement des séquences d'adaptateurs qui sont nécessaires pour l'attachement des fragments d'ADN à la surface solide ou à la cellule de flux de la plateforme de séquençage. Ces adaptateurs facilitent l'amplification et le séquençage des fragments d'ADN de manière massivement parallèle, générant des millions de courtes séquences d'ADN en une seule course de séquençage.
Quels sont les principes de conception des amorces de séquençage ?
Les amorces de séquençage sont souvent divisées en amorces de séquençage universelles pour vecteurs et amorces de séquençage spécifiques à un gène :
Amorces de séquençage universelles pour vecteurs plasmidiques
Les deux extrémités du MCS (site polyclonal), puis il suffit de placer les amorces de séquençage à la position des extrémités du fragment, c'est-à-dire les amorces conçues selon la séquence du vecteur. Les entreprises de séquençage en général disposent d'une partie d'amorces universelles gratuites qui peuvent être utilisées, ces amorces étant assez courantes. vecteurs commerciaux utilisés pour les amorces de séquençage, tels que le vecteur pCDNA3.1, ou le vecteur pGL3-Basic, et bien sûr d'autres vecteurs.
Exigences générales pour les amorces de spécificité universelle vectorielle :
(1) Spécificité : nécessite un seul site de liaison à la séquence du vecteur ;
(2) Position : au moins 100 bases de l'insert sont requises, une proximité trop grande peut entraîner une séquençage inexact aux deux extrémités de l'insert.
(3) Longueur : 17 à 25 bases sont suffisantes
(4) Contenu en GC : pas d'exigences particulières, essayez d'être au-dessus de 35 %
Valeur Tm : pas d'exigences particulières, essayez d'être au-dessus de 40.
(6) exigences de synthèse : de préférence purification par PAGE, le désalage est également possible, j'utilise moi-même des amorces désalées sans problèmes.
Amorces de séquençage spécifiques aux gènes
En général, lorsque la longueur du fragment inséré dépasse 1500 pb, nous devons concevoir séquençage spécifique à un gène Amorces, combien faut-il concevoir, simplement selon un primer de séquençage avec une longueur de lecture efficace de 700 pb, par exemple pour un fragment inséré de 2500 pb, alors au moins quatre amorces de séquençage, deux amorces de séquençage universelles, deux amorces de séquençage spécifiques au gène.
Exigences générales pour les amorces de séquençage spécifiques aux gènes :
(1) Spécificité : liaison au modèle de séquençage, sans écarts de plus de 4 bases.
(2) Position : Lorsque plusieurs amorces doivent être conçues, le chevauchement entre la longueur de séquençage de l'amorce précédente et la prochaine amorce de séquençage doit être d'au moins 100 bases, sinon les deux amorces de séquençage risquent de ne pas se chevaucher, et l'amorce de séquençage devra être conçue à nouveau. C'est la même raison pour les amorces universelles de vecteur et les amorces spécifiques de gène.
(3) Longueur : 17-25 bases
(4) Contenu en GC : pas d'exigence particulière, essayez d'être au-dessus de 35 %
(5) Valeur Tm : aucune exigence particulière, essayer d'être au-dessus de 40.
(6) Exigences de synthèse : purification de préférence par PAGE, le désalage est également possible.
Conception de primers pour le séquençage Sanger
Dans Séquençage de Sanger dans les expériences, la plupart des amorces PCR peuvent être utilisées comme amorces de séquençage pour les réactions de séquençage, mais certaines amorces PCR ne peuvent pas être utilisées pour les réactions de séquençage, principalement en raison des raisons suivantes :
(1) Amorces simples : les amorces simples ont souvent plusieurs sites de liaison sur le modèle de séquençage, ce qui affecte directement les résultats du séquençage.
(2) Amorces aléatoires : les amorces aléatoires (comme les amorces RAPD) sont généralement courtes, et la température d'hybridation utilisée est basse, ce qui ne permet pas une bonne liaison au modèle dans les conditions de réaction de séquençage.
(3) Amorces avec des fragments trop longs : En général, les amorces de séquençage ne doivent pas dépasser 24 pb, et des amorces trop longues sont susceptibles de se lier à plusieurs sites de liaison présents sur le modèle de séquençage dans des conditions de réaction de séquençage inférieures, ce qui entraîne un bruit plus élevé ; de plus, la pureté des amorces plus longues sera également difficile à garantir, généralement la pureté des amorces utilisées pour le séquençage doit être supérieure à 90 %, et lorsque la pureté des amorces est faible, le signal de fond de la réaction de séquençage sera significativement plus élevé, ce qui affecte directement l'exactitude des résultats de séquençage.
(4) Amorces spécialement étiquetées : les quatre bases de la réaction de séquençage Sanger sont étiquetées par fluorescence, et les amorces étiquetées par fluorescence utilisées dans la réaction de séquençage généreront des interférences avec le signal de fluorescence ; de plus, les amorces étiquetées avec d'autres types de macromolécules ne conviennent également pas aux réactions de séquençage, et les groupes macromoléculaires étiquetés sur les amorces affecteront directement la mobilité des fragments d'ADN, entraînant une mauvaise forme de pic ou des résultats de séquençage incorrects.
(5) Amorces de faible pureté : les amorces de séquençage ont des exigences élevées en matière de pureté, et la présence de substances étrangères mélangées dans les amorces synthétiques peut entraîner une augmentation du bruit, ce qui affecte directement la qualité du séquençage.
Sélection de primers dans le séquençage 16S/18S/ITS
Différentes espèces de bactéries ont la même séquence de région conservée et des séquences de région variable différentes. Des amorces peuvent être conçues pour amplifier toutes. gènes 16SrRNA bactériens dans des échantillons environnementaux basés sur les séquences des régions conservées, tandis que différentes espèces de bactéries peuvent être distinguées en fonction des séquences des régions variables.
Les amorces les plus couramment utilisées dans les méthodes traditionnelles sont 27F et 1492R, qui peuvent amplifier presque la longueur complète du gène 16SrRNA, ce qui n'est pas applicable aux plateformes de séquençage à haut débit en raison de la limitation actuelle de la longueur de lecture des NGS, mais est largement utilisé pour l'identification moléculaire des bactéries pures. Compte tenu de la limitation actuelle de la longueur de lecture des plateformes de séquençage à haut débit grand public, seule une certaine région variable de l'ADN 16Sr peut être séquencée. Certains choisissent de séquencer une seule région V (V3/V4/V6), d'autres deux régions V (région V3-V4 ou région V4-V5), et certains choisissent trois régions V (région V1-V3, région V5-V7 ou région V7-V9) pour le séquençage de l'ADN 16S dans la littérature.
En général, les régions de séquençage couramment utilisées et les plus reconnues pour notre microbiomique environnementale sont V3-V4, V4-V5, ou la région V4 seule. De nombreux amorces de séquençage 16S sont documentées dans le projet Earth Microbiome, y compris les amorces traditionnelles 515F/806R et les séquences d'amorces optimisées 515F/806R.
Amorce dans le séquençage du gène 16S rRNA. (Abellan-Schneyder et al., 2021)
De même, les gènes d'ARNr 18S sont des séquences d'ADN qui codent pour les petites sous-unités des ribosomes eucaryotes avec à la fois des régions conservées et variables (V1-V9, sans région V6). Les régions conservées reflètent les affinités entre les espèces biologiques, tandis que les régions variables reflètent les différences entre les espèces et sont adaptées comme critères taxonomiques au niveau des espèces et au-dessus. V4 est le choix le plus utilisé pour l'annotation de l'analyse des gènes d'ARNr 18S, avec les informations de base de données les plus complètes et la meilleure classification. Chez les champignons, les gènes d'ARNr 5.8S, 18S et 28S sont hautement conservés, tandis que l'ITS montre un polymorphisme de séquence extrêmement large dans la grande majorité des eucaryotes en raison d'une pression moindre de la sélection naturelle et de la capacité à tolérer plus de variations au cours de l'évolution. En même temps, le type conservé d'ITS montre une relative cohérence au sein des espèces et des différences plus évidentes entre les espèces, ce qui peut refléter les différences entre les genres et même les souches. Les fragments de séquence ITS sont petits (350 pb et 400 pb pour ITS 1 et ITS 2, respectivement) et faciles à analyser, et ont été largement utilisés dans l'analyse phylogénétique de différentes espèces de champignons.
Les archéobactéries, également connues sous le nom d'archées, constituent une classe très spéciale de bactéries qui possèdent certaines caractéristiques à la fois des procaryotes et des eucaryotes. Des études ont montré que les paires de primers 519F/915R et 344F/915R ont la meilleure spécificité pour les archéobactéries. Il existe une préférence pour les paires de primers adaptées à différentes plateformes, et pour la plateforme de séquençage Illumina MiSeq 2×300 pb, le primer 519F/915R est le plus adapté (région 16S V4V5).
Référence :
- Abellan-Schneyder, Isabel, et al. "Guide, pipelines, paramètres : problèmes dans le séquençage du gène 16S rRNA." Msphère 6.1 (2021) : e01202-20.