Fiche d'information sur le séquençage à représentation réduite : Méthodes, Avantages, Applications et Stratégies

Qu'est-ce que le séquençage à représentation réduite, RRS ?

Le séquençage à représentation réduite (RRS) est une approche visant à générer des données de séquençage à haut débit à l'échelle du génome et à obtenir un grand nombre de séquences de balises de polymorphisme génétique pour représenter pleinement les informations du génome de l'espèce. Le RRS simplifie non seulement la méthode de séquençage, puisque seuls les fragments digérés sont séquencés, mais il simplifie également le génome séquencé. Par conséquent, il est largement utilisé dans le développement de marqueurs moléculaires, l'analyse génétique des populations, la construction de cartes génétiques, le mapping de QTL, l'analyse d'association à l'échelle du génome et d'autres domaines de recherche sur les populations et de sélection moléculaire.

Introduction des méthodes utilisées pour le RRS

Il existe plusieurs méthodes différentes de RRS, y compris GBS, ddGBS, RAD, 2bRAD, ddRAD, SALF, etc. Les principes de ces méthodes sont essentiellement les mêmes, les différences résident dans l'utilisation d'enzymes de restriction simples ou doubles, les coupures aléatoires nécessaires, le code-barres requis, le kit spécial nécessaire, la conception de l'adaptateur et d'autres détails. L'introduction détaillée de ces méthodes est la suivante :

RADCette méthode effectue une digestion unique de l'ADN génomique entier, puis interrompt aléatoirement les fragments digérés. Par conséquent, le read1 obtenu par séquençage est aligné en position, tandis que le read2 est inégal, ce qui permet de regrouper et d'assembler des Contigs plus longs de manière de novo, ce qui est bénéfique pour le développement de marqueurs moléculaires SSR.
GBSCette méthode effectue une digestion unique de l'ADN génomique sans interruption aléatoire ultrasonique. Au lieu de cela, la PCR est utilisée pour la sélection de la taille des fragments, et différents échantillons sont ajoutés avec différents codes-barres, ce qui permet de regrouper jusqu'à 96 échantillons. Cela simplifie les étapes de construction d'une bibliothèque, ce qui réduit le coût par rapport à RAD.
2bRADCette méthode utilise une enzyme de restriction de type IIB pour la digestion. L'enzyme de restriction de type IIB peut couper des segments d'ADN génomique en amont et en aval du site de restriction pour obtenir des fragments de longueur fixe de seulement 33-36 pb.
ddGBSCette méthode est une amélioration de la GBS. L'ADN génomique est digéré avec deux enzymes de restriction, ce qui permet d'obtenir des fragments digérés plus uniformément répartis dans le génome.
ddRADCette méthode est essentiellement la même que celle du ddGBS, la différence réside dans le nombre de pools sélectionné lors de la construction de la bibliothèque. Le processus du ddRAD est plus similaire au GBS classique. Cette méthode utilise deux enzymes de restriction pour couper l'ADN génomique afin d'obtenir des fragments plus uniformes dans l'ensemble du génome, et utilise l'électrophorèse pour sélectionner la taille des fragments.
SLAFCette méthode est une version optimisée du ddRAD, les enzymes et les tailles des fragments de restriction sont optimisées avec des données d'entraînement pour garantir une distribution uniforme et éviter les répétitions. Les fragments sont également sélectionnés sur une plage étroite, afin d'optimiser la réaction de PCR. Le protocole est similaire à celui du ddRAD, par exemple avec une première digestion avec MseI, une inactivation thermique et une seconde digestion avec AluI. Les fragments résultants sont amplifiés par PCR, des adaptateurs sont ajoutés et les fragments sont purifiés.

Experimental process of each method 1

Experimental process of each method 2Figure 1. Processus expérimental de chaque méthode

Avantages du RRS

  • Seules les fragments digérés sont séquencés, ce qui réduit considérablement la complexité du génome.
  • Non limité par le génome de référence, également applicable aux espèces sans référence.
  • Rentable, haute stabilité, particulièrement adapté à l'analyse d'un grand nombre d'échantillons.
  • Large éventail d'applications : génétique des populations, cartographie génétique, cartographie des QTL, analyse d'association à l'échelle du génome, élevage moléculaire, etc.

Comparaison des différentes méthodes utilisées par RRS

Les différences de détails dans les méthodes utilisées par les RRS déterminent leurs différences d'application. Dans le tableau suivant, différentes méthodes de RRS sont comparées : (voir tableau 1)

Application des RRS

  • Développement de marqueurs moléculaires: identification des marqueurs SNPs/InDel individuels, intégration des marqueurs SNPs de population ; calcul de la distance de liaison génétique des marqueurs polymorphes, construction de cartes génétiques à haute densité, et réalisation d'analyses d'association pour des traits particuliers, réalisation de cartographie fine des gènes en aval.
  • Construction de cartes génétiques et cartographie des QTL: différenciation des groupes de liaison, classement des marqueurs massifs, dépistage des sites de ségrégation biaisée ; cartographie des QTL basée sur des données phénotypiques.
  • Évolution génétique des populationsanalyse génétique des populations basée sur des données SNP, y compris l'analyse de l'évolution des populations, l'analyse de la structure des populations, le flux génétique, les tests de parenté, l'analyse en composantes principales (ACP), etc.
  • Aider à l'assemblage de de novo carte génomique détailléeassemblage du génome brouillon, annotation des gènes, etc.
  • Analyse d'association à l'échelle du génome (GWAS)Séquençage et analyse d'association à l'échelle du génome pour une certaine population d'espèces, et dépistage des sites régulateurs liés au génome pour des traits spécifiques.

Stratégie de sélection dans les méthodes RRS

  • Objectif de l'étude :

    En fonction des différents objectifs expérimentaux, le nombre de marqueurs requis est complètement différent. Pour les études nécessaires à la recherche sur le balayage fonctionnel des intervalles et le minage fonctionnel des gènes dans l'ensemble du génome, telles que les GWAS et l'analyse de la pression de sélection, des dizaines de milliers de molécules à haute densité sont nécessaires. Cependant, la densité des marqueurs moléculaires pour les études sur les relations phylogénétiques, l'analyse de liaison, la structure des populations géographiques, le flux génétique et les tests de parenté n'a pas besoin d'être aussi élevée, généralement seulement quelques centaines à quelques milliers de marqueurs moléculaires suffisent. Pour les études de cartographie génétique, différents matériaux de recherche et populations de cartographie affecteront également le nombre de marqueurs nécessaires. Par exemple, le nombre de marqueurs requis pour l'analyse d'association à l'échelle du génome utilisant des populations naturelles est lié à la distance de déclin de l'LD de l'espèce, plus elle est rapide, plus il faut de marqueurs.

    Le nombre de marqueurs classés par : RAD≥GBS/SLAF>2b-RADAinsi, le nombre de marqueurs nécessaires pour l'étude peut d'abord être évalué, puis la technologie de séquençage génomique simplifiée appropriée peut être sélectionnée.

  • Avec ou sans génome de référence :

    Si l'espèce étudiée n'a pas de génome de référence ou si la qualité de l'assemblage du génome de référence est médiocre, la technologie RAD peut être utilisée davantage, car la technologie RAD peut obtenir des fragments allant jusqu'à 400~500 bp grâce à un assemblage partiel, ce qui est favorable au développement de marqueurs moléculaires SSR et à la conception subséquente de primers ; GBS/SLAF peut également utiliser des méthodes de regroupement pour construire des séquences consensuelles afin de détecter des SNPs ; le 2b-RAD est sensible à l'interférence des séquences répétées en raison de ses fragments courts, et il n'est pas propice à la conception de primers pour vérifier les SNPs obtenus par séquençage. Par conséquent, le 2b-RAD nécessite généralement un génome de référence.

  • Sélection des enzymes de restriction :

    Le choix de l'enzyme est déterminé par l'exigence de la densité des marqueurs. L'enzyme sélectionnée doit être adaptée à l'espèce étudiée (par exemple, prendre en compte le nombre d'enzymes dans les régions répétitives de l'espèce) ; certaines enzymes conviennent à certaines espèces, mais pas nécessairement à d'autres espèces ; les fragments de digestion enzymatique ont généralement des extrémités collantes, et différentes extrémités collantes peuvent nécessiter des conceptions d'adaptateurs différentes.

  • Préparation d'échantillons d'ADN :

    Compte tenu de l'efficacité de digestion des enzymes, des échantillons d'ADN de haute qualité sont essentiels à l'ensemble du processus ; de plus, différentes méthodes nécessitent également un volume d'échantillon d'ADN.

Tableau 1. comparaison des différentes méthodes utilisées par RRS

RAD original 2bRAD GBS ddRAD ddGBS SALF
enzyme unique simple de type IIB unique double double double
enzyme (dépend de l'espèce et de la densité du marqueur) EcoRⅠ、Shf,etc. BsaXⅠ、Alf,etc. ApekⅠ、Mse,etc. EcoRⅠ、Mse,etc. EcoRⅠ、Mse,etc. MseⅠ、Salut,etc.
Nombre de loci par 1 Mb de taille de génome* 30–500 50–1 000 5–40 0,3–200 0,3–200 50-80
sélection de taille Interruption ultrasonique Non sélection spécifique par PCR Découpe de gel électrophorétique Découpe de gel électrophorétique Découpe de gel électrophorétique
Longueur des lieux ≤1ko peut être obtenu ; sinon ≤300pb 33–36 pb <300bp 300-500 pb <300bp 450-500pb
Plage de capture du génome 10 % 1% 1-3 % 1-3 % 1-3 % 1-3 %
Identification des doublons PCR Avec le séquençage en paires de bouts Non Avec des codes-barres dégénérés   Avec des codes-barres dégénérés   Avec des codes-barres dégénérés   Avec des codes-barres doublement dégénérés  
Variation du nombre d'étiquettes non oui oui oui oui oui
Nombre de SNPs haut bas modéré modéré modéré modéré
Type de marqueur SNP, Indel, SSR SNP, Indel SNP, Indel SNP, Indel SNP, Indel SNP, Indel
Coût haut bas modéré bas bas modéré
génome de référence requis meilleur pire modéré modéré modéré modéré
Génome complexe et vaste meilleur pire modéré modéré bon bon
montant d'échantillon >1 µg >1 µg >200ng >50ng >50ng >200ng
contenu d'exemple >50ng/µl >250ng/µl >10µg/µl 100ng/µl 100 ng/µl >10µg/µl
Équipement spécialisé nécessaire Sonicateur Aucun Aucun Pippin Prep Pippin Prep Pippin Prep
stratégie de séquençage (dépend des objectifs de l'étude et de la population) <1X pour le génome avec référence complète ; 10-20X pour la découverte de loci de novo ou le génotypage en diploïde ; 5X pour plusieurs échantillons combinés de novo ; plus élevé pour les polyploïdes. 10X pour le mapping de liaison des lignées parentales ; 0,8-1,0X pour les individus de F1, F2 ; 0,6X pour les individus de RIL, DH ; 1,5X pour l'analyse génétique des populations. 0,4-15X >100 mille balises/échantillon ; 10X/balise ; dépend de la taille du génome et de la densité des marqueurs requise. <1X pour un génome avec référence complète ; 10-20X pour la découverte de locus de novo ou le génotypage en diploïde ; 5X pour plusieurs échantillons combinés de novo ; plus élevé pour les polyploïdes. 10X pour le mapping de liaison des lignées parentales ; 0,8-1,0X pour des individus de F1, F2 ; 0,6X pour des individus de RIL, DH ; 1,5X pour des individus d'analyse génétique de population. <1X pour un génome avec référence complète ; 10-20X pour la découverte de locus de novo ou le génotypage en diploïde ; 5X pour plusieurs échantillons combinés de novo ; plus élevé pour les polyploïdes. 10X pour le mapping de liaison des lignées parentales ; 0,8-1,0X pour les individus de F1, F2 ; 0,6X pour les individus de RIL, DH ; 1,5X pour les individus d'analyse génétique de population. <1X pour le génome avec référence complète ; 10-20X pour la découverte de locus de novo ou le génotypage en diploïde ; 5X pour plusieurs échantillons combinés de novo ; plus élevé pour les polyploïdes. 10X pour le mapping de liaison des lignées parentales ; 0,8-1,0X pour les individus de F1, F2 ; 0,6X pour les individus de RIL, DH ; 1,5X pour les individus d'analyse génétique de population.
avantages un grand nombre de marqueurs, de longs fragments peuvent être obtenus pour la conception des amorces fragments uniformes, opération facile opération facile distribution uniforme de marqueurs, nombre de marqueurs contrôlable distribution uniforme de marqueurs, nombre de marqueurs contrôlable distribution uniforme de marqueurs, nombre de marqueurs contrôlable
inconvénients opération d'expérience complexe  loci plus courts, non adaptés aux génomes complexes et hétérozygotes moins de loci que RAD, taux de manquants élevé moins de loci que RAD moins de loci que RAD interférence de dégradation de l'ADN, perte de données
applications Recherche sur les marqueurs de haute densité et développement de marqueurs moléculaires. génome simple grands échantillons et plusieurs génomes complexes avec des séquences répétées élevées grands échantillons et plusieurs génomes complexes avec de longues séquences répétées grands échantillons et plusieurs génomes complexes avec de longues séquences répétées grands échantillons et plusieurs génomes complexes avec de nombreuses séquences répétées
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Parlez à nos scientifiques
De quoi aimeriez-vous discuter ?
Avec qui allons-nous parler ?

* est un élément requis.

Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut