Le séquençage à représentation réduite (RRS) est une approche visant à générer des données de séquençage à haut débit à l'échelle du génome et à obtenir un grand nombre de séquences de balises de polymorphisme génétique pour représenter pleinement les informations du génome de l'espèce. Le RRS simplifie non seulement la méthode de séquençage, puisque seuls les fragments digérés sont séquencés, mais il simplifie également le génome séquencé. Par conséquent, il est largement utilisé dans le développement de marqueurs moléculaires, l'analyse génétique des populations, la construction de cartes génétiques, le mapping de QTL, l'analyse d'association à l'échelle du génome et d'autres domaines de recherche sur les populations et de sélection moléculaire.
Il existe plusieurs méthodes différentes de RRS, y compris GBS, ddGBS, RAD, 2bRAD, ddRAD, SALF, etc. Les principes de ces méthodes sont essentiellement les mêmes, les différences résident dans l'utilisation d'enzymes de restriction simples ou doubles, les coupures aléatoires nécessaires, le code-barres requis, le kit spécial nécessaire, la conception de l'adaptateur et d'autres détails. L'introduction détaillée de ces méthodes est la suivante :
Figure 1. Processus expérimental de chaque méthode
Les différences de détails dans les méthodes utilisées par les RRS déterminent leurs différences d'application. Dans le tableau suivant, différentes méthodes de RRS sont comparées : (voir tableau 1)
En fonction des différents objectifs expérimentaux, le nombre de marqueurs requis est complètement différent. Pour les études nécessaires à la recherche sur le balayage fonctionnel des intervalles et le minage fonctionnel des gènes dans l'ensemble du génome, telles que les GWAS et l'analyse de la pression de sélection, des dizaines de milliers de molécules à haute densité sont nécessaires. Cependant, la densité des marqueurs moléculaires pour les études sur les relations phylogénétiques, l'analyse de liaison, la structure des populations géographiques, le flux génétique et les tests de parenté n'a pas besoin d'être aussi élevée, généralement seulement quelques centaines à quelques milliers de marqueurs moléculaires suffisent. Pour les études de cartographie génétique, différents matériaux de recherche et populations de cartographie affecteront également le nombre de marqueurs nécessaires. Par exemple, le nombre de marqueurs requis pour l'analyse d'association à l'échelle du génome utilisant des populations naturelles est lié à la distance de déclin de l'LD de l'espèce, plus elle est rapide, plus il faut de marqueurs.
Le nombre de marqueurs classés par : RAD≥GBS/SLAF>2b-RADAinsi, le nombre de marqueurs nécessaires pour l'étude peut d'abord être évalué, puis la technologie de séquençage génomique simplifiée appropriée peut être sélectionnée.
Si l'espèce étudiée n'a pas de génome de référence ou si la qualité de l'assemblage du génome de référence est médiocre, la technologie RAD peut être utilisée davantage, car la technologie RAD peut obtenir des fragments allant jusqu'à 400~500 bp grâce à un assemblage partiel, ce qui est favorable au développement de marqueurs moléculaires SSR et à la conception subséquente de primers ; GBS/SLAF peut également utiliser des méthodes de regroupement pour construire des séquences consensuelles afin de détecter des SNPs ; le 2b-RAD est sensible à l'interférence des séquences répétées en raison de ses fragments courts, et il n'est pas propice à la conception de primers pour vérifier les SNPs obtenus par séquençage. Par conséquent, le 2b-RAD nécessite généralement un génome de référence.
Le choix de l'enzyme est déterminé par l'exigence de la densité des marqueurs. L'enzyme sélectionnée doit être adaptée à l'espèce étudiée (par exemple, prendre en compte le nombre d'enzymes dans les régions répétitives de l'espèce) ; certaines enzymes conviennent à certaines espèces, mais pas nécessairement à d'autres espèces ; les fragments de digestion enzymatique ont généralement des extrémités collantes, et différentes extrémités collantes peuvent nécessiter des conceptions d'adaptateurs différentes.
Compte tenu de l'efficacité de digestion des enzymes, des échantillons d'ADN de haute qualité sont essentiels à l'ensemble du processus ; de plus, différentes méthodes nécessitent également un volume d'échantillon d'ADN.
Tableau 1. comparaison des différentes méthodes utilisées par RRS
| RAD original | 2bRAD | GBS | ddRAD | ddGBS | SALF | |
|---|---|---|---|---|---|---|
| enzyme | unique | simple de type IIB | unique | double | double | double |
| enzyme (dépend de l'espèce et de la densité du marqueur) | EcoRⅠ、ShfⅠ,etc. | BsaXⅠ、AlfⅠ,etc. | ApekⅠ、MseⅠ,etc. | EcoRⅠ、MseⅠ,etc. | EcoRⅠ、MseⅠ,etc. | MseⅠ、SalutⅢ,etc. |
| Nombre de loci par 1 Mb de taille de génome* | 30–500 | 50–1 000 | 5–40 | 0,3–200 | 0,3–200 | 50-80 |
| sélection de taille | Interruption ultrasonique | Non | sélection spécifique par PCR | Découpe de gel électrophorétique | Découpe de gel électrophorétique | Découpe de gel électrophorétique |
| Longueur des lieux | ≤1ko peut être obtenu ; sinon ≤300pb | 33–36 pb | <300bp | 300-500 pb | <300bp | 450-500pb |
| Plage de capture du génome | 10 % | 1% | 1-3 % | 1-3 % | 1-3 % | 1-3 % |
| Identification des doublons PCR | Avec le séquençage en paires de bouts | Non | Avec des codes-barres dégénérés | Avec des codes-barres dégénérés | Avec des codes-barres dégénérés | Avec des codes-barres doublement dégénérés |
| Variation du nombre d'étiquettes | non | oui | oui | oui | oui | oui |
| Nombre de SNPs | haut | bas | modéré | modéré | modéré | modéré |
| Type de marqueur | SNP, Indel, SSR | SNP, Indel | SNP, Indel | SNP, Indel | SNP, Indel | SNP, Indel |
| Coût | haut | bas | modéré | bas | bas | modéré |
| génome de référence requis | meilleur | pire | modéré | modéré | modéré | modéré |
| Génome complexe et vaste | meilleur | pire | modéré | modéré | bon | bon |
| montant d'échantillon | >1 µg | >1 µg | >200ng | >50ng | >50ng | >200ng |
| contenu d'exemple | >50ng/µl | >250ng/µl | >10µg/µl | 100ng/µl | 100 ng/µl | >10µg/µl |
| Équipement spécialisé nécessaire | Sonicateur | Aucun | Aucun | Pippin Prep | Pippin Prep | Pippin Prep |
| stratégie de séquençage (dépend des objectifs de l'étude et de la population) | <1X pour le génome avec référence complète ; 10-20X pour la découverte de loci de novo ou le génotypage en diploïde ; 5X pour plusieurs échantillons combinés de novo ; plus élevé pour les polyploïdes. 10X pour le mapping de liaison des lignées parentales ; 0,8-1,0X pour les individus de F1, F2 ; 0,6X pour les individus de RIL, DH ; 1,5X pour l'analyse génétique des populations. | 0,4-15X | >100 mille balises/échantillon ; 10X/balise ; dépend de la taille du génome et de la densité des marqueurs requise. | <1X pour un génome avec référence complète ; 10-20X pour la découverte de locus de novo ou le génotypage en diploïde ; 5X pour plusieurs échantillons combinés de novo ; plus élevé pour les polyploïdes. 10X pour le mapping de liaison des lignées parentales ; 0,8-1,0X pour des individus de F1, F2 ; 0,6X pour des individus de RIL, DH ; 1,5X pour des individus d'analyse génétique de population. | <1X pour un génome avec référence complète ; 10-20X pour la découverte de locus de novo ou le génotypage en diploïde ; 5X pour plusieurs échantillons combinés de novo ; plus élevé pour les polyploïdes. 10X pour le mapping de liaison des lignées parentales ; 0,8-1,0X pour les individus de F1, F2 ; 0,6X pour les individus de RIL, DH ; 1,5X pour les individus d'analyse génétique de population. | <1X pour le génome avec référence complète ; 10-20X pour la découverte de locus de novo ou le génotypage en diploïde ; 5X pour plusieurs échantillons combinés de novo ; plus élevé pour les polyploïdes. 10X pour le mapping de liaison des lignées parentales ; 0,8-1,0X pour les individus de F1, F2 ; 0,6X pour les individus de RIL, DH ; 1,5X pour les individus d'analyse génétique de population. |
| avantages | un grand nombre de marqueurs, de longs fragments peuvent être obtenus pour la conception des amorces | fragments uniformes, opération facile | opération facile | distribution uniforme de marqueurs, nombre de marqueurs contrôlable | distribution uniforme de marqueurs, nombre de marqueurs contrôlable | distribution uniforme de marqueurs, nombre de marqueurs contrôlable |
| inconvénients | opération d'expérience complexe | loci plus courts, non adaptés aux génomes complexes et hétérozygotes | moins de loci que RAD, taux de manquants élevé | moins de loci que RAD | moins de loci que RAD | interférence de dégradation de l'ADN, perte de données |
| applications | Recherche sur les marqueurs de haute densité et développement de marqueurs moléculaires. | génome simple | grands échantillons et plusieurs génomes complexes avec des séquences répétées élevées | grands échantillons et plusieurs génomes complexes avec de longues séquences répétées | grands échantillons et plusieurs génomes complexes avec de longues séquences répétées | grands échantillons et plusieurs génomes complexes avec de nombreuses séquences répétées |