Qu'est-ce que le RAD-seq ?
De nos jours, l'application de la technologie de séquençage à représentation réduite dans le génotypage SNP à grande échelle et à haut débit est un domaine de recherche en plein essor. Des enzymes de restriction sont utilisées pour fragmenter l'ADN génomique, puis certains fragments caractéristiques sont sélectionnés et soumis à la technologie de séquençage de nouvelle génération pour l'identification de marqueurs génétiques au sein du génome de manière à haut débit. La technologie de séquençage à représentation réduite la plus largement utilisée, le séquençage d'ADN associé aux sites de restriction (RAD-seq), a été développée par des chercheurs de l'Université de l'Oregon. Comparée aux bibliothèques à extrémités appariées et aux bibliothèques à paires de mates, la technologie RAD-seq avec méthode de pooling peut créer jusqu'à 96 bibliothèques de séquençage en une seule fois, ce qui est assez pratique pour l'opération expérimentale et rentable. Plus important encore, elle ne dépend pas des informations du génome de référence.
La technologie RAD-seq est un séquençage à haut débit de fragments spécifiques d'enzymes de restriction. Des millions de marqueurs génétiques de polymorphisme peuvent être obtenus par un seul séquençage, et le RAD-seq a été largement utilisé dans des domaines de recherche tels que l'écologie, la génétique, la génomique et d'autres. Selon le type et la quantité d'endonucléase de restriction utilisée, le RAD-seq peut être divisé en RAD-seq original, 2b-RAD, ddRAD, ezRAD, GBS (génotypage par séquençage) et d'autres méthodes.
Avantages du 2b-RAD par rapport à d'autres méthodes de séquençage RAD
2b-RAD est une sorte de technologie RAD-seq, qui est réalisée sur la base de fragments uniformes générés par une endonucléase de restriction de type IIB. 2b-RAD surmonte efficacement certaines des limitations du RAD-seq, telles que le processus de construction de bibliothèque délicat et les longueurs variées des fragments d'ADN restreints. Nous avons passé en revue les principaux avantages de 2b-RAD par rapport à d'autres technologies de séquençage RAD, qui sont énumérés comme suit.
(1) Plus de types et de nombres de marqueursLe nombre de loci obtenus par différentes technologies de RAD-seq varie considérablement. Dans l'ensemble, le 2b-RAD peut obtenir plus de loci et est plus adapté pour étudier les relations évolutives, la structure des populations, le flux génétique et d'autres problèmes connexes. En plus des SNP, le 2b-RAD peut également fournir des marqueurs dominants et des informations sur les CNV.
(2) Étiquettes indépendantesLes tags 2b-RAD sont indépendants, ce qui permet de réduire la redondance des données et d'augmenter le contenu informationnel. D'autres technologies Rad-seq sont susceptibles de détecter une séquence de chaque côté d'un site de restriction, et les informations fournies par les fragments adjacents sont complètement liées, équivalentes à la redondance des données. La technique 2b-RAD fournit plus d'informations car le point de contact se trouve des deux côtés, rendant impossible que deux tags soient complètement adjacents.
(3) Toutes les bibliothèques séquencéesPour le 2b-RAD, tous les fragments d'enzyme coupés par l'enzyme de restriction sont utilisés pour le séquençage, garantissant que les sites de restriction ne sont pas perdus. Cela permet une couverture ultra-dense du génome, et l'information est plus complète. En théorie, la distance de distribution moyenne des étiquettes 2b-RAD sur le génome est de 2 kb. C'est-à-dire qu'il est possible d'obtenir plus de 200 000 étiquettes dans un génome de taille 1G.
(4) Haute répétabilitéLe processus de 2b-RAD est simple et présente une grande répétabilité technique. Le résultat est très cohérent après qu'un échantillon a été séquencé deux fois. Il utilise la stratégie N+1, donc chaque projet effectuera par défaut une répétition technique pour un individu. C'est-à-dire que le même échantillon répétera la construction de la séquence de bibliothèque une fois, garantissant que le taux de récurrence des balises du même échantillon ne doit pas être inférieur à 95 % entre deux expériences, et que le taux de récurrence des marques ne doit pas être inférieur à 85 %.
(5) Profondeur de séquençage uniformeLa technique 2b-RAD génère des étiquettes de coupe enzymatique de longueur égale de 33 à 36 pb, qui sont enrichies pour la réaction de séquençage à haut débit en aval, et le dépistage et l'analyse de typage SNP à l'échelle du génome sont réalisés grâce à une analyse bioinformatique. La profondeur uniforme de séquençage garantit la fiabilité et l'exactitude de chaque étiquette.
Tableau 1. Les avantages de 2b-RAD par rapport à d'autres technologies de séquençage Rad.
| RAD-seq original | GBS | ddRAD | 2b-RAD | |
| Processus | Le processus implique la sélection de fragments et l'isolement et la purification de l'ADN en plusieurs étapes. | Aucune interruption physique, sélection de la taille des fragments et réparation de fin. | Le processus implique la sélection de fragments et l'isolement et la purification de l'ADN en plusieurs étapes. | Le processus est simple, sans interruption physique, sélection de la taille des fragments et réparation de fin. |
| Sélection de fragments | 300-1000 pb | ≤300pb | ≤300 points de base | 33-36pb |
| Couverture des sites de restriction | Partie | Partie | Partie | Entier |
| Répétabilité technique | Bas | Bas | Bas | Élevé |
| Contrôle de la densité des étiquettes | Pauvre | Pauvre | Général | Flexible et contrôlable |
| Profondeur de séquençage des balises | Très différent | Très différent | Très différent | Uniforme |
| Type de marqueur | SNP | SNP | SNP | SNP et marqueurs dominants |
| Analyse | L'efficacité d'élimination était faible pour les faux positifs de SNP causés par des séquences répétées. | L'efficacité d'élimination était faible pour les faux positifs de SNP causés par des séquences répétées. | L'efficacité d'élimination était faible pour les faux positifs de SNP causés par des séquences répétées. | Le nouvel algorithme de typage des données (iML) peut efficacement éliminer les SNP faussement positifs causés par des séquences répétées. |
Flux de travail de 2b-RAD
Le cœur de 2b-RAD est l'application de l'endonucléase de restriction de type IIb (Figure 1). Ce type d'endonucléase reconnaît six bases d'ADN double brin, puis coupe l'ADN en amont et en aval du site de reconnaissance, ce qui donne une séquence de balise de 27 pb. L'extrémité 3' de la balise est mise en évidence par 3 bases, qui sont également complètement aléatoires en composition. L'adaptateur adapté à la plateforme de séquençage à haut débit est ligaturé des deux côtés de la balise, et après amplification par PCR, il peut être utilisé pour le séquençage.

Figure 1. Préparation et séquençage des tags 2b-RAD.
(1) Préparation et digestion des échantillonsL'ADN génomique est extrait et sa concentration, ainsi que la contamination par des protéines et de l'ARN, sont détectées. L'ADN est digéré avec l'enzyme de restriction II. Un échantillon supplémentaire peut être digéré simultanément pour détecter l'efficacité de la digestion par électrophorèse sur gel d'agarose à 1 %. La bande d'ADN primaire a disparu et est devenue dispersée, indiquant une digestion réussie.
(2) Adaptateur de connexionDes adaptateurs spécifiques sont attachés aux fragments de restriction produits ci-dessus. À ce stade, la représentation réduite des tags (RTR) peut être obtenue pour cibler un sous-ensemble des sites de restriction pour le génotypage.
(3) AmplificationL'amplification PCR utilise une ADN polymérase à haute fidélité et un ensemble d'amorces. Ces amorces peuvent introduire des codes-barres spécifiques à l'échantillon et les séquences nécessaires à l'enrichissement par billes sur le système de séquençage. En moyenne, trois réactions d'amplification sont réalisées pour chaque échantillon et fusionnées. Les produits PCR fusionnés ont été purifiés par électrophorèse.
(4) Séquençage. Les bibliothèques qualifiées sont séquencées sur des plateformes SOLiD ou Illumina. Les bibliothèques standard BsaXI pour Illumina sont sérialisées puis séquencées en paires par la plateforme Hiseq X-ten, PE150 ou Hiseq 2500 v2.
(5) Contrôle de la qualitéLes plateformes SOLiD et Illumina produisent des lectures de 35 pb de longueur. La position de la balise terminale doit être exclue à chaque lecture pour éliminer l'influence des artefacts. Ensuite, les longues régions homo-polymères, les positions de qualité excessivement basse et les lectures floues sont éliminées. Les lectures de haute qualité restantes sont utilisées pour l'analyse suivante.
(6) Alignement de séquencesPour l'analyse basée sur des références, le paquet logiciel SHRiMP est utilisé pour l'alignement de lectures de haute qualité contre la base de données de référence. Pour de novo L'analyse, le paquet logiciel CD-HIT est utilisé pour les organismes qui n'ont pas de séquence de génome complète.
(7) Analyse avancée
I) Construction de cartes de liaison à haute précision. Sur la base des résultats de génotypage, le logiciel Joinmap peut être utilisé pour construire la carte de liaison génétique, et enfin intégrer la carte génétique avec MergeMap et d'autres logiciels.
II) Localisation des loci de caractère quantitatif (QTL). Sur la base des données phénotypiques et de la carte de liaison à haute densité, il est possible d'atteindre la localisation précise des QTL pour les traits quantitatifs ou qualitatifs. Les résultats de l'analyse de corrélation peuvent être utilisés pour aider à évaluer la fiabilité des résultats de l'analyse QTL.
III) Génétique des populations. Selon le nombre de balises entre différents groupes et entre différents individus au sein du groupe, la présence ou l'absence de la même balise, la fréquence des gènes et la fréquence des génotypes des marqueurs SNP au sein de la balise, la différenciation et l'évolution des populations peuvent être évaluées.
Chez CD Genomics, nous vous offrons des services de séquençage de haute qualité et intégrés. bioinformatique analyse pour votre Génotypage SNP projet. Si vous avez des exigences supplémentaires ou des questions, n'hésitez pas à nous contacter.
Références :