Analyse de ségrégation en vrac (BSA)

Qu'est-ce que le BSA ?

L'analyse de ségrégation en vrac (BSA) est une technique de cartographie des QTL pour identifier les loci génomiques affectant un trait d'intérêt. La technique consiste à former deux groupes en croisant des individus présentant des phénotypes extrêmement opposés ou un mutant d'intérêt est croisé avec un type sauvage, puis deux pools sont créés en sélectionnant des individus aux extrémités de la distribution phénotypique, suivis d'un séquençage en pool. Les fréquences alléliques sont ensuite estimées pour les deux pools ; des différences apparaîtront entre les deux pools si les régions du génome contiennent des loci causaux.

BSA Analysis Workflow

Qu'est-ce que le BSA-seq ?

Alors que les techniques de regroupement de population ont progressé et que le coût de Séquençage de nouvelle génération (NGS) a considérablement diminué, l'intégration de rééchantillonnage du génome entier L'analyse de ségrégation en masse (BSA) est devenue une approche prédominante. La fusion de la BSA avec le séquençage de nouvelle génération (NGS), appelée BSA-seq, a accéléré l'identification de marqueurs étroitement liés à des traits clés, améliorant ainsi la découverte de gènes et la résolution du cartographie des loci de traits quantitatifs (QTL). Notamment, le BSA-seq offre des économies de temps considérables dans la construction de populations expérimentales, en particulier lors de la localisation des QTL, en faisant un moyen rapide et efficace d'identifier des gènes fonctionnels et des loci associés à des traits quantitatifs. En résumé, le BSA-seq, ancré dans l'amalgame de regroupement de populations et des technologies de séquençage de deuxième génération, est capable de discerner des sites de polymorphisme nucléotidique unique (SNP) associés à des traits phénotypiques. Il a trouvé une large application dans la localisation précise des QTL et l'identification de gènes cibles fonctionnels.

Principes de la technologie BSA-seq

La technique BSA-seq a permis de surmonter de nombreuses limitations associées à la création de Lignes Isogéniques Proches (NILs) dans les cultures. Son principe consiste à hybrider une paire de lignées parentales présentant des traits d'intérêt contrastés. Par la suite, à partir de n'importe quelle population de descendants en segregation (généralement la génération F2), 20 à 50 plantes individuelles affichant des phénotypes extrêmes pour le trait cible sont sélectionnées. L'ADN de ces individus est ensuite extrait et mis en commun de manière équimolaire, ce qui permet de créer deux pools génétiques distincts. Ces deux pools génétiques doivent différer en ce qui concerne le trait d'intérêt, tandis que tous les autres loci génomiques restent aléatoires. Les marqueurs polymorphes identifiés à partir de la comparaison de ces deux pools peuvent être associés à un gène fonctionnel ou à un QTL d'intérêt.

Avantages et caractéristiques de BSA-seq

  • Période expérimentale courte
  • Résultats de cartographie précis
  • Rentable

Diagramme de flux de l'expérience BSA

Figure 2: BSA Experimental Workflow DiagramNature Biotechnology, 2011., Akira Abe et al.

Spécifications de service

Exigences d'échantillon
  • Types d'échantillons : Deux parents à phénotypes extrêmes ou parents à phénotype sauvage, pool mixte de descendants à phénotypes extrêmes avec au moins 20 individus.
  • Échantillon d'ADN : ~1,5 μg (concentration ≥ 30 ng/μl ; OD260/280=1,8~2,0)
Remarque : Les montants d'échantillons sont indiqués à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Cliquez
Stratégie de séquençage
  • Plateformes Illumina HiSeq
  • Pool parental 20X, pool de descendance 30X
  • Analyse des métriques de qualité de séquençage
Analyse bioinformatique
Nous proposons plusieurs analyses de bioinformatique personnalisées :
  • Contrôle qualité des données brutes
  • Alignement de référence
  • Détection et annotation des SNP, Indel et SV
  • Analyse de la fréquence des allèles
  • Cartographie de la position du trait d'intérêt
  • Annotation fonctionnelle des gènes candidats
Remarque : Les sorties de données et les contenus d'analyse recommandés affichés sont à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Analyse des données BSA-seq

Pour identifier les loci de gènes fonctionnels, une comparaison au niveau des SNP entre les deux populations regroupées et séquencées est essentielle. La méthode la plus couramment utilisée à cet effet est l'approche du SNP-index. Son principe sous-jacent implique l'analyse statistique des bases à chaque position de nucléotide à l'aide des lectures de séquençage. Un parent de référence ou un génome de référence existant est généralement sélectionné comme référence. Les comptages de lectures dans le pool de descendants qui correspondent ou diffèrent de la référence à une position de nucléotide spécifique sont comptés, et le ratio des lectures différentes par rapport au total des lectures à cette position est calculé, donnant ainsi le SNP-index. Le SNP-index est déterminé dans une fenêtre glissante, généralement en utilisant une taille de fenêtre de 1 Mb avec un incrément de 10 kb pour chaque glissement. De plus, Δ(SNP-index) est utilisé pour mesurer la différence des indices SNP entre les deux pools de gènes, capturant ainsi efficacement les variations à des loci individuels. Les résultats sont généralement visualisés dans un graphique de type Manhattan, comme illustré ci-dessous, où l'axe horizontal représente les positions chromosomiques, l'axe vertical du graphique SNP-index indique les ratios de lectures calculés pour chaque position SNP, et l'axe vertical du graphique Δ(SNP-index) représente la différence des indices SNP entre les deux échantillons regroupés. Plus la valeur absolue de Δ(SNP-index) est grande, plus un locus est significativement associé au trait extrême.

Example of SNP-Index and (SNP-Index) Calculation Results.Exemple de résultats de calcul de l'indice SNP et de Δ(indice SNP)

Livrables

  • Les données de séquençage originales
  • Résultats expérimentaux
  • Rapport d'analyse des données

Référence

  1. Michelmore RW, Paran I, Kesseli RV. Identification de marqueurs liés aux gènes de résistance aux maladies par analyse de ségrégation groupée : une méthode rapide pour détecter des marqueurs dans des régions génomiques spécifiques en utilisant des populations ségrégeantes. Proc Natl Acad Sci U S A1991;88(21):9828-9832. doi:10.1073/pnas.88.21.9828
  2. Zhang K, Li Y, Zhu W, et al. Cartographie fine et analyse du transcriptome du gène de feuille viridiante v-2 dans le concombre (Cucumis sativus L.). Front Plant Sci2020;11:570817. Publié le 25 septembre 2020. doi:10.3389/fpls.2020.570817
  3. Lee SB, Kim JE, Kim HT, Lee GM, Kim BS, Lee JM. Le mapping génétique du locus c1 par séquençage BSA basé sur GBS a révélé le régulateur de réponse pseudo 2 comme un gène candidat contrôlant la couleur des fruits de poivre. Théor Appl Génét. 2020 ; 133(6) : 1897-1910. doi:10.1007/s00122-020-03565-5
  4. Guo Z, Cai L, Chen Z, et al. Identification des gènes candidats contrôlant la tolérance au froid du riz dans la région froide au stade de la montaison par BSA-Seq et RNA-Seq. R Soc Open Sci. 2020;7(11):201081. Publié le 18 novembre 2020. doi:10.1098/rsos.201081
  5. Zhao Z, Sheng X, Yu H, Wang J, Shen Y, Gu H. Identification des gènes candidats impliqués dans la rizification des fleurs de chou-fleur. Int J Mol Sci. 2020;21(6):1999. Publié le 15 mars 2020. doi:10.3390/ijms21061999
  6. Aguado E, García A, Iglesias-Moya J, et al. Cartographie d'un locus d'andromonoécie partielle chez Citrullus lanatus en utilisant des approches BSA-Seq et GWAS. Frontières en Sciences des Plantes. 2020;11:1243. Publié le 19 août 2020. doi:10.3389/fpls.2020.01243

Résultats de la démo

Des résultats partiels sont présentés ci-dessous :

The BSA-seq Results Display Figure.

FAQs sur l'analyse de ségrégation en vrac

Q1 : Quels types de lignées parentales sont adaptées à la construction de populations ?

A1 : Il est recommandé de sélectionner des lignées parentales avec un minimum de loci hétérozygotes et de différences de traits uniques. De plus, les différences entre les lignées parentales ne doivent pas être trop importantes, car une différenciation excessive peut entraîner des faux positifs prononcés, rendant difficile l'identification des véritables régions cibles. Lors de la sélection des lignées parentales pour le trait cible, diverses méthodes peuvent être employées, telles que la mutagenèse par EMS, les individus naturels et la mutagenèse par UV, qui peuvent toutes être utilisées dans l'analyse de ségrégation en vrac (BSA).

Q2 : Qu'est-ce qui justifie la préférence pour la sélection de lignées individuelles plutôt que de populations mixtes, de populations naturelles ou de populations d'arbres ?

A2 : Les populations mixtes, les populations naturelles et les populations d'arbres sont souvent caractérisées par un degré significatif d'hétérozygotie, entraînant une diversité génétique substantielle. Même au sein de régions d'ADN limitées, la coexistence de multiples génotypes alléliques est une occurrence courante. Cette prévalence de génotypes divers au sein des pools d'ADN conduit à une fiabilité diminuée dans la détection des polymorphismes nucléotidiques simples (SNP) et au calcul précis des fréquences génotypiques.

Dans les lignées hybrides, un segment d'ADN contient généralement seulement deux allèles, un de chaque parent, ce qui rend l'alignement des lectures à une séquence de référence et la détection de variants relativement simples. Dans les populations hautement hétérozygotes, le regroupement d'ADN provenant de diverses sources augmente la diversité des lectures, entraînant des taux d'erreur plus élevés dans l'alignement du génome de référence et la détection de SNP.

Dans l'analyse BSA-seq basée sur les lignées hybrides, la plupart des génotypes mutants sont à haute fréquence (≥0,5), ce qui les rend relativement faciles à détecter. En revanche, les populations naturelles présentent souvent de nombreux SNPs à faible fréquence, et lorsqu'ils sont regroupés, il devient difficile de distinguer les véritables SNPs à faible fréquence de ceux résultant d'erreurs de séquençage ou d'alignement, ce qui introduit des complexités dans l'analyse des données.

Q3 : Est-il possible d'extraire l'ADN parental à partir d'échantillons de graines et l'ADN des descendants à partir d'échantillons de feuilles ?

A3 : La sélection de parties spécifiques de plantes pour l'extraction de l'ADN dépend de deux facteurs essentiels : la constitution de l'enveloppe de la graine et de l'endosperme, ainsi que le degré d'homozygotie. L'origine principalement attribuée au parent maternel au sein de l'enveloppe de la graine peut exercer une influence. De même, le degré d'homozygotie chez la descendance est une considération cruciale. Dans les cas où l'homozygotie est substantielle et où la disparité entre l'ADN parental et celui de la descendance est minimale, l'influence devient réduite.

Q4 : Quelle est la procédure recommandée pour regrouper l'ADN des descendants ?

A4 : Il est conseillé d'extraire individuellement l'ADN de chaque échantillon de descendance et de les combiner ensuite en quantités équimolaires. Cette approche permet de minimiser le bruit de fond et de réduire les erreurs systématiques potentielles.

Q5 : Quels critères les populations de descendants doivent-elles respecter ?

A5 : En principe, toute descendance hybride démontrant une ségrégation des traits pour la caractéristique cible peut être adaptée à l'analyse de ségrégation en masse (BSA). Les populations couramment utilisées incluent les générations F2, les populations de retour et les lignées recombinantes consanguines. Pour les traits qualitatifs, la descendance peut afficher un ratio de 1:1 ou 3:1, en fonction du trait spécifique étudié. Dans le contexte des traits quantitatifs, il est avantageux que la descendance présente des traits conformes à une distribution normale. En cas de déviation prononcée par rapport à la normalité, il devient impératif d'évaluer l'influence potentielle des gènes létaux récessifs.

Q6 : Est-il possible de garantir la taille de la région candidate et le nombre de gènes candidats ?

A6 : Les dimensions de la région candidate et la quantité de gènes candidats dépendent de divers éléments, notamment la taille de la population, le niveau de divergence génétique entre les matériaux parentaux, les caractéristiques du trait cible, la profondeur de séquençage et le milieu génomique spécifique à l'espèce étudiée. Ces paramètres peuvent être estimés à travers le prisme des expériences spécifiques au projet et de la littérature pertinente.

Q7 : Dans les cas où l'intervalle cartographié présente une taille excessive, quelles mesures peuvent être employées pour l'ajustement ?

A7 : Pour affiner l'intervalle de cartographie, on peut ajuster l'intervalle de confiance ou opter pour la sélection de marqueurs SNP et InDel spécifiques au sein de l'intervalle de cartographie BSA, créant ainsi une carte locale. Cette stratégie s'avère efficace pour minimiser l'étendue de la région de cartographie.

Q8 : Après la sélection des gènes candidats, comment le gène cible est-il validé ?

A8 : Les méthodes de validation courantes incluent :

Validation des SNP :

Convertir les SNP candidats en marqueurs CAPS ou dCAPS pour validation.

Analyse les sites de reconnaissance des enzymes de restriction pour les SNPs candidats, sélectionnez les SNPs provoquant des changements dans les sites de reconnaissance des enzymes, amplifiez les fragments contenant les SNPs correspondants à l'aide de primers spécifiques, puis effectuez une digestion enzymatique et une électrophorèse sur gel pour convertir les SNPs en marqueurs CAPS. Analysez le polymorphisme des marqueurs CAPS pour validation.

Amplifiez par PCR les régions SNP candidates et validez les produits d'amplification en utilisant le séquençage Sanger.

Valider l'expression des gènes candidats dans différents phénotypes en utilisant la RT-PCR.

Effectuer une analyse de l'expression génique différentielle basée sur les transcriptomes pour examiner les différences significatives dans l'expression des gènes.

Analyse de l'ARNi : Utilisez la technologie de l'ARNi pour réduire ou éliminer spécifiquement l'expression de gènes spécifiques.

Q9 : Quelles sont les exigences pour les lignées parentales lors de la construction de la population ?

A9 : Les lignées parentales doivent être aussi pures que possible, et cette pureté peut être obtenue par auto-pollinisation. Les deux lignées parentales doivent présenter des différences significatives dans le caractère cible, mais d'autres caractères doivent être aussi cohérents que possible pour minimiser les interférences lors des analyses de cartographie ultérieures.

Q10 : Quelle est la raison de recommander l'homozygotie dans les lignées parentales pour le caractère cible dans le BSA-seq ?

A10 : Le concept fondamental du mapping des traits par BSA-seq repose sur l'identification des SNPs provenant des deux sources parentales et le calcul subséquent de l'indice SNP sur l'ensemble du génome au sein des pools de descendants. Si les lignées parentales ne sont pas homozygotes, cela peut entraîner une diminution du taux de détection des SNPs chez les descendants et un indice SNP réduit. Par conséquent, pour réussir le mapping, il deviendrait nécessaire d'abaisser le seuil de sélection de l'indice SNP, ce qui pourrait entraîner une augmentation des faux positifs. Dans le calcul de l'indice SNP, la pratique courante consiste à utiliser la lignée parentale comme référence et à filtrer les loci homozygotes, où l'indice SNP est ensuite calculé dans le pool de descendants à ces loci spécifiques.

Q11 : Quel est le nombre optimal d'échantillons de descendants à recueillir ?

A11 : La collecte d'échantillons de descendants doit respecter les directives suivantes : Pour les traits qualitatifs, il est conseillé de rassembler autant d'individus récessifs que possible, avec un minimum de 20 individus, généralement compris entre 30 et 50. De même, un nombre égal d'individus dominants doit être collecté. En ce qui concerne les traits quantitatifs, il est généralement recommandé de choisir les 5%-10% des individus présentant les valeurs de traits les plus extrêmes pour une évaluation plus approfondie. De plus, la création d'un histogramme basé sur les données des traits des descendants peut s'avérer précieuse pour orienter le processus de sélection.

Histogram of Offspring Trait Data.

Q12 : Quelle est la profondeur de séquençage requise pour les lignées parentales et les lignées descendantes lors du resequencement ?

A12 : Pour garantir l'exactitude des marqueurs SNP et InDel, le séquençage doit maintenir une certaine profondeur. Il est recommandé que les lignées parentales aient une profondeur de séquençage d'au moins 20X. La profondeur de séquençage pour les échantillons groupés doit être déterminée en fonction du nombre d'échantillons, avec une profondeur moyenne d'au moins 1X par échantillon. Par exemple, s'il y a 30+30 descendants, alors la profondeur de séquençage pour chaque pool de descendants ne doit pas être inférieure à 30X. Si les contraintes budgétaires le permettent, vous pouvez envisager d'augmenter encore la profondeur.

Q13 : La séquençage génomique réduit peut-il être utilisé pour le cartographie des traits par BSA ?

A13 : La technologie de BSA à génome réduit ne peut capturer que 1 % à 10 % de l'ensemble du génome. Si l'espèce étudiée possède un grand génome et que le caractère d'intérêt est contrôlé par plusieurs gènes mineurs avec de nombreux loci associés, le séquençage à génome réduit peut capturer quelques loci mais manquera la majorité d'entre eux, ce qui peut être désavantageux pour des recherches ultérieures. Pour les caractères qualitatifs ou les caractères quantitatifs contrôlés par des gènes majeurs, il existe un risque élevé associé au BSA à génome réduit. Il est conseillé d'effectuer un séquençage à génome réduit pour les lignées parentales et la population, et de construire une carte de liaison à génome complet pour le mapping des gènes de caractères.

Études de cas sur l'analyse de ségrégation en vrac

Cas classique : Le séquençage de nouvelle génération à partir de l'analyse de ségrégation en vrac accélère l'identification simultanée de deux gènes qualitatifs chez le soja.

Journal : Frontières en science des plantes
Facteur d'impact : 6,627
Publié : 31 mai 2017

Contexte

Analyse de ségrégation en vrac (BSA) offrent une approche simple pour l'identification rapide de marqueurs moléculaires étroitement associés aux phénotypes. Les techniques de BSA ont été utilisées dans diverses espèces pour la localisation de gènes importants. Avec les avancées des technologies de séquençage de l'ADN, les méthodes de BSA basées sur Séquençage de nouvelle génération (NGS) ont considérablement accéléré l'identification des gènes responsables de maladies. Le soja, l'une des cultures légumineuses les plus largement cultivées au monde, a pris du retard par rapport à d'autres cultures dans l'identification et l'isolement des gènes, en raison d'une variation génétique limitée, d'un génome complexe et volumineux, et d'une faible efficacité de transformation génétique. Seuls quelques gènes régissant des traits spécifiques, tels que l'habitude de croissance de la tige et le nombre de graines par gousse, ont été identifiés. Le développement de méthodes pour identifier rapidement les gènes qui contrôlent des traits agronomiques importants est d'une importance capitale pour faire progresser la recherche sur la fonctionnalité des gènes du soja.

Figure 1: Analysis of Cotyledon Color Genetics in the ZH30 and JY102 Cross. (Song et al., 2017)FIGURE 1. Analyse génétique de la couleur des cotylédons dans un croisement entre ZH30 et JY102.

Échantillon source : Pédigrée F2 se concentrant sur le phénotype de la couleur des feuilles jaune/vert

Taille de l'échantillon : 2 lignées parentales + 30 descendants à feuilles jaunes + 30 descendants à feuilles vertes

Profondeur de séquençage : Lignes parentales (12X + 9X), descendants (59X + 53X)

Matériaux et Méthodes

Préparation des échantillons

  • Soja
  • Jeunes feuilles
  • Extraction d'ADN

Séquençage

Analyse de données

  • Analyse de l'indice SNP
  • Analyse par fenêtre glissante

Résultats

Zhonghuang30 est la lignée parentale avec des feuilles jaunes, et Jiyu102 est la lignée parentale avec des feuilles vertes. Grâce au retour à la lignée F1 avec Zhonghuang30 (la lignée parentale à feuilles jaunes), aucune ségrégation n'est survenue, confirmant la dominance de la couleur jaune dans la lignée parentale. Sur la base des ratios de ségrégation dans la génération F2 et les lignées F2:3, il a été déterminé que la couleur des feuilles est contrôlée par deux gènes, le vert étant un trait récessif.

En utilisant la méthode QTL-seq, la localisation préliminaire du caractère cible (couleur des feuilles) a été réalisée, et sur la base de l'indice ΔSNP, le caractère cible a été initialement cartographié sur deux intervalles, qCC1 (~2,68 Mb) sur Chr1 et qCC2 (~2,68 Mb) sur Chr11. Par la suite, un affinage de la cartographie a été effectué en utilisant des marqueurs de recombinaison SSR et Indel sur 200 descendants pour réduire les régions de cartographie. qCC1 a été finement cartographié sur une région de 30,7 kb, qui comprenait quatre gènes, le gène D1 étant un homologue du gène vert dans Arabidopsis, comme rapporté précédemment dans d'autres études. qCC2 a été finement cartographié sur une région de 67,7 kb, qui comprenait neuf gènes, et de même, l'un de ces gènes, D2, est un homologue rapporté du gène vert dans Arabidopsis.

Une exploration fonctionnelle et une validation ont été réalisées pour ces deux gènes candidats. Il a été constaté que le gène D1 avait une base T manquante entre les lignées parentales, entraînant une mutation par décalage du cadre de lecture et une terminaison prématurée dans la lignée parentale verte, JY102. De plus, le gène D2 avait une répétition de séquence de 322 pb entre les lignées parentales, entraînant une terminaison prématurée de ce gène dans la lignée parentale verte, JY102.

Référence

  1. Song J, Li Z, Liu Z, et al. Le séquençage de nouvelle génération à partir de l'analyse de ségrégation en vrac accélère l'identification simultanée de deux gènes qualitatifs chez le soja. Frontières en science des plantes2017, 31;8:919.

Publications connexes

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

Collection de données génétiques dans des études basées sur l'ethnicité chez les Aymaras, Quechuas et Mestizos : les défis de l'étude sur la génétique de la maladie d'Alzheimer dans la population péruvienne (GAPP).

Journal : Alzheimer et Démence

Année : 2022

Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir et je serai heureux de vous aider.

Évaluation des biomarqueurs plasmatiques pour la classification A/T/N de la maladie d'Alzheimer chez les adultes d'ethnie hispanique des Caraïbes

Journal : JAMA Network Open

Année : 2023

Je suis désolé, mais je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Augmentation de la production de spores fongiques pathogènes et aéroportées suite à l'exposition d'une mycobiote du sol à des polluants chlorés aromatiques.

Journal : Microbiology Spectrum

Année : 2023

Désolé, je ne peux pas accéder aux contenus externes ou aux liens. Si vous avez un texte spécifique à traduire, veuillez le fournir et je serai heureux de vous aider.

Une variante de fusion dans le gène SLC16A8 entraîne un déficit de transport de lactate dans les cellules épithéliales pigmentaires rétiniennes dérivées de cellules iPS humaines.

Journal : Cellules

Année : 2021

Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir et je serai heureux de vous aider.

Voir plus articles publiés par nos clients.

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Ressources en vedette
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut