Analyse de ségrégation en vrac (BSA)

Qu'est-ce que le BSA ?

L'analyse de ségrégation en vrac (BSA) est une technique de cartographie des QTL pour identifier les loci génomiques affectant un trait d'intérêt. La technique consiste à former deux groupes en croisant des individus présentant des phénotypes extrêmement opposés ou un mutant d'intérêt est croisé avec un type sauvage, puis deux pools sont créés en sélectionnant des individus aux extrémités de la distribution phénotypique, suivis d'un séquençage en pool. Les fréquences alléliques sont ensuite estimées pour les deux pools ; des différences apparaîtront entre les deux pools si les régions du génome contiennent des loci causaux.

BSA Analysis Workflow

Qu'est-ce que le BSA-seq ?

À mesure que les techniques de regroupement de population ont progressé et que le coût de Séquençage de nouvelle génération (NGS) a considérablement diminué, l'intégration de resequencement de génome entier L'analyse de ségrégation en masse (BSA) est devenue une approche prédominante. La fusion de la BSA avec le séquençage de nouvelle génération (NGS), appelée BSA-seq, a accéléré l'identification de marqueurs étroitement liés à des traits clés, améliorant ainsi la découverte de gènes et la résolution du cartographie des loci de traits quantitatifs (QTL). Notamment, le BSA-seq offre des économies de temps substantielles dans la construction de populations expérimentales, en particulier lors de la localisation des QTL, ce qui en fait un moyen rapide et efficace d'identifier des gènes fonctionnels et des loci associés à des traits quantitatifs. En résumé, le BSA-seq, ancré dans l'amalgame du regroupement de populations et des technologies de séquençage de deuxième génération, est capable de discerner des sites de polymorphisme nucléotidique unique (SNP) associés à des traits phénotypiques. Il a trouvé une large application dans la localisation précise des QTL et l'identification de gènes cibles fonctionnels.

Principes de la technologie BSA-seq

La technique BSA-seq a permis de surmonter de nombreuses limitations associées à la création de Lignes Isogéniques Proches (NIL) dans les cultures. Son principe consiste à hybrider une paire de lignées parentales présentant des traits d'intérêt contrastés. Par la suite, à partir de n'importe quelle population de descendants segregants (généralement la génération F2), 20 à 50 plantes individuelles affichant des phénotypes extrêmes pour le trait cible sont sélectionnées. L'ADN de ces individus est ensuite extrait et mis en commun de manière équimolaire, ce qui permet de créer deux pools génétiques distincts. Ces deux pools génétiques doivent différer en ce qui concerne le trait d'intérêt, tandis que tous les autres loci génomiques restent aléatoires. Les marqueurs polymorphes identifiés à partir de la comparaison de ces deux pools peuvent être associés à un gène fonctionnel ou à un QTL d'intérêt.

Avantages et caractéristiques de BSA-seq

  • Période expérimentale courte
  • Résultats de cartographie précis
  • Économique

Diagramme de flux de l'expérience BSA

Figure 2: BSA Experimental Workflow DiagramNature Biotechnology, 2011., Akira Abe et al.

Spécifications de service

Exigences d'échantillon
  • Types d'échantillons : Deux parents à phénotypes extrêmes ou parents à phénotype sauvage, pool mélangé de descendants à phénotypes extrêmes avec au moins 20 individus.
  • Échantillon d'ADN : ~1,5 μg (concentration ≥ 30 ng/μl ; OD260/280=1,8~2,0)
Remarque : Les montants d'échantillons sont indiqués à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Cliquez
Stratégie de séquençage
  • Plateformes Illumina HiSeq
  • Pool parental 20X, pool de descendance 30X
  • Analyse des métriques de qualité de séquençage
Analyse bioinformatique
Nous proposons plusieurs analyses bioinformatiques personnalisées :
  • Contrôle qualité des données brutes
  • Alignement de référence
  • Détection et annotation des SNP, Indel et SV
  • Analyse de la fréquence des allèles
  • Cartographie de la position du trait d'intérêt
  • Annotation fonctionnelle des gènes candidats
Remarque : Les sorties de données et les contenus d'analyse recommandés affichés sont à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Analyse des données BSA-seq

Pour identifier des loci de gènes fonctionnels, une comparaison au niveau des SNP entre les deux populations regroupées et séquencées est essentielle. La méthode la plus couramment utilisée à cet effet est l'approche SNP-index. Son principe sous-jacent implique l'analyse statistique des bases à chaque position de nucléotide en utilisant les lectures de séquençage. Un parent de référence ou un génome de référence existant est généralement sélectionné comme référence. Les comptes de lectures dans le pool de descendants qui correspondent ou diffèrent de la référence à une position de nucléotide spécifique sont comptabilisés, et le ratio des lectures différentes par rapport au total des lectures à cette position est calculé, donnant ainsi le SNP-index. Le SNP-index est déterminé dans une fenêtre glissante, généralement en utilisant une taille de fenêtre de 1 Mb avec un incrément de 10 kb pour chaque glissement. De plus, Δ(SNP-index) est utilisé pour mesurer la différence dans les indices SNP entre les deux pools de gènes, capturant efficacement les variations à des loci individuels. Les résultats sont généralement visualisés dans un graphique de Manhattan, comme illustré ci-dessous, où l'axe horizontal représente les positions chromosomiques, l'axe vertical du graphique SNP-index indique les ratios de lecture calculés pour chaque position SNP, et l'axe vertical du graphique Δ(SNP-index) représente la différence dans les indices SNP entre les deux échantillons regroupés. Plus la valeur absolue de Δ(SNP-index) est grande, plus un locus est significativement associé au trait extrême.

Example of SNP-Index and (SNP-Index) Calculation Results.Exemple des résultats de calcul de l'indice SNP et de Δ(indice SNP)

Livrables

  • Les données de séquençage originales
  • Résultats expérimentaux
  • Rapport d'analyse des données

Référence

  1. Michelmore RW, Paran I, Kesseli RV. Identification de marqueurs liés aux gènes de résistance aux maladies par analyse de segregants groupés : une méthode rapide pour détecter des marqueurs dans des régions génomiques spécifiques en utilisant des populations segregantes. Proc Natl Acad Sci U S A1991 ; 88(21) : 9828-9832. doi : 10.1073/pnas.88.21.9828
  2. Zhang K, Li Y, Zhu W, et al. Cartographie fine et analyse du transcriptome du gène de feuille viridiante v-2 chez le concombre (Cucumis sativus L.). Front Plant Sci. 2020;11:570817. Publié le 25 septembre 2020. doi:10.3389/fpls.2020.570817
  3. Lee SB, Kim JE, Kim HT, Lee GM, Kim BS, Lee JM. Le mappage génétique du locus c1 par séquençage BSA basé sur GBS a révélé le régulateur de réponse pseudo-2 comme gène candidat contrôlant la couleur des fruits de poivron. Théor Appl Génét2020 ; 133(6) : 1897-1910. doi : 10.1007/s00122-020-03565-5
  4. Guo Z, Cai L, Chen Z, et al. Identification des gènes candidats contrôlant la tolérance au froid du riz dans la région froide au stade de la montée par BSA-Seq et RNA-Seq. R Soc Open Sci. 2020;7(11):201081. Publié le 18 novembre 2020. doi:10.1098/rsos.201081
  5. Zhao Z, Sheng X, Yu H, Wang J, Shen Y, Gu H. Identification des gènes candidats impliqués dans la rizicité des fleurs de chou-fleur. Int J Mol Sci. 2020;21(6):1999. Publié le 15 mars 2020. doi:10.3390/ijms21061999
  6. Aguado E, García A, Iglesias-Moya J, et al. Cartographie d'un locus d'andromonoécie partielle chez Citrullus lanatus en utilisant des approches BSA-Seq et GWAS. Front Plant Sci. 2020;11:1243. Publié le 19 août 2020. doi:10.3389/fpls.2020.01243

Les résultats partiels sont présentés ci-dessous :

The BSA-seq Results Display Figure.

Q1 : Quels types de lignées parentales sont adaptés à la construction de populations ?

A1 : Il est recommandé de sélectionner des lignées parentales avec un minimum de loci hétérozygotes et de différences de traits uniques. De plus, les différences entre les lignées parentales ne doivent pas être trop étendues, car une différenciation excessive peut entraîner des faux positifs prononcés, rendant difficile l'identification des véritables régions cibles. Lors de la sélection des lignées parentales pour le trait cible, diverses méthodes peuvent être employées, telles que la mutagenèse EMS, les individus naturels et la mutagenèse UV, toutes pouvant être utilisées dans l'analyse de ségrégation en vrac (BSA).

Q2 : Qu'est-ce qui justifie la préférence pour la sélection de lignées individuelles plutôt que de populations mixtes, de populations naturelles ou de populations d'arbres ?

A2 : Les populations mixtes, les populations naturelles et les populations d'arbres sont souvent caractérisées par un degré significatif d'hétérozygotie, entraînant une diversité génétique substantielle. Même au sein de régions d'ADN limitées, la coexistence de multiples génotypes alléliques est une occurrence courante. Cette prévalence de génotypes divers au sein des pools d'ADN conduit à une fiabilité diminuée dans la détection des polymorphismes nucléotidiques simples (SNP) et le calcul précis des fréquences génotypiques.

Dans les lignées hybrides, un segment d'ADN contient généralement seulement deux allèles, un de chaque parent, ce qui rend l'alignement des lectures à une séquence de référence et la détection des variants relativement simples. Dans les populations hautement hétérozygotes, le regroupement d'ADN provenant de diverses sources augmente la diversité des lectures, entraînant des taux d'erreur plus élevés dans l'alignement du génome de référence et la détection des SNP.

Dans l'analyse BSA-seq basée sur les lignées hybrides, la plupart des génotypes mutants sont à haute fréquence (≥0,5), ce qui les rend relativement faciles à détecter. En revanche, les populations naturelles présentent souvent de nombreux SNP à faible fréquence, et lorsqu'ils sont regroupés, il devient difficile de distinguer les véritables SNP à faible fréquence de ceux résultant d'erreurs de séquençage ou d'alignement, ce qui introduit des complexités dans l'analyse des données.

Q3 : Est-il possible d'extraire l'ADN parental à partir d'échantillons de graines et l'ADN des descendants à partir d'échantillons de feuilles ?

A3 : La sélection de parties spécifiques de plantes pour l'extraction d'ADN dépend de deux facteurs essentiels : la constitution de l'enveloppe de la graine et de l'endosperme, et le degré d'homozygotie. L'origine principalement attribuée au parent maternel au sein de l'enveloppe de la graine peut exercer une influence. De même, le degré d'homozygotie chez la progéniture est une considération cruciale. Dans les cas où l'homozygotie est substantielle et que la disparité entre l'ADN parental et celui de la progéniture est minimale, l'influence devient réduite.

Q4 : Quelle est la procédure recommandée pour regrouper l'ADN des descendants ?

A4 : Il est conseillé d'extraire individuellement l'ADN de chaque échantillon de descendance et de les combiner ensuite en quantités équimolaires. Cette approche permet de minimiser le bruit de fond et de réduire les erreurs systématiques potentielles.

Q5 : Quels critères les populations de descendants doivent-elles respecter ?

A5 : En principe, toute descendance hybride démontrant une ségrégation des traits pour la caractéristique cible peut être adaptée à l'analyse de ségrégation en vrac (BSA). Les populations couramment utilisées incluent les générations F2, les populations de rétro-croisement et les lignées recombinantes consanguines. Pour les traits qualitatifs, la descendance peut afficher un ratio de 1:1 ou 3:1, en fonction du trait spécifique étudié. Dans le contexte des traits quantitatifs, il est avantageux que la descendance présente des traits conformes à une distribution normale. En cas de déviation prononcée par rapport à la normalité, il devient impératif d'évaluer l'influence potentielle des gènes létaux récessifs.

Q6 : Est-il possible de garantir la taille de la région candidate et le nombre de gènes candidats ?

A6 : Les dimensions de la région candidate et la quantité de gènes candidats dépendent de divers éléments, notamment la taille de la population, le niveau de divergence génétique entre les matériaux parentaux, les caractéristiques du trait cible, la profondeur de séquençage et le milieu génomique spécifique à l'espèce étudiée. Ces paramètres peuvent être estimés à travers le prisme des expériences spécifiques au projet et de la littérature pertinente.

Q7 : Dans les cas où l'intervalle cartographié présente une taille excessive, quelles mesures peuvent être employées pour l'ajuster ?

A7 : Pour affiner l'intervalle de cartographie, on peut ajuster l'intervalle de confiance ou opter pour la sélection de marqueurs SNP et InDel spécifiques au sein de l'intervalle de cartographie BSA, créant ainsi une carte locale. Cette stratégie s'avère efficace pour minimiser l'étendue de la région de cartographie.

Q8 : Après la sélection des gènes candidats, comment le gène cible est-il validé ?

A8 : Les méthodes de validation courantes incluent :

Validation des SNP :

Convertir les SNP candidats en marqueurs CAPS ou dCAPS pour validation.

Analyse les sites de reconnaissance des enzymes de restriction pour les SNPs candidats, sélectionnez les SNPs provoquant des changements dans les sites de reconnaissance des enzymes, amplifiez les fragments contenant les SNPs correspondants à l'aide de primers spécifiques, puis effectuez une digestion enzymatique et une électrophorèse sur gel pour convertir les SNPs en marqueurs CAPS. Analysez le polymorphisme des marqueurs CAPS pour validation.

Amplifiez les régions SNP candidates par PCR et validez les produits d'amplification en utilisant le séquençage Sanger.

Valider l'expression des gènes candidats dans différents phénotypes en utilisant la RT-PCR.

Effectuer une analyse d'expression génique différentielle basée sur les transcriptomes pour examiner les différences significatives dans l'expression des gènes.

Analyse de l'ARNi : Utilisez la technologie de l'ARNi pour réduire ou supprimer spécifiquement l'expression de gènes spécifiques.

Q9 : Quelles sont les exigences pour les lignées parentales lors de la construction de la population ?

A9 : Les lignées parentales doivent être aussi pures que possible, et cette pureté peut être atteinte par auto-pollinisation. Les deux lignées parentales doivent présenter des différences significatives dans le caractère cible, mais d'autres caractères doivent être aussi cohérents que possible pour minimiser les interférences dans les analyses de cartographie ultérieures.

Q10 : Quelle est la justification de la recommandation d'homozygotie dans les lignées parentales pour le caractère cible dans le séquençage BSA ?

A10 : Le concept fondamental du mapping des traits par BSA-seq repose sur l'identification des SNPs provenant des deux sources parentales et le calcul subséquent de l'indice SNP à travers l'ensemble du génome au sein des pools de descendants. Si les lignées parentales ne sont pas homozygotes, cela peut entraîner un taux de détection réduit des SNPs chez les descendants et un indice SNP diminué. Par conséquent, pour réussir le mapping, il deviendrait nécessaire d'abaisser le seuil de sélection de l'indice SNP, ce qui pourrait entraîner une augmentation de l'occurrence de faux positifs. Dans le calcul de l'indice SNP, la pratique courante consiste à utiliser la lignée parentale comme référence et à filtrer les loci homozygotes, où l'indice SNP est ensuite calculé dans le pool de descendants à ces loci spécifiques.

Q11 : Quel est le nombre optimal d'échantillons de descendants à recueillir ?

A11 : La collecte d'échantillons de descendants doit respecter les directives suivantes : Pour les traits qualitatifs, il est conseillé de collecter autant d'individus récessifs que possible, avec un minimum de 20 individus, généralement compris entre 30 et 50. De même, un nombre égal d'individus dominants doit être collecté. En ce qui concerne les traits quantitatifs, il est généralement recommandé de choisir les 5%-10% des individus affichant les valeurs de traits les plus extrêmes pour une évaluation plus approfondie. De plus, la création d'un histogramme basé sur les données de traits des descendants peut s'avérer précieuse pour orienter le processus de sélection.

Histogram of Offspring Trait Data.

Q12 : Quelle est la profondeur de séquençage requise pour les lignées parentales et les lignées descendantes lors du resequencement ?

A12 : Pour garantir l'exactitude des marqueurs SNP et InDel, le séquençage doit maintenir une certaine profondeur. Il est recommandé que les lignées parentales aient une profondeur de séquençage d'au moins 20X. La profondeur de séquençage pour les échantillons groupés doit être déterminée en fonction du nombre d'échantillons, avec une profondeur moyenne d'au moins 1X par échantillon. Par exemple, s'il y a 30+30 descendants, alors la profondeur de séquençage pour chaque pool de descendants ne doit pas être inférieure à 30X. Si les contraintes budgétaires le permettent, vous pouvez envisager d'augmenter encore la profondeur.

Q13 : La séquençage de génome réduit peut-il être utilisé pour le cartographie des traits par BSA ?

A13 : La technologie de BSA à génome réduit ne peut capturer que 1 % à 10 % de l'ensemble du génome. Si l'espèce étudiée possède un grand génome et que le caractère d'intérêt est contrôlé par plusieurs gènes mineurs avec de nombreux loci associés, le séquençage de génome réduit peut capturer quelques loci mais manquera la majorité d'entre eux, ce qui peut être désavantageux pour des recherches ultérieures. Pour les caractères qualitatifs ou les caractères quantitatifs contrôlés par des gènes majeurs, il existe un risque élevé associé à la BSA à génome réduit. Il est conseillé d'effectuer un séquençage de génome réduit pour les lignées parentales ainsi que pour la population, et de construire une carte de liaison à génome complet pour le mappage des gènes de caractère.

Cas classique : Le séquençage de nouvelle génération à partir de l'analyse de ségrégation en masse accélère l'identification simultanée de deux gènes qualitatifs chez le soja.

Journal : Frontières en science des plantes
Facteur d'impact : 6,627
Publié : 31 mai 2017

Contexte

Analyse par ségrégation en masse (BSA) offrent une approche simple pour l'identification rapide de marqueurs moléculaires étroitement associés aux phénotypes. Les techniques de BSA ont été utilisées dans diverses espèces pour la localisation de gènes importants. Avec les avancées des technologies de séquençage de l'ADN, les méthodes de BSA basées sur Séquençage de nouvelle génération (NGS) ont considérablement accéléré l'identification des gènes responsables de maladies. Le soja, l'une des cultures légumineuses les plus largement cultivées au monde, a pris du retard par rapport à d'autres cultures en matière d'identification et d'isolement des gènes, en raison d'une variation génétique limitée, d'un génome complexe et volumineux, et d'une faible efficacité de transformation génétique. Seuls quelques gènes régissant des traits spécifiques, tels que l'habitude de croissance de la tige et le nombre de graines par gousse, ont été identifiés. Le développement de méthodes pour identifier rapidement les gènes qui contrôlent des traits agronomiques importants est d'une importance capitale pour faire progresser la recherche sur la fonctionnalité des gènes du soja.

Figure 1: Analysis of Cotyledon Color Genetics in the ZH30 and JY102 Cross. (Song et al., 2017)FIGURE 1. Analyse génétique de la couleur des cotylédons dans un croisement entre ZH30 et JY102.

Échantillon source : Pédigrée F2 se concentrant sur le phénotype de la couleur des feuilles jaune/vert.

Taille de l'échantillon : 2 lignées parentales + 30 descendants à feuilles jaunes + 30 descendants à feuilles vertes

Profondeur de séquençage : Lignes parentales (12X + 9X), descendants (59X + 53X)

Matériaux et Méthodes

Préparation des échantillons

  • Soja
  • Jeunes feuilles
  • Extraction d'ADN

Séquençage

Analyse de données

  • Analyse de l'indice SNP
  • Analyse par fenêtre glissante

Résultats

Zhonghuang30 est la lignée parentale avec des feuilles jaunes, et Jiyu102 est la lignée parentale avec des feuilles vertes. Grâce au croisement arrière de la génération F1 avec Zhonghuang30 (la lignée parentale à feuilles jaunes), aucune ségrégation n'est survenue, confirmant la dominance de la couleur jaune dans la lignée parentale. Sur la base des ratios de ségrégation dans la génération F2 et les lignées F2:3, il a été déterminé que la couleur des feuilles est contrôlée par deux gènes, le vert étant un trait récessif.

En utilisant la méthode QTL-seq, la localisation préliminaire du caractère cible (couleur des feuilles) a été réalisée, et sur la base de l'indice ΔSNP, le caractère cible a été initialement cartographié sur deux intervalles, qCC1 (~2,68 Mb) sur Chr1 et qCC2 (~2,68 Mb) sur Chr11. Par la suite, un affinage de la cartographie a été effectué en utilisant des marqueurs de recombinaison SSR et Indel sur 200 descendants pour réduire les régions de cartographie. qCC1 a été finement cartographié sur une région de 30,7 kb, qui comprenait quatre gènes, le gène D1 étant un homologue du gène vert dans Arabidopsis, comme cela a été rapporté dans d'autres études. qCC2 a été finement cartographié sur une région de 67,7 kb, qui comprenait neuf gènes, et de même, l'un de ces gènes, D2, est un homologue rapporté du gène vert dans Arabidopsis.

Une exploration fonctionnelle et une validation ont été réalisées pour ces deux gènes candidats. Il a été constaté que le gène D1 avait une base T manquante entre les lignées parentales, entraînant une mutation par décalage du cadre de lecture et une terminaison prématurée dans la lignée parentale verte, JY102. De plus, le gène D2 avait une répétition de séquence de 322 pb entre les lignées parentales, entraînant une terminaison prématurée de ce gène dans la lignée parentale verte, JY102.

Référence

  1. Song J, Li Z, Liu Z, et al. Le séquençage de nouvelle génération à partir de l'analyse de ségrégation en masse accélère l'identification simultanée de deux gènes qualitatifs chez le soja. Frontières en science des plantes2017, 31;8:919.

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

Collection de données génétiques dans des études basées sur l'ethnicité chez les Aymaras, Quechuas et Mestizos : les défis de l'étude sur la génétique de la maladie d'Alzheimer dans la population péruvienne (GAPP)

Journal : Alzheimer et Démence

Année : 2022

Désolé, je ne peux pas accéder à des liens externes.

Évaluation des biomarqueurs plasmatiques pour la classification A/T/N de la maladie d'Alzheimer chez les adultes d'origine hispanique des Caraïbes

Journal : JAMA Network Open

Année : 2023

Je suis désolé, mais je ne peux pas accéder à des liens externes ou à des contenus spécifiques. Si vous avez un texte que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.

Augmentation de la production de spores fongiques pathogènes et aériennes suite à l'exposition d'une mycobiote du sol à des polluants chlorés aromatiques.

Journal : Microbiology Spectrum

Année : 2023

Désolé, je ne peux pas accéder à des liens externes.

Une variante d'épissage dans le gène SLC16A8 entraîne un déficit de transport de lactate dans les cellules épithéliales pigmentaires rétiniennes dérivées de cellules iPS humaines.

Journal : Cellules

Année : 2021

Désolé, je ne peux pas accéder aux liens ou au contenu externe. Veuillez fournir le texte que vous souhaitez traduire.

Voir plus articles publiés par nos clients.

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Ressources en vedette
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut