Étude de cas : Identification de la résistance à la flétrissure bactérienne chez la tomate via QTL-seq

Contexte et objectif (définition du problème)

Flétrissure bactérienne, causée par des membres de la Ralstonia solanacearum Le complexe d'espèces est une maladie du sol à fort impact qui peut rapidement faire s'effondrer les cultures de tomates dans des environnements permissifs. Dans les programmes de sélection et les laboratoires axés sur les mécanismes, un goulot d'étranglement récurrent est que "résistant contre susceptible" se comporte souvent comme un trait quantitatif : des loci forts peuvent exister, mais des loci mineurs, l'environnement et le bruit de phénotypage peuvent brouiller les signaux.

Pour un PI axé sur le mécanisme, le véritable défi n'est généralement pas de "trouver a locus," mais produire un intervalle défendable et une chaîne de preuves qui peut soutenir un ensemble de figures de haute qualité, une stratégie de marqueur et une liste restreinte de candidats que les examinateurs considéreront comme plausibles pour un suivi.

Contexte des traits et valeur de recherche

La résistance est précieuse car elle peut :

  • permettre une production stable dans des champs infestés,
  • réduire le besoin d'une gestion intensive, et
  • fournir des éléments génétiques pour construire un germoplasme résilient.

En même temps, la résistance peut être dépendant de la souche et des conditionset plusieurs loci de résistance ont été décrits chez la tomate, y compris des régions liées à des sources dérivées d'Hawaï. (Wang et al., 2013 ; doi:10.1007/s10681-012-0830-x)

Objectif et critères de succès

ObjectifUtilisez QTL-seq (BSA-Seq) pour identifier une ou plusieurs régions génomiques associées à la résistance au flétrissement bactérien et produire :

1. pic(s) clair(s) dans un profil Δ(SNP-index) à l'échelle du génome,

2. un intervalle exploitable avec des limites rationnelles,

3. a liste restreinte de gènes candidats soutenu par des preuves structurées, et

4. marqueurs adaptés à la confirmation de génotypage RUO dans des populations et des panels indépendants.

Pour éviter la "chasse aux pics", définissez ces portes. avant en regardant le graphique à l'échelle du génome :

Portes de bulk/phénotype

  • Bulk résistant enrichi pour une résistance extrême ; bulk susceptible enrichi pour une susceptibilité extrême.
  • Ambiguïté minimale (éviter les phénotypes intermédiaires sauf s'ils sont explicitement modélisés)
  • Règle de sélection extrême claire enregistrée (par exemple, les 10-15 % les plus élevés/bas)

Séquençage et cartographie des portes

  • Couverture suffisante pour une estimation stable des fréquences alléliques à l'échelle du génome
  • Biais de référence minimal ; pas de déserts de couverture évidents entraînant des pics apparents.

Portes de variantes/statistiques

  • Densité de SNP suffisamment élevée et fiable après filtrage
  • Pic soutenu par un signal constant à travers les fenêtres adjacentes (pas un simple pic)
  • La bande de confiance (ou seuil empirique) sépare le pic du bruit de fond.

Figure 1. Study overviewFigure 1. Aperçu de l'étude
Un aperçu anonymisé du QTL-seq pour la résistance à la flétrissure bactérienne de la tomate : extrêmes phénotypiques → mélanges équilibrés → séquençage → filtrage des variants et Δ(SNP-index) par fenêtres → intervalle de pic → classement des candidats et notes de marqueurs pour la confirmation de génotypage RUO. Cette figure met en avant la "chaîne de livrables" allant de la conception expérimentale aux résultats prêts pour les examinateurs.


Conception de l'étude (ce qui a été fait)

Cette section est rédigée comme ce que vous faites + ce que vous devez enregistrer Ainsi, l'étude reste défendable pour les examinateurs et réutilisable pour de futures cartographies fines.

Stratégie de population et de phénotypage

Choix de la populationune population de ségrégation où le trait montre un contraste significatif (par exemple, F₂, retour en arrière ou RILs). Le QTL-seq a été initialement conçu avec des plans où ~20 à 50 individus par extrême volume est un point de départ pratique dans de nombreux environnements de plantes. (Takagi et al., 2013 ; doi:10.1111/tpj.12105)

Le phénotypage est la véritable limite de puissance. Pour un trait de maladie transmise par le sol :

  • Standardiser la préparation de l'inoculum et les points de temps de notation.
  • Utilisez une grille de notation claire et répétable (une échelle ordinale convient si elle est cohérente).
  • Enregistrez les covariables qui peuvent expliquer le bruit (température, substrat, âge des plantes, lot).

Règle de sélection extrême (établie avant les génotypes)

  • Résistant extrême : 10 à 15 % les plus bas de la distribution de gravité
  • Extrême susceptible : 10–15 % supérieurs
  • Si la distribution est peu profonde ou biaisée, augmenter la taille de la population plutôt que de se détendre dans des extrêmes.

Si votre objectif à long terme est le mécanisme, conservez les sous-composants phénotypiques (par exemple, le temps d'apparition par rapport à la gravité finale) en tant que métadonnées ; différents loci peuvent correspondre à différents composants.

Pour un rappel sur la méthode SNP-index et Δ(SNP-index), consultez notre guide sur l'approche QTL-seq : Approche QTL-seq : Accélérer la découverte de traits des cultures via BSA-Seq

Pour maintenir la cohérence des analyses et des rapports en aval, alignez votre conception sur une norme. flux de travail d'analyse de ségrégation en vrac (BSA) précoce (naming d'échantillons, définitions en masse et champs de métadonnées).

Construction en gros (N par lot et stratégie d'équilibrage)

Taille en vrac: Commencez par ~20 à 50 individus par lot (ou plus si le trait est bruyant). (Takagi et al., 2013 ; doi:10.1111/tpj.12105)

Stratégie d'équilibrage

  • Égaliser l'entrée d'ADN par individu pour éviter les "individus dominants".
  • Faire correspondre des volumes sur des covariables non liées lorsque cela est possible (distribution par plateau/lot).
  • Évitez les artefacts de parenté (ne suréchantillonnez pas involontairement un groupe familial à moins que cela ne soit intentionnel).

Manipulation de l'ADN

  • Utilisez une méthode d'extraction cohérente pour tous les individus.
  • Quantifiez avec précision (méthodes fluorométriques préférées).
  • Pool équimolaire et enregistrez les calculs.

Lorsque les envois sont prêts, séquençage du génome entier est couramment utilisé pour le QTL-seq.

Plan de séquençage (indépendant de la plateforme) et points de contrôle de QC

Un plan indépendant de la plateforme est défini par :

  • longueur de lecture suffisante pour un mappage robuste à la référence de la tomate,
  • couverture suffisante pour stabiliser les estimations de fréquence allélique,
  • duplication et contamination contrôlées pour éviter une profondeur déformée.

Planification de la couverture (conseils pratiques)

  • Bonne référence + densité SNP adéquate : une profondeur modérée peut bien fonctionner.
  • Référence fragmentée, répétitions élevées ou capture inégale : prévoyez une profondeur plus élevée pour conserver des SNP utilisables après filtrage.

Points de contrôle QC que vous devez capturer

  • Qualité de lecture brute (qualité par base, contenu des adaptateurs)
  • Taux de cartographie et lectures correctement appariées
  • Distribution de profondeur (uniformité à travers le génome)
  • Taux de duplication (proxy de complexité de la bibliothèque)
  • Comptes SNP après filtrage et absence de données

De nombreux groupes regroupent le laboratoire et le reporting QC sous un livrable NGS pour garantir une documentation cohérente.


Bioinformatique et statistiques (résultats clés)

C'est ici qu'un PI axé sur les mécanismes peut gagner la confiance des examinateurs : en présentant les résultats comme Portes QC plus logique statistiquepas seulement "nous avons exécuté un pipeline."

Liste de contrôle minimale de rapport (pour les examinateurs)

Vous pouvez copier/coller ce bloc dans les Méthodes ou les Matériaux supplémentaires.

  • Masse N et règle de sélection extrême (seuils de percentile ; définition du phénotype)
  • Type de population (F₂/BC/RIL) et génome de référence version/construction
  • Métriques de séquençage: lectures totales, % de mappage, % de duplication, couverture (moyenne/médiane et % du génome au-dessus du seuil)
  • Seuils de filtrage des variantes: profondeur minimale par lot, seuils de qualité de cartographie/base, plafond de profondeur maximale, filtres de manque
  • Paramètres de lissage des fenêtres: taille de la fenêtre et pas (ou méthode de lissage), et justification
  • Règle de la limite de pic: comment les limites d'intervalle ont été choisies (retour de référence + fenêtres consécutives)
  • Rubrique de notation des candidats: critères et pondération (impact des variantes, cohérence, annotation, preuves d'expression optionnelles)
  • Paquet de reproductibilité: VCF, tableau des statistiques de fenêtre, scripts/paramètres de traçage

Résumé de QC + cartographie (ce qui a été vérifié et pourquoi)

ButConfirmez que les deux volumes sont comparables et que les artefacts de cartographie/couverture ne masqueront pas les pics de QTL.

Portes QC (seuils de départ recommandés)

  • Lectures brutes: ≥80–90 % des bases à Q30+ (dépendant de la plateforme)
  • Rognage d'adaptateur: contenu de l'adaptateur résiduel proche de zéro
  • Taux de cartographie: souvent ≥90 % pour une bonne référence de tomate ; vérifier si beaucoup plus bas
  • Lectures correctement appariées: haute fraction attendue pour les lectures appariées
  • Taux de duplication: idéalement faible à modéré ; une duplication élevée inattendue suggère une faible complexité de la bibliothèque
  • Uniformité de couvertureéviter les "déserts de couverture" qui diffèrent systématiquement entre les volumes

Ce qu'un tableau de correspondance convivial pour les évaluateurs inclut

  • lectures totales par lot, % passant le filtre
  • pourcentage de mappage, pourcentage correctement apparié
  • profondeur moyenne et médiane, % du génome ≥10× (ou votre seuil choisi)
  • taux de duplication
  • résumé de la taille d'insertion (pour les données PE)

Une section QC propre et prête pour révision provient souvent d'un modèle de rapport d'analyse aligné sur analyse des données génomiques qui préserve les paramètres et les métriques intermédiaires.

Appel de variantes + filtrage (stabilisation de l'indice SNP)

Pourquoi le filtrage n'est-il pas optionnel ?Δ(SNP-index) dépend des estimations de fréquence allélique. Une faible profondeur, une faible qualité, le multi-mappage et le biais de brin peuvent augmenter le bruit et créer des "pics fantômes".

Flux de travail typique

1. Aligner les lectures à la référence

2. Marquer les doublons (ou au minimum les quantifier)

3. Appeler les SNPs conjointement à travers les lots

4. Appliquer un filtrage strict :

  • profondeur minimale par échantillon par site (souvent ≥8–10 lectures)
  • plafond de profondeur maximum (pour éviter les répétitions/artéfacts de numéro de copie)
  • qualité minimale de base et qualité de mappage
  • supprimer les sites avec des anomalies sévères d'équilibre des allèles
  • optionnellement supprimer les indels pour maintenir un modèle SNP-index propre

Indice SNP (conceptuel)

  • Indice SNP : fraction de lectures soutenant l'allèle alternatif à un site dans un échantillon en vrac.
  • Δ(Index SNP) : différence entre les groupes à travers le génome (définir la direction de manière cohérente)

Pour garder l'enregistrement des paramètres auditable, documentez le appel de variantes configuration (versions logicielles, filtres exacts, comptes de rétention SNP).

Ajoutez un lien supplémentaire vers une ressource de contrôle qualité/filtres interne là où votre matrice de contenu l'exige :
[MATRIX_LINK_NEEDED : article interne sur les meilleures pratiques de filtrage QC/variant]

Logic de sélection d'intervalle de candidats et tracé de l'indice SNP (Δ(SNP-index))

Sortie principaleUn profil Δ(SNP-index) à l'échelle du génome, généralement lissé dans des fenêtres glissantes.

Deux cadres largement utilisés pour le séquençage NGS-BSA/QTL sont :

  • Méthode Δ(SNP-index) (souvent associé à la confiance basée sur la simulation ou l'empirisme)
  • Méthode G′ / statistique G lissée (inférence basée sur des statistiques)

QTLseqr met en œuvre les deux approches et de nombreux groupes les utilisent comme vérifications complémentaires. (Mansfeld & Grumet, 2018 ; doi:10.3835/plantgenome2018.01.0006)
Un traitement statistique fondamental des sources de variance NGS-BSA est également disponible. (Magwene et al., 2011 ; doi:10.1371/journal.pcbi.1002255)

Comment nous avons sélectionné un intervalle (limites défendables)

1. Identifiez la région principale où Δ(SNP-index) dépasse la bande de confiance (ou le seuil empirique).

2. Élargir les limites jusqu'à ce que le signal revienne à la ligne de base et reste stable sur plusieurs fenêtres adjacentes.

3. Inspectez la couverture locale et la mappabilité ; traitez les régions à faible couverture et riches en répétitions avec prudence.

4. Confirmez éventuellement avec une statistique alternative (par exemple, G′) pour vous assurer que la même région émerge.

Figure 2. Window-smoothed Δ(SNP-index) peak with confidence bandFigure 2. Pic de Δ(SNP-index) lissé par fenêtre avec bande de confiance (à placer après cette sous-section)
Exemple Δ(Index SNP) à travers la position chromosomique après lissage par fenêtre glissante (bande de taille/étape définie dans les Méthodes). La bande ombragée représente une bande de confiance dérivée d'une simulation ou d'un seuil génomique empirique, utilisé pour séparer le signal soutenu du bruit de fond. L'intervalle candidat est défini par fenêtres consécutives au-dessus du seuil plus une règle de limite (retour à la ligne de base), plutôt qu'un maximum à un point unique.

Priorisation des gènes candidats (annotation + plausibilité + preuves structurées)

Une fois l'intervalle défini, l'étape de l'intervalle au candidat peut être soit subjective ("cela ressemble à un gène de résistance"), soit à l'épreuve de la révision (chaîne de preuves structurée). Pour un PI axé sur le mécanisme, une grille transparente est généralement la différence.

Composants de preuve

  • Impact des variantes: variants à fort/moyen impact prédits (stop-gain, site d'épissage, missense délétère)
  • Consistance en vrac: la direction de la fréquence allélique correspond à l'enrichissement attendu sur l'intervalle
  • Annotation fonctionnelledomaines/chemins liés à la défense plausibles (général)
  • Preuve d'expression (optionnelle): si vous avez déjà des données RNA-seq, utilisez l'expression comme preuves à l'appui prioriser les candidats (contexte mécaniste RUO)

Si vous prévoyez d'incorporer l'expression comme support orthogonal, associez l'intervalle avec Analyse du transcriptome par RNA-seq comme un complément structuré (et non un remplacement pour la cartographie).


Interprétation des résultats (du pic à l'action)

Cette section traduit les résultats en étapes concrètes à suivre—classement des candidats et planification des marqueurs—tout en rendant l'incertitude explicite.

Taille de l'intervalle des candidats et justification des limites

Un intervalle QTL-seq est un estimation limitée par la résolution façonné par :

  • densité de recombinaison dans votre population,
  • taille de l'effet QTL,
  • taille en vrac et pureté du phénotype,
  • profondeur de séquençage et densité de SNP,
  • artéfacts de couverture/cartographie.

Comment décrire la taille de l'intervalle dans un manuscrit

  • Fournissez les coordonnées d'intervalle (version de référence), la position du pic et la largeur.
  • Rapport du nombre de gènes/modèles de gènes à l'intérieur de l'intervalle.
  • Expliquez la logique des frontières (par exemple, "plateau au-dessus de la bande de confiance sur X Mb ; frontières choisies au retour à la ligne de base sur Y fenêtres consécutives").
  • Citez des preuves de contrôle qualité soutenant la stabilité (uniformité de couverture, densité SNP).

Si l'intervalle reste large (centaines de gènes), considérez-le comme un guide pour l'étape suivante : ajoutez des recombinants et du génotypage pour affiner.

Pour resserrer une région après le premier passage, ciblé. cartographie fine des SNP peut convertir un large intervalle en segments candidats définis par recombinaison.

De l'intervalle à la liste restreinte des candidats (général, défendable par les examinateurs)

Dans la recherche sur la résistance à la flétrissure bactérienne de la tomate, les loci stables sont souvent suivis par le développement de marqueurs et des étapes de confirmation indépendante, c'est pourquoi le lien "pic-à-marqueur" est important. (Yeon et al., 2022 ; doi:10.3390/plants11172223)

Approche de présélection (exemple de grille d'évaluation)
Nous construisons une table de candidats avec les colonnes :

  • ID de gène anonymisé
  • Variante(s) + impact prévu
  • Directionnalité de la fréquence allélique en masse
  • Note d'annotation (domaine/chemin)
  • Note d'expression optionnelle (si disponible)
  • Score de priorité (pondération explicite)

Si vous intégrez le support des expressions, standardisez les sorties via analyse des données transcriptomiques Ainsi, le classement des candidats reste transparent et reproductible.

Figure 3. Example candidate prioritization table with explicit weightingFigure 3. Exemple de tableau de priorisation des candidats avec pondération explicite
Exemple anonymisé uniquement. Un tableau de candidats à quatre lignes illustre comment un barème de notation transparent peut combiner (i) impact des variantes (par exemple, stop-gain vs missense), (ii) consistance en vrac à travers la région de sommet, (iii) optionnel indices d'expression, et (iv) notes sur le parcours/domaine dans un score de priorité pondéréL'objectif est de montrer la chaîne de preuves que les examinateurs attendent, même lorsque les identifiants de gènes finaux diffèrent d'un projet à l'autre.

Plan de suivi

Un plan adapté aux évaluateurs sépare confirmation génétique de suivi mécaniste.

A) Confirmation de génotypage RUO (rapide, évolutif)

  • Proposez un petit ensemble de marqueurs à travers la région du sommet.
  • Écran :
  • la population d'origine (vérification de la cohérence),
  • une population indépendante et séparée (transférabilité),
  • panneaux/matériaux plus larges (généralisation sous RUO).
  • Utilisez des recombinants pour réduire la région.

B) Suivi mécaniste (axé sur le PI, publiable)

  • Sélectionnez un petit nombre de candidats pour des analyses plus approfondies.
  • Collecter des preuves à l'appui :
  • changements d'expression pertinents à la condition,
  • consistance au niveau des voies avec les mécanismes de défense connus,
  • association de haplotypes dans des panels plus larges (si disponibles).

C) Paquet de reproductibilité

  • Fournir les détails de la pipeline versionnée, les paramètres et les sorties intermédiaires (VCF, statistiques de fenêtre, graphiques, tableau des candidats, notes sur les marqueurs).

Résumé de la décision : pourquoi cette approche a gagné (temps et retour sur investissement du projet)

Pour une comparaison détaillée du calendrier/ROI, voir le lien. cartographie vs QTL-seq.

Temps économisé par rapport au mappage de liaison classique

Comparé aux workflows de cartographie de liaison classiques qui nécessitent un développement itératif des marqueurs et des rondes de génotypage répétées, le QTL-seq déplace l'effort vers :

  • un lot de séquençage à haut débit (deux échantillons, parfois plus les parents),
  • un seul passage d'analyse intégrée,
  • génération rapide de variants denses qui alimentent le cartographie fine et la planification des marqueurs.

Le cadre original du QTL-seq mettait l'accent sur la rapidité en re-séquençant des extrêmes en masse plutôt qu'en génotypant de nombreux marqueurs chez tous les individus. (Takagi et al., 2013 ; doi:10.1111/tpj.12105)

Réduction du travail et processus go/no-go plus rapide

Pour un laboratoire axé sur les mécanismes, la question de validation est souvent : Avons-nous un locus crédible qui mérite un investissement mécaniste ? QTL-seq accélère cette décision en produisant :

  • un scan à l'échelle du génome avec des pics clairs (ou un résultat honnête de "pas de pic"),
  • un intervalle avec des bornes rationnelles et un support QC,
  • une liste restreinte structurée,
  • notes de marqueur orientées vers la confirmation de génotypage RUO.

Feuille de route pour les prochaines étapes (si les résultats sont forts, modérés ou désordonnés)

Si les résultats sont solides (un seul pic majeur)

  • Procédez à la confirmation de génotypage RUO et à l'affinement basé sur des recombinants.
  • Commencez le suivi mécaniste des meilleurs candidats.

Si les résultats sont modérés (plusieurs pics)

  • Vérifiez la pureté du phénotype et les effets de lot.
  • Envisagez de répéter avec des extrêmes plus serrés ou des volumes plus importants.
  • Vérifiez avec une statistique alternative (Δ(Index SNP) vs G′).

Si les résultats sont désordonnés (pas de pic clair)

  • Considérez-le comme un retour sur le design :
  • phénotype trop bruyant ou extrêmes trop faibles,
  • densité de SNP insuffisante ou problèmes de cartographie,
  • déséquilibre de masse (biais de regroupement de l'ADN).
  • Reconceptualiser : augmenter la taille de la population, affiner le phénotypage, ajuster la profondeur.

Pour le soutien à la réanalyse et à la reproductibilité, intégrez un standardisé services de bioinformatique flux de travail et maintenir les enregistrements de paramètres cohérents à travers les itérations.


Quand utiliser QTL-seq (et quand ne pas l'utiliser)

Utilisez QTL-seq lorsque

  • Vous avez une population ségréguante et pouvez phénotyper de manière fiable.
  • Les extrêmes sont suffisamment clairs pour former des masses de haute pureté.
  • Vous soupçonnez qu'au moins un locus a un effet modéré à important.
  • Vous avez besoin d'un scan rapide et dense pour justifier un cartographie fine en aval.

Envisagez des alternatives ou une stratégie en deux étapes lorsque

  • Le trait est hautement polygénique avec une séparation phénotypique peu marquée.
  • Le phénotypage est dominé par l'environnement/le lot avec une réplication limitée.
  • Le génome de référence est trop fragmenté/répétitif pour une cartographie fiable.
  • Vous avez besoin d'estimations de taille d'effet à travers de nombreux loci (GWAS ou cartographie complète peuvent être mieux).

Outil de décision sur une seule page (mini-tableau + arbre de décision)

Mini-table : choisissez la bonne approche (RUO)

Votre situation ajustement QTL-seq Résultats RUO attendus Risques principaux Atténuation
Extrêmes clairs, locus majeur probable Élevé Interval de pic, grille de critères pour les candidats, notes du correcteur pour la confirmation RUO. Biais de référence, répétitions locales Plafonds de profondeur stricts + vérifications de couverture
Extrêmes modérés, tailles d'effet mixtes Médium Multiples sommets ou intervalles plus larges Bruit phénotypique → faux négatifs Augmenter N, resserrer les extrêmes, répliquer le phénotypage.
Hautement polygénique, séparation faible Bas Profil plat/bruyant Déplacements de fréquence allélique sous-puissants Considérez les GWAS, les populations plus grandes, le cartographie multi-étapes.
Référence fragmentée / répétitions Moyen–Bas Écarts, pics instables Cartes des artefacts Les masques se répètent, ajustez la limite de profondeur maximale, envisagez une référence améliorée.

Arbre de décision simple

1. Pouvez-vous définir les extrêmes avec confiance ?

  • Non → améliorer le phénotypage ou augmenter la taille de la population.
  • Oui → allez à (2).

2. La densité des SNP et la qualité de cartographie sont-elles adéquates à l'échelle du génome ?

  • Non → ajuster la séquence/les filtres/la stratégie de référence.
  • Oui → allez à (3).

3. Observez-vous des pics soutenus au-dessus du seuil de confiance ?

  • Non → revoir la pureté des phénotypes, la profondeur et les filtres ; envisager des statistiques alternatives.
  • Oui → définir les limites d'intervalle + établir une grille de candidats + préparer des notes pour les marqueurs pour la confirmation de génotypage RUO.

QC et dépannage (seuils actionnables + symptôme→cause→solution)

Tableau de contrôle qualité (métrique → attendu → ce dont cela vous protège)

métrique de contrôle qualité Attente pratique (point de départ typique) Si cela échoue, conséquence courante.
Pureté phénotypique en vrac Extrêmes clairement séparés ; intermédiaires minimaux Les pics s'aplanissent ; faux négatifs
Équilibre de pooling d'ADN Entrée équimolaire par individu Distorsion artificielle de la fréquence des allèles
Taux de cartographie Souvent ≥90% avec une bonne référence SNPs manquants ; biais de référence
Accord approprié Haute fraction pour les bibliothèques PE Profondeur inégale ; artefacts structurels
Taux de duplication Faible à modéré ; enquêter si élevé Profondeur effective réduite ; indice SNP bruyant
Profondeur par site (post-filtre) Généralement ≥8–10 par lot par SNP Pointe épineuse Δ (indice SNP) ; pics instables
Densité SNP après filtres Densité génomique suffisante Scan sous-alimenté ; lacunes

Tableau de dépannage (symptôme → cause probable → solution)

Symptôme Cause probable Réparer (le plus rapide en premier)
Pas de sommet nulle part. Séparation des phénotypes trop faible ; les échantillons ne sont pas extrêmes. Re-évaluer ; resserrer les extrêmes ; augmenter la taille de la population.
De nombreux petits sommets Effets de lot ; notation incohérente Standardiser les conditions ; répliquer le bloc de phénotypage
Pic d'aiguille unique dans une fenêtre Région de faible profondeur/répétition ; filtrage faible Augmenter la profondeur minimale ; limiter la profondeur maximale ; exclure les répétitions ; vérifier la couverture.
Déplacements de pics avec taille de fenêtre Densité SNP sous-alimentée ou inégale Augmenter la profondeur ou la taille du volume ; confirmer avec G′.
Liste des candidats énorme Résolution limitée par la recombinaison Ajouter des recombinants ; génotypage ciblé ; cartographie fine

Pour les exigences de soumission et la structure des métadonnées, suivez le directives de soumission d'échantillons.


Liste de contrôle des livrables (ce à quoi vous devez vous attendre)

Un package complet de QTL-seq pour la recherche RUO comprend généralement :

  • Tableaux récapitulatifs de QC pour les deux lots (brut + cartographié)
  • Ensemble de SNP filtrés (VCF) + rapport de filtrage
  • Tableau des statistiques de fenêtre + paramètres de traçage
  • Graphiques Δ(SNP-index) à l'échelle du génome (et graphiques d'alternatives statistiques optionnels)
  • Coordonnées d'intervalle de pic + justification explicite des limites
  • Tableau des candidats avec colonnes de preuves + grille de notation
  • Notes sur le panneau de marqueurs pour la confirmation de génotypage RUO (coordonnées, allèles, notes de conception de l'essai)
  • Paquet de reproductibilité (versions logicielles, seuils, scripts)

FAQ

Combien d'individus par lot ai-je besoin ?

Un point de départ courant est d'environ 20 à 50 par bulk dans de nombreux designs QTL-seq de plantes, mais les traits bruyants et les tailles d'effet plus petites bénéficient généralement le plus de l'augmentation de la taille du bulk et de l'amélioration du phénotypage. (Takagi et al., 2013 ; doi :10.1111/tpj.12105)

Dois-je séquencer les parents ?

Pas strictement, mais les données parentales améliorent souvent l'interprétation de la direction des allèles et le classement des candidats, en particulier lorsque plusieurs sources de résistance peuvent exister.

Quelle est la raison la plus courante pour laquelle le QTL-seq ne donne pas de résultats satisfaisants ?

Bruit phénotypique et séparation extrême faible. Si les échantillons ne sont pas vraiment extrêmes, une augmentation du séquençage ne sauve que rarement un signal plat.

Comment choisir la taille de la fenêtre pour lisser le Δ(SNP-index) ?

La taille de la fenêtre trade la résolution contre la stabilité. Si les pics se déplacent de manière dramatique avec les paramètres de la fenêtre, les données peuvent être sous-alimentées ou inégales en densité/ couverture SNP ; envisagez d'augmenter la profondeur, d'appliquer des filtres plus stricts ou d'utiliser des statistiques alternatives.

Δ(SNP-index) vs G′—lequel devrais-je rapporter ?

De nombreuses études les considèrent comme complémentaires : Δ(SNP-index) est intuitif pour la directionnalité, tandis que G′ fournit un cadre d'inférence basé sur des statistiques. (Mansfeld & Grumet, 2018 ; doi:10.3835/plantgenome2018.01.0006)

Comment éviter que la priorisation des candidats ne semble subjective ?

Utilisez une grille transparente (impact de la variante + cohérence de masse + annotation + support d'expression optionnel) et montrez le poids.

Puis-je intégrer des preuves de RNA-seq si j'ai déjà des données ?

Oui—utilisez l'expression comme preuves à l'appui pour classer les candidats dans l'intervalle cartographié (support du mécanisme RUO), et non comme un substitut à la cartographie.

Que se passe-t-il si j'obtiens deux pics forts ?

Confirmez chaque pic en utilisant la confirmation de génotypage RUO dans une population ou un panel indépendant, puis affinez avec des recombinants et un génotypage ciblé.

Comment passer des marqueurs d'intervalle aux marqueurs compatibles avec l'élevage ?

Le développement de marqueurs et les études de sélection assistée par marqueurs (SAM) dans la tomate illustrent comment des régions de QTL stables peuvent être converties en tests de génotypage robustes pour le dépistage de matériaux de reproduction et de recherche (RUO).


Références (format unifié) — avec liens DOI

  1. Takagi H, Abe A, Yoshida K, et al. QTL-seq : cartographie rapide des loci de traits quantitatifs chez le riz par séquençage de génome entier de l'ADN provenant de deux populations groupées. Le Journal des Plantes. 2013. doi : 10.1111/tpj.12105
  2. Mansfeld BN, Grumet R. QTLseqr : un package R pour l'analyse de ségrégation en vrac avec le séquençage de nouvelle génération. Le génome des plantes. 2018. doi : 10.3835/plantgenome2018.01.0006
  3. Zhang J, Panthee DR. PyBSASeq : un algorithme simple et efficace pour l'analyse de ségrégation en masse avec des données de séquençage du génome entier. BMC Bioinformatique. 2020. doi : 10.1186/s12859-020-3435-8
  4. Magwene PM, Willis JH, Kelly JK. Les statistiques de l'analyse de ségrégation en vrac utilisant le séquençage de nouvelle génération. PLoS Biologie Computationnelle. 2011. doi : 10.1371/journal.pcbi.1002255
  5. Michelmore RW, Paran I, Kesseli RV. Identification de marqueurs liés aux gènes de résistance aux maladies par analyse de segregants en masse : une méthode rapide pour détecter des marqueurs dans des régions génomiques spécifiques en utilisant des populations segregantes. Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 1991. doi : 10.1073/pnas.88.21.9828
  6. Siddique MI, Silverman E, Louws F, Panthee DR. Cartographie des loci de caractères quantitatifs pour la résistance à la flétrissure bactérienne et la hauteur des plantes chez les tomates. Plantes. 2024. doi : 10.3390/plants13060876
  7. Wang JF, Ho FI, Truong HTH, et al. Identification des principaux QTL associés à la résistance stable de la variété de tomate 'Hawaii 7996' à Ralstonia solanacearum. Euphytica. 2013. doi : 10.1007/s10681-012-0830-x
  8. Yeon J, Le NT, Sim SC. Évaluation de la résistance indépendante de la température contre le flétrissement bactérien en utilisant des QTL majeurs dans la tomate cultivée.Solanum lycopersicum L.). Plantes. 2022. doi : 10.3390/plants11172223
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut