How many individuals per bulk do I need?

A common starting point is ~20–50 per bulk in many plant QTL-seq designs, but noisy traits and smaller effect sizes typically benefit most from increasing bulk size and improving phenotyping. (Takagi et al., 2013; doi:10.1111/tpj.12105)

Do I need to sequence the parents?

Not strictly, but parental data often improves allele-direction interpretation and candidate ranking, especially when multiple resistance sources may exist.

What’s the most common reason QTL-seq underperforms?

Phenotype noise and weak extreme separation. If bulks are not truly extreme, increased sequencing rarely rescues a flat signal.

How do I choose window size for smoothing Δ(SNP-index)?

Window size trades resolution vs stability. If peaks shift dramatically with window settings, the data may be underpowered or uneven in SNP density/coverage; consider depth increases, stronger filters, or alternate statistics.

Δ(SNP-index) vs G′—which should I report?

Many studies treat them as complementary: Δ(SNP-index) is intuitive for directionality, while G′ provides a statistics-based inference framework. (Mansfeld & Grumet, 2018; doi:10.3835/plantgenome2018.01.0006)

How do I keep candidate prioritization from sounding subjective?

Use a transparent rubric (variant impact + bulk consistency + annotation + optional expression support) and show the weighting.

Can I integrate RNA-seq evidence if I already have data?

Yes—use expression as supporting evidence to rank candidates within the mapped interval (RUO mechanism support), not as a substitute for mapping.

What if I get two strong peaks?

Confirm each peak using RUO genotyping confirmation in an independent population or panel, then refine with recombinants and targeted genotyping.

How do I move from interval to breeder-friendly markers?

Marker development and marker-assisted selection (MAS) studies in tomato illustrate how stable QTL regions can be converted into robust genotyping assays for screening breeding and research materials (RUO).

Étude de cas : Identification de la résistance à la flétrissure bactérienne chez la tomate via QTL-seq

Contexte et objectif (définition du problème)

Flétrissure bactérienne, causée par des membres de la Ralstonia solanacearum Le complexe d'espèces est une maladie du sol à fort impact qui peut rapidement faire s'effondrer les cultures de tomates dans des environnements permissifs. Dans les programmes de sélection et les laboratoires axés sur les mécanismes, un goulot d'étranglement récurrent est que "résistant contre susceptible" se comporte souvent comme un trait quantitatif : des loci forts peuvent exister, mais des loci mineurs, l'environnement et le bruit de phénotypage peuvent brouiller les signaux.

Pour un PI axé sur le mécanisme, le véritable défi n'est généralement pas de "trouver a locus," mais produire un intervalle défendable et une chaîne de preuves qui peut soutenir un ensemble de figures de haute qualité, une stratégie de marqueur et une liste restreinte de candidats que les examinateurs considéreront comme plausibles pour un suivi.

Contexte des traits et valeur de recherche

La résistance est précieuse car elle peut :

permettre une production stable dans des champs infestés,
réduire le besoin d'une gestion intensive, et
fournir des éléments génétiques pour construire un germoplasme résilient.

En même temps, la résistance peut être dépendant de la souche et des conditionset plusieurs loci de résistance ont été décrits chez la tomate, y compris des régions liées à des sources dérivées d'Hawaï. (Wang et al., 2013 ; doi:10.1007/s10681-012-0830-x)

Objectif et critères de succès

ObjectifUtilisez QTL-seq (BSA-Seq) pour identifier une ou plusieurs régions génomiques associées à la résistance au flétrissement bactérien et produire :

1. pic(s) clair(s) dans un profil Δ(SNP-index) à l'échelle du génome,

2. un intervalle exploitable avec des limites rationnelles,

3. a liste restreinte de gènes candidats soutenu par des preuves structurées, et

4. marqueurs adaptés à la confirmation de génotypage RUO dans des populations et des panels indépendants.

Pour éviter la "chasse aux pics", définissez ces portes. avant en regardant le graphique à l'échelle du génome :

Portes de bulk/phénotype

Bulk résistant enrichi pour une résistance extrême ; bulk susceptible enrichi pour une susceptibilité extrême.
Ambiguïté minimale (éviter les phénotypes intermédiaires sauf s'ils sont explicitement modélisés)
Règle de sélection extrême claire enregistrée (par exemple, les 10-15 % les plus élevés/bas)

Séquençage et cartographie des portes

Couverture suffisante pour une estimation stable des fréquences alléliques à l'échelle du génome
Biais de référence minimal ; pas de déserts de couverture évidents entraînant des pics apparents.

Portes de variantes/statistiques

Densité de SNP suffisamment élevée et fiable après filtrage
Pic soutenu par un signal constant à travers les fenêtres adjacentes (pas un simple pic)
La bande de confiance (ou seuil empirique) sépare le pic du bruit de fond.

Figure 1. Study overview Figure 1. Aperçu de l'étude
Un aperçu anonymisé du QTL-seq pour la résistance à la flétrissure bactérienne de la tomate : extrêmes phénotypiques → mélanges équilibrés → séquençage → filtrage des variants et Δ(SNP-index) par fenêtres → intervalle de pic → classement des candidats et notes de marqueurs pour la confirmation de génotypage RUO. Cette figure met en avant la "chaîne de livrables" allant de la conception expérimentale aux résultats prêts pour les examinateurs.

Conception de l'étude (ce qui a été fait)

Cette section est rédigée comme ce que vous faites + ce que vous devez enregistrer Ainsi, l'étude reste défendable pour les examinateurs et réutilisable pour de futures cartographies fines.

Stratégie de population et de phénotypage

Choix de la populationune population de ségrégation où le trait montre un contraste significatif (par exemple, F₂, retour en arrière ou RILs). Le QTL-seq a été initialement conçu avec des plans où ~20 à 50 individus par extrême volume est un point de départ pratique dans de nombreux environnements de plantes. (Takagi et al., 2013 ; doi:10.1111/tpj.12105)

Le phénotypage est la véritable limite de puissance. Pour un trait de maladie transmise par le sol :

Standardiser la préparation de l'inoculum et les points de temps de notation.
Utilisez une grille de notation claire et répétable (une échelle ordinale convient si elle est cohérente).
Enregistrez les covariables qui peuvent expliquer le bruit (température, substrat, âge des plantes, lot).

Règle de sélection extrême (établie avant les génotypes)

Résistant extrême : 10 à 15 % les plus bas de la distribution de gravité
Extrême susceptible : 10–15 % supérieurs
Si la distribution est peu profonde ou biaisée, augmenter la taille de la population plutôt que de se détendre dans des extrêmes.

Si votre objectif à long terme est le mécanisme, conservez les sous-composants phénotypiques (par exemple, le temps d'apparition par rapport à la gravité finale) en tant que métadonnées ; différents loci peuvent correspondre à différents composants.

Pour un rappel sur la méthode SNP-index et Δ(SNP-index), consultez notre guide sur l'approche QTL-seq : Approche QTL-seq : Accélérer la découverte de traits des cultures via BSA-Seq

Pour maintenir la cohérence des analyses et des rapports en aval, alignez votre conception sur une norme. flux de travail d'analyse de ségrégation en vrac (BSA) précoce (naming d'échantillons, définitions en masse et champs de métadonnées).

Construction en gros (N par lot et stratégie d'équilibrage)

Taille en vrac: Commencez par ~20 à 50 individus par lot (ou plus si le trait est bruyant). (Takagi et al., 2013 ; doi:10.1111/tpj.12105)

Stratégie d'équilibrage

Égaliser l'entrée d'ADN par individu pour éviter les "individus dominants".
Faire correspondre des volumes sur des covariables non liées lorsque cela est possible (distribution par plateau/lot).
Évitez les artefacts de parenté (ne suréchantillonnez pas involontairement un groupe familial à moins que cela ne soit intentionnel).

Manipulation de l'ADN

Utilisez une méthode d'extraction cohérente pour tous les individus.
Quantifiez avec précision (méthodes fluorométriques préférées).
Pool équimolaire et enregistrez les calculs.

Lorsque les envois sont prêts, séquençage du génome entier est couramment utilisé pour le QTL-seq.

Plan de séquençage (indépendant de la plateforme) et points de contrôle de QC

Un plan indépendant de la plateforme est défini par :

longueur de lecture suffisante pour un mappage robuste à la référence de la tomate,
couverture suffisante pour stabiliser les estimations de fréquence allélique,
duplication et contamination contrôlées pour éviter une profondeur déformée.

Planification de la couverture (conseils pratiques)

Bonne référence + densité SNP adéquate : une profondeur modérée peut bien fonctionner.
Référence fragmentée, répétitions élevées ou capture inégale : prévoyez une profondeur plus élevée pour conserver des SNP utilisables après filtrage.

Points de contrôle QC que vous devez capturer

Qualité de lecture brute (qualité par base, contenu des adaptateurs)
Taux de cartographie et lectures correctement appariées
Distribution de profondeur (uniformité à travers le génome)
Taux de duplication (proxy de complexité de la bibliothèque)
Comptes SNP après filtrage et absence de données

De nombreux groupes regroupent le laboratoire et le reporting QC sous un livrable NGS pour garantir une documentation cohérente.

Bioinformatique et statistiques (résultats clés)

C'est ici qu'un PI axé sur les mécanismes peut gagner la confiance des examinateurs : en présentant les résultats comme Portes QC plus logique statistiquepas seulement "nous avons exécuté un pipeline."

Liste de contrôle minimale de rapport (pour les examinateurs)

Vous pouvez copier/coller ce bloc dans les Méthodes ou les Matériaux supplémentaires.

Masse N et règle de sélection extrême (seuils de percentile ; définition du phénotype)
Type de population (F₂/BC/RIL) et génome de référence version/construction
Métriques de séquençage: lectures totales, % de mappage, % de duplication, couverture (moyenne/médiane et % du génome au-dessus du seuil)
Seuils de filtrage des variantes: profondeur minimale par lot, seuils de qualité de cartographie/base, plafond de profondeur maximale, filtres de manque
Paramètres de lissage des fenêtres: taille de la fenêtre et pas (ou méthode de lissage), et justification
Règle de la limite de pic: comment les limites d'intervalle ont été choisies (retour de référence + fenêtres consécutives)
Rubrique de notation des candidats: critères et pondération (impact des variantes, cohérence, annotation, preuves d'expression optionnelles)
Paquet de reproductibilité: VCF, tableau des statistiques de fenêtre, scripts/paramètres de traçage

Résumé de QC + cartographie (ce qui a été vérifié et pourquoi)

ButConfirmez que les deux volumes sont comparables et que les artefacts de cartographie/couverture ne masqueront pas les pics de QTL.

Portes QC (seuils de départ recommandés)

Lectures brutes: ≥80–90 % des bases à Q30+ (dépendant de la plateforme)
Rognage d'adaptateur: contenu de l'adaptateur résiduel proche de zéro
Taux de cartographie: souvent ≥90 % pour une bonne référence de tomate ; vérifier si beaucoup plus bas
Lectures correctement appariées: haute fraction attendue pour les lectures appariées
Taux de duplication: idéalement faible à modéré ; une duplication élevée inattendue suggère une faible complexité de la bibliothèque
Uniformité de couvertureéviter les "déserts de couverture" qui diffèrent systématiquement entre les volumes

Ce qu'un tableau de correspondance convivial pour les évaluateurs inclut

lectures totales par lot, % passant le filtre
pourcentage de mappage, pourcentage correctement apparié
profondeur moyenne et médiane, % du génome ≥10× (ou votre seuil choisi)
taux de duplication
résumé de la taille d'insertion (pour les données PE)

Une section QC propre et prête pour révision provient souvent d'un modèle de rapport d'analyse aligné sur analyse des données génomiques qui préserve les paramètres et les métriques intermédiaires.

Appel de variantes + filtrage (stabilisation de l'indice SNP)

Pourquoi le filtrage n'est-il pas optionnel ?Δ(SNP-index) dépend des estimations de fréquence allélique. Une faible profondeur, une faible qualité, le multi-mappage et le biais de brin peuvent augmenter le bruit et créer des "pics fantômes".

Flux de travail typique

1. Aligner les lectures à la référence

2. Marquer les doublons (ou au minimum les quantifier)

3. Appeler les SNPs conjointement à travers les lots

4. Appliquer un filtrage strict :

profondeur minimale par échantillon par site (souvent ≥8–10 lectures)
plafond de profondeur maximum (pour éviter les répétitions/artéfacts de numéro de copie)
qualité minimale de base et qualité de mappage
supprimer les sites avec des anomalies sévères d'équilibre des allèles
optionnellement supprimer les indels pour maintenir un modèle SNP-index propre

Indice SNP (conceptuel)

Indice SNP : fraction de lectures soutenant l'allèle alternatif à un site dans un échantillon en vrac.
Δ(Index SNP) : différence entre les groupes à travers le génome (définir la direction de manière cohérente)

Pour garder l'enregistrement des paramètres auditable, documentez le appel de variantes configuration (versions logicielles, filtres exacts, comptes de rétention SNP).

Ajoutez un lien supplémentaire vers une ressource de contrôle qualité/filtres interne là où votre matrice de contenu l'exige :
[MATRIX_LINK_NEEDED : article interne sur les meilleures pratiques de filtrage QC/variant]

Logic de sélection d'intervalle de candidats et tracé de l'indice SNP (Δ(SNP-index))

Sortie principaleUn profil Δ(SNP-index) à l'échelle du génome, généralement lissé dans des fenêtres glissantes.

Deux cadres largement utilisés pour le séquençage NGS-BSA/QTL sont :

Méthode Δ(SNP-index) (souvent associé à la confiance basée sur la simulation ou l'empirisme)
Méthode G′ / statistique G lissée (inférence basée sur des statistiques)

QTLseqr met en œuvre les deux approches et de nombreux groupes les utilisent comme vérifications complémentaires. (Mansfeld & Grumet, 2018 ; doi:10.3835/plantgenome2018.01.0006)
Un traitement statistique fondamental des sources de variance NGS-BSA est également disponible. (Magwene et al., 2011 ; doi:10.1371/journal.pcbi.1002255)

Comment nous avons sélectionné un intervalle (limites défendables)

1. Identifiez la région principale où Δ(SNP-index) dépasse la bande de confiance (ou le seuil empirique).

2. Élargir les limites jusqu'à ce que le signal revienne à la ligne de base et reste stable sur plusieurs fenêtres adjacentes.

3. Inspectez la couverture locale et la mappabilité ; traitez les régions à faible couverture et riches en répétitions avec prudence.

4. Confirmez éventuellement avec une statistique alternative (par exemple, G′) pour vous assurer que la même région émerge.

Figure 2. Window-smoothed Δ(SNP-index) peak with confidence band Figure 2. Pic de Δ(SNP-index) lissé par fenêtre avec bande de confiance (à placer après cette sous-section)
Exemple Δ(Index SNP) à travers la position chromosomique après lissage par fenêtre glissante (bande de taille/étape définie dans les Méthodes). La bande ombragée représente une bande de confiance dérivée d'une simulation ou d'un seuil génomique empirique, utilisé pour séparer le signal soutenu du bruit de fond. L'intervalle candidat est défini par fenêtres consécutives au-dessus du seuil plus une règle de limite (retour à la ligne de base), plutôt qu'un maximum à un point unique.

Priorisation des gènes candidats (annotation + plausibilité + preuves structurées)

Une fois l'intervalle défini, l'étape de l'intervalle au candidat peut être soit subjective ("cela ressemble à un gène de résistance"), soit à l'épreuve de la révision (chaîne de preuves structurée). Pour un PI axé sur le mécanisme, une grille transparente est généralement la différence.

Composants de preuve

Impact des variantes: variants à fort/moyen impact prédits (stop-gain, site d'épissage, missense délétère)
Consistance en vrac: la direction de la fréquence allélique correspond à l'enrichissement attendu sur l'intervalle
Annotation fonctionnelledomaines/chemins liés à la défense plausibles (général)
Preuve d'expression (optionnelle): si vous avez déjà des données RNA-seq, utilisez l'expression comme preuves à l'appui prioriser les candidats (contexte mécaniste RUO)

Si vous prévoyez d'incorporer l'expression comme support orthogonal, associez l'intervalle avec Analyse du transcriptome par RNA-seq comme un complément structuré (et non un remplacement pour la cartographie).

Interprétation des résultats (du pic à l'action)

Cette section traduit les résultats en étapes concrètes à suivre—classement des candidats et planification des marqueurs—tout en rendant l'incertitude explicite.

Taille de l'intervalle des candidats et justification des limites

Un intervalle QTL-seq est un estimation limitée par la résolution façonné par :

densité de recombinaison dans votre population,
taille de l'effet QTL,
taille en vrac et pureté du phénotype,
profondeur de séquençage et densité de SNP,
artéfacts de couverture/cartographie.

Comment décrire la taille de l'intervalle dans un manuscrit

Fournissez les coordonnées d'intervalle (version de référence), la position du pic et la largeur.
Rapport du nombre de gènes/modèles de gènes à l'intérieur de l'intervalle.
Expliquez la logique des frontières (par exemple, "plateau au-dessus de la bande de confiance sur X Mb ; frontières choisies au retour à la ligne de base sur Y fenêtres consécutives").
Citez des preuves de contrôle qualité soutenant la stabilité (uniformité de couverture, densité SNP).

Si l'intervalle reste large (centaines de gènes), considérez-le comme un guide pour l'étape suivante : ajoutez des recombinants et du génotypage pour affiner.

Pour resserrer une région après le premier passage, ciblé. cartographie fine des SNP peut convertir un large intervalle en segments candidats définis par recombinaison.

De l'intervalle à la liste restreinte des candidats (général, défendable par les examinateurs)

Dans la recherche sur la résistance à la flétrissure bactérienne de la tomate, les loci stables sont souvent suivis par le développement de marqueurs et des étapes de confirmation indépendante, c'est pourquoi le lien "pic-à-marqueur" est important. (Yeon et al., 2022 ; doi:10.3390/plants11172223)

Approche de présélection (exemple de grille d'évaluation)
Nous construisons une table de candidats avec les colonnes :

ID de gène anonymisé
Variante(s) + impact prévu
Directionnalité de la fréquence allélique en masse
Note d'annotation (domaine/chemin)
Note d'expression optionnelle (si disponible)
Score de priorité (pondération explicite)

Si vous intégrez le support des expressions, standardisez les sorties via analyse des données transcriptomiques Ainsi, le classement des candidats reste transparent et reproductible.

Figure 3. Example candidate prioritization table with explicit weighting Figure 3. Exemple de tableau de priorisation des candidats avec pondération explicite
Exemple anonymisé uniquement. Un tableau de candidats à quatre lignes illustre comment un barème de notation transparent peut combiner (i) impact des variantes (par exemple, stop-gain vs missense), (ii) consistance en vrac à travers la région de sommet, (iii) optionnel indices d'expression, et (iv) notes sur le parcours/domaine dans un score de priorité pondéréL'objectif est de montrer la chaîne de preuves que les examinateurs attendent, même lorsque les identifiants de gènes finaux diffèrent d'un projet à l'autre.

Plan de suivi

Un plan adapté aux évaluateurs sépare confirmation génétique de suivi mécaniste.

A) Confirmation de génotypage RUO (rapide, évolutif)

Proposez un petit ensemble de marqueurs à travers la région du sommet.
Écran :
la population d'origine (vérification de la cohérence),
une population indépendante et séparée (transférabilité),
panneaux/matériaux plus larges (généralisation sous RUO).
Utilisez des recombinants pour réduire la région.

B) Suivi mécaniste (axé sur le PI, publiable)

Sélectionnez un petit nombre de candidats pour des analyses plus approfondies.
Collecter des preuves à l'appui :
changements d'expression pertinents à la condition,
consistance au niveau des voies avec les mécanismes de défense connus,
association de haplotypes dans des panels plus larges (si disponibles).

C) Paquet de reproductibilité

Fournir les détails de la pipeline versionnée, les paramètres et les sorties intermédiaires (VCF, statistiques de fenêtre, graphiques, tableau des candidats, notes sur les marqueurs).

Résumé de la décision : pourquoi cette approche a gagné (temps et retour sur investissement du projet)

Pour une comparaison détaillée du calendrier/ROI, voir le lien. cartographie vs QTL-seq.

Temps économisé par rapport au mappage de liaison classique

Comparé aux workflows de cartographie de liaison classiques qui nécessitent un développement itératif des marqueurs et des rondes de génotypage répétées, le QTL-seq déplace l'effort vers :

un lot de séquençage à haut débit (deux échantillons, parfois plus les parents),
un seul passage d'analyse intégrée,
génération rapide de variants denses qui alimentent le cartographie fine et la planification des marqueurs.

Le cadre original du QTL-seq mettait l'accent sur la rapidité en re-séquençant des extrêmes en masse plutôt qu'en génotypant de nombreux marqueurs chez tous les individus. (Takagi et al., 2013 ; doi:10.1111/tpj.12105)

Réduction du travail et processus go/no-go plus rapide

Pour un laboratoire axé sur les mécanismes, la question de validation est souvent : Avons-nous un locus crédible qui mérite un investissement mécaniste ? QTL-seq accélère cette décision en produisant :

un scan à l'échelle du génome avec des pics clairs (ou un résultat honnête de "pas de pic"),
un intervalle avec des bornes rationnelles et un support QC,
une liste restreinte structurée,
notes de marqueur orientées vers la confirmation de génotypage RUO.

Feuille de route pour les prochaines étapes (si les résultats sont forts, modérés ou désordonnés)

Si les résultats sont solides (un seul pic majeur)

Procédez à la confirmation de génotypage RUO et à l'affinement basé sur des recombinants.
Commencez le suivi mécaniste des meilleurs candidats.

Si les résultats sont modérés (plusieurs pics)

Vérifiez la pureté du phénotype et les effets de lot.
Envisagez de répéter avec des extrêmes plus serrés ou des volumes plus importants.
Vérifiez avec une statistique alternative (Δ(Index SNP) vs G′).

Si les résultats sont désordonnés (pas de pic clair)

Considérez-le comme un retour sur le design :
phénotype trop bruyant ou extrêmes trop faibles,
densité de SNP insuffisante ou problèmes de cartographie,
déséquilibre de masse (biais de regroupement de l'ADN).
Reconceptualiser : augmenter la taille de la population, affiner le phénotypage, ajuster la profondeur.

Pour le soutien à la réanalyse et à la reproductibilité, intégrez un standardisé services de bioinformatique flux de travail et maintenir les enregistrements de paramètres cohérents à travers les itérations.

Quand utiliser QTL-seq (et quand ne pas l'utiliser)

Utilisez QTL-seq lorsque

Vous avez une population ségréguante et pouvez phénotyper de manière fiable.
Les extrêmes sont suffisamment clairs pour former des masses de haute pureté.
Vous soupçonnez qu'au moins un locus a un effet modéré à important.
Vous avez besoin d'un scan rapide et dense pour justifier un cartographie fine en aval.

Envisagez des alternatives ou une stratégie en deux étapes lorsque

Le trait est hautement polygénique avec une séparation phénotypique peu marquée.
Le phénotypage est dominé par l'environnement/le lot avec une réplication limitée.
Le génome de référence est trop fragmenté/répétitif pour une cartographie fiable.
Vous avez besoin d'estimations de taille d'effet à travers de nombreux loci (GWAS ou cartographie complète peuvent être mieux).

Outil de décision sur une seule page (mini-tableau + arbre de décision)

Mini-table : choisissez la bonne approche (RUO)

Votre situation	ajustement QTL-seq	Résultats RUO attendus	Risques principaux	Atténuation
Extrêmes clairs, locus majeur probable	Élevé	Interval de pic, grille de critères pour les candidats, notes du correcteur pour la confirmation RUO.	Biais de référence, répétitions locales	Plafonds de profondeur stricts + vérifications de couverture
Extrêmes modérés, tailles d'effet mixtes	Médium	Multiples sommets ou intervalles plus larges	Bruit phénotypique → faux négatifs	Augmenter N, resserrer les extrêmes, répliquer le phénotypage.
Hautement polygénique, séparation faible	Bas	Profil plat/bruyant	Déplacements de fréquence allélique sous-puissants	Considérez les GWAS, les populations plus grandes, le cartographie multi-étapes.
Référence fragmentée / répétitions	Moyen–Bas	Écarts, pics instables	Cartes des artefacts	Les masques se répètent, ajustez la limite de profondeur maximale, envisagez une référence améliorée.

Arbre de décision simple

1. Pouvez-vous définir les extrêmes avec confiance ?

Non → améliorer le phénotypage ou augmenter la taille de la population.
Oui → allez à (2).

2. La densité des SNP et la qualité de cartographie sont-elles adéquates à l'échelle du génome ?

Non → ajuster la séquence/les filtres/la stratégie de référence.
Oui → allez à (3).

3. Observez-vous des pics soutenus au-dessus du seuil de confiance ?

Non → revoir la pureté des phénotypes, la profondeur et les filtres ; envisager des statistiques alternatives.
Oui → définir les limites d'intervalle + établir une grille de candidats + préparer des notes pour les marqueurs pour la confirmation de génotypage RUO.

QC et dépannage (seuils actionnables + symptôme→cause→solution)

Tableau de contrôle qualité (métrique → attendu → ce dont cela vous protège)

métrique de contrôle qualité	Attente pratique (point de départ typique)	Si cela échoue, conséquence courante.
Pureté phénotypique en vrac	Extrêmes clairement séparés ; intermédiaires minimaux	Les pics s'aplanissent ; faux négatifs
Équilibre de pooling d'ADN	Entrée équimolaire par individu	Distorsion artificielle de la fréquence des allèles
Taux de cartographie	Souvent ≥90% avec une bonne référence	SNPs manquants ; biais de référence
Accord approprié	Haute fraction pour les bibliothèques PE	Profondeur inégale ; artefacts structurels
Taux de duplication	Faible à modéré ; enquêter si élevé	Profondeur effective réduite ; indice SNP bruyant
Profondeur par site (post-filtre)	Généralement ≥8–10 par lot par SNP	Pointe épineuse Δ (indice SNP) ; pics instables
Densité SNP après filtres	Densité génomique suffisante	Scan sous-alimenté ; lacunes

Tableau de dépannage (symptôme → cause probable → solution)

Symptôme	Cause probable	Réparer (le plus rapide en premier)
Pas de sommet nulle part.	Séparation des phénotypes trop faible ; les échantillons ne sont pas extrêmes.	Re-évaluer ; resserrer les extrêmes ; augmenter la taille de la population.
De nombreux petits sommets	Effets de lot ; notation incohérente	Standardiser les conditions ; répliquer le bloc de phénotypage
Pic d'aiguille unique dans une fenêtre	Région de faible profondeur/répétition ; filtrage faible	Augmenter la profondeur minimale ; limiter la profondeur maximale ; exclure les répétitions ; vérifier la couverture.
Déplacements de pics avec taille de fenêtre	Densité SNP sous-alimentée ou inégale	Augmenter la profondeur ou la taille du volume ; confirmer avec G′.
Liste des candidats énorme	Résolution limitée par la recombinaison	Ajouter des recombinants ; génotypage ciblé ; cartographie fine

Pour les exigences de soumission et la structure des métadonnées, suivez le directives de soumission d'échantillons.

Liste de contrôle des livrables (ce à quoi vous devez vous attendre)

Un package complet de QTL-seq pour la recherche RUO comprend généralement :

Tableaux récapitulatifs de QC pour les deux lots (brut + cartographié)
Ensemble de SNP filtrés (VCF) + rapport de filtrage
Tableau des statistiques de fenêtre + paramètres de traçage
Graphiques Δ(SNP-index) à l'échelle du génome (et graphiques d'alternatives statistiques optionnels)
Coordonnées d'intervalle de pic + justification explicite des limites
Tableau des candidats avec colonnes de preuves + grille de notation
Notes sur le panneau de marqueurs pour la confirmation de génotypage RUO (coordonnées, allèles, notes de conception de l'essai)
Paquet de reproductibilité (versions logicielles, seuils, scripts)

FAQ

Combien d'individus par lot ai-je besoin ?

Un point de départ courant est d'environ 20 à 50 par bulk dans de nombreux designs QTL-seq de plantes, mais les traits bruyants et les tailles d'effet plus petites bénéficient généralement le plus de l'augmentation de la taille du bulk et de l'amélioration du phénotypage. (Takagi et al., 2013 ; doi :10.1111/tpj.12105)

Dois-je séquencer les parents ?

Pas strictement, mais les données parentales améliorent souvent l'interprétation de la direction des allèles et le classement des candidats, en particulier lorsque plusieurs sources de résistance peuvent exister.

Quelle est la raison la plus courante pour laquelle le QTL-seq ne donne pas de résultats satisfaisants ?

Bruit phénotypique et séparation extrême faible. Si les échantillons ne sont pas vraiment extrêmes, une augmentation du séquençage ne sauve que rarement un signal plat.

Comment choisir la taille de la fenêtre pour lisser le Δ(SNP-index) ?

La taille de la fenêtre trade la résolution contre la stabilité. Si les pics se déplacent de manière dramatique avec les paramètres de la fenêtre, les données peuvent être sous-alimentées ou inégales en densité/ couverture SNP ; envisagez d'augmenter la profondeur, d'appliquer des filtres plus stricts ou d'utiliser des statistiques alternatives.

Δ(SNP-index) vs G′—lequel devrais-je rapporter ?

De nombreuses études les considèrent comme complémentaires : Δ(SNP-index) est intuitif pour la directionnalité, tandis que G′ fournit un cadre d'inférence basé sur des statistiques. (Mansfeld & Grumet, 2018 ; doi:10.3835/plantgenome2018.01.0006)

Comment éviter que la priorisation des candidats ne semble subjective ?

Utilisez une grille transparente (impact de la variante + cohérence de masse + annotation + support d'expression optionnel) et montrez le poids.

Puis-je intégrer des preuves de RNA-seq si j'ai déjà des données ?

Oui—utilisez l'expression comme preuves à l'appui pour classer les candidats dans l'intervalle cartographié (support du mécanisme RUO), et non comme un substitut à la cartographie.

Que se passe-t-il si j'obtiens deux pics forts ?

Confirmez chaque pic en utilisant la confirmation de génotypage RUO dans une population ou un panel indépendant, puis affinez avec des recombinants et un génotypage ciblé.

Comment passer des marqueurs d'intervalle aux marqueurs compatibles avec l'élevage ?

Le développement de marqueurs et les études de sélection assistée par marqueurs (SAM) dans la tomate illustrent comment des régions de QTL stables peuvent être converties en tests de génotypage robustes pour le dépistage de matériaux de reproduction et de recherche (RUO).

Références (format unifié) — avec liens DOI

Takagi H, Abe A, Yoshida K, et al. QTL-seq : cartographie rapide des loci de traits quantitatifs chez le riz par séquençage de génome entier de l'ADN provenant de deux populations groupées. Le Journal des Plantes. 2013. doi : 10.1111/tpj.12105
Mansfeld BN, Grumet R. QTLseqr : un package R pour l'analyse de ségrégation en vrac avec le séquençage de nouvelle génération. Le génome des plantes. 2018. doi : 10.3835/plantgenome2018.01.0006
Zhang J, Panthee DR. PyBSASeq : un algorithme simple et efficace pour l'analyse de ségrégation en masse avec des données de séquençage du génome entier. BMC Bioinformatique. 2020. doi : 10.1186/s12859-020-3435-8
Magwene PM, Willis JH, Kelly JK. Les statistiques de l'analyse de ségrégation en vrac utilisant le séquençage de nouvelle génération. PLoS Biologie Computationnelle. 2011. doi : 10.1371/journal.pcbi.1002255
Michelmore RW, Paran I, Kesseli RV. Identification de marqueurs liés aux gènes de résistance aux maladies par analyse de segregants en masse : une méthode rapide pour détecter des marqueurs dans des régions génomiques spécifiques en utilisant des populations segregantes. Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 1991. doi : 10.1073/pnas.88.21.9828
Siddique MI, Silverman E, Louws F, Panthee DR. Cartographie des loci de caractères quantitatifs pour la résistance à la flétrissure bactérienne et la hauteur des plantes chez les tomates. Plantes. 2024. doi : 10.3390/plants13060876
Wang JF, Ho FI, Truong HTH, et al. Identification des principaux QTL associés à la résistance stable de la variété de tomate 'Hawaii 7996' à Ralstonia solanacearum. Euphytica. 2013. doi : 10.1007/s10681-012-0830-x
Yeon J, Le NT, Sim SC. Évaluation de la résistance indépendante de la température contre le flétrissement bactérien en utilisant des QTL majeurs dans la tomate cultivée.Solanum lycopersicum L.). Plantes. 2022. doi : 10.3390/plants11172223

Services associés

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.