Séquençage du génome entier à faible couverture

Qu'est-ce que le séquençage génomique à faible couverture ?

Les génotypes détectés à l'aide de méthodes de resequencement à haute profondeur sont sans aucun doute les plus complets, mais sont actuellement trop coûteux à appliquer à l'élevage des plantes et des animaux, en particulier pour les espèces ayant des génomes complexes et volumineux. La faible couverture séquençage du génome (lcWGS) émerge comme une alternative efficace en sacrifiant la profondeur de séquençage pour une plus grande couverture du génome et une taille d'échantillon plus importante grâce à des stratégies statistiques probabilistes.

La stratégie LcWGS combine les avantages de RAD-seq, tout en évitant les inconvénients. Il peut étudier l'ensemble du génome au niveau de la population (en tenant compte à la fois de la profondeur et de l'étendue du génome), tout en conservant les informations des individus, et le coût est comparable aux deux. Par conséquent, l'obtention de génotypes à l'échelle du génome par lcWGS combiné avec des algorithmes est une pratique populaire ces dernières années.

Caractéristiques de la technologie de séquençage du génome entier à faible couverture

LcWGS WGS Tableau RAD-seq
Profondeur de séquençage bas élevé - élevé
Nombre de variantes plus plus moins moins
Détection de nouvelles variantes oui oui non non
Précision modéré élevé haut élevé
Génome de référence oui oui oui oui/non
Coût bas haut bas bas

Quels problèmes LcWGS peut-il résoudre ?

Le séquençage génomique à faible couverture (lcWGS) effectue d'abord rééchantillonnage à faible profondeur de tout le génome et la détection des variants pour tous les individus d'une population, puis utilise des algorithmes pour inférer et remplir (Imputation) les génotypes manquants en fonction du déséquilibre de liaison (LD) entre les variants, et enfin obtient des marqueurs génétiques à haute densité au niveau du génome entier pour des échantillons à grande échelle.

Ces dernières années, la LcWGS pour de grands échantillons a été théoriquement démontrée comme permettant d'obtenir des marqueurs SNP à haute densité à l'échelle du génome à un coût très faible, ce qui augmente à son tour la précision de la localisation des QTL et explore mieux les mécanismes génétiques de diverses maladies. La LcWGS a également été utilisée pour des analyses d'association et des études de génétique des populations. L'avantage de peupler des données à faible densité au niveau du séquençage de tout le génome pour la prédiction de la valeur d'élevage s'est avéré être fortement dépendant de la distribution de fréquence des mutations causales. La supériorité des données peuplées sous un modèle neutre était faible, et la précision de l'évaluation génétique utilisant des données peuplées pouvait être améliorée de 30 % lorsque toutes les fréquences alléliques minimales des mutations causales étaient faibles.

Flux de travail de l'analyse LcWGS

Le processus de prétraitement de LcWGS est similaire à celui de WGS, mais une différence importante réside dans la nécessité d'utiliser des probabilités génotypiques pour expliquer la probabilité d'incertitude génotypique, comme l'analyse en aval utilisant le spectre de fréquence des sites (SFS). Le processus d'analyse des données lcWGS, qui utilise des probabilités génotypiques pour expliquer un cadre probabiliste pour l'incertitude génotypique. Du spectre de fréquence des allèles (SFS) aux statistiques de diversité et au FST, c'est le processus d'analyse du logiciel ANGSD. D'autres outils (par exemple, ATLAS) peuvent inférer ces statistiques directement à partir des GL sans utilisation préalable de SFS.

Workflow of lcWGS.Flux de travail de lcWGS. (Lou et al., 2021)

Comment concevoir des expériences pour le séquençage du génome entier à faible couverture ?

Il n'existe pas un ensemble unique de conceptions expérimentales pour le resequencement à faible profondeur qui soit adapté à tous les objectifs d'étude. Au lieu de cela, la conception optimale dépend des objectifs de l'étude, du système et du budget. Étant donné un budget, les principaux compromis pour le resequencement à faible profondeur concernent la taille de l'échantillon et la profondeur de séquençage. Par exemple, l'estimation de la fréquence allélique, l'analyse de la structure des populations et la différenciation génétique entre les populations peuvent être séquencées avec un plus grand nombre d'échantillons pour obtenir des résultats précis ; les spectres de fréquence allélique (SFS), l'inférence démographique utilisant δaδi, Tajima'D ou les valeurs absolues de LD nécessitent une considération de profondeurs de séquençage plus élevées. Par conséquent, les chercheurs doivent soigneusement considérer quel type d'analyse est le plus important pour les objectifs de l'étude et trouver le bon équilibre. En synthétisant les résultats de nos études et des études précédentes, nous fournissons quelques lignes directrices générales pour la conception d'expériences de resequencement à faible profondeur.

Quels sont les avantages du séquençage génomique à faible couverture ?

Le séquençage de génome à faible couverture fait référence au séquençage d'un génome à une profondeur relativement faible, ce qui entraîne généralement une couverture incomplète de l'ensemble du génome. Bien que le séquençage à faible couverture présente certains avantages, il comporte également certaines limitations.

Avantages du séquençage génomique à faible couverture :

  • Rentable : Le séquençage à faible couverture nécessite moins de ressources de séquençage, ce qui le rend plus rentable par rapport au séquençage à haute profondeur. Cela permet aux chercheurs de séquencer un plus grand nombre d'échantillons dans un budget donné.
  • Efficace pour les études de population : Dans les études de population, où les chercheurs cherchent à analyser les variations génétiques à travers un grand nombre d'individus, le séquençage à faible couverture peut fournir une représentation raisonnable de la variation génétique à une fraction du coût du séquençage profond. Cela permet une identification efficace des variants génétiques communs et l'exploration des schémas au niveau de la population.
  • Identification des variantes génétiques communes : Le séquençage à faible couverture peut identifier efficacement les variantes génétiques communes qui se produisent à une fréquence plus élevée dans la population. Cela est particulièrement utile dans les études d'association à l'échelle du génome (GWAS), où les chercheurs examinent la relation entre les variations génétiques et les traits ou les maladies.

Qu'en est-il des limitations et des défis du séquençage génomique à faible couverture ?

Malgré les nombreux avantages du LcWGS, il existe encore des lacunes dans les domaines suivants :

  • Processus complexe et manque d'interface logicielle conviviale et de documentation : LcWGS implique plusieurs étapes, y compris la préparation de la bibliothèque, le séquençage et l'analyse des données. Le processus peut être techniquement difficile, nécessitant une expertise en génomique et en bioinformatique. De plus, la disponibilité d'interfaces logicielles conviviales et de documentation complète pour l'analyse de LcWGS peut être limitée, rendant cette méthode moins accessible aux chercheurs qui ne maîtrisent pas bien ces techniques.
  • Exigences computationnelles pour la fixation de phase et le padding : Pour déterminer avec précision la phase des variants génétiques (c'est-à-dire l'agencement des variants sur chaque chromosome), des ressources et des algorithmes computationnels supplémentaires sont nécessaires. La fixation de phase et le padding impliquent des processus intensifs en calcul pour résoudre l'ambiguïté des haplotypes et réduire le nombre de combinaisons possibles d'haplotypes, ce qui est exigeant en termes de temps et de puissance de calcul.
  • Interprétation incohérente des génotypes en raison des limitations du logiciel : Le logiciel utilisé pour l'analyse LcWGS peut présenter certaines limitations, telles que des biais algorithmiques ou des erreurs dans l'appel des génotypes. Cela peut entraîner des incohérences dans l'interprétation des génotypes, affectant l'exactitude et la fiabilité des résultats.
  • Pas adapté pour l'analyse des génotypes connus et sensible aux effets de lot : LcWGS peut ne pas être idéal pour l'analyse des génotypes connus, tels que le génotypage ciblé ou les études de validation. La couverture et la profondeur limitées peuvent entraîner des appels de génotypage manqués ou inexacts, affectant la fiabilité de telles analyses. De plus, LcWGS peut être sensible aux effets de lot, où les variations techniques introduites lors du traitement des échantillons ou du séquençage peuvent influencer les résultats, rendant difficile la comparaison des échantillons entre différents lots ou études.
  • Incapacité à phaser avec précision sans un panel de référence : Le phasage précis des variants génétiques nécessite un panel de référence d'haplotypes provenant d'une population diversifiée. Sans un panel de référence approprié, le LcWGS peut avoir des difficultés à déterminer avec précision les haplotypes, limitant ainsi sa capacité à fournir des informations détaillées sur l'agencement des variants sur chaque chromosome.
  • Inadéquation pour les petites tailles d'échantillons et les génomes complexes : LcWGS peut ne pas être bien adapté aux petites tailles d'échantillons, car la couverture et la profondeur limitées peuvent entraîner une sensibilité réduite dans la détection des variants génétiques, en particulier ceux qui sont rares ou de faible fréquence. De plus, les génomes complexes avec des régions répétitives ou des variations structurelles peuvent poser des défis pour un appel de variants précis et un assemblage utilisant des données LcWGS.

Référence :

  1. Lou, Runyang Nicolas, et al. "Un guide pour débutants sur le séquençage du génome entier à faible couverture pour la génomique des populations." Écologie moléculaire 30.23 (2021) : 5966-5993.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut