Les génotypes détectés à l'aide de méthodes de resequencement à haute profondeur sont sans aucun doute les plus complets, mais sont actuellement trop coûteux à appliquer à l'élevage des plantes et des animaux, en particulier pour les espèces ayant des génomes complexes et volumineux. La faible couverture séquençage du génome (lcWGS) émerge comme une alternative efficace en sacrifiant la profondeur de séquençage pour une plus grande couverture du génome et une taille d'échantillon plus importante grâce à des stratégies statistiques probabilistes.
La stratégie LcWGS combine les avantages de RAD-seq, tout en évitant les inconvénients. Il peut étudier l'ensemble du génome au niveau de la population (en tenant compte à la fois de la profondeur et de l'étendue du génome), tout en conservant les informations des individus, et le coût est comparable aux deux. Par conséquent, l'obtention de génotypes à l'échelle du génome par lcWGS combiné avec des algorithmes est une pratique populaire ces dernières années.
Caractéristiques de la technologie de séquençage du génome entier à faible couverture
| LcWGS | WGS | Tableau | RAD-seq | |
| Profondeur de séquençage | bas | élevé | - | élevé |
| Nombre de variantes | plus | plus | moins | moins |
| Détection de nouvelles variantes | oui | oui | non | non |
| Précision | modéré | élevé | haut | élevé |
| Génome de référence | oui | oui | oui | oui/non |
| Coût | bas | haut | bas | bas |
Le séquençage génomique à faible couverture (lcWGS) effectue d'abord rééchantillonnage à faible profondeur de tout le génome et la détection des variants pour tous les individus d'une population, puis utilise des algorithmes pour inférer et remplir (Imputation) les génotypes manquants en fonction du déséquilibre de liaison (LD) entre les variants, et enfin obtient des marqueurs génétiques à haute densité au niveau du génome entier pour des échantillons à grande échelle.
Ces dernières années, la LcWGS pour de grands échantillons a été théoriquement démontrée comme permettant d'obtenir des marqueurs SNP à haute densité à l'échelle du génome à un coût très faible, ce qui augmente à son tour la précision de la localisation des QTL et explore mieux les mécanismes génétiques de diverses maladies. La LcWGS a également été utilisée pour des analyses d'association et des études de génétique des populations. L'avantage de peupler des données à faible densité au niveau du séquençage de tout le génome pour la prédiction de la valeur d'élevage s'est avéré être fortement dépendant de la distribution de fréquence des mutations causales. La supériorité des données peuplées sous un modèle neutre était faible, et la précision de l'évaluation génétique utilisant des données peuplées pouvait être améliorée de 30 % lorsque toutes les fréquences alléliques minimales des mutations causales étaient faibles.
Le processus de prétraitement de LcWGS est similaire à celui de WGS, mais une différence importante réside dans la nécessité d'utiliser des probabilités génotypiques pour expliquer la probabilité d'incertitude génotypique, comme l'analyse en aval utilisant le spectre de fréquence des sites (SFS). Le processus d'analyse des données lcWGS, qui utilise des probabilités génotypiques pour expliquer un cadre probabiliste pour l'incertitude génotypique. Du spectre de fréquence des allèles (SFS) aux statistiques de diversité et au FST, c'est le processus d'analyse du logiciel ANGSD. D'autres outils (par exemple, ATLAS) peuvent inférer ces statistiques directement à partir des GL sans utilisation préalable de SFS.
Flux de travail de lcWGS. (Lou et al., 2021)
Il n'existe pas un ensemble unique de conceptions expérimentales pour le resequencement à faible profondeur qui soit adapté à tous les objectifs d'étude. Au lieu de cela, la conception optimale dépend des objectifs de l'étude, du système et du budget. Étant donné un budget, les principaux compromis pour le resequencement à faible profondeur concernent la taille de l'échantillon et la profondeur de séquençage. Par exemple, l'estimation de la fréquence allélique, l'analyse de la structure des populations et la différenciation génétique entre les populations peuvent être séquencées avec un plus grand nombre d'échantillons pour obtenir des résultats précis ; les spectres de fréquence allélique (SFS), l'inférence démographique utilisant δaδi, Tajima'D ou les valeurs absolues de LD nécessitent une considération de profondeurs de séquençage plus élevées. Par conséquent, les chercheurs doivent soigneusement considérer quel type d'analyse est le plus important pour les objectifs de l'étude et trouver le bon équilibre. En synthétisant les résultats de nos études et des études précédentes, nous fournissons quelques lignes directrices générales pour la conception d'expériences de resequencement à faible profondeur.
Le séquençage de génome à faible couverture fait référence au séquençage d'un génome à une profondeur relativement faible, ce qui entraîne généralement une couverture incomplète de l'ensemble du génome. Bien que le séquençage à faible couverture présente certains avantages, il comporte également certaines limitations.
Avantages du séquençage génomique à faible couverture :
Malgré les nombreux avantages du LcWGS, il existe encore des lacunes dans les domaines suivants :
Référence :