26 mars 2021 | Christie Rizk

NEW YORK – Un groupe international de chercheurs a montré que le séquençage à faible couverture peut efficacement identifier de nouveaux variants dans les génomes d'individus issus de populations actuellement sous-représentées dans les bases de données génomiques, et peut aider à surmonter les défis posés par les puces de génotypage courantes.
Dans une étude publiée jeudi dans l'American Journal of Human Genetics, les chercheurs ont noté que la plupart des études génétiques utilisent des puces de génotypage et des panneaux de référence séquencés qui capturent le mieux la variation la plus courante dans les populations d'ascendance européenne. Afin de comparer les approches de génération de données les mieux adaptées aux populations sous-représentées, les chercheurs ont donc séquencé les génomes complets de 91 individus dans le cadre de l'étude Neuropsychiatric Genetics of African Population-Psychosis (NeuroGAP-Psychosis) avec des participants d'Éthiopie, du Kenya, d'Afrique du Sud et d'Ouganda.
Ils ont séquencé ces génomes avec une couverture élevée, puis ont utilisé une approche de sous-échantillonnage pour évaluer la qualité des puces d'association à l'échelle du génome (GWAS) par rapport au séquençage à faible couverture, en calculant la concordance des variants imputés de ces technologies avec ceux provenant de données de séquençage complet à haute profondeur. Ce faisant, les chercheurs ont constaté que le séquençage à faible couverture à une profondeur de 4x ou plus capturait les variants de toutes les fréquences plus précisément que toutes les puces GWAS couramment utilisées qu'ils ont examinées, et à un coût comparable. De plus, ils ont noté que les profondeurs de séquençage plus faibles de 0,5x à 1x se comportaient de manière comparable aux puces GWAS à faible densité couramment utilisées.
Les chercheurs ont également constaté que le séquençage à faible couverture était sensible à la variation nouvelle : le séquençage 4x a détecté 45 % des singleton et 95 % des variants communs qui avaient été précédemment identifiés dans des génomes africains à haute couverture.
« Notre travail indique qu'il est grand temps de passer des microarrays au séquençage du génome entier à faible couverture pour les études sur les maladies complexes. Cela est particulièrement vrai pour les populations sous-représentées dans les études génétiques pour deux grandes raisons », a déclaré l'auteur principal et chercheuse au Broad Institute, Alicia Martin.
« Tout d'abord, nous pouvons combler le fossé entre les études coûteuses sur les variants rares généralement réalisées dans les familles et les études sur les variants communs moins coûteuses afin de mieux comprendre l'architecture génétique des maladies courantes », a déclaré Martin. « Deuxièmement, contrairement aux microarrays, le séquençage à faible couverture offre la possibilité de construire des ressources génomiques durables qui faciliteront les études futures dans des populations qui manquent actuellement de bonnes bases de données de référence. »
D'après leurs diverses analyses, les chercheurs ont constaté que le séquençage 4x surpassait tous les tableaux GWAS qu'ils avaient évalués, y compris les tableaux denses tels que le tableau H3Africa, qui a été conçu pour capturer la variation africaine. Le séquençage 4x était également comparable en prix aux tableaux à haute densité qui analysaient des millions de SNP et d'indels à travers le spectre de fréquence allélique.
Ils ont également constaté que le séquençage 1x était l'une des options les plus abordables, coûtant moins cher et offrant des performances similaires ou meilleures que celles des matrices de faible densité couramment utilisées, telles que l'Illumina GSA. Ils ont également noté que le GSA est composé de variants qui sont les plus courants dans les populations européennes et qu'il n'est donc pas la technologie la plus appropriée pour les études de participants ayant principalement une ascendance non européenne.
Outre le coût, le séquençage à faible couverture présente plusieurs avantages distincts par rapport aux puces GWAS, notamment une identification plus précise des variations génétiques à travers le spectre de fréquence allélique dans les populations sous-représentées. Dans les données de NeuroGAP-Psychosis, les chercheurs ont constaté que 38 % des variantes communes ne pouvaient pas être imputées à partir des données de la Phase III des 1000 Genomes, probablement en raison d'un manque de diversité est-africaine et sud-africaine dans ce panel.
Parmi les variants rares, le fait que le séquençage 4x ait détecté près de la moitié de tous les singleton était particulièrement attrayant pour les études sur les maladies. Des travaux antérieurs en génétique psychiatrique ont montré que, bien que les variants communs expliquent la majeure partie de l'héritabilité des SNP pour la schizophrénie, par exemple, les études sur l'exome révèlent également des signatures génétiques partiellement convergentes qui sont informatives pour les troubles psychiatriques sévères, ont-ils déclaré. Les technologies de séquençage qui peuvent combler le fossé entre les variants rares et communs seront donc essentielles pour élucider pleinement leurs architectures génétiques en affinant les variants causaux, en détectant des variations enrichies et en identifiant des variants rares ayant de grands effets.
Les avancées méthodologiques post-GWAS avec des données de séquençage à faible couverture peuvent faciliter ces analyses, ont noté les chercheurs.
« Nous utiliserons le séquençage à faible couverture dans les grandes études en cours, y compris l'étude NeuroGAP-Psychosis qui implique 40 000 participants d'Éthiopie, du Kenya, d'Afrique du Sud et d'Ouganda, ainsi que le projet umbrella des Populations sous-représentées dans les études sur les maladies mentales (PUMAS) qui inclura 120 000 populations latino-américaines et africaines séquencées », a ajouté Martin.
Plus d'infos sur : https://www.genomeweb.com/sequencing/low-coverage-sequencing-effectively-ids-novel-variants-underrepresented-populations#.YGKSBa8zY2w