Séquençage de l'exome entier dans les études de génétique des populations et d'évolution
Avec le développement rapide de la technologie de séquençage à haut débit, Séquençage de l'exome complet (WES) est devenu un outil essentiel pour élucider la structure génétique des populations et les mécanismes évolutifs. En ciblant et en capturant environ 1 % des régions codantes des protéines dans le génome, le WES peut identifier efficacement les variations génétiques associées à l'évolution adaptative et à la susceptibilité aux maladies, ce qui le rend particulièrement adapté aux études comparatives à grande échelle entre espèces.
Cet article vise à passer en revue de manière systématique les dernières avancées du séquençage de l'exome (WES) dans la génétique des populations et la recherche évolutive, et, en tenant compte de ses avantages technologiques et de ses limitations, à explorer son potentiel dans l'évolution adaptative des espèces, l'annotation des fonctions génétiques et les applications interdisciplinaires, afin de fournir des références méthodologiques et des cadres théoriques pour les recherches futures.
I. Principes techniques et avantages clés
Le séquençage d'exomes (WES) identifie efficacement les variations génétiques associées à des maladies ou à l'adaptation en ciblant environ 1 % des régions codantes en protéines (exons) du génome. Comparé au séquençage du génome entier (WGS), le WES est moins coûteux et fournit des données plus ciblées, ce qui le rend particulièrement adapté à l'analyse d'échantillons à grande échelle. Par exemple, un seul passage de WES peut détecter plus de 100 000 variations d'exons, couvrant plus de 95 % des mutations pathogènes connues.
II. Applications Clés en Génétique des Populations
WES révèle des variations novatrices et des différences de population
Heutinck PA et al. ont analysé 111 patients iraniens atteints de DRN non syndromique en utilisant le séquençage de l'exome complet. (WES)Ils ont constaté que 59 % (66 cas) avaient une cause génétique claire, impliquant 31 gènes et 53 variants pathogènes (principalement des mutations de translocation, représentant 36 %). Les gènes pathogènes à haute fréquence comprenaient CERKL (12 %), EYS (11 %) et RPE65 (9 %). Ils ont identifié 14 variants nouveaux (26 %, répartis sur 12 gènes) et découvert deux cas de délétions hémizygotes du gène RP2 (héritage récessif lié à l'X) confirmés par une analyse du nombre de copies, élargissant ainsi la compréhension de la diversité génétique des IRD.
WES a révélé que 94 % (62 cas) de cette population avait une transmission autosomique récessive (taux de consanguinité élevés entraînant principalement des variants homozygotes), avec 2 cas de transmission liée à l'X et 2 cas de transmission autosomique dominante. Cinq patients ont été reclassés de "RP non syndromique" à IRD syndromique (comme le syndrome de Bardet-Biedl), et 3 ont été reclassés en dystrophie maculaire. Des VUS (variantes d'importance indéterminée) ont été trouvés dans 35 cas (32 %), et la cause est restée indéterminée dans 10 cas (9 %). L'analyse de la population a montré que le variant CERKL était le plus commun chez les Turcs, RPE65 chez les Kurdes, et les variants EYS chez les Persans, soulignant la diversité génétique. L'étude souligne l'impact des taux de consanguinité élevés sur la structure génétique et la nécessité d'améliorer les capacités de test génétique local.
Comparaison des gènes causaux les plus fréquents dans les trois plus grands groupes ethniques (Heutinck PA et al., 2025)
Analyse d'association au niveau de la population des gènes liés aux maladies
Bernstein N et al., grâce à une analyse de séquençage de l'exome sur sang total de 200 000 individus âgés de 40 à 73 ans dans le UK Biobank, ont révélé pour la première fois à grande échelle le schéma de sélection positive des mutations somatiques dans le sang vieillissant. L'équipe a identifié 52 700 mutations somatiques dans les régions codantes, constatant que leur nombre et leur fréquence allélique augmentaient avec l'âge, et qu'environ un huitième des mutations non synonymes étaient sélectionnées positivement (dN/dS=1,13). S'appuyant sur cela, l'équipe de recherche a franchi les limites des 74 gènes CH traditionnels, identifiant 17 nouveaux gènes moteurs de sélection positive (tels que BAX, CHEK2 et MYD88) en utilisant des méthodes telles que dNdScv. Les mutations dans ces gènes ont augmenté la prévalence des CH cloniques larges (VAF>0,1) de 18 %, et leur fréquence et taille clonales ont également augmenté avec l'âge, conformément au schéma classique des gènes CH.
Les 17 gènes nouvellement découverts non seulement élargissent le spectre des facteurs de prolifération des cellules hématopoïétiques (CH), mais révèlent également leur forte association avec divers phénotypes cliniques : les mutations MYD88/IGLL5 augmentent significativement le risque de leucémie lymphoïde chronique (LLC), les mutations ZBTB33 entraînent des taux anormaux de cellules dans la moelle osseuse, et la plupart des CH induits par les gènes nouvellement découverts sont étroitement associés à un risque accru d'infection et de mortalité toutes causes confondues, les résultats défavorables s'aggravant avec l'augmentation clonale. Cette découverte offre une nouvelle perspective sur la compréhension du rôle de l'hématopoïèse clonale dans le vieillissement, le cancer et les maladies hématologiques, et indique également des directions potentielles pour des interventions ciblées dans l'expansion clonale anormale et le retardement des phénotypes de vieillissement associés.
Identification des gènes associés au strabisme
Duan W et al. ont analysé 10 lignées d'exotropie associées au strabisme au Yunnan, en Chine (47 individus, dont 32 patients) en utilisant le séquençage de l'exome complet combiné avec Séquençage de Sanger, révélant pour la première fois le mécanisme génétique. L'étude a identifié sept gènes pathogènes potentiels (COL4A2, SYNE1, LOXHD1, AUTS2, GTDC2, HERC2 et CDH3) et a trouvé 11 variantes de type missense co-segérées avec des membres de la lignée, toutes étant nocives, de faible fréquence (<5 % dans la population générale) et correspondant à une transmission autosomique dominante, avec un âge moyen d'apparition de 3,35 ± 1,51 ans (plus tôt que dans les cas sporadiques). Parmi eux, COL4A2 (variantes dans 3 lignées) et SYNE1 (variantes dans 2 lignées) étaient directement associés à la maladie, et cinq gènes (COL4A2, SYNE1, AUTS2, HERC2 et CDH3) chevauchaient la liste des gènes du strabisme de l'Ontologie Phénotypique Humaine (HPO).
Ces gènes se répartissent en deux catégories fonctionnelles : liés au système nerveux (COL4A2, SYNE1, etc., impliqués dans le développement neural et l'ancrage synaptique) et liés aux muscles (CDH3, GTDC2, etc., impliqués dans le développement des muscles extraoculaires). Un séquençage par capture de cibles a ensuite validé ces gènes dans 220 cas sporadiques : AUTS2 a révélé 15 variants (12 SNPs + 3 Indels), et GTDC2 a révélé 4 variants SNP. L'étude confirme l'hétérogénéité génétique de l'exotropie, fournissant des gènes candidats pour un diagnostic précoce et un traitement de précision, mais des tailles d'échantillons plus importantes et une validation fonctionnelle (par exemple, au niveau de l'ARNm/protéine) sont nécessaires pour confirmer le mécanisme.
Flux de travail pour la détection et la validation des variants génétiques dans les pedigrees d'exotropie concomitante (Duan W et al., 2025)
Explorer le service
III. Études de cas en biologie évolutive
Évolution adaptative des primates
Hyakawa T et al. ont analysé la structure génétique et les caractéristiques évolutives de 42 chimpanzés en utilisant le séquençage de l'exome entier (combiné avec une capture de sondes humaines) (échantillons non invasifs de fèces sauvages + échantillons de sang de populations captives). La reconstruction d'arbre par maximum de vraisemblance des gènes mitochondriaux a montré une distribution monophylétique significative parmi les sous-espèces de chimpanzés (occidentale, centrale et orientale), mais aucun groupe monophylétique n'a été formé dans certaines populations locales. L'analyse multivariée autosomique (MDS, clustering hiérarchique et analyse de mélange) a efficacement distingué les sous-espèces (occidentale vs centrale/orientale) et les populations locales (par exemple, la séparation des chimpanzés occidentaux de Bosu des populations captives), et a identifié des échantillons hybrides (par exemple, l'hybride occidental-central Chloe), confirmant que les séquences d'exons peuvent retracer l'origine géographique et la différenciation des populations.
L'étude a également révélé une corrélation négative significative entre l'hétérozygotie des exons et le ratio de substitution non synonyme/synonyme (N/S) à l'échelle du génome, indiquant une charge mutationnelle (accumulation de mutations légèrement nuisibles dans de petites populations). Parmi les 23 534 gènes codants identifiés, 60 % contenaient des pseudogènes ségrégués (allèles qui fonctionnent à la fois comme des gènes fonctionnels et des pseudogènes). Parmi ceux-ci, des pseudogènes partagés entre sous-espèces de gènes récepteurs de chémorécepteurs (récepteur olfactif OR7D4, récepteur du goût amer TAS2R42) (par exemple, le pseudogène d'insertion OR7D4 partagé entre Bosu et Mahalai) étaient des candidats potentiels pour une sélection équilibrée ou liés à des adaptations olfactives/gustatives. Cette méthode a validé la faisabilité d'un échantillonnage non invasif avec un tampon de lyse, fournissant un outil rentable pour la génétique de conservation chez les chimpanzés sauvages et pouvant être étendu à d'autres organismes non modèles.
Variations nucléotidiques de l'exome regroupées aux niveaux des sous-espèces et des populations locales (Hyakawa T et al., 2025)
WES révèle les gènes de la différenciation de la couleur du pelage.
Yan, X et al. ont analysé 46 individus de cinq espèces de singes rhésus sur l'île de Sulawesi en utilisant le séquençage de l'exome complet (combiné avec un kit de capture d'exons humains), identifiant environ 550 gènes exprimés de manière hautement différentielle (régions riches en SNP dans le top 5 % des valeurs de Fst). Ces gènes sont impliqués dans des processus biologiques clés tels que la pigmentation, l'adhésion cellulaire, la transduction du signal (par exemple, Rho GTPase, voie TGF-bêta) et la réponse au stress. La différenciation des gènes liés à la pigmentation était particulièrement marquée : des mutations de type missense dans TYR (tyrosinase) (par exemple, D132N) et LRIT3 (S394P, Y363D) ne sont partagées que par des espèces à pelage sombre (M. nigra, M. nigrescens), ce qui pourrait influencer les différences de couleur de pelage en régulant l'étape limitante de la synthèse de mélanine ou la signalisation de FGFR1 ; des variations de type missense dans des gènes tels que MC1R et ASIP peuvent affecter la fonction des récepteurs et le dépôt de mélanine, soulignant la contribution de la différenciation génétique aux traits spécifiques des espèces.
L'étude a également identifié un grand nombre de SNPs fixes (Fst=1) comme marqueurs génétiques spécifiques à chaque espèce. Quatre comparaisons ont révélé un total de 8380 SNPs fixes (41,18%-45% situés dans des exons), impliquant 705-861 gènes (tels que TGM4 et ZFHX3), qui peuvent être utilisés pour la différenciation des espèces et le suivi du risque d'hybridation. L'analyse Fst a montré une différenciation inégale entre les espèces (la plus haute moyenne Fst=0,179 a été observée dans la comparaison NgNc), indiquant que les adaptations locales (comme la sélection positive pour la couleur du pelage) et la dérive génétique conduisent conjointement à une différenciation rapide. Ces résultats fournissent des preuves génomiques cruciales pour comprendre la spéciation des primates, l'évolution adaptative de la couleur du pelage et la conservation des macaques rhésus en danger (comme le maintien de l'intégrité génétique).
La distribution des valeurs Fst des SNPs du top 5 % dans toutes les comparaisons interspécifiques par paires (Yan, X et al., 2025)
IV. Avantages et défis techniques
- Avantages :
- Coût-efficacité élevée : le coût du séquençage à échantillon unique n'est que d'1/10 de celui du séquençage du génome entier (WGS), ce qui le rend adapté aux études de cohorte impliquant des milliers de participants.
- Détection de variantes hautement efficace : le taux de détection des variantes à faible fréquence (<1%) est supérieur de plus de 30% à celui des puces SNP.
- Défis :
- Biais de couverture : L'efficacité de la capture d'exons est affectée par des séquences répétitives génomiques, et certaines variantes à faible fréquence peuvent être manquées.
- Limitations dans l'interprétation fonctionnelle : se limiter aux régions codantes rend difficile l'évaluation du rôle des variants régulateurs ou des ARN non codants.
V. Directions de développement futur
- Intégration multi-omiques : Combinaison épigénomique et transcriptomique données pour analyser l'impact fonctionnel des variants. Par exemple, valider les mécanismes régulateurs épigénétiques des variants d'exon par le biais d'analyses de méthylation.
- Assistance par l'intelligence artificielle : Utilisation de l'apprentissage profond pour prédire la pathogénicité des variants, accélérant le dépistage des gènes de maladies.
- Comparaison inter-espèces : Étendre aux organismes non-modèles (tels que les primates sauvages) pour révéler des mécanismes adaptatifs évolutivement conservés.
Conclusion
WES fournit un outil efficace pour la génétique des populations et la recherche évolutive, mais son application nécessite une validation sous plusieurs dimensions, y compris l'épigénétique et les expériences fonctionnelles. Avec la baisse des coûts de séquençage et l'optimisation des algorithmes, WES jouera un rôle de plus en plus central dans des domaines tels que les mécanismes des maladies humaines et l'évolution adaptative des espèces.
Les gens demandent aussi
À quoi sert le test de séquençage de l'exome entier ?
Le test de séquençage de l'exome entier est principalement utilisé dans le diagnostic clinique pour identifier les mutations génétiques causant des troubles héréditaires rares, et dans la recherche pour étudier la génomique du cancer, les maladies complexes et la génétique des populations.
Le WGS est-il plus coûteux que le WES ?
Le séquençage génomique complet (WGS) coûte actuellement deux à trois fois plus cher que le séquençage d'exomes (WES), mais la majeure partie du coût du WGS (>90%) est directement liée au séquençage, tandis que le coût du WES est principalement dû au kit de capture.
Quelles maladies le séquençage de l'exome entier peut-il détecter ?
WES est précieux pour les patients pédiatriques présentant des conditions telles que des anomalies congénitales multiples, des troubles neurodéveloppementaux et de l'épilepsie où une étiologie génétique est suspectée.
Combien de temps faut-il pour obtenir des résultats d'un séquençage de l'exome entier ?
Le délai de traitement est d'environ 5 jours, mais peut varier en fonction de facteurs tels que la date de collecte, la qualité/quantité de l'échantillon et l'exhaustivité des informations sur le patient fournies.
Références
- Heutinck PAT, Iglesias AI, Farhud DD, van Tienhoven M, Khoshraftar A, Zarif-Yeganeh M, Kia SK, Ghanbari M, Smoor MA, Klaver CCW, Hoefsloot LH, Thiadens AAHJ, Verhoeven VJM. Séquençage de l'exome entier diagnostique dans des dystrophies rétiniennes héréditaires présumées autosomiques récessives dans une population iranienne. Sci Rep. 2025 3 juil;15(1):23745.
- Bernstein N, Spencer Chapman M, Nyamondo K, Chen Z, Williams N, Mitchell E, Campbell PJ, Cohen RL, Nangalia J. L'analyse des mutations somatiques dans le sang total de 200 618 individus identifie une sélection positive omniprésente et de nouveaux facteurs déclencheurs de l'hématopoïèse clonale.. Nat Genet. Juin 2024 ; 56(6) : 1147-1155.
- Il F, Pasam R, Shi F, Kant S, Keeble-Gagnere G, Kay P, Forrest K, Fritz A, Hucl P, Wiebe K, Knox R, Cuthbert R, Pozniak C, Akhunova A, Morrell PL, Davies JP, Webb SR, Spangenberg G, Hayes B, Daetwyler H, Tibbits J, Hayden M, Akhunov E. Le séquençage de l'exome met en évidence le rôle de l'introgression des parents sauvages dans la formation du paysage adaptatif du génome du blé.. Nat GenetMai 2019 ; 51(5) : 896-904.
- Duan W, Zhou T, Huang X, He D, Hu M. Le séquençage de l'exome entier révèle la base génétique de l'exotropie concomitante héréditaire dans dix pedigrees chinois.. BMC Médecine Génomique. 7 janvier 2025 ; 18(1) : 4.
- Hayakawa T, Kishida T, Go Y, Inoue E, Kawaguchi E, Aizu T, Ishizaki H, Toyoda A, Fujiyama A, Matsuzawa T, Hashimoto C, Furuichi T, Agata K. Évolution à l'échelle du génome dans des populations locales de chimpanzés sauvages. Sci Rep2025 2 janv;15(1):548.
- Yan X, Arakawa N, Widayati KA, Purba LHPS, Fahri F, Suryobroto B, Terai Y, Imai H. L'analyse de l'exome révèle une divergence entre les espèces dans le gène TYR et identifie des marqueurs génétiques spécifiques à cinq espèces endémiques de Macaca sur l'île de Sulawesi.. BMC Écol Évol. 2025 3 juil;25(1):66.