Avec le développement rapide de la technologie de séquençage à haut débit, Séquençage de l'exome entier Le séquençage d'exome (WES) est devenu un outil essentiel pour élucider la structure génétique des populations et les mécanismes évolutifs. En ciblant et en capturant environ 1 % des régions codantes de protéines dans le génome, le WES peut identifier efficacement les variations génétiques associées à l'évolution adaptative et à la susceptibilité aux maladies, ce qui le rend particulièrement adapté aux études comparatives à grande échelle entre espèces.
Cet article vise à examiner systématiquement les dernières avancées du séquençage de l'exome (WES) dans la génétique des populations et la recherche évolutive, et, en tenant compte de ses avantages et limitations technologiques, à explorer son potentiel dans l'évolution adaptative des espèces, l'annotation des fonctions génétiques et les applications interdisciplinaires, afin de fournir des références méthodologiques et des cadres théoriques pour les recherches futures.
Le séquençage d'exomes (WES) identifie efficacement les variations génétiques associées à des maladies ou à l'adaptation en ciblant environ 1 % des régions codantes des protéines (exons) dans le génome. Comparé au séquençage du génome entier (WGS), le WES est moins coûteux et fournit des données plus ciblées, ce qui le rend particulièrement adapté à l'analyse d'échantillons à grande échelle. Par exemple, un seul passage de WES peut détecter plus de 100 000 variations d'exons, couvrant plus de 95 % des mutations pathogènes connues.
Heutinck PA et al. ont analysé 111 patients iraniens atteints de DRN non syndromiques en utilisant le séquençage de l'exome complet. (WES)Ils ont constaté que 59 % (66 cas) avaient une cause génétique claire, impliquant 31 gènes et 53 variants pathogènes (principalement des mutations de translocation, représentant 36 %). Les gènes pathogènes à haute fréquence comprenaient CERKL (12 %), EYS (11 %) et RPE65 (9 %). Ils ont identifié 14 variants nouveaux (26 %, répartis sur 12 gènes) et découvert deux cas de délétions hémizygotes du gène RP2 (héritage récessif lié à l'X) confirmés par une analyse du nombre de copies, élargissant la compréhension de la diversité génétique des maladies rétiniennes héréditaires (IRD).
WES a révélé que 94 % (62 cas) de cette population avait une héritage autosomique récessif (taux de consanguinité élevés conduisant à des variantes principalement homozygotes), avec 2 cas d'héritage lié à l'X et 2 cas d'héritage autosomique dominant. Cinq patients ont été reclassés de "RP non syndromique" à IRD syndromique (comme le syndrome de Bardet-Biedl), et 3 ont été reclassés en dystrophie maculaire. Des VUS (variantes d'importance indéterminée) ont été trouvés dans 35 cas (32 %), et la cause est restée indéterminée dans 10 cas (9 %). L'analyse de la population a montré que la variante CERKL était la plus courante chez les Turcs, RPE65 chez les Kurdes, et les variantes EYS chez les Persans, soulignant la diversité génétique. L'étude souligne l'impact des taux de consanguinité élevés sur la structure génétique et la nécessité d'améliorer les capacités de test génétique local.
Comparaison des gènes causaux les plus fréquents dans les trois plus grands groupes ethniques (Heutinck PA et al., 2025)
Bernstein N et al., à travers l'analyse du séquençage de l'exome de sang entier de 200 000 individus âgés de 40 à 73 ans dans le UK Biobank, ont révélé pour la première fois à grande échelle le modèle de sélection positive des mutations somatiques dans le sang vieillissant. L'équipe a identifié 52 700 mutations somatiques dans les régions codantes, constatant que leur nombre et leur fréquence allélique augmentaient avec l'âge, et qu'environ un huitième des mutations non synonymes étaient sélectionnées positivement (dN/dS=1,13). S'appuyant sur cela, l'équipe de recherche a franchi les limites des 74 gènes CH traditionnels, identifiant 17 nouveaux gènes moteurs de sélection positive (tels que BAX, CHEK2 et MYD88) en utilisant des méthodes telles que dNdScv. Les mutations dans ces gènes ont augmenté la prévalence des CH cloniques larges (VAF>0,1) de 18 %, et leur fréquence et taille clonales ont également augmenté avec l'âge, conformément au modèle classique des gènes CH.
Les 17 gènes nouvellement découverts non seulement élargissent le spectre des facteurs de prolifération des cellules hématopoïétiques (CH), mais révèlent également leur forte association avec divers phénotypes cliniques : les mutations MYD88/IGLL5 augmentent significativement le risque de leucémie lymphoïde chronique (LLC), les mutations ZBTB33 entraînent des taux anormaux de cellules dans la moelle osseuse, et la plupart des CH induits par des gènes nouvellement découverts sont étroitement associés à un risque accru d'infection et de mortalité toutes causes confondues, avec des résultats défavorables s'aggravant avec l'augmentation clonale. Cette découverte offre une nouvelle perspective sur la compréhension du rôle de l'hématopoïèse clonale dans le vieillissement, le cancer et les maladies hématologiques, et indique également des directions potentielles pour des interventions ciblées dans l'expansion clonale anormale et le retardement des phénotypes de vieillissement associés.
Duan W et al. ont analysé 10 lignées d'exotropie associées au strabisme dans le Yunnan, en Chine (47 individus, dont 32 patients) en utilisant le séquençage de l'exome entier combiné avec Séquençage de Sanger, révélant pour la première fois le mécanisme génétique. L'étude a identifié sept gènes pathogènes potentiels (COL4A2, SYNE1, LOXHD1, AUTS2, GTDC2, HERC2 et CDH3) et a trouvé 11 variants faux-sens co-segregés avec des membres de la lignée, tous nocifs, de faible fréquence (<5 % dans la population générale) et correspondant à une transmission autosomique dominante, avec un âge moyen d'apparition de 3,35 ± 1,51 ans (plus tôt que dans les cas sporadiques). Parmi eux, COL4A2 (variants dans 3 lignées) et SYNE1 (variants dans 2 lignées) étaient directement associés à la maladie, et cinq gènes (COL4A2, SYNE1, AUTS2, HERC2 et CDH3) se chevauchaient avec la liste des gènes du strabisme de l'Ontologie Phénotypique Humaine (HPO).
Ces gènes se classent en deux catégories fonctionnelles : liés au système nerveux (COL4A2, SYNE1, etc., impliqués dans le développement neural et l'ancrage synaptique) et liés aux muscles (CDH3, GTDC2, etc., impliqués dans le développement des muscles extraoculaires). Un séquençage par capture de cibles a ensuite validé ces gènes dans 220 cas sporadiques : AUTS2 a révélé 15 variants (12 SNP + 3 Indels), et GTDC2 a révélé 4 variants SNP. L'étude confirme l'hétérogénéité génétique de l'exotropie, fournissant des gènes candidats pour un diagnostic précoce et un traitement de précision, mais des tailles d'échantillons plus importantes et une validation fonctionnelle (par exemple, au niveau de l'ARNm/protéine) sont nécessaires pour confirmer le mécanisme.
Flux de travail pour la détection et la validation des variantes génétiques dans les pedigrees d'exotropie concomitante (Duan W et al., 2025)
Explorer le service
Hyakawa T et al. ont analysé la structure génétique et les caractéristiques évolutives de 42 chimpanzés en utilisant le séquençage de l'exome entier (combiné avec une capture de leurres humains) (échantillons non invasifs de fèces sauvages + échantillons de sang de populations captives). La reconstruction d'arbre par maximum de vraisemblance des gènes mitochondriaux a montré une distribution monophylétique significative parmi les sous-espèces de chimpanzés (occidentale, centrale et orientale), mais aucun groupe monophylétique n'a été formé dans certaines populations locales. L'analyse multivariée autosomique (MDS, regroupement hiérarchique et analyse de mélange) a efficacement distingué les sous-espèces (occidentale vs. centrale/orientale) et les populations locales (par exemple, la séparation des chimpanzés occidentaux de Bosu des populations captives), et a identifié des échantillons hybrides (par exemple, l'hybride occidental-central Chloe), confirmant que les séquences d'exons peuvent retracer l'origine géographique et la différenciation des populations.
L'étude a également révélé une corrélation négative significative entre l'hétérozygotie des exons et le ratio de substitution non synonyme/synonyme (N/S) à l'échelle du génome, indiquant une charge mutationnelle (accumulation de mutations légèrement nuisibles dans de petites populations). Parmi les 23 534 gènes codants identifiés, 60 % contenaient des pseudogènes segregés (allèles qui fonctionnent à la fois comme des gènes fonctionnels et des pseudogènes). Parmi ceux-ci, les pseudogènes partagés entre sous-espèces de gènes récepteurs de chimiorécepteurs (récepteur olfactif OR7D4, récepteur de goût amer TAS2R42) (par exemple, le pseudogène d'insertion OR7D4 partagé entre Bosu et Mahalai) étaient des candidats potentiels pour une sélection équilibrée ou liés à des adaptations olfactives/gustatives. Cette méthode a validé la faisabilité de l'échantillonnage non invasif avec un tampon de lyse, fournissant un outil rentable pour la génétique de conservation chez les chimpanzés sauvages et pouvant être étendu à d'autres organismes non modèles.
Variations nucléotidiques de l'exome regroupées aux niveaux des sous-espèces et des populations locales (Hyakawa T et al., 2025)
Yan, X et al. ont analysé 46 individus de cinq espèces de singes rhésus sur l'île de Sulawesi en utilisant le séquençage de l'exome entier (combiné avec un kit de capture d'exons humains), identifiant environ 550 gènes exprimés de manière hautement différentielle (régions riches en SNP dans le top 5 % des valeurs de Fst). Ces gènes sont impliqués dans des processus biologiques clés tels que la pigmentation, l'adhésion cellulaire, la transduction du signal (par exemple, Rho GTPase, voie TGF-bêta) et la réponse au stress. La différenciation des gènes liés à la pigmentation était particulièrement marquée : des mutations de type missense dans TYR (tyrosinase) (par exemple, D132N) et LRIT3 (S394P, Y363D) ne sont partagées que par des espèces à pelage foncé (M. nigra, M. nigrescens), pouvant potentiellement entraîner des différences de couleur de pelage en régulant l'étape limitante de la synthèse de mélanine ou la signalisation FGFR1 ; des variations de type missense dans des gènes tels que MC1R et ASIP peuvent affecter la fonction des récepteurs et le dépôt de mélanine, soulignant la contribution de la différenciation génétique aux traits spécifiques aux espèces.
L'étude a également identifié un grand nombre de SNP fixes (Fst=1) comme marqueurs génétiques spécifiques aux espèces. Quatre comparaisons ont révélé un total de 8380 SNP fixes (41,18%-45% situés dans des exons), impliquant 705-861 gènes (tels que TGM4 et ZFHX3), qui peuvent être utilisés pour la différenciation des espèces et le suivi du risque d'hybridation. L'analyse Fst a montré une différenciation inégale entre les espèces (la plus haute moyenne Fst=0,179 a été observée dans la comparaison NgNc), indiquant que les adaptations locales (comme la sélection positive pour la couleur du pelage) et la dérive génétique conduisent conjointement à une différenciation rapide. Ces résultats fournissent des preuves génomiques cruciales pour comprendre la spéciation des primates, l'évolution adaptative de la couleur du pelage et la conservation des macaques rhésus en danger (comme le maintien de l'intégrité génétique).
La distribution des valeurs Fst des SNPs du top 5 % dans toutes les comparaisons interspécifiques par paires (Yan, X et al., 2025)
WES fournit un outil efficace pour la génétique des populations et la recherche évolutive, mais son application nécessite une validation sous plusieurs dimensions, y compris l'épigénétique et les expériences fonctionnelles. Avec la diminution des coûts de séquençage et l'optimisation des algorithmes, WES jouera un rôle de plus en plus central dans des domaines tels que les mécanismes des maladies humaines et l'évolution adaptative des espèces.
À quoi sert le test de séquençage de l'exome complet ?
Le test de séquençage de l'exome entier est principalement utilisé dans le diagnostic clinique pour identifier les mutations génétiques causant des troubles héréditaires rares, et dans la recherche pour étudier la génomique du cancer, les maladies complexes et la génétique des populations.
Le WGS est-il plus coûteux que le WES ?
Le séquençage génomique complet (WGS) coûte actuellement deux à trois fois plus cher que le séquençage d'exome (WES), mais la majeure partie du coût du WGS (>90%) est directement liée au séquençage, tandis que le coût du WES est principalement dû au kit de capture.
Quelles maladies le séquençage de l'exome entier peut-il détecter ?
WES est précieux pour les patients pédiatriques présentant des conditions telles que des anomalies congénitales multiples, des troubles neurodéveloppementaux et de l'épilepsie où une étiologie génétique est suspectée.
Combien de temps faut-il pour obtenir des résultats d'un séquençage de l'exome entier ?
Le délai de traitement est d'environ 5 jours, mais peut varier en fonction de facteurs tels que la date de collecte, la qualité/quantité de l'échantillon et l'exhaustivité des informations sur le patient fournies.
Références