What are the limitations of whole exome sequencing?

Exome sequencing does not target 100% of the genes in the human genome; approximately 97% of exons are targeted. However, ~10% of exons may not be covered at sufficient levels to reliably call heterozygous variants. Each individual may have slightly different coverage yield distributions across the exome.

What are the limitations of exome sequencing in detecting rare and undiagnosed diseases?

Although exome sequencing covers almost 99 % of mutations in targeted gene panels, it has limitations in detecting mutations such as low degree mosaicism, deep intronic variants, small CNVs, and mutations in repeat regions and high GC regions.

What cannot be detected by whole exome sequencing?

There may be functional variants in non-coding regions that regulate gene expression, such as enhancers and long-noncoding RNAs. However, these non-coding variants (NCVs), even if genetically identifiable, are not covered by WES and thus cannot be detected.

What is a challenge when sequencing an entire genome?

Production issues like sample contamination, library chimaeras and variable run quality have become increasingly problematic in the transition from technology development lab to production floor.

What are the ethical issues of whole genome sequencing?

We identify three major ethical considerations that have been implicated in whole-genome research: the return of research results to participants; the obligations, if any, that are owed to participants' relatives; and the future use of samples and data taken for whole-genome sequencing.

Défis et limitations courants du séquençage de l'exome entier

Séquençage de l'exome entier (WES), en tant qu'une des technologies fondamentales dans la recherche génomique, fournit un outil important pour le diagnostic des maladies génétiques, la recherche sur les tumeurs et le développement de médicaments en ciblant et en capturant des séquences d'ADN dans les régions codantes des protéines (exons). Cependant, son application fait encore face à de nombreux défis techniques, analytiques et éthiques. La section suivante passe en revue de manière systématique les principales limitations de WES, combinant les dernières recherches et la pratique clinique.

Alt:WES's list of unresolved challenges. Liste des défis non résolus de WES (Bertier G et al., 2016)

I. Limitations techniques

Couverture incomplète et biais de capture

Le séquençage de l'exome (WES) ne couvre qu'environ 1 % à 2 % du génome (c'est-à-dire les régions exoniques), mais certains exons ne peuvent pas être capturés efficacement en raison de limitations techniques. Par exemple :
Régions à Haute Teneur en GC : Par exemple, la teneur en GC des régions d'exons du gène BRCA1 atteint jusqu'à 70 %, ce qui entraîne une diminution de l'efficacité d'hybridation des sondes et un taux de faux négatifs de 5 % à 10 %.
Interférence de séquence répétitive : Par exemple, le pseudogène (CYP21A2P) du gène CYP21A2 présente une similarité de séquence allant jusqu'à 98 % avec le gène fonctionnel, ce qui facilite la liaison incorrecte des sondes de capture conventionnelles, entraînant des résultats faussement négatifs.
Différences de plateforme : L'uniformité de couverture peut varier entre différents kits d'enrichissement de capture (par exemple, Agilent vs. IDT) et les plateformes de séquençage, mais les plateformes nationales actuelles (telles que DNBSEQ-T7/G400) ont atteint des performances comparables à celles d'Illumina. NovaSeq dans le séquençage de l'exome entier.

Limitations dans la détection des variations structurelles et des mutations complexes

Les variations du nombre de copies (VNC) : le séquençage de l'exome entier (WES) a une sensibilité de moins de 60 % pour les VNC > 50 pb, tandis que séquençage à lecture longue (tels que PacBio HiFi) peut améliorer la sensibilité à plus de 90 %. Par exemple, le syndrome de microdélétion 22q11.2 peut être manqué dans le WES en raison d'une couverture de sonde insuffisante.
Sensibilité Insuffisante pour les Variants à Basse Fréquence : Le séquençage exomique standard (WES) en diagnostic clinique (généralement à une profondeur moyenne d'environ 100×) a une capacité limitée à détecter des variants à basse fréquence, tels que les mutations somatiques ou le mosaicisme avec une fréquence allélique inférieure à 5 %. Bien que la sensibilité puisse être améliorée en augmentant la profondeur de séquençage (>300×), cette approche augmente considérablement les coûts et le volume de données, rendant ainsi le séquençage moins rentable par rapport à des panels de séquençage plus ciblés ou au séquençage du génome entier (WGS).

Interférence des pseudogènes et homologie de séquence

Interférence des pseudogènes : Par exemple, le pseudogène SBDSP du gène SBDS présente une similarité de séquence allant jusqu'à 97 % avec le gène fonctionnel. Le séquençage Sanger peut l'identifier à tort comme une mutation hétérozygote, nécessitant une vérification par qPCR ou séquençage à long fragment.
Difficulté à distinguer les gènes homologues : Par exemple, la similarité de séquence entre PTEN et PTENP1 peut facilement entraîner une contamination croisée lors de la capture ciblée, nécessitant un design spécifique des sondes ou une vérification par MLPA.

II. Défis dans l'analyse et l'interprétation des données

Complexité de l'annotation des variants

Pertinence et Limitations de l'Annotation des Bases de Données : Le séquençage de l'exome entier (WES) génère un grand nombre de variantes rares, dont l'interprétation repose fortement sur des bases de données publiques (par ex., ClinVar, gnomAD). Cependant, deux défis majeurs existent : (1) Retard d'Annotation : Les mutations familiales privées nouvellement découvertes sont souvent classées comme Variantes de Signification Incertaine (VUS) et peuvent nécessiter des années de preuves accumulées pour être reclassées ; (2) Biais de Population : Les bases de données existantes (par ex., gnomAD) sont principalement composées de données provenant de populations européennes. Ce biais peut conduire à une classification erronée des variantes rares trouvées dans d'autres populations comme pathogènes. Par conséquent, le WES fait face à des défis d'interprétation significatifs tant dans la découverte de nouveaux gènes causant des maladies que dans le service aux populations sous-représentées.
Sources d'annotation conflictuelles : La même variante peut être étiquetée comme "pathogène" ou "bénigne" dans des outils tels qu'ANNOVAR et SnpEff, nécessitant une vérification manuelle. Par exemple, la mutation c.743G>A dans le gène TP53 est répertoriée comme pathogène dans certaines bases de données, mais des études récentes montrent qu'elle n'est pas phénotypiquement pertinente.

Risque double de faux positifs et de faux négatifs

Erreurs techniques : Le biais d'amplification PCR peut entraîner une perte d'allèles, comme la mutation c.1521_1523delCTT dans le gène CFTR, qui peut être manquée lors de l'amplification.
Mutations à faible fréquence : Lorsque la fréquence de mutation est inférieure à 1 %, le taux de détection de l'exome entier (WES) peut être inférieur à 30 %, nécessitant une vérification par ddPCR ou NGS séquençage profond.

Manque de collaboration multidisciplinaire et de normalisation

Interprétation des divergences : La classification de la pathogénicité du même VUS peut varier jusqu'à 40 % entre différents laboratoires. Par exemple, la mutation c.3985C>T dans le gène SCN1A peut être classée comme "pathogène" ou "d'importance inconnue" dans le diagnostic de l'épilepsie.
Association phénotype-génotype insuffisante : Environ 30 % des résultats de WES ne peuvent pas être efficacement associés à des gènes spécifiques en raison de descriptions phénotypiques vagues (par exemple, "retard de développement").

Alt:Issues that were encountered in data analysis. Problèmes rencontrés dans l'analyse des données (Corominas J et al., 2022)

III. Questions éthiques et pratiques dans les applications cliniques

Dilemmes éthiques des découvertes incidentelles

Risque de maladie non ciblée : Le séquençage de l'exome entier (WES) peut détecter des mutations pathogènes non liées au phénotype actuel (par exemple, BRCA1 c.68_69delAG), nécessitant une notification préalable des patients et des plans de gestion. Des études montrent que 15 % des participants ressentent des symptômes d'anxiété en raison de découvertes incidentelles.
Controverses concernant le rapport des maladies à l'âge adulte : par exemple, les mutations du gène APC peuvent indiquer un risque de cancer colorectal, mais le patient peut ne pas encore être asymptomatique, nécessitant une réflexion approfondie sur la nécessité de divulguer cette information.

Correspondance de la qualité des échantillons et des phénotypes

Impact de la dégradation de l'ADN : La fragmentation de l'ADN dans les échantillons FFPE peut entraîner une diminution de la profondeur de couverture et une augmentation de 2 à 3 fois des taux d'erreur de séquençage dans les régions des bords des exons (telles que les codons de départ/arrêt).
Changements phénotypiques dynamiques : Par exemple, le phénotype de l'encéphalopathie épileptique néonatale peut évoluer sur plusieurs mois, nécessitant des mises à jour régulières des informations cliniques pour une réanalyse des données.

IV. Améliorations technologiques et orientations futures

Innovation technologique

Intégration du séquençage à lecture longue : les technologies PacBio HiFi et Oxford Nanopore peuvent résoudre des variations structurelles complexes (telles que des translocations équilibrées), augmentant le taux de détection des CNV à 90 %.
CRISPR enrichissement ciblé : L'enrichissement médié par CRISPR combiné au séquençage à longue lecture permet la capture spécifique de régions génomiques à longue portée (par exemple, >10 kb) avec une grande spécificité, améliorant la sensibilité de détection des mutations à faible fréquence (<1%) de 40%-60% par rapport au séquençage à longue lecture non ciblé. Cette approche est particulièrement utile pour résoudre des régions génomiques complexes (par exemple, séquences répétitives, variants structurels) qui sont difficiles à analyser avec le séquençage exomique à courte lecture traditionnel.

Optimisation des algorithmes et des bases de données

Modèles d'apprentissage profond : Des modèles tels qu'ECOLE, utilisant l'architecture Transformer, améliorent la précision de détection des CNV de 50,1 % à 68,7 % et le rappel de 49,6 % à 78,4 %.
Mises à jour dynamiques de la base de données : La base de données gnomAD (v4.0) intègre des données provenant de plus de 800 000 individus (y compris 730 947 exomes et 76 215 génomes), prenant en charge des requêtes de fréquence de variantes en temps réel et réduisant les faux positifs de VUS.

Flux de travail cliniques standardisés

Équipe multidisciplinaire (EMD) : Les équipes composées de généticiens, de cliniciens et de bioinformaticiens peuvent améliorer la précision diagnostique de 20 %.
Système de contrôle de la qualité : les laboratoires certifiés CAP doivent avoir une profondeur de séquençage de ≥100×, une couverture de ≥95% et participer régulièrement à des évaluations de qualité interlaboratoires (comme UK NEQAS).

V. Analyse de cas typique

Cas 1 : Interférence entre le gène SBDS et le pseudogène

Contexte : Le syndrome de Shwachman-Diamond (SDS) est souvent causé par des mutations bialléliques dans le gène SBDS. Ce gène possède un pseudogène hautement homologué, SBDSP (similarité de séquence >97%).
Limitations et conséquences du WES : Le WES à courtes lectures a du mal à distinguer les séquences entre SBDS et SBDSP. Cela peut conduire à : 1) Faux positifs : Interpréter à tort les variations de séquence dans le pseudogène comme des mutations dans le gène fonctionnel ; 2) Faux négatifs / Interprétation erronée : Lorsqu'une grande délétion (par exemple, une délétion d'exon) existe dans le gène fonctionnel en même temps qu'une variante de nucléotide unique dans le pseudogène, les données WES peuvent être erronément interprétées comme une "mutation ponctuelle homozygote" au lieu de l'état correct de "hétérozygotie composée avec une délétion." Une clarification nécessite un séquençage à longues lectures ou une PCR quantitative (qPCR).
Argument principal : Cette affaire révèle la limitation fondamentale du WES dans la résolution des régions génomiques hautement homologues.

Cas 2 : Détection manquée d'une grande délétion de fragment dans le gène CYP21A2

Contexte : La forme la plus courante d'hyperplasie surrénalienne congénitale (HSC) est causée par des mutations dans le gène CYP21A2. Ce gène est également très homologué au pseudogène CYP21A1P (similarité >98%).
Limitations et conséquences du WES : Pour un patient suspecté d'avoir une CAH, le WES n'a identifié qu'une variante de signification incertaine (VUS) dans le gène CFTR, qui ne pouvait pas expliquer la présentation clinique. Un séquençage génomique (GS) ou un test MLPA ultérieur a révélé une grande délétion hétérozygote (par exemple, exons 1-7) dans le gène CYP21A2, une variante avec une pathogénicité claire. Les raisons de l'échec du WES sont : 1) Les grandes délétions dépassent le champ de détection : Les pipelines bioinformatiques standards du WES sont insensibles aux délétions >50 pb ; 2) Difficulté d'alignement dans les régions homologues : Même si des fragments sont capturés, les courtes lectures ne peuvent pas être alignées avec précision entre CYP21A2 et CYP21A1P.
Argument principal : Cette affaire illustre le taux élevé de faux négatifs du séquençage de l'exome entier (WES) dans la détection des grandes variantes structurelles (SV). Lorsque la suspicion clinique demeure élevée malgré un résultat négatif de WES, un séquençage génomique supplémentaire ou des tests ciblés sont nécessaires.

Résumé

Les limitations du séquençage de l'exome entier (WES) impliquent plusieurs dimensions, y compris la technologie, l'analyse et l'éthique. Ces limitations nécessitent des percées progressives grâce à l'innovation technologique (comme le séquençage à long tirage), à l'optimisation des algorithmes (comme les modèles d'apprentissage profond) et à des processus standardisés (comme la collaboration en équipe multidisciplinaire (MDT)). À l'avenir, avec l'amélioration des cadres de consentement éclairé dynamique et du partage de données à l'échelle mondiale (comme le projet GA4GH), le WES devrait jouer un rôle plus central dans la médecine de précision ; cependant, son application clinique doit encore équilibrer le potentiel technologique avec les risques éthiques.

Les gens demandent aussi

Quelles sont les limitations du séquençage de l'exome entier ?

Le séquençage de l'exome ne cible pas 100 % des gènes du génome humain ; environ 97 % des exons sont ciblés. Cependant, environ 10 % des exons peuvent ne pas être couverts à des niveaux suffisants pour appeler de manière fiable des variants hétérozygotes. Chaque individu peut avoir des distributions de rendement de couverture légèrement différentes à travers l'exome.

Quelles sont les limites du séquençage de l'exome dans la détection des maladies rares et non diagnostiquées ?

Bien que le séquençage de l'exome couvre presque 99 % des mutations dans les panels de gènes ciblés, il présente des limitations dans la détection de mutations telles que le mosaïcisme de faible degré, les variantes introniques profondes, les petits CNV et les mutations dans les régions répétées et les régions à forte teneur en GC.

Ce qui ne peut pas être détecté par le séquençage de l'exome complet ?

Il peut exister des variantes fonctionnelles dans les régions non codantes qui régulent l'expression des gènes, telles que les amplificateurs et les ARN longs non codants. Cependant, ces variantes non codantes (VNC), même si elles sont génétiquement identifiables, ne sont pas couvertes par le séquençage de l'exome entier (WES) et ne peuvent donc pas être détectées.

Quel est un défi lors du séquençage d'un génome entier ?

Les problèmes de production tels que la contamination des échantillons, les chimères de bibliothèque et la qualité variable des courses sont devenus de plus en plus problématiques lors de la transition du laboratoire de développement technologique vers la chaîne de production.

Quels sont les enjeux éthiques du séquençage complet du génome ?

Nous identifions trois considérations éthiques majeures qui ont été impliquées dans la recherche sur le génome entier : le retour des résultats de recherche aux participants ; les obligations, le cas échéant, envers les proches des participants ; et l'utilisation future des échantillons et des données prélevés pour le séquençage du génome entier.

Références :

Bertier G, Hétu M, Joly Y. Défis non résolus du séquençage de l'exome entier clinique : une revue systématique de la littérature sur les opinions des utilisateurs finaux. BMC Génétique Médicale. 2016 11 août ; 9(1) : 52.
Miya F, Nakato D, Suzuki H, Yamada M, Watanabe D, Takenouchi T, Kosaki K. Augmenter l'efficacité coût-efficacité dans le diagnostic clinique en utilisant le séquençage de l'exome entier étendu : SNVs, SVs et au-delà.. J Hum Genet. Jan 2026;71(1):13-21.
Corominas J, Smeekens SP, Nelen MR, Yntema HG, Kamsteeg EJ, Pfundt R, Gilissen C. Séquençage de l'exome clinique - Erreurs et précautions. Hum Mutat2022 août ; 43(8) : 1041-1055.

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.

Services associés