Principes et flux de travail du séquençage de l'exome entier

Qu'est-ce que WES ?

L'exome est communément défini comme englobant tous les exons au sein des gènes codant pour des protéines, y compris des éléments qui ne codent pas pour des protéines, tels que les séquences de microARN ou de lncARN. L'examen de l'exome aide à l'identification de loci qui peuvent précipiter des maladies spécifiques. Pour l'étude des troubles mendéliens rares, le séquençage de l'exome s'avère être une méthode particulièrement efficace pour la détection des variations génétiques.

Accéléré par les avancées dans enrichissement ciblé stratégies et percées dans les technologies de séquençage de l'ADN, l'évolution de séquençage de l'exome entier (WES) a été instrumental. WES représente une technique d'analyse génomique destinée à l'examen détaillé de tous les exons transcrits au sein d'un génome. Cela est réalisé en s'appuyant sur l'ADN. microarrays ou séquençage du génome entier des plateformes en tandem avec des technologies de capture de séquences. Ces outils permettent la capture sélective et l'enrichissement des régions exon dans l'ADN, qui sont ensuite soumises à un séquençage à haut débit pour obtenir des informations sur les mécanismes de régulation de l'expression génique.

WES présente la capacité de détecter des mutations potentielles qui peuvent être associées à des phénotypes ou des maladies, ainsi que des variations génomiques globales, la découverte de nouveaux gènes et les relations phénotype-génotype de mutations génétiques.

Différence entre WES et WGS

WES implique l'extraction de toutes les régions exoniques, les principaux domaines orchestrant la synthèse des protéines. Les protéines forment le noyau structurel et fonctionnel du corps humain, rendant les zones de l'exome au sein de l'ADN d'une valeur génétique maximale. Étant donné que les exons ne constituent qu'1 % du génome d'un individu, le WES parvient à maîtriser les coûts tout en amplifiant la profondeur des tests, un facteur critique influençant l'exactitude. Des résultats de recherche académique significatifs sont actuellement centrés sur la région exoniques, de sorte que les données générées par le WES sont suffisamment substantielles pour de futures mises à jour. Avec l'avènement de nouvelles découvertes de recherche, une analyse directe des données peut être effectuée sans nécessiter un nouveau test.

Séquençage du génome entier (WGS) s'efforce de capturer tous les loci génétiques. Les zones au-delà des exons, qui représentent 99 % des loci totaux, contiennent de nombreux segments répétitifs et nonsensiques. Le rendement de la littérature académique pertinente est également remarquablement limité, ce qui implique que le contenu lisible dérivé du WGS est presque indistinguable de celui extrait du WES. Cependant, des coûts significatifs sont disproportionnellement gaspillés sur des loci 'inutiles' dans le WGS, rendant difficile la garantie d'une profondeur de séquençage. Dans certains tests génétiques WGS coûtant plusieurs milliers d'euros, la profondeur moyenne n'est qu'à peine de 30X. Pour les loci analysés, la profondeur de séquençage peut chuter à des niveaux à un chiffre, rendant les données pratiquement sans valeur pour référence.

Comparé au WGS, le WES présente un avantage dans les trois aspects suivants :

  • Le temps : le WES nécessite moins de temps que le WGS.
  • Les ensembles de données générés par le WES sont significativement plus petits que ceux du WGS, ce qui les rend plus faciles à gérer pour l'analyse bioinformatique.
  • Coût : Le coût du WGS est trois à quatre fois supérieur à celui du WES.

Par conséquent, le séquençage de l'exome (WES) est actuellement considéré comme la technique de test génétique la plus rentable.

Principe du séquençage de l'exome

Séquençage de l'exome entier en tant que technique d'analyse génomique, elle recherche des mutations génétiques liées aux variations de fonction des protéines. Le principe de base englobe :

Capture et enrichissement de l'ADN : Des sondes d'ADN ou d'ARN spécifiques aux régions d'exons sont d'abord utilisées pour capturer et enrichir les séquences d'ADN. Cela est généralement réalisé grâce à la technologie de capture hybride en phase liquide, qui utilise les principes de l'appariement des bases pour hybrider des sondes d'ARN marquées par de la biotine avec des bibliothèques d'ADN contenant des séquences d'adaptateurs, puis enrichit l'ADN de la zone cible par liaison à des billes magnétiques.

Séquençage à haut débit : Les séquences d'ADN enrichies sont ensuite séquencées via une technologie de séquençage à haut débit. Le séquençage est le processus de découverte de tous les agencements de désoxyribonucléotides dans l'exome, ce qui peut nous aider à comprendre les changements pathophysiologiques potentiels dans certaines maladies.

Analyse des données : Les résultats de séquençage sont soumis à une analyse bioinformatique pour identifier les mutations génétiques associées aux variations de fonction des protéines.

Flux de travail général du séquençage de l'exome

Le processus de travail conventionnel de Séquençage de l'exome entier (WES) comprend la préparation des échantillons, la capture de l'exome et la conception de la bibliothèque, enrichissement ciblé, séquençage et analyse bioinformatique. Une illustration correspondant au flux de travail WES peut être représentée ci-dessous.

Figure1. Workflow of WGS.Figure 1. Flux de travail du WGS.

Remarque : Les protocoles précis diffèrent selon les types d'échantillons, les kits de réactifs et les équipements de séquençage. Les chercheurs doivent se conformer aux instructions spécifiées pour les réactifs, les kits et les machines de séquençage utilisés.

Préparation des échantillons : Des échantillons de sang total, des cellules mononucléées du sang périphérique (PBMC), des tissus fraîchement congelés, des échantillons fixés au formol et inclus dans la paraffine (FFPE), des échantillons de plasma et des cellules de liquide amniotique, entre autres, peuvent être utilisés pour le séquençage de l'exome. L'ADN est extrait des échantillons biologiques à tester et fragmenté par des méthodes physiques ou des processus enzymatiques. La disruption physique comprend le cisaillement, la sonication et le cisaillement dynamique des fluides, où le cisaillement et la sonication servent de méthodes principales de fragmentation de l'ADN. Les processus enzymatiques impliquent généralement l'utilisation de nucléases ou de transposases, qui fragmentent l'ADN en morceaux plus petits. Les nucléases induisent la rupture des liaisons phosphodiester au sein des acides nucléiques, entraînant la fragmentation de l'ADN.

Capture et enrichissement des exons : Lors de la capture et de l'enrichissement de l'exome, les exons sont enrichis de manière sélective à l'aide de la technologie de capture de l'exome. Le concept fondamental derrière l'enrichissement ciblé concerne l'exploitation des différences physico-chimiques entre le composé cible et d'autres substances pour faciliter leur séparation. Après l'isolement de l'exome du reste du génome, plusieurs étapes de lavage sont nécessaires pour obtenir un exome plus pur. Bien que l'eau distillée soit généralement utilisée pour éluer les cibles, certains kits spécialisés peuvent nécessiter des solutions d'élution spécifiques.

Construction de bibliothèque : La construction de bibliothèques implique la réparation des extrémités des fragments d'ADN exoniques enrichis, l'attachement de connecteurs et l'amplification des bibliothèques pour convertir les fragments d'ADN exoniques enrichis en bibliothèques de séquençage, une étape qui fournit des modèles d'ADN suffisants pour le séquençage ultérieur.

Tableau 1. Kits courants d'enrichissement ciblé pour le séquençage.

Kits Région ciblée Entrée d'ADN génomique requise Ajout d'adaptateur Longueur de la sonde (m)
Agilent SureSelect XT2 V6 Exome 60 Mo 100 ng Ligation 120
Agilent SureSelect XT2 V5 Exome 51 Mo 100 ng Ligation 120
Panneau Exome IDT xGEN 39 Mo 500 ng Ligation non décrit
Illumina Nextera Rapid Capture Exome élargi 62 Mo 50 ng Transposase 95
Roche NimblegenSeqCap EZ Exome v3.0 64 Mo 1 µg Ligation 60 - 90

Séquençage : Avec les avancées des techniques de séquençage, le séquençage de nouvelle génération (NGS) est de plus en plus utilisé pour le séquençage de l'exome. Le principe du NGS consiste à coupler l'échantillon d'exome à une base appropriée (comme le flowcell dans l'Illumina Hiseq et les billes magnétiques dans Roche-454), suivi d'une duplication PCR in situ pour garantir l'amplification du signal à chaque cycle. Le ddNTP est examiné après chaque cycle d'extension, et la séquence complète est finalement compilée à l'aide d'un algorithme bioinformatique. L'efficacité élevée et les capacités de débit rendent le NGS une option attrayante pour le séquençage à haut débit.

En dehors du séquençage de nouvelle génération (NGS), les technologies de séquençage de troisième génération évoluent rapidement et possèdent des efficacités qui surpassent largement celles du NGS. Le séquençage à molécule unique, une caractéristique distinctive du séquençage de troisième génération, peut réduire de manière spectaculaire le temps et le coût associés au séquençage de l'ensemble du génome à quelques minutes. Des entreprises telles que PacificBio et Oxford Nanopore ont démontré l'efficacité de leurs méthodes, qui pourraient potentiellement déclencher une révolution dans le domaine du séquençage de l'exome.

Tableau 2. Méthodes courantes utilisées pour le séquençage de nos jours.

Méthodes Société Génération Longueur de lecture Précision Lectures par exécution Temps par course
semi-conducteur ionique Ion Torrent deuxième génération Jusqu'à 600 pb 99,60 % jusqu'à 80 millions 2 heures
Pyroséquençage (454) Roche deuxième génération 700 pb 99,90 % 1 million 24 heures
Séquençage par synthèse Illumina deuxième génération 75-300 pb 99,90 % 1 million à 3 milliards 1 à 11 jours
Séquençage par ligation (SOLiD) ABI deuxième génération 50+35 ou 50+50 pb 99,90 % 1,2 à 1,4 milliard 1 à 2 semaines
Séquençage par nanopore Technologies Oxford Nanopore 3ème génération jusqu'à 500 Ko 92–97 % (lecture unique)* dépendant de la longueur de lecture sélectionnée par l'utilisateur 1 minute à 48 heures
Séquençage en temps réel à molécule unique Pacific Biosciences 3ème génération 30 000 ans avant le présent 87 % (lecture unique)* 10 à 20 milliards 0,5-20 heures

Analyse des données : Le processus d'analyse des données implique l'élimination des lectures de faible qualité lors du séquençage grâce au contrôle de qualité, l'alignement des lectures de haute qualité avec le génome de référence, la quantification des polymorphismes nucléotidiques simples (SNP), des insertions et des délétions (Indels), et des variations du nombre de copies (CNV), suivi de l'annotation, du dépistage, de l'analyse et de la validation. L'analyse des données constitue un point critique dans le séquençage de l'exome, englobant l'évaluation et le traitement de la qualité des données de séquençage, l'alignement des lectures de séquençage au génome de référence et l'identification des mutations génétiques au sein des échantillons. Les mutations génétiques détectées doivent être annotées, y compris la détermination de la fonction de la mutation, sa signification pathologique et son impact potentiel.

Figure2. The typical variant calling pipeline.Figure 2. Le pipeline typique d'appel de variants.

Avantages du séquençage de l'exome

Coût-efficacité : Comparé à Séquençage du génome entier, Séquençage de l'exome complet offre une couverture plus approfondie, une plus grande précision et est plus économiquement efficace.

Profondeur de séquençage élevée : La profondeur de séquençage peut atteindre plus de 120x.

Haut débit : Il répond aux besoins de recherche de plusieurs régions cibles à partir d'un grand nombre d'échantillons.

Haute précision : Avec une couverture de séquençage approfondie, la précision des données est élevée et efficace.

Application du séquençage de l'exome

Séquençage de l'exome entier (WES) trouve des applications dans divers domaines de la recherche biomédicale, y compris l'étude des maladies monogéniques. maladies héréditaires, maladies complexes, mutations somatiques dans les tumeurs, découverte des oncogènes et des gènes suppresseurs de tumeurs, et avancement des initiatives de médecine personnalisée.

Les tumeurs, étant des maladies complexes provoquées par de multiples mutations génétiques, peuvent être efficacement comprises avec l'aide de séquençage de l'exome completCela permet aux scientifiques et aux cliniciens de découvrir des variations dans les gènes liés aux tumeurs afin d'obtenir un diagnostic et un pronostic précis de la tumeur. Cela inclut principalement la recherche sur les gènes pilotes, le sous-typage moléculaire des tumeurs, la recherche sur les métastases récurrentes et la médication sur mesure pour les tumeurs individuelles.

Les troubles génétiques proviennent souvent de mutations génétiques, qui se produisent fréquemment dans les régions exoniques qui codent des protéines. Les méthodes traditionnelles de détection des mutations nécessitent une enquête approfondie sur les gènes liés à la maladie un par un, ce qui est chronophage, laborieux et nécessite une taille d'échantillon substantielle. Cependant, le séquençage de l'exome atténue ces inconvénients en permettant l'examen simultané de plusieurs gènes de la maladie, ce qui améliore considérablement l'efficacité et la précision de la détection. En appliquant le séquençage de l'exome (WES), nous pouvons séquencer toutes les régions exoniques nécessaires pour coder des protéines, identifiant ensuite les mutations génétiques ou les loci polymorphes liés à l'apparition de la maladie. Cela facilite un diagnostic et un traitement précis des troubles génétiques.

Figure3. WES and impact of its genetic consequences on human public health.Figure 3. WES et impact de ses conséquences génétiques sur la santé publique humaine. (Rabbani B et al., 2014)

Le séquençage de l'exome (WES) suscite un intérêt considérable pour les applications cliniques, principalement parce qu'il englobe les régions exploitables d'un génome. L'objectif principal est d'identifier les variations au sein des régions exoniques et de déterminer les mutations causales des maladies ou des variants pathogènes. L'intersection de l'analyse des grandes données et du WES stimule des avancées dans la médecine personnalisée sous de nombreuses dimensions.

Si vous êtes intéressé par nos services de génomique, n'hésitez pas à contacter nos scientifiques. Nous sommes plus qu'heureux de vous aider. En plus de séquençage génomique, nous proposons également des services incluant transcriptomique, épigénomique, génomique microbienne, et Séquençage SMRT de PacBio.

Références :

  1. Warr A, Robert C, Hume D, et al. Séquençage de l'exome : perspectives actuelles et futures. G3 : Gènes, Génomes, Génétique, 2015, 5(8) : 1543-1550.
  2. Rabbani B, Tekin M, Mahdieh N. La promesse du séquençage de l'exome entier en génétique médicale. Journal de génétique humaine, 2014, 59(1) : 5-15.
  3. Suwinski P, Ong C, Ling MHT, et al. Faire progresser la médecine personnalisée grâce à l'application du séquençage de tout l'exome et de l'analyse des grandes données. Frontières en génétique, 2019, 10:49.
  4. Shashi V, McConkie-Rosell A, Schoch K, et al. Considérations pratiques dans l'application clinique du séquençage de l'exome entier. Génétique clinique, 2016, 89(2) : 173-181.
  5. Goh G, Choi M. Application du séquençage de l'exome entier pour identifier des variants causant des maladies dans les maladies humaines héréditaires. Génomique et informatique, 2012, 10(4) : 214.
  6. Albertsen H M, Matalliotaki C, Matalliotakis M, et al. Le séquençage de l'exome entier identifie des délétions hémizygotes dans les gènes UGT2B28 et USP17L2 dans une famille sur trois générations avec endométriose. Rapports de Médecine Moléculaire, 2019, 19(3) : 1716-1720.
  7. Erjavec S O, Gelfman S, Abdelaziz A R, et al. Le séquençage de l'exome entier dans l'alopécie areata identifie des variantes rares dans KRT82. Communications Nature, 2022, 13(1) : 800.
  8. Luo W, Zhang C, Jiang Y, et al. Reconstruction systématique de la biologie de l'autisme à partir de profils massifs de mutations génétiques. La science progresse, 2018, 4(4) : e1701799.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Parlez à nos scientifiques
De quoi aimeriez-vous discuter ?
Avec qui allons-nous parler ?

* est un élément requis.

Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut