L'exome est communément défini comme englobant tous les exons au sein des gènes codant pour des protéines, y compris des éléments qui ne codent pas pour des protéines, tels que les séquences de microARN ou de lncARN. L'examen de l'exome aide à l'identification de loci qui peuvent précipiter des maladies spécifiques. Pour l'étude des troubles mendéliens rares, le séquençage de l'exome s'avère être une méthode particulièrement efficace pour la détection des variations génétiques.
Accéléré par les avancées dans enrichissement ciblé stratégies et percées dans les technologies de séquençage de l'ADN, l'évolution de séquençage de l'exome entier (WES) a été instrumental. WES représente une technique d'analyse génomique destinée à l'examen détaillé de tous les exons transcrits au sein d'un génome. Cela est réalisé en s'appuyant sur l'ADN. microarrays ou séquençage du génome entier des plateformes en tandem avec des technologies de capture de séquences. Ces outils permettent la capture sélective et l'enrichissement des régions exon dans l'ADN, qui sont ensuite soumises à un séquençage à haut débit pour obtenir des informations sur les mécanismes de régulation de l'expression génique.
WES présente la capacité de détecter des mutations potentielles qui peuvent être associées à des phénotypes ou des maladies, ainsi que des variations génomiques globales, la découverte de nouveaux gènes et les relations phénotype-génotype de mutations génétiques.
WES implique l'extraction de toutes les régions exoniques, les principaux domaines orchestrant la synthèse des protéines. Les protéines forment le noyau structurel et fonctionnel du corps humain, rendant les zones de l'exome au sein de l'ADN d'une valeur génétique maximale. Étant donné que les exons ne constituent qu'1 % du génome d'un individu, le WES parvient à maîtriser les coûts tout en amplifiant la profondeur des tests, un facteur critique influençant l'exactitude. Des résultats de recherche académique significatifs sont actuellement centrés sur la région exoniques, de sorte que les données générées par le WES sont suffisamment substantielles pour de futures mises à jour. Avec l'avènement de nouvelles découvertes de recherche, une analyse directe des données peut être effectuée sans nécessiter un nouveau test.
Séquençage du génome entier (WGS) s'efforce de capturer tous les loci génétiques. Les zones au-delà des exons, qui représentent 99 % des loci totaux, contiennent de nombreux segments répétitifs et nonsensiques. Le rendement de la littérature académique pertinente est également remarquablement limité, ce qui implique que le contenu lisible dérivé du WGS est presque indistinguable de celui extrait du WES. Cependant, des coûts significatifs sont disproportionnellement gaspillés sur des loci 'inutiles' dans le WGS, rendant difficile la garantie d'une profondeur de séquençage. Dans certains tests génétiques WGS coûtant plusieurs milliers d'euros, la profondeur moyenne n'est qu'à peine de 30X. Pour les loci analysés, la profondeur de séquençage peut chuter à des niveaux à un chiffre, rendant les données pratiquement sans valeur pour référence.
Comparé au WGS, le WES présente un avantage dans les trois aspects suivants :
Par conséquent, le séquençage de l'exome (WES) est actuellement considéré comme la technique de test génétique la plus rentable.
Services qui pourraient vous intéresser
Séquençage de l'exome entier en tant que technique d'analyse génomique, elle recherche des mutations génétiques liées aux variations de fonction des protéines. Le principe de base englobe :
Capture et enrichissement de l'ADN : Des sondes d'ADN ou d'ARN spécifiques aux régions d'exons sont d'abord utilisées pour capturer et enrichir les séquences d'ADN. Cela est généralement réalisé grâce à la technologie de capture hybride en phase liquide, qui utilise les principes de l'appariement des bases pour hybrider des sondes d'ARN marquées par de la biotine avec des bibliothèques d'ADN contenant des séquences d'adaptateurs, puis enrichit l'ADN de la zone cible par liaison à des billes magnétiques.
Séquençage à haut débit : Les séquences d'ADN enrichies sont ensuite séquencées via une technologie de séquençage à haut débit. Le séquençage est le processus de découverte de tous les agencements de désoxyribonucléotides dans l'exome, ce qui peut nous aider à comprendre les changements pathophysiologiques potentiels dans certaines maladies.
Analyse des données : Les résultats de séquençage sont soumis à une analyse bioinformatique pour identifier les mutations génétiques associées aux variations de fonction des protéines.
Le processus de travail conventionnel de Séquençage de l'exome entier (WES) comprend la préparation des échantillons, la capture de l'exome et la conception de la bibliothèque, enrichissement ciblé, séquençage et analyse bioinformatique. Une illustration correspondant au flux de travail WES peut être représentée ci-dessous.
Figure 1. Flux de travail du WGS.
Remarque : Les protocoles précis diffèrent selon les types d'échantillons, les kits de réactifs et les équipements de séquençage. Les chercheurs doivent se conformer aux instructions spécifiées pour les réactifs, les kits et les machines de séquençage utilisés.
Préparation des échantillons : Des échantillons de sang total, des cellules mononucléées du sang périphérique (PBMC), des tissus fraîchement congelés, des échantillons fixés au formol et inclus dans la paraffine (FFPE), des échantillons de plasma et des cellules de liquide amniotique, entre autres, peuvent être utilisés pour le séquençage de l'exome. L'ADN est extrait des échantillons biologiques à tester et fragmenté par des méthodes physiques ou des processus enzymatiques. La disruption physique comprend le cisaillement, la sonication et le cisaillement dynamique des fluides, où le cisaillement et la sonication servent de méthodes principales de fragmentation de l'ADN. Les processus enzymatiques impliquent généralement l'utilisation de nucléases ou de transposases, qui fragmentent l'ADN en morceaux plus petits. Les nucléases induisent la rupture des liaisons phosphodiester au sein des acides nucléiques, entraînant la fragmentation de l'ADN.
Capture et enrichissement des exons : Lors de la capture et de l'enrichissement de l'exome, les exons sont enrichis de manière sélective à l'aide de la technologie de capture de l'exome. Le concept fondamental derrière l'enrichissement ciblé concerne l'exploitation des différences physico-chimiques entre le composé cible et d'autres substances pour faciliter leur séparation. Après l'isolement de l'exome du reste du génome, plusieurs étapes de lavage sont nécessaires pour obtenir un exome plus pur. Bien que l'eau distillée soit généralement utilisée pour éluer les cibles, certains kits spécialisés peuvent nécessiter des solutions d'élution spécifiques.
Construction de bibliothèque : La construction de bibliothèques implique la réparation des extrémités des fragments d'ADN exoniques enrichis, l'attachement de connecteurs et l'amplification des bibliothèques pour convertir les fragments d'ADN exoniques enrichis en bibliothèques de séquençage, une étape qui fournit des modèles d'ADN suffisants pour le séquençage ultérieur.
Tableau 1. Kits courants d'enrichissement ciblé pour le séquençage.
| Kits | Région ciblée | Entrée d'ADN génomique requise | Ajout d'adaptateur | Longueur de la sonde (m) |
| Agilent SureSelect XT2 V6 Exome | 60 Mo | 100 ng | Ligation | 120 |
| Agilent SureSelect XT2 V5 Exome | 51 Mo | 100 ng | Ligation | 120 |
| Panneau Exome IDT xGEN | 39 Mo | 500 ng | Ligation | non décrit |
| Illumina Nextera Rapid Capture Exome élargi | 62 Mo | 50 ng | Transposase | 95 |
| Roche NimblegenSeqCap EZ Exome v3.0 | 64 Mo | 1 µg | Ligation | 60 - 90 |
Séquençage : Avec les avancées des techniques de séquençage, le séquençage de nouvelle génération (NGS) est de plus en plus utilisé pour le séquençage de l'exome. Le principe du NGS consiste à coupler l'échantillon d'exome à une base appropriée (comme le flowcell dans l'Illumina Hiseq et les billes magnétiques dans Roche-454), suivi d'une duplication PCR in situ pour garantir l'amplification du signal à chaque cycle. Le ddNTP est examiné après chaque cycle d'extension, et la séquence complète est finalement compilée à l'aide d'un algorithme bioinformatique. L'efficacité élevée et les capacités de débit rendent le NGS une option attrayante pour le séquençage à haut débit.
En dehors du séquençage de nouvelle génération (NGS), les technologies de séquençage de troisième génération évoluent rapidement et possèdent des efficacités qui surpassent largement celles du NGS. Le séquençage à molécule unique, une caractéristique distinctive du séquençage de troisième génération, peut réduire de manière spectaculaire le temps et le coût associés au séquençage de l'ensemble du génome à quelques minutes. Des entreprises telles que PacificBio et Oxford Nanopore ont démontré l'efficacité de leurs méthodes, qui pourraient potentiellement déclencher une révolution dans le domaine du séquençage de l'exome.
Tableau 2. Méthodes courantes utilisées pour le séquençage de nos jours.
| Méthodes | Société | Génération | Longueur de lecture | Précision | Lectures par exécution | Temps par course |
| semi-conducteur ionique | Ion Torrent | deuxième génération | Jusqu'à 600 pb | 99,60 % | jusqu'à 80 millions | 2 heures |
| Pyroséquençage (454) | Roche | deuxième génération | 700 pb | 99,90 % | 1 million | 24 heures |
| Séquençage par synthèse | Illumina | deuxième génération | 75-300 pb | 99,90 % | 1 million à 3 milliards | 1 à 11 jours |
| Séquençage par ligation (SOLiD) | ABI | deuxième génération | 50+35 ou 50+50 pb | 99,90 % | 1,2 à 1,4 milliard | 1 à 2 semaines |
| Séquençage par nanopore | Technologies Oxford Nanopore | 3ème génération | jusqu'à 500 Ko | 92–97 % (lecture unique)* | dépendant de la longueur de lecture sélectionnée par l'utilisateur | 1 minute à 48 heures |
| Séquençage en temps réel à molécule unique | Pacific Biosciences | 3ème génération | 30 000 ans avant le présent | 87 % (lecture unique)* | 10 à 20 milliards | 0,5-20 heures |
Analyse des données : Le processus d'analyse des données implique l'élimination des lectures de faible qualité lors du séquençage grâce au contrôle de qualité, l'alignement des lectures de haute qualité avec le génome de référence, la quantification des polymorphismes nucléotidiques simples (SNP), des insertions et des délétions (Indels), et des variations du nombre de copies (CNV), suivi de l'annotation, du dépistage, de l'analyse et de la validation. L'analyse des données constitue un point critique dans le séquençage de l'exome, englobant l'évaluation et le traitement de la qualité des données de séquençage, l'alignement des lectures de séquençage au génome de référence et l'identification des mutations génétiques au sein des échantillons. Les mutations génétiques détectées doivent être annotées, y compris la détermination de la fonction de la mutation, sa signification pathologique et son impact potentiel.
Figure 2. Le pipeline typique d'appel de variants.
Coût-efficacité : Comparé à Séquençage du génome entier, Séquençage de l'exome complet offre une couverture plus approfondie, une plus grande précision et est plus économiquement efficace.
Profondeur de séquençage élevée : La profondeur de séquençage peut atteindre plus de 120x.
Haut débit : Il répond aux besoins de recherche de plusieurs régions cibles à partir d'un grand nombre d'échantillons.
Haute précision : Avec une couverture de séquençage approfondie, la précision des données est élevée et efficace.
Séquençage de l'exome entier (WES) trouve des applications dans divers domaines de la recherche biomédicale, y compris l'étude des maladies monogéniques. maladies héréditaires, maladies complexes, mutations somatiques dans les tumeurs, découverte des oncogènes et des gènes suppresseurs de tumeurs, et avancement des initiatives de médecine personnalisée.
Les tumeurs, étant des maladies complexes provoquées par de multiples mutations génétiques, peuvent être efficacement comprises avec l'aide de séquençage de l'exome completCela permet aux scientifiques et aux cliniciens de découvrir des variations dans les gènes liés aux tumeurs afin d'obtenir un diagnostic et un pronostic précis de la tumeur. Cela inclut principalement la recherche sur les gènes pilotes, le sous-typage moléculaire des tumeurs, la recherche sur les métastases récurrentes et la médication sur mesure pour les tumeurs individuelles.
Les troubles génétiques proviennent souvent de mutations génétiques, qui se produisent fréquemment dans les régions exoniques qui codent des protéines. Les méthodes traditionnelles de détection des mutations nécessitent une enquête approfondie sur les gènes liés à la maladie un par un, ce qui est chronophage, laborieux et nécessite une taille d'échantillon substantielle. Cependant, le séquençage de l'exome atténue ces inconvénients en permettant l'examen simultané de plusieurs gènes de la maladie, ce qui améliore considérablement l'efficacité et la précision de la détection. En appliquant le séquençage de l'exome (WES), nous pouvons séquencer toutes les régions exoniques nécessaires pour coder des protéines, identifiant ensuite les mutations génétiques ou les loci polymorphes liés à l'apparition de la maladie. Cela facilite un diagnostic et un traitement précis des troubles génétiques.
Figure 3. WES et impact de ses conséquences génétiques sur la santé publique humaine. (Rabbani B et al., 2014)
Le séquençage de l'exome (WES) suscite un intérêt considérable pour les applications cliniques, principalement parce qu'il englobe les régions exploitables d'un génome. L'objectif principal est d'identifier les variations au sein des régions exoniques et de déterminer les mutations causales des maladies ou des variants pathogènes. L'intersection de l'analyse des grandes données et du WES stimule des avancées dans la médecine personnalisée sous de nombreuses dimensions.
Si vous êtes intéressé par nos services de génomique, n'hésitez pas à contacter nos scientifiques. Nous sommes plus qu'heureux de vous aider. En plus de séquençage génomique, nous proposons également des services incluant transcriptomique, épigénomique, génomique microbienne, et Séquençage SMRT de PacBio.
Références :