Séquençage par nanopore pour la détection de variations structurelles, typage HLA et analyse de STR

Dans le domaine de la génétique humaine, la recherche basée sur le séquençage du génome entier sert de fondement à la capture d'informations essentielles sur les variations génomiques, y compris les polymorphismes nucléotidiques simples (SNP), les insertions et les délétions (InDels), les variants structurels (SV), les variations du nombre de copies (CNV), entre autres. Ces variations génomiques sont considérées comme des tâches fondamentales et des objectifs centraux dans l'investigation scientifique. Les technologies de séquençage à longues lectures, illustrées par Pacbio et Nanopore, avec leur caractéristique distinctive de générer de longues lectures, ont démontré une utilité étendue dans l'étude des génomes humains et non humains.

Qu'est-ce que le séquençage par nanopore ?

Le resequencement par nanopore est une technique de séquençage qui consiste à réaliser séquençage du génome entier sur des échantillons humains. En utilisant des lectures longues allant de 10 kb à 20 kb, ces séquences sont alignées et analysées par rapport au génome de référence humain. Ce processus permet une détection précise des variations génétiques, telles que les variations structurelles (SV) et les variations du nombre de copies (CNV), au sein des séquences d'ADN des échantillons comparées au génome de référence ou entre différents échantillons. Cette technologie répond aux limitations du resequencement de nouvelle génération dans la détection des variations de séquence de grands segments.

Pourquoi effectuer un resequencement par nanopore ?

L'exploration des SV et des CNV permet à cette technique de trouver des applications dans les analyses différentielles entre individus ou populations. Elle joue un rôle crucial dans les études liées à Antigène leucocytaire humain (HLA), Répétitions Courtes en Tandem (STRs), et d'autres aspects dans les domaines des maladies et des cancers. Le séquençage de troisième génération, avec ses avantages de lectures longues (capables de couvrir de grandes variations structurelles, des régions répétitives, un contenu élevé en GC, des régions hautement homologues et des régions hautement polymorphes) et l'absence d'amplification par PCR (évitant les erreurs introduites par l'amplification par PCR), a émergé comme une nouvelle stratégie pour explorer les informations sur la variation génétique dans le génome humain.

Détection de variantes :

Les variations structurelles génomiques (SV) font généralement référence à des variations structurelles de grands segments dépassant 50 pb, englobant divers types tels que les délétions (DEL), les insertions (INS), les duplications (DUP), les inversions (INV) et les variations du nombre de copies (CNV). Ces variations, qui se produisent à la fois au niveau individuel et au niveau de la population, propulsent la diversité et l'évolution du génome humain. En comparaison avec les polymorphismes de nucléotides uniques (SNP), les SV constituent une proportion plus élevée des variations totales et ont un impact plus large sur le génome. Une fois que des changements se produisent, ils exercent souvent des effets profonds sur les organismes vivants. De plus en plus de preuves indiquent l'association des SV avec de nombreuses maladies humaines, y compris les troubles neurodéveloppementaux, les maladies cardiovasculaires et les cancers. Par conséquent, une analyse systématique des SV dans le génome humain a des implications significatives pour la recherche biologique et clinique.

Cependant, la détection des SV reste un défi technologique particulièrement complexe. Tout d'abord, les SV eux-mêmes englobent une variété diversifiée de types, généralement classés en cinq catégories : insertions, suppressions, duplications, translocations et inversions. La nature distincte de ces cinq mutations introduit des variations notables dans les complexités de détection. Par exemple, les mutations de suppression sont relativement plus faciles à détecter, tandis que l'identification des mutations d'insertion ou de duplication pose de plus grands défis. Ensuite, certaines mutations de SV présentent des magnitudes substantielles, définies comme dépassant 50 paires de bases, certaines s'étendant à plusieurs centaines de kilobases. Pour de courts segments typiques du séquençage de nouvelle génération, cela représente un défi indéniable que les approches technologiques actuelles peinent à surmonter. De plus, les séquences répétitives comme les CNV posent des difficultés supplémentaires en raison de la longueur limitée des données de séquençage, les rendant également difficiles à traiter.

Utilisation de lectures longues Séquençage par nanopore La technologie élimine le besoin de jonction, permettant une couverture complète des variations structurelles et/ou des régions répétitives, tout en conservant des informations relatives à la polyploïdie. De plus, en scrutant les séquences des deux sources parentales, il devient possible de discerner précisément l'occurrence des variations structurelles (SVs). Cela, à son tour, fournit des données plus précises et raffinées pour étudier le rôle des variations structurelles dans les maladies, l'évolution et la diversité génétique. Ainsi, à l'heure actuelle, l'utilisation de fragments longs par nanopore se distingue comme la stratégie optimale pour la détection des variations structurelles.

Analyse des STRs:

Les répétitions en tandem courtes (STR) sont de brèves séquences d'ADN, généralement composées de 2 à 6 paires de bases (pb), présentes de manière répétitive à des positions fixes dans le génome. Les STR représentent environ 7 % de la séquence du génome humain et présentent un polymorphisme élevé, avec des longueurs variables observées chez différents individus. Des allèles anormalement allongés ou "étendus" des STR constituent une catégorie significative de variations pathogéniques au sein des populations. À ce jour, des expansions de STR dans plus de 40 gènes ont été établies comme causes de maladies héréditaires. La majorité de ces conditions se manifestent principalement par des symptômes neurologiques ou neuromusculaires, englobant des troubles tels que la maladie de Huntington (MH ; HTT), le syndrome de l'X fragile (SXF ; FMR1), les ataxies héréditaires (RFC1, FXN, etc.), la dystrophie myotonique (DMPK et CNBP), les canalopathies musculaires (CSTB, SAMD12, STARD7, etc.), ainsi que la démence frontotemporale et la sclérose latérale amyotrophique (SLA) liées à C9orf72.

Étant donné (i) la nature diverse et répandue des troubles d'expansion des répétitions en tandem courtes (STR), (ii) la multitude de gènes impliqués, (iii) la découverte continue de nouveaux gènes, (iv) la diversité en taille et en conformation de séquence des expansions STR pathogènes, et (v) les lacunes existantes dans notre compréhension fondamentale de leur biologie, il y a une demande croissante pour des méthodes de détection moléculaire améliorées pour les STR. Les techniques moléculaires établies (telles que le Southern blotting et la réaction en chaîne par polymérase amorcée par répétition, RP-PCR) sont relativement lentes, laborieuses, imprécises et nécessitent des tests individuels avec des amorces/probes spécifiques pour chaque STR distinct.

Cela devient problématique lorsque plusieurs expansions de STR différentes peuvent se manifester sous des phénotypes similaires (hétérogénéité de locus), posant un obstacle majeur à l'évaluation des gènes de STR nouvellement découverts. Le séquençage de nouvelle génération (NGS) présente une utilité dans l'analyse des expansions de STR. Cependant, la grande taille, la faible complexité de séquence et la forte teneur en GC de nombreuses expansions de STR pathogènes rendent leur analyse difficile via des plateformes de NGS à lecture courte (comme Illumina). Par conséquent, il existe une nécessité croissante de méthodologies raffinées pour la détection moléculaire des STR.

Séquençage par nanopore et Séquençage pacifique, tous deux englobant séquençage à lecture longue les technologies sont applicables pour le typage génétique de grandes et complexes expansions d'ADN répétitif (STR). Ces méthodologies facilitent une couverture homogène des régions de faible complexité au sein du génome, sans biais de GC. Un autre avantage de ces technologies réside dans l'analyse simultanée de la méthylation de l'ADN à des loci répétitifs. Ainsi, l'utilisation de données de troisième génération à longues lectures pour la détection des STR présente des avantages distincts.

Pathogenic STR sites with ONTSites STR pathogènes avec ONT

Typage HLA :

L'Antigène Leucocytaire Humain (HLA), situé sur le bras court du chromosome 6 dans le génome humain, comprend une série de loci génétiques étroitement liés. Classé en trois catégories principales—Ⅰ, Ⅱ et Ⅲ—le HLA se distingue principalement en fonction des caractéristiques structurelles, fonctionnelles et de distribution cellulaire de ses produits géniques. Le typage des gènes de classe Ⅰ et Ⅱ revêt une importance significative dans les applications cliniques.

L'HLA présente une caractéristique de polymorphisme élevé, par laquelle les cellules immunitaires distinguent le soi du non-soi en reconnaissant l'HLA, en faisant la carte d'identité génétique des humains. Étroitement lié au système immunitaire du corps, le typage HLA trouve ses principales applications dans des domaines tels que la médecine de transplantation, la recherche sur les maladies liées au système immunitaire, les réponses aux médicaments et les transfusions de plaquettes. Étant donné la nature difficile du typage précis en raison de ses caractéristiques polymorphes, la caractérisation précise des gènes HLA a constamment posé un casse-tête de recherche et une direction ardemment poursuivie par diverses technologies de séquençage.

Ces dernières années, les technologies de séquençage à haut débit, tirant parti de leurs avantages en termes de débit, de caractérisation génomique complète ou exhaustive, de réduction des délais de traitement et de diminution de l'ambiguïté dans la détermination des séquences, ont remplacé le séquençage de Sanger comme référence en matière de typage à haute résolution de l'Antigène Leucocytaire Humain (HLA). Cette transition présente un avantage significatif par rapport aux méthodes de typage conventionnelles.

Le Séquençage par nanopore La plateforme a démontré des performances exceptionnelles dans la génération de longues lectures (des milliers ou des millions de paires de bases). En utilisant la stratégie "long amplicon, longue lecture", elle élimine avec succès le besoin de fragmentation de l'ADN lors de la préparation des bibliothèques de séquençage HLA. Simultanément, elle optimise l'identification des variations éloignées s'étendant sur des milliers de paires de bases. Cette plateforme atteint une cohérence et une précision remarquables, largement considérée comme une solution rapide et rentable pour le typage HLA.

Comparison of workflows by traditional NGS and nanopore sequencing.Comparaison des flux de travail entre le séquençage NGS traditionnel et le séquençage par nanopore.

Références :

  1. Chang Liu a., Xiao Yang b,1, Brian F Duffye, Jessica Hoisington-Lopezd, MariaLynn Crosby'Rhonda Porche-Sorbet, Katsuyuki Saito e, Rick Berry,, Victoria Swamidass', Robi D. Typage HLA haute résolution par des lectures longues à partir des cellules de flux Oxford Nanopore R10.3. Mitra Immunologie Humaine 2021
  2. Igor Stevanovski et al., Diagnostic génétique complet des troubles d'expansion de répétitions en tandem avec séquençage nanopore ciblé programmable. Sci. Adv.8,eabm5386(2022).
  3. Liu C. Un long chemin vers un typage HLA rapide et haute résolution : La perspective des nanopores. Hum Immunol. Juil 2021;82(7):488-495.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut