Aperçu complet du séquençage à longues lectures en 2024

Contexte du séquençage à longues lectures

la séquençage à lecture longue. séquençage à lecture longueComparé au séquençage à court reads, le séquençage à long reads peut générer directement des séquences > 10 kb à partir d'ADN natif, et il peut résoudre de manière fiable les séquences répétées et les grandes réarrangements génomiques pour permettre une détection plus précise et complète des molécules d'acide nucléique, identifiant des variants structurels et davantage de transcrits dans le génome. Maintenant, les approches de séquençage à long reads sont représentées par Pacific Biosciences et Oxford Nanopore technologies, et en raison de son débit élevé, de ses longues lectures et de sa capacité à détecter directement les modifications de méthylation des bases, elle est de plus en plus appliquée dans les domaines de l'assemblage de génomes, des marqueurs épigénétiques, de la transcriptomique et de la métagénomique.

Aperçu du séquençage à longues lectures

Quelles sont les méthodes de séquençage à longues lectures ?

Séquençage à lecture longue(LRS), également connu sous le nom de séquençage de troisième génération, ne nécessite pas de fragmentation de l'ADN pour le séquençage, permettant ainsi de couvrir des séquences répétitives entières et d'atteindre un assemblage continu et complet. Avec l'amélioration du débit et de la précision du séquençage, la technologie LRS peut déterminer des séquences continues allant de dizaines de milliers à plusieurs mégabases, et la maturité technologique augmente régulièrement.

Les principales méthodes de séquençage à lecture longue actuellement sont :

Séquençage par nanoporePionnier par Oxford Nanopore Technologies (ONT), le séquençage par nanopore consiste à faire passer des molécules d'ADN simple brin à travers un nanopore protéique intégré dans une membrane synthétique. Au fur et à mesure que l'ADN traverse le nanopore, il module le courant ionique, permettant la détection en temps réel des séquences de nucléotides. Le séquençage par nanopore offre portabilité, rapidité de traitement et la capacité de générer des lectures ultra-longues, ce qui le rend adapté à un large éventail d'applications, y compris le diagnostic clinique, la surveillance des maladies infectieuses et les études de métagénomique.

A schematic diagram of the mechanism of Oxford Nanopore Technologies (ONT) sequencing(Figure created using BioRender.com)Un diagramme schématique du mécanisme de séquençage des technologies Oxford Nanopore (figure créée avec BioRender.com)

Séquençage en temps réel à molécule unique (SMRT)Développé par Pacific Biosciences (PacBio), le séquençage SMRT utilise une approche unique de séquençage par synthèse. Il implique l'immobilisation de molécules uniques d'ADN polymérase sur une surface solide au sein de nanostructures de guide d'onde à mode zéro (ZMW). Chaque ZMW contient un petit puits où le séquençage a lieu. Pendant le séquençage, des nucléotides marqués par fluorescence sont ajoutés au modèle d'ADN lié à la polymérase, et les signaux lumineux émis sont détectés en temps réel. Cette méthode produit des lectures longues avec une grande précision et est particulièrement utile pour résoudre des régions génomiques complexes, telles que des séquences répétitives et des variations structurelles.

Principle of Single-molecule real-time (SMRT) sequencing from PacBio (Goodwin, McPherson and McCombie, 2016)Principe du séquençage en temps réel à molécule unique (SMRT) de PacBio (Goodwin, McPherson et McCombie, 2016)

Séquençage à lecture longue VS séquençage à lecture courte

Comment cela fonctionne-t-il ?

Séquençage à lecture longue et le séquençage à lecture courte ont des principes de fonctionnement différents en fonction de la longueur des fragments d'ADN.

La séquençage à long-reads fonctionne selon les étapes suivantes : d'abord, les fragments d'ADN sont décomposés en fragments plus grands allant de milliers à des dizaines de milliers de paires de bases de longueur, et des adaptateurs de séquençage sont attachés aux extrémités des fragments d'ADN. La bibliothèque d'ADN préparée est chargée sur la plateforme de séquençage à long-reads. Dans séquençage SMRTles molécules d'ADN polymérase sont immobilisées sur une surface solide à l'intérieur d'une nanostructure de guide d'onde à mode zéro (ZMW), permettant à des molécules d'ADN individuelles de se lier à l'ADN polymérase au sein du ZMW. Des nucléotides marqués par fluorescence sont ensuite ajoutés au modèle d'ADN et le signal lumineux émis est détecté en temps réel. Les signaux fluorescents sont convertis en séquences de nucléotides en observant leur timing et leur intensité. Dans Séquençage par nanoporeDes molécules d'ADN sont intégrées dans de minuscules nanopores protéiques dans une membrane synthétique. Lorsque l'ADN passe à travers le nanopore, il provoque des perturbations caractéristiques dans les courants ioniques circulant à travers le pore. Ces perturbations sont détectées et enregistrées sous forme de signaux électriques, qui sont ensuite convertis en séquences de nucléotides à l'aide d'algorithmes spécialisés. Ces séquences sont ensuite alignées sur un génome de référence ou soumises à un assemblage de novo pour identifier des variants génétiques, des réarrangements structuraux et d'autres caractéristiques génomiques.

Le processus de séquençage par lectures courtes étape par étape est le suivant : d'abord, les fragments d'ADN cibles sont fragmentés en plus petits morceaux, puis des adaptateurs de séquençage sont attachés aux extrémités des fragments d'ADN. Les fragments d'ADN traités sont fixés à des surfaces solides telles que des lames de verre ou des cellules de flux via des connecteurs. Les fragments d'ADN sont amplifiés en clusters identiques par amplification en pont ou génération de clusters. Chaque cluster représente un fragment d'ADN de l'échantillon original, et les séquences d'ADN dans chaque cluster sont ensuite lues simultanément à l'aide d'une plateforme de séquençage. Le séquençage Illumina est l'une des plateformes de séquençage par lectures courtes les plus couramment utilisées, qui utilise une approche de terminateur réversible. Des nucléotides marqués par fluorescence sont ajoutés aux clusters de fragments d'ADN. À mesure que chaque nucléotide est incorporé dans la chaîne d'ADN en croissance, son marquage fluorescent est imagé et enregistré, le marquage fluorescent est retiré après enregistrement, et le nucléotide suivant est ajouté. Plusieurs cycles sont effectués pour générer des lectures de séquences d'ADN. Les signaux fluorescents ou les séquences de nucléotides sont ensuite traités et convertis en un format numérique. Les courtes lectures de séquences sont ensuite comparées à un génome de référence ou réassemblées.

Quels sont les avantages et les inconvénients du séquençage à longues lectures et du séquençage à courtes lectures ?

What are the advantages and disadvantages of long-read sequencing and short read sequencing

<ul class="ullist"> <li>haute précision avec une bonne profondeur de couverture</li> <li>lectures longues qui peuvent aider à résoudre les ambiguïtés</li> <li>aucune amplification de l'ADN requise</li> <li>temps de réponse comparativement plus rapide</li> <li>longue durée d'exécution avec des difficultés de phasage</li> <li>l'équipement de séquençage est coûteux</li> <li>coûteux pour les petits laboratoires cliniques</li> <li>taux d'erreur historiquement plus élevé</li> </ul> <p>avantages du séquençage à courtes lectures</p> <p>avantages du séquençage à longues lectures</p> <p>inconvénients du séquençage à courtes lectures</p> <p>inconvénients du séquençage à longues lectures</p>

L'avantage du séquençage à longues lectures de CD Genomics

Longues lectures et haute précision

La technologie de séquençage propriétaire du cd-genome offre une précision et une résolution extrêmement élevées pour détecter avec précision des variants génomiques complexes.

Polyvalence et adaptabilité

La plateforme de séquençage à lecture longue de cd-genomic a un large éventail d'applications, adaptée à diverses utilisations allant de la recherche fondamentale au diagnostic clinique. Telles que les marqueurs épigénétiques, la transcriptomique, la métagénomique, etc.

Flux de travail rationalisé et évolutivité

Le flux de travail de séquençage à lecture longue de cd-genomic est conçu pour améliorer l'efficacité et l'évolutivité, permettant la collecte de données en temps réel et offrant un délai d'exécution plus rapide.

Le flux de travail du séquençage à lecture longue de CD Genomics

Préparation des échantillons

  • Extraction d'ADN : Extraire des échantillons d'ADN de haute qualité de l'organisme ou du tissu cible.
  • Préparation de la bibliothèque : Utilisez les protocoles propriétaires de cd-genomic pour fragmenter l'ADN en fragments plus grands allant de milliers à des dizaines de milliers de paires de bases de longueur, et sélectionnez des adaptateurs appropriés.

Séquençage

  • Chargement : Charger les bibliothèques de séquençage préparées sur la plateforme de séquençage à lecture longue cd-génomique.
  • Séquençage : Généré les séquences longues en temps réel en utilisant la technologie de séquençage avancée de cd-genomic.

Analyse des données

  • Analyse de base : Convertit les signaux électriques ou fluorescents bruts générés lors du séquençage en séquences de nucléotides.
  • Alignement de lecture : cartographie de séquences nucléotidiques longues séquencées à un génome de référence ou à un assemblage de novo, identification de variants génétiques et de réarrangements structurels.
  • Analyse des variantes : détecte et analyse les variantes génétiques, y compris les polymorphismes nucléotidiques simples (SNP), les insertions, les délétions et les variantes structurelles.
  • Annotation : annotation des variantes détectées.

Conclusion

Séquençage à lecture longue aide à dessiner des cartes du génome et du transcriptome, permettant la détection de l'ADN, la détection de grandes variations structurelles et la détection de la méthylation, jouant un rôle indispensable dans la recherche génomique. L'utilisation de plusieurs plateformes de séquençage pour une analyse complète des cibles est actuellement la principale méthode de séquençage utilisée et a obtenu de bons résultats. Cependant, améliorer la précision du séquençage long reste notre priorité. Avec l'amélioration continue de la précision de la technologie de séquençage à longues lectures, son rôle dans la recherche scientifique deviendra de plus en plus important.

Avec une technologie de séquençage à long lecture avancée et des services professionnels, CD Genomics s'engage à soutenir la recherche en génomique. Embrassez l'avenir de la génomique avec CD Genomics et embarquez pour un voyage de découverte et d'innovation.

Référence :

  1. Hu, T., N. Chitnis, D. Monos et A. Dinh (2021). "Technologies de séquençage de nouvelle génération : un aperçu." Hum Immunol 82(11) : 801-811.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut