Construction de bibliothèques pour le séquençage de nouvelle génération (NGS)

Aperçu rapide

01 Qu'est-ce que la construction de bibliothèque en séquençage de nouvelle génération (NGS) ? 02 Méthodes de préparation de bibliothèques NGS 03 Construction de bibliothèque d'ADN Illumina 04 Construction d'une bibliothèque de méthylation de l'ADN simple brin 05 FAQ : Créer une bibliothèque de séquençage

Séquençage de nouvelle génération (NGS), également reconnu sous le nom de séquençage à haut débit, a évolué à partir des technologies PCR et des microarrays géniques. Cette méthode de séquençage innovante introduit des terminaisons de terminaison réversibles, permettant au séquençage de se produire simultanément avec la synthèse. La détermination des séquences d'ADN est réalisée en capturant les bases nouvellement ajoutées avec des marqueurs spécifiques pendant le processus de réplication de l'ADN. Dans une avancée significative, Roche a introduit le premier séquenceur de nouvelle génération, le Roche 454, en 2005, marquant le début de l'ère du séquençage à haut débit. Et Illumina devient la plateforme de séquençage la plus populaire.

Cette technologie de séquençage revêt une importance capitale dans la recherche en sciences de la vie et en pharmacie en raison de sa capacité à générer rapidement des données substantielles avec une longueur de lecture relativement courte. Dans le flux de travail du séquençage de nouvelle génération (NGS), la première étape consiste à construire l'ADN de l'échantillon, suivie des tests en machine et de l'analyse subséquente. La construction de la bibliothèque de séquençage est une étape cruciale qui détermine le succès de NGS La qualité de l'ADN et des produits de construction de bibliothèques influence de manière significative des paramètres tels que le taux de conversion de la bibliothèque, la profondeur de séquençage, la complexité et l'homogénéité. Par conséquent, des mesures de contrôle de qualité strictes sont impératives tout au long du processus de séquençage.

Qu'est-ce que la construction de bibliothèques en séquençage de nouvelle génération (NGS) ?

Une bibliothèque d'ADN englobe une série d'étapes préparatoires pour les échantillons d'ADN/ARN avant le séquençage. Les échantillons d'acides nucléiques originaux ne peuvent pas être utilisés directement pour le séquençage ; seuls les échantillons traités peuvent répondre aux exigences de la plateforme de séquençage. Ces préparations impliquent des tâches telles que l'introduction de joints d'extrémité essentiels aux échantillons d'ADN, une condition préalable au séquençage. En cas de volume d'échantillon insuffisant, l'amplification par PCR est utilisée pour satisfaire aux critères de la machine. La construction de la bibliothèque d'ADN constitue la base de séquençage de nouvelle génération technologie des bibliothèques.

Contrôle de qualité dans le flux de travail de préparation de bibliothèques NGS peut être un article utile pour le séquençage et l'analyse.

Represents the steps involved in Next Generation Sequencing Représente les étapes impliquées dans le séquençage de nouvelle génération : La préparation et l'amplification de la bibliothèque, le séquençage et l'analyse des données sont les trois étapes importantes impliquées dans le NGS. (Selvakumar et al., 2022)

La construction de bibliothèques d'ADN est au cœur de séquençage de nouvelle génération technologie des bibliothèques. Cela implique l'étape cruciale d'ajout de joints terminaux aux fragments examinés. Diverses méthodes existent pour la construction de bibliothèques d'ADN, classées en fonction de leurs approches de formation de joints :

Construction de jonction de clonage TA
Méthode Swift
Construction de bibliothèque de transposases
Construction d'amplicons PCR
Construction de bibliothèque de jonction à extrémité plate

Les services de séquençage à haut débit et de construction de bibliothèques de CD Genomics permettent une analyse approfondie des génomes, des transcriptomes et des épigénomes. Plongez dans les subtilités de la construction de bibliothèques, une étape cruciale de ce processus, car elle garantit la génération de données de haute qualité essentielles pour une analyse génomique robuste.

Méthodes de préparation de bibliothèques NGS

Construction de bibliothèque de jonction TA

La construction de bibliothèques par clonage à l'aide de jonctions TA est actuellement la méthode la plus répandue pour la construction de bibliothèques. Le processus comprend les étapes suivantes :

Fragmentation de l'ADN génomique.
Réparation des extrémités de l'ADN fragmenté et ajout d'une queue A.
Fixation de l'adaptateur.
Amplification de la concentration d'échantillon par amplification PCR.

Cette technique nécessite la synthèse préalable de fragments cibles avec des adaptateurs à queue T et des extrémités à queue A, les reliant ensuite à des échantillons fragmentés via un clonage TA facilité par la ligase ADN.

Méthode Swift

La méthode de construction de bibliothèque par la méthode Swift présente des similitudes avec la méthode de construction de bibliothèque par clonage TA. Elle consiste à introduire des séquences de jonction P5 et P7 à chaque extrémité du fragment examiné. Après la réparation des extrémités, la jonction P7 est d'abord connectée à l'extrémité 3', suivie de la connexion de la jonction P5 à l'extrémité 5'. Ensuite, la concentration de l'échantillon est augmentée par amplification PCR.

Construction de bibliothèque de transposases

La pierre angulaire de la construction de bibliothèques de transposases repose sur le transposon Tn5, essentiellement un fragment d'ADN codant le gène de la transposase. La construction traditionnelle de bibliothèques implique la fragmentation de l'ADN, la réparation des extrémités, l'amplification de la bibliothèque et une purification en plusieurs étapes. Cependant, l'utilisation de Tn5 pour la construction de bibliothèques simplifie le processus, condensant plusieurs étapes en une seule réaction.

Le in vitro Les éléments transposables du transposon Tn5 utilisés pour la construction de bibliothèques comprennent la séquence terminale du transposon, l'ADN cible, la transposase (Tnp) et Mg2+ (activateur).

Construction de bibliothèque d'amplicons PCR

La méthode de construction de la bibliothèque d'amplicons utilise une réaction de PCR pour introduire des jonctions aux extrémités des fragments cibles, nécessitant seulement deux cycles de PCR et de purification pour obtenir la bibliothèque souhaitée. Dans un premier temps, des amorces contenant la séquence universelle sont associées à la région cible. Ensuite, les jonctions de séquençage sont reliées par une réaction de PCR lors de la deuxième étape.

Construction de bibliothèque à jonction à extrémité plate

La méthode des adaptateurs ligaturés à extrémité plate consiste à attacher des adaptateurs spécifiques aux extrémités de fragments d'ADN fragmentés. Cette approche suit une série d'étapes comprenant la fragmentation de l'échantillon d'ADN, la réparation des extrémités, la ligature des adaptateurs, la récupération sélective des fragments d'ADN, l'enrichissement par PCR de la bibliothèque et la purification du produit PCR. Le processus de séquençage pour la construction de bibliothèques avec des adaptateurs ligaturés à extrémité plate implique des diminutions transitoires du pH dans le microenvironnement, qui sont détectées et enregistrées par un électrode de pH pour faciliter les lectures de données.

Construction de bibliothèques d'ADN Illumina

Veuillez lire notre article : Séquençage de nouvelle génération (NGS) Illumina : Principes et flux de travail pour plus d'informations.

Fragmentation

La phase initiale de la construction de la bibliothèque consiste à résoudre les limitations de longueur de lecture des machines de séquençage. L'ADN extrait ne peut pas être séquencé directement en raison de ces limitations. Par conséquent, diverses méthodes, telles que la fragmentation ultrasonique et la digestion enzymatique, sont utilisées pour couper précisément l'ADN en fragments de longueurs appropriées. Bien que les méthodes mécaniques puissent entraîner une perte d'échantillons plus élevée et une complexité accrue, les méthodes enzymatiques, en particulier celles utilisant la transposase Tn5, sont préférées pour leur rapport coût-efficacité et leur simplicité. Le transposon Tn5, initialement identifié dans E. coli, comprend des composants clés tels que les séquences IS50, les séquences Outside End (OE), les séquences Inside End (IE) et les gènes de résistance aux médicaments.

Réparation/ajout de la queue A

Après la fragmentation, les extrémités de l'ADN peuvent présenter des caractéristiques plates ou inégales. À cette étape, les extrémités des fragments d'ADN sont modifiées, et une base A distinctive est ajoutée pour créer une extrémité collante pour l'attachement ultérieur du primer de jonction.

Les fragments d'ADN générés à l'étape précédente, présentant des extrémités collantes 5'/3' ou des extrémités plates, subissent une réparation des extrémités pour convertir toutes les extrémités collantes en extrémités plates. Pour le collage TA, la phosphorylation à l'extrémité 5' et l'ajout d'un "A" à l'extrémité 3' sont essentiels pour l'appariement complémentaire avec des jonctions possédant des extrémités collantes "T". Ce processus implique l'action collaborative de la T4 ADN polymérase, de la T4 polynucléotide kinase et de la Taq ADN polymérase.

DNA library preparation using a transposase-based method (Nextera) developed by Illumina. Préparation de bibliothèque d'ADN utilisant une méthode basée sur une transposase (Nextera) développée par Illumina. (Head et al., 2014)

La polymérase T4 ADN présente une activité de polymérase ADN 5'→3', synthétisant l'ADN dans la direction 5'→3' et aplanissant les extrémités proéminentes 5'. De plus, son activité exonuclease 3'→5' aplanit les extrémités proéminentes 3', transformant les fragments d'ADN avec des extrémités collantes en ADN à extrémités plates.
La kinase de polynucléotides T4 est essentielle pour catalyser le transfert du groupe γ-phosphate de l'ATP vers l'extrémité hydroxyle de l'extrémité 5' du brin d'oligonucléotide, préparant ainsi les jonctions pour l'étape de liaison suivante.
La Taq ADN polymérase présente une activité polymérase 5'→3' pour synthétiser l'ADN dans la direction 5'→3' et une activité désoxynucléotidyltransférase pour ajouter un nucléotide "A" à l'extrémité 3' du produit PCR. Ces processus complexes garantissent la préparation de fragments d'ADN avec des extrémités optimisées pour les étapes suivantes de la construction de bibliothèques d'ADN Illumina.

Jonctions

Les fragments d'ADN avec des queues A ajoutées présentent des extrémités A proéminentes, facilitant leur appariement complémentaire avec des jonctions portant des extrémités T. L'objectif principal de l'incorporation de jonctions est d'ajouter des étiquettes de bibliothèque et des séquences d'oligonucléotides qui complètent la plateforme de séquençage aux extrémités de l'ADN fragmenté.

Les jonctions jouent un rôle essentiel dans la bibliothèque, les jonctions de type Y de la plateforme Illumina étant largement utilisées dans le séquençage. Ces jonctions comprennent les séquences P5/P7, Index et Rd1/Rd2 SP. Les séquences P5/P7 s'associent aux séquences sur la puce de séquençage, ancrant les fragments pour les tests sur le Flowcell afin de compléter l'amplification en pont. L'Index permet de distinguer les différents échantillons dans la bibliothèque mixte de séquençage embarquée, et Rd1/Rd2 SP sert de région de liaison pour les amorces de séquençage Read1 et Read2. La ligation de jonctions implique généralement la T4 ADN ligase, qui répare les coupures à brin simple dans l'ADN à double brin et reconnecte les nucléotides adjacents. Dans la ligation de jonctions, les jonctions avec des extrémités collantes "T" et des extrémités collantes "A" peuvent être combinées sans couture, formant un brin double complet.

Amplification par PCR

En raison de la jonction ajoutée précédemment, une amplification directe est réalisée à l'aide d'amorces complémentaires à la jonction. Les extrémités non complémentaires des jonctions "Y" ajoutées précédemment nécessitent une étape intermédiaire avant le séquençage direct. Pour séquencer plusieurs échantillons simultanément, des index/barcodes peuvent être ajoutés pour différencier les différents échantillons. Cette étape aide non seulement à distinguer les différentes bibliothèques lors de l'analyse ultérieure des échantillons, mais introduit également des séquences d'oligonucléotides complémentaires au séquenceur aux deux extrémités par PCR, spécifiquement P5/P7.

4 Jalons dans la technologie de séquençage de l'ADN

Première percée : Lecture directe

Pré-lecture directe : La méthode de séquençage originale précédant la lecture directe impliquait des techniques telles que le clonage moléculaire, la PAGE et l'autoradiographie radiographique.
Méthode SBC : Une réaction de dégradation chimique utilisant des réactifs spécifiques pour dégrader directement les molécules d'ADN. Gilbert a reçu le prix Nobel de chimie en 1980 pour avoir inventé la méthode SBC.
Méthode SBS : Basée sur la réaction de synthèse enzymatique et la synthèse d'ADN, également connue sous le nom de Méthode de Sanger ou méthode de terminaison terminale de l'acide désoxyribonucléique double. Cette méthode présente des avantages tels que des réactifs non toxiques, une facilité d'opération, des résultats stables, une grande précision et une excellente reproductibilité.

Deuxième percée : L'automatisation

Pionniers du séquençage automatisé : Akiyoshi Wada, Wilhelm Ansorge.
La percée clé dans l'automatisation de la méthode SBS est survenue avec l'invention par Leroy Hood du séquenceur SBS automatisé à quatre couleurs fluorescentes. Cette innovation a joué un rôle crucial dans le soutien et le lancement du Projet Génome Humain (PGH).

Troisième percée : montée en puissance

L'émergence et l'amélioration de la technologie de séquençage par électrophorèse capillaire ont facilité l'augmentation d'échelle.
En 1998, ABI a introduit le séquenceur capillaire ABIPrism 3700 (ABI3700), permettant une montée en échelle directe de la technologie de séquençage. L'introduction subséquente de la série de séquenceurs MegaBACE a considérablement contribué à l'achèvement précoce du HGP.

Quatrième percée : Séquençage massivement parallèle

Cela représente un saut en avant substantiel, caractérisé par la capacité de séquencer l'ADN de manière massivement parallèle, ce qui permet une analyse rapide et simultanée de plusieurs fragments. L'une des caractéristiques clés du séquençage est sa contribution significative à la chute vertigineuse des coûts de séquençage.

FAQ : Créer une bibliothèque de séquençage

1. Quelles sont les étapes principales impliquées dans la construction d'une bibliothèque d'ADN ?

Les principales étapes de la construction d'une bibliothèque d'ADN comprennent :

Fragmentation et réparation des extrémités : Décomposer l'ADN en fragments gérables et réparer les extrémités pour garantir une ligation appropriée.
Ligation : Joindre les fragments d'ADN réparés à des adaptateurs ou des vecteurs pour le séquençage.
PCR (Réaction de polymérase en chaîne) : Amplification de l'ADN ligaturé pour augmenter la quantité en vue du séquençage.

Remarque : Les étapes de purification des billes sont omises ici.

De plus, la construction d'une bibliothèque à partir d'échantillons d'ARN implique une étape supplémentaire en raison de la nature de l'ARN. Elle nécessite la transcription inverse de l'ARN en ADN complémentaire (ADNc) avant de poursuivre le processus de construction de la bibliothèque mentionné ci-dessus. Cependant, le principe fondamental reste le même.

2. Pourquoi est-il nécessaire de fragmenter les échantillons d'ADNg avant la préparation de la bibliothèque NGS ?

Les séquenceurs Illumina lisent généralement des fragments dans une plage de 50 à 600 paires de bases, bien que cette plage puisse varier en fonction des puces de séquençage et des réactifs utilisés. En revanche, la plupart des échantillons d'ADN génomique humain intact (gDNA) dépassent 10 kilobases (kb) de longueur. Par conséquent, il est essentiel de décomposer ces grands fragments en morceaux plus petits pour réussir la construction de bibliothèques. Cette exigence de fragmentation est également valable pour la plateforme MGI.

Tableau 1 Longueurs de lecture de séquençage recommandées pour différentes applications sur les plateformes de séquençage Illumina

Séquençage de l'ADN
Application de séquençage	Longueur de lecture recommandée
Séquençage du génome entier	2 x 150 pb
Séquençage de l'exome complet	2 x 150 pb
Séquençage de capture ciblée	2 x 150 pb
Séquençage d'amplicons	La longueur totale de l'insert d'amplicon
Séquençage de novo	2 x 150 - 2 x 300 pb
Séquençage de l'ARN
Application de séquençage	Longueur de lecture recommandée
Analyse du transcriptome	2 x 75 pb
Profilage de l'expression génique	1 x 50 pb
Séquençage des petits ARN	1 x 50 pb

3. Pourquoi est-il essentiel d'incorporer un adaptateur après la fragmentation de l'ADN ? Quelle est son importance ?

Un adaptateur complet se compose de trois composants : des amorces universelles (P5 et P7), un index (i7/i5) et des amorces de séquençage (SP1 et SP2).

Amorces universelles faciliter la génération de clusters, tandis que les amorces de séquençage sont essentielles pour le séquençage de l'insert.
La séquence de jonction est déterminée par la plateforme de séquençage.
Indexation sert à différencier divers échantillons au sein du même lot de données de séquençage. Lors du séquençage de plusieurs échantillons sur la même puce (≥2), l'indexation est cruciale pour la discrimination des échantillons. Cependant, si un seul échantillon occupe une cellule de flux, l'indexation devient inutile, bien que les amorces universelles (P5&P7) et les amorces de séquençage (SP1&SP2) restent essentielles.

Remarque : Bien qu'il existe plusieurs méthodes pour ajouter un jonction complète à un échantillon, la séquence de jonction de la bibliothèque résultante reste cohérente. Nous avons l'intention de consacrer un article à l'élucidation des diverses structures et connexions des jonctions à l'avenir.

4. Pourquoi les bibliothèques PCR et sans PCR existent-elles, et laquelle est la plus répandue ?

La PCR sert de méthode pour augmenter le volume d'échantillon. Lorsque le volume d'entrée initial est insuffisant, la réplication PCR est nécessaire pour atteindre le volume de bibliothèque requis pour le séquençage. En revanche, un volume de départ suffisant permet de compléter la ligation des jonctions, la purification et le séquençage ultérieur sans amplification PCR.

Cependant, les bibliothèques PCR sont plus répandues pour plusieurs raisons :

Volume de départ insuffisant : La plupart des échantillons manquent du volume initial requis pour un onboarding direct.
Structure physique spécialisée : Les bibliothèques non amplifiées par PCR possèdent une jonction en forme de Y unique, ce qui peut introduire des biais dans les évaluations de qualité des bibliothèques.
Junctions résiduelles : Le rapport élevé de jonctions par rapport aux modèles et une purification inadéquate entraînent des jonctions résiduelles significatives, diminuant la qualité globale de la bibliothèque.

5. Pourquoi différents kits imposent-ils des exigences distinctes pour les volumes de départ des échantillons ?

La capacité de volume de départ d'un kit dépend principalement de la sensibilité, de la spécificité et de la stabilité de ses enzymes respectives. Les kits destinés à des volumes de départ plus faibles (par exemple, les échantillons de prélèvements nasopharyngés pour les tests COVID-19) nécessitent une efficacité enzymatique accrue, ce qui se traduit par des prix plus élevés. De plus, les kits conçus pour des échantillons à faible volume de départ possèdent souvent des brevets exclusifs et des avantages distincts, contribuant ainsi à leurs coûts élevés. contactez notre équipe technique pour plus d'informations.

Références :

Selvakumar, Sushmaa Chandralekha, et al. "CRISPR/Cas9 et séquençage de nouvelle génération dans le traitement personnalisé du cancer." Cancer moléculaire 21.1 (2022) : 83.
Head, Steven R., et al. "Construction de bibliothèques pour le séquençage de nouvelle génération : aperçus et défis." Biotechniques 56,2 (2014) : 61-77.

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.

Services associés