Construction de bibliothèques pour le séquençage de nouvelle génération (NGS)
La construction de la bibliothèque est l'étape la plus sujette à variabilité dans le flux de travail NGS et la principale cause d'échecs de séquençage. Une bibliothèque bien construite avec des paramètres optimisés—méthode de fragmentation, rapport molaire des adaptateurs, protocole de sélection de taille et nombre de cycles d'amplification—peut faire la différence entre un projet qui fournit des données prêtes pour publication dès le premier essai et un autre qui nécessite des dépannages répétés et un re-séquençage.
Le coût d'une construction de bibliothèque suboptimale va au-delà des dépenses directes en réactifs. Une bibliothèque avec un contenu excessif de dimères d'adaptateurs gaspille des lectures de séquençage ; celle avec trop de duplicats PCR réduit la profondeur de couverture effective ; une bibliothèque mal sélectionnée par taille produit des taux de mappage plus faibles. Lorsque ces inefficacités s'accumulent dans un projet multi-échantillons, la perte de données cumulative peut être substantielle, équivalente à la perte de lanes ou de cellules de flux entières en capacité de séquençage. Pour un projet typique de WGS de 96 échantillons à 30× de couverture, une perte de 20 % des lectures utilisables en raison de problèmes de qualité de la bibliothèque se traduit par environ 0,5 à 1 To de données de séquençage gaspillées et des dizaines de milliers de dollars en coûts de séquençage non récupérables.
Ce guide est rédigé pour les chercheurs qui comprennent déjà les étapes de base de la construction de bibliothèques, mais qui ont besoin d'orientations quantitatives sur l'optimisation des paramètres. Il couvre les principaux paramètres ajustables à chaque étape du flux de travail, les compromis associés à chaque choix et les métriques de contrôle de qualité qui distinguent une bonne bibliothèque d'une bibliothèque ratée.
L'accent est délibérément pratique : après avoir lu ce guide, vous devriez être en mesure de justifier votre choix de méthode de fragmentation, de calculer un rapport molaire approprié entre l'adaptateur et l'insertion, de sélectionner le bon rapport de billes SPRI pour la taille de fragment cible et d'interpréter un tracé de Bioanalyzer pour déterminer si votre bibliothèque passe le contrôle de qualité.
Les paramètres discutés dans ce guide sont des points de départ, et non des règles fixes. Chaque laboratoire, type d'échantillon et plateforme de séquençage peut nécessiter des ajustements mineurs à ces valeurs recommandées. L'approche la plus efficace consiste à établir une base en utilisant les paramètres recommandés, puis à titrer les variables clés (cycles PCR, ratios de billes) à travers de petites expériences pilotes pour déterminer les réglages optimaux pour votre flux de travail et type d'échantillon spécifiques.
Le flux de travail principal en un coup d'œil
Chaque flux de travail de construction de bibliothèque Illumina suit la même séquence d'étapes, quel que soit le kit ou le protocole spécifique ou le type d'échantillon de départ :
- FragmentationL'ADN est fragmenté en morceaux de taille cible.
- Réparation de fin et A-tailingLes extrémités des fragments sont émoussées, phosphorylées et dotées d'une queue A.
- Ligation d'adaptateursDes adaptateurs de séquençage sont ligaturés aux fragments.
- Nettoyage et sélection de tailleLes adaptateurs et fragments non incorporés en dehors de la plage cible sont éliminés à l'aide de billes magnétiques SPRI.
- Amplification de bibliothèqueL'amplification par PCR augmente le rendement de la bibliothèque (les méthodes sans PCR omettent cette étape).
- Contrôle de qualité de la bibliothèqueLa bibliothèque finale est quantifiée et vérifiée pour sa qualité.
Les étapes clés du processus de construction de bibliothèque Illumina—fragmentation, réparation des extrémités, ligature des adaptateurs, nettoyage, amplification et contrôle de qualité—peuvent être visualisées comme un processus linéaire. L'ADN d'entrée entre à gauche, passe par chaque étape de transformation et sort à droite sous forme de bibliothèque prête à être séquencée. La qualité de la bibliothèque finale dépend de l'effet cumulatif des choix de paramètres à chaque étape, les étapes antérieures ayant le plus grand impact car les erreurs se propagent en avant à travers le flux de travail.
Chacune de ces étapes dispose de paramètres ajustables qui affectent considérablement la qualité finale de la bibliothèque. Les sections suivantes fournissent des conseils quantitatifs pour chaque choix de paramètre.
Figure 1. Flux de travail de construction de bibliothèque Illumina en six étapes — de la fragmentation de l'ADN au contrôle qualité final
Légende : Le flux de travail de construction de bibliothèque Illumina en six étapes montrant la progression linéaire de la fragmentation à la réparation des extrémités, la ligature des adaptateurs, la sélection de taille, l'amplification et le contrôle qualité final, avec des erreurs en phase initiale se propageant à travers le processus.
Fragmentation — Comparaison des approches mécaniques, enzymatiques et de tagmentation
La fragmentation est le premier paramètre variable dans le flux de travail de construction de bibliothèques et celui qui a un impact mesurable sur la qualité des données en aval. Trois approches sont disponibles, chacune avec des caractéristiques distinctes qui affectent l'uniformité de la couverture, la reproductibilité et la flexibilité d'entrée.
Fragmentation mécanique utilise l'énergie acoustique (Covaris) ou la nébulisation pour fragmenter l'ADN. Le processus est purement physique—aucune enzyme n'est impliquée—ce qui signifie qu'il produit essentiellement aucun biais dépendant de la séquence. Cela fait de la fragmentation mécanique la méthode préférée pour les projets de séquençage génomique complet (WGS) où une couverture uniforme à travers toutes les régions génomiques, y compris les promoteurs riches en GC et les introns pauvres en GC, est essentielle. Les compromis sont un coût d'instrumentation plus élevé, un temps de traitement plus long et un débit plus faible par rapport aux méthodes enzymatiques.
Fragmentation enzymatique utilise un cocktail de nucléases (typiquement NEBNext Ultra II ou KAPA HyperPlus) pour introduire des cassures double-brin. La fragmentation basée sur des enzymes est plus évolutive que le cisaillement mécanique et fonctionne sur une plage d'entrée plus large, allant de quantités sub-nanogrammes à plusieurs microgrammes. Le profil de biais dépend de la formulation de l'enzyme : certains mélanges d'enzymes produisent une qualité proche de celle du mécanique avec un débit significativement plus élevé.
Tagmentation (basée sur Tn5) utilise une transposase Tn5 hyperactive qui fragmente simultanément l'ADN et insère des séquences d'adaptateurs en une seule réaction. Cela réduit le temps de manipulation d'environ 30 minutes à moins de 5 minutes et fonctionne avec aussi peu que 1 ng d'ADN d'entrée. Le compromis est que Tn5 présente un biais mesurable dans les régions à faible GC, où la couverture peut chuter à 60-70 % de la moyenne du génome. La tagmentation est mieux adaptée aux applications où la rapidité et un faible apport sont prioritaires par rapport à l'uniformité absolue de la couverture.
| Paramètre | Mécanique (Covaris) | Enzymatique | Tagmentation (Tn5) |
|---|---|---|---|
| Plage d'ADN d'entrée | 50 ng – 5 µg | 0,5 ng – 1 µg | 1–50 ng |
| biais GC | Le plus bas | Faible à modéré | Modéré (régions à faible GC) |
| Reproductibilité (CV) | <10 % | 10–20 % | 15–25 % |
| Temps pratique | 10–15 min (plus instrument) | 5 à 10 minutes | 2 à 5 minutes |
| Le mieux adapté pour | WGS, échantillons de haute valeur | Usage général, FFPE, cfADN | Faible apport, dépistage rapide, génomes bactériens |
Logique de sélectionPour les projets de séquençage génomique (WGS) où une couverture uniforme à travers le contenu en GC est critique, la fragmentation mécanique produit le biais le plus faible. Pour les flux de travail polyvalents traitant des types d'échantillons divers, la fragmentation enzymatique offre le meilleur équilibre entre commodité et qualité. La tagmentation est idéale pour les applications à faible entrée ou à haut débit où la vitesse est priorisée par rapport à l'uniformité de couverture.
Lors de la sélection d'une méthode de fragmentation, l'application en aval dicte le choix approprié. Par exemple, Projets de séquençage d'ARN utilisez la fragmentation de l'ADNc induite par la chaleur plutôt que l'une des trois méthodes de fragmentation de l'ADN, rendant l'étape de fragmentation fondamentalement différente des flux de travail de bibliothèque d'ADN.
Contrôle de la qualité de la fragmentationAvant de procéder à la réparation et à la ligature, il est conseillé de vérifier la distribution de la taille des fragments à l'aide d'un Bioanalyzer ou d'un TapeStation. Le tracé doit montrer une distribution unimodale centrée sur la taille cible. Une distribution bimodale ou un pic large s'étendant sur plus de 500 pb indique des conditions de fragmentation sous-optimales et peut nécessiter un ajustement du temps de cisaillement ou de la concentration enzymatique avant de poursuivre le reste du flux de travail.
Les chercheurs planifiant des projets à grande échelle peuvent tirer parti de services de séquençage du génome entier où la fragmentation et la construction de bibliothèques sont optimisées pour chaque type d'échantillon.
Figure 2. Comparaison des méthodes de fragmentation — profils de biais de couverture en fonction du contenu en GC pour les approches mécaniques, enzymatiques et de tagmentation
Légende : Profils de biais de couverture comparative selon le contenu en GC pour trois méthodes de fragmentation montrant que la fragmentation mécanique produit la couverture la plus uniforme, la fragmentation enzymatique avec un biais faible à modéré, et la tagmentation avec un biais mesurable dans les régions à faible GC.
Optimisation du rapport molaire de ligature d'adaptateur
Le rapport molaire entre les adaptateurs et les fragments d'ADN d'insertion est l'un des paramètres les plus souvent mal optimisés dans la construction de bibliothèques. Si vous vous trompez, vous produisez soit des dimères d'adaptateurs (trop d'adaptateurs), soit des bibliothèques mal étiquetées (trop peu d'adaptateurs). Le rapport optimal dépend de la concentration des extrémités de fragments pouvant être ligaturées, qui est déterminée à la fois par la masse d'ADN d'entrée et la taille moyenne des fragments. Une masse donnée de fragments courts a plus d'extrémités par unité de masse que la même masse de fragments longs, donc le rapport molaire doit tenir compte du nombre d'extrémités disponibles.
Pour la construction de bibliothèques Illumina standard, le rapport molaire recommandé entre les adaptateurs et les inserts se situe dans une plage de 10:1 à 50:1, en fonction de la quantité d'entrée :
- >500 ng d'entrée → ratio de 10:1 à 20:1 (efficacité de ligation suffisante, risque de dimères minimal)
- 100–500 ng d'entrée → ratio de 20:1 à 30:1
- 10–100 ng d'entrée → ratio de 30:1 à 50:1 (un ratio plus élevé est nécessaire pour compenser la probabilité de collision plus faible)
- <10 ng d'entrée → ratio de 50:1 à 100:1 ; le dimère d'adaptateur devient un risque significatif, et des kits spécialisés à faible entrée avec des adaptateurs en boucle de tige sont recommandés par rapport aux adaptateurs en Y standard.
Adaptateurs en Y vs. adaptateurs en boucle de tigeLes adaptateurs Y standards ont deux bras non complémentaires qui créent une structure en fourche. Lors de la ligation, les deux bras peuvent participer aux événements de ligation, et en l'absence d'insertion, les deux bras peuvent se lier entre eux pour former des dimères d'adaptateurs. Les adaptateurs en boucle-stem utilisent une structure en épingle à cheveux qui empêche la ligation entre adaptateurs, réduisant la formation de dimères de 50 à 80 % par rapport aux adaptateurs Y. Pour la construction de bibliothèques à faible entrée où les dimères d'adaptateurs sont le principal mode de défaillance, les adaptateurs en boucle-stem offrent une amélioration significative de la qualité.
La contamination par des dimères d'adaptateurs est détectable sur une trace de Bioanalyzer sous la forme d'un pic à 120–140 pb. À des niveaux inférieurs à 5 % de la masse totale de la bibliothèque, les dimères ont un impact minimal sur le séquençage ; au-dessus de 5 %, ils consomment des lectures de séquençage sans produire de données alignables, réduisant ainsi efficacement la sortie de données exploitables du projet. À des niveaux supérieurs à 20 %, les dimères d'adaptateurs deviennent l'espèce dominante dans la bibliothèque, et la course de séquençage produira principalement des lectures non alignables.
Figure 3. Rapport molaire d'adaptateur vs. rendement de la bibliothèque et formation de dimères — relation quantitative
Légende : Relation quantitative entre le rapport molaire adaptateur-à-insert et le rendement de la bibliothèque (bleu) et la formation de dimères d'adaptateurs (rouge), montrant la fenêtre de fonctionnement optimale entre 10:1 et 50:1 en fonction de la quantité d'ADN d'entrée.
Réparation des extrémités et A-Tailing — Une étape intermédiaire critique
Après fragmentation, les fragments d'ADN ont des extrémités hétérogènes : certains ont des surplombs 5' ou 3', certains sont à bout franc, et certains peuvent avoir des extrémités endommagées ou modifiées. L'étape de réparation des extrémités utilise une combinaison d'enzymes, typiquement la polymérase T4 de l'ADN (qui comble les surplombs 5' et enlève les surplombs 3') et la kinase des polynucléotides T4 (qui phosphoryle les extrémités 5') pour produire des fragments uniformes à bout franc, phosphorylés en 5'.
L'ajout d'adénosine suit immédiatement : une polymérase Taq ajoute un seul adénosine à l'extrémité 3' de chaque fragment droit. Ce surplomb A est complémentaire au surplomb T simple sur les adaptateurs Illumina standard, permettant une ligation efficace des adaptateurs tout en empêchant les adaptateurs de se lier entre eux.
Le paramètre clé dans la réparation des extrémités est le rapport enzyme-ADN. Une enzyme insuffisante laisse une fraction des extrémités non réparées ou non A-queue, réduisant le nombre de fragments pouvant se lier avec succès aux adaptateurs. Cela produit une bibliothèque avec un rendement final inférieur à celui attendu en fonction de la quantité d'ADN d'entrée. Un symptôme courant est une bibliothèque qui passe la quantification Qubit mais montre une faible densité de clusters sur la cellule de flux, indiquant que de nombreuses molécules quantifiées manquent de séquences d'adaptateurs fonctionnels aux deux extrémités.
La plupart des kits de construction de bibliothèques commerciales incluent des mélanges d'enzymes optimisés qui équilibrent ces activités. Si vous utilisez un protocole personnalisé, une réparation des extrémités de 30 minutes à 20°C suivie d'un ajout d'A de 30 minutes à 37°C constitue un point de départ standard qui peut être ajusté en fonction de la formulation enzymatique spécifique.
Impact de l'efficacité de l'A-tailing sur la ligature des adaptateurs en avalL'étape de l'A-tailing est parfois considérée comme une réaction enzymatique de routine, mais son efficacité détermine directement le rendement de ligation maximal possible. Si seulement 80 % des fragments reçoivent un A-overhang, l'efficacité de ligation théorique maximale chute de 50 % (si chaque paire de fragments est A-taillée) à environ 40 %. Cette réduction de 20 % des molécules effectives se traduit directement par un rendement final de bibliothèque inférieur. Pour les échantillons à faible entrée où chaque molécule compte, garantir un A-tailing complet est l'un des moyens les plus simples de maximiser le rendement de la bibliothèque sans cycles PCR supplémentaires. Analyse des données génomiques Le flux en aval est également affecté car des bibliothèques avec un rendement suboptimal peuvent produire une couverture insuffisante pour une détection fiable des variants.
Sélection de Taille — Un Guide Pratique sur le Ratio des Perles SPRI
La sélection de taille par billes SPRI (Solid Phase Reversible Immobilization) est la méthode la plus couramment utilisée pour éliminer les tailles de fragments indésirables des bibliothèques NGS. Le paramètre clé est le rapport volume de billes sur volume d'échantillon, qui détermine la plage de tailles de fragments retenus. Le principe est simple : à des rapports de billes plus élevés, les fragments plus petits sont capturés ; à des rapports de billes plus faibles, seuls les fragments plus grands se lient. En effectuant deux sélections successives, une fenêtre de taille cible précise peut être isolée.
Comprendre la relation entre le rapport de perlesLes billes SPRI fonctionnent en liant des fragments d'ADN en présence d'un agent de crowding (PEG). L'efficacité de liaison dépend de la taille : à une concentration donnée de PEG, les fragments plus grands se lient préférentiellement tandis que les fragments plus petits restent en solution. Un ratio de billes de 0,6× signifie que le volume des billes représente 60 % du volume de l'échantillon ; à ce ratio, les fragments de plus de 500 à 600 pb se lient aux billes et peuvent être capturés. Le surnageant contient des fragments en dessous de ce seuil, y compris la plupart des dimères d'adaptateurs. Un ratio de 0,8× capture des fragments de plus de 200 à 300 pb. La différence entre deux ratios consécutifs définit la fenêtre de taille.
| Plage de fragments cible | Premier rapport de perles (côté droit) | Ratio de la deuxième perle (côté gauche) | Application |
|---|---|---|---|
| 200–300 pb | 0,6 × (perles à jeter) | 0,8 × (retenir des perles) | Bibliothèques d'amplicons et d'ADNcf |
| 300–500 pb | 0,6 × (perles à jeter) | 0,7 × (retenir des perles) | Bibliothèques WGS et WES standard |
| 500–800 pb | 0,5× (perles à jeter) | 0,6 × (retenir des perles) | Bibliothèques à longs inserts, paires de mates |
Comment fonctionne la sélection de taille double faceLa première sélection (côté droit) utilise un faible rapport de billes pour lier de grands fragments et de longs dimères d'adaptateurs, qui sont éliminés avec les billes. Le surnageant contenant les fragments de taille cible est ensuite transféré dans un deuxième tube avec un rapport de billes plus élevé pour capturer les fragments souhaités. Le surnageant restant avec les courts fragments et les dimères d'adaptateurs est éliminé.
La précision de la sélection de taille dépend de la différence entre les deux ratios. Un écart plus large (par exemple, 0,5× à 0,8×) conserve une gamme de tailles plus large ; un écart plus étroit (par exemple, 0,6× à 0,7×) produit une distribution plus serrée mais un rendement total inférieur. Pour la plupart des applications de séquençage génomique complet (WGS), une sélection double face de 0,6×/0,7× offre un bon équilibre entre rendement et précision. Pour les applications nécessitant un contrôle de taille plus strict—comme la construction de bibliothèques d'ADNcf où les fragments cibles sont déjà courts—un écart plus étroit entre les deux ratios est approprié.
Nettoyage simple face vs. nettoyage recto-versoUn nettoyage unilatéral (ratio d'une perle, une étape de magnétisation) ne supprime que les fragments en dessous d'un seuil. C'est plus rapide, mais cela ne retire pas les gros fragments qui peuvent réduire la qualité des clusters sur la cellule de flux. Pour la plupart des protocoles de construction de bibliothèques, un nettoyage bilatéral est recommandé pour s'assurer que les gros et petits fragments sont éliminés.
Figure 4. Guide de ratio des billes SPRI — plages de sélection de taille double face pour différentes tailles de fragments cibles
Légende : Guide de sélection du ratio de perles SPRI montrant le protocole de sélection de taille double face pour trois plages de fragments cibles—200-300 pb, 300-500 pb et 500-800 pb—avec les paires de ratios de perles correspondantes et les contextes d'application.
Amplification PCR — Nombre de cycles vs. Taux de duplication
L'amplification par PCR est nécessaire pour la plupart des workflows de construction de bibliothèques, mais chaque cycle supplémentaire augmente le taux de duplication et introduit un biais. Le nombre de cycles optimal dépend principalement de la quantité d'ADN d'entrée.
La relation entre le nombre de cycles et la duplication n'est pas linéaire. Au cours des 4 à 6 premiers cycles, l'amplification se situe dans la phase exponentielle où chaque molécule de modèle produit une molécule fille unique, et la duplication est minimale. Après 8 à 10 cycles, la réaction commence à se saturer : les molécules amplifiées commencent à se réassocier et à former des duplicatas PCR, et le taux effectif de génération de nouvelles molécules uniques ralentit. Au-delà de 10 cycles, chaque cycle supplémentaire ajoute environ 5 à 10 % de duplicatas supplémentaires sans augmenter proportionnellement la complexité de la bibliothèque unique.
Une polymérase à haute fidélité (taux d'erreur <10⁻⁶ par base) est essentielle pour minimiser l'introduction de mutations artefactuelles lors de la construction de bibliothèques. La polymérase Taq standard introduit des erreurs à un taux d'environ 10⁻⁴ à 10⁻⁵ par base, ce qui peut produire des appels de variants faussement positifs dans des applications sensibles comme la détection de variants rares ou le séquençage unicellulaire. Les polymérases KAPA HiFi, Q5 et basées sur Pfu sont couramment utilisées dans la construction de bibliothèques NGS pour leur équilibre entre rendement, fidélité et biais d'amplification.
| ADN d'entrée | Cycles PCR recommandés | Taux de duplication attendu |
|---|---|---|
| >1 µg (pour PCR-free) | 0 (sans PCR) | <5 % |
| 100 ng–1 µg | 4–8 | 5 à 15 % |
| 10–100 ng | 8–10 | 10–20 % |
| 1–10 ng | 10–12 | 15–30 % |
| <1 ng | 12–14 | 20–50 % |
Pour les applications où le taux de duplication est critique (appel de variants WGS, détection de variants rares), la construction de bibliothèques sans PCR est l'approche préférée chaque fois que la quantité d'entrée le permet. Pour les échantillons à faible entrée où la méthode sans PCR n'est pas réalisable, l'utilisation d'une polymérase à haute fidélité et la limitation du nombre de cycles au minimum requis pour produire un rendement de bibliothèque suffisant est la meilleure stratégie pratique.
Pour les projets avec des exigences de couverture spécifiques, services de séquençage ciblé peut aider à optimiser les paramètres de construction de la bibliothèque pour la région d'intérêt cible.
Figure 5. Nombre de cycles PCR vs. taux de duplication — relation quantitative selon les niveaux d'ADN d'entrée
Légende : Relation quantitative entre le nombre de cycles PCR et le taux de duplication à différents niveaux d'ADN d'entrée, montrant la transition de phase exponentielle à saturation et la plage de nombre de cycles optimale pour chaque catégorie d'entrée.
Mettre en œuvre — Un exemple de planification de projet
Pour illustrer comment ces paramètres interagissent en pratique, considérons un chercheur planifiant un projet de séquençage du génome humain avec 48 échantillons. Les échantillons se composent de 40 échantillons d'ADN sanguin de haute qualité (avec un apport >1 µg chacun) et de 8 échantillons tumoraux FFPE (avec un apport d'environ 100 ng chacun, dégradés). Un seul protocole de construction de bibliothèque ne servira pas de manière optimale les deux types d'échantillons.
Pour les 40 échantillons d'ADN sanguin : la construction de bibliothèques sans PCR avec fragmentation mécanique et un nettoyage SPRI double face à 0,6×/0,7× est l'approche préférée. La méthode sans PCR élimine le biais de duplication et la fragmentation mécanique garantit une couverture GC uniforme. La taille cible des inserts est de 350-500 pb, et les bibliothèques finales devraient donner un rendement >5 nM par qPCR.
Pour les 8 échantillons FFPE : la construction de bibliothèque basée sur la PCR avec fragmentation enzymatique (qui inclut une étape de réparation des dommages de l'ADN) est requise. Le rapport entre les adaptateurs et l'insertion doit être augmenté à 30:1 pour compenser l'entrée effective plus faible due à l'ADN dégradé. Les cycles de PCR doivent être limités à 8-10 pour éviter l'amplification des artefacts. La fenêtre de sélection de taille doit être élargie (0,6×/0,8×) pour s'adapter à la distribution de taille des fragments plus large typique des échantillons FFPE.
Les deux ensembles de bibliothèques ne peuvent pas être regroupés dans le même couloir de cellule de flux sans ajuster les concentrations de chargement, car les bibliothèques sans PCR auront une molarité significativement plus élevée. Une quantification séparée par qPCR pour chaque ensemble, suivie d'un regroupement équimolaire au sein de chaque ensemble, garantit une densité de clusters cohérente entre tous les échantillons.
Cet exemple démontre pourquoi les paramètres discutés dans ce guide doivent être appliqués sur une base par type d'échantillon, et non comme un protocole universel. Services de séquençage NGS avec une expertise en construction de bibliothèques spécifiques à des applications, peut gérer ces ensembles de paramètres variables à travers des types d'échantillons divers au sein d'un même projet.
Construction de bibliothèques spécifiques à l'application — WGS vs. ARN vs. Épigénomique
Les paramètres optimaux de construction de la bibliothèque diffèrent considérablement en fonction de l'application en aval :
| Application | Fragmentation | Adaptateur | PCR | Contrôle qualité clé |
|---|---|---|---|---|
| Séquençage du génome entier | Mécanique ou enzymatique | Adaptateur Y standard | Sans PCR ou 4 à 8 cycles | Taux de duplication <15% |
| RNA-seq (ARNm) | Fragmentation de l'ADNc induite par la chaleur | Adaptateurs spécifiques à l'ARN | 10 à 14 cycles | RIN ≥ 7, efficacité d'épuisement de l'ARNr |
| Épigénomique (WGBS) | Enzymatique (compatible avec le bisulfite) | Adaptateurs méthylés | 8 à 12 cycles | Taux de conversion au bisulfite >99% |
| ChIP-seq | Enzymatique ou tagmentation | Adaptateur Y standard | 10 à 14 cycles | Fragments enrichis à la taille attendue |
| Métagénomique (shotgun) | Enzymatique (à faible apport) | Adaptateur Y standard | 8 à 12 cycles | Aucune contamination de l'ADN hôte |
L'essentiel est qu'il n'existe pas de paramètres de construction de bibliothèque "taille unique". Un protocole optimisé pour le séquençage du génome entier (WGS) fonctionnera mal pour l'ADN circulant (cfDNA) ou le séquençage d'ARN (RNA-seq) en raison des différences dans la quantité d'entrée, la distribution de la taille des fragments et la compatibilité des adaptateurs.
Exemple pratique — Construction de bibliothèque WES vs. WGSLe séquençage de l'exome entier nécessite une étape supplémentaire de capture par hybridation après la construction initiale de la bibliothèque. La bibliothèque initiale doit répondre aux mêmes normes de contrôle qualité qu'une bibliothèque de séquençage du génome entier (WGS), mais avec une contrainte supplémentaire : la bibliothèque doit avoir une complexité suffisante pour survivre à l'étape de capture sans des taux de duplication excessifs. Cela signifie que la construction de la bibliothèque WES doit utiliser moins de cycles de PCR qu'une bibliothèque WGS avec la même entrée, car l'étape de capture introduit une amplification supplémentaire qui aggrave le taux de duplication.
Exemple pratique — construction de bibliothèque de cfDNALa construction de bibliothèques de cfDNA est sans doute la plus sensible à l'optimisation des paramètres. La quantité d'entrée (1 à 50 ng) et la taille des fragments (~167 pb) se situent toutes deux en dehors de la plage optimale pour les protocoles standard. Le rapport entre les adaptateurs et les inserts doit être soigneusement contrôlé : trop bas, l'efficacité de ligation en souffre ; trop élevé, la contamination par des dimères d'adaptateurs devient sévère car les courts fragments de cfDNA ne peuvent pas être efficacement séparés des dimères par sélection de taille. Des kits de construction de bibliothèques à faible entrée spécialisés avec des adaptateurs en boucle et des rapports de billes optimisés sont recommandés pour les flux de travail de cfDNA.
Services de séquençage NGS avec des protocoles de construction de bibliothèques spécifiques à l'application, il est possible d'adapter l'ensemble des paramètres aux exigences de chaque projet.
Figure 6. Construction de bibliothèques spécifiques à une application — différences de paramètres entre cinq applications NGS courantes
Tableau comparatif des paramètres pour cinq applications NGS—WGS, RNA-seq, WGBS, ChIP-seq et métagénomique—montrant les différences dans la méthode de fragmentation, le type d'adaptateur, le nombre de cycles PCR et les principaux indicateurs de contrôle qualité pour chaque application.
QC de bibliothèque — Critères d'acceptation quantifiables
Un flux de travail QC systématique avec des seuils de réussite/échec prédéfinis empêche les mauvaises bibliothèques de gaspiller la capacité de séquençage. Les critères suivants représentent des normes pratiques pour la plupart des projets de construction de bibliothèques Illumina. Ces seuils sont basés sur une expérience empirique à travers des milliers de bibliothèques et reflètent la performance nécessaire pour produire des données de séquençage de haute qualité sur les plateformes Illumina modernes.
| Métrique de QC | Méthode | Passer | Prudence | Échouer |
|---|---|---|---|---|
| Concentration de bibliothèque | qPCR | >2 nM | 1–2 nM | <1 nM |
| Contenu du dimère d'adaptateur | Bioanalyseur | <5 % de la masse totale | 5 à 10 % | >10 % |
| Taille moyenne des fragments | Bioanalyseur | Dans une plage de ±10 % de l'objectif | ±10–20 % | >±20 % |
| Taux de duplication (WGS) | Computational | <15% | 15–30 % | >30 % |
| qPCR vs. ratio Qubit | Les deux | 0,5–2,0 | 2,0–3,0 | >3,0 |
Interpréter les résultats combinés du contrôle qualitéAucun indicateur unique n'est suffisant pour évaluer la qualité d'une bibliothèque. Une bibliothèque avec plus de 10 % de contenu de dimère d'adaptateur peut tout de même passer le contrôle qualité de séquençage si la concentration globale est élevée, mais elle gaspillera une proportion de lectures sur des séquences non informatives. Une bibliothèque avec une faible concentration (<1 nM) peut toujours être chargée sur la cellule de flux, mais produira probablement une faible densité de clusters et sous-utilisera la capacité de la cellule de flux. L'indicateur le plus fiable d'une bonne bibliothèque est celle qui passe tous les seuils de contrôle qualité simultanément.
Suivi des lots d'enzymesUn facteur souvent négligé dans la reproductibilité de la construction de bibliothèques est la variabilité entre les lots d'enzymes. Les enzymes utilisées dans la fragmentation, la réparation des extrémités, la ligature et l'amplification sont des réactifs biologiques présentant une variabilité inhérente d'un lot à l'autre. Pour les projets s'étendant sur plusieurs lots, il est judicieux de conserver un petit aliquote de chaque lot d'enzyme pour une comparaison côte à côte. Un échantillon de contrôle avec des performances connues devrait être inclus lors du passage à un nouveau lot pour valider des résultats cohérents.
Le ratio qPCR vs. Qubit est un diagnostic particulièrement utile. La qPCR mesure uniquement les molécules de bibliothèque amplifiables et ligaturées par des adaptateurs, tandis que Qubit mesure tout l'ADN double brin dans l'échantillon. Si les lectures de Qubit sont significativement plus élevées que celles de qPCR (ratio >3), la bibliothèque contient probablement une forte proportion d'ADN non amplifiable—typiquement des dimères d'adaptateurs, des fragments non ligaturés ou des artefacts de primers qui ne produiront pas de données de séquençage. Un ratio proche de 1 indique une bibliothèque propre, la plupart de l'ADN mesuré étant des molécules fonctionnelles de la bibliothèque.
Figure 7. Diagramme de flux de décision QC de la bibliothèque — critères de réussite/échec pour chaque point de contrôle QC
Légende : Organigramme de décision QC de la bibliothèque montrant les seuils de passage/avertissement/échec pour cinq indicateurs clés : concentration qPCR, contenu en dimères d'adaptateurs, taille des fragments, taux de duplication et ratio qPCR-Qubit, avec les actions recommandées à chaque point de décision.
Comment CD Genomics soutient la construction de bibliothèques
CD Genomics propose des services de construction de bibliothèques de bout en bout couvrant l'ensemble des méthodes et types d'échantillons compatibles avec Illumina.
Méthodes disponiblesNotre laboratoire réalise la fragmentation mécanique, la fragmentation enzymatique et la construction de bibliothèques basée sur la tagmentation à travers des protocoles basés sur la PCR, sans PCR et à faible entrée. La méthode est choisie en fonction de la qualité et de la quantité de l'échantillon, ainsi que du type de projet.
Expertise en échantillons spéciauxNous avons validé des protocoles de construction de bibliothèques pour les échantillons FFPE, cfDNA, cellules uniques et échantillons à ultra faible entrée, avec des ratios d'adaptateurs optimisés, des plages de sélection SPRI et des nombres de cycles PCR pour chaque type d'entrée.
Normes de contrôle qualitéChaque bibliothèque subit une quantification par qPCR, une analyse de trace par Bioanalyzer et une confirmation de la distribution des tailles. Les bibliothèques qui ne répondent pas aux critères d'acceptation décrits dans ce guide sont signalées et re-préparées avant de passer au séquençage.
Pour plus de détails, explorez notre services NGS ou contactez notre équipe pour des recommandations spécifiques au projet.
FAQ
Quelle est la méthode de fragmentation optimale pour la construction de bibliothèques WGS ?
La fragmentation mécanique (Covaris) produit la couverture la plus uniforme en fonction du contenu en GC avec le biais le plus faible. La fragmentation enzymatique est un bon second choix et offre un meilleur débit. La tagmentation n'est pas recommandée pour le WGS en raison du biais en GC dans les régions à faible GC.
Quel rapport molécule d'adaptateur à molécule de molaires devrais-je utiliser pour la construction d'une bibliothèque standard ?
Pour des entrées de 100 à 500 ng, un rapport molaire adaptateur-à-insert de 20:1 à 30:1 est recommandé. Pour des entrées plus élevées (>500 ng), un rapport de 10:1 à 20:1 ; pour des entrées plus faibles, jusqu'à 50:1 peut être nécessaire.
Comment choisir le bon ratio de billes SPRI pour la taille de fragment cible ?
Pour des fragments de 300 à 500 pb (WGS standard), utilisez une sélection des deux côtés avec un ratio de perles de 0,6× pour le premier et de 0,7× pour le second. Pour des fragments de 200 à 300 pb (amplicon, cfDNA), utilisez 0,6×/0,8×. Pour des fragments plus grands (500 à 800 pb), utilisez 0,5×/0,6×.
Combien de cycles de PCR devrais-je utiliser pour la construction de ma bibliothèque ?
Pour 100 ng à 1 µg d'entrée : 4 à 8 cycles. Pour 10 à 100 ng : 8 à 10 cycles. Pour <10 ng : 10 à 14 cycles. Utilisez le nombre minimum qui produit un rendement suffisant.
Qu'est-ce qui détermine si une bibliothèque réussit le contrôle qualité ?
Critères de passage clés : concentration de qPCR >2 nM, contenu en dimères d'adaptateurs <5% de la masse totale de la bibliothèque, taille moyenne des fragments dans ±10% de la cible, et rapport qPCR-Qubit entre 0,5 et 2,0.
Comment distinguer les dimères d'adaptateurs des courts fragments de bibliothèque sur un traceur Bioanalyzer ?
Les dimères d'adaptateurs apparaissent comme un pic net à environ 120–140 pb. Les courts fragments de bibliothèque produisent un pic plus large dans la même région mais avec une forme différente. Si le pic douteux représente <5 % de la masse totale, il est peu probable qu'il affecte de manière significative les performances de séquençage.
Pourquoi le rendement de ma bibliothèque est-il inférieur à mes attentes ?
Les causes les plus courantes sont : une concentration d'ADN d'entrée surestimée (utilisez un essai fluorométrique, pas de spectrophotométrie UV), un rapport adaptateur-insère insuffisant, ou un nettoyage excessif des billes qui a éliminé trop de matériel.
Puis-je utiliser le même protocole de construction de bibliothèque pour l'ARN-seq et le WGS ?
Non. La construction de bibliothèques RNA-seq nécessite une transcription inverse, une fragmentation de l'ADNc et l'incorporation d'adaptateurs spécifiques à un brin. La construction de bibliothèques WGS utilise une fragmentation de l'ADN suivie d'une ligation d'adaptateurs. Ce sont des flux de travail fondamentalement différents.
Quelle est la quantité minimale d'ADN requise pour la construction d'une bibliothèque standard ?
Les kits standard basés sur la PCR peuvent fonctionner avec des entrées aussi faibles que 0,1 ng, mais le rendement et la complexité deviennent peu fiables en dessous de 1 ng. Pour des entrées inférieures à 10 ng, un kit spécifiquement conçu pour la construction de bibliothèques à faible entrée est recommandé.
Comment la conversion au bisulfite affecte-t-elle la construction de bibliothèques pour le séquençage du génome entier par bisulfite ?
Le traitement au bisulfite convertit les cytosines non méthylées en uracile, qui sont lues comme des thymines lors du séquençage. Cela réduit la complexité de la séquence et nécessite des protocoles de construction de bibliothèques spécialisés avec des adaptateurs méthylés et des polymérases compatibles avec le bisulfite.
Quelle est la raison la plus courante d'une faible densité de clusters dans une bibliothèque bien quantifiée ?
La cause cachée la plus courante est une faible efficacité de ligation des adaptateurs. La bibliothèque passe la quantification Qubit (qui mesure tout l'ADN double brin), mais de nombreuses molécules manquent d'adaptateurs fonctionnels aux deux extrémités. Effectuer des mesures qPCR et Qubit en parallèle et comparer le rapport est le meilleur diagnostic.
Comment choisir entre un nettoyage SPRI simple face et double face pour ma bibliothèque ?
Le nettoyage unilatéral est plus rapide et suffisant pour les applications où l'élimination des dimères d'adaptateurs est l'objectif principal et où les grands fragments sont moins préoccupants. Le nettoyage bilatéral est recommandé pour le séquençage du génome entier (WGS) et les applications sensibles à la taille où il est nécessaire de contrôler à la fois les grands et les petits fragments.
Puis-je utiliser les mêmes paramètres de construction de bibliothèque pour l'ADN FFPE que pour l'ADN de tissu frais congelé ?
Non. L'ADN FFPE est généralement dégradé (taille moyenne des fragments de 200 à 400 pb) et contient des bases endommagées. La construction de la bibliothèque pour FFPE doit utiliser une étape de pré-réparation avec l'uracile-ADN glycosylase, moins de cycles de PCR (pour éviter l'amplification des artefacts) et une fenêtre de sélection de taille plus large qui s'adapte à la distribution des fragments plus courts et plus hétérogènes.
Quelles sont les conditions de stockage optimales pour les bibliothèques complètes ?
Les bibliothèques complètes doivent être stockées à -20°C dans des tubes à faible adsorption. Les bibliothèques sont stables pendant au moins 6 mois dans ces conditions. Évitez les cycles répétés de congélation-dégel en aliquotant les bibliothèques en volumes à usage unique.
Comment puis-je déterminer si mon protocole de construction de bibliothèque nécessite une optimisation ?
L'indicateur le plus fiable est le rapport qPCR-Qubit. Un rapport constamment supérieur à 3,0 indique qu'une fraction significative de l'ADN quantifié n'est pas un matériau de bibliothèque fonctionnel. D'autres signes incluent : une densité de clusters constamment faible malgré une concentration de chargement adéquate, des taux de duplication supérieurs à 30 %, ou des pics de dimères d'adaptateurs supérieurs à 10 % sur les traces du Bioanalyzer.
À des fins de recherche uniquement.
Références:
- Optimisation des techniques de fragmentation de l'ADN. Diagnostics. 2025;15:2294.
- Optimisation de la fragmentation enzymatique. BMC Genomics. 2022;23:89.
- Amélioration technique de l'NGS dans les milieux cliniques — optimisation de la ligature des adaptateurs. Médecine de laboratoire pratique2025;40:e00430.
- Une analyse comparative des approches de préparation de bibliothèque pour des échantillons à faible apport. BMC Genomics. 2018;19:763.
- PCR multiplex à faible nombre de cycles pour la construction de bibliothèques. Électrophorèse2024;45:1255-1264.