Un guide mis à jour sur la préparation de bibliothèques Illumina : kits, méthodes et stratégies pour des types d'échantillons difficiles
La préparation de la bibliothèque est le facteur déterminant le plus important du succès du séquençage. Peu importe la puissance de la plateforme de séquençage ou la sophistication du pipeline d'analyse des données, une bibliothèque mal préparée produira des données inutilisables, une capacité de cellule de flux gaspillée et du temps perdu.
Mais en 2026, le défi pour la plupart des chercheurs n'est plus de comprendre les étapes de base de la préparation des bibliothèques. Le défi consiste à choisir la bonne méthode parmi un nombre croissant d'options : basée sur la PCR ou sans PCR, basée sur la fragmentation ou sur la tagmentation, et des kits optimisés pour des types d'échantillons spécifiques tels que les tissus FFPE, l'ADN circulant libre (cfDNA) et les échantillons à ultra faible entrée.
Ce guide fournit un cadre pratique pour prendre ces décisions. Il couvre les principales stratégies de préparation de bibliothèques et les kits disponibles pour le séquençage Illumina, en mettant l'accent sur le choix de la bonne approche en fonction de votre type d'échantillon, de l'échelle de votre projet et des exigences de qualité des données.
Pourquoi les choix de préparation de bibliothèque comptent plus que jamais
La préparation de bibliothèques représente la majorité de la variabilité dans les flux de travail NGS. Une bibliothèque bien conçue produit systématiquement des données de haute qualité ; une bibliothèque mal conçue peut échouer même sur le meilleur instrument de séquençage. Alors que les coûts de séquençage ont diminué, la préparation de bibliothèques est devenue une part proportionnellement plus importante du coût total du projet, rendant le choix de la méthode une décision financière significative.
Trois facteurs clés influencent le choix de la méthode de préparation de bibliothèque :
- Qualité et quantité des échantillonsL'ADN génomique de haute qualité (>1 µg) permet d'accéder à des méthodes sans PCR qui minimisent les biais. Les échantillons de faible qualité ou de faible quantité (FFPE, cfDNA, cellules uniques) nécessitent des kits spécialisés avec des enzymes de réparation ou des protocoles à ultra faible entrée. La cause la plus courante d'échec de la bibliothèque est le matériel d'entrée dégradé qui n'a pas été identifié avant que la bibliothèque ne soit quantifiée, ce qui explique pourquoi investir dans un contrôle qualité rigoureux en amont est rentabilisé de nombreuses fois.
- Type de projetLe séquençage du génome entier (WGS) exige un faible biais expérimental et une couverture cohérente. Le séquençage ciblé nécessite une haute efficacité de capture. Le séquençage par amplicons repose sur des amorces multiplex équilibrées. Chaque type d'application impose des exigences différentes sur la méthode de préparation de la bibliothèque, ce qui signifie qu'il n'existe pas de "meilleur" kit unique, mais seulement le meilleur kit pour une combinaison donnée d'échantillon et d'application.
- Débit et temps de réponseCertaines méthodes peuvent passer de l'ADN à une bibliothèque prête à séquencer en moins de 3 heures ; d'autres nécessitent 6 à 8 heures. Pour de grands lots, la compatibilité avec l'automatisation devient un facteur important. Un laboratoire traitant 96 échantillons par semaine aura des exigences de débit différentes de celui traitant 16 échantillons par mois.
Au-delà de ces facteurs, une quatrième considération prend de l'importance : la complexité de la bibliothèque. Une bibliothèque avec une complexité élevée—c'est-à-dire qui représente le génome ou le transcriptome original avec une duplication minimale—produit des appels de variants de meilleure qualité, des mesures d'expression plus fiables et des résultats plus reproductibles entre les lots. Les méthodes de préparation de bibliothèque qui préservent la complexité (sans PCR, PCR à faible cycle et protocoles de tagmentation optimisés) sont de plus en plus privilégiées pour les projets où la qualité des données est la préoccupation principale.
Pour les chercheurs planifiant leur premier projet de NGS ou cherchant à optimiser un pipeline existant, comprendre ces compromis est essentiel. Complet services NGS couvrir l'ensemble des méthodes de préparation de bibliothèques, rendant possible la sélection de l'approche optimale pour les exigences spécifiques de chaque projet.
Le flux de travail standard en bref
Les étapes fondamentales de la préparation de bibliothèque Illumina restent cohérentes à travers la plupart des méthodes, bien que la mise en œuvre spécifique varie :
- FragmentationL'ADN est fragmenté en morceaux de taille cible (généralement de 200 à 800 pb) par cisaillement mécanique, digestion enzymatique ou tagmentation.
- Réparation de fin et A-tailingLes extrémités des fragments sont émoussées, phosphorylées et dotées d'une queue A pour permettre la ligation des adaptateurs.
- Ligation d'adaptateursDes adaptateurs de séquençage contenant des séquences P5/P7, des codes-barres d'index et des sites de liaison pour les amorces de séquençage sont ligaturés aux fragments.
- Sélection de tailleLes fragments en dehors de la plage de taille cible sont éliminés, généralement à l'aide de billes magnétiques SPRI.
- Amplification de bibliothèque (optionnelle)L'amplification par PCR ajoute suffisamment de matériel pour le séquençage. Les méthodes sans PCR omettent complètement cette étape.
- Contrôle de qualité de la bibliothèqueLa bibliothèque finale est quantifiée et contrôlée en qualité à l'aide de qPCR, d'essais fluorométriques et d'électrophorèse capillaire (Bioanalyzer ou TapeStation).
Cet aperçu est intentionnellement bref car les mécanismes détaillés de chaque étape sont déjà couverts dans des ressources existantes. L'objectif de ce guide est de choisir entre les méthodes disponibles, et non de fournir un protocole étape par étape.
Figure 1. Cadre décisionnel pour la préparation de la bibliothèque — du type d'échantillon et des objectifs du projet à la stratégie de préparation optimale
Cadre décisionnel guidant les chercheurs depuis le type d'échantillon, la quantité d'entrée et les objectifs du projet jusqu'à la stratégie optimale de préparation de bibliothèque à travers des méthodes basées sur la PCR, sans PCR et de tagmentation.
Choisir la bonne stratégie de préparation de bibliothèque — basée sur la PCR, sans PCR ou par tagmentation
Chaque méthode de préparation de bibliothèque Illumina appartient à l'une de trois catégories techniques. Comprendre les différences entre ces catégories est la première étape pour choisir le bon kit pour votre projet.
Fragmentation et ligation basées sur la PCRL'ADN est fragmenté par cisaillement mécanique (Covaris) ou digestion enzymatique, suivi de la réparation des extrémités, de l'ajout de queues A, de la ligature des adaptateurs et de l'amplification par PCR. C'est l'approche la plus flexible et la plus largement utilisée. Elle fonctionne bien sur une large gamme de quantités d'entrée (0,1 ng à 1 µg) et de types d'échantillons. Le compromis est que l'amplification par PCR peut introduire un biais dans les régions riches en GC et augmenter les taux de duplication. Les kits utilisant cette stratégie nécessitent généralement 4 à 8 heures pour un flux de travail complet.
Fragmentation sans PCR + ligationLe même flux de travail que ci-dessus, mais l'amplification PCR est omise. Cela élimine le biais introduit par la PCR et produit la couverture génomique la plus uniforme, en faisant la norme d'or pour les applications de séquençage de génome entier (WGS). La limitation est que les méthodes sans PCR nécessitent un ADN d'entrée plus élevé (généralement >100 ng à >1 µg selon le kit) car il n'y a pas d'étape d'amplification pour augmenter le rendement de la bibliothèque.
Tagmentation (basée sur la transposase)Une enzyme transposase modifiée fragmente simultanément l'ADN et insère des séquences d'adaptateurs en une seule étape de réaction. Cela réduit considérablement le temps de manipulation et les besoins en entrée - certains kits de tagmentation fonctionnent avec aussi peu que 1 ng d'ADN d'entrée. L'inconvénient est que les méthodes de tagmentation peuvent introduire un biais dépendant de la séquence, en particulier dans les régions à faible GC, et peuvent produire des bibliothèques avec une distribution de taille d'insertion plus étroite.
Cadre de sélection: Sur la base de l'analyse ci-dessus, un guide pratique pour la sélection des méthodes peut être résumé comme suit :
- ADN de haute qualité >1 µg pour le séquençage du génome entier → Fragmentation sans PCR + ligation produit la couverture la plus uniforme avec les taux de duplication les plus bas
- Entrée 10–100 ng, besoin d'un retour rapide → Basé sur la tagmentation les méthodes sont les plus efficaces, réduisant le temps de préparation de la bibliothèque d'environ la moitié
- FFPE, cfADN ou d'autres échantillons difficiles → Fragmentation et ligation basées sur la PCR avec des enzymes de réparation ou des kits spécialisés à ultra faible entrée
- Laboratoire flexible et polyvalent traitant divers types d'échantillons. Fragmentation et ligation basées sur la PCR offre la plus large plage d'entrée et compatibilité d'application
Figure 2. Trois stratégies de préparation de bibliothèque — fragmentation par PCR + ligation, sans PCR, et tagmentation
Légende : Comparaison des trois principales stratégies de préparation de bibliothèques Illumina montrant les différences dans le mécanisme de fragmentation, les exigences d'amplification, la plage d'ADN d'entrée et les applications les mieux adaptées pour chaque approche.
Considérations sur le flux de travail en laboratoireEn plus des facteurs techniques mentionnés ci-dessus, la logistique pratique des laboratoires devrait influencer le choix. Les kits de fragmentation par PCR et de ligation produisent des résultats cohérents sur une large gamme de types d'échantillons, ce qui les rend idéaux pour les installations centrales ou les laboratoires de services qui reçoivent des types d'échantillons divers. Les méthodes de tagmentation sont mieux adaptées aux laboratoires qui traitent un type d'échantillon cohérent à grande échelle et qui privilégient la rapidité. Les méthodes sans PCR sont les plus appropriées pour les laboratoires ayant un accès fiable à de l'ADN de haute qualité et en grande quantité, ainsi qu'un besoin spécifique de réduction des biais qu'elles offrent.
Comparaison des kits de préparation de bibliothèque disponibles selon des paramètres clés
Plusieurs kits disponibles dans le commerce mettent en œuvre chacune des trois stratégies ci-dessus. Le choix entre eux dépend des exigences spécifiques de votre projet.
| Type de kit | Méthode | Plage d'entrée | Temps typique | Meilleure application |
|---|---|---|---|---|
| Sans PCR (fragmentation standard + ligation) | Sonication + ligation, pas de PCR | 100 ng – 1 µg | ~6 h | WGS où le biais minimal est critique ; ADN de haute qualité |
| Basé sur la PCR (fragmentation standard + ligature) | Sonication/enzymatique + ligation + PCR | 0,1 ng – 1 µg | ~4–6 h | Plage d'application la plus large ; entrée flexible ; FFPE avec réparation |
| Basé sur la tagmentation | Fragmentation de transposase + insertion d'adaptateur | 1–50 ng | ~3 h | Faible entrée ; flux de travail rapide ; bactéries, virus, petits génomes |
| Ultra-faible entrée / optimisé pour cfDNA | Boucle en tige ou ligation spécialisée | 0,05–50 ng | ~2,5–3 h | cfDNA, biopsie liquide, cellule unique, entrées sub-nanogrammes |
Conseils pratiques de sélectionPour les laboratoires traitant une gamme diversifiée de types d'échantillons, un kit de fragmentation et de ligation basé sur la PCR avec une large plage d'entrée est le choix le plus polyvalent, couvrant tout, des gDNA de haute qualité aux bibliothèques FFPE, cfDNA et RNA-seq. Pour les laboratoires se concentrant exclusivement sur le WGS ADN de haute qualité, une approche sans PCR offre la meilleure qualité de données avec les taux de duplication les plus bas. Pour les laboratoires priorisant la rapidité et un faible input sur des types d'échantillons simples, la tagmentation est une excellente option qui peut réduire le temps de manipulation jusqu'à 50 %. Pour les projets impliquant du cfDNA ou d'autres applications à ultra faible input, un kit spécifiquement optimisé pour ces entrées devrait être la première considération—l'utilisation d'un kit standard basé sur la PCR sur cfDNA conduit souvent à une contamination par dimères d'adaptateurs car les courts fragments d'insertion ne fournissent pas une séparation suffisante des produits de ligation adaptateur-adaptateur.
Considérations de coûtLe coût par bibliothèque varie selon les trois stratégies. Les kits de fragmentation basés sur la PCR + les kits de ligation ont généralement le coût par réaction le plus élevé, tandis que les kits de tagmentation sont souvent moins chers. Cependant, le coût par kit de bibliothèque doit être mis en balance avec le coût d'une course de séquençage ratée. Une petite économie sur les réactifs de bibliothèque est insignifiante si elle produit une bibliothèque qui se regroupe mal, qui génère peu de données ou qui introduit un biais compromettant l'interprétation biologique. Le coût total du projet — et non le coût des réactifs par bibliothèque — est la métrique économique pertinente.
Type d'échantillon spécial 1 — ADN FFPE et dégradé
L'ADN dérivé de FFPE présente des défis uniques pour la préparation des bibliothèques. La fixation au formol provoque un réticulation qui fragmente l'ADN et introduit des modifications de bases—en particulier, la désamination de la cytosine (C→T) qui peut apparaître comme des mutations apparentes dans les données de séquençage.
La préparation réussie de bibliothèques FFPE nécessite deux adaptations spécifiques :
- Réparation des dommages avant la construction de la bibliothèqueUne étape de réparation pré-bibliothèque utilisant un mélange d'enzymes contenant de l'uracile-DNA glycosylase (UDG) et d'autres enzymes de réparation des dommages élimine les cytosines désaminées et répare les coupures. Cette étape est essentielle pour éliminer les artefacts C→T qui apparaîtraient autrement comme des variants faussement positifs.
- Flexibilité d'entrée et réduction du nombre de cyclesL'ADN FFPE est généralement fragmenté à une taille moyenne de 200 à 400 pb, ce qui se situe déjà dans la plage cible pour la plupart des bibliothèques Illumina. L'accent doit être mis sur la minimisation des cycles d'amplification supplémentaires pour éviter tout biais supplémentaire. Les kits de fragmentation par PCR + ligation avec modules de réparation sont l'approche recommandée.
Les bibliothèques FFPE montrent généralement une distribution de taille d'insertion plus large et une complexité inférieure par rapport aux bibliothèques provenant d'ADN de haute qualité. Un traceur Bioanalyzer montrant un pic large de 150 à 600 pb, plutôt qu'un pic net, est normal pour les échantillons FFPE. Le principal critère de contrôle qualité n'est pas la forme du pic mais la présence d'un pic de bibliothèque clair au-dessus de tout signal de dimère d'adaptateur.
Figure 3. Comparaison des traces du Bioanalyzer ADN FFPE — ADN FFPE dégradé versus traces de bibliothèques d'ADN génomique de haute qualité
Légende : Électrophorégramme comparatif du bioanalyseur montrant la forme de pic large typique des bibliothèques d'ADN dérivées de FFPE par rapport au pic net et bien défini des bibliothèques d'ADN génomique de haute qualité.
Type d'échantillon spécial 2 — cfDNA et échantillons à ultra faible entrée
L'ADN circulant libre de cellules (cfDNA) est présent dans le plasma à des concentrations très faibles (généralement de 1 à 50 ng par mL de sang) et se compose de fragments d'une longueur moyenne d'environ 167 pb, soit la longueur de l'ADN enroulé autour d'un seul nucléosome. Ces caractéristiques nécessitent une approche fondamentalement différente pour la préparation de la bibliothèque par rapport à l'ADN génomique.
Considérations clés pour la préparation de bibliothèques cfDNA:
- Contrôle du dimère d'adaptateurParce que les fragments d'ADNcf sont courts (~167 pb + adaptateurs = ~300 pb de bibliothèque finale), toute contamination par des dimères d'adaptateurs (~120 pb) se situe dans la même plage de taille et ne peut pas être efficacement éliminée par sélection de taille. Les kits avec des adaptateurs en boucle ou de type bulle réduisent la formation de dimères plus efficacement que les adaptateurs en Y standard pour les applications d'ADNcf.
- Optimisation du cycle PCRL'entrée en cfDNA est trop faible pour les méthodes sans PCR, donc une amplification est nécessaire. Cependant, chaque cycle PCR supplémentaire risque d'introduire des biais et des duplications. L'équilibre optimal se situe généralement entre 8 et 12 cycles, calibré pour produire un rendement de bibliothèque suffisant sans dépasser des taux de duplication de 10 à 15 %.
- Sensibilité au saut d'indice: Parce que chaque molécule dans une bibliothèque de cfDNA est précieuse, le saut d'index qui réaffecte les lectures entre les échantillons est particulièrement nuisible. Des index doubles uniques (UDI) sont fortement recommandés pour les projets multiplexés de cfDNA.
Le profil de la bibliothèque cfDNA sur un Bioanalyzer devrait montrer un pic à environ 280–330 pb (167 pb d'insertion + 120–140 pb d'adaptateur). Un second pic à 120–140 pb indique une contamination par des dimères d'adaptateur et suggère la nécessité d'optimiser le protocole.
Figure 4. Trace Bioanalyzer de la bibliothèque cfDNA — pic typique de la bibliothèque et contamination par dimères d'adaptateurs
L'analytique Bioanalyzer d'une bibliothèque cfDNA montrant le pic de bibliothèque attendu à environ 280–330 pb et un pic de dimère d'adaptateur plus petit à environ 120–140 pb, indiquant une contamination nécessitant une optimisation du protocole.
Comparaison : cfDNA vs. préparation de bibliothèque gDNA standardLes différences fondamentales entre la préparation de bibliothèques de cfDNA et de gDNA vont au-delà de la quantité d'entrée. Comme les fragments de cfDNA sont déjà courts et possèdent des extrémités caractéristiques (groupes 5-phosphate, 3-hydroxyle issus de la clivage nucléosomal), l'étape de fragmentation est complètement omise. Le flux de travail de préparation de la bibliothèque commence directement par la réparation des extrémités et l'ajout d'une queue A, suivi de la ligature des adaptateurs. La stratégie de nettoyage diffère également : les ratios de billes SPRI doivent être soigneusement optimisés pour retenir les courts fragments de cfDNA tout en éliminant les dimères d'adaptateurs, qui ne sont que d'environ 40 à 60 pb plus courts que les fragments de la bibliothèque cible. Un nettoyage à billes double face - d'abord à 0,6-0,8× pour éliminer les grands fragments, puis à 1,5-1,8× pour capturer les fragments de la plage cfDNA - est une approche courante et efficace.
WGS vs. Enrichissement ciblé vs. Amplicon — Comment la préparation de bibliothèque diffère selon l'application
Le flux de travail de préparation de la bibliothèque change en fonction de ce qui vient après.
| Application | Objectif de préparation | Métrique clé de contrôle qualité | Exigence d'entrée |
|---|---|---|---|
| Séquençage du génome entier | Couverture uniforme avec un biais minimal | Insérer la distribution des tailles, le taux de duplication | 100 ng – 1 µg ; PCR sans préférence |
| Enrichissement ciblé (WES, panneaux) | Capture efficace des régions cibles | % sur cible, uniformité de couverture | 10–200 ng |
| Séquençage d'amplicons | Amplification équilibrée entre les cibles | Équilibre de lecture entre les amplicons, dimère d'amorce | 1–100 ng |
Pour Préparation de bibliothèque WGS, la priorité est de minimiser le biais expérimental. Les méthodes sans PCR sont préférées lorsque la quantité d'entrée le permet. Les points de contrôle critiques de l'assurance qualité sont la distribution de la taille des fragments (un pic étroit à la taille cible) et le taux de duplication (devrait être <10 % pour les méthodes sans PCR, <15 % pour les méthodes basées sur la PCR).
Pour préparation de bibliothèque d'enrichissement cibléLa bibliothèque initiale est construite de la même manière qu'une bibliothèque WGS, mais une étape supplémentaire de capture par hybridation est ajoutée pour isoler les régions cibles. Le critère de contrôle qualité critique passe de l'uniformité de couverture à l'efficacité de capture (% de lectures se mappant aux régions cibles). La préparation de la bibliothèque pour l'enrichissement ciblé doit produire suffisamment de complexité pour éviter que les lectures en double ne dominent les données ciblées après la capture.
Pour préparation de bibliothèque basée sur des ampliconsla bibliothèque est générée par PCR multiplex plutôt que par fragmentation et ligature d'adaptateurs. Le principal défi est d'équilibrer la performance des amorces sur toutes les cibles pour éviter la perte de régions spécifiques. Le contrôle qualité se concentre sur l'uniformité de la couverture sur l'ensemble des cibles - un indicateur standard est le pourcentage d'amplicons dans une plage de 0,2× à 2× de la profondeur de couverture moyenne.
Une note sur la préparation de bibliothèques d'ARNBien que l'objectif principal de ce guide soit la préparation de bibliothèques d'ADN, la préparation de bibliothèques d'ARN-seq suit un flux de travail différent. Au lieu de fragmenter avant la ligation des adaptateurs, l'ARN est d'abord converti en ADNc par transcription inverse, puis fragmenté (ou fragmenté avant la transcription inverse, selon le protocole). Les étapes de ligation des adaptateurs et d'amplification sont similaires à celles de la préparation de bibliothèques d'ADN, mais la spécificité des brins doit être préservée si le design expérimental nécessite de distinguer le brin d'ARN original de son complément.
Figure 5. Préparation de bibliothèque WGS vs préparation de bibliothèque d'enrichissement ciblé vs préparation de bibliothèque d'amplicons — comparaison des flux de travail
Légende : Diagramme de flux comparatif montrant les trois principales voies de préparation de bibliothèques NGS—WGS, enrichissement ciblé et amplicon—avec des différences dans la stratégie de fragmentation, les étapes de capture/amplification et les principaux indicateurs de contrôle qualité pour chacune.
Plusieurs kits de préparation de bibliothèques d'ARN disponibles dans le commerce y parviennent grâce à différentes stratégies chimiques. Le contrôle qualité des bibliothèques d'ARN-seq doit également évaluer l'efficacité de la déplétion de l'ARN ribosomal, qui est un critère de qualité critique non applicable à la préparation de bibliothèques d'ADN.
Stratégie de multiplexage pour les projets par lotsLors de la préparation des bibliothèques pour un projet multi-échantillons, la stratégie de codage-barres doit être planifiée avant le début de la construction de la bibliothèque. Pour les projets comportant 96 échantillons ou moins par course de séquençage, un indexage simple est généralement suffisant, à condition que les séquences d'index présentent une diversité adéquate. Pour les projets dépassant 96 échantillons, ou lorsque des courses multiplexées seront combinées pour l'analyse, des index doubles uniques (UDI) sont fortement recommandés. L'UDI élimine le risque de saut d'index, ce qui peut entraîner des appels de variantes faussement positifs dans les conceptions de séquençage en pool. Le choix de la stratégie d'indexation affecte le flux de travail de préparation de la bibliothèque, car certains ensembles d'index nécessitent des configurations d'adaptateurs spécifiques, ce qui influence à son tour la chimie de ligature et le protocole de nettoyage.
Résultats de QC de la bibliothèque de lecture — Un guide pratique des modèles d'échec courants
Apprendre à interpréter les traces du Bioanalyzer ou du TapeStation est l'une des compétences les plus utiles pour quiconque travaille avec des bibliothèques NGS. Voici les six motifs de trace les plus courants et ce qu'ils signifient :
- Bibliothèque normaleUn pic unique et symétrique dans la plage de taille attendue. Pour une bibliothèque d'inserts standard de 350 pb avec des adaptateurs, cela signifie un pic à environ 470 pb. De légers épaules de chaque côté sont acceptables.
- Pic du dimère d'adaptateurUn deuxième pic, plus petit, entre 120 et 140 pb (selon la conception de l'adaptateur). Cela indique que les molécules d'adaptateurs se sont ligaturées entre elles pendant l'étape de ligation plutôt qu'à l'ADN d'insertion. Un pic de dimères <5 % de la masse totale de la bibliothèque est généralement acceptable ; des niveaux plus élevés nécessitent un nettoyage supplémentaire ou une révision du protocole.
- Pic décalé à gauche (courts fragments)Le pic de la bibliothèque est en dessous de la plage de taille attendue. Cela indique généralement une sur-fragmentation lors de l'étape de cisaillement ou de tagmentation. Cela réduit la longueur de lecture mappable et peut nécessiter une ré-optimisation des conditions de fragmentation.
- Pic de décalage vers la droite (longs fragments)Le pic de la bibliothèque est supérieur à la plage de taille attendue. Cela indique une sous-fragmentation ou une sélection de taille inefficace. Ces bibliothèques peuvent produire une densité de clusters plus faible sur la cellule de flux car les fragments plus longs ne s'amplifient pas aussi efficacement.
- Pic large (large distribution de taille)La trace s'étend sur plus de 500 pb sans pic dominant. Cela est courant avec l'ADN d'entrée dégradé, en particulier l'ADN FFPE. Cela est acceptable pour les bibliothèques FFPE tant que la majorité des fragments se situent dans ou près de la longueur de lecture de séquençage.
- Pas de pic ou signal très faibleLa bibliothèque a un rendement extrêmement faible ou a complètement échoué. Les causes courantes incluent une ligation d'adaptateur échouée, une quantité d'ADN d'entrée insuffisante ou une enzyme de ligation dégradée. Cela nécessite de répéter la préparation de la bibliothèque avec un contrôle positif pour isoler la cause.
Des exemples de chaque motif de trace sont montrés ci-dessous.
Figure 6. Traces de bibliothèque Bioanalyzer normales vs anormales — six motifs de traces courants avec annotations
Légende : Six motifs de trace Bioanalyzer courants pour les bibliothèques NGS : pic de bibliothèque normal, contamination par dimères d'adaptateurs, décalage à gauche (sous-fragmenté), décalage à droite (sur-fragmenté), pic large (entrée dégradée) et bibliothèque échouée sans signal détectable.
Comment optimiser les rendements des bibliothèques pour des échantillons à faible entrée
L'une des questions pratiques les plus courantes auxquelles les chercheurs sont confrontés est comment maximiser le rendement de la bibliothèque lorsque le matériel d'entrée est limité. La recommandation standard de "utiliser plus d'ADN d'entrée" n'est souvent pas une option, donc des stratégies alternatives sont nécessaires.
Minimiser les pertes à chaque étape de nettoyage.Chaque étape de purification par billes SPRI entraîne une perte de 10 à 20 % de matériel de bibliothèque, même dans des conditions optimales. Pour les échantillons à faible entrée, réduire le nombre d'étapes de purification peut améliorer considérablement le rendement final. Certains protocoles combinent la purification post-ligation et post-PCR en une seule étape avec des billes, au prix d'une distribution de taille légèrement plus large. Lorsque l'entrée est critique (inférieure à 10 ng), ce compromis vaut généralement la peine d'être accepté.
Optimiser le nombre de cycles de PCRLa relation entre les cycles de PCR et le rendement de la bibliothèque n'est pas linéaire. Les premiers cycles produisent une amplification exponentielle ; après 10 à 12 cycles, des cycles supplémentaires ajoutent relativement peu de rendement tout en augmentant significativement les taux de duplication. Pour des entrées très faibles (<5 ng), 12 à 14 cycles peuvent être nécessaires. Pour des entrées supérieures à 10 ng, 8 à 10 cycles sont généralement suffisants. Surveiller la courbe d'amplification par qPCR ou réaliser un test pilote à petite échelle à 8, 10, 12 et 14 cycles pour un nouveau type d'échantillon aide à identifier l'équilibre optimal.
Utiliser des molécules porteusesL'ajout d'un transporteur (par exemple, du polyacrylamide linéaire ou du glycogène) lors des étapes de précipitation à l'éthanol peut améliorer la récupération de l'ADN à faible concentration. Cela est particulièrement utile pour les échantillons d'ADNc où les quantités d'entrée se situent dans la plage de 1 à 10 ng et où chaque nanogramme compte.
Considérez les flux de travail à tube unique.Certain méthodes de préparation de bibliothèques récemment développées effectuent la fragmentation, la réparation des extrémités, l'ajout de queue A et la ligature des adaptateurs dans un seul tube sans étapes de nettoyage intermédiaires. Ces flux de travail en un seul tube peuvent améliorer l'efficacité de conversion pour des échantillons à faible entrée de 30 à 50 % par rapport aux protocoles en plusieurs étapes, au détriment d'un contrôle de taille moins précis.
Automatisation et évolutivité dans la préparation des bibliothèques
À mesure que les projets de séquençage augmentent en échelle, la préparation manuelle des bibliothèques devient un goulot d'étranglement. Un laboratoire traitant 384 bibliothèques par semaine ne peut se permettre de préparer chaque bibliothèque à la main, et les effets de lot provenant de différents opérateurs peuvent introduire une variation technique indésirable.
Les plateformes d'automatisation de la manipulation des liquides (comme celles de Beckman Coulter, Hamilton ou Agilent) peuvent traiter 96 ou 384 échantillons en parallèle avec des volumes de réactifs et des temps d'incubation constants. Les principales considérations pour adopter une préparation de bibliothèque automatisée incluent :
- Compatibilité des protocolesTous les kits de préparation de bibliothèque commerciaux n'ont pas de protocoles d'automatisation validés. Choisir un kit avec un script d'automatisation établi réduit considérablement le temps de développement.
- Contraintes de volumeLes manipulateurs de liquides automatisés ont des volumes de pipetage minimum (généralement de 0,5 à 2 µL). Les kits avec des volumes de réaction plus petits peuvent nécessiter un passage à des versions à volume plus élevé pour être compatibles avec l'automatisation.
- Manipulation des billes magnétiquesLa purification automatisée par billes est l'étape la plus difficile à optimiser. Le temps de décantation des billes, l'engagement du magnet et la vitesse d'élimination du surnageant affectent tous la reproductibilité.
- Intégration QCLes workflows automatisés les plus efficaces incluent des étapes de contrôle qualité en ligne, telles que la lecture automatisée des plaques pour la quantification, afin d'identifier les bibliothèques défaillantes avant qu'elles ne passent au séquençage.
Pour les équipes de recherche qui réalisent des projets de séquençage à grande échelle, services NGS avec des capacités de préparation de bibliothèque automatisée peuvent offrir le débit et la reproductibilité que les méthodes manuelles ne peuvent égaler.
Un flux de travail QC pratique avant le séquençage
Avant de soumettre un lot de bibliothèques à une course de séquençage, un flux de travail de contrôle qualité standardisé doit être appliqué à chaque bibliothèque. L'objectif est d'identifier les bibliothèques susceptibles d'échouer avant qu'elles ne gaspillent la capacité de la cellule de flux.
- Quantification par qPCRC'est la méthode la plus précise pour déterminer la concentration des molécules de bibliothèque amplifiables. Un résultat de qPCR qui diffère de la mesure Qubit de plus de 3 fois indique souvent une contamination par des dimères d'adaptateurs ou un échec de la ligation.
- Distribution de taille par électrophorèse capillaireUn traceur Bioanalyzer ou TapeStation confirme que les fragments se situent dans la plage de taille attendue et que les niveaux de dimères d'adaptateurs sont acceptables.
- Calcul de la molaritéLa concentration obtenue par qPCR est convertie en molarité en utilisant la taille moyenne des fragments à partir du traceur Bioanalyzer, qui est utilisée pour calculer le volume de chargement.
- Normalisation de la piscinePour les courses multiplexées, les bibliothèques individuelles sont mélangées en quantités équimolaires, avec un excès de 10 à 20 % préparé.
- Titration pilotePour les nouveaux types de bibliothèques, un test pilote de 2 à 3 concentrations de chargement sur le type de cellule d'écoulement prévu est fortement recommandé.
Ce flux de travail de QC prend environ 2 à 3 heures pour 96 bibliothèques et doit être considéré comme une partie routinière de chaque projet NGS.
Figure 7. Flux de travail d'automatisation pour la préparation de bibliothèques à haut débit
Légende : Flux de travail automatisé de manipulation de liquides pour la préparation de bibliothèques montrant les points d'intégration clés : compatibilité des protocoles, contraintes de volume, optimisation de la manipulation des billes magnétiques et contrôle qualité en ligne pour une production évolutive.
Comment CD Genomics soutient la préparation de bibliothèques
CD Genomics propose des services complets de préparation de bibliothèques couvrant l'ensemble des méthodes et types d'échantillons compatibles avec Illumina.
Méthodes disponiblesNotre laboratoire exécute des méthodes de préparation de bibliothèques basées sur la fragmentation et la ligation par PCR, sans PCR, et basées sur la tagmentation, en utilisant les kits commerciaux les plus largement adoptés. Le choix de la méthode est déterminé par le type d'échantillon et les exigences du projet.
Expertise en échantillons spéciauxNous avons accumulé une vaste expérience en réparation de l'ADN FFPE et en construction de bibliothèques, en préparation de bibliothèques cfDNA et à faible entrée, ainsi qu'en workflows optimisés pour l'automatisation pour des projets à grande échelle. Nos protocoles sont validés pour le sang, les tissus, le FFPE, le cfDNA, les cellules uniques, ainsi que pour des échantillons végétaux et microbiens.
Contrôle de qualité de la bibliothèqueChaque bibliothèque subit un contrôle qualité rigoureux, y compris une analyse de trace par Bioanalyzer ou TapeStation, une quantification par qPCR et une confirmation de la distribution des tailles avant de passer au séquençage.
ScalabilitéPour les projets de grande envergure, nous déployons des flux de travail automatisés de manipulation de liquides qui garantissent une qualité de bibliothèque cohérente entre tous les échantillons. Cela est particulièrement précieux pour les projets multi-batch où la reproductibilité d'un lot à l'autre est essentielle.
Pour plus de détails, explorez notre services NGS ou contactez notre équipe pour des recommandations spécifiques au projet.
FAQ
Quelle est la différence entre la préparation de bibliothèque basée sur la PCR et la préparation de bibliothèque sans PCR ?
Les bibliothèques basées sur la PCR comprennent une étape d'amplification qui augmente le rendement mais peut introduire un biais dans les régions riches en GC et augmenter les taux de duplication. Les bibliothèques sans PCR évitent l'amplification, produisant une couverture plus uniforme, mais nécessitent un ADN d'entrée plus élevé (>100 ng).
Quelle méthode de préparation de bibliothèque est la meilleure pour les échantillons d'ADN FFPE ?
La fragmentation par PCR + ligation avec une étape de réparation de l'ADN pré-bibliothèque est recommandée pour les échantillons FFPE. L'étape de réparation élimine les artefacts de désamination de la cytosine qui apparaîtraient autrement comme des mutations faussement positives.
La préparation de bibliothèque sans PCR peut-elle être utilisée avec de l'ADN à faible entrée ?
Pas typiquement. Les méthodes sans PCR nécessitent entre 100 ng et 1 µg d'ADN d'entrée. Pour des entrées inférieures à 100 ng, une méthode basée sur la PCR est nécessaire pour générer un rendement de bibliothèque suffisant.
À quoi ressemble un dimère d'adaptateur sur un traceur Bioanalyzer ?
Un dimère d'adaptateur apparaît comme un petit pic à environ 120–140 pb, bien en dessous du pic de bibliothèque attendu. Si le dimère constitue plus de 5 % de la masse totale de la bibliothèque, un nettoyage supplémentaire est recommandé.
Comment choisir entre la tagmentation et la fragmentation + ligation ?
La tagmentation offre un flux de travail plus rapide et des exigences d'entrée plus faibles, mais peut introduire un biais GC. La fragmentation + ligation fournit une couverture plus uniforme à travers le contenu GC et est le choix préféré pour le séquençage génomique complet (WGS) et les applications nécessitant une représentation génomique uniforme.
Quelle est la quantité minimale d'ADN d'entrée pour la préparation standard de bibliothèques ?
Les kits standard basés sur la PCR nécessitent généralement un minimum de 0,1 à 1 ng d'entrée. Les kits à ultra faible entrée peuvent fonctionner avec aussi peu que 50 pg. Les kits sans PCR nécessitent entre 100 ng et 1 µg.
Comment puis-je retirer les dimères d'adaptateurs de ma bibliothèque ?
Les dimères d'adaptateurs peuvent être réduits en optimisant le rapport de nettoyage des billes SPRI (des rapports plus élevés retiennent plus de dimères), en utilisant une sélection de taille des deux côtés, ou en ajoutant une étape de sélection de taille basée sur un gel pour les cas récalcitrants.
Quels indicateurs de qualité devrais-je rapporter pour la préparation de bibliothèques WGS ?
Au minimum : concentration de la bibliothèque (à partir de qPCR), distribution de la taille des fragments (à partir de Bioanalyzer) et taux de duplication (à partir d'un contrôle de qualité de séquençage peu profond ou d'une estimation computationnelle).
CD Genomics peut-il préparer des bibliothèques à partir d'ADNcf ?
Oui. Nous proposons une préparation de bibliothèque optimisée pour l'ADNcf en utilisant des protocoles à très faible entrée et des conceptions d'adaptateurs en boucle-stem qui minimisent la formation de dimères d'adaptateurs dans les bibliothèques de courts fragments.
Combien de temps dure une préparation de bibliothèque typique ?
Un protocole standard de fragmentation par PCR + ligation prend 4 à 6 heures, de l'ADN d'entrée à la bibliothèque prête à être séquencée. Les méthodes de tagmentation peuvent être réalisées en environ 3 heures. Les méthodes sans PCR nécessitent 5 à 7 heures en raison des étapes de nettoyage supplémentaires nécessaires pour éliminer les adaptateurs non incorporés sans l'option d'un nettoyage par PCR.
Quelle est la différence entre la préparation de bibliothèque à index unique et à double index ?
Les bibliothèques à index unique utilisent une séquence de code-barres par échantillon, tandis que les bibliothèques à double index utilisent deux séquences de code-barres indépendantes (une sur chaque adaptateur). Le double indexage réduit le risque de mauvaise attribution des échantillons lorsque plusieurs bibliothèques sont regroupées pour le séquençage, en particulier sur les plateformes de cellules de flux à motifs où le saut d'index est plus courant.
Qu'est-ce qui cause des taux de duplication élevés dans les données de séquençage ?
Des taux de duplication élevés (>20%) sont le plus souvent causés par une quantité d'ADN d'entrée insuffisante, un nombre excessif de cycles PCR ou une faible complexité de la bibliothèque de départ. Pour les bibliothèques de séquençage génomique complet (WGS), les méthodes sans PCR produisent les taux de duplication les plus bas, tandis que les méthodes basées sur la PCR avec des entrées en dessous de la plage recommandée sont les plus susceptibles de rencontrer ce problème.
Uniquement pour un usage de recherche.
Références:
- Meilleures pratiques pour la préparation de bibliothèques Illumina. Protocoles Actuels en Génétique Humaine2019 ; 102(1) : e86.
- Comparaison du biais de séquençage des kits de préparation de bibliothèques actuellement disponibles. Recherche sur l'ADN. 2019;26(5):391-402.
- Analyse comparative des approches de préparation de bibliothèques pour l'ADN FFPE. Rapports Scientifiques. 2025;15:12992.
- Une analyse comparative des approches de préparation de bibliothèque pour des échantillons à faible apport. BMC Genomics2018 ; 19 : 763.