Contrôle de qualité des bibliothèques de phages par données NGS

Le succès de dépistage par affichage de phages dépend fondamentalement de la qualité de la bibliothèque. Le contrôle de qualité traditionnel—s'appuyant sur le séquençage Sanger à faible débit et des vérifications fonctionnelles ponctuelles—échoue à évaluer de manière exhaustive la diversité compositionnelle et l'intégrité.

Séquençage de nouvelle génération des phages (NGS) transforme ce paradigme en permettant une caractérisation au niveau moléculaire grâce au séquençage profond à haut débit. Cette approche facilite une évaluation complète à travers des dimensions de qualité clés.

Dimensions clés du contrôle de la qualité

1. Construction et diversité des bibliothèques de phages affichés

La construction de la bibliothèque détermine fondamentalement la qualité de l'affichage des phages. Les niveaux de diversité influencent directement à la fois la richesse et la fiabilité des résultats de criblage ultérieurs. L'évaluation traditionnelle de la diversité repose généralement sur l'amplification monoclonale. En revanche, la technologie NGS fournit rapidement des données de diversité complètes et précises grâce au séquençage à haut débit de bibliothèques entières.

Le NGS permet un calcul précis des fréquences de séquences individuelles, facilitant une évaluation robuste de la diversité et de la couverture de la bibliothèque. Une bibliothèque optimale doit posséder une diversité suffisante pour garantir l'identification de peptides ou de protéines candidats à haute affinité ciblant des molécules spécifiques.

2. Analyse quantitative et détection des écarts

Le séquençage profond via le NGS quantifie l'abondance de chaque séquence au sein d'une bibliothèque. Détecter les écarts est crucial lors du contrôle qualité. Les problèmes courants incluent :

  • Biais de clonage : Certaines séquences peuvent devenir de manière disproportionnée abondantes en raison des artefacts d'amplification PCR. L'analyse NGS de l'abondance relative des séquences identifie de tels clones enrichis ou biaisés.
  • Indels : Les erreurs d'insertion ou de suppression lors de la construction de la bibliothèque peuvent entraîner des séquences manquantes ou tronquées. Le séquençage de nouvelle génération (NGS) identifie précisément ces défauts, aidant à l'affinement des protocoles de construction.

The lysis rate of phage vE20 in different MOI.Identification de liants alternatifs dans l'ensemble de données NGS (Nannini F et al., 2021)

3. Stabilité et reproductibilité de la bibliothèque

La stabilité cohérente de la bibliothèque et la reproductibilité d'un lot à l'autre sont essentielles pour des résultats fiables de criblage par phage display. Le séquençage de nouvelle génération (NGS) facilite l'analyse comparative entre les lots de bibliothèque, garantissant une qualité de construction constante. Les comparaisons de séquençage révèlent si la composition des séquences reste stable entre les lots et détectent les mutations indésirables ou la contamination.

4. Analyse des données post-dépistage

Suite aux rondes de sélection, les données NGS permettent une analyse détaillée des résultats d'enrichissement. Les chercheurs identifient les séquences enrichies par affinité en analysant les variations d'abondance des séquences après le dépistage. Les étapes analytiques clés comprennent :

  • Alignement de séquences : La comparaison des séquences filtrées avec la bibliothèque originale permet d'identifier les séquences présentant une fréquence accrue (enrichies) ou une déplétion (éliminées).
  • Analyse d'enrichissement : Le suivi des changements d'abondance des séquences au cours des rounds de dépistage successifs met en évidence des peptides ou des protéines candidats progressivement enrichis en tant que ligands à haute affinité.

5. Évaluation de la qualité des données et contrôle des erreurs

La qualité des données NGS impacte de manière critique la fiabilité des résultats. Une évaluation rigoureuse lors du contrôle qualité de la bibliothèque implique :

  • Profondeur de séquençage : Assurer une couverture suffisante pour détecter avec précision toutes les séquences de la bibliothèque.
  • Précision des données : Valider la précision en comparant les résultats à des normes connues. Il est nécessaire de supprimer les données de séquence de faible qualité pour maintenir la fiabilité analytique.

Vérification de l'intégrité structurelle

Le séquençage en paires (2 × 150 pb) a été utilisé pour couvrir l'insertion et ses régions flanquantes. Grâce à l'assemblage des lectures, les éléments critiques suivants ont été authentifiés : l'intégrité du peptide signal (par exemple, PelB) ; le maintien du cadre de lecture traductionnel correct (absence d'erreurs de décalage) ; la pureté des régions CDR (sans codons stop) ; et la séquence précise des étiquettes fonctionnelles (par exemple, His-Tag/épitope Myc).

Quantification de la diversité et diagnostic des biais

Les indicateurs de qualité fondamentaux englobent plusieurs critères. La taille effective de la bibliothèque, représentée par le nombre de clones fonctionnels, doit dépasser 10 % de sa diversité théorique. Un indice de diversité de Shannon supérieur à 8 (sur une échelle log₁₀) est requis pour confirmer une distribution adéquate de l'uniformité. La fidélité des séquences exige que les taux de mutation spécifiques aux positions et l'utilisation des codons présentent une déviation inférieure à 15 % par rapport aux spécifications conçues. De plus, une analyse approfondie de la couverture est nécessaire pour les régions fonctionnelles clés.

Évaluations spécifiques au type de bibliothèque

1. Bibliothèques d'anticorps/nanobodies :

L'évaluation comprend la vérification de la couverture des mutations CDR (par exemple, s'assurer que la distribution de la longueur du CDR-H3 est conforme à la conception), l'analyse de la fréquence d'utilisation des gènes germinaux pour détecter un biais d'amplification non intentionnel, et le dépistage des risques potentiels de stabilité tels que les zones hydrophobes sujettes à l'agrégation, les résidus de cystéine non appariés ou les motifs de glycosylation indésirables.

2. Bibliothèques de peptides :

L'évaluation implique la détection d'enrichissements aberrants de structures secondaires (par exemple, α-hélice/β-feuillet) en utilisant l'analyse de la matrice de scores spécifique à la position (PSSM). L'intégrité des motifs fonctionnels cruciaux, tels que les sites de clivage par des protéases et la capacité de formation de liaisons disulfures, est également évaluée.

Pré-sélection fonctionnelle et prédiction structurelle

Des approches computationnelles intégrées sont utilisées pour l'analyse in silico. Par exemple, des simulations conformationnelles sont réalisées sur des ensembles de séquences CDR3 dérivées du NGS (par exemple, 10 000 variantes) en utilisant des outils comme NanoNet ou RoseTTAFold. Ces simulations prédisent la topologie des poches de liaison (les classifiant comme convexes, concaves ou plates). De plus, les clones sont filtrés pour leur complémentarité électrostatique avec la distribution de charge de l'épitope cible.

Flux de travail de contrôle qualité standardisé

Une mise en œuvre par étapes du contrôle qualité est recommandée :

  • Post-construction : Un minimum de 1 million de lectures est requis pour évaluer le taux d'insertion, l'intégrité du cadre de lecture et la présence de codons stop.
  • Post-amplification : Au moins 5 millions de lectures sont nécessaires pour évaluer l'indice de diversité et identifier d'éventuelles préférences clonales.
  • Pré-panneau : Une évaluation de la conformation fonctionnelle doit être réalisée sur un minimum de 10 000 séquences représentatives.

Plus d'informations sur les bibliothèques de phages améliorées par le séquençage de nouvelle génération peuvent être trouvées ici : "Phage Display et NGS : Comment le séquençage de nouvelle génération améliore les bibliothèques de phages".

Pour voir comment la plateforme Illumina peut séquencer en profondeur des bibliothèques de phages, consultez "Séquencement profond de bibliothèques de phages utilisant des plateformes Illumina".

Cas complet 1 : Contrôle de qualité guidé par NGS dans la sélection des peptides

Établissement de la caractérisation de la bibliothèque de référence

Le séquençage de la bibliothèque naïve initiale a établi un profil de référence pour les fréquences des acides aminés et leurs préférences positionnelles (par exemple, la sérine à 10,8 %, la L-Cystéine maintenue en dessous de 1 %). Cette analyse a également identifié un gradient de fréquence d'arginine/lysine en N-terminal, avec la plus faible occurrence à la position 1 augmentant jusqu'à la plus élevée à la position 12.

Vérification de l'intégrité de la bibliothèque

L'analyse de 521 981 séquences a confirmé un niveau élevé de fidélité, avec plus de 95 % de congruence entre les séquences synthétisées et les codons conçus. L'évaluation a également détecté des anomalies structurelles, y compris des codons d'arrêt aberrants (menant à une terminaison prématurée) et des mutations par décalage de cadre, grâce à l'alignement des séquences flanquantes.

Surveillance dynamique du processus de dépistage

Le séquençage de nouvelle génération (NGS) a été utilisé pour suivre l'évolution moléculaire de 12 composants au cours de trois cycles de biopanning. Un enrichissement ciblé était évident : la fréquence du motif QxQ dans les fractions éludées a grimpé de 0,21 % à 26,85 %. Cet enrichissement était encore plus marqué dans la fraction d'élution forte (stripping), où le motif QxQ C-terminal a atteint 92,6 %. Parallèlement, la persistance du motif HxH dans les fractions de lavage indiquait une préférence de liaison non spécifique.

Quantification du biais d'amplification

Une analyse comparative des bibliothèques pré- et post-amplification a révélé un changement dans la composition en acides aminés. Il y avait une augmentation de la fréquence des résidus polaires (Thr/Ser) et une diminution des résidus hydrophobes (Val/Ile). Une réduction notable de la fréquence de la cystéine, passant de 0,99 % à 0,36 %, a suggéré une inactivation des phages potentiellement médiée par la formation de liaisons disulfure.

Résultats clés du contrôle qualité

1. Validation du motif fonctionnel :

L'analyse pLogo et MEME a localisé le motif critique de liaison à l'arsenic QxQ (positions 10-12) à l'extrémité C-terminale. Sa fréquence a augmenté de 0,14 % à 69,23 % au cours des tours de dépistage. L'interrogation indépendante de la base de données (48HD.Cloud) a confirmé que QxQ est un motif non dominant dans les bibliothèques naturelles, se classant autour de la 4500e position.

2. Élimination des faux positifs :

L'application d'un algorithme d'analyse par ensembles croisés (ES = (∩ élution ∪ ∩ stripping) ∩ (∩ lavage ∩ ∩ entrée)) a efficacement filtré les clones à prolifération rapide (par exemple, ceux contenant le motif HxH). Ce processus a identifié 13 peptides cibles à haute confiance, dont 9 contenaient un motif conservé xxMPxTxxGQVQ.

3. Traçabilité des défauts :

NGS a détecté la déplétion post-amplification des résidus aromatiques hydrophobes (Phe/Tyr). La cause profonde a été retracée à la perte d'agrégation survenant lors de l'étape de précipitation PEG/NaCl.

Valeur de la percée technologique

  • Efficacité : NGS a capturé la diversité de la bibliothèque en détectant 46 séquences uniques (dont 43 étaient des occurrences uniques), une tâche qui a nécessité une validation monoclonale traditionnelle de 68 clones pour ne trouver que 3 répétitions.
  • Nouvelle perspective : L'analyse a révélé des effets positionnels au niveau de l'extrémité N-terminale, y compris une absence complète de proline à la position 1 (attribuée à un encombrement stérique) et une fréquence réduite de glutamate aux positions 1-4 (où la charge négative entrave la liaison à la cible).
  • Directives de conception : Ces résultats ont directement influencé la conception des bibliothèques suivantes, recommandant l'incorporation d'un doublet L-Glutamine en C-terminal (QxQ) et l'évitement des résidus chargés négativement en N-terminal (Braun R et al., 2020).

The lysis rate of phage vE20 in different MOI.Visualisation de la fréquence relative des séquences uniques dans la fraction centrale ES–I–W\naï.lib (Braun R et al., 2020)

Cas complet 2 : Détection de la corruption de la bibliothèque d'affichage de phages par NGS

1. Diagnostic précis de la corruption

  • Exposition de clones nuls dominants : Une NGS ultra-profonde (25 millions de lectures) a révélé que 95 % des phages de l'éluate de troisième ronde présentaient le même peptide non fonctionnel WSLGYTG. Le séquençage Sanger conventionnel (30 clones) a complètement manqué ce signal.
  • Mécanisme d'avantage de croissance : Le séquençage du génome entier a identifié une délétion du gène lacZ, conférant une efficacité d'amplification de 142× par rapport aux clones normaux, entraînant l'effondrement de l'homogénéisation de la bibliothèque.

2. Dynamiques de déclin de la diversité

  • Effondrement monoclonal : La diversité initiale saine (41 % de monoclonaux) a chuté à 0,04 % dans les élutions, indiquant de sévères goulets d'étranglement d'amplification.
  • Perte de séquence fonctionnelle : les séquences uniques ont diminué de 770 fois (61,6 % → 0,08 %), confirmant l'exclusion compétitive des clones à haute affinité de faible fréquence par des variants dominants en croissance.

3. Analyse du mécanisme des faux positifs

  • Artefacts induits par amplification : les clones WSLGYTG se sont multipliés de manière identique dans les contrôles sans cible, confirmant que l'enrichissement provenait de la dominance de l'amplification (Pr-TUP), et non de la capacité de liaison.
  • Limitations du séquençage Sanger : Alors que Sanger a détecté 11 faux positifs, le NGS a révélé leurs véritables classements au-delà du 1000e, exposant un biais d'échantillonnage de 90 % dans les méthodes traditionnelles.

4. Attribution des échecs de dépistage

  • Illusion du taux de récupération : augmentation de la production par 200 (1,6×10⁻⁶→3,4×10⁻⁴) au cours des rondes de dépistage représentant une amplification de clones corrompus, et non un véritable enrichissement de la cible.
  • Invalidation fonctionnelle : Les peptides candidats confirmés par SPR et cytométrie en flux (par exemple, p16/p18) manquaient d'activité de liaison, corroborant le diagnostic de corruption NGS.

Implications de la valeur technique et du contrôle de la qualité

  • NGS permet :
    • Détection de la corruption : analyse ultra-profonde (sensibilité de 0,08 %) → traçage des clones dominants en croissance → quantification de la décroissance de la diversité
    • Révélations critiques :

Les échecs de dépistage primaire proviennent de la corruption de la bibliothèque, et non de problèmes liés à la cible ou de défauts de conception.

Le taux de récupération est peu fiable ; la proportion de monoclonaux (>20%) devrait évaluer la santé du dépistage.

Le séquençage Sanger introduit une distorsion sévère ; le NGS est essentiel pour un minage précis (Sell DK et al., 2024)

The lysis rate of phage vE20 in different MOI.L'abondance des clones dans la bibliothèque naïve Ph.D.TM-7 (en haut) et l'éluate du 3ème tour (en bas) est présentée sous forme de graphiques à barres empilées (Sell DK et al., 2024)

Cas complet 3 : Accélération de la découverte de peptides spécifiques à une cible via le NGS

1. Contrôle de la qualité de la construction de la bibliothèque

  • Vérification de l'intégrité de la séquence :
    • Couverture complète des gènes d'anticorps (1,4 kb) utilisant le séquençage à lecture longue (par exemple, PacBio)
    • Détection des décalages de cadres/codons stop
    • Le taux de clonage fonctionnel a augmenté à plus de 95 % (contre 70 % avec le séquençage Sanger).
  • Quantification de la diversité :
    • Indice de Shannon >9.0 (indiquant une capacité de bibliothèque >10¹⁰)
    • Biais d'utilisation des codons identifié (par exemple, conception SER : 33 % → mesure CDR3 : 62 %)
    • Optimisation du protocole de synthèse guidée

2. Suivi du processus de dépistage

  • Alerte précoce à la corruption :
    • Alertes en temps réel lorsque des clones invalides à haute fréquence (par exemple, WSLGYTG) dépassent 95 %
    • Prévention du gaspillage de ressources (par exemple, dépistage ciblé des CD4 : économies de coûts de 90 %)
  • Suivi des motifs fonctionnels :
    • Enrichissement quantifié des motifs cibles (par exemple, liaison à l'arsenic QxQ : 0,14 % → 69,23 % sur 3 cycles)
    • Efficacité de dépistage confirmée

3. Extraction de clones fonctionnels profonds

  • Récupération à haute affinité et faible abondance :
    • Le NGS a détecté 54 % des anticorps à haute affinité (EC₅₀ <0,1 nM) manqués par les méthodes conventionnelles.
    • Identification exclusive des anticorps neutralisants du virus 229E
  • Correction du biais germinal :
    • Révélation d'un enrichissement inattendu de VH1-69/VK1-39 (44,2 %)
    • Mutagénèse CDR rationnelle guidée

4. Orientation à la maturation d'affinité

  • Optimisation Non-Avidante :
    • Les modèles ML entraînés sur des ensembles de données NGS ont permis une mutagenèse parallèle polyclonale.
    • Découvert des variantes cryptiques à fort potentiel (augmentation de l'affinité de 100×)
  • Prédiction de l'activité en fonction de la structure :
    • NanoNet a simulé 10 000 conformations de CDR3.
    • Topologie de courbure de 14 acides aminés (prévalence > 95 %)
    • Taux de réussite triplé pour le ciblage des épitopes concaves

Valeur de percée technologique

NGS transforme le contrôle qualité d'un simple échantillonnage à une surveillance complète grâce à :

Innovation Application
Indice de corruption (Pourcentage à haute fréquence / Pente de déclin de la diversité) Avertissement de santé pour le dépistage précoce
Chauffe de chaleur pour l'enrichissement des motifs fonctionnels Optimisation dynamique des conditions de lavage
Métriques de forme conformationnelle (par exemple, ratio de flexion CDR3) Prédiction de l'activité de liaison

Établit de nouveaux paradigmes de contrôle qualité moléculaire pour le développement de cibles indrogables (Bakhshinejad B et al., 2025)

The lysis rate of phage vE20 in different MOI.Un aperçu schématique du flux de travail de biopanning par affichage de phages et de la validation en aval (Bakhshinejad B et al., 2025)

Conclusion

Le contrôle de qualité NGS transforme le développement de bibliothèques de phages d'une "opération en boîte noire" en un processus de contrôle précis basé sur les données. Grâce au système de vérification en trois couches de l'intégrité des séquences → diversité → fonctionnalité, il évite non seulement le risque d'échec du dépistage, mais fournit également un plan moléculaire pour la conception rationnelle de la prochaine génération de bibliothèques hautement actives. Avec l'intégration de la technologie de lecture longue et du modèle de prédiction par IA, le contrôle de qualité des bibliothèques évolue vers une ère intelligente entièrement bouclée de "Conception-construction-vérification".

Pour plus d'informations sur la façon de construire et d'utiliser une base de données de séquences de phages, veuillez vous référer à "Construire et utiliser des bases de données de séquences de génomes de phages".

Les gens demandent aussi

Quelles sont les limitations de l'affichage de phages ?

L'affichage de phages peut ne pas récupérer tous les Acm spécifiques aux antigènes présents dans une bibliothèque d'anticorps donnée. L'appariement des chaînes lourdes et légères peut ne pas refléter celui de l'immunoglobuline in vivo.

Qu'est-ce que le panning de bibliothèque ?

Dans sa forme la plus simple, le panning est réalisé en incubant une bibliothèque de peptides affichés sur phages avec une plaque (ou une perle) recouverte de la cible, en lavant les phages non liés et en élution des phages spécifiquement liés.

Qu'est-ce que le biopanning de phages ?

Le biopanning par affichage de phages est un outil important et largement utilisé pour identifier et isoler des clones positifs spécifiques à partir de grandes bibliothèques de fragments d'anticorps et développer des candidats initiaux à travers diverses stratégies d'ingénierie ultérieures, telles que la maturation d'affinité.

Qu'est-ce que le contrôle des phages ?

La thérapie par phages est une forme de contrôle biologique où des bactériophages sont utilisés pour contrôler les populations microbiennes au lieu d'agents antibactériens. Les bactériophages interagissent avec des récepteurs spécifiques sur la membrane de l'hôte et injectent ensuite leur matériel génétique dans les bactéries.

Quelles sont les limitations du typage phagique ?

Le typage phagique nécessite l'utilisation d'un nombre complet de phages, il est donc généralement utilisé uniquement dans les laboratoires de référence. Il repose également sur l'interprétation du motif de lyse individuel et la comparaison avec une norme, ce qui a conduit par le passé à des résultats contradictoires entre différents laboratoires.

Références :

  1. Nannini F, Senicar L, Parekh F, Kong KJ, Kinna A, Bughda R, Sillibourne J, Hu X, Ma B, Bai Y, Ferrari M, Pule MA, Onuoha SC. Combinaison de l'affichage de phages avec le séquençage de nouvelle génération SMRTbell pour la découverte rapide de fragments scFv fonctionnels.. AcMabs. 2021 Jan-Déc;13(1):1864084.
  2. Braun R, Schönberger N, Vinke S, Lederer F, Kalinowski J, Pollmann K. Application du séquençage de nouvelle génération (NGS) dans la sélection de peptides affichés sur phages pour soutenir l'identification de motifs de liaison à l'arsenic.. Virus. 27 nov. 2020;12(12):1360.
  3. Vendre DK, Bakhshinejad B, Sinkjaer AW, Dawoodi IM, Wiinholt MN, Sloth AB, Stavnsbjerg C, Kjaer A. Utiliser le NGS pour découvrir la corruption d'une sélection par affichage de peptides sur phages. Curr Issues Mol Biol2024 Sep 21;46(9):10590-10605.
  4. Bakhshinejad B, Ghiasvand S. Une liaison magnifique : Affichage de phages et la recherche de peptides sélectifs pour les cellules. Virus2025 Jul 12;17(7):975.
  5. Altendorf T, Mohrlüder J, Willbold D. TSAT : Logiciel d'évaluation efficace pour les données NGS des sélections de phages/phages en image miroir.. Biophysique Rep (N Y). 2024 11 sept;4(3):100166.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut