Le succès de dépistage par affichage de phages dépend fondamentalement de la qualité de la bibliothèque. Le contrôle de qualité traditionnel—s'appuyant sur le séquençage Sanger à faible débit et des vérifications fonctionnelles ponctuelles—échoue à évaluer de manière exhaustive la diversité compositionnelle et l'intégrité.
Séquençage de nouvelle génération des phages (NGS) transforme ce paradigme en permettant une caractérisation au niveau moléculaire grâce au séquençage profond à haut débit. Cette approche facilite une évaluation complète à travers des dimensions de qualité clés.
La construction de la bibliothèque détermine fondamentalement la qualité de l'affichage des phages. Les niveaux de diversité influencent directement à la fois la richesse et la fiabilité des résultats de criblage ultérieurs. L'évaluation traditionnelle de la diversité repose généralement sur l'amplification monoclonale. En revanche, la technologie NGS fournit rapidement des données de diversité complètes et précises grâce au séquençage à haut débit de bibliothèques entières.
Le NGS permet un calcul précis des fréquences de séquences individuelles, facilitant une évaluation robuste de la diversité et de la couverture de la bibliothèque. Une bibliothèque optimale doit posséder une diversité suffisante pour garantir l'identification de peptides ou de protéines candidats à haute affinité ciblant des molécules spécifiques.
Le séquençage profond via le NGS quantifie l'abondance de chaque séquence au sein d'une bibliothèque. Détecter les écarts est crucial lors du contrôle qualité. Les problèmes courants incluent :
Identification de liants alternatifs dans l'ensemble de données NGS (Nannini F et al., 2021)
La stabilité cohérente de la bibliothèque et la reproductibilité d'un lot à l'autre sont essentielles pour des résultats fiables de criblage par phage display. Le séquençage de nouvelle génération (NGS) facilite l'analyse comparative entre les lots de bibliothèque, garantissant une qualité de construction constante. Les comparaisons de séquençage révèlent si la composition des séquences reste stable entre les lots et détectent les mutations indésirables ou la contamination.
Suite aux rondes de sélection, les données NGS permettent une analyse détaillée des résultats d'enrichissement. Les chercheurs identifient les séquences enrichies par affinité en analysant les variations d'abondance des séquences après le dépistage. Les étapes analytiques clés comprennent :
La qualité des données NGS impacte de manière critique la fiabilité des résultats. Une évaluation rigoureuse lors du contrôle qualité de la bibliothèque implique :
Le séquençage en paires (2 × 150 pb) a été utilisé pour couvrir l'insertion et ses régions flanquantes. Grâce à l'assemblage des lectures, les éléments critiques suivants ont été authentifiés : l'intégrité du peptide signal (par exemple, PelB) ; le maintien du cadre de lecture traductionnel correct (absence d'erreurs de décalage) ; la pureté des régions CDR (sans codons stop) ; et la séquence précise des étiquettes fonctionnelles (par exemple, His-Tag/épitope Myc).
Les indicateurs de qualité fondamentaux englobent plusieurs critères. La taille effective de la bibliothèque, représentée par le nombre de clones fonctionnels, doit dépasser 10 % de sa diversité théorique. Un indice de diversité de Shannon supérieur à 8 (sur une échelle log₁₀) est requis pour confirmer une distribution adéquate de l'uniformité. La fidélité des séquences exige que les taux de mutation spécifiques aux positions et l'utilisation des codons présentent une déviation inférieure à 15 % par rapport aux spécifications conçues. De plus, une analyse approfondie de la couverture est nécessaire pour les régions fonctionnelles clés.
L'évaluation comprend la vérification de la couverture des mutations CDR (par exemple, s'assurer que la distribution de la longueur du CDR-H3 est conforme à la conception), l'analyse de la fréquence d'utilisation des gènes germinaux pour détecter un biais d'amplification non intentionnel, et le dépistage des risques potentiels de stabilité tels que les zones hydrophobes sujettes à l'agrégation, les résidus de cystéine non appariés ou les motifs de glycosylation indésirables.
L'évaluation implique la détection d'enrichissements aberrants de structures secondaires (par exemple, α-hélice/β-feuillet) en utilisant l'analyse de la matrice de scores spécifique à la position (PSSM). L'intégrité des motifs fonctionnels cruciaux, tels que les sites de clivage par des protéases et la capacité de formation de liaisons disulfures, est également évaluée.
Des approches computationnelles intégrées sont utilisées pour l'analyse in silico. Par exemple, des simulations conformationnelles sont réalisées sur des ensembles de séquences CDR3 dérivées du NGS (par exemple, 10 000 variantes) en utilisant des outils comme NanoNet ou RoseTTAFold. Ces simulations prédisent la topologie des poches de liaison (les classifiant comme convexes, concaves ou plates). De plus, les clones sont filtrés pour leur complémentarité électrostatique avec la distribution de charge de l'épitope cible.
Une mise en œuvre par étapes du contrôle qualité est recommandée :
Plus d'informations sur les bibliothèques de phages améliorées par le séquençage de nouvelle génération peuvent être trouvées ici : "Phage Display et NGS : Comment le séquençage de nouvelle génération améliore les bibliothèques de phages".
Pour voir comment la plateforme Illumina peut séquencer en profondeur des bibliothèques de phages, consultez "Séquencement profond de bibliothèques de phages utilisant des plateformes Illumina".
Le séquençage de la bibliothèque naïve initiale a établi un profil de référence pour les fréquences des acides aminés et leurs préférences positionnelles (par exemple, la sérine à 10,8 %, la L-Cystéine maintenue en dessous de 1 %). Cette analyse a également identifié un gradient de fréquence d'arginine/lysine en N-terminal, avec la plus faible occurrence à la position 1 augmentant jusqu'à la plus élevée à la position 12.
L'analyse de 521 981 séquences a confirmé un niveau élevé de fidélité, avec plus de 95 % de congruence entre les séquences synthétisées et les codons conçus. L'évaluation a également détecté des anomalies structurelles, y compris des codons d'arrêt aberrants (menant à une terminaison prématurée) et des mutations par décalage de cadre, grâce à l'alignement des séquences flanquantes.
Le séquençage de nouvelle génération (NGS) a été utilisé pour suivre l'évolution moléculaire de 12 composants au cours de trois cycles de biopanning. Un enrichissement ciblé était évident : la fréquence du motif QxQ dans les fractions éludées a grimpé de 0,21 % à 26,85 %. Cet enrichissement était encore plus marqué dans la fraction d'élution forte (stripping), où le motif QxQ C-terminal a atteint 92,6 %. Parallèlement, la persistance du motif HxH dans les fractions de lavage indiquait une préférence de liaison non spécifique.
Une analyse comparative des bibliothèques pré- et post-amplification a révélé un changement dans la composition en acides aminés. Il y avait une augmentation de la fréquence des résidus polaires (Thr/Ser) et une diminution des résidus hydrophobes (Val/Ile). Une réduction notable de la fréquence de la cystéine, passant de 0,99 % à 0,36 %, a suggéré une inactivation des phages potentiellement médiée par la formation de liaisons disulfure.
Découvrez notre service →
L'analyse pLogo et MEME a localisé le motif critique de liaison à l'arsenic QxQ (positions 10-12) à l'extrémité C-terminale. Sa fréquence a augmenté de 0,14 % à 69,23 % au cours des tours de dépistage. L'interrogation indépendante de la base de données (48HD.Cloud) a confirmé que QxQ est un motif non dominant dans les bibliothèques naturelles, se classant autour de la 4500e position.
L'application d'un algorithme d'analyse par ensembles croisés (ES = (∩ élution ∪ ∩ stripping) ∩ (∩ lavage ∩ ∩ entrée)) a efficacement filtré les clones à prolifération rapide (par exemple, ceux contenant le motif HxH). Ce processus a identifié 13 peptides cibles à haute confiance, dont 9 contenaient un motif conservé xxMPxTxxGQVQ.
NGS a détecté la déplétion post-amplification des résidus aromatiques hydrophobes (Phe/Tyr). La cause profonde a été retracée à la perte d'agrégation survenant lors de l'étape de précipitation PEG/NaCl.
Visualisation de la fréquence relative des séquences uniques dans la fraction centrale ES–I–W\naï.lib (Braun R et al., 2020)
Les échecs de dépistage primaire proviennent de la corruption de la bibliothèque, et non de problèmes liés à la cible ou de défauts de conception.
Le taux de récupération est peu fiable ; la proportion de monoclonaux (>20%) devrait évaluer la santé du dépistage.
Le séquençage Sanger introduit une distorsion sévère ; le NGS est essentiel pour un minage précis (Sell DK et al., 2024)
L'abondance des clones dans la bibliothèque naïve Ph.D.TM-7 (en haut) et l'éluate du 3ème tour (en bas) est présentée sous forme de graphiques à barres empilées (Sell DK et al., 2024)
NGS transforme le contrôle qualité d'un simple échantillonnage à une surveillance complète grâce à :
| Innovation | Application |
|---|---|
| Indice de corruption (Pourcentage à haute fréquence / Pente de déclin de la diversité) | Avertissement de santé pour le dépistage précoce |
| Chauffe de chaleur pour l'enrichissement des motifs fonctionnels | Optimisation dynamique des conditions de lavage |
| Métriques de forme conformationnelle (par exemple, ratio de flexion CDR3) | Prédiction de l'activité de liaison |
Établit de nouveaux paradigmes de contrôle qualité moléculaire pour le développement de cibles indrogables (Bakhshinejad B et al., 2025)
Un aperçu schématique du flux de travail de biopanning par affichage de phages et de la validation en aval (Bakhshinejad B et al., 2025)
Le contrôle de qualité NGS transforme le développement de bibliothèques de phages d'une "opération en boîte noire" en un processus de contrôle précis basé sur les données. Grâce au système de vérification en trois couches de l'intégrité des séquences → diversité → fonctionnalité, il évite non seulement le risque d'échec du dépistage, mais fournit également un plan moléculaire pour la conception rationnelle de la prochaine génération de bibliothèques hautement actives. Avec l'intégration de la technologie de lecture longue et du modèle de prédiction par IA, le contrôle de qualité des bibliothèques évolue vers une ère intelligente entièrement bouclée de "Conception-construction-vérification".
Pour plus d'informations sur la façon de construire et d'utiliser une base de données de séquences de phages, veuillez vous référer à "Construire et utiliser des bases de données de séquences de génomes de phages".
Quelles sont les limitations de l'affichage de phages ?
L'affichage de phages peut ne pas récupérer tous les Acm spécifiques aux antigènes présents dans une bibliothèque d'anticorps donnée. L'appariement des chaînes lourdes et légères peut ne pas refléter celui de l'immunoglobuline in vivo.
Qu'est-ce que le panning de bibliothèque ?
Dans sa forme la plus simple, le panning est réalisé en incubant une bibliothèque de peptides affichés sur phages avec une plaque (ou une perle) recouverte de la cible, en lavant les phages non liés et en élution des phages spécifiquement liés.
Qu'est-ce que le biopanning de phages ?
Le biopanning par affichage de phages est un outil important et largement utilisé pour identifier et isoler des clones positifs spécifiques à partir de grandes bibliothèques de fragments d'anticorps et développer des candidats initiaux à travers diverses stratégies d'ingénierie ultérieures, telles que la maturation d'affinité.
Qu'est-ce que le contrôle des phages ?
La thérapie par phages est une forme de contrôle biologique où des bactériophages sont utilisés pour contrôler les populations microbiennes au lieu d'agents antibactériens. Les bactériophages interagissent avec des récepteurs spécifiques sur la membrane de l'hôte et injectent ensuite leur matériel génétique dans les bactéries.
Quelles sont les limitations du typage phagique ?
Le typage phagique nécessite l'utilisation d'un nombre complet de phages, il est donc généralement utilisé uniquement dans les laboratoires de référence. Il repose également sur l'interprétation du motif de lyse individuel et la comparaison avec une norme, ce qui a conduit par le passé à des résultats contradictoires entre différents laboratoires.
Références :