Métriques de qualité pour le séquençage d'eccDNA : efficacité d'enrichissement, bruit de fond et reproductibilité

Définir le succès d'un projet d'ADN circulaire (Circle-Seq et apparentés) commence par ce que vous mesurez et la manière dont vous le mesurez de manière cohérente. Dans les flux de travail réservés à la recherche, l'essence des "bonnes données" est simple : élimination efficace de l'ADN linéaire, conservation démontrable de l'ADN circulaire, faible bruit de fond et résultats reproductibles entre les réplicats et les lots—sans faire de promesses de performance externe. Ce guide pratique résume les points de contrôle mesurables et les normes de reporting pour les équipes d'assurance qualité des CRO et les responsables des installations centrales utilisant des stratégies hybrides (lecture courte Illumina plus lecture longue ONT/PacBio) pour répondre aux exigences des études sur les mécanismes, la découverte et l'application.


Contrôle qualité pré-séquençage : intégrité de l'ADN HMW et préparation de l'échantillon

L'intégrité de l'ADN génomique à haut poids moléculaire (HMW) est la première étape. Un échantillon fragmenté augmente les artefacts de digestion et complique l'enrichissement. Les systèmes d'électrophorèse automatisés (Agilent TapeStation ou Bioanalyzer) vous aident à visualiser si vous avez une bande HMW dominante avec un minimum de traînée—un signal d'acceptation pour continuer.

Electropherogram-style trace showing acceptable high-molecular-weight genomic DNA profile versus a degraded sample overlay.

Figure 1. Trace d'électrophorèse capillaire (TapeStation/Bioanalyzer) montrant de l'ADN génomique de haut poids moléculaire (HMW) (en haut) comparé à un échantillon dégradé (en bas) ; la position des pics indique la taille des fragments et la hauteur des pics indique la quantité relative.

Ce qu'il faut documenter avant l'enrichissement :

  • Trace d'intégrité de l'ADN : un pic HMW dominant et une ligne de base propre ; éviter un flou prononcé de faible poids moléculaire.
  • Concentration et volume : apport suffisant pour la méthode d'enrichissement choisie (exonucléase seule, exonucléase + amplification en cercle roulant, ou capture).
  • Contrôles de contamination : contrôles d'extraction simulée (processus) et contrôles sans modèle pour détecter les contaminations croisées.
  • Chaîne de conservation et métadonnées : source de l'échantillon, protocole d'extraction, lots de réactifs, opérateur et approche d'enrichissement prévue.

Liste de contrôle d'acceptation de style SOP (illustrative) :

  • Recevoir et enregistrer des échantillons avec des identifiants de lot/de course et des conditions de stockage.
  • Inspectez la trace du TapeStation/Bioanalyzer ; procédez si la bande HMW domine et que le flou est minimal.
  • Quantifiez l'ADN ; confirmez que l'entrée répond au minimum requis pour le protocole sélectionné.
  • Préparez des contrôles de contamination ; incluez une extraction fictive et sans modèle.
  • Enregistrer les métadonnées dans le LIMS : source, numéros de lot, ID de l'opérateur, méthode d'enrichissement prévue.

Notes supplémentaires de contrôle qualité avant séquençage pour les stratégies hybrides :

  • Pour ONT/PacBio exécute, confirme l'extraction douce et le cisaillement minimal ; envisage la sélection de taille uniquement si justifiée par les objectifs du projet (par exemple, en se concentrant sur des cercles de >1 kb).
  • Pour Illumina Circle-Seq, prévoyez des cycles RCA conservateurs et un nettoyage post-amplification pour minimiser les artefacts concatémiques.
  • Si l'enrichissement basé sur la capture est utilisé, des ensembles de sondes pilotes avec des cercles synthétiques doivent être utilisés pour confirmer la récupération et la spécificité des cibles avant de passer à l'échelle.

Mesure de l'efficacité d'enrichissement de l'eccDNA avec qPCR et des spike-ins

L'enrichissement efficace des eccDNA montre deux signatures : la déplétion de l'ADN linéaire nucléaire et la rétention de l'ADN circulaire (y compris mitochondrial). Le qPCR d'un gène nucléaire par rapport à l'ADN mitochondrial est un contrôle rapide et routinier. L'ajout de spikés exogènes de plasmides circulaires et linéaires fournit une mesure calibrée de la récupération.

Éléments clés de configuration :

  • Marqueur de déplétion nucléaire : choisissez un gène nucléaire à copie unique peu susceptible de former de l'eccDNA dans des conditions de base (par exemple, COX5B ou ACTB). Suivez son signal qPCR avant et après digestion.
  • Contrôle de rétention circulaire : utiliser un gène mitochondrial (l'ADNmt est circulaire) pour vérifier que les molécules circulaires persistent.
  • Spike-ins exogènes : ajouter un plasmide circulaire connu et un plasmide linéarisé avant l'enrichissement pour calculer les rapports circulaire : linéaire récupérés après le traitement.

qPCR fold-change bar chart comparing depletion of a linear nuclear gene versus retention of mitochondrial circular DNA before and after enrichment.

Figure 2. changement en fold de qPCR avant et après enrichissement : déplétion d'un marqueur nucléaire linéaire (ΔCt illustratif 22 → 30) contre rétention de l'ADN circulaire mitochondrial (ΔCt illustratif 20 → 21) ; changements en fold calculés par la méthode 2^−ΔΔCt (barres d'erreur = réplicats techniques).

Calcul de référence, non engageant :

  • Supposons que les valeurs Ct avant enrichissement soient : Nucléaire = 22 et ADNmt = 20 ; les valeurs Ct après digestion sont : Nucléaire = 30 et ADNmt = 21.
  • Quantité relative (RQ) via ΔCt (2^-ΔCt) : Déplétion nucléaire ≈ 2^(22−30) ≈ 1/256 ; rétention d'ADNmt ≈ 2^(20−21) ≈ 1/2.
  • Signalez un "rapport de récupération circulaire:linéaire" (défini explicitement dans votre SOP) en utilisant l'ADNmt et des spike-ins : le rapport du signal circulaire retenu par rapport au signal linéaire épuisé après enrichissement. Dans cet exemple, ADNmt par rapport à l'ADN nucléaire ≈ 128, indiquant une forte rétention par rapport à l'épuisement.

Considérations à travers les plateformes :

  • La méthode Circle-Seq à lecture courte d'Illumina avec exonucléase + RCA offre une haute sensibilité mais peut augmenter le nombre de duplicats ; gardez les cycles de RCA conservateurs et vérifiez la complexité de la bibliothèque.
  • Le séquençage direct à long fragment d'Oxford Nanopore des cercles enrichis capture des lectures traversant les jonctions et des distributions de taille, aidant à la validation structurelle.
  • Les stratégies de capture PacBio HiFi peuvent fournir des lectures de haute précision de cercles plus grands ; planifiez les exigences d'entrée et les conceptions de sondes de capture en conséquence.
  • Stratégie hybride : associer Illumina pour la profondeur avec ONT/PacBio pour la confirmation structurelle. Utiliser des contrôles de spike-in et de qPCR cohérents sur tous les chemins pour comparer l'efficacité d'enrichissement.

Exemple travaillé avec des spike-ins (illustratif) :

  • Ajoutez 10 ng d'un plasmide circulaire connu (par exemple, 2-3 kb) et 10 ng du même plasmide linéarisé par digestion par restriction à l'extraction avant le traitement avec l'exonucléase.
  • Après enrichissement et nettoyage, quantifiez par qPCR avec des amorces couvrant des régions uniques du plasmide. Si les estimations post-enrichissement indiquent 7,5 ng circulaire et 0,01 ng linéaire, le rapport de récupération circulaire:linéaire est de 750, montrant une rétention préférentielle des formes circulaires.
  • Remarque : l'abondance de l'ADNmt varie selon les tissus ; comparez les rapports de spike-in entre les lots pour surveiller la stabilité du processus.

Contrôle de qualité post-séquençage : support de cartographie, arrière-plan et normalisation de l'abondance

Une fois le séquençage terminé, les appels d'eccDNA doivent être soutenus par des preuves d'alignement claires et des niveaux de fond raisonnables. C'est ici que les pratiques de "qc de séquençage eccdna" convergent entre les données de lecture courte et de lecture longue.

Cartographie et seuils de preuve :

  • Soutien aux lectures fractionnées/déformées : les preuves traversant les jonctions sont essentielles dans les bibliothèques de courtes lectures (par exemple, les comptes minimum de lectures fractionnées ajustés à la complexité du génome).
  • Paires discordantes : des signaux de soutien provenant d'anomalies en paires renforcent la confiance.
  • Long format jonctions : les lectures directes couvrant les jonctions réduisent l'ambiguïté ; inspectez la couverture par cercle et les distributions de longueur des lectures.

Normalisation de l'abondance et suivi de fond :

  • Normalisez les comptes en eccDNAs par million de lectures mappées (EPM) ou un métrique similaire normalisé en fonction de la profondeur.
  • Suivre le contenu linéaire résiduel : rapporter la fraction de lectures se mappant aux régions linéaires canoniques par rapport aux jonctions circulaires ; inclure des marqueurs de gènes nucléaires ou des fenêtres génomiques sélectionnées comme proxy de fond.
  • Définissez un "Ratio Enrichi en Cercles" personnalisé pour vos rapports, avec la formule clairement énoncée (par exemple, le nombre de lectures soutenant les jonctions divisé par le nombre total de lectures mappées dans la bibliothèque d'enrichissement). Considérez-le comme une métrique spécifique au projet plutôt qu'une norme communautaire.

Notes de QC spécifiques à la plateforme :

  • Illumina à lecture courte : surveiller les taux de duplication et les séquences sur-représentées dans FastQC ; inspecter les distributions des tailles d'insertion ; s'assurer que les comptes de lectures couvrant les jonctions dépassent vos seuils d'acceptation internes.
  • ONT long-read : évaluer la précision par lecture et la performance des homopolymères ; confirmer les appels de jonction via plusieurs lectures ; considérer les journaux d'échantillonnage adaptatif s'ils ont été utilisés.
  • PacBio HiFi : vérifier la précision des lectures et les distributions de longueur ; s'assurer que les cibles de capture sont représentées avec une couverture suffisante ; inspecter la précision du consensus pour les séquences de jonction.

Reproductibilité des pipelines hybrides :

  • Standardiser le contrôle de qualité des lectures (FastQC/fastp) et l'alignement (BWA-MEM pour les courtes lectures ; Minimap2 pour les longues lectures). Utiliser des environnements conteneurisés et des fichiers de paramètres fixes.
  • Pour la détection, envisagez des outils complémentaires (Circle-Map, CReSIL, ecc_finder, eccDNA-pipe) et enregistrez les versions exactes.
  • Générez des PDF de QC avec des seuils et des comptes de preuves par cercle ; incluez un dictionnaire de données décrivant les champs et les filtres.

Les étapes de contrôle qualité en bioinformatique sont détaillées dans l'aperçu des services de CD Genomics : Services de bioinformatique.

Exemples de commandes (illustratives ; épinglez les versions dans votre SOP) :

# Short-read alignment
bwa mem -t 16 reference.fa sample_R1.fastq.gz sample_R2.fastq.gz | samtools view -Sb - > sample.bam
samtools sort -@ 8 -o sample.sorted.bam sample.bam
samtools index sample.sorted.bam

# Long-read alignment
minimap2 -t 16 -ax map-ont reference.fa sample_ONT.fastq.gz | samtools sort -o sample_ONT.sorted.bam -
samtools index sample_ONT.sorted.bam

# Circle-Map detection (example; adjust parameters)
Circle-Map Realign -i sample.sorted.bam -o sample.circlemap.bam -r reference.fa
Circle-Map Detect -i sample.circlemap.bam -o sample_circles.bed

# ecc_finder (conceptual)
python ecc_finder.py --in sample.sorted.bam --ref reference.fa --out eccfinder_calls.bed

Documentez les versions des outils, les paramètres et les seuils aux côtés de ces commandes dans votre rapport de contrôle qualité.


Reproductibilité : Réplicats biologiques, corrélations et acceptation

La reproductibilité est l'ancre de la confiance. Votre logique d'acceptation doit distinguer les réplicats biologiques des répétitions techniques et inclure des métadonnées de lot.

Replicate correlation scatter plot (Replicate 1 vs Replicate 2) with R-squared annotation for eccDNA abundance.

Figure 3. Répliquer la concordance pour l'abondance d'eccDNA (EPM) : nuage de points de Répétition 1 par rapport à Répétition 2 avec R² annoté pour indiquer la reproductibilité à travers les loci génomiques.

Rapport recommandé, présenté comme une pratique plutôt que comme des promesses :

  • Chevauchement de présence/absence : calculer le chevauchement d'intervalle réciproque (par exemple, seuils de chevauchement ≥50%) entre les réplicats biologiques.
  • Corrélations : rapportez les corrélations de Pearson ou de Spearman pour les comptes d'eccDNA normalisés en fonction de la profondeur (EPM) à travers les bins génomiques ou les gènes.
  • Variabilité : résumer le coefficient de variation (CV) pour le soutien de lecture par cercle et signaler les valeurs aberrantes.
  • Notes de lot : enregistrer l'opérateur, les numéros de lot des réactifs, les identifiants des courses d'instrument et les conditions de reprise.

Considérations sur la stratégie hybride pour la reproductibilité :

  • Utilisez Illumina pour stabiliser la détection basée sur la profondeur et ONT/PacBio pour valider la structure, puis réconciliez les appels entre les plateformes.
  • Lorsque l'accord est partiel, privilégiez les cercles avec un soutien multi-preuves (lectures fractionnées, paires discordantes et jonctions de longues lectures). Documentez les règles de décision dans le rapport de contrôle qualité.

Guide d'acceptation (illustratif) :

  • Accepter un lot lorsque le chevauchement de réplication et les corrélations respectent les seuils définis en interne et que les contrôles de contamination sont propres.
  • Signaler pour examen lorsque les taux de duplication ou le fond linéaire résiduel dépassent les attentes internes.
  • Relancez la digestion ou re-séquencez lorsque les preuves de jonction sont systématiquement inférieures aux seuils internes malgré une profondeur suffisante.

Résumé de la reproductibilité inter-institutions (illustratif, non engageant) :

Alors que les benchmarks formels multi-laboratoires pour l'eccDNA restent rares, des études indépendantes fournissent des signaux illustratifs utiles. Par exemple, le séquençage parallèle à cellule unique dans González et al., scEC&T‑seq (2023) rapporté une forte concordance inter-plateformes (Illumina vs. Nanopore ; Pearson R ≈ 0,95 pour les ensembles de données appariés). Une comparaison de méthodes distincte de 2024 a rapporté une concordance de réplicats plus élevée pour les lectures courtes/longues de type WGS (>50 % et ~54 %, respectivement) par rapport à certaines variantes de Circle-Seq, soulignant la dépendance au protocole plutôt que la reproductibilité universelle. Rapportez ces chiffres comme des observations au niveau de l'étude (inclure le type d'échantillon, la plateforme et n lorsque disponible) et traitez-les comme illustratifs, et non comme des garanties de service.


Dépannage des données de mauvaise qualité : Symptômes courants et actions correctives

Lorsque des drapeaux QC apparaissent, agissez rapidement avec des diagnostics basés sur les symptômes et des corrections ciblées. Ci-dessous se trouve une matrice de dépannage compacte que vous pouvez adapter.

Symptôme Cause probable Vérification immédiate Action corrective
Fonds linéaire élevé après digestion Activité exonucléase incomplète ; dégradation du tampon ou de l'enzyme qPCR nucléaire vs ADNmt ; vérifier le lot d'enzyme et l'incubation. Répéter la digestion avec une enzyme fraîche ; optimiser le tampon/l'incubation ; inclure des contrôles de processus.
Bibliothèques à faible complexité (duplication élevée) Suramplification RCA ; formation de concatémères Duplication FastQC ; profil de taille de bibliothèque ; revue du cycle RCA Titrer l'entrée RCA ; raccourcir l'amplification ; purifier les cercles ; envisager l'enrichissement basé sur la capture.
Biais de taille/séquence Dépendance au site de restriction ou biais de sonde de capture Couverture vs flancs ; répéter l'analyse de contenu Utilisez la tagmentation ou des mélanges d'enzymes ; redessinez les sondes de capture ; notez le biais attendu dans le rapport.
Contamination dans les contrôles Transfert ou contamination par les réactifs Signaux de contrôle d'extraction sans modèle et de simulation Auditer l'espace de travail ; remplacer les réactifs ; retraiter avec des contrôles de contamination plus stricts.
Support de jonction insuffisant Profondeur trop faible ; filtres agressifs Tables de support de lecture par cercle ; révision des filtres Augmenter la profondeur de séquençage ; assouplir les filtres de manière conservatrice ; agréger les réplicats.

Orientation décisionnelle (illustrative) :

  • Si la digestion échoue (le signal nucléaire qPCR reste élevé), arrêtez la préparation en aval et répétez la digestion.
  • Si la duplication dépasse les attentes et que des artefacts structurels apparaissent, ajustez la RCA ou passez à l'enrichissement basé sur la capture et re-séquencez.
  • Si une contamination est détectée dans les contrôles, annulez le lot, décontaminez et relancez avec des réactifs propres.
  • Si le support de jonction est marginal, augmentez la profondeur ou combinez les répliques ; notez les mises en garde dans les livrables.

Validation et Audit : Documentation, LIMS et Pipelines Reproductibles

Un programme de contrôle qualité n'est aussi solide que sa documentation. Préparez des dossiers auditable qui capturent les méthodes, les paramètres et les preuves.

Champs de métadonnées recommandés (tableau d'exemple) :

Champ Description
ID d'échantillon, ID de lot/exécution Identifiants uniques pour la traçabilité
Source et stockage Tissu/lignée cellulaire, méthode de conservation
Protocole d'extraction Kit ou réactifs ; version ; opérateur
Méthode d'enrichissement Exonucléase seule, exonucléase+RCA, capture ; justification
Conception de spike-in Contrôles circulaires et linéaires ; montants d'entrée
cibles de qPCR Gène nucléaire, ADNmt, ensembles d'amorces
Paramètres de préparation de bibliothèque Masse d'entrée, cycles, version du kit
Détails du séquenceur/exécution Plateforme, cellule de flux/puce, version chimique
Versions de bioinformatique Aligneurs et détecteurs ; étiquettes de conteneurs ; paramètres
Notes d'acceptation Métriques de chevauchement/corrélation ; indicateurs de décision

Reproductibilité des pipelines :

  • Conteneurisez tous les logiciels (Docker/Singularity) ; épinglez chaque outil à une version.
  • Conservez les fichiers de paramètres sous Git ; exportez une section "méthodes" lisible par l'homme.
  • Produire des livrables standardisés : FASTQ, BAM aligné, tableaux d'appels d'ecDNA (semblables à BED), un rapport de contrôle qualité au format PDF et un dictionnaire de données concis.

Page de résumé QC du modèle (illustratif) :

  • Aperçu : nom du projet, identifiants de lot, plateformes utilisées (Illumina + ONT/PacBio), liste des échantillons.
  • Pré-QC : Notes d'acceptation TapeStation/Bioanalyzer, quantités d'entrée, contrôles de contamination.
  • Contrôle qualité de l'enrichissement : valeurs qPCR nucléaires vs ADNmt, ratios de récupération des ajouts, paramètres de digestion.
  • Contrôle qualité de la bibliothèque : concentration, distribution des fragments, métriques de duplication.
  • Contrôle de qualité de séquençage : profondeur, taux de cartographie, comptes de soutien des jonctions.
  • Résumé de la détection : nombre d'eccDNAs, EPM, définition et valeurs du ratio enrichi en cercles.
  • Reproductibilité : chevauchement de réplication, corrélation (R, R^2), distributions de CV.
  • Décisions : accepter/retraiter/reclasser les indicateurs et les justifications.

Références pour l'adoption externe : Pour la structure et les étapes des SOP en laboratoire humide, voir Protocole de purification à l'échelle du génome de l'ADN circulaire extrachromosomique de JOVE 2016Pour la formation sur les flux de travail de séquençage basés sur la circularisation applicables à Circle-Seq, veuillez vous référer à Protocole d'essai off-target CIRCLE-seq de JOVE 2024; citez ces éléments comme des matériaux tiers illustratifs plutôt que comme des garanties de service.


Conclusion : Transformez le QC en SOP sur lesquels vous pouvez compter.

La qualité est un processus, pas une promesse. Définissez des étapes explicites et mesurables : HMW intégrité de l'ADN, vérifications d'enrichissement basées sur qPCR, métriques post-séquençage basées sur des preuves, et reproductibilité au niveau des réplicats - le tout consigné dans un rapport vérifiable. Si vous avez besoin d'un cadre pratique pour concevoir et documenter des cohortes d'études sur l'eccDNA, des contrôles et des livrables, les conseils de style plan dans considérations de conception d'étude sur l'eccDNA peut aider à traduire ces normes de contrôle qualité en plans de projet.

Auteur

Yang H. — Chercheur senior, CD Genomics ; Université de Floride.

Yang est un chercheur en génomique avec plus de 10 ans d'expérience en recherche dans les domaines de la génétique, de la biologie moléculaire et cellulaire, des flux de travail de séquençage et de l'analyse bioinformatique. Compétent à la fois dans les techniques de laboratoire et l'interprétation des données, Yang soutient la conception d'études RUO et les projets basés sur le séquençage de nouvelle génération (NGS).


Références :

  1. L'évaluation quantitative révèle la dominance des eccDNAs endogènes dans le génome humain — Mouakkad-Montoya et al., PNAS (2021). DOI : 10.1073/pnas.2102842118.
  2. eccDNA-pipe : un pipeline intégré pour l'identification, l'analyse et l'annotation de l'ADN circulaire extrachromosomique — Fang et al., Briefings in Bioinformatics (2024). DOI : 10.1093/bib/bbae034.
  3. ecc_finder : Un outil robuste et précis pour détecter l'ADN circulaire extrachromosomique — Zhang et al., Frontiers in Plant Science (2021)DOI : 10.3389/fpls.2021.743742.
  4. ADN circulaire extrachromosomique : État actuel et perspectives futures — Zhao et al., eLife (2022). DOI : 10.7554/eLife.81412.
  5. Séquençage parallèle des ADN circulaires extrachromosomiques et des transcriptomes complets à résolution unicellulaire (scEC&T-seq) — González et al., Nature Communications/PMC (2023).
  6. ADN circulaire extrachromosomique comme nouveau biomarqueur de la progression du cancer colorectal — Qiu et al., Médecine Moléculaire (2025). DOI : 10.1186/s10020-025-01164-y.
  7. L'atlas d'eccDNA chez les souris mâles révèle des caractéristiques protégeant les gènes contre la formation d'eccDNA induite par la transcription — Liang et al., Nature Communications (2025). DOI : 10.1038/s41467-025-57042-y.
  8. Formation d'ADN circulaire médiée par la microhomologie à partir de l'ADN génomique — Hu et al., eLife prépublication (2023).
  9. Un profil d'ADN circulaire distinct interagit avec les changements du protéome dans des contextes pathologiques — Gerovska et al., 2023, PMC10498603.
  10. Analyse quantitative avec les systèmes Agilent TapeStation — Agilent Technologies, Aperçu Technique 5994-8050EN (2025).
  11. Contrôle de qualité des échantillons dans les solutions NGS d'Agilent (TapeStation/Bioanalyzer) — Agilent Technologies, Note d'application 5994-0127EN (2018).
  12. Dépôt Circle-Map — Prada-Luengo et al., GitHub (2020–2025).
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut