Le guide ultime du séquençage des eccDNA : définitions vs ecDNA, flux de travail sur le cancer et ressources de l'atlas inter-espèces.
L'ADN circulaire extrachromosomique (eccDNA) est passé d'une curiosité à un objectif de recherche pratique dans les domaines de l'oncologie, de la biologie du développement et de la génomique des plantes. Ce guide apporte de la clarté sur trois axes : (1) des définitions précises et des distinctions entre eccDNA et ecDNA ; (2) des workflows de détection et de séquençage axés sur le cancer, couvrant le laboratoire humide et la bioinformatique ; et (3) la navigation dans un atlas/base de données inter-espèces. L'objectif est de vous aider à assembler des expériences et des analyses rigoureuses sans confondre le petit eccDNA avec le grand ecDNA oncogénique.
Principaux enseignements
- Utilisez "eccDNA" pour décrire les petits fragments d'ADN circulaires et "ecDNA" pour les grands cercles oncogéniques (≈0,1–10 Mb) ; ils diffèrent par leur taille, leur contenu génétique et leur comportement.
- Pour séquençage d'eccDNALes lectures courtes excellent dans la détection de points de rupture dans les flux de travail d'enrichissement (par exemple, Circle-Seq), tandis que les lectures longues sont essentielles pour reconstruire de grandes structures d'ecDNA.
- Un flux de travail robuste élimine l'ADN linéaire (exonucléases), amplifie les cercles (RCA phi29), valide les jonctions (PCR/Sanger) et confirme la structure/emplacement (FISH, cartographie à lecture longue ou optique).
- Des bases de données récentes (par exemple, eccDNABase, scEccDNAdb) offrent des entrées multi-espèces et des contextes unicellulaires ; utilisez-les pour vérifier les résultats et planifier des expériences.

eccDNA vs ecDNA : terminologie claire et différences fondamentales
La confusion entre eccDNA et ecDNA entraîne des interprétations erronées. L'eccDNA désigne généralement de petites molécules d'ADN circulaires provenant de fragments chromosomiques et apparaissant dans des tissus normaux et cancéreux, tandis que l'ecDNA fait référence à de grands amplificats circulaires (≈0,1–10 Mb) enrichis dans les cancers, portant souvent des oncogènes intacts et des éléments régulateurs. Des revues autorisées définissent ces frontières, y compris l'aperçu de l'eccDNA de 2024 par Wang et ses collègues et la synthèse de 2024 dans Frontiers in Genetics par Zhou et ses co-auteurs. Pour la prévalence et les implications de l'ecDNA, le guide de 2025 de Weiser et ses co-auteurs dans Cancer Discovery agrège des preuves pan-cancéreuses.
| Caractéristique | eccADN | ecADN |
|---|---|---|
| Taille typique | Sous-kb dominant ; souvent <500–800 pb ; peut atteindre plusieurs kb dans les cancers. | ≈0,1–10 Mo ; souvent des cercles de 1–3 Mo |
| Contenu génétique | Fragments partiels ; rarement des gènes entiers | Transporte fréquemment des oncogènes intacts et des éléments régulateurs. |
| Amplification | Typiquement pas amplifié de manière clonale. | Amplification à haute copie ; évolution rapide |
| Prévalence | Présent dans les tissus normaux et cancéreux | Enrichi dans divers cancers (~17 % pan-cancer) |
| Rôles | Réponses potentielles aux régulations/stress | Conduit à l'hétérogénéité et à la résistance aux thérapies |
Les lectures de soutien avec méthodes et définitions incluent la revue en libre accès de Wang de 2024 dans PMC et l'article de Zhou de 2024 dans Frontiers in Genetics sur les méthodes d'identification, tandis que le rôle du ecDNA dans le cancer est synthétisé dans la revue de Weiser de 2025 dans Cancer Discovery.
Comment se forme l'eccDNA et pourquoi est-ce important
Les mécanismes couvrent les voies de dommages et de réparation de l'ADN :
- La jonction par microhomologie (MMEJ) et la jonction alternative peuvent circulariser des fragments au niveau des tracts de microhomologie.
- La jonction des extrémités non homologues (NHEJ) et la recombinaison homologue (HR) produisent des cercles dans des contextes de cassures double brin.
- Des événements catastrophiques comme la chromothripsie et les cycles de rupture-fusion-pont génèrent de grands amplifications qui peuvent se circulariser en ecDNA.
Ces modèles affectent la détection. Par exemple, les jonctions riches en microhomologie favorisent la découverte de lectures éclatées dans les ensembles de données à courtes lectures, tandis que l'ecDNA complexe et répétitif nécessite souvent une résolution à longues lectures et une reconstruction basée sur des graphes. Les synthèses de méthodes récentes et le contexte historique sont résumés dans des revues de 2024-2025, y compris l'aperçu des théranostics de 2025.
Boîte à outils de détection : étapes en laboratoire humide, contrôle qualité et pièges courants
Un fiable détection d'eccDNA Le flux de travail élimine l'ADN linéaire, augmente l'abondance de l'ADN circulaire et valide les structures avant le séquençage.
-
Digestion d'exonucléase de l'ADN linéaire
- La DNase Plasmid-Safe (PSD) dégrade sélectivement l'ADN linéaire avant l'amplification en cercle roulant (RCA). Soyez attentif aux cercles entaillés qui peuvent être vulnérables à certaines nucléases ; un aperçu de 2024 décrit les choix d'enzymes et les mises en garde.
- Les flux de travail de l'exonucléase V RecBCD utilisent des digestions en série (souvent jusqu'à 48 heures) avec inactivation par la chaleur ; la qPCR des marqueurs nucléaires (par exemple, HBB) et mitochondriaux (par exemple, MT-CO1/ND5) peut suivre l'épuisement.
-
Déplétion de l'ADN mitochondrial
- Si le transport de l'ADNmt est élevé, des stratégies pour linéariser et digérer l'ADNmt (endonucleases ou coupures guidées par CRISPR) peuvent réduire le bruit avant l'amplification par RCA, comme résumé dans les revues de méthodes de 2024-2025.
-
Amplification par cercle roulant (phi29)
- L'RCA isothermique utilisant phi29 renforce l'ADN circulaire. Notez le biais en faveur des petits cercles ; prévoyez une validation orthogonale pour les candidats plus grands.
-
Enrichissement Circle-Seq et séquençage à lecture courte
- Les étapes typiques incluent un traitement alcalin et une séparation sur colonne, une digestion PSD, une amplification par RCA phi29, une préparation de bibliothèque et un séquençage en paires. Des bio-informatique centrées sur les jonctions (lectures éclatées et paires discordantes) suivent.
-
Centrifugation en gradient de densité CsCl–EtBr
- Dans des échantillons avec une abondance de cercles plus élevée, la séparation par densité de flottation peut enrichir davantage les cercles, souvent associée à des exonucléases.
Points saillants du contrôle qualité et du dépannage :
- Vérifiez l'élimination de l'ADN linéaire par qPCR avant la RCA pour réduire les artefacts.
- Valider les cercles putatifs par PCR inverse/vers l'extérieur et séquençage Sanger des jonctions.
- Si l'ADNmt domine les lectures, ajoutez une déplétion ciblée ou ajustez l'extraction pour réduire l'ADN organellaire.
Pour des pratiques générales de qualité des acides nucléiques applicables aux flux de travail ADN, consultez ce guide pratique sur l'extraction et le contrôle qualité de notre base de connaissances : Le guide le plus complet sur l'extraction d'ARNSes principes en matière de rendement, de pureté et d'intégrité se traduisent bien dans les contextes de l'ADN.
Stratégies de séquençage pour le séquençage d'eccDNA : courtes vs longues lectures et quand utiliser chacune.
Le choix d'une plateforme dépend de la taille du cercle, de la résolution structurelle requise et du budget.
-
Lectures courtes Illumina (150–300 pb PE)
- Forces : haute précision de base ; détection sensible des petits eccDNA ; cartographie précise des points de rupture via des lectures éclatées et des paires discordantes. Les synthèses de méthodes, y compris la revue Theranostics de 2025, discutent de ces avantages.
- Limitations : résolution médiocre pour les cercles grands/répétitifs ; la reconstruction complète de l'ecDNA complexe est souvent impossible sans un soutien de lecture longue.
-
Lectures longues HiFi de PacBio (10–25 ko+) et Lectures longues d'Oxford Nanopore (de dizaines à des centaines de ko ; ultra-long réalisable)
- Forces : capture de longues séquences à travers les répétitions, permettant la reconstruction de grands cercles ou de cercles complexes et d'ecDNA ; ONT offre également des signaux de méthylation natifs. Les applications dans les contextes de biopsie liquide sont résumées par Si et ses collègues (2024).
- Limitations : taux d'erreur par lecture plus élevés (surtout ONT ; atténués par consensus/polissage), exigences de coût/d'entrée et nécessité d'une validation orthogonale.
-
Stratégies hybrides
- Combinez des lectures courtes pour la précision des jonctions avec des lectures longues pour l'échafaudage et la reconstruction complète. C'est souvent le chemin pragmatique pour l'ecDNA suspecté.
Les pages de contexte qui encadrent les décisions entre lectures courtes et longues en transcriptomique offrent également des analogies utiles pour l'ADN : les aperçus des plateformes et les amorces pour lectures courtes et longues peuvent aider à structurer la réflexion autour des compromis en matière de précision, de longueur de lecture et de débit. Service de séquençage du transcriptome et d'analyse des données et Séquençage cDNA à lecture courte vs séquençage cDNA à lecture longue et séquençage direct de l'ARN.
Pipelines de bioinformatique : des lectures aux appels d'ADN circulaire
Un ensemble d'outils pratiques a émergé entre 2024 et 2026 :
- eccDNA‑pipe intègre des fichiers FastQ bruts (WGS, Circle‑Seq ou Circulome-seq) avec des modules de détection (Circle‑Map ou AmpliconArchitect), puis effectue l'annotation et la visualisation ; voir la description de Fang et ses collègues en 2024 dans Briefings in Bioinformatics.
- Circle-Map détecte les jonctions d'eccDNA dans les ensembles de données d'enrichissement, fournissant des coordonnées et des distributions de taille ; cette approche est abordée dans les revues méthodologiques de 2024.
- AmpliconArchitect (AA) reconstruit des graphes d'amplicons focaux dans des ensembles de données de séquençage du génome entier (WGS) ; AmpliconClassifier (AC) catégorise les structures (ecDNA/cyclique, BFB, HSR, complexe, linéaire). Une validation croisée avec la cytogénétique et des lectures longues est recommandée ; la revue de Weiser de 2025 résume l'utilisation et les performances de AA/AC.
- Des ressources complémentaires comme CytoCellDB effectuent des appels dans des contextes de caryotype et de lignées cellulaires pour soutenir la classification et la génération d'hypothèses.
Résultats à attendre :
- Coordonnées et tailles pour les petits eccDNA ;
- Classes structurelles et nombre de copies pour l'ecDNA ;
- Annotations génétiques et artefacts de visualisation (graphes de points de rupture, graphiques de Manhattan, modèles 3D) ;
- Drapeaux QC indiquant la confiance et l'état de validation.
Bases de données et navigation dans les atlas à travers les espèces
Plusieurs ressources mises à jour vous aident à explorer l'ADN circulaire à travers les tissus et les organismes :
- eccDNABase (2025, Biologie Moléculaire et Évolution) propose des entrées multi-espèces avec des options d'annotation et de téléchargement ; utilisez les filtres par espèce et exportez en BED/CSV lorsque cela est proposé. Consultez la description de la base de données 2025 sur le site de MBE.
- scEccDNAdb (2024, Oxford Academic Database) intègre des contextes d'eccDNA à cellule unique pour l'homme et la souris ; consultez l'article de la base de données 2024 pour le lien du portail et des exemples de requêtes.
- Des ensembles de données de l'atlas des tissus de souris publiés en 2025 rapportent les distributions d'eccDNA à travers les tissus et les groupes d'âge, utiles pour des attentes de référence.
- CytoCellDB (2024, NAR Cancer) se concentre sur les caryotypes des lignées cellulaires cancéreuses et prend en charge les prédictions d'ecDNA/HSR qui complètent les résultats d'AmpliconSuite.
Conseils pratiques :
- Commencez par des requêtes centrées sur les gènes (oncogènes, gènes de réponse au stress), puis passez aux filtres par espèce et par tissu.
- Exporter les entrées et suivre les métadonnées (type d'échantillon, plateforme, profondeur) pour éviter de trop généraliser à travers des ensembles de données hétérogènes.
Validation axée sur le cancer : combiner des preuves orthogonales
Aucune méthode unique n'est suffisante. Une pile de confirmation robuste comprend généralement :
- PCR des jonctions (externe/inverse) suivi du séquençage Sanger pour confirmer la topologie circulaire et les points de rupture exacts.
- FISH pour visualiser les motifs de localisation et d'amplification.
- Lecture longue (ONT/PacBio) ou cartographie génomique optique pour résoudre les architectures répétitives et vérifier les modèles d'ecDNA.
L'association de ces méthodes augmente la confiance et améliore l'interprétabilité pour les études fonctionnelles en aval.
Génomique des plantes : preuves et adaptations des méthodes
Les systèmes de plantes offrent des exemples clairs et validés ainsi que des considérations techniques uniques.
- Le profilage du riz (Oryza sativa) avec Circle-Seq a identifié des dizaines de milliers de petits eccADNs à travers les tissus, les conditions environnementales modulant leur abondance ; la plupart des cercles se situaient dans la plage de 200 à 400 pb, comme rapporté dans une étude en accès libre de 2024.
- Dans Amaranthus palmeri, la résistance aux herbicides est associée à de grands réplicons portant EPSPS et, dans certains cas, GS2 ; l'ADN circulaire réarrangé soutient la double résistance, selon un article de Plant Cell de 2025.
Notes de méthode pour les plantes :
- Adapter l'extraction pour gérer les parois cellulaires et les métabolites secondaires ; inclure des étapes de nettoyage pour réduire les inhibiteurs.
- Plan de déplétion de l'ADN organellaire pour limiter le transfert des plastides/mitochondries.
- Utilisez des lectures longues et la PCR en jonction pour valider les structures ; la FISH sur les noyaux est réalisable dans certains tissus.
Mettre le tout ensemble : un flux pratique de bout en bout
Commencez par une extraction soigneuse et un contrôle qualité pour garantir un ADN de haute masse moléculaire (surtout si des lectures longues sont prévues). Éliminez l'ADN linéaire via des exonucleases et, si nécessaire, dépletez l'ADNmt. Amplifiez les cercles avec la RCA phi29 tout en surveillant un éventuel biais de taille. Choisissez le séquençage en fonction des objectifs : lectures courtes Illumina pour la découverte de petits eccDNA et le cartographie des points de rupture ; PacBio HiFi ou Nanopore pour des ecDNA suspects de grande taille et des répétitions complexes ; approches hybrides lorsque la précision et la structure sont nécessaires. Analysez les données d'enrichissement avec Circle-Map ou eccDNA-pipe ; interrogez le WGS pour l'ecDNA en utilisant AmpliconArchitect + AmpliconClassifier et soutenez les classifications avec un contexte cytogénétique provenant de CytoCellDB. Validez les candidats avec PCR de jonction/Sanger, imagerie FISH, et cartographie par lectures longues ou optique. Enfin, croisez les résultats dans des bases de données telles que eccDNABase et scEccDNAdb pour situer vos résultats dans un paysage inter-espèces plus large.
Prochaines étapes et ressources
Divulgation : CD Genomics est notre produit. Lors de la planification des choix de plateforme et de la conception de l'étude, les pages de présentation des plateformes et les amorces courtes et longues peuvent aider à structurer les décisions sans imposer une approche unique. Pour les lecteurs intéressés par les parallèles entre les acides nucléiques circulaires, un aperçu du séquençage des circARN offre un contexte utile. Ressources internes :
- Aperçu de la plateforme : Service de séquençage d'eccDNA
FAQ — Questions fréquentes sur le séquençage de l'eccDNA
Q1 — Quelle est la différence entre eccDNA et ecDNA ?
A1 — eccDNA fait référence à des molécules d'ADN circulaires relativement petites dérivées de fragments chromosomiques et couramment trouvées dans des tissus normaux et malades ; ecDNA désigne des amplifications circulaires beaucoup plus grandes (≈0,1–10 Mb) qui portent fréquemment des oncogènes intacts et entraînent l'hétérogénéité tumorale et la résistance, comme synthétisé dans des revues récentes telles que Wang 2024 et Weiser et al. 2025.
Q2 — Quelles sont les étapes essentielles en laboratoire humide pour les flux de travail de séquençage d'eccDNA ?
A2 — Les étapes clés sont : extraction soigneuse (préserver l'ADN de haute masse moléculaire pour des lectures longues), élimination sélective de l'ADN linéaire (par exemple, DNase Plasmid-Safe ou RecBCD), déplétion mitochondriale optionnelle, amplification en cercle roulant (phi29) pour les protocoles enrichis, et préparation de la bibliothèque adaptée à la plateforme choisie. Voir la section boîte à outils de détection pour les points de contrôle et les mises en garde phi29/RCA résumées dans. Wang 2024.
Q3 — Lectures courtes, lectures longues ou hybride — que devrais-je choisir ?
A3 — Utilisez des lectures courtes (Illumina) pour la détection sensible de petits eccDNA et le mappage précis des jonctions ; choisissez des lectures longues (PacBio HiFi ou ONT) pour résoudre de grandes architectures ecDNA répétitives ; combinez les deux (hybride) lorsque vous avez besoin de précision des jonctions et d'une reconstruction complète de la structure (voir la section Stratégies de séquençage et le cadre des plateformes dans le guide).
Q4 — Quels outils de bioinformatique sont recommandés pour les données d'enrichissement par rapport aux données de séquençage du génome entier (WGS) ?
A4 — Pour les données d'enrichissement/Circle‑Seq, des outils centrés sur les jonctions comme Carte circulaire ou des pipelines intégrés tels que eccDNA‑pipe sont couramment utilisés. Pour la découverte et la reconstruction de l'ecDNA par séquençage du génome entier (WGS), utilisez AmpliconArchitect + AmpliconClassifier et valider avec des assemblages de longues lectures ou un mappage optique ; voir Fang et al. 2024 pour eccDNA-pipe et Weiser 2025 pour l'utilisation de AA/AC.
Q5 — Comment devrais-je valider expérimentalement les cercles candidats ?
A5 — Une pile de validation minimale : PCR directe/inverse des jonctions avec séquençage Sanger (confirmation de la topologie), FISH pour localiser l'amplification dans les cellules, et séquençage à longues lectures ou cartographie optique pour confirmer des architectures plus grandes. La combinaison des méthodes augmente la confiance ; voir la section de validation axée sur le cancer.
Q6 — Où puis-je trouver des atlas d'eccDNA inter-espèces et comment les interroger ?
A6 — Commencez par des ressources sélectionnées telles que eccDNABase (2025) pour les entrées multi-espèces et scEccDNAdb (2024) pour des contextes de cellules uniques. Interrogez par gène, espèce ou coordonnées génomiques ; exportez au format BED/CSV lorsque cela est possible et conservez les métadonnées des échantillons (plateforme, tissu, profondeur) pour éviter de trop généraliser à travers des études hétérogènes.
Q7 — Quelles considérations particulières s'appliquent aux échantillons de plantes ?
A7 — Les plantes présentent des défis d'extraction (parois cellulaires, métabolites secondaires) et des résidus d'ADN organellaire. Adapter les étapes d'extraction et de purification, inclure l'épuisement des plastides/mitochondries, et valider avec PCR de jonction plus des lectures longues ou FISH lorsque cela est possible ; des exemples de plantes validés incluent le profilage du riz et des cas de résistance d'Amaranthus cités dans le guide (Zhuang 2024 ; Carvalho‑Moore 2025).
Q8 — Les méthodes d'enrichissement courantes biaisent-elles les distributions de taille des cercles détectés ?
A8 — Oui. Les protocoles RCA (phi29) et Circle‑Seq amplifient de manière préférentielle les petits cercles, ce qui peut sous-représenter les grands ecDNA ; les gradients de CsCl et les approches à longues lectures réduisent ce biais pour les structures plus grandes. Interprétez les distributions de taille en tenant compte du biais méthodologique (voir la boîte à outils de détection et les stratégies de séquençage).
Q9 — L'ADNecc peut-il être détecté de manière fiable dans des types d'échantillons cliniques (FFPE, plasma) ?
A9 — C'est possible mais plus difficile : la fragmentation de l'ADN FFPE et la faible abondance dans le plasma réduisent la sensibilité et augmentent les artefacts. Optimisez l'extraction, incluez des contrôles négatifs solides, envisagez l'enrichissement des cibles ou un séquençage plus approfondi, et validez les candidats de manière orthogonale (PCR/FISH/lectures longues) avant l'interprétation.
Q10 — Comment commencer un projet de séquençage d'eccDNA reproductible ?
A10 — Liste de contrôle initiale clé : définir la question biologique et la plage de taille cible ; sélectionner l'enrichissement par rapport au séquençage génomique complet (WGS) ; planifier la plateforme (courte, longue ou hybride) et la profondeur estimée ; inclure des contrôles de déplétion d'ADN linéaire et des ajouts ; prédéfinir les méthodes de validation (PCR, FISH, longues lectures) ; et enregistrer les métadonnées et les paramètres d'analyse pour la reproductibilité. Utilisez la section Assemblage du flux de travail pratique et les ressources internes de contrôle qualité (par exemple, le guide d'extraction d'ARN) pour des pratiques exemplaires transférables en matière d'échantillons et de contrôle qualité : Guide d'extraction d'ARN et de contrôle qualité.
Référence :
- définitions et méthodes de l'eccDNA (2024) : La revue en libre accès de Wang sur l'eccDNA
- Méthodes d'identification et terminologie (2024) : Frontiers in Genetics revue par Zhou et ses collègues
- Prévalence de l'ecDNA dans le cancer et implications (2025) : Synthèse de Cancer Discovery par Weiser et ses co-auteurs
- Évolution des méthodes et contexte de la plateforme (2025) : Aperçu des flux de travail eccDNA en théranostique
- Base de données multi-espèces (2025) : eccDNABase sur la biologie moléculaire et l'évolution
- Base de données unicellulaire (2024) : scEccDNAdb dans la base de données académique d'Oxford
- Contexte cytogénétique pour les amplicons (2024) : CytoCellDB dans NAR Cancer
- Profilage d'eccDNA de riz (2024) : Étude en libre accès rapportant l'eccDNA à l'échelle des tissus
- Cercles de résistance d'Amaranthus palmeri (2025) : Article sur les grands réplicons dans les cellules végétales