La méthylation de l'ADN, un processus épigénétique essentiel, joue un rôle crucial dans la régulation des gènes et divers processus biologiques. La densité de CpG, la fréquence des dinucléotides CpG dans une région génomique donnée, est devenue un facteur clé dans l'analyse de la méthylation de l'ADN. Différentes techniques moléculaires ont été développées pour étudier les motifs de méthylation de l'ADN à travers les génomes. Dans cet article, nous visons à comparer trois méthodes largement utilisées : Immunoprécipitation de l'ADN méthylé suivie de séquençage (MeDIP-Seq), Séquençage bisulfite à représentation réduite (RRBS) et séquençage bisulfite de tout le génome (WGBS). Nous analysons leurs préférences pour différentes régions de densité CpG et mettons en évidence leurs forces et leurs limites dans l'analyse de la méthylation de l'ADN.
Les régions génomiques peuvent être classées en différentes catégories en fonction de leur densité en CpG, telles que les îles CpG (CGI), les rives CpG, les étagères CpG et les étagères continentales CpG. Des analyses génomiques à l'échelle du génome dans diverses espèces, y compris l'homme, le rat, l'oiseau et le poisson, ont montré que la majorité des régions génomiques appartiennent à la catégorie de faible densité (1-3 CpG/100bp). Les régions de haute densité (>5 CpG/100bp) représentent moins de 10 % du génome.
Lectures recommandées : Identification des DMC, DMR et DMG dans l'analyse de la méthylation de l'ADN.
Densité de CpG à l'échelle du génome. (Beck et al., 2022)
Le MeDIP-seq (Immunoprécipitation de l'ADN méthylé suivie de séquençage) est une technique épigénomique largement utilisée qui permet l'analyse à l'échelle du génome des motifs de méthylation de l'ADN à un coût réduit par rapport à d'autres méthodes à haute résolution. Cette méthode implique une série d'étapes pour enrichir les fragments d'ADN méthylés, suivies d'un séquençage pour générer des profils de méthylation de l'ADN à travers le génome. MeDIP-Seq utilise un anticorps anti-5-méthylcytosine pour enrichir les régions d'ADN méthylé, suivi d'un séquençage de nouvelle génération. MeDIP-Seq cible principalement les régions à faible densité de CpG (<5 CpG/100bp), couvrant plus de 95 % du génome. Il fournit un aperçu général des motifs de méthylation de l'ADN mais manque de résolution à base unique.
Séquençage par immunoprécipitation de l'ADN méthylé (MeDIP-Seq). (Beck et al., 2022)
Malgré son utilité, le MeDIP-seq présente certaines limitations dont les chercheurs doivent être conscients.
L'une des principales limitations du MeDIP-seq est son incapacité à fournir une résolution à une seule base. Étant donné que l'ADN est fragmenté en plusieurs centaines de paires de bases lors de la sonication, l'emplacement exact des sites de méthylation CpG individuels ne peut pas être déterminé. Au lieu de cela, le MeDIP-seq fournit des informations sur l'état global de la méthylation de l'ADN dans les régions contenant des sites CpG méthylés.
Comparé à d'autres méthodes de séquençage comme le séquençage bisulfite de tout le génome (WGBS), le MeDIP-seq n'est pas considéré comme une technique à haut débit. Cela est dû au fait qu'il cible sélectivement les fragments d'ADN méthylés, plutôt que de séquencer l'ensemble du génome. Par conséquent, le MeDIP-seq peut ne pas offrir une couverture aussi complète du génome que le WGBS.
Le MeDIP-seq fournit des informations sur la présence de fragments d'ADN méthylés, mais ne mesure pas directement le niveau de méthylation des CpG à chaque site. Par conséquent, il ne peut pas faire la distinction entre différents degrés de méthylation (par exemple, 50 % de méthylation contre 80 % de méthylation) aux sites CpG individuels.
Le MeDIP-seq peut rencontrer des difficultés lors de l'analyse des régions à forte densité de sites CpG. L'efficacité de liaison des anticorps peut varier pour les régions fortement méthylées, entraînant des biais potentiels dans l'analyse.
RRBS (Séquençage Bisulfite à Représentation Réduite) et WGBS (Whole Genome Bisulfite Sequencing) sont des techniques avancées de séquençage de la méthylation de l'ADN reconnues pour leur capacité à atteindre une résolution à base unique.
RRBS est une technique de profilage de la méthylation de l'ADN ciblée qui combine un traitement au bisulfite avec le séquençage de nouvelle génération. Elle se concentre sur les régions riches en CpG en utilisant des enzymes de restriction pour fragmenter l'ADN génomique avant la conversion au bisulfite, permettant aux chercheurs d'analyser un sous-ensemble représentatif du génome avec une résolution supérieure à celle du MeDIP-seq. RRBS implique un processus en deux étapes. Dans un premier temps, des endonucléases de restriction sensibles à la méthylation sont utilisées pour cliver enzymatiquement l'ADN non méthylé à des sites CpG spécifiques avec une forte densité de GC, ce qui entraîne la formation de fragments d'ADN. Ces fragments sont ensuite soigneusement sélectionnés en fonction de leur taille et ciblés vers des régions telles que les promoteurs et les îlots CpG. Par la suite, les fragments subissent une conversion au sulfite, qui transforme la cytosine non méthylée en uracile tout en préservant la cytosine méthylée. Après cela, une amplification par PCR et un séquençage sont réalisés sur ces fragments.
Représentation réduite de bisulfite (RRBS). (Beck et al., 2022)
D'autre part, le WGBS consiste à soumettre l'ensemble du génome à un traitement au sulfite sans isolement préalable des fragments méthylés. WGBS est considéré comme la norme d'or pour l'étude de la méthylation de l'ADN car il fournit une résolution au niveau des paires de bases à travers tout le génome. Il implique la conversion au bisulfite de l'ADN génomique, qui convertit les cytosines non méthylées en uraciles tout en laissant les cytosines méthylées inchangées. Le séquençage ultérieur permet d'identifier précisément les cytosines méthylées et non méthylées, fournissant une image complète et détaillée du paysage de la méthylation de l'ADN. Lors de la conversion au bisulfite, les cytosines non méthylées sont converties en uracile, tandis que les cytosines méthylées restent inchangées. L'ADN post-conversion est ensuite séquencé, et divers protocoles bioinformatiques sont employés, conduisant souvent à une caractérisation complète du génome.
Bisulfite de tout le génome (WGBS). (Beck et al., 2022)
L'analyse MeDIP-seq a révélé des résultats intrigants concernant la distribution de la densité de CpG à travers diverses espèces. L'analyse des données a montré que la majorité des régions différentiellement méthylées (DMRs) identifiées dans les ensembles de données MeDIP-seq étaient principalement associées à des régions de faible densité de CpG, spécifiquement dans la plage de 0 à 3 sites de CpG par 100 paires de bases (pb). Notamment, une densité de CpG prévalente de 1 site de CpG par 100 pb a été observée, ce qui était étroitement corrélé à la densité prédominante au sein du génome représentatif.
Ces résultats suggèrent fortement que le MeDIP-seq présente une propension à interroger des régions génomiques caractérisées par une faible densité de CpG, capturant ainsi efficacement les changements de méthylation se produisant dans de telles zones. Ces régions de faible densité de CpG sont largement réparties et englobent plus de 90 % des génomes de diverses espèces. Par conséquent, MeDIP-seq est une méthode bien adaptée pour étudier les motifs de méthylation de l'ADN dans ces régions, offrant ainsi un aperçu complet des dynamiques de méthylation à travers le génome.
Néanmoins, il est à noter que certaines variations dans la distribution de la densité de CpG ont été observées lors de la comparaison d'échantillons de différentes espèces. Par exemple, l'analyse des DMRs de poisson zèbre a indiqué un déplacement vers des densités de CpG légèrement plus élevées, spécifiquement dans la plage de 1 à 4 sites de CpG par 100 pb. Ce déplacement peut être attribué à la présence de deux types cellulaires distincts, les spermatozoïdes et les érythrocytes, au sein des échantillons de poisson zèbre, chacun pouvant présenter des motifs de méthylation uniques.
L'analyse RRBS (séquençage bisulfite à représentation réduite) réalisée sur diverses espèces a révélé des résultats intrigants concernant la distribution de la densité de CpG dans les ensembles de données acquis. Plus précisément, les régions différentiellement méthylées (DMRs) identifiées par RRBS ont montré une bifurcation distincte dans les densités de CpG. Certains ensembles de données ont présenté un déplacement vers des densités de CpG plus élevées, en particulier dans la plage de >10 CpG/100bp, tandis que d'autres ont montré une préférence pour des densités de CpG intermédiaires.
Lors d'un examen plus approfondi, il a été révélé que dans les ensembles de données RRBS avec des densités de CpG dépassant 10 CpG/100pb, la densité dominante se situait entre 10 et 12 CpG/100pb. Néanmoins, lorsque l'analyse a été étendue aux densités de CpG sur plus de 1 kb, une part substantielle (environ deux tiers) des régions >10 CpG se situait en dessous de 10 CpG/1 kb. Cela indique que les régions à haute densité de CpG tendent à montrer une diminution de la densité sur de plus longues étendues d'ADN.
De plus, une comparaison entre MeDIP-Seq et RRBS Les méthodes, toutes deux appliquées aux mêmes échantillons de jeux de données de truites arc-en-ciel mais réalisées par différents laboratoires, ont révélé des biais distincts associés à chaque approche. MeDIP-Seq a montré une préférence pour les régions à faible densité de CpG, tandis que RRBS a montré une propension pour les régions à haute densité de CpG.
Le RRBS s'avère particulièrement bien adapté pour étudier les changements de méthylation de l'ADN dans les régions riches en CpG, telles que les promoteurs et les îlots CpG, tandis que le MeDIP-Seq est plus approprié pour profiler les motifs de méthylation dans les régions à faible densité de CpG à travers le génome. La disponibilité de jeux de données MeDIP-Seq et RRBS pour les mêmes échantillons dans l'étude sur la truite arc-en-ciel a offert une précieuse opportunité de validation croisée et a mis en évidence les forces et les limites de chaque méthode.
L'analyse de séquençage bisulfite de tout le génome (WGBS) Les données provenant de diverses espèces ont fourni des informations précieuses sur la distribution de la densité de CpG au sein des ensembles de données acquis. Les résultats révèlent que la densité de CpG dans l'ensemble de données WGBS se situe dans une plage comparable à celle observée dans l'ensemble de données de séquençage bisulfite à représentation réduite (RRBS). Cependant, des différences notables dans les distributions de densité de CpG entre ces deux analyses ont été identifiées.
En particulier, les ensembles de données WGBS présentent des variations subtiles, montrant une propension vers des densités de CpG plus élevées, en particulier dans la plage de 2 à 5 CpG/100pb et des densités de CpG dépassant 10 CpG/100pb. Cela suggère que les données WGBS ont tendance à cibler et à capturer les changements de méthylation de l'ADN dans des régions enrichies en densité plus élevée de sites CpG.
Remarquablement, à part les poules, les régions avec 1 CpG/100pb étaient les moins détectées dans les ensembles de données WGBS, ce qui implique que le WGBS est moins susceptible d'identifier des régions méthylées différemment (DMRs) dans des zones avec des densités de CpG extrêmement faibles.
Référence:
Beck, Daniel, Millissia Ben Maamar, et Michael K. Skinner. "Comparaison des méthodes d'analyse de la densité de CpG et de la méthylation de l'ADN à l'échelle du génome (MeDIP, RRBS et WGBS)." Épigénétique 17,5 (2022) : 518-530.