Principes et flux de travail du séquençage bisulfite de tout le génome

Introduction au WGBS

Dans des scénarios de recherche typiques, la méthylation de l'ADN fait principalement référence à un processus de méthylation qui se produit sur le cinquième atome de carbone de la cytosine dans les dinucléotides CpG, entraînant la formation de 5-méthylcytosine (5-mC). Cela constitue la principale forme de méthylation de l'ADN chez les eucaryotes, y compris les plantes et les animaux, et représente la seule forme chez les mammifères. En raison de la stabilité relative de la méthylation de l'ADN en tant que statut de modification, elle peut être héritée par l'ADN des descendants au cours du processus de réplication de l'ADN, représentant ainsi un mécanisme significatif d'héritage épigénétique.

Par conséquent, la distribution de la 5-méthylcytosine (ou méthylome) à travers l'ensemble du génome a suscité une attention considérable. Séquençage de bisulfite de génome entier (WGBS) est une méthode qui utilise un traitement au bisulfite pour convertir les cytosines (C) non méthylées dans le génome, permettant de distinguer les cytosines méthylées des cytosines non méthylées, associée à une technologie de séquençage à haut débit pour déterminer l'état de méthylation aux sites CpG/CHG/CHH. Elle a été appliquée avec succès dans l'analyse des méthylomes à travers diverses branches de la phylogénie eucaryote, plusieurs espèces, et dans l'analyse des méthylomes dans les cellules souches embryonnaires humaines, les cellules souches pluripotentes induites, les cellules mononucléaires du sang périphérique, les cellules cancéreuses du côlon, et d'autres. Ces WGBS les ensembles de données ont permis de nombreuses découvertes inaccessibles par d'autres méthodes. Avec la diminution du coût du séquençage, le WGBS devient de plus en plus la méthode de choix dans la recherche. Cependant, la méthode traditionnelle WGBS Les méthodes posent des défis significatifs pour les échantillons à faible entrée. À mesure que les applications de l'analyse de méthylation continuent de s'étendre, des études sur le développement embryonnaire aux applications cliniques telles que le dépistage précoce des tumeurs, il y a une demande croissante pour la construction de bibliothèques de méthylation à partir d'échantillons à faible entrée.

Principes de la WGBS

Des études épigénétiques ont confirmé que la modification de la méthylation de l'ADN dans des régions spécifiques des gènes joue un rôle important dans la conformation des chromosomes et la régulation de l'expression génique. La méthylation des résidus de cytosine de l'ADN au C5 (5moiC) est une marque épigénétique courante chez de nombreux eucaryotes et se trouve largement dans les CpG ou CpHpG (H=A, T, C). Il existe principalement trois approches, y compris la digestion par endonucléase, l'enrichissement par affinité et la conversion par bisulfite (Tableau 1). Presque toutes les approches d'analyse de la méthylation de l'ADN spécifiques à la séquence nécessitent un traitement dépendant de la méthylation avant l'amplification ou l'hybridation pour maintenir la fidélité. Diverses techniques de biologie moléculaire, telles que le séquençage de nouvelle génération (NGS), sont ensuite réalisées pour détecter 5.moiRésidus de C.

Tableau 1. Principes principaux de l'analyse de méthylation basée sur le NGS.

Digestion enzymatique Enrichissement par affinité Bisulfite de sodium
Principes Certain enzymes de restriction, telles que HpaII et SmaJe suis inhibé par 5.moiC dans le CpG. L'enrichissement par affinité utilise des anticorps spécifiques pour 5.moiC ou protéines de liaison aux méthyles avec affinité pour le profilage de la méthylation de l'ADN. Le bisulfite de sodium transforme chimiquement la cytosine non méthylée en uracile, permettant ainsi la détection de la méthylation.
Exemple de méthode Méthyl-seq
*MCA-seq
*HELP-seq
*MSCC
*MeDIP-seq
*MIRA-seq
*RRBS
*WGBS
*BSPP

*MCA : amplification des îlots CpG méthylés ; *HELP : enrichissement des petits fragments HpaII par PCR médiée par ligation ; *MSCC : comptage des coupures sensibles à la méthylation ; *MeDIP-seqimmunoprécipitation de l'ADN méthylé ; *MIRA : essai de récupération des îlots CpG méthylés ; *RRBSséquençage bisulfite à représentation réduite ; *WGBS : séquençage du génome entier par bisulfite ; *BSPP : sondes de verrouillage par bisulfite.

Diverses méthodologies ont été développées pour évaluer les niveaux de méthylation de l'ADN dans des échantillons. La conversion au bisulfite a suscité une révolution dans l'analyse de la méthylation du génome dans les années 1990. Considérée comme la "référence" pour la détermination du niveau de méthylation, WGBS fonctionne sur le principe de l'analyse de méthylation basée sur le bisulfite. Cette technique commence par le traitement de l'ADN d'échantillon avec du bisulfite, qui convertit avec succès les bases de cytosine non méthylées en uracile, laissant les cytosines méthylées inchangées. L'amplification PCR subséquente provoque la transposition de l'uracile en thymine, le distinguant des cytosines méthylées d'origine. Lorsqu'elle est associée à la technologie de séquençage à haut débit, cette méthode permet de cartographier un profil de méthylation de l'ADN du génome entier avec une résolution à base unique.

Figure 1. Bisulfite Treatment and PCR Amplification Preceding DNA Sequencing.Figure 1. Conversion au bisulfite et amplification PCR avant le séquençage de l'ADN.

WGBS est une technologie de séquençage à haute résolution utilisée pour détecter l'état de méthylation des bases de cytosine dans les molécules d'ADN. Dans le cadre du WGBS, l'échantillon d'ADN subit d'abord un traitement au bisulfite, transformant les cytosines non méthylées en uracile, tandis que les cytosines méthylées restent inchangées. Grâce à l'analyse de séquençage, nous pouvons déterminer l'état de méthylation de chaque base de cytosine. WGBS, en tant que méthode de recherche d'une grande importance dans ce domaine, applique une combinaison de traitement au bisulfite et de technologies de séquençage de nouvelle génération (principalement, le séquençage shotgun) pour étudier la méthylation de l'ADN au niveau génomique.

Flux de travail de WGBS

En résumé, les étapes de base de WGBS inclure l'extraction d'ADN, la conversion au bisulfite, la préparation de la bibliothèque, le séquençage et l'analyse bioinformatique. Ici, nous utilisons Illumina HiSeq comme exemple pour illustrer le flux de travail du WGBS.

Figure 2. Overview of the Whole Genome Bisulfite Sequencing Workflow.Figure 2. Le flux de travail du séquençage du génome entier par bisulfite.

Figure 3. The Whole Genome Bisulfite Sequencing Procedure. (Khanna et al. Epignome[trade] methyl-seq kit: a novel post-bisulfite conversion library prep method for methylation analysis. 2013)Figure 3. Le flux de travail du séquençage bisulfite de l'ensemble du génome (Khanna et al. 2013).

  • Extraction d'ADN

Tout d'abord, environ 1 à 5 mg d'échantillons de tissus prélevés sur des humains, des animaux, des plantes ou des micro-organismes sont préparés pour l'ADN. En général, les échantillons pour le séquençage bisulfite de génome entier doivent répondre aux quatre caractéristiques suivantes.

i. Eucaryotes ;

ii. Hypométhylation (comme le montre la Figure 4, des études ont montré qu'une fois que le nombre de sites CpG dans une région augmente, les données de séquençage du WGBS commencent à diminuer) ;

iii. Son génome de référence a été assemblé au moins au niveau du scaffold ;

iv. Annotations génomiques relativement complètes. Ensuite, appliquez un kit approprié pour extraire de l'ADN de haute pureté et de poids moléculaire élevé. L'ADN extrait doit avoir une masse d'au moins 5 μg, une concentration d'au moins 50 ng/μl et un rapport OD260/280 compris entre 1,8 et 2,0.

Figure 4. Traditional WGBS Technology Exhibits Limited Methylation Site Coverage. (Raine et al., Splinted ligation adapter tagging (splat), a novel library preparation method for whole genome bisulphite sequencing. 2016)Figure 4. La technologie WGBS conventionnelle a une faible couverture des sites de méthylation (Raine et al., 2016)

  • Conversion au bisulfite

La conversion par bisulfite est considérée comme la "norme d'or" pour l'analyse de la méthylation de l'ADN, les principes étant illustrés dans la Figure 5. Pour cette méthode, la dégradation de l'ADN induite par le bisulfite peut entraîner une déplétion des régions génomiques enrichies en cytosines non méthylées. Il est donc important d'évaluer la quantité de dégradation de l'ADN dans les conditions de réaction, et il convient également de considérer comment cela affecte l'amplicon souhaité. Olova et al. (2018) ont constaté que la dégradation de l'ADN est forte dans les protocoles de conversion par bisulfite qui utilisent une forte dénaturation ou une forte molarité de bisulfite. Plusieurs kits sont disponibles sur le marché (Tableau 2).

Figure 5. Bisulfite-Induced Deamination of Cytosine. (Hayatsu et al. DNA methylation analysis: speedup of bisulfite-mediated deamination of cytosine in the genomic sequencing procedure. 2004)Figure 5. Déamination de la cytosine médiée par le bisulfite (Hayatsu et al. 2004).

Tableau 2. Protocoles et paramètres de conversion au bisulfite.

Kits Dénaturation Température de conversion Temps d'incubation
Zymo EZ Kit de Méthylation de l'ADN Lightning Basé sur la chaleur ; 99 °C
Basé sur des alcalins ; 37 °C
65 °C 90 minutes
Kit EpiTect Bisulfite (Qiagen) Basé sur la chaleur ; 99 °C 55 °C 10 heures
Kit de méthylation de l'ADN EZ (Zymo Research) Basé sur des alcalins ; 37 °C 50 °C 12-16 heures
  • Préparation de la bibliothèque

Prenez le kit EpiGnome™ Methyl-Seq (Epicentre) comme exemple (comme montré dans la Figure 6), l'ADN simple brin traité par bisulfite est amorcé de manière aléatoire à l'aide d'une polymérase capable de lire les nucléotides d'uracile, pour synthétiser de l'ADN contenant une étiquette de séquence spécifique. L'extrémité 3' du brin d'ADN nouvellement synthétisé est ensuite étiquetée sélectivement avec une seconde séquence spécifique, permettant ainsi d'obtenir une molécule d'ADN à deux marqueurs avec une étiquette de séquence connue aux extrémités 5' et 3'. Les adaptateurs Illumina P7 et P5 sont ensuite ajoutés par PCR aux extrémités 5 et 3 avant le séquençage de l'ADN.

Figure 6. EpiGnomeTM Methyl-Seq Kit Workflow.Figure 6. Flux de travail pour le kit EpiGnome™ Methyl-Seq.

  • Séquençage

La technologie de séquençage Hiseq, une nouvelle méthode de séquençage basée sur le séquençage par synthèse (SBS), est largement appliquée pour WGBSL'amplification par pont sur une cellule de flux est réalisée en utilisant un réseau de molécules uniques. Étant donné que la nouvelle technique de blocage réversible ne peut synthétiser qu'une seule base à la fois et marquer le fluorophore, le laser correspondant est utilisé pour exciter le fluorophore, et la lumière d'excitation peut être capturée pour lire les informations sur la base. La stratégie de paires d'extrémités de 150 pb est généralement employée dans le WGBS pour séquencer des bibliothèques d'ADN traitées au bisulfite de 250-300 pb d'insertion. En plus de l'Illumina HiSeq, PacBio SMRT, Nanopore, Roche 454 et d'autres plateformes Illumina sont également couramment utilisées à cet effet.

  • Analyse des données

Une série d'analyses peut être effectuée pour les résultats de séquençage. Cinq principaux types d'analyses d'information sont répertoriés dans le Tableau 3. De plus, une analyse de la densité de méthylation, une analyse des régions méthylées de manière différentielle (DMR), l'annotation des DMR et l'analyse d'enrichissement (GO/KEGG) ainsi qu'une analyse de regroupement peuvent également être réalisées. Les ressources bioinformatiques communes de WGBS inclure BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA et le Portail de données TCGA.

Tableau 3. Principaux types d'analyse des données WGBS.

Type Détails
Alignement par rapport au génome de référence Des outils, tels que le logiciel SOAP, sont utilisés pour comparer les lectures avec la séquence du génome de référence, et seules les lectures alignées seront utilisées pour l'analyse des informations de méthylation. Alignez les lectures en permettant des correspondances C-C et des discordances C-T.
mC appelant Déterminez la position de mC dans tout le génome. Les ratios de mC sont calculés en tenant compte de la qualité des lectures et des probabilités de cartographie multi-locus. Éliminez les alignements à faible probabilité qui ont une faible fiabilité d'alignement.
Analyse de la profondeur de séquence et de la couverture Une image reflétant la relation entre la couverture génétique et la profondeur de séquençage détermine si la découverte de la méthylation peut être réalisée avec un certain degré de confiance à des positions de base spécifiques.
Analyse du niveau de méthylation Le niveau de méthylation de chaque base C méthylée est calculé comme suit : 100*lectures/lectures totales. Le niveau de méthylation moyen à l'échelle du génome reflète les caractéristiques globales du profil de méthylation génomique.
Tendances mondiales du méthylome Le rapport de distribution de CG, CHGG et CHH dans les bases C méthylées reflète dans une certaine mesure les caractéristiques des cartes de méthylation du génome entier de certaines espèces.

Avantages et limites de la WGBS

Avantages :

  • Résolution à base unique : La méthode permet une analyse précise jusqu'à la résolution à base unique, permettant une détermination exacte du statut de méthylation de chaque base de cytosine. Elle est considérée comme la "référence" dans la recherche sur le niveau de méthylation.
  • Taux de conversion élevé dans la construction de bibliothèques de méthylation : le taux de conversion moyen par séquençage au bisulfite est supérieur à 99 %, avec des mesures de contrôle de qualité strictes mises en place lors de la construction de la bibliothèque.
  • Large éventail d'applications : La méthode est applicable à la recherche sur la méthylation dans toutes les espèces disposant de génomes de référence connus.
  • Couverture Génomique Complète : Elle maximise l'acquisition d'informations complètes sur la méthylation du génome, permettant une cartographie précise du paysage de méthylation.
  • Épigénomique Recherche : Elle présente un potentiel significatif pour étudier la spécificité spatiotemporelle dans le domaine de l'épigénétique.

Limitations :

  • Volume de données important requis (au moins 30x de couverture recommandé).
  • Dépendance à un génome de référence.
  • Contenu de base AT élevé après traitement, ce qui peut affecter le séquençage et l'analyse.
  • Susceptibilité aux dommages de l'ADN lors du traitement au bisulfite.

Applications de WGBS

(1) Études épigénétiques : WGBS sert d'outil instrumental pour enquêter sur les variations de méthylation de l'ADN parmi différents types de cellules, tissus ou stades de développement, déchiffrant ainsi le rôle des altérations épigénétiques dans les processus biologiques. Cela améliore notre compréhension des mécanismes impliqués dans la régulation de l'expression génique, la différenciation cellulaire, le développement et l'apparition de maladies.

(2) Recherche sur les maladies : Dans l'exploration des maladies, WGBS joue un rôle central. Les chercheurs peuvent comparer les motifs de méthylation de l'ADN dans des états sains et affectés par la maladie, dans le but d'identifier les altérations de méthylation liées à l'initiation et à la progression de la maladie. De telles investigations revêtent une importance vitale pour les études concernant le cancer, les troubles neurologiques, les maladies cardiovasculaires, entre autres.

(3) Différences individuelles et Génétique des populationsWGBS facilite également la recherche sur les variations de méthylation de l'ADN interindividuelles, aidant à comprendre la variation génétique de la méthylation au sein des populations. Cela fait progresser l'analyse de la base génétique de la méthylation, ainsi que son rôle dans la détermination de la susceptibilité à la santé d'un individu.

(4) Études d'impact environnemental : Des facteurs environnementaux externes tels que la nutrition, les toxines, les médicaments, etc., peuvent potentiellement influencer la méthylation de l'ADN. Le WGBS aide les chercheurs à évaluer comment ces forces environnementales pourraient modifier l'expression des gènes via la méthylation, influençant ainsi la fonctionnalité physiologique d'un individu et le risque de maladie.

(5) Évolutionnaire Recherche : De plus, la WGBS peut être utilisée pour comparer les motifs de méthylation de l'ADN entre différentes espèces, éclairant ainsi le rôle de la méthylation dans l'évolution. Cela peut contribuer à notre compréhension de la manière dont la méthylation participe à l'adaptation des espèces et à la génération de diversité.

Différence entre WGBS et RRBS

WGBS est une technologie de séquençage à haut débit utilisée pour l'analyse de la méthylation de l'ADN. Elle peut effectuer une analyse de la méthylation sur l'ensemble du génome, couvrant chaque base de cytosine et identifiant son statut de méthylation, faisant de la WGBS la norme d'or pour la recherche sur la méthylation de l'ADN, capable de fournir des informations sur la méthylation à haute résolution et en profondeur. Séquençage bisulfite à représentation réduite (RRBS) est une méthode de séquençage de méthylation à 'représentation réduite' qui séquence sélectivement des zones spécifiques du génome riches en îlots CpG et autres régions à forte méthylation, par opposition à WGBSBien que le RRBS ait une couverture plus étroite, il est plus rentable et adapté aux études d'échantillons à grande échelle car il nécessite une profondeur de séquençage moins importante.

Une analyse comparative approfondie entre Séquençage de bisulfite de génome entier (WGBS) et le séquençage bisulfite à représentation réduite (RRBS) peut élucider leurs forces et limitations respectives, aidant les chercheurs à choisir l'approche optimale qui correspond à leurs objectifs d'investigation. Par exemple, si une compréhension complète du statut de méthylation de chaque base de cytosine dans le génome est nécessaire dans l'étude, WGBS pourrait être un choix supérieur. En revanche, si la recherche met l'accent sur des régions de méthylation spécifiques ou nécessite le traitement d'un grand nombre d'échantillons, le RRBS pourrait potentiellement offrir une solution plus économique. De plus, mettre en parallèle ces deux techniques peut contribuer à une meilleure évaluation de leurs performances et de leur applicabilité. En contrastant WGBS et RRBS en termes de volume de données, de coût, de couverture, de résolution, etc., les chercheurs peuvent obtenir une compréhension plus riche des avantages et des inconvénients inhérents à chaque méthode. À son tour, cette connaissance peut orienter la conception expérimentale et l'analyse des données de manière plus éclairée.

Tableau 4. Différence entre WGBS et RRBS

Caractéristique WGBS RRBS
Couverture Cible Analyse l'ensemble du génome, couvrant chaque base C pour déterminer son statut de méthylation. Adopte une approche de "représentation réduite", séquençant sélectivement des régions spécifiques riches en îlots CpG et d'autres zones hautement méthylées, offrant une couverture plus étroite mais étant plus rentable et adaptée aux analyses d'échantillons à grande échelle.
Volume de données et coût Génère des volumes de données plus importants, donc des coûts plus élevés. Produit des volumes de données relativement plus petits, entraînant des coûts réduits.
Résolution et profondeur de couverture Fournit une résolution plus élevée et une couverture plus profonde, capable de détecter l'état de méthylation de chaque base C dans le génome. Offre une résolution élevée comparable et une profondeur de couverture suffisante pour détecter l'état de méthylation de régions sélectionnées.
Manipulation des échantillons et conception expérimentale Nécessite plus de matériel ADN de départ, pas adapté aux échantillons à faible entrée ou aux échantillons cliniques précieux. Nécessite moins de matériel ADN de départ, adapté aux analyses d'échantillons à faible entrée et aux études d'échantillons à grande échelle.

Références :

  1. Fraga, M. F., Esteller, M. (2002). Méthylation de l'ADN : un profil des méthodes et des applications. Biotechniques, 33(3), 636-49.
  2. Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U., et al. (2010). Une séquence préliminaire du génome néandertalien. Science, 328(5979), 710–722.
  3. Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). Analyse de la méthylation de l'ADN : accélération de la désamination médiée par le bisulfite de la cytosine dans la procédure de séquençage génomique. Actes de l'Académie du Japon,80(4), 189-194.
  4. Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). PCR spécifique à la méthylation : un nouvel essai PCR pour l'état de méthylation des îlots CpG. Actes de l'Académie nationale des sciences des États-Unis d'Amérique, 93(18), 9821-9826.
  5. Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014). L'ADN méthylé est sur-représenté dans les données de séquençage bisulfite du génome entier. Front Genet, 5(5), 341.
  6. Khanna, A., Czyz, A., & Syed, F. (2013). Kit de séquençage méthyle Epignome[trade] : une nouvelle méthode de préparation de bibliothèque post-conversion au bisulfite pour l'analyse de la méthylation. Méthodes de la Nature, 10(10).
  7. Laird, P. W. (2003). Le pouvoir et la promesse des marqueurs de méthylation de l'ADN. Nature Reviews Cancer, 3(4), 253–266. doi:10.1038/nrc1045
  8. Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., & Anthony, H. (2015). Une enquête à l'échelle du génome sur la méthylation de l'ADN dans le blé hexaploïde. Biologie des génomes, 16(1), 273.
  9. Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian, et al. (2011). Un rapport d'utilisation bref sur le séquenceur Illumina HiSeq 2000. Mycologie, 2(3), 169-191.
  10. Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005). Séquençage bisulfite à représentation réduite pour une analyse comparative de la méthylation de l'ADN à haute résolution. Recherche sur les acides nucléiques, 33(18), 5868-77.
  11. Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S., et al. (2012). Une séquence génomique à haute couverture d'un individu denisovien archaïque. Science, 338(6104), 222-6.
  12. Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). La comparaison des stratégies de préparation de bibliothèques de séquençage de bisulfite du génome entier identifie des sources de biais affectant les données de méthylation de l'ADN. Biologie du génome, 19(1), 33.
  13. Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016). Adaptateur de ligature splinté (splat), une nouvelle méthode de préparation de bibliothèque pour le séquençage de génome entier par bisulfite. Recherches sur les acides nucléiques, 45(6), e36.
  14. Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al. (2011). Distribution génomique et variation inter-échantillons de la méthylation non-CpG à travers les types cellulaires humains. Plos Génétique, 7(12), e1002389.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Parlez à nos scientifiques
De quoi aimeriez-vous discuter ?
Avec qui allons-nous parler ?

* est un élément requis.

Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut