Un guide étape par étape sur l'EM-Seq : de l'extraction de l'ADN à l'analyse de la méthylation

Méthyl-seq enzymatique (EM-seq), en tant que technologie innovante et efficace, émerge progressivement au premier plan de la recherche en génomique, offrant un outil puissant pour une analyse approfondie du mystère de Méthylation de l'ADNLe processus de l'EM-seq est précis et rigoureux, intégrant une série d'opérations expérimentales avancées et de principes scientifiques. De la préparation initiale des échantillons à l'acquisition précise des données finales, chaque étape joue un rôle clé dans la révélation exacte des motifs de méthylation de l'ADN.

Dans cet article, le flux de travail EM-seq est présenté en détail, y compris la préparation des échantillons, la modification chimique, la construction de la bibliothèque, les étapes de séquençage et l'analyse des données, montrant son rôle important et son potentiel d'application dans la recherche en sciences biologiques.

Workflow of EM-seq (Olova et al., 2023)Un schéma du flux de travail EM-seq (Olova et al., 2023)

Préparation d'échantillons EM-seq

Dans l'expérience EM-seq, la préparation des échantillons est une étape initiale très critique, et sa qualité est directement liée à l'exactitude et à la fiabilité des résultats expérimentaux ultérieurs. De l'obtention des échantillons biologiques à leur traitement en échantillons adaptés à l'EM-seq, chaque étape doit strictement suivre le processus standard et contrôler de nombreux détails pour garantir que l'information sur la méthylation de l'ADN dans les échantillons puisse être complètement et précisément conservée et analysée.

Types et sources d'échantillonsIl existe différents types d'échantillons qui peuvent être utilisés dans le processus EM-Seq. Les lignées cellulaires sont l'un des échantillons couramment utilisés. En raison de leurs caractéristiques relativement homogènes, elles sont très pratiques pour étudier les caractéristiques épigénétiques de types cellulaires spécifiques. Lors de l'étude du mécanisme de régulation épigénétique des cellules immunitaires pour comprendre le processus de réponse immunitaire, les lignées cellulaires immunitaires correspondantes peuvent être sélectionnées. Les échantillons de tissus couvrent un large éventail, et les échantillons de tissus tumoraux sont très importants dans l'étude épigénétique du cancer. En analysant les modifications épigénétiques telles que la méthylation de l'ADN dans les tissus tumoraux, nous pouvons révéler le mécanisme moléculaire de l'apparition et du développement des tumeurs, et fournir des indices clés pour le diagnostic précoce, le jugement du pronostic et la découverte de cibles thérapeutiques du cancer.

Précautions pour la collecte et la conservation des échantillonsTous les types de collecte d'échantillons doivent suivre la méthode et l'opportunité spécifiques les meilleures. Pour les échantillons de tissu tumoral, ils doivent être collectés dès que possible après la résection chirurgicale afin d'éviter la modification épigénétique des cellules tumorales due à l'ischémie et à d'autres facteurs. Il est généralement recommandé de terminer la collecte dans les 30 minutes suivant l'extraction in vitro. Lors de la collecte, assurez-vous que le site de collecte est représentatif et essayez d'éviter de mélanger avec des tissus normaux. Les échantillons de tissu peuvent être rapidement congelés dans de l'azote liquide après la collecte pour maintenir leur modification épigénétique in vivo. Les échantillons de sang sont généralement collectés par prélèvement sanguin intraveineux, et des tubes de collecte de sang contenant des anticoagulants sont utilisés. Après la collecte de sang, ils doivent être doucement inversés et mélangés uniformément à temps pour éviter la coagulation du sang.

Extraction d'acides nucléiquesSelon les différents types d'échantillons, des méthodes d'extraction d'acides nucléiques appropriées doivent être sélectionnées. Pour les échantillons de lignées cellulaires, la méthode d'adsorption sur colonne en silice est couramment utilisée, qui est simple et rapide à mettre en œuvre, permettant de réaliser l'extraction d'acides nucléiques en peu de temps, et convient aux expériences de quantité de Qualcomm. Cependant, cette méthode peut entraîner une certaine perte d'acides nucléiques lors de l'élution. La méthode phénol-chloroforme est souvent utilisée pour extraire des acides nucléiques à partir d'échantillons de tissus. Les acides nucléiques extraits par cette méthode ont une haute pureté et peuvent efficacement éliminer des impuretés telles que les protéines. Cependant, les étapes d'opération sont compliquées, et des réactifs toxiques tels que le phénol et le chloroforme sont nécessaires, ainsi que des compétences opérationnelles de la part des expérimentateurs.

Contrôle de qualitéLes indicateurs clés incluent la concentration, la pureté et l'intégrité. La concentration est détectée par un spectrophotomètre. Après que l'échantillon d'acide nucléique soit dilué à un multiple approprié, il est placé dans un spectrophotomètre pour détecter l'absorbance à la longueur d'onde de 260 nm, et la concentration d'acide nucléique est calculée selon la loi de Lambert-Beer. La pureté est mesurée par le rapport A260/A280 et A260/A230. Le rapport A260/A280 des échantillons d'ADN pur doit être compris entre 1,8 et 2,0. Si le rapport est inférieur à 1,8, il peut y avoir une contamination par des protéines. Si le rapport est supérieur à 2,0, il peut y avoir une contamination par de l'ARN. Le rapport A260/A230 doit être compris entre 2,0 et 2,2. Si le rapport est trop bas, il peut y avoir des impuretés telles que des polysaccharides et des polyphénols. L'intégrité de l'acide nucléique a été jugée en observant l'intégrité des bandes par électrophorèse sur gel d'agarose. Après que l'échantillon d'acide nucléique ait été mélangé avec le tampon de chargement, il est ajouté dans le puits de chargement du gel d'agarose, et l'électrophorèse est réalisée à une tension appropriée. Si les bandes sont vagues et diffuses, cela indique que l'intégrité de l'acide nucléique est mauvaise et qu'il a pu être dégradé, ce qui affectera les résultats expérimentaux ultérieurs de l'EM-Seq.

The quality control of the EM - seq and BS - seq (as reported by Wang et al. in 2022)Le contrôle de qualité de l'EM-seq et du BS-seq (Wang et al., 2022)

Modification chimique dans l'EM-seq

Le processus de modification chimique de l'EM-seq n'est pas un changement chimique direct des bases de l'ADN dans le sens traditionnel, mais une série de réactions enzymatiques bien conçues pour atteindre un marquage efficace et une détection précise des sites de méthylation spécifiques. Cette méthode de modification chimique a ouvert une voie entièrement nouvelle et potentielle pour révéler de manière exhaustive et précise le mystère du groupe de méthylation de l'ADN, ce qui a grandement favorisé le développement des recherches connexes.

Réactif de modification et réaction

Dans le processus EM-Seq, les réactifs chimiques de modification clés sont la β-glucosyltransférase (βGT) et le bisulfite. La βGT est une enzyme qui peut ajouter des groupes glucose à la 5-méthylcytosine (5mC). Son essence chimique est une protéine, formée par le repliement d'une séquence d'acides aminés spécifique. Dans la réaction, la 5-méthylcytosine -β-D-glucoside (5mC-β-D-glucopyranoside) a été formée par l'ajout d'un groupe β-glucosyl au 5ème atome de carbone de la 5mC par réaction enzymatique, ce qui a modifié la structure chimique de la 5mC. Sa fonction est de marquer la 5mC et de la distinguer de la cytosine non modifiée, ce qui pose une base pour le traitement ultérieur au bisulfite.

Le bisulfite joue un rôle extrêmement important dans l'EM-Seq. La structure chimique du bisulfite est HSO, qui possède une forte réductibilité. Dans des conditions acides, le bisulfite peut déaminé avec la cytosine non modifiée. Le mécanisme de réaction spécifique est que l'ion bisulfite (HSO) réagit d'abord avec le groupe amino à une position spécifique de la cytosine pour former un produit intermédiaire. Par la suite, dans certaines conditions, le produit intermédiaire subit une réaction de déamination, et le groupe amino est remplacé par un groupe hydroxyle, qui est finalement converti en uracile. Cependant, la cytosine modifiée par méthylation n'a aucun effet sur la cytosine modifiée par méthylation en raison de l'existence du groupe méthyle, qui empêche la réaction d'addition entre le bisulfite et le groupe amino à une position spécifique.

Optimisation des conditions de réaction

Lors de la réaction de modification, les paramètres de température et de temps ont des effets significatifs sur l'efficacité et la spécificité de la réaction. Les résultats montrent que la vitesse de réaction du bisulfite avec la cytosine non modifiée est lente à basse température. Une température trop élevée peut également poser des problèmes. Lorsque la température dépasse 60℃, bien que la vitesse de réaction soit extrêmement rapide, il y aura une sur-réaction. La sur-réaction se caractérise par la désamination non seulement de la cytosine non modifiée, mais aussi de la cytosine partiellement méthylée, et la probabilité de rupture de brins d'ADN augmente, ce qui affectera gravement l'exactitude des résultats de séquençage ultérieurs. La concentration de l'agent modifiant est également très importante pour l'effet de la réaction. Lorsque la concentration de bisulfite est trop faible, la réaction de la cytosine non modifiée est incomplète, et il est impossible de marquer efficacement toutes les bases non modifiées.

The MDA amplification on the EM-seq converted genome (as reported by Wang and colleagues in 2022)L'amplification MDA sur le génome converti par EM-seq (Wang et al., 2022)

Construction de bibliothèque EM-seq

Dans la phase de construction de la bibliothèque EM-seq, la fragmentation et la ligation des adaptateurs sont des étapes cruciales, qui affectent directement la qualité de la bibliothèque ainsi que l'exactitude et la fiabilité des résultats de séquençage ultérieurs.

Traitement de la fragmentation

Méthode de fragmentation physiqueLa fragmentation ultrasonique consiste à réaliser la fragmentation des molécules d'acide nucléique en utilisant l'effet mécanique des ondes ultrasonores. Lorsque l'onde ultrasonore agit sur une solution d'acide nucléique, elle produit une vibration à haute fréquence, ce qui forme de minuscules bulles dans la solution. Ces bulles se dilatent et se contractent rapidement sous l'action des ondes ultrasonores, et finissent par éclater, générant une forte force de cisaillement. Les molécules d'acide nucléique sont ainsi fragmentées en morceaux de taille appropriée sous l'effet de cette force de cisaillement.

Digestion enzymatiqueLa digestion enzymatique est basée sur la reconnaissance et la coupure de séquences d'ADN spécifiques par des enzymes de restriction. Les endonucléases de restriction peuvent reconnaître des séquences nucléotidiques spécifiques dans des molécules d'ADN double brin, qui ont généralement une structure palindromique. Une fois que la séquence cible est reconnue, l'endonucléase de restriction clive l'ADN double brin à un site spécifique. Différentes enzymes de restriction reconnaissent différentes séquences, il est donc possible de sélectionner les enzymes de restriction appropriées selon les besoins pour obtenir des fragments d'ADN d'une longueur attendue.

Méthode de connexion

Site de liaison du primer universelCette partie de la séquence fournit des sites de liaison pour des amorces universelles lors de l'amplification PCR suivante, de sorte que tous les fragments de la bibliothèque puissent être efficacement amplifiés dans la réaction PCR. Dans le processus de séquençage, l'amorce de séquençage est combinée avec cette partie de la séquence du linker, guidant ainsi la réaction de séquençage et garantissant que l'information de séquence du fragment d'acide nucléique puisse être lue avec précision.

Sélection de ligaseDifférents types de ligases ont une efficacité de ligation et une préférence de substrat différentes. La ligase T4 ADN est une ligase courante, qui peut connecter efficacement les extrémités collantes et les extrémités franches. Dans la réaction de ligation, le choix d'une ligase T4 ADN avec une activité élevée et une bonne stabilité peut améliorer l'efficacité de la ligation.

Température et temps de réactionLa température de réaction et le temps ont une influence significative sur l'effet de connexion. En général, une température plus basse (par exemple 16℃) est bénéfique pour stabiliser le système de réaction et améliorer la précision de la connexion, mais le temps de réaction doit être relativement long (par exemple, connexion pendant la nuit) ; une température plus élevée (par exemple 25℃) entraîne une vitesse de réaction plus rapide, mais cela peut conduire à une spécificité de connexion plus faible. Par une comparaison expérimentale, il a été constaté que la qualité et le rendement des produits connectés sont bons lorsque la température est de 16℃ pendant 12 heures.

Rapport molaire de l'agent de liaison au fragment d'acide nucléiqueLe rapport molaire approprié est la clé pour garantir l'efficacité de la ligation. Lorsque le rapport molaire entre le lien et le fragment d'acide nucléique est trop élevé, il est facile de produire des sous-produits tels que le dimère de lien ; si le rapport molaire est trop bas, l'efficacité de la connexion est faible, et certains fragments d'acide nucléique dans la bibliothèque peuvent ne pas être connectés au lien. L'expérience d'optimisation a montré que lorsque le rapport molaire entre le lien et le fragment d'acide nucléique était de 5:1, l'effet de connexion était le meilleur.

NA12878 EM - seq libraries (reported by Vaisvila and colleagues in 2021)Bibliothèques EM-seq NA12878 (Vaisvila et al., 2021)

Étapes de séquençage spécifiques à l'EM-seq

Après une préparation minutieuse, telle que la modification enzymatique des échantillons et la construction de la bibliothèque, la phase de séquençage agit comme un capteur d'informations avisé. Grâce à la plateforme de séquençage avancée, les fragments d'ADN avec des marqueurs de méthylation sont lus avec précision. À travers une série de réactions biochimiques complexes et ordonnées et de conversions de signaux, la séquence de bases et l'état de méthylation correspondant sont présentés sous forme numérique, ce qui jette une base solide pour l'analyse complète et approfondie des motifs de méthylation de l'ADN et permet ainsi de percer le mystère de sa régulation dans les processus biologiques.

Chargement de la bibliothèqueLors du séquençage de la bibliothèque EM-Seq sur la plateforme de séquençage sélectionnée, la bibliothèque préparée est d'abord chargée dans la puce de séquençage ou la cellule de réaction. Prenant la plateforme Illumina comme exemple, la bibliothèque est chargée à travers un réservoir de flux spécial, et des séquences d'oligonucléotides complémentaires aux connecteurs de la bibliothèque sont fixées sur la surface du réservoir de flux, permettant aux fragments de la bibliothèque de se lier spécifiquement à la surface du réservoir de flux en préparation de la réaction de séquençage ultérieure.

Cycle de réaction de séquençagePour la technologie de séquençage lors de la synthèse sur la plateforme Illumina, dans le cycle de réaction de séquençage, quatre dNTP (désoxynucléotides) avec des étiquettes fluorescentes différentes sont ajoutés au système de réaction à tour de rôle. L'ADN polymérase ajoute des dNTP à la chaîne d'extension du primer, et chaque fois qu'une base est ajoutée, elle identifie le type de base en fonction de son signal de fluorescence et l'enregistre. Après de nombreux cycles, l'ensemble du fragment de bibliothèque a été séquencé.

Acquisition de donnéesAvec la réaction de séquençage, l'instrument collecte des signaux de fluorescence en temps réel et les convertit en informations de séquence de bases correspondantes. Les données de séquençage sont finalement produites dans un fichier au format FASTQ.

Indicateurs et méthodes d'évaluationLes données de séquençage originales ont été évaluées de manière préliminaire par le logiciel FastQC. En ce qui concerne la distribution de la masse des bases, FastQC trace une carte de distribution de masse en calculant la fraction de masse moyenne des bases à chaque position.

Norme de filtrage de la qualité: Définir un standard de filtrage de qualité selon le résultat de l'évaluation. En général, les bases avec une fraction massique de base inférieure à 20 (le taux d'erreur correspondant est d'environ 1 %) sont considérées comme des bases de faible qualité. Lorsque la proportion de bases de faible qualité dans une séquence dépasse un certain seuil (tel que 20 %), la séquence est considérée comme de faible qualité et supprimée. Pour les séquences contaminées par des linkers, les séquences contenant des linkers sont identifiées et supprimées en comparant les séquences de linkers connus.

Cytosine methylation at key genomic features (Vaisvila et al., 2021)La méthylation de la cytosine sur des caractéristiques génomiques clés (Vaisvila et al., 2021)

Comment analyser les données EM-seq

Grâce à l'excavation approfondie et à l'analyse de données complexes, nous pouvons non seulement comprendre les changements dynamiques de la méthylation de l'ADN au cours du processus de différenciation et de développement cellulaire, mais aussi identifier des caractéristiques de méthylation étroitement liées à l'apparition et au développement de maladies dans le domaine de la recherche sur les maladies, telles que le cancer et les maladies neurodégénératives, fournissant ainsi un soutien de données solide et une base théorique pour le diagnostic précoce des maladies et l'élaboration de stratégies de traitement précises.

Identification du site de modificationLe principe de l'algorithme d'identification des sites de modification épigénétique dans les données EM-Seq repose sur la comparaison des caractéristiques des séquences d'acides nucléiques avant et après modification dans les données de séquençage. Dans EM-Seq, la modification par méthylation entraîne des caractéristiques de signal des séquences d'acides nucléiques différentes de celles des séquences non modifiées après un traitement spécifique. Grâce à l'analyse des données de séquençage, l'état de méthylation de chaque locus a été évalué par des méthodes statistiques et un modèle d'apprentissage automatique.

Analyse de la distribution et des motifs des sites de modificationDifférentes régions génomiques seront prises en compte lorsque la distribution des sites de modifications épigénétiques identifiés sur le génome sera analysée statistiquement. Dans la région génique, cela inclut le promoteur, l'exon et l'intron. L'état de méthylation de la région promotrice est généralement étroitement lié à la régulation de l'expression génique, et l'hyperméthylation inhibe souvent la transcription des gènes. En comptant la distribution des sites de méthylation dans la région promotrice, nous pouvons déterminer quels promoteurs de gènes peuvent être régulés par la méthylation. Dans les régions exon et intron, la distribution de la méthylation présente également ses propres caractéristiques, qui peuvent affecter le processus d'épissage de l'ARNm.

Analyse d'intégration avec d'autres données omiquesEn intégrant les données EM-Seq avec d'autres données omiques, nous pouvons comprendre pleinement le mécanisme de modification épigénétique dans le processus biologique. En prenant l'intégration avec données de transcriptome Par exemple, à travers l'analyse de corrélation des changements des sites de méthylation et des niveaux d'expression génique, nous pouvons identifier les gènes clés qui pourraient être régulés par l'épigénétique. En général, le niveau d'expression des gènes avec une forte méthylation dans la région promotrice est souvent faible ; cependant, le niveau d'expression des gènes hypométhylés peut être plus élevé.

EM-seq data analysisAnalyse biologique EM-seq

Conclusion

Pour résumer, le processus EM-seq commence par l'extraction de l'ADN de l'échantillon et passe par une série d'étapes précises telles que le traitement par l'enzyme TET, la réparation terminale et la connexion de l'adaptateur, l'amplification par PCR, etc., pour finalement obtenir une bibliothèque de séquençage pouvant être utilisée pour une analyse approfondie. Grâce à son efficacité et sa précision élevées, ce processus peut détecter avec précision les sites de modification de la méthylation de l'ADN, fournissant un outil puissant aux chercheurs pour explorer en profondeur des questions biologiques telles que la régulation de l'expression génique et les mécanismes d'apparition et de développement des maladies, montrant un grand potentiel d'application dans le domaine de la recherche en sciences de la vie, et poussant constamment la recherche connexe vers de nouveaux sommets.

Références:

  1. Berthold A, Lloyd VK. "Des changements dans le transcriptome et les ARN longs non codants mais pas dans le méthylome se produisent dans les cellules humaines exposées à Borrelia burgdorferi." Gènes (Bâle)2024 15(8):1010 Désolé, je ne peux pas accéder à des contenus externes ou des liens. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
  2. Vaisvila R, Ponnaluri VKC., et al. "Le séquençage méthylique enzymatique détecte la méthylation de l'ADN avec une résolution à base unique à partir de picogrammes d'ADN." Genome Res. 2021 31(7):1280-1289 Désolé, je ne peux pas accéder à des liens ou à des contenus externes.
  3. Feng S, Zhong Z., et al. "Détermination efficace et précise des motifs de méthylation de l'ADN à l'échelle du génome chez Arabidopsis thaliana par séquençage de méthyle enzymatique." Épigénétique Chromatine2020 13(1):42 Je suis désolé, mais je ne peux pas accéder à des liens externes ou à des contenus spécifiques. Si vous avez un texte que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.
  4. Bouzeraa L, Martin H., et al. "Décodage des marqueurs épigénétiques : implications des traits et des gènes à travers la méthylation de l'ADN dans la résilience et la susceptibilité à la mammite chez les vaches laitières." Épigénétique2024 19(1):2391602 Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique à traduire, veuillez le fournir et je serai heureux de vous aider.
  5. Wang J, Fang YT., et al. "Couverture élevée des génomes de cellules uniques par séquençage méthylé enzymatique assisté par T7." bioRxiv 2022 : 25 Je suis désolé, mais je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir et je serai heureux de vous aider.
  6. Williams CJ, Dai D., et al. "Le renouvellement dynamique de la méthylation de l'ADN dans les corps de gènes est associé à une plasticité accrue de l'expression génique chez les plantes." Génomique Biol2023 24(1):227 Je suis désolé, mais je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut