Aperçu du séquençage Hi-C

Qu'est-ce que le séquençage Hi-C ?

La recherche génomique englobe diverses dimensions, principalement classées en représentations 1D, 2D et 3D. Dans le domaine 1D, les chercheurs utilisent des techniques de cartographie linéaire pour étudier les séquences génomiques. En passant à la dimension 2D, ils se penchent sur l'analyse de réseaux, en se concentrant particulièrement sur les réseaux sans échelle. Enfin, la dimension 3D examine les aspects structurels et dynamiques du génome.

La technologie Hi-C se distingue comme une méthode puissante pour étudier la structure 3D des génomes. Dérivée de la fusion de Séquençage à haut débit (HTS) et la Capture de Conformation des Chromosomes (3C), Hi-C offre des aperçus sur l'organisation spatiale de la chromatine au sein du noyau.

La capture de conformation des chromosomes (3C) implique une série d'étapes : fixation de la chromatine nucléaire, digestion des liaisons entre la chromatine et les protéines, ligation des digestats, libération des protéines liées et analyse par PCR pour détecter les interactions entre les fragments d'ADN. Cette méthode suppose que les fragments d'ADN interagissant physiquement présentent des fréquences de liaison plus élevées, qui sont identifiées par PCR spécifique de locus.

Hi-C va plus loin en construisant des assemblages au niveau des chromosomes à partir de séquences génomiques fragmentées et en déterminant leur ordre et leur orientation sur le chromosome. De plus, Hi-C peut être intégré à d'autres données omiques, telles que RNA-Seq et ChIP-Seqpour élucider les réseaux régulateurs de gènes et épigénétiques sous-jacents aux traits des organismes.

Forms of complex genomic rearrangements: Chromoplexy is characterized by the exchange of larger fragments between chromosomes. (Schöpflin et al., 2022)Formes de réarrangements génomiques complexes : La chromoplexie se caractérise par l'échange de fragments plus grands entre les chromosomes. (Schöpflin et al., 2022)

Avantages de la construction de chromosomes Hi-C

  • Approche centrée sur l'individu : Contrairement aux méthodes traditionnelles qui nécessitent souvent la construction de populations, la construction de chromosomes Hi-C peut être efficacement réalisée par un seul individu. Cela simplifie le processus, réduisant ainsi le besoin d'études basées sur de vastes populations.
  • Efficacité de localisation améliorée : La construction de chromosomes Hi-C présente une efficacité de localisation supérieure à celle de nombreuses techniques conventionnelles. Cela signifie qu'elle peut identifier avec précision l'organisation spatiale des séquences génomiques, offrant des informations détaillées sur les interactions de la chromatine et les arrangements structurels.
  • Capacités de correction d'erreurs : Un avantage notable de la construction de chromosomes Hi-C est sa capacité à corriger les erreurs lors de l'assemblage du génome. Cette fonctionnalité permet aux chercheurs de peaufiner et d'améliorer la précision du génome assemblé, garantissant des résultats fiables pour les analyses et interprétations ultérieures.

Flux de travail de la technologie de séquençage Hi-C

  • Réticulation cellulaire

Les cellules subissent une préparation et une fixation par réticulation avec du formaldéhyde ou du paraformaldéhyde. Ce processus préserve les interactions protéine-ADN et ADN-ADN intracellulaires, maintenant ainsi la structure 3D à l'intérieur de la cellule. Pour les échantillons vivants, un traitement typique implique 1 à 3 % de formaldéhyde pendant 10 à 30 minutes à température ambiante. Cependant, il est crucial de noter que cette étape peut entraver l'efficacité de la digestion des séquences d'ADN par les endonucléases de restriction et nécessite un contrôle précis.

  • Digestion par endonucléase

L'ADN est clivé enzymatiquement à l'aide d'endonucléases de restriction, générant des extrémités collantes de chaque côté des liaisons croisées. La taille des fragments résultants impacte la résolution du séquençage. En général, deux enzymes sont disponibles pour sélection : une endonucléase de restriction de 6 pb ou une endonucléase de restriction de 4 pb. Des enzymes telles qu'EcoR1 ou HindIII sont utilisées pour couper le génome environ tous les 4000 pb, résultant en environ 1 million de fragments dans le génome humain.

Main steps in the Hi-C protocol prior to sequencing. (Lun et al., 2015)Étapes principales du protocole Hi-C avant le séquençage. (Lun et al., 2015)

  • Réparation de fin

L'ADN fragmenté possède soit des extrémités plates, soit des extrémités collantes, qui subissent une réparation pour créer des extrémités franches. Au cours de ce processus, des bases marquées à la biotine sont introduites pour faciliter la purification et la capture ultérieures de l'ADN.

  • Cyclisation

Les fragments d'ADN réparés à leurs extrémités sont bouclés entre des segments d'ADN contenant des interactions à l'aide de la ligase T4. Par la suite, les protéines reliant les fragments d'ADN sont digérées pour isoler les fragments réticulés.

  • Purification et capture de l'ADN

L'ADN est déliqué, purifié et fragmenté en fragments de 300 pb à 700 pb. Les fragments contenant des interactions sont ensuite capturés pour la construction de la bibliothèque à l'aide de billes magnétiques à affinité de brin. Des ultrasons ou des méthodes similaires sont utilisés pour décomposer davantage les fragments.

  • Séquençage

Des fragments contenant de la biotine sont capturés à l'aide de billes magnétiques, des bibliothèques sont construites et le séquençage est réalisé.

Analyse des données pour le séquençage Hi-C

Le processus d'analyse des données pour le séquençage Hi-C comprend six étapes critiques :

  • Filtrage des lectures brutes préliminaire : Cette étape initiale consiste à filtrer les lectures brutes pour éliminer les séquences de faible qualité ou erronées, similaire aux procédures de traitement des données de séquençage de seconde génération standard.
  • Comparaison de séquences : L'utilisation du mode de séquençage à paires est recommandée pour l'analyse des données Hi-C, facilitant une comparaison précise des séquences.
  • Positionnement des sites de clivage : Après avoir déterminé l'emplacement physique des paires de lectures dans le génome, l'étape suivante consiste à identifier le site de clivage par enzyme de restriction le plus proche correspondant à chaque paire de lectures. Cela se fait en tenant compte de la restriction de la taille du fragment d'insertion. La position du segment clivé enzymatiquement fournit un emplacement approximatif où les interactions de l'ADN se sont produites.
  • Dépistage des fragments de comparaison valides : Les fragments de comparaison valides sont identifiés comme des lectures appariées situées aux extrémités opposées du site de clivage et mappées dans des directions opposées, garantissant une représentation précise des interactions chromosomiques.
  • Intégration des intensités d'interaction des fragments d'ADN : Les intensités des interactions des fragments d'ADN sont intégrées, fournissant des informations sur la force et la fréquence des interactions entre les loci génomiques.
  • Normalisation de la matrice d'interaction des fragments d'ADN : La normalisation de la matrice d'interaction des fragments d'ADN est effectuée pour garantir des comparaisons impartiales et une interprétation précise des données d'interaction.

Assemblage Hi-C

L'assemblage Hi-C est généralement réalisé à l'aide de logiciels tels que LACHESIS, qui segmente, séquence et oriente le génome en fonction du soutien fourni par des paires de lectures valides. Ce processus implique un mappage manuel et une vérification du génome pour obtenir un assemblage final au niveau des chromosomes.

Les paires de lectures valides produisent des signaux sur la carte, dont la force est directement proportionnelle à la distance spatiale et à la distance de séquence entre les contigs. Cette information permet la correction d'erreurs, y compris l'identification et la correction de contigs mal assemblés, l'ajustement des orientations des contigs et la détermination du placement des contigs au sein des chromosomes par le biais de regroupements.

En fin de compte, un assemblage de génome au niveau des chromosomes, affiné, est obtenu, avec les éventuelles divergences restantes ajustées manuellement pour garantir l'exactitude. Le processus d'ajustement manuel vise à obtenir un signal diagonal clair, indicatif d'un génome bien assemblé.

Applications de la technologie Hi-C

Ces dernières années, la technologie Hi-C a joué un rôle essentiel dans l'avancement de l'assemblage du génome et la compréhension de la structure tridimensionnelle (3D) des génomes chez divers organismes, y compris les humains, les chèvres, les moustiques, la levure, l'orge et le blé. L'assemblage réussi de génomes au niveau des chromosomes dans ces espèces souligne la fiabilité et la polyvalence de la technologie d'assemblage du génome assistée par Hi-C.

La technologie Hi-C révèle la structure tridimensionnelle complexe des génomes, élucidant l'organisation hiérarchique de la chromatine, des compartiments (compartiments A/B) aux domaines structuraux associés à la topologie (TAD), et plus loin aux boucles. Cette compréhension globale est cruciale pour étudier les interactions spatiales entre les séquences d'ADN, construire des structures chromosomiques 3D à haute résolution, déchiffrer les mécanismes de régulation des gènes et faciliter la construction de génomes trans-chromosomiques et d'haplotypes s'étendant sur des chromosomes. Notamment, les structures 3D des génomes ont été reconstruites avec succès dans divers organismes, y compris les humains, la drosophile, la levure, Arabidopsis thaliana, le riz et des espèces de coton. Une analyse comparative des structures 3D des génomes à travers différents échantillons a également été réalisée, apportant des éclaircissements sur des aspects évolutifs et fonctionnels.

  • Cartes Hi-C du génome entier : Cela inclut une analyse complète des interactions cis/trans au sein du génome.
  • Identification et analyse des compartiments A/B : Hi-C facilite l'identification et l'analyse des compartiments génomiques, complétée par des analyses conjointes avec Chip-seq et RNA-seq données.
  • Analyse des interactions entre gènes et séquences répétées : Hi-C permet d'explorer les interactions entre les gènes et les séquences répétées, souvent intégrées aux données RNA-seq pour une analyse complète.
  • Identification et analyse des TAD : La technologie Hi-C aide à l'identification et à l'analyse des Domaines Associés Topologiquement (TAD), souvent associée à Chip-seq et RNA-seq analyses.
  • Modélisation des boucles à l'échelle du génome : cet aspect nécessite des données complémentaires telles que le DNase-seq et est souvent analysé conjointement avec Chip-seq et des données RNA-seq.
  • Analyse différentielle des structures 3D : Hi-C permet une analyse différentielle des structures 3D parmi plusieurs échantillons, y compris l'analyse différentielle des compartiments A/B, des TAD et des boucles.

Références :

  1. Schöpflin, Robert, et al. "L'intégration de Hi-C avec le séquençage du génome à lectures courtes et longues révèle la structure des génomes réarrangés de la lignée germinale." Communications Nature 13.1 (2022) : 6470.
  2. Lun, Aaron TL, et Gordon K. Smyth. "diffHic : un package Bioconductor pour détecter des interactions génomiques différentielles dans les données Hi-C." BMC bioinformatique 16 (2015) : 1-11.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut