La recherche génomique englobe diverses dimensions, principalement classées en représentations 1D, 2D et 3D. Dans le domaine 1D, les chercheurs utilisent des techniques de cartographie linéaire pour étudier les séquences génomiques. En passant à la dimension 2D, ils se penchent sur l'analyse de réseaux, en se concentrant particulièrement sur les réseaux sans échelle. Enfin, la dimension 3D examine les aspects structurels et dynamiques du génome.
La technologie Hi-C se distingue comme une méthode puissante pour étudier la structure 3D des génomes. Dérivée de la fusion de Séquençage à haut débit (HTS) et la Capture de Conformation des Chromosomes (3C), Hi-C offre des aperçus sur l'organisation spatiale de la chromatine au sein du noyau.
La capture de conformation des chromosomes (3C) implique une série d'étapes : fixation de la chromatine nucléaire, digestion des liaisons entre la chromatine et les protéines, ligation des digestats, libération des protéines liées et analyse par PCR pour détecter les interactions entre les fragments d'ADN. Cette méthode suppose que les fragments d'ADN interagissant physiquement présentent des fréquences de liaison plus élevées, qui sont identifiées par PCR spécifique de locus.
Hi-C va plus loin en construisant des assemblages au niveau des chromosomes à partir de séquences génomiques fragmentées et en déterminant leur ordre et leur orientation sur le chromosome. De plus, Hi-C peut être intégré à d'autres données omiques, telles que RNA-Seq et ChIP-Seqpour élucider les réseaux régulateurs de gènes et épigénétiques sous-jacents aux traits des organismes.
Formes de réarrangements génomiques complexes : La chromoplexie se caractérise par l'échange de fragments plus grands entre les chromosomes. (Schöpflin et al., 2022)
Les cellules subissent une préparation et une fixation par réticulation avec du formaldéhyde ou du paraformaldéhyde. Ce processus préserve les interactions protéine-ADN et ADN-ADN intracellulaires, maintenant ainsi la structure 3D à l'intérieur de la cellule. Pour les échantillons vivants, un traitement typique implique 1 à 3 % de formaldéhyde pendant 10 à 30 minutes à température ambiante. Cependant, il est crucial de noter que cette étape peut entraver l'efficacité de la digestion des séquences d'ADN par les endonucléases de restriction et nécessite un contrôle précis.
L'ADN est clivé enzymatiquement à l'aide d'endonucléases de restriction, générant des extrémités collantes de chaque côté des liaisons croisées. La taille des fragments résultants impacte la résolution du séquençage. En général, deux enzymes sont disponibles pour sélection : une endonucléase de restriction de 6 pb ou une endonucléase de restriction de 4 pb. Des enzymes telles qu'EcoR1 ou HindIII sont utilisées pour couper le génome environ tous les 4000 pb, résultant en environ 1 million de fragments dans le génome humain.
Étapes principales du protocole Hi-C avant le séquençage. (Lun et al., 2015)
L'ADN fragmenté possède soit des extrémités plates, soit des extrémités collantes, qui subissent une réparation pour créer des extrémités franches. Au cours de ce processus, des bases marquées à la biotine sont introduites pour faciliter la purification et la capture ultérieures de l'ADN.
Les fragments d'ADN réparés à leurs extrémités sont bouclés entre des segments d'ADN contenant des interactions à l'aide de la ligase T4. Par la suite, les protéines reliant les fragments d'ADN sont digérées pour isoler les fragments réticulés.
L'ADN est déliqué, purifié et fragmenté en fragments de 300 pb à 700 pb. Les fragments contenant des interactions sont ensuite capturés pour la construction de la bibliothèque à l'aide de billes magnétiques à affinité de brin. Des ultrasons ou des méthodes similaires sont utilisés pour décomposer davantage les fragments.
Des fragments contenant de la biotine sont capturés à l'aide de billes magnétiques, des bibliothèques sont construites et le séquençage est réalisé.
Le processus d'analyse des données pour le séquençage Hi-C comprend six étapes critiques :
Assemblage Hi-C
L'assemblage Hi-C est généralement réalisé à l'aide de logiciels tels que LACHESIS, qui segmente, séquence et oriente le génome en fonction du soutien fourni par des paires de lectures valides. Ce processus implique un mappage manuel et une vérification du génome pour obtenir un assemblage final au niveau des chromosomes.
Les paires de lectures valides produisent des signaux sur la carte, dont la force est directement proportionnelle à la distance spatiale et à la distance de séquence entre les contigs. Cette information permet la correction d'erreurs, y compris l'identification et la correction de contigs mal assemblés, l'ajustement des orientations des contigs et la détermination du placement des contigs au sein des chromosomes par le biais de regroupements.
En fin de compte, un assemblage de génome au niveau des chromosomes, affiné, est obtenu, avec les éventuelles divergences restantes ajustées manuellement pour garantir l'exactitude. Le processus d'ajustement manuel vise à obtenir un signal diagonal clair, indicatif d'un génome bien assemblé.
Ces dernières années, la technologie Hi-C a joué un rôle essentiel dans l'avancement de l'assemblage du génome et la compréhension de la structure tridimensionnelle (3D) des génomes chez divers organismes, y compris les humains, les chèvres, les moustiques, la levure, l'orge et le blé. L'assemblage réussi de génomes au niveau des chromosomes dans ces espèces souligne la fiabilité et la polyvalence de la technologie d'assemblage du génome assistée par Hi-C.
La technologie Hi-C révèle la structure tridimensionnelle complexe des génomes, élucidant l'organisation hiérarchique de la chromatine, des compartiments (compartiments A/B) aux domaines structuraux associés à la topologie (TAD), et plus loin aux boucles. Cette compréhension globale est cruciale pour étudier les interactions spatiales entre les séquences d'ADN, construire des structures chromosomiques 3D à haute résolution, déchiffrer les mécanismes de régulation des gènes et faciliter la construction de génomes trans-chromosomiques et d'haplotypes s'étendant sur des chromosomes. Notamment, les structures 3D des génomes ont été reconstruites avec succès dans divers organismes, y compris les humains, la drosophile, la levure, Arabidopsis thaliana, le riz et des espèces de coton. Une analyse comparative des structures 3D des génomes à travers différents échantillons a également été réalisée, apportant des éclaircissements sur des aspects évolutifs et fonctionnels.
Références :