L'analyse intégrative de multiples ensembles de données génomiques est cruciale pour comprendre la complexité de la régulation des gènes dans la santé et la maladie. Les récentes avancées dans les technologies de séquençage à haut débit ont conduit à la génération de grandes quantités de données génomiques, telles que Hi-C, ATAC-seq, ChIP-seqet des données d'expression génique. Hi-C est une technique qui capture les interactions de la chromatine à l'échelle du génome, tandis que l'ATAC-seq et le ChIP-seq fournissent des informations sur l'accessibilité de la chromatine et les interactions protéine-ADN, respectivement. En intégrant ces ensembles de données, les chercheurs peuvent étudier la relation entre la structure de la chromatine, la liaison des facteurs de transcription et l'expression génique.
Runx1/AML1 est un membre de la famille des facteurs de transcription RUNX impliqués dans le maintien de l'homéostasie hématopoïétique normale. La disruption de RUNX1 chez l'homme entraîne plusieurs troubles hématopoïétiques, y compris la leucémie myéloïde aiguë et les troubles plaquettaires familiaux avec des malignités myéloïdes. Runx1 est un gène large et complexe qui est régulé transcriptionnellement par deux promoteurs (P1 et P2) sous le contrôle spatiotemporel de plusieurs amplificateurs hématopoïétiques. L'élucidation du mécanisme de régulation transcriptionnelle de Runx1 devrait contribuer à une meilleure compréhension des changements de conformation de la chromatine adoptés par des gènes complexes à plusieurs promoteurs pendant le développement. L'analyse combinée de Dnasel-seq, ChIP-seq, ATAC-seq et RNA-seq a révélé des sites de chromatine accessibles sur des amplificateurs connus, des sites CTCF et des éléments cis-régulateurs candidats au sein des TAD pendant la différenciation. Il a été constaté que pendant la différenciation, des frontières de chromatine sub-TAD se forment de manière dynamique au sein du grand et complexe domaine régulateur de Runx1 et sont impliquées dans la coordination de l'expression génique et de la différenciation hématopoïétique.
Modèle schématique des changements dynamiques de la chromatine au niveau de Runx1 pendant le développement hématopoïétique et après les suppressions de sites CTCF proches du promoteur.
En plus de la recherche sur les maladies, l'analyse intégrative a également été utilisée pour étudier le développement normal et la différenciation cellulaire. Gossypium hirsutum, une culture de fibres et de graines oléagineuses importée et largement cultivée dans le monde, est également un modèle pour analyser tous les génomes polyploïdes. Cette recherche se concentre sur la détermination de la composition fonctionnelle du génome, y compris les gènes codants pour des protéines et les éléments régulateurs non codants, afin de guider l'amélioration des traits agricoles. L'étude a d'abord préparé une bibliothèque Hi-C à ultra-haute résolution (3 Kb) (233 Gb) et une bibliothèque Pore-C avec une résolution appropriée (20 Kb) basée sur des feuilles de G. hirsutum pour construire une carte génomique 3D fine du coton afin d'explorer pleinement les multiples interactions des domaines structuraux de la chromatine pour aider à comprendre l'état et la localisation intranucléaire des composants génomiques fonctionnels. Ensuite, Hi-C, ChIA-PET (H3K4me3) et ChIP-Seq (H3K4me3, H3K27ac et H3K27me3) ont été utilisés pour étudier les boucles de chromatine et leur rôle potentiel dans la transcription des gènes. À une résolution de 3 Kb, l'étude a observé 31 047 boucles gène-gène, 40 035 boucles gène-région non codante et 121 415 autres boucles. Les gènes situés aux points d'ancrage des boucles gène-gène avaient des niveaux d'expression plus élevés, associés à des niveaux plus élevés de modifications d'histones actives. Des éléments régulateurs cis-transcriptionnels à longue portée (CREs) ont ensuite été identifiés en combinant ATAC-Seq, ChIP-Seq et boucles de chromatine. Cette étude a examiné de manière exhaustive la fine structure du génome 3D du coton allotétraploïde et a analysé les caractéristiques des interactions multiples complexes et de haut niveau, ainsi que leur impact potentiel sur l'expression des gènes.
Cartographie multi-omique de la fine structure 3D du génome et implications dans la régulation transcriptionnelle chez le coton allotétraploïde.
L'analyse intégrative de plusieurs ensembles de données génomiques, tels que Hi-C, ATAC-seq, ChIP-seq et les données d'expression génique, a le potentiel de fournir une compréhension plus approfondie de l'organisation spatiale de la chromatine, de la régulation transcriptionnelle et des mécanismes de la maladie.
Références: