Technologies pour étudier la régulation des gènes
Les gènes sont les unités de base de l'hérédité. Ils sont cruciaux pour le développement individuel, les maladies et le vieillissement. La régulation des gènes est la manière dont les organismes contrôlent les niveaux de protéines. Cela se fait en gérant la transcription de l'ADN et la traduction de l'ARNm. La régulation des gènes fonctionne à différents stades. Ces stades sont la régulation au niveau transcriptionnel, la régulation post-transcriptionnelle et la régulation au niveau de la traduction. Comprendre ce système complexe nécessite des technologies avancées. Ces technologies nous aident à examiner chaque couche du contrôle des gènes. Cet article fournit un aperçu des principales technologies utilisées pour étudier la régulation des gènes, y compris RNA-seq, ATAC-seq, ChIP-seq, CRISPR/Cas9 et techniques de cellule unique.
Séquençage du transcriptome (RNA-seq) et analyse de l'expression génique
Séquençage de l'ARN (RNA-seq) se présente comme une technique hautement efficace. Elle quantifie précisément les niveaux d'expression des gènes. Cette méthode peut révéler de nouveaux transcrits (molécules d'ARN). De plus, l'ARN-seq identifie diverses variations d'épissage, qui représentent différentes manières dont les gènes sont assemblés. Elle détecte également des altérations subtiles de l'ADN, telles que les polymorphismes à un seul nucléotide (SNP) et les insertions/délétions (indels), grâce au séquençage à grande échelle des molécules d'ARN. Par rapport à la technologie de microarray conventionnelle, l'ARN-seq présente une sensibilité supérieure et une plage dynamique plus large. Cela permet la détection même de transcrits à faible abondance et élimine la limitation antérieure de nécessiter des informations génomiques complètes.
Principes de base et flux de travail expérimental de l'ARN-seq
À sa base, le séquençage de l'ARN (RNA-seq) fonctionne en transformant les molécules d'ARN en ADN complémentaire (cDNA) plus stable, qui est ensuite prêt pour le séquençage. Ce processus fondamental se déroule à travers plusieurs étapes cruciales :
Isolation de l'ARN
La première étape consiste à obtenir de l'ARN total de haute qualité à partir de cellules ou d'échantillons de tissu. Souvent, l'ARN ribosomique (ARNr), qui constitue la majeure partie de l'ARN, est éliminé. Cette étape permet de concentrer l'échantillon en ARN messager (ARNm) et d'autres ARN non codants importants.
Préparation de la bibliothèque
Ensuite, l'ARN isolé est fragmenté en morceaux plus petits. Ces fragments sont ensuite rétrotranscrits en ADNc simple brin. Par la suite, un second brin d'ADNc est synthétisé, formant de l'ADNc double brin. Il est crucial que des adaptateurs soient ensuite attachés à ces fragments d'ADNc ; ceux-ci sont essentiels pour la phase de séquençage à venir.
Séquençage
La "bibliothèque" de cDNA préparée est chargée sur une plateforme de séquençage à haut débit. Ici, des millions de courtes séquences de lectures sont générées. Chacune de ces lectures correspond à un fragment d'un transcrit d'ARN original.
Enfin, les lectures de séquençage brutes subissent une analyse bioinformatique. Ces lectures sont alignées à un génome de référence. En comptant combien de lectures se rapportent à chaque gène, les niveaux d'expression génique peuvent être précisément quantifiés. Cela permet finalement aux chercheurs de déterminer l'abondance relative de chaque transcrit présent dans l'échantillon.
Figure1. Flux de travail RNA-seq.Love, M. et al. 2015)
Le rôle de l'ARN-seq dans l'analyse de l'expression génique
L'ARN-seq nous fournit des données claires sur le niveau d'expression des gènes. Cela inclut les niveaux de gènes, les différentes manières dont les gènes sont assemblés (variantes d'épissage) et les modifications de l'emballage de l'ADN (modifications épigénétiques). En comparant les schémas d'expression des gènes dans différentes situations, nous pouvons identifier des gènes qui agissent différemment. Cela nous aide à comprendre comment la régulation des gènes change de manière dynamique. Par exemple, dans les études sur les maladies, l'ARN-seq peut détecter des gènes exprimés de manière anormale dans les cellules cancéreuses. Cela nous aide à trouver des biomarqueurs et des cibles potentielles pour le traitement. De plus, l'ARN-seq peut explorer des processus qui se produisent après qu'un gène a été copié, comme la fusion de gènes, l'édition de l'ARN et la dégradation de l'ARN. Ces processus sont très importants pour contrôler comment les gènes sont exprimés.
L'RNA-seq fait plus que simplement montrer des changements dans l'expression des gènes ; il aide à construire des réseaux de régulation génique. Nous pouvons combiner les données d'RNA-seq avec d'autres données "omiques", comme le ChIP-seq, l'ATAC-seq et les données de méthylation de l'ADN. Cela permet d'avoir une vue plus complète de la façon dont les gènes sont contrôlés. Par exemple, le ChIP-seq montre où les facteurs de transcription se lient à l'ADN. L'RNA-seq montre ensuite comment ces gènes s'expriment. En combinant ces données, nous pouvons construire un réseau génique détaillé, révélant comment les gènes s'influencent mutuellement. L'RNA-seq peut également nous aider à comprendre ce que font les facteurs de transcription. En observant les changements d'expression génique près des sites de liaison des facteurs de transcription, nous pouvons deviner lesquels sont impliqués dans la régulation des gènes.
Technologies d'accessibilité de la chromatine
L'accessibilité de la chromatine désigne la facilité avec laquelle l'ADN au sein de la chromatine peut être atteint par des protéines régulatrices et d'autres molécules essentielles. À l'intérieur du noyau, l'ADN est enroulé de manière complexe autour des protéines histones, formant des unités fondamentales appelées nucléosomes. Ces nucléosomes subissent ensuite un enroulement et un pliage supplémentaires pour construire la structure de chromatine de haut niveau. Le niveau d'accessibilité dans des zones spécifiques de la chromatine détermine directement si les gènes qu'elles contiennent peuvent être transcrits et par la suite contrôlés. Les régions de chromatine hautement accessibles favorisent généralement les interactions avec des facteurs de transcription et divers autres éléments régulateurs, favorisant ainsi l'expression génique. En revanche, les zones de chromatine largement inaccessibles sont souvent liées à la suppression de l'activité génique, souvent appelée silençage génique.
La signification biologique de l'ouverture de la chromatine
La chromatine, le complexe d'ADN et de protéines (principalement des histones), peut exister dans différents états :
- Chromatine fermée (hétérochromatine): Densément empaquetés et généralement inaccessibles aux facteurs de transcription et à l'ARN polymérase. Les gènes dans ces régions sont généralement silencieux.
- Chromatine ouverte (Euchromatine): Peu compactés et accessibles, permettant aux protéines régulatrices de se lier à l'ADN. Ces régions correspondent souvent à des gènes actifs, des promoteurs, des amplificateurs et d'autres éléments régulateurs.
Aperçus de l'ATAC
ATAC - seq a fourni de nombreuses nouvelles perspectives sur la régulation des gènes. L'une des découvertes significatives est la découverte de nouveaux éléments régulateurs. En cartographiant l'accessibilité de la chromatine à travers le génome, l'ATAC-seq peut identifier des régions susceptibles d'être impliquées dans la régulation des gènes, telles que les amplificateurs, les promoteurs et les isolateurs. Ces éléments régulateurs jouent des rôles cruciaux dans le contrôle de l'expression des gènes en interagissant avec des facteurs de transcription et d'autres protéines régulatrices.
Une étude a révélé que les domaines topologiques (TAD) peuvent former des interactions à longue distance sur des millions de bases, construisant une unité de pliage du génome de haut ordre appelée méta-domaines. Dans ces structures, les promoteurs dans des TAD distants sont spécifiquement appariés avec des éléments régulateurs intergéniques, impliquant principalement des gènes liés à la détermination du destin neuronal. L'étude a trouvé que bien que ces associations à longue distance existent dans de nombreux neurones, elles ne stimulent l'activité transcriptionnelle que dans quelques neurones. Grâce à une analyse ATAC-seq à cellule unique, les auteurs ont découvert que les frontières des méta-domaines chevauchent de manière significative les pics d'accessibilité de la chromatine et les régions de haute sensibilité à la DNase, suggérant qu'elles pourraient être ancrées par des facteurs de transcription tels que GAF et CTCF. Cette étude montre que le pliage du génome peut former des échafaudages régulateurs spécifiques au type cellulaire, offrant une nouvelle perspective pour comprendre la régulation génique à grande échelle.
Figure 2. Organisation au niveau des chromosomes du génome régulateur.Mohana, G., et al. 2023)
Services qui pourraient vous intéresser
En savoir plus
Immunoprécipitation de la chromatine (ChIP - seq) et localisation des facteurs de transcription
ChIP-seq La ChIP-seq (Immunoprécipitation de la chromatine suivie de séquençage) est une technique utilisée pour identifier les sites de liaison des facteurs de transcription. En utilisant des anticorps spécifiques pour enrichir les fragments d'ADN qui se lient à des protéines spécifiques, la ChIP-seq peut révéler les emplacements de liaison des facteurs de transcription sur le génome. Combinée à la technologie de séquençage à haut débit, la ChIP-seq peut fournir une carte de liaison des facteurs de transcription à l'échelle du génome, aidant ainsi les chercheurs à comprendre le mécanisme de régulation des gènes.
Le processus de base du ChIP-seq
La procédure fondamentale pour le ChIP-seq commence par le croisement des complexes ADN-protéine. Par la suite, la chromatine est fragmentée en morceaux plus petits par sonication. Des anticorps spécifiques sont ensuite utilisés pour l'immunoprécipitation, isolant l'ADN lié à la protéine cible, qui est ensuite séquencé. L'analyse de ces données de séquençage permet d'identifier des régions hautement enrichies, appelées "pics", représentant des sites de liaison des facteurs de transcription. De plus, le ChIP-seq offre des perspectives sur les marques épigénétiques, telles que les modifications des histones, éclairant ainsi des mécanismes complexes de régulation génique.
Applications de ChIP-seq dans la construction de réseaux régulateurs
Les données ChIP-seq sont fondamentales pour construire des réseaux régulateurs de gènes complets :
Identification des cibles directes : En identifiant les sites de liaison d'un facteur de transcription, le ChIP-seq relie directement un régulateur à ses gènes cibles, révélant des relations de cause à effet.
Définition des éléments régulateurs : Le ChIP-seq pour des modifications spécifiques des histones (par exemple, H3K27ac pour les enhancers actifs) aide à délimiter les frontières et l'activité de divers éléments régulateurs à travers le génome.
Intégration avec d'autres données : Combiner les données ChIP-seq avec les données RNA-seq (pour voir si les gènes cibles sont exprimés de manière différentielle) et ATAC-seq (pour voir si les sites de liaison se trouvent dans une chromatine ouverte) permet une compréhension plus complète de la façon dont les facteurs de transcription recrutent la machinerie transcriptionnelle et modulent l'expression des gènes dans un contexte chromatinien dynamique. Cette intégration est cruciale pour reconstruire le circuit complexe de la régulation génique.
Technologie CRISPR/Cas9 : Intervention précise dans les mécanismes de régulation génétique
CRISPR/Cas9 provient du système immunitaire acquis des bactéries et des archées, et est utilisé pour résister aux infections virales. Lorsqu'un bactériophage envahit, l'ARN cr (crRNA), l'ARN trac (tracrRNA) et la protéine Cas9 forment un complexe pour reconnaître le motif adjacent au protospacer (PAM, la séquence est un segment de trois bases NGG) de la séquence d'ADN du bactériophage, où l'ARN cr se lie à la séquence d'ADN adjacente au PAM de manière complémentaire pour ouvrir la structure en double brin, et l'ARN trac active l'activité de coupure de Cas9, coupant près du troisième nucléotide en amont du site PAM pour rompre le double brin d'ADN, résistant ainsi à l'invasion virale. Le système de mutation génique CRISPR/Cas9 développé sur la base de ce système ne contient que deux composants importants, l'un étant la protéine Cas9 avec une activité de coupure de double brin d'ADN, et l'autre étant l'sgRNA (ARN guide court) avec une fonction de guidage. La protéine Cas9 peut se lier à l'sgRNA et cibler l'ADN cible grâce à un appariement complémentaire des bases sous la direction de l'sgRNA. Avec l'aide de l'activité d'endonucléase de Cas9, des cassures d'ADN double brin se produisent au site cible, puis des mutations géniques sont causées avec l'aide de la réparation de l'ADN cellulaire (Figure 4). Par exemple, les cellules peuvent utiliser la voie de jonction des extrémités non homologues (NHEJ) pour provoquer des mutations de décalage du cadre de lecture ou des suppressions et insertions de fragments dans les gènes, tandis que la voie de réparation par recombinaison homologue (HR) peut fournir de l'ADN donneur pour réaliser un édition spécifique des gènes ou l'insertion de gènes spécifiques.
Figure 3. Vue d'ensemble des applications CRISPR/Cas9.Xiong, X. et al. 2016)
Au-delà de la coupure de l'ADN, des versions modifiées de l'enzyme Cas9 peuvent être ciblées avec précision sur des loci génomiques spécifiques pour activer ou réprimer l'expression génique :
- Interférence CRISPR (CRISPRi)Ce système utilise un Cas9 catalytiquement inactif (dCas9), qui peut se lier à l'ADN mais ne peut pas le couper. Lorsque le dCas9 est fusionné à un domaine de répresseur transcriptionnel (par exemple, KRAB), il peut être guidé par un ARN guide unique (sgRNA) vers le promoteur ou la région codante d'un gène, bloquant physiquement la machinerie de transcription et "silencieux" efficacement l'expression génique. CRISPRi offre une méthode hautement spécifique et titrable pour la réduction de l'expression génique.
- Activation CRISPR (CRISPRa)Inversement, le dCas9 peut être fusionné à un domaine d'activateur transcriptionnel (par exemple, VP64 ou P65-HSF1). Lorsqu'il est dirigé vers le promoteur ou la région amplificatrice d'un gène, ce complexe recrute la machinerie transcriptionnelle endogène, entraînant l'"activation" ou la régulation à la hausse de l'expression génique. CRISPRa fournit un outil puissant pour étudier les effets de la surexpression de gènes spécifiques ou de l'activation d'éléments régulateurs dormants.
Progrès de pointe de la technologie des cellules uniques dans la recherche réglementaire
L'évolution des technologies à cellule unique offre un nouveau point de vue pour étudier la régulation des gènes. Plus précisément, le séquençage d'ARN à cellule unique (scRNA-seq) éclaire les différences inhérentes entre les cellules individuelles. Cette capacité aide les chercheurs à déchiffrer les motifs d'expression génique uniques à différents types de cellules. De plus, l'avènement du séquençage ATAC à cellule unique permet d'examiner l'accessibilité de la chromatine à la résolution d'une seule cellule, révélant ainsi des distinctions régulatrices entre elles.
De plus, les approches unicellulaires peuvent être intégrées à la technologie de criblage CRISPR pour explorer les changements dynamiques au sein des réseaux de régulation génique. Par exemple, la technologie Perturb-ATAC permet d'identifier comment les facteurs de transcription, les ARN non codants longs et les régulateurs de la chromatine gouvernent l'accessibilité du génome. Cela est réalisé en détectant simultanément les ARN guides CRISPR ainsi qu'une analyse de groupe épigénétique, offrant une compréhension plus approfondie de ces interactions complexes.
Conclusion
Avec le développement continu du séquençage à haut débit, de la technologie des cellules uniques, du CRISPR/Cas9 et d'autres technologies, les frontières de la recherche sur la régulation des gènes s'élargissent constamment. Ces technologies nous aident non seulement à comprendre plus en profondeur le mécanisme de la régulation des gènes, mais elles offrent également de nouvelles perspectives sur les mécanismes des maladies et les stratégies de traitement.
Références:
- Love, M. I., Anders, S., Kim, V., & Huber, W. (2015). Flux de travail RNA-Seq : analyse exploratoire au niveau des gènes et expression différentielle. F1000Research, 4, 1070. Je suis désolé, mais je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
- Mohana, G., et al. (2023). Organisation au niveau des chromosomes du génome régulateur dans le système nerveux de Drosophila. Cellule, 186(18), 3826–3844.e26. Je suis désolé, mais je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir et je serai heureux de vous aider.
- Xiong, X., Chen, M., Lim, W. A., Zhao, D., & Qi, L. S. (2016). CRISPR/Cas9 pour l'ingénierie du génome humain et la recherche sur les maladies. Revue annuelle de la génomique et de la génétique humaine, 17, 131–154. Désolé, je ne peux pas accéder à des liens externes.