Transcriptomique est un sujet qui étudie l'expression des gènes. En analysant le transcriptome, les chercheurs peuvent comprendre quels gènes sont activés, quand et comment leurs niveaux d'expression changent. Dans cet article, nous résumons et examinons d'abord les types courants de technologies de transcriptome. Ensuite, nous comparons et analysons les avantages techniques et les principaux défis de diverses stratégies de recherche pour aider à la conception expérimentale actuelle et à l'analyse de recherche. Enfin, nous soulignons l'importance de la transcriptomique dans l'analyse intégrée multi-omiques et nous nous projetons vers ses perspectives de développement.
Transcriptome, de manière générale, fait référence à la somme de tous les ARN qui peuvent être transcrits dans une cellule ou un groupe de cellules dans le même environnement (ou conditions physiologiques), y compris l'ARN messager (ARNm), l'ARN ribosomique (ARNr), l'ARN de transfert (ARNt) et l'ARN non codant.[1]; dans une définition étroite, cela fait référence à tous les ARN messagers (ARNm) qui peuvent être transcrits par les cellules. Par conséquent, la transcriptomique peut être simplement définie comme suit : c'est l'étude de toutes les molécules d'ARN dans les cellules. La transcriptomique, également connue sous le nom de profilage d'expression, étudie les niveaux d'expression de l'ARN dans une population cellulaire donnée. L'analyse du transcriptome a un large éventail d'applications, y compris en médecine, en agriculture, dans l'environnement et pour les microorganismes.[2-5]Ici, nous commencerons par les technologies de séquençage du transcriptome et les méthodes d'analyse du transcriptome pour expliquer la découverte fonctionnelle de la transcriptomique dans le génome, révéler la composition moléculaire des cellules et des tissus, et comprendre le rôle des voies régulatrices du développement et des maladies.
RNA-Seq est une technologie récemment développée qui utilise séquençage de nouvelle génération technologies pour l'analyse du transcriptome. Elles peuvent obtenir de manière complète et rapide les informations de séquence et d'expression de presque tous les transcrits d'une cellule ou d'un tissu spécifique dans un certain état, y compris les ARNm codant des protéines et divers ARN non codants, l'abondance d'expression des différents transcrits produits par l'épissage alternatif des gènes, etc.[6,7]En analysant la structure et le niveau d'expression des transcrits, il est également possible de découvrir des transcrits inconnus et rares, permettant ainsi d'analyser avec précision des questions importantes en sciences de la vie telles que les différences d'expression génique, les variations structurelles des gènes et le dépistage de marqueurs moléculaires.[8].
Fig.1 Classification des technologies RNA-Seq
Service qui pourrait vous intéresser
Ressource
Le flux de travail pour le séquençage de l'ARN est exactement similaire (Fig. 2). Il commence par le contrôle de qualité des échantillons (Contrôle de qualité des échantillons) pour s'assurer que vos échantillons répondent aux critères de la technique RNA-Seq. Ensuite, la bibliothèque appropriée est préparée en fonction de votre organisme cible et de votre application, puis testée pour sa qualité (Contrôle de qualité de la bibliothèque). Ensuite, une stratégie de séquençage est utilisée pour séquencer les échantillons et les données résultantes sont également vérifiées pour leur qualité (Contrôle de qualité des données). Enfin, analyses bioinformatiques sont effectuées et les résultats sont fournis. Vous pouvez analyser les résultats de séquençage selon vos propres objectifs expérimentaux.
Fig.2 Un flux de travail typique d'une expérience RNA-seq
Comme mentionné ci-dessus, l'objet de la recherche transcriptomique est l'ARN dans différentes conditions physiologiques/environnementales ou les mêmes. Ils ont souvent des fonctions différentes. Les méthodes d'analyse transcriptomique pour l'ARN ayant différentes fonctions seront discutées ci-dessous.
Les ARNm sont des modèles qui guident la synthèse des protéines et sont des messagers qui transmettent l'information génétique de l'ADN aux protéines. mRNA-seq est un outil puissant pour analyser le profil transcriptomique cellulaire. Actuellement, il existe de nombreuses études liées au transcriptome de l'ARNm. Les principaux objectifs/directions de recherche incluent : 1. Profilage quantitatif des transcrits dans différents tissus ou échantillons, sous diverses conditions et traitements. 2. Découverte de nouveaux transcrits, d'épissages alternatifs (AS) et de variations de transcrits (Fig. 3)[9]3. Recherche des mécanismes de développement[10] et résistance aux médicaments[11] à travers des transcrits spécifiques aux tissus ou l'expression génique au cours du temps (Fig. 4). 4. Découverte de biomarqueurs[12] basé sur les transcriptions/isoformes de roman, l'identification de SNP/InDel et l'analyse des gènes de fusion.
Fig.3 Annotation de la fonction des gènes et analyse de la structure des gènes de Lolium multiflorum
Fig. 4 Analyse du transcriptome des tubercules de igname à différents stades de développement
Les ARN longs non codants (lncARN) constituent une fraction modérément abondante du transcriptome eucaryote, composée d'ARN non codants (ARNnc) de plus de 200 nt, qui affectent de multiples fonctions cellulaires par leur régulation de la transcription génique, des modifications post-transcriptionnelles et de l'épigénétique. Le séquençage des lncARN (lncRNA-seq) est un puissant outil de séquençage de nouvelle génération (NGS) pour étudier les rôles fonctionnels dans divers processus biologiques et maladies humaines, telles que le cancer et les troubles neurologiques.[13,14].
Les petits ARN (sARN) sont de courtes molécules d'ARN, généralement non codantes, impliquées dans le silençage génique et la régulation post-transcriptionnelle de l'expression génique. Le séquençage des sARN (sRNA-seq) est une méthode qui permet l'investigation approfondie de ces ARN, en particulier des microARN (miARN, de 18 à 40 nt de longueur). Le sRNA-seq est une approche efficace pour cibler sélectivement n'importe quelle espèce de sARN avec une sensibilité et une résolution sans précédent, le tout dans une seule analyse. Associé à un pipeline bioinformatique robuste en interne, le service sRNA-seq aide les chercheurs à décrire l'expression différentielle des miARN, les altérations structurelles et à découvrir de nouveaux sARN.[14,15].
L'ARN circulaire (circARN) est une molécule de ncARN hautement stable, sous forme de boucle fermée de manière covalente, qui ne possède ni coiffe en 5' ni queues poly(A) en 3'. La structure circulaire confère aux circARN une résistance à la digestion par les exonucléases, une caractéristique qui peut être exploitée dans la construction de bibliothèques. Le service de séquençage de circARN de CD Genomics (circRNA-seq) utilise la technologie de séquençage de nouvelle génération (NGS) pour soutenir un large éventail d'investigations axées sur le circARN. La fonction régulatrice des circARN pourrait être impliquée dans de nombreux processus biologiques.[14], comme la régulation de l'expression des gènes en agissant comme des "éponges" à miARN, le transport des miARN et la régulation globale de la synthèse des protéines.
Service qui pourrait vous intéresser
Ressource
Il peut y avoir de nombreuses cellules avec des phénotypes et des génotypes différents au sein du même type de cellules. La technologie de séquençage de l'ARN à cellule unique (single-cell RNA-seq) offre aux scientifiques l'opportunité d'étudier et d'analyser le comportement, le mécanisme et la relation des cellules individuelles en séquençant le transcriptome au niveau de la cellule unique.[16]Il est largement utilisé dans des domaines de recherche en plein essor tels que les cellules germinales, les cellules souches embryonnaires, les cellules nerveuses, les cellules tumorales et les cellules immunitaires. La plateforme de séquençage du transcriptome unicellulaire 10x Genomics peut capturer près de 100 000 cellules en utilisant des technologies telles que la microfluidique et le marquage par code-barres pour obtenir une grande quantité d'informations sur le transcriptome.[17]Le cœur de l'analyse du transcriptome unicellulaire est la classification des cellules et l'identification des gènes différentiels dans les sous-populations. Le regroupement et l'analyse différentielle des cellules sont effectués, et l'enrichissement fonctionnel des gènes différentiels est réalisé pour identifier les caractéristiques fonctionnelles des sous-populations (Fig.5).[18]Il présente des avantages uniques dans le typage cellulaire et l'identification des facteurs marqueurs, apportant de nouvelles méthodes et des moyens pratiques pour l'identification des types cellulaires, la réponse différentielle des voies de signalisation, les réseaux de régulation moléculaire et la recherche sur l'hétérogénéité cellulaire.[19,20].
Fig.5 L'analyse du paysage de 22 types de cellules immunitaires chez des patients normaux et atteints de la maladie de Kawasaki.
Le séquençage du transcriptome spatial peut fournir des informations telles que le transcriptome de l'objet de recherche et peut également localiser sa position spatiale dans le tissu. La combinaison des informations transcriptomiques avec les informations de position spatiale fournit une base pour détecter la composition spatiale et l'expression génique des cellules dans le tissu.[21,22]La transcriptomique spatiale Visium est une technologie qui détecte l'expression génique de l'ensemble du transcriptome in situ dans les tissus, ce qui nous permet de détecter les niveaux d'expression génique tout en obtenant en même temps des informations de localisation sur l'expression spatiale des gènes au sein du tissu. Comparée à la transcriptomique spatiale, la transcriptomique traditionnelle à gènes entiers ou le séquençage de transcriptomes unicellulaires perdent les informations de distribution spatiale des gènes ou des cellules au sein des tissus, tandis que l'hybridation par sonde d'ARN largement utilisée ne peut détecter qu'un nombre limité d'échantillons à la fois. La transcriptomique spatiale peut superposer l'expression génique et les résultats de coloration HE sans digérer le tissu (Fig. 6), permettant ainsi de conserver la structure spatiale au sein du tissu, ce qui nous permet d'étudier l'hétérogénéité cellulaire dans différentes régions au sein du tissu.[23-25].
Fig.6 Visualisation et analyses bioinformatiques des domaines tissulaires définis par la morphologie ou le profil d'expression génique.
Dans cet article, nous avons discuté de plusieurs stratégies courantes et technologies de séquençage pour l'analyse du transcriptome. Le séquençage du transcriptome en vrac ne peut détecter que le niveau d'expression moyen des gènes dans des cellules mélangées et n'inclut pas d'informations spécifiques sur les cellules et les emplacements spatiaux.[26]La séquençage du transcriptome à cellule unique peut obtenir des profils d'expression génique individuels des cellules et explorer l'hétérogénéité cellulaire, mais la source des informations de localisation spatiale ne peut pas être obtenue.[16]; le transcriptome spatial fournit des informations sur la distribution spatiale des profils d'expression génique, permettant ainsi d'obtenir simultanément des données d'expression génique cellulaire et des informations sur la localisation spatiale, et d'explorer l'hétérogénéité spatiale. Cela favorise en outre l'étude de l'expression génique réelle des cellules in situ des tissus et l'affichage morphologique des réseaux de communication intercellulaire.[22].
Dans le processus d'analyse des biomolécules, il est inévitable de passer du tout aux détails, puis des détails au tout. Lorsque les gens comprennent la structure biologique au niveau moléculaire et cellulaire, ils souhaitent naturellement étudier les groupes de cellules et les tissus à une échelle plus macro, et même les processus physiologiques et les connexions pathologiques des organes. Les méthodes de recherche multi-omiques ne sont pas seulement largement utilisées dans le domaine des maladies, mais peuvent également fournir une compréhension complète et systématique des interrelations et des réseaux régulateurs de diverses biomolécules dans les domaines de la recherche fondamentale, de la sélection moléculaire, du diagnostic clinique et du développement de médicaments, fournissant une base pour la biologie des réseaux et les systèmes.[27-29]Par conséquent, la stratégie de combiner le transcriptome avec le génome, le protéome, le métabolome et d'autres analyses multi-omiques conjointes est adoptée par de plus en plus de scientifiques. On pense que les stratégies de recherche multi-omiques peuvent ouvrir davantage de domaines de recherche à l'avenir.
Références :