Le profilage de l'ARN en utilisant des technologies de séquençage à haut débit est connu sous le nom de RNA-seq.
Services qui pourraient vous intéresser
Puisque RNA-seq est quantitatif, il est utile pour déterminer les niveaux d'expression de l'ARN. En plus de cette fonction de base, le séquençage de l'ARN peut être utilisé pour l'expression génique différentielle, la détection de variants et l'expression spécifique des allèles, profilage des petits ARNcaractérisation des motifs d'épissage alternatif, biologie des systèmes, RNA-seq unicellulaire et développement de SNPs et SSRs, etc.
RNA-SeqL'utilisation de la technologie de séquençage à haut débit permet le séquençage complet de bibliothèques d'ADNc de tous les ARN transcrits au sein d'un échantillon cellulaire ou tissulaire. Cette approche permet une évaluation quantitative de l'expression des ARN spécifiques en comptant les nombres de lectures correspondants, facilitant ainsi la découverte de nouveaux transcrits. Lorsqu'un génome de référence est disponible, ces transcrits peuvent être cartographiés de nouveau sur le génome, améliorant la compréhension des informations génétiques complètes, telles que la localisation des transcrits et les schémas d'épissage. Cette technique largement appliquée est essentielle dans divers domaines, y compris la recherche biologique, les études médicales, la recherche clinique et le développement pharmaceutique, enrichissant considérablement notre compréhension et notre application des sciences génomiques.
Figure 1. Vue d'ensemble du pipeline d'analyse typique de l'ARN-seq (Han et al. 2015).
Expression génique différentielle
Une application importante de RNA-seq Il s'agit de la comparaison des transcriptomes à travers différentes étapes de développement, traitements ou conditions pathologiques. Cette analyse, également connue sous le nom d'analyse de l'expression génique différentielle, nécessite l'identification des gènes ainsi que de leurs isoformes et une évaluation précise de leurs niveaux d'expression. Il est important d'illustrer les éléments fonctionnels du génome et de découvrir les mécanismes biologiques du développement et de la maladie.
Les outils courants pour l'expression génique différentielle incluent Cuffdiff, DESeq, DESeq2, EdgeR, PoissonSeq, Limma voom et MISO.
Détection des variantes et expression spécifique des allèles
RNA-seq permet l'identification des variants et de l'expression spécifique des allèles. Les polymorphismes nucléotidiques simples (SNP) font référence à la variation d'un seul nucléotide qui se produit à une position spécifique dans le génome, ce qui peut conduire à une expression spécifique des allèles (ASE). L'ASE signifie que l'un des deux allèles est fortement transcrit en ARNm et que l'autre est faiblement transcrit ou même pas du tout transcrit. Des études récentes ont également associé l'ASE à la susceptibilité à un certain nombre de maladies humaines. RNA-seq et séquençage de l'ADN à l'échelle du génome entier (WGS) permettre l'identification de variantes de maladies courantes, y compris les SNP et l'ASE.
Les outils courants utilisés pour la détection des variants sont GATK, ANNOVAR, SNPiR, SNiPlay3.
Profilage des petits ARN
Petits ARN Les espèces impliquent généralement des microARN (miARN), des ARN interférents petits (siARN) et des ARN interagissant avec piwi (piARN), ainsi que d'autres types de petits ARN, tels que les ARN nucléolaires petits (snoARN) et les ARN nucléaires petits (snARN). Les petits ARN jouent un rôle dans le silençage des gènes et la régulation post-transcriptionnelle de l'expression génique. Il a été démontré que les petits ARN sont impliqués dans des processus biologiques, y compris le développement, la prolifération et la différenciation cellulaire, ainsi que l'apoptose. La plupart des premières petit ARN les études de découverte ont utilisé la pyroséquençage, puis d'autres plateformes NGS avec un débit plus élevé, ce qui a entraîné des enquêtes à l'échelle du génome et la découverte d'un nombre croissant de petites espèces d'ARN. Les outils bioinformatiques courants pour séquençage de petits ARN les données sont présentées dans le Tableau 1.
Tableau 1. Comparaison des applications web sRNA-seq (Rahman et al. 2018).
| Caractéristiques | Oasis 2 | omiRas | mirTools 2.0 | MAGI | Chimira | sRNAtoolbox |
| Compression FASTQ | √ | √ | √ | |||
| modifications et éditions de miARN | √ | √ | √ | √ | √ | |
| Base de données de nouveaux miARN | √ | √ | ||||
| Infection et analyse inter-espèces | √ | |||||
| Organisme non modèle | √ | √ | ||||
| Expression différentielle | √ | √ | √ | √ | √ | √ |
| Expression différentielle multivariée | √ | √ | ||||
| Classification | √ | |||||
| Prédiction de cibles de miARN novatrices | √ | √ | √ | |||
| Analyse des voies/GO | √ | √ | √ | √ | √ | |
| Soumission de travaux par lots (API) | √ | |||||
| Navigateur de génome | √ |
Caractérisation des motifs d'épissage alternatif
Les motifs d'épissage alternatif sont importants pour comprendre le développement et les maladies humaines, car des motifs d'épissage altérés contribuent au développement, à la différenciation cellulaire et aux maladies humaines. RNA-seq est un outil puissant pour la caractérisation des motifs d'épissage alternatif. Le séquençage à paires permet d'obtenir des informations de séquence des deux extrémités, détectant ainsi les motifs d'épissage sans nécessiter de connaissances préalables sur les annotations des transcrits. Séquençage SMRT de PacBio permet d'examiner les schémas d'épissage et la connectivité des transcrits de manière impartiale et à l'échelle du génome en générant séquences de transcriptions complètes.
Les outils courants pour la caractérisation des motifs d'épissage alternatif incluent TopHat, MapSplice, SpliceMap, SplitSeek, GEM mapper, SpliceR, SplicingCompass, GIMMPS, MATS et rMATS.
Figure 2. RNA-seq pour la détection des événements d'épissage alternatif (Ozsolak et Milos 2011).
Biologie des systèmes
La création de listes de gènes d'expression différentielle (DE) n'est pas la dernière étape de RNA-seq L'analyse. Une compréhension biologique plus approfondie d'un système expérimental peut être acquise en examinant les changements d'expression de groupes de gènes. Ce processus, connu sous le nom de biologie des systèmes, repose sur la compréhension que le tout est plus grand que la somme des parties. L'analyse des voies et l'analyse des réseaux de co-expression sont deux parties importantes incluses.
Tableau 2. Les outils pour l'analyse des voies et l'analyse des réseaux de co-expression utilisant des données RNA-seq.
| Analyse des voies | GSEA | Une approche basée sur les connaissances pour le profilage d'expression à l'échelle du génome. |
| GSVA | Une méthode non paramétrique et non supervisée pour estimer la variation de l'enrichissement des ensembles de gènes à travers les échantillons d'un ensemble de données d'expression. | |
| SeqGSEA | Fournit des méthodes pour l'analyse d'enrichissement de jeux de gènes en intégrant l'expression différentielle et l'épissage. | |
| GAGE | Une évaluation des tout derniers algorithmes d'assemblage de génomes à grande échelle. | |
| SPIA | Identifie les voies les plus pertinentes pour la condition. | |
| TAPPA | Un outil basé sur Java pour l'identification des voies génétiques associées aux phénotypes. | |
| DEAP | Identifie des motifs réglementaires importants à partir de données d'expression différentielle. | |
| GSAASeqSP | Peut identifier des voies ou des ensembles de gènes significativement associés. | |
| Réseau de co-expression | GSCA | aider les chercheurs à faire des découvertes en utilisant d'énormes quantités de données d'expression génique disponibles publiquement. |
| DICER | Détecte des ensembles de gènes co-exprimés de manière différentielle en utilisant un nouveau score probabiliste pour la corrélation différentielle. | |
| WGCNA | Une méthode puissante pour isoler des groupes de gènes co-exprimés à partir de données de microarray ou de RNA-seq. |
Séquençage d'ARN à cellule unique
Le séquençage d'ARN à cellule unique offre des opportunités pour disséquer l'interaction entre les processus cellulaires intrinsèques et les stimuli extrinsèques dans la détermination du destin cellulaire. Il contribue également à une meilleure compréhension de la manière dont une « cellule aberrante » peut déterminer l'issue d'une infection. De plus, une majorité des cellules vivantes ne peuvent pas être cultivées in vitro, le séquençage d'ARN à cellule unique peut découvrir de nouvelles espèces ou des processus régulateurs d'importance biotechnologique ou médicale. Le flux de travail du séquençage d'ARN à cellule unique implique généralement les étapes suivantes : isolation de cellules uniques, construction de bibliothèques d'ADNc, RNA-seqet la bioinformatique (Figure 2).
Figure 3. Le flux de travail général du séquençage d'ARN à cellule unique.
Applications du RNA-seq à cellule unique :
Développement de SNPs et SSRs
RNA-seq est un outil puissant qui peut être utilisé pour détecter et identifier des polymorphismes à un seul nucléotide (SNP) au sein des génomes. En comparant et en analysant les données transcriptomiques de différents individus ou populations, nous pouvons localiser les SNP dans divers génomes et les dépister et valider par la suite. Ce processus aide à notre compréhension de la divergence génétique entre les organismes individuels, fournissant une base solide pour une exploration plus approfondie des relations entre génotypes et phénotypes. De plus, l'ARN-seq peut également être utilisé pour découvrir et examiner des répétitions de séquences simples (SSR) au sein de la structure génomique. Les SSR, qui consistent en des séquences d'ADN répétées trouvées dans le génome, sont primordiaux pour le marquage génétique et la recherche en génétique des populations. En analysant les données de séquences d'ARN, nous pouvons identifier des gènes et des transcrits contenant des SSR, posant ainsi des bases importantes pour des études sur la diversité génétique et l'évolution.
Utilisation RNA-seq données, nous sommes capables de construire un carte génétique du génome-- révélant ainsi la distribution des loci génétiques et l'étendue de la diversité génétique. Grâce à l'analyse des séquences d'ARN provenant d'individus ou de populations distincts, nous sommes non seulement capables d'établir un lien entre génotype et phénotype, mais aussi d'inférer la fonction des SNP et des SSR au sein du génome, ainsi que leur signification évolutive. L'ARN-seq nous permet également d'identifier et d'authentifier les différences génétiques entre diverses ressources de germoplasme et variétés. En analysant comparativement les données du transcriptome provenant de différents germoplasmes ou variétés, nous pouvons découvrir des SNP et des SSR qui portent des traits génotypiques ou phénotypiques spécifiques. Ainsi, cela jette les bases pour la collecte, la préservation et l'utilisation des ressources de germoplasme.
RNA-seq a été employé dans divers aspects de la recherche et de la thérapie du cancer, englobant la découverte et la caractérisation de biomarqueurs détaillant l'hétérogénéité et l'évolution du cancer, la résistance aux médicaments, les microenvironnements immunitaires dans le cancer et l'immunothérapie, ainsi que les néoantigènes. Notamment, les fusions géniques ont été inextricablement liées à la tumorigenèse et servent de biométriques cancéreuses idéales et de cibles thérapeutiques, principalement détectées par RNA-CaptureSeq dans des échantillons cliniques. En plus des biomarqueurs d'acides nucléiques, l'intégration de l'ARN-seq avec l'immunohistochimie et les blots protéiques a confirmé l'identification de certaines protéines comme biomarqueurs du cancer. Par exemple, la combinaison de COX nucléaire2 La cyclooxygénase-2 (COX-2) et le HER2 (récepteur 2 du facteur de croissance épidermique humain) ont émergé comme des biomarqueurs potentiels pour le cancer, en particulier dans le diagnostic du cancer colorectal et la prédiction de son pronostic. RNA-seq peut détecter des mutations à un stade précoce et des polymorphismes à haut risque, conduisant à la découverte de nouveaux biomarqueurs du cancer et de cibles thérapeutiques potentielles, permettant ainsi de surveiller les maladies et de guider la thérapie ciblée dans les décisions de traitement précoce. Par exemple, dans le cancer du sein, le séquençage de l'ARN à cellule unique a révélé que les cellules myéloïdes immatures immunosuppressives infiltrant la tumeur contribuent à la résistance aux médicaments.
Figure 4. Applications de l'ARN-seq dans l'analyse de l'expression différentielle et les biomarqueurs du cancer, l'hétérogénéité du cancer et la résistance aux médicaments, le microenvironnement immunitaire du cancer, l'immunothérapie et les néoantigènes. (Hong et al., 2020)
Grâce à l'application de Séquençage de l'ARN (RNA-seq)Nous pouvons contribuer à la révélation des mécanismes sous-jacents à l'apparition des maladies, améliorer la précision des diagnostics, évaluer l'efficacité des traitements et identifier de nouvelles cibles thérapeutiques. Grâce à une analyse comparative des données transcriptomiques provenant d'échantillons de patients et de groupes de contrôle standard utilisant le RNA-seq, il est possible de discerner les différences d'expression génique associées à l'apparition et à la progression des maladies, révélant ainsi de potentiels mécanismes pathologiques. Dans l'identification de biomarqueurs liés à diverses maladies, le rôle du RNA-seq est essentiel. En examinant les données transcriptionnelles des échantillons de patients, des motifs spécifiques d'expression génique corrélés aux états pathologiques peuvent être mis en évidence. Cette révélation de nouveaux biomarqueurs a des implications considérables pour les diagnostics précoces et l'évaluation pronostique des maladies. De plus, le RNA-seq peut être utilisé pour identifier de nouvelles cibles thérapeutiques, orienter des plans de traitement personnalisés et informer des stratégies immunothérapeutiques. En dehors de son utilisation dans la recherche sur le cancer, le RNA-seq a trouvé de nombreuses applications dans l'étude de nombreuses autres maladies, y compris les affections cardiovasculaires, les troubles neurologiques et les maladies auto-immunes. L'examen et l'analyse des données transcriptomiques dérivées de patients ouvrent la voie à une compréhension plus approfondie des mécanismes des maladies, ce qui, à son tour, fournit de nouvelles perspectives et stratégies pour le diagnostic et le traitement des maladies.
Employant RNA-Seqla technologie de séquençage à haut débit, a des implications considérables dans divers domaines biologiques. Les applications de l'ARN-seq en biologie englobent principalement l'analyse de l'expression génique, la recherche sur les ARN non codants, les études épigénétiques, la recherche en évolution moléculaire et la recherche en génomique fonctionnelle. En mesurant les niveaux d'expression de l'ARNm au niveau du transcriptome, il est possible d'identifier les gènes différemment exprimés dans des conditions variées, révélant ainsi des réseaux de régulation génique et des voies de signalisation. L'ARN-seq peut faciliter la découverte et l'analyse des ARN non codants, tels que miARNs et lncARNs, qui jouent des rôles essentiels dans la régulation des gènes, l'épigénétique et l'apparition des maladies. En ce qui concerne la recherche sur l'évolution moléculaire, les données RNA-Seq peuvent être utilisées pour comparer les spectres d'expression des gènes entre différentes espèces ou populations, permettant ainsi d'étudier l'évolution et la différenciation des fonctions génétiques. De plus, le RNA-seq sert à identifier et à interpréter fonctionnellement les gènes fonctionnels et les éléments régulateurs au sein du génome.
En utilisant des données de RNA-seq, des recherches approfondies sur les mécanismes pathogènes microbiaux peuvent être entreprises. Le RNA-seq nous permet de construire des réseaux de régulation transcriptionnelle chez les microbes et de découvrir les relations entre les facteurs régulateurs et les gènes associés à la pathogénicité. L'identification des gènes codant pour des facteurs de virulence et des mécanismes d'évasion immunitaire chez les microbes aide considérablement notre compréhension de la pathogénèse, car ces gènes jouent souvent des rôles cruciaux dans les invasions microbiennes et le contournement du système immunitaire. Il est important de noter que le RNA-seq peut également faciliter la recherche sur la résistance microbienne aux antibiotiques. Une analyse des changements transcriptomiques microbiens après un traitement antibiotique peut éclairer les gènes et les voies impliqués dans le développement de la résistance. De plus, cette technologie peut examiner les altérations de l'expression génique dans les cellules hôtes pendant un processus d'infection microbienne, ce qui peut révéler des informations sur les mécanismes d'invasion microbienne, les réponses immunitaires de l'hôte et les interactions moléculaires impliquées dans le processus pathogène.
RNA-Seq a trouvé des applications profondes dans l'agriculture, en particulier dans l'étude des maladies animales et végétales, l'investigation de la résistance et de l'adaptabilité des cultures, ainsi que l'avancement du breeding moléculaire. Grâce à l'ARN-Seq, nous pouvons évaluer les changements d'expression génique dans les tissus animaux et végétaux infectés pour identifier les gènes liés à la résistance aux maladies. De plus, l'ARN-Seq permet d'explorer les changements physiologiques et métaboliques lors de l'apparition de la maladie, éclaircissant ainsi sa pathophysiologie. L'ARN-Seq peut être instrumental pour déchiffrer les mécanismes moléculaires par lesquels les cultures contrent les stress environnementaux. En étudiant les changements d'expression génique dans les cultures sous des conditions adverses, nous pouvons identifier des gènes associés à la résistance au stress. Cela ajoute un soutien théorique au breeding sélectif de nouvelles variations de cultures adaptées à diverses conditions environnementales. En outre, l'ARN-Seq permet l'analyse de la corrélation entre des données d'expression génique étendues et des données de traits phénotypiques, facilitant ainsi les études d'association génotype-phénotype. Cela est essentiel pour identifier des gènes fonctionnels associés à des traits cibles, fournissant des marqueurs moléculaires potentiels et des informations sur le fond génétique pour le breeding moléculaire.
Les résultats de RNA-Seq L'analyse peut être exploitée pour développer des marqueurs moléculaires à utiliser dans la sélection assistée par marqueurs (SAM) en amélioration des cultures. Cette approche aide à améliorer l'efficacité de la sélection et à accélérer la sélection et la diffusion de gènes favorables. De plus, le séquençage d'ARN (RNA-seq) peut élucider les changements dans l'expression des gènes lors de l'interaction entre les plantes et les microorganismes pathogènes ou les ravageurs, contribuant ainsi à la compréhension des mécanismes moléculaires sous-jacents à la résistance des plantes aux maladies et aux ravageurs. Cela fournit de nouvelles cibles et stratégies pour la gestion des maladies et des ravageurs. Le RNA-seq est également utilisé pour étudier les réseaux de régulation transcriptionnelle impliqués dans l'interaction entre les plantes et les microorganismes bénéfiques. Il aide à identifier les effets promoteurs des biofertilisants sur la croissance des plantes et l'absorption des nutriments, améliorant ainsi le rendement et la qualité des cultures.
Si vous souhaitez plus d'informations sur le RNA-seq, veuillez consulter les articles suivants :
Flux de travail en bioinformatique pour l'ARN-seq
Les technologies et le flux de travail de l'ARN-seq
Références :