Outils de bioinformatique pour l'analyse des ARN non codants

L'introduction aux ARN non codants

Les ARN non codants (ARNnc) étaient autrefois considérés comme des bruits de transcription ou des sous-produits du traitement de l'ARN, mais des preuves croissantes suggèrent qu'une majorité d'entre eux sont biologiquement fonctionnels et régulent diverses activités dans les cellules. Les ARNnc sont grossièrement classés en deux catégories selon leur longueur de séquence : les petits ARNnc (<200 pb) et les longs ARNnc (200 pb ou plus). Les catégories d'ARNnc sont listées dans le Tableau 1.

Tableau 1. Aperçu des ncRNA (Fu 2014).

ncARNs Nom complet Fonction
ncARN de ménage
ARNr ARN ribosomal Machinerie de traduction
ARNt ARN de transfert Transporteurs d'acides aminés
snARN Petite ARN nucléaire Traitement de l'ARN
snoARN Petite ARN nucléolaire Modifications de l'ARN
TR ARN des télomères Synthèse des extrémités des chromosomes
ncARN régulateurs
miARN MicroARNs Stabilité de l'ARN et contrôle de la traduction
endo-siARN siRNA endogène Dégradation de l'ARN
rasiARN ARN dérivé de répétition Contrôle transcriptionnel
piARN ARN interagissant avec Piwi Silenciement des transposons et dégradation de l'ARNm
eARN ARN dérivé d'un amplificateur Régulation de l'expression génique
PATs ARN associé au promoteur Initiation de la transcription et libération de la pause
lncARN non codant ARN long non-codant Impression, épigénétique, structure nucléaire

Comme le montre le Tableau 1, les ncARN peuvent être grossièrement divisés en deux classes : les ncARN de maintien et les ncARN régulateurs. Les ncARN de maintien, comprenant l'ARNr, l'ARNt, l'ARNsn, l'ARNsno et l'ARNt, sont considérés comme « constitutifs » car ils sont exprimés de manière ubiquitaire dans tous les types cellulaires et offrent des fonctions essentielles aux organismes. Les ncARN régulateurs, comprenant les miARN, les endo-siARN, les rasiARN, les piARN, les eARN, les PAT et les lncARN, ont suscité un intérêt croissant de la part de la communauté de recherche en raison de leur fonction régulatrice dans l'expression génique, l'imprégnation et l'épigénétique. RNA-seq est une technique avancée pour illustrer les espèces de ncRNA. Ici, nous avons fait un résumé des outils bioinformatiques pour l'analyse des ncRNA avec des données provenant du NGS.

Bioinformatics Tools for Non-Coding RNA Analysis

Figure 1. Les ncARN comme parties intégrées du réseau génique (Fu 2014).

Analyse des petits ncRNA

Les petits ARN jouent un rôle crucial dans la régulation transcriptionnelle et sont essentiels pour comprendre pleinement l'ensemble du scénario de la régulation transcriptionnelle. Leurs profils d'expression aberrants sont considérés comme associés à des dysfonctionnements cellulaires et à des maladies. Par conséquent, de nombreuses recherches se concentrent sur la détection, la prédiction ou la quantification de l'expression des petits ARN, en particulier des miARN, afin de mieux comprendre la santé humaine et les maladies. Les outils informatiques disponibles pour séquençage de petits ARN les données sont résumées dans le Tableau 2.

Tableau 2. Outils informatiques pour l'analyse des petits ncRNA

Outils Descriptions
DARIO Quantifiez et annotez les ncARN avec accès à plusieurs bases de données publiques de ncARN.
CPSS Quantifier et annoter les ncARN, en mettant particulièrement l'accent sur les miARN.
ncPRO-seq Détecter des petits ncARN connus de manière impartiale et découvrir de nouvelles espèces de ncARN.
CoRAL Diviser les petits ncRNA en catégories fonctionnelles basées sur des caractéristiques biologiquement interprétables autres que la séquence ; Annoter les ncRNA dans des organismes moins bien caractérisés.
CODE-ARN Combiner la structure secondaire avec de novo assemblage. Applicable à l'annotation des ncRNA manquant de génomes de référence.
miRDeep Utilisé pour détecter à la fois des miARN connus et nouveaux dans les données de séquençage d'ARNs courts.

Détection de l'ARN circulaire

les outils informatiques disponibles pour la détection des circARN comprennent CIRI, CIRCexplorer et KNIFE, qui montrent une performance équilibrée entre précision et sensibilité. Les circARN sont un nouveau type d'ARN qui forme une boucle continue fermée de manière covalente. La plupart d'entre eux sont générés à partir de séquences exoniques ou introniques, et des protéines liant l'ARN (RBP) ou des séquences complémentaires inverses sont nécessaires à leur biogenèse. Les circARN sont principalement conservés et fonctionnent comme des éponges à miARN, des régulateurs de l'épissage et de la transcription, ou des modificateurs de l'expression des gènes parentaux. De plus en plus de preuves suggèrent l'importance potentielle des circARN dans les maladies humaines, telles que les maladies vasculaires athéroscléreuses, les troubles neurologiques et le cancer. séquençage de circRNA Les données sont résumées dans le tableau 2.

Tableau 3. Outils informatiques pour la détection des ARN circulaires.

Méthode Approche dépendances
CIRI Lecture segmentée basée sur les données Bwa, péri
CIRCexplorer Lecture segmentée basée sur les données STAR, bedtools, python (pysam, docopt, Interval)
COUTEAU Basé sur le candidat Bowtie, Bowtie2, tophat2, samtools, perl

Investigation des LncRNA

L'lncRNA est un type d'ARN non codant de plus de 200 nucléotides, tel que les lincRNAs et les macroARNs. Les lncRNAs fonctionnent comme une plateforme pour l'interaction avec l'ARNm, les miARN ou les protéines. Ils ont émergé en tant que régulateurs vitaux dans divers aspects de la biologie, y compris la régulation transcriptionnelle, la régulation post-transcriptionnelle et le remodelage de la chromatine. Des recherches croissantes suggèrent que la mauvaise expression des lncRNAs contribue à l'initiation, à la croissance et à la métastase des tumeurs. Les lncRNAs deviennent donc une cible prometteuse pour le diagnostic et la thérapie du cancer. La combinaison de séquençage de l'lncARN et des outils informatiques adaptés est une approche puissante à cet égard.

Tableau 4. Outils informatiques pour l'investigation des lncRNA.

Outils Applications Référence
lncRScan Détecter les lncRNA à partir des assemblages complexes ; Distinguer les lncRNA des ARNm. (Soleil et al.., 2012)
iSeeRNA Détecter avec précision et rapidité les lincRNA à partir de grands ensembles de données. (Soleil et al.., 2013)
Annocript Détecter les lncRNA en s'appuyant sur des bases de données publiques et des logiciels d'analyse de séquences pour vérifier un fort potentiel non codant. (Musacchia et al.. 2015)
LncRNA2Fonction Annoter les lncRNA en se basant sur la théorie selon laquelle des motifs d'expression similaires dans des conditions diverses peuvent partager des fonctions et des voies biologiques similaires. (Jiang et al.. 2015)

Références:

  1. Choudhuri S. Petits ARN non codants : biogenèse, fonction et importance émergente en toxicologie. Journal de toxicologie biochimique et moléculaire, 2010, 24(3) : 195-216.
  2. Fu X D. ARN non codants : une nouvelle frontière en biologie régulatrice. Revue nationale des sciences, 2014, 1(2) : 190-204.
  3. Gao Y, Wang J, Zhao F. CIRI : un algorithme efficace et sans biais pour l'identification de nouveaux ARN circulaires. Biologie du génome, 2015, 16(1) : 4.
  4. Jiang Q, Ma R, Wang J, et al.LncRNA2Function : une ressource complète pour l'investigation fonctionnelle des lncARN humains basée sur des données de séquençage d'ARN.BMC Genomics. BioMed Centrall, 2015, 16(3) : S2.
  5. Musacchia F, Basu S, Petrosino G, et al.Annocript : un pipeline flexible pour l'annotation des transcriptomes capable d'identifier des ARN non codants longs putatifs. Bioinformatique, 2015, 31(13) : 2199-2201.
  6. Qu S, Yang X, Li X, et al.ARN circulaire : une nouvelle étoile des ARN non codants. Lettres de cancer, 2015, 365(2) : 141-148.
  7. Su Y, Wu H, Pavlosky A, et al.. ARN non codants régulateurs : nouveaux instruments dans l'orchestration de la mort cellulaire[J]. Cell death & disease, 2016, 7(8) : e2333.
  8. Sun K, Chen X, Jiang P, et al.iSeeRNA : identification de longs transcrits d'ARN non codants intergéniques à partir de données de séquençage du transcriptome. BMC génomique, 2013, 14(2) : S7.
  9. Sun L, Zhang Z, Bailey T L, et al.Prédiction de nouveaux ARN non codants longs basée sur les données RNA-Seq de l'étude de knockout Klf1 chez la souris. BMC bioinformatique, 2012, 13(1) : 331.
  10. Veneziano D, Nigita G, Ferro A. Approches computationnelles pour l'analyse des ncRNA à travers des techniques de séquençage profond. Frontières en bioingénierie et biotechnologie, 2015, 3 : 77.
  11. Yang G, Lu X, Yuan L. LncRNA : un lien entre l'ARN et le cancer. Biochimica et Biophysica Acta (BBA) - Mécanismes de Régulation Génétique, 2014, 1839(11) : 1097-1109.
  12. Zeng X, Lin W, Guo M, et al. Un aperçu complet et une évaluation des outils de détection des ARN circulaires. PLoS biologie computationnelle, 2017, 13(6) : e1005420.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Parlez à nos scientifiques
De quoi aimeriez-vous discuter ?
Avec qui allons-nous parler ?

* est un élément requis.

Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut