L'introduction aux ARN non codants
Les ARN non codants (ARNnc) étaient autrefois considérés comme des bruits de transcription ou des sous-produits du traitement de l'ARN, mais des preuves croissantes suggèrent qu'une majorité d'entre eux sont biologiquement fonctionnels et régulent diverses activités dans les cellules. Les ARNnc sont grossièrement classés en deux catégories selon leur longueur de séquence : les petits ARNnc (<200 pb) et les longs ARNnc (200 pb ou plus). Les catégories d'ARNnc sont listées dans le Tableau 1.
Tableau 1. Aperçu des ncRNA (Fu 2014).
| ncARNs | Nom complet | Fonction |
| ncARN de ménage | ||
| ARNr | ARN ribosomal | Machinerie de traduction |
| ARNt | ARN de transfert | Transporteurs d'acides aminés |
| snARN | Petite ARN nucléaire | Traitement de l'ARN |
| snoARN | Petite ARN nucléolaire | Modifications de l'ARN |
| TR | ARN des télomères | Synthèse des extrémités des chromosomes |
| ncARN régulateurs | ||
| miARN | MicroARNs | Stabilité de l'ARN et contrôle de la traduction |
| endo-siARN | siRNA endogène | Dégradation de l'ARN |
| rasiARN | ARN dérivé de répétition | Contrôle transcriptionnel |
| piARN | ARN interagissant avec Piwi | Silenciement des transposons et dégradation de l'ARNm |
| eARN | ARN dérivé d'un amplificateur | Régulation de l'expression génique |
| PATs | ARN associé au promoteur | Initiation de la transcription et libération de la pause |
| lncARN non codant | ARN long non-codant | Impression, épigénétique, structure nucléaire |
Comme le montre le Tableau 1, les ncARN peuvent être grossièrement divisés en deux classes : les ncARN de maintien et les ncARN régulateurs. Les ncARN de maintien, comprenant l'ARNr, l'ARNt, l'ARNsn, l'ARNsno et l'ARNt, sont considérés comme « constitutifs » car ils sont exprimés de manière ubiquitaire dans tous les types cellulaires et offrent des fonctions essentielles aux organismes. Les ncARN régulateurs, comprenant les miARN, les endo-siARN, les rasiARN, les piARN, les eARN, les PAT et les lncARN, ont suscité un intérêt croissant de la part de la communauté de recherche en raison de leur fonction régulatrice dans l'expression génique, l'imprégnation et l'épigénétique. RNA-seq est une technique avancée pour illustrer les espèces de ncRNA. Ici, nous avons fait un résumé des outils bioinformatiques pour l'analyse des ncRNA avec des données provenant du NGS.

Figure 1. Les ncARN comme parties intégrées du réseau génique (Fu 2014).
Analyse des petits ncRNALes petits ARN jouent un rôle crucial dans la régulation transcriptionnelle et sont essentiels pour comprendre pleinement l'ensemble du scénario de la régulation transcriptionnelle. Leurs profils d'expression aberrants sont considérés comme associés à des dysfonctionnements cellulaires et à des maladies. Par conséquent, de nombreuses recherches se concentrent sur la détection, la prédiction ou la quantification de l'expression des petits ARN, en particulier des miARN, afin de mieux comprendre la santé humaine et les maladies. Les outils informatiques disponibles pour séquençage de petits ARN les données sont résumées dans le Tableau 2.
Tableau 2. Outils informatiques pour l'analyse des petits ncRNA
| Outils | Descriptions |
| DARIO | Quantifiez et annotez les ncARN avec accès à plusieurs bases de données publiques de ncARN. |
| CPSS | Quantifier et annoter les ncARN, en mettant particulièrement l'accent sur les miARN. |
| ncPRO-seq | Détecter des petits ncARN connus de manière impartiale et découvrir de nouvelles espèces de ncARN. |
| CoRAL | Diviser les petits ncRNA en catégories fonctionnelles basées sur des caractéristiques biologiquement interprétables autres que la séquence ; Annoter les ncRNA dans des organismes moins bien caractérisés. |
| CODE-ARN | Combiner la structure secondaire avec de novo assemblage. Applicable à l'annotation des ncRNA manquant de génomes de référence. |
| miRDeep | Utilisé pour détecter à la fois des miARN connus et nouveaux dans les données de séquençage d'ARNs courts. |
Détection de l'ARN circulaire
les outils informatiques disponibles pour la détection des circARN comprennent CIRI, CIRCexplorer et KNIFE, qui montrent une performance équilibrée entre précision et sensibilité. Les circARN sont un nouveau type d'ARN qui forme une boucle continue fermée de manière covalente. La plupart d'entre eux sont générés à partir de séquences exoniques ou introniques, et des protéines liant l'ARN (RBP) ou des séquences complémentaires inverses sont nécessaires à leur biogenèse. Les circARN sont principalement conservés et fonctionnent comme des éponges à miARN, des régulateurs de l'épissage et de la transcription, ou des modificateurs de l'expression des gènes parentaux. De plus en plus de preuves suggèrent l'importance potentielle des circARN dans les maladies humaines, telles que les maladies vasculaires athéroscléreuses, les troubles neurologiques et le cancer. séquençage de circRNA Les données sont résumées dans le tableau 2.
Tableau 3. Outils informatiques pour la détection des ARN circulaires.
| Méthode | Approche | dépendances |
| CIRI | Lecture segmentée basée sur les données | Bwa, péri |
| CIRCexplorer | Lecture segmentée basée sur les données | STAR, bedtools, python (pysam, docopt, Interval) |
| COUTEAU | Basé sur le candidat | Bowtie, Bowtie2, tophat2, samtools, perl |
Investigation des LncRNA
L'lncRNA est un type d'ARN non codant de plus de 200 nucléotides, tel que les lincRNAs et les macroARNs. Les lncRNAs fonctionnent comme une plateforme pour l'interaction avec l'ARNm, les miARN ou les protéines. Ils ont émergé en tant que régulateurs vitaux dans divers aspects de la biologie, y compris la régulation transcriptionnelle, la régulation post-transcriptionnelle et le remodelage de la chromatine. Des recherches croissantes suggèrent que la mauvaise expression des lncRNAs contribue à l'initiation, à la croissance et à la métastase des tumeurs. Les lncRNAs deviennent donc une cible prometteuse pour le diagnostic et la thérapie du cancer. La combinaison de séquençage de l'lncARN et des outils informatiques adaptés est une approche puissante à cet égard.
Tableau 4. Outils informatiques pour l'investigation des lncRNA.
| Outils | Applications | Référence |
| lncRScan | Détecter les lncRNA à partir des assemblages complexes ; Distinguer les lncRNA des ARNm. | (Soleil et al.., 2012) |
| iSeeRNA | Détecter avec précision et rapidité les lincRNA à partir de grands ensembles de données. | (Soleil et al.., 2013) |
| Annocript | Détecter les lncRNA en s'appuyant sur des bases de données publiques et des logiciels d'analyse de séquences pour vérifier un fort potentiel non codant. | (Musacchia et al.. 2015) |
| LncRNA2Fonction | Annoter les lncRNA en se basant sur la théorie selon laquelle des motifs d'expression similaires dans des conditions diverses peuvent partager des fonctions et des voies biologiques similaires. | (Jiang et al.. 2015) |
Références: