Flux de travail en bioinformatique et outils pour le profilage des ribosomes

Aperçu du profilage des ribosomes

Profilage des ribosomes Le Ribo-seq est une technique établie pour détecter les régions de transcrits traduits via le séquençage de nouvelle génération (NGS). Le Ribo-seq a comblé le fossé entre le séquençage de l'ARN et la protéomique en cartographiant la position des ribosomes en traduction sur l'ensemble du transcriptome. Depuis son invention, les scientifiques ont utilisé le Ribo-seq pour répondre à des questions allant de la détection de petits cadres de lecture ouverts traduits (OFRs) à la quantification du contrôle translationnel.

Le protocole Ribo-seq se compose de (i) traitement par des médicaments et récolte des cellules, (ii) empreinte de nucléases et isolement des fragments protégés par les ribosomes (RPF), et (iii) préparation de la bibliothèque et séquençage profond. Bien que le protocole expérimental ait été examiné dans l'article "Aperçu du profilage des ribosomes : définition, applications, principes et flux de travail", ici nous nous concentrerons sur l'analyse des données du profilage des ribosomes.

The experimental workflow of ribosome profiling (Ribo-seq).
Figure 1. Le flux de travail expérimental du profilage des ribosomes (Ribo-seq).

Analyse des données dans le Ribo-Seq

Les empreintes ribosomiques sont très courtes (25-35 nt) et sont généralement séquencées par séquençage en simple sens. Le flux de travail de l'analyse Ribo-seq comprend le contrôle de qualité, le mapping des lectures, la normalisation et l'analyse des données en aval, comme l'analyse d'expression différentielle (Figure 2). Certains outils ont été développés pour le traitement des données Ribo-seq. Par exemple, RiboGalaxy peut être utilisé pour vérifier la qualité des données Ribo-seq, aligner les lectures et visualiser les résultats. RiboVIEW est un cadre computationnel pour la visualisation, le contrôle de qualité et l'analyse statistique de l'analyse Ribo-seq.

Flow-chart of data analysis in ribosome profiling
Figure 2. Diagramme de flux de l'analyse des données dans le profilage des ribosomes (Bartholomäus, et al.. 2016).

  • Contrôle de qualité

La première étape de l'analyse des données dans le profilage des ribosomes consiste en un contrôle de qualité et un rognage des adaptateurs. La plupart des données de Ribo-seq sont traitées avec un score Phred dans la plage de ~20-30 ou avec une précision de base de 99,0-99,9 %. Les séquences d'adaptateurs doivent être supprimées à l'aide d'outils tels que Cutadapt. Un pourcentage élevé de lectures composées de petits ARN structurés (ARNr, ARNt ou ARN sno) doit être éliminé en utilisant un alignement tenant compte des épissures tel que STAR. Sinon, leur surabondance peut interrompre la quantification ultérieure.

  • Lecture de la cartographie

La cartographie des lectures est une procédure cruciale pour trouver l'emplacement unique de chaque lecture dans le génome de référence. Les données prétraitées peuvent être cartographiées sur des génomes ou des transcriptomes. La cartographie sur le génome est préférée car elle n'est pas biaisée par les exons et introns connus et permet la découverte de nouveaux ORFs. De plus, les génomes sont mieux définis que les transcriptomes et la cartographie génomique est plus rapide et offre souvent une meilleure couverture. Les outils de cartographie incluent des algorithmes basés sur des tables de hachage ou la transformation de Burrows-Wheeler (BWT). Les outils basés sur BWT, tels que Bowtie, sont préférés car ils sont rapides et moins exigeants en calcul. Bien que Bowtie ne puisse pas cartographier les jonctions d'épissage, TopHat est couramment utilisé pour aligner de courtes lectures à travers les jonctions et découvrir les jonctions. de novo.

Les RPF sont très courts et peuvent correspondre à plusieurs emplacements. Cependant, il n'existe pas de stratégie uniforme pour traiter ce problème. Pour éviter une surinterprétation des données, le mappage conservateur avec des lectures mappées de manière unique pourrait être le meilleur choix dans certaines analyses, telles que l'analyse différentielle.

  • Normalisation

Après le mappage des lectures, des comptes de lectures sont attribués à chaque gène ou ARN non codant. Les gènes qui se chevauchent posent un problème ici. Le rpkM est une approche couramment utilisée pour la normalisation des comptes de lectures. Il prend en compte les différences de profondeur de séquençage entre les bibliothèques et la variation de longueur de chaque gène.

  • Analyse en aval

Analyse différentielleLes outils utilisés pour identifier les gènes exprimés différemment (DEGs) dans les ensembles de données RNA-seq sont également appliqués dans les études Ribo-seq, tels que DESeq, EdgeR et baySeq.

Recherche d'ORFLe Ribo-seq représente une technique puissante pour la détection et l'annotation des régions de séquence codante (CDS), permettant de détecter la traduction des ORFs en amont, l'utilisation des codons de départ, ou la traduction de RNAs présumément non codants.

Références :

  1. Calviello L, Ohler U. Au-delà des comptes de lecture : analyse des données Ribo-seq pour comprendre les fonctions du transcriptome. Tendances en Génétique, 2017, 33(10) : 728-744.
  2. Bartholomäus A, Del Campo C, Ignatova Z. Cartographie des biais non standardisés du profilage des ribosomes. Chimie biologique, 2016, 397(1) : 23-35.
  3. Carja O, Xing T, Wallace E W J, et al. riboviz : analyse et visualisation des ensembles de données de profilage des ribosomes[J]. BMC bioinformatics, 2017, 18(1) : 461.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut