Introduction à l'analyse des données de séquençage de miARN

Avec l'avancement des technologies de séquençage à haut débit, le séquençage de miARN est devenu un outil puissant pour le profilage de l'expression des miARN dans divers échantillons. L'analyse des données de séquençage de miARN est cruciale pour faire progresser notre compréhension de la régulation génique, des mécanismes de la maladie et de la médecine personnalisée. Elle permet la découverte de miARN régulateurs impliqués dans des processus biologiques importants et l'identification de miARN comme biomarqueurs potentiels pour le diagnostic, le pronostic et la réponse au traitement des maladies. De plus, l'analyse des données de séquençage de miARN aide à déchiffrer des réseaux régulateurs complexes médiés par les miARN et contribue au développement d'approches de médecine personnalisée. L'intégration des données de séquençage de miARN avec d'autres données omiques améliore notre compréhension des processus biologiques et permet le développement de thérapies ciblées.

Service d'analyse des données de séquençage de miARN

L'équipe d'experts en bioinformatique de CD Genomics, avec une vaste expérience de projet, fournit des services d'analyse des données de séquençage de miARN, y compris l'analyse standard, l'analyse avancée et l'analyse personnalisée pour répondre à vos besoins de recherche spécifiques.

Flux de travail d'analyse des données de miARN-Seq

Contenu de l'analyse des données

1. Statistiques de distribution de la longueur des microARN

Appliquer fastx (fastx_toolkit-0.0.13.2) pour prétraiter les lectures originales, enlever les séquences d'adaptateurs et les séquences de faible qualité (y compris les bases ambiguës N, les séquences avec une qualité de base inférieure à 10 et une longueur inférieure à 18nt), et enfin fournir les statistiques des résultats de traitement dans un tableau et un diagramme de distribution de longueur.

2. Statistiques d'annotation d'alignement des microARN

La séquence obtenue par séquençage a été comparée avec la base de données Sanger miRBase, les rRNA connus, les tRNA, les régions répétées, la base de données RefSeq, et d'autres bases de données non codantes telles que ncRNA, piRNA, la base de données Rfam, et a annoté les microARN connus.

3. Annotation d'autres petits ARN

Les lectures séquencées sont alignées aux bases de données génomiques correspondantes pour les espèces, et les sources des lectures annotées sont classées et comptées. Ce processus aide à identifier et quantifier les microARN connus et d'autres types de molécules de petits ARN.

4. Prédiction de nouveaux microARN

La structure en épingle à cheveux caractéristique des précurseurs de microARN peut être utilisée pour prédire de nouveaux microARN. Pour les séquences qui ne sont pas annotées dans les résultats d'alignement, elles sont comparées à la séquence du génome entier de l'espèce. En analysant les modèles de pliage, si une séquence est située sur une structure en boucle, elle est provisoirement identifiée comme un candidat nouveau microARN.

Pour les nouveaux microARN prédit, leurs emplacements chromosomiques, positions de début et de fin, orientation de brin, ainsi que des valeurs numériques telles que le compte, la longueur, la teneur en GC et l'énergie libre minimale sont enregistrés et listés.

De plus, pour les nouveaux microARN, la structure secondaire de leurs précurseurs et leur relation avec les microARN matures sont calculées et présentées.

5. Graphiques d'analyse de saturation

L'analyse de saturation examine si la détection des microARN répertoriés dans la base de données miRBase augmente avec l'augmentation de la profondeur de séquençage. Les résultats d'annotation sont divisés proportionnellement et tracés pour observer la tendance des résultats d'annotation dans les échantillons biologiques, garantissant leur validité biologique.

6. Sélection de l'expression des microARN

Les différences entre les échantillons sont comparées à l'aide du package R DEGseq et de scripts Perl pour comparer les niveaux d'expression des microARN entre les échantillons en fonction des critères de regroupement du client (par exemple, groupe témoin vs groupe expérimental). Dans l'analyse différentielle, le TPM (Transcripts par million) est utilisé comme données normalisées, calculé comme le compte de lecture individuel de microARN multiplié par 10^6 divisé par le compte total de lectures.

7. Prédiction des gènes cibles des microARN

Le logiciel miranda est utilisé pour prédire les sites cibles potentiels pour les séquences de microARN et les séquences cDNA génomiques correspondantes des espèces.

Service d'analyse des données de séquençage de miARN (Zhaohui Luo, et al,. 2012)

Alternativement, la base de données TargetScan peut être utilisée pour associer les microARN à leurs gènes cibles. Les résultats incluent des informations pertinentes sur le microARN et ses gènes cibles.

8. Analyse d'enrichissement fonctionnel GO (gènes cibles)

Service d'analyse des données de séquençage de miARN (Yuepeng Song et al,. 2013)

9. Analyse d'enrichissement de signification des voies (gènes cibles)

Cas 1 : Profilage des microARN floraux de dimorphisme sexuel et expression des gènes cibles dans le peuplier andromonoïque (Populus tomentosa). PLoS One. 2013, 8(5):e62681.(IF3.730)

Cette étude rapporte pour la première fois l'identification de miARN associés au développement des fleurs et de leurs gènes cibles. Sur la base de l'annotation des gènes, tous les gènes cibles ont été classés en quatre catégories.
La première catégorie est celle des gènes liés au développement floral, y compris Pto-F6, Pto-F11, Pto-F14, Pto-F19, Pto-25, Pto-36, Pto-F51, Pto-F54 et Pto-F66.
La deuxième catégorie concerne les gènes liés au transport des ions calcium : Pto-F28 et Pto-F45 (miARN spécifiques aux fleurs femelles) et Pto-F16 (miARN spécifique aux fleurs mâles).
La troisième catégorie concerne les gènes liés à la régulation hormonale : 10 miARN (à l'exception de Pto-F6) qui sont principalement exprimés dans les fleurs femelles.
La quatrième catégorie concerne les gènes liés à la méthylation de l'ADN : trois miARN.
Ces résultats fournissent des informations sur les rôles régulateurs des miARN dans le développement floral, y compris leur implication dans l'organogenèse des fleurs, la signalisation hormonale, le transport des ions calcium et les processus de méthylation de l'ADN.

Cas 2 : MeCP2 supprime le traitement nucléaire des microARN et la croissance dendritique en régulant le complexe DGCR8/Drosha p547. Developmental Cell. 2014, 28, 547–60.(IF:10.366)

Les mutations ou variations du nombre de copies dans le gène humain MeCP2 entraînent des troubles neurologiques du développement, tels que l'autisme. Des chercheurs de l'Institut des neurosciences, des Instituts de sciences biologiques de Shanghai, Académie chinoise des sciences, dirigés par le Dr Zilong Qiu, ont utilisé la technologie de séquençage à haut débit pour analyser quantitativement les petits ARN matures dans la région hippocampique de souris knockout MeCP2. Ils ont découvert que MeCP2 inhibe la production d'un grand nombre de petits ARN. Cette étude a révélé une nouvelle fonction de la protéine associée à l'autisme MeCP2 dans le traitement des petits ARN et suggère que cette fonction pourrait être impliquée dans le mécanisme pathogène sous-jacent aux troubles neurologiques du développement causés par des mutations du gène MeCP2.

Service d'analyse de données de séquençage de miARN