Séquençage des petits ARN (Small RNA-Seq), facilité par Séquençage de nouvelle génération (NGS) La technologie est une technique instrumentale pour l'isolement et l'acquisition d'informations sur les molécules d'ARN non codantes. Cette méthode permet de distinguer et d'évaluer les petits ARN, y compris la découverte de nouvelles variantes et la prédiction de leurs fonctions potentielles. En tirant parti de cette technologie, les petits ARN peuvent être différenciés des familles d'ARN plus grandes, améliorant ainsi notre compréhension de leurs rôles dans les fonctions cellulaires et l'expression des gènes.
Séquençage des petits ARN représente une approche de plus en plus populaire pour aborder les problèmes biologiques des miARN et d'autres petits ARN non codants (sncARN), tels que les ARN interagissant avec piwi (piARN), les ARN interférents petits (siARN) et les ARN d'initiation de transcription (tiARN). Les miARN, piARN et siARN sont les trois sncARN les plus étudiés et sont largement analysés par séquençage, car il a été rapporté qu'ils jouent un rôle vital dans la régulation post-traductionnelle de l'expression génique. Le séquençage des petits ARN est devenu une bonne norme tant pour la découverte des petits ARN que pour le profilage des petits ARN, car il permet de séquencer l'ensemble du complément de petits ARN avec un haut débit et une grande sensibilité. Comparé aux microarrays et à la qPCR, séquençage de petits ARN ne nécessite pas de connaissances a priori sur la séquence. En plus de l'acquisition de l'ensemble des espèces de miARN et de petits ARN, séquençage des petits ARN aide également à comprendre comment la régulation post-transcriptionnelle affecte le phénotype et à identifier de nouveaux biomarqueursIl a été largement appliqué dans la recherche sur le cancer et les maladies complexes.
Les petits ARN constituent une grande catégorie de molécules régulatrices, y compris les miARN, ncARN, siARN, snoARN, piARN et rasiARN, qui se trouvent partout dans tous les organismes biologiques. Ces petits ARN régulent la croissance, le développement et la progression des maladies des organismes par divers moyens tels que la dégradation de l'ARNm, la répression de la traduction, la formation d'hétérochromatine et l'élimination de l'ADN. Le séquençage des petits ARN (sARN), généralement réalisé sur la plateforme Illumina HiSeq, facilite l'analyse complète des miARN, siARN et piARN présents dans les échantillons. De plus, cette technologie peut identifier des sARN connus, prédire de nouveaux sARN et anticiper les gènes cibles des sARN, fournissant ainsi un outil puissant pour examiner la fonctionnalité des petits ARN et les mécanismes régulateurs.
Figure 1. La structure et la classification des petits ARN. (Xiong et al., 2023)
Services qui pourraient vous intéresser
Séquençage des petits ARN est une technique à haut débit utilisée pour étudier les ARN non codants tels que les microARN (miARN), les siARN et les piARN, entre autres. Cette méthode permet la génération directe de séquençage de miARN des bibliothèques d'ARN total, éclairant ainsi le rôle des ARN non codants. Grâce à cette approche, nous pouvons non seulement comprendre comment la régulation post-transcriptionnelle affecte les phénotypes, mais aussi identifier de nouveaux marqueurs biologiques et capturer une gamme complète d'espèces de petits ARN et de miARN.
Nature à haut débit : Une seule course de séquençage peut produire plus de 5 millions de lectures de séquence.
Haute sensibilité : Le séquençage à haut débit des petits ARN présente une sensibilité intrinsèquement élevée, capable de détecter des molécules d'ARN non codantes rares. Cette caractéristique permet aux chercheurs d'identifier et de quantifier des ARN non codants à faible abondance, tels que les microARN.
Exhaustivité : Cette méthodologie permet la détection et l'identification de tous les types de molécules d'ARN petits présentes dans un échantillon, y compris les microARN, les siARN et les piARN, entre autres. Ce niveau de exhaustivité permet aux chercheurs d'examiner en profondeur le paysage d'expression des ARN non codants.
Haute résolution : Séquençage des petits ARN permet la détection de variations mineures dans les petits ARN au niveau d'une seule base ; Précision : quantification très précise allant de quelques à plusieurs millions de copies. En incluant leur longueur et leurs caractéristiques structurelles, cette haute résolution permet aux chercheurs d'explorer la fonction et les mécanismes de régulation des ARN non codants.
Pas de dépendance à l'information connue : Il peut identifier des petits ARN connus, ainsi que découvrir de nouveaux.
Excellente Reproductibilité : Le séquençage approfondi garantit l'aléatoire des échantillons, offrant une excellente reproductibilité sans nécessité d'expériences répétées.
Diversité des données : La riche diversité des données générées par séquençage de petits ARN fournit une richesse d'informations bénéfiques à la recherche biologique. L'analyse des données de séquençage permet de comprendre les motifs d'expression des ARN non codants, leurs réseaux régulateurs et les changements associés aux maladies.
Efficacité économique : Avec l'avancement de la technologie de séquençage, les coûts associés à séquençage des petits ARN continuer à diminuer, rendant cela financièrement accessible à un nombre croissant de laboratoires et de projets de recherche. Cette réduction des coûts non seulement abaisse la barrière à la recherche, mais favorise également l'application large des études sur les ARN non codants.
les petites ARN. Les chercheurs ont progressivement constaté que les données de séquençage contenant l'expression différentielle des petits ARN sont parfois incohérentes avec les résultats des microarrays, de la qPCR et des blots de Northern. Cela a été principalement attribué au biais dépendant de la ligase ARN pour des séquences d'adaptateurs particulières introduites lors de la construction de la bibliothèque de petits ARN. Des études ont suggéré que la randomisation des séquences d'adaptateurs proches de la jonction de ligation peut réduire le biais de ligation et optimiser les résultats de séquençage. Le kit NEXTflex Small RNA-seq de Bioo Scientific est actuellement le seul kit disponible commercialement qui réduit le biais associé à la ligation. Ce kit utilise des adaptateurs avec des extrémités aléatoires de 4 nt, ce qui permet une couverture plus uniforme des espèces individuelles de petits ARN. Un travail de Baran-Gale et al. (2015) a suggéré que le protocole NEXTflex est le kit le moins biaisé pour les petites ARN. séquençage de petits ARN.
Tableau 1. Les kits disponibles dans le commerce pour la construction de bibliothèques de petits ARN.
| Kits | Plateformes de séquençage appariées | Stratégies pour réduire les biais |
| Kit de préparation de bibliothèque d'ARNs petits NEBNext ((NEB) | Plateformes Illumina | Utilisation du polyéthylène glycol (PEG) |
| Kit de séquençage de petits ARN NEXTflex V3 (BIOO Scientific) | Plateformes Illumina | Utiliser à la fois des adaptateurs randomisés et du PEG |
| Kit SMARTer smRNA-Seq (Clontech) | Plateformes Illumina | Éviter complètement la ligature |
| Kit de séquençage RNA-seq de petites RNA CATS (Diagenode) | Plateformes Illumina | Éviter complètement la ligature |
| Kit de préparation de bibliothèque d'ARN petit TruSeq (Illumina) | Plateformes Illumina | Index ajoutés lors de la PCR |
Les principales sources de biais dans séquençage de petits ARN inclure le biais de ligation et le biais de PCR. Le biais de ligation provient des différences dans la structure secondaire des miARN et des adaptateurs pendant la réaction de ligation, ce qui conduit à ce que certains miARN aient une efficacité de ligation plus élevée que d'autres. Cela, à son tour, impacte l'exactitude des données. Plusieurs stratégies pour atténuer ce problème incluent l'amélioration de la conception des adaptateurs pour réduire le biais, l'utilisation de corrections computationnelles pour ajuster les valeurs d'expression, le déploiement d'enzymes spécifiques pour éliminer certaines modifications, et l'augmentation du caractère aléatoire des adaptateurs.
Une autre source de biais est le biais PCR, causé par les différentes efficacités d'amplification des molécules de longueurs et de structures secondaires variées durant le processus de PCR. Pour atténuer ce biais, des codes-barres moléculaires pourraient être utilisés pour étiqueter les produits de PCR, permettant ainsi de distinguer des molécules identiques qui ont été amplifiées par PCR. L'étape finale dans le séquençage des petits ARN Le flux de travail est le séquençage. Cette étape peut être associée à certains types de biais (tels que les effets de couloir et les effets de regroupement), mais ces biais sont généralement considérés comme des biais secondaires qui influencent subtilement le niveau global de biais.
Actuellement, il existe principalement trois méthodes pour aborder différents problèmes de biais : (1) la ligation originale à deux adaptateurs ; (2) la ligation améliorée à double adaptateur ; (3) les méthodes sans ligation (basées sur l'adenylation). De plus, un ensemble de technologies alternatives reposant sur l'hybridation des miARN et des sondes cibles évite complètement les étapes de ligation ou de polyadénylation, et dans certains cas, élimine également la phase PCR et les lectures NGS. Ces techniques offrent généralement un flux de travail simplifié adapté à une analyse routinière et automatisée. Cependant, leur spectre de miARN analysable, déterminé par un ensemble de sondes préconçues, est limité, ce qui contraint leur potentiel de découverte.
(1) Les deux méthodes de ligation d'adaptateurs originales
La méthode traditionnelle de ligation à double adaptateur consiste d'abord à connecter un adaptateur 3' pré-adenylé, suivi de l'adaptateur 5' (Fig.2). Cette approche est privilégiée en raison de son applicabilité à un large éventail de types de petits ARN, de sa capacité à détecter des ARN avec des modifications particulières, et de son utilisation historique de longue date. Cependant, des limitations inhérentes existent. Le biais de ligation des adaptateurs peut conduire à une surestimation ou une sous-estimation de certains miARN, ou à une détection potentiellement complètement évitée. La formation de dimères d'adaptateurs peut compromettre le nombre de lectures, affectant ainsi la précision des données. De plus, cette méthode ne parvient pas à capturer des types spécifiques de petits ARN, tels que les snARN avec des modifications à l'extrémité 3'.
Figure 2. Protocole de ligation à deux adaptateurs original pour l'analyse du RNA-seq de petits ARN. (Benesova et al., 2021)
(2) La méthode améliorée basée sur la ligation de deux adaptateurs
Les méthodes de ligation à double adaptateur améliorées visent à atténuer ou à contrer les biais de ligation et de PCR. Actuellement, trois techniques sont disponibles : (i) le couplage des deux adaptateurs avec des nucléotides aléatoires (Figure 3A) ; (ii) la ligation d'un seul adaptateur suivie de la circularisation (Figure 3B) ; et (iii) l'intégration de codes-barres moléculaires avec un adaptateur double. Les adaptateurs aléatoires réduisent le biais de ligation grâce à l'inclusion de sections aléatoires, ce qui peut nécessiter une gestion minutieuse pour éviter les impacts du biais de PCR. L'approche de ligation avec un seul adaptateur et la circularisation subséquente tire parti de la circularisation intramoléculaire pour réduire le biais de ligation, bien qu'il puisse encore y avoir des biais potentiels au niveau de l'extrémité 3'. En revanche, la méthode impliquant des codes-barres moléculaires atténue le biais de PCR en incorporant des codes-barres moléculaires.
Figure 3. Méthodes améliorées de ligation à deux adaptateurs pour l'analyse de l'ARN petit-seq. La réduction du biais de ligation ou de PCR est réalisée par : (A) des adaptateurs randomisés ; (B) la ligation d'un seul adaptateur et la circularisation ; et (C) des codes-barres moléculaires. (Benesova et al., 2021)
Méthode sans ligation
Les approches sans ligature incluent principalement des schémas basés sur la polyadénylation et le changement de modèle (Fig. 4), ainsi que des technologies basées sur des sondes, qui permettent toutes une analyse ciblée des miARN connus. Ces techniques offrent un flux de travail rationalisé et une analyse computationnelle tout en contournant les biais associés aux étapes de liaison et de PCR. L'approche reposant sur la polyadénylation et le changement de modèle utilise l'activité de changement de modèle de la transcriptase inverse (RTase) pour ajouter des adaptateurs en 5' en bout, contrairement aux méthodes de ligature traditionnelles. L'indépendance de cette méthode par rapport à la ligature permet une quantification plus précise des miARN, évitant ainsi les biais introduits par les étapes de ligature. Cependant, elle présente certains inconvénients, notamment le fait que certaines lectures ne s'alignent pas avec les séquences de miARN, entraînant des taux de cartographie des miARN plus faibles et des augmentations potentielles des coûts de séquençage.
Les technologies basées sur des sondes utilisent des sondes spécifiques pour l'analyse ciblée de miARN connus. Par exemple, le Nanostring nCounter utilise des codes-barres moléculaires directs et des sondes codées par couleur pour la détection numérique des miARN, ce qui le rend adapté à la quantification de plus de 800 miARN différents. L'essai FirePlex miARN combine la technologie des nanoparticules en hydrogel avec des régions spécifiques aux miARN et des adaptateurs universels, permettant la quantification de 65 espèces de miARN en une seule réaction et éliminant les écarts introduits par le processus de séparation. Pendant ce temps, EdgeSeq utilise des sondes qui se lient spécifiquement pour l'analyse et le séquençage des miARN. Son processus de préparation de bibliothèque est automatisé et l'analyse computationnelle standardisée, ce qui permet d'obtenir des résultats comparables et fiables.
Figure 4. Mécanisme de polyadénylation et de changement de modèle appliqué dans l'analyse du séquençage des petits ARN. (Benesova et al., 2021)
Le flux de travail de séquençage de petits ARN comprend généralement l'isolement total de l'ARN, la construction de bibliothèques d'ARNs petits, le séquençage approfondi et l'analyse bioinformatique.
Figure 5. Chemin de la technologie de séquençage des petits ARN.
Enrichissement des petits ARN
Étant donné les longueurs caractéristiquement courtes des petits ARN, généralement comprises entre 20 et 30 nucléotides (nt), il est nécessaire d'enrichir l'ARN total extrait. Ce processus peut être réalisé soit par l'utilisation d'un kit de réactifs spécifique pour l'enrichissement des petits ARN, tel que le miRNeasy Mini Kit, soit par électrophorèse sur gel sélective par taille. Les échantillons utilisés pour l'enrichissement peuvent varier des matériaux cellulaires, des tissus, à divers fluides corporels.
Construction de bibliothèques de petits ARN
Les groupes phosphate 5' et hydroxyle 3' sur les petits ARN permettent aux ligases de cibler et de capturer sélectivement ces espèces de petits ARN. Pour séquençage des petits ARNla séquençage à haut débit des bibliothèques de petits ARN. La construction de bibliothèques commence généralement par la ligation d'un adaptateur ADN pré-adrénylé à l'extrémité 3' des sARN en utilisant une version tronquée de la ligase T4 ARN 2, suivie de la ligation d'un adaptateur ARN à leur extrémité 5' à l'aide de la ligase T4 ARN 1. Après cette ligation, les produits peuvent être facilement transcrits inversement en cDNA et amplifiés par PCR avant le séquençage à haut débit. Il existe de nombreux kits commercialement disponibles qui génèrent des bibliothèques de petits ARN directement à partir d'échantillons d'ARN total (Tableau 1). Les produits sont adaptés au séquençage Illumina. Les principes généraux de la construction de bibliothèques de petits ARN sont décrits dans la Figure 6, mais différents kits peuvent avoir des protocoles légèrement différents. Le processus de purification par gel est dédié au contrôle de qualité et à la sélection de taille. Selon vos intérêts de recherche, la taille appropriée des séquences est récupérée par sélection de taille basée sur des billes ou purification par PAGE pour le séquençage approfondi. Une bibliothèque cDNA d'inserts de 18 à 40 pb est un choix typique qui couvre les miARN, siARN et piARN. Veuillez noter que le séquençage des miARN et des ARNm nécessite deux protocoles de bibliothèque distincts, même avec le même échantillon d'ARN total. Après le contrôle de qualité des bibliothèques de petits ARN, le séquençage à haut débit est ensuite effectué. Les plateformes Illumina sont les instruments les plus populaires pour séquençage de petits ARN, tels que MiSeq et HiSeq.
Figure 6. Les principes de la construction de bibliothèques d'ARN petits.
Analyse bioinformatique
Séquençage des petits ARN peut être utilisé pour le regroupement de petits ARN, la découverte de nouveaux petits ARN, la prédiction des cibles des miARN, l'expression différentielle des petits ARN, l'analyse évolutive et l'analyse fonctionnelle. Mais avant cela, les données de séquençage brutes doivent être prétraitées et normalisées. Le prétraitement des données implique la suppression des adaptateurs et des codes-barres, la sélection de taille, la suppression des lectures complexes et la génération de lectures uniques. La normalisation est le processus qui permet de rendre les niveaux d'expression comparables entre les bibliothèques. Rfam et miRBase sont deux bases de données courantes pour l'analyse des petits ARN. Rfam est une base de données en accès libre fournissant des informations sur les tRNA, rRNA et snoRNA, etc. miRBase contient les séquences et annotations de tous les miARN connus à travers les espèces.
Figure 7. Le flux de travail d'analyse bioinformatique des données de séquençage de petits ARN (Buschmann et al. 2016).
Contrôle de la qualité des données : La fiabilité des résultats d'analyse d'informations dépend de la qualité des données de séquençage. Par conséquent, les données brutes de séquençage sRNA subissent des processus de contrôle qualité rigoureux, y compris le découpage des adaptateurs, l'élimination des séquences contenant des bases N, le filtrage des bases de faible qualité et la sélection par longueur. Cela garantit l'acquisition de données de séquençage de haute qualité, tout en facilitant l'énumération des espèces de petits ARN et la caractérisation de leur distribution de longueur.
Alignement du génome de référence : À partir des lectures propres obtenues après la sélection par longueur de chaque échantillon, un alignement sur le génome de référence est effectué, suivi d'une analyse statistique des résultats d'alignement.
Analyse des miARN connus : L'alignement des lectures à la base de données des miARN permet d'identifier les microARN connus.
Analyse des ncARN : L'alignement des lectures sur des séquences d'ARNnc spécifiques à l'espèce ou sur la base de données Rfam facilite l'identification des rRNA, tRNA, snRNA et snoRNA.
Prédiction de nouveaux miARN : Utilisation de miREvo pour la prédiction de nouveaux miARN, accompagnée d'analyses de préférence de nucléotides et de structure secondaire.
Expression génique et analyse différentielle : Quantification des miARN connus et nouveaux basée sur les résultats d'alignement, suivie d'une analyse différentielle des miARN pour élucider l'expression différentielle entre les échantillons ou les groupes.
Prédiction des gènes cibles des miARN : Exploitation des outils logiciels miRanda et RNAhybrid pour la prédiction des gènes cibles miRNA différentiels.
Enrichissement fonctionnel : En utilisant des bases de données d'annotation fonctionnelle telles que GO et KEGG, un enrichissement significatif des informations fonctionnelles concernant les gènes cibles de miARN différemment exprimés parmi les échantillons ou les groupes est obtenu.
Séquençage des petits ARN est une technique essentielle en biologie, largement utilisée dans divers domaines de recherche, notamment dans la régulation des gènes, le diagnostic des maladies et l'investigation biomédicale.
Analyse de l'expression des miARN :
Les microARN (miARN) sont des ARN non codants essentiels impliqués dans la régulation de l'expression génique. Séquençage des petits ARN permet une évaluation complète et à haut débit des niveaux d'expression des miARN, éclaircissant ainsi les réseaux fonctionnels et régulatoires des miARN au sein des organismes.
Recherche fonctionnelle des miARN :
Utilisation séquençage de petits ARN permet l'identification des gènes cibles des miARN et l'exploration approfondie des interactions mutuelles entre les miARN et leurs cibles. Cette approche s'immerge profondément dans le déchiffrement des fonctions biologiques et des mécanismes régulateurs des miARN.
Découverte de biomarqueurs :
Étant donné les rôles essentiels des miARN dans l'apparition et la progression de nombreuses maladies, le séquençage des petits ARN constitue un outil puissant pour découvrir des miARN associés aux maladies. Par conséquent, cela offre un potentiel biomarqueurs pour le diagnostic des maladies et les interventions thérapeutiques.
Investiguer les associations miARN-maladie :
En juxtaposant les profils d'expression des miARN dans des états sains et malades, il est possible de discerner les miARN associés aux maladies. Cette révélation pourrait fournir des informations significatives pour élucider la pathogénie des maladies et engendrer des méthodologies de traitement innovantes.
Recherche sur les interactions entre les miARN et les médicaments :
Séquençage des petits ARN peut faciliter l'exploration des interactions entre les miARN et les médicaments. Cela inclut l'influence des composés pharmaceutiques sur l'expression des miARN, ainsi que le rôle régulateur des miARN sur le métabolisme des médicaments et l'efficacité thérapeutique.
Enquêtes sur l'évolution biologique :
L'analyse comparative des profils d'expression des miARN entre différentes espèces ou individus à travers séquençage de petits ARN peut mettre en lumière la conservativité et la diversité des miARN dans le processus évolutif des organismes.
Recherche sur la réponse au stress environnemental :
Étant donné le rôle crucial des miARN dans la réponse d'un organisme au stress environnemental, l'utilisation de séquençage de petits ARN fournit une méthode pour étudier comment ce stress influence le profil d'expression des miARN, explorant ainsi les mécanismes sous-jacents de l'adaptation biologique.
Figure 8. Applications des modifications des petits ARN. (Xiong et al., 2023)
Pour plus de détails pipeline bioinformatique pour le séquençage des petits ARN, veuillez vous référer à cette page. En plus de séquençage de petits ARN, nous fournissons également d'autres séquençage transcriptomique services, y compris RNA-seq, séquençage de l'ARN bactérien, séquençage de l'lncARN, séquençage de circRNA et séquençage du dégradome.
Références :