L'ARN-seq constitue la pierre angulaire de l'analyse de l'expression génique différentielle (DGE), une méthode essentielle en biologie moléculaire. Le flux de travail conventionnel commence par l'extraction de l'ARN en laboratoire, suivie de l'enrichissement en ARN messager ou de l'élimination de l'ARN ribosomique, de la synthèse de l'ADNc et de la création de bibliothèques de séquençage ligaturées avec des adaptateurs. Ces bibliothèques sont ensuite soumises à un séquençage à haut débit, utilisant souvent des plateformes Illumina, générant des lectures allant de 100 à 30 millions par échantillon. La phase computationnelle qui suit implique l'alignement des lectures ou l'assemblage en transcriptomes, la quantification des transcrits qui se chevauchent, la normalisation et le filtrage inter-échantillons, culminant en une modélisation statistique pour discerner les altérations significatives des niveaux d'expression des gènes ou des transcrits à travers les cohortes d'échantillons.
Historiquement, le RNA-seq a adopté diverses plateformes, notamment Illumina, réputée pour ses courtes longueurs de lecture, en contraste avec les plateformes de séquençage à longues lectures telles que PacBio et Nanopore, chacune offrant des avantages et des inconvénients distincts.
Les services de séquençage à haut débit et de construction de bibliothèques de CD Genomics permettent une analyse approfondie des transcriptomes. CD Genomics propose des services de RNA-Seq à lecture courte et à lecture longue, garantissant une recherche robuste sur les transcriptomes dans des échantillons de la plus haute qualité.
Le séquençage à court reads et le séquençage à long reads se présentent comme des méthodologies distinctes dans le séquençage de l'ADN ou de l'ARN, chacune offrant des caractéristiques et des avantages uniques dans le décodage de l'information génétique.
Séquençage à lecture courte implique l'analyse de séquences d'ADN ou d'ARN en fragments plus courts. Parmi les technologies de séquençage à lecture courte, la plateforme d'Illumina se distingue, réputée pour générer des séquences s'étendant sur des dizaines à des centaines de paires de bases.
D'autre part, séquençage à lecture longue excelle à capturer des fragments d'ADN ou d'ARN plus longs, souvent s'étendant sur des milliers à des centaines de milliers de paires de bases.
La sélection entre le séquençage à court et à long reads dépend des exigences spécifiques de l'étude. Les courts reads sont bien adaptés aux efforts de séquençage à grande échelle, à la détection de SNP et aux études d'expression génique, tandis que les longs reads excellent dans la résolution de structures génomiques complexes, facilitant l'assemblage du génome et la localisation des variations structurelles au sein des gènes. Souvent, les chercheurs choisissent une approche hybride, tirant parti des deux technologies pour obtenir une compréhension plus nuancée des paysages génétiques.
Tableau 1 Lecture courte vs. lecture longue RNA-seq
| Séquençage cDNA à lecture courte | cDNA-Seq à lecture longue | RNA-Seq à lecture longue | |
| Plateformes | Illumina, Ion Torrent | PacBio | Oxford Nanopore |
| Avantages | - Débit très élevé : 100 à 1 000 fois plus de lectures par course que les plateformes de lecture longue. - Les courbes de biais et d'erreur sont facilement compréhensibles. - Offre de nombreuses méthodes compatibles et des flux de travail computationnels pour l'analyse de l'ARN dégradé. |
- Capture de nombreux transcrits complets dans des lectures de 1 à 50 kb. - Simplifie les méthodes computationnelles pour l'analyse du transcriptome ab initio. |
- Des segments de lecture longs allant de 1 à 50 Ko capturent efficacement des transcriptions complètes. - Des calculs simplifiés facilitent l'analyse du transcriptome ab initio. - Préparation d'échantillons sans besoin de transcription inverse ou avec un biais PCR réduit. - La détection des modifications de bases de l'ARN est activée, y compris l'estimation directe des longueurs de la queue Poly(A) grâce au séquençage de molécules uniques. |
| Inconvénients | La préparation des échantillons (transcription inverse, PCR, sélection de taille) introduit un biais. - Détection et quantification limitées des isoformes. - Nécessite des étapes de correspondance et/ou d'assemblage du transcriptome ab initio pour la découverte de transcrits. |
- Débit faible à moyen : 500 000 à 10 millions de lectures par exécution. - Biais de préparation d'échantillons présents pour la découverte de guides, l'analyse du transcriptome ab initio et la découverte de transcrits de fusion. - Non recommandé pour l'analyse de l'ARN dégradé. |
- La technologie offre un faible débit, actuellement compris entre 500 000 et 1 million de lectures par exécution. La compréhension de la préparation des échantillons et des biais de séquençage reste incomplète. - Capable de détecter des modifications dans l'acide ribonucléique (ARN). |
| Applications clés | - DGEWTA, petit ARN, analyse unicellulaire, omiques spatiales, assemblage d'ARN de novo, analyse du translatome, analyse structurale et des interactions ARN-protéine, etc. | - Découverte d'isoformes, analyse du transcriptome ab initio, découverte de transcrits de fusion, MHC, HLA ou autre analyse complexe de transcrits. | - Découverte d'isoformes, analyse de transcriptome ab initio, découverte de transcrits de fusion, MHC, HLA ou autre analyse de transcrits complexes. - Capable d'identifier les modifications de l'acide ribonucléique (ARN). |
| Considérations technologiques | - Haut débit avec des biais connus. - Les flux de travail computationnels répondent à diverses applications d'analyse de l'ARN. |
- Débit moyen avec des biais de préparation d'échantillons. - Détection directe des modifications de l'ARN. |
|
| Recommandations | - Adapté à un large éventail d'applications d'analyse de l'ARN. - Non recommandé pour l'analyse de l'ARN dégradé. |
- Recommandé pour la découverte d'isoformes, l'analyse des transcrits de fusion et l'analyse des transcrits complexes. - Pas adapté à l'analyse de l'ARN dégradé. |
Le séquençage excelle dans des tâches telles que la découverte d'isoformes, l'analyse de transcriptomes ab initio, la détection de transcrits de fusion et l'examen de transcrits complexes comme les MHC et HLA. Cependant, il n'est pas recommandé pour l'analyse de l'ARN dégradé. |