Qu'est-ce que le séquençage d'ARN en vrac ?

Séquençage d'ARN en vrac, communément appelé RNA-seq en vrac, fournit des informations sur les niveaux d'expression génique moyens au sein d'un échantillon de tissu entier. Cette approche s'avère précieuse pour la transcriptomique comparative et les investigations de biomarqueurs. Cependant, elle ne permet pas de saisir l'hétérogénéité nuancée présente au sein des tissus.

Flux de travail de séquençage d'ARN en vrac

L'ARN-seq en vrac, une technique fondamentale dans l'analyse des transcriptomes, a connu près de deux décennies d'utilisation généralisée, servant d'outil vital pour les chercheurs. Sa nomenclature, "en vrac", la distingue de l'avènement ultérieur de l'ARN-seq à cellule unique. L'ampleur de RNA-seq Les analyses englobent la comparaison de séquences, l'épissage des transcrits, la quantification de l'expression, l'analyse différentielle, la détection de gènes de fusion, l'épissage variable, l'édition de l'ARN et la détection de mutations.

Considérez le processus standard, illustré par des plateformes de séquençage de seconde génération à lecture courte et longue couramment utilisées, telles qu'Illumina et SOLiD :

  • Construction de la bibliothèque de séquençage : Cette étape initiale implique l'extraction d'ARN, la synthèse de cDNA et l'ajout de jonctions. Pour le séquençage de l'ARNm, l'Oligo (dT) est souvent utilisé pour enrichir l'ARNm ou épuiser l'ARN ribosomal.
  • Séquençage sur des plateformes à haut débit : La bibliothèque préparée subit un séquençage sur une plateforme à haut débit.
  • Analyse des données en amont : Cette phase englobe le contrôle de qualité, le filtrage, la comparaison (alignement/cartographie), la quantification et l'analyse avancée des variantes d'épissage au sein des lectures séquencées.
  • Analyse en aval : Suite à l'acquisition de la matrice d'expression, diverses méthodes sont utilisées pour l'exploration des données.

Les services de séquençage à haut débit et de construction de bibliothèques de CD Genomics permettent une analyse approfondie des transcriptomes.

Séquençage RNA en vrac ouvre la voie à des aperçus profonds sur la dynamique de l'expression génique et les processus régulateurs. Le flux de travail d'analyse des données comprend :

  • Analyse d'expression différentielle : Cette technique compare des gènes ou des transcrits, mettant en évidence des différences significatives entre divers groupes expérimentaux.
  • Regroupement et Visualisation : Les échantillons subissent une analyse de regroupement pour élucider les motifs d'expression génique. Des méthodes telles que l'Analyse de Réseau de Co-expression Génétique Pondérée (WGCNA), le regroupement de cohérence, la Factorisation en Matrice Non Négative (NMF) et l'analyse de séries temporelles sont utilisées.
  • Analyse d'enrichissement : Des techniques telles que l'analyse de sur-représentation (ORA), l'analyse d'enrichissement des ensembles de gènes (GSEA) et l'analyse de variation des ensembles de gènes (GSVA) mettent en évidence des voies biologiques enrichies.
  • Construction de réseaux réglementaires/interactions : Les chercheurs construisent des réseaux complexes pour élucider les mécanismes réglementaires et les interactions au sein des systèmes biologiques.

Comprehensive protocol of RNA-seq data analysis. (Sahraeian et al., 2017)Protocole complet d'analyse des données RNA-seq. (Sahraeian et al., 2017)

scRNA-seq vs. RNA-seq en vrac vs. Transcriptomique spatiale

RNA-seq en vrac est une méthode conventionnelle pour séquencer l'ARN dans toutes les cellules en regroupant l'ARN de plusieurs cellules ou tissus. Cette approche offre un profil d'expression global représentant l'ensemble de la population cellulaire, facilitant l'identification des gènes exprimés de manière différentielle à travers les tissus, les conditions ou les points temporels.

L'objectif principal de RNA-seq en vrac il s'agit de comparer les niveaux d'expression génique moyens entre différentes conditions ou échantillons. Par exemple, les chercheurs l'utilisent couramment pour analyser les variations d'expression entre les tissus malades et sains, identifiant ainsi les gènes présentant des changements d'expression significatifs.

Cependant, le séquençage d'ARN en vrac n'a pas la capacité de discerner les disparités d'expression au niveau des cellules individuelles, ce qui peut obscurcir les sous-populations cellulaires rares, les variations transcriptionnelles subtiles ou les dynamiques d'expression génique temporelles. Par conséquent, pour les recherches nécessitant une résolution plus fine et l'exploration de la diversité cellulaire, des techniques plus sophistiquées comme le scRNA-seq deviennent impératives.

Le séquençage d'ARN à cellule unique (scRNA-seq) permet l'analyse de l'expression génique au sein de cellules individuelles, offrant des perspectives sur l'hétérogénéité cellulaire au-delà des capacités des méthodes de séquençage d'ARN traditionnelles telles que le séquençage d'ARN en vrac (Bulk RNA-seq).

Dans les expériences de scRNA-seq, les cellules sont isolées individuellement et leur ARN est extrait. Par la suite, l'ARN subit une transcription inverse en cDNA, suivie d'une amplification et d'un séquençage. Cette méthodologie haute résolution facilite l'identification des types cellulaires, des états et des sous-populations, révélant une diversité cellulaire cachée et des clusters cellulaires rares indétectables avec le RNA-seq en vrac.

L'objectif principal de l'analyse scRNA-seq est d'explorer l'hétérogénéité cellulaire et de délimiter des types ou états cellulaires distincts. Avec le scRNA-seq, des données d'expression génique sont acquises pour chaque cellule, permettant une compréhension nuancée des disparités et de la diversité cellulaires.

De plus, la scRNA-seq utilise des techniques d'analyse de clusters pour catégoriser les cellules en sous-groupes en fonction de leurs profils d'expression génique, révélant à la fois des similitudes et des distinctions entre les cellules. En annotant des gènes marqueurs cellulaires connus, les chercheurs peuvent valider et classer les types cellulaires nouvellement découverts.

De plus, le scRNA-seq facilite l'identification des gènes spécifiquement exprimés au cours de différentes étapes de développement, à travers divers types de tissus ou dans des conditions pathologiques distinctes.

Tableau 1 Différences entre le séquençage d'ARN unicellulaire (scRNA-seq), le séquençage d'ARN en vrac et le séquençage de transcriptome spatial

Aspecte Séquençage d'ARN à cellule unique (scRNA-seq) Séquençage d'ARN en vrac Séquençage de transcriptome spatial
Définition Séquençage de cellules uniques pour obtenir des informations sur leur transcriptome. Analyse de l'expression génique dans les tissus et les populations cellulaires. Examine simultanément l'expression génique et les informations de localisation spatiale des cellules.
Traitement des échantillons Isolation, lyse et amplification de cellules individuelles. Extraction directe d'ARN et amplification de tissus et de populations cellulaires. Sections ou fixation selon les besoins de l'échantillon.
Coûts expérimentaux Plus élevé Relativement bas Plus élevé
Qualité des données Difficile d'obtenir des données de haute qualité en raison de divers facteurs tels que le marquage fluorescent des cellules individuelles et la préparation de bibliothèques d'ARN. Affecté par des facteurs tels que l'extraction et l'amplification de l'ARN, il existe un certain effet de lot. Relativement difficile, mais peut fournir des informations spatiales de haute précision.
Analyse des données Complexe à traiter et nécessite une analyse des caractéristiques individuelles des cellules. Méthode d'analyse de l'expression différentielle relativement simple et couramment utilisée pour l'analyse. Besoin de combiner avec la biologie moléculaire, l'imagerie et d'autres domaines pour une analyse complète.
Scénarios d'application Analyse les phénotypes cellulaires individuels, les trajectoires de développement cellulaire, etc. Analyser l'expression génique globale des tissus et des populations cellulaires pour étudier la fonction des gènes et les mécanismes physiologiques. Analyse la structure spatiale des différents types de cellules dans les tissus, les interactions cellulaires, etc.

Comment choisir la bonne technologie de séquençage d'ARN ?

Le séquençage à cellule unique, le séquençage d'ARN en vrac et le séquençage du transcriptome spatial offrent chacun des avantages uniques et rencontrent des limitations spécifiques. Cependant, l'intégration des trois approches peut atténuer les inconvénients individuels, aboutissant à une analyse plus complète, précise et éclairante des phénomènes biologiques.

Les principaux avantages de l'analyse combinée incluent :

  • Aperçu complet des profils d'expression cellulaire et de l'organisation spatiale : Le séquençage à cellule unique fournit des profils d'expression génique détaillés des cellules individuelles, tandis que le séquençage du transcriptome spatial révèle des informations sur la localisation spatiale au sein des tissus. En combinant ces approches, une compréhension plus approfondie des fonctions cellulaires et des interactions au sein des tissus peut être obtenue.
  • Amélioration de la qualité et de la fiabilité des données : Les effets de lot et le bruit technique inhérents au séquençage unicellulaire et au séquençage d'ARN en vrac peuvent être identifiés et corrigés grâce au séquençage du transcriptome spatial. Cette intégration aide à atténuer les résultats faussement positifs potentiels, améliorant ainsi la fiabilité globale des données.
  • Compréhension holistique de la complexité biologique : L'analyse combinée couvre plusieurs niveaux, des caractéristiques moléculaires des cellules individuelles au contexte plus large des tissus entiers. Par conséquent, elle permet une interprétation plus complète des phénomènes biologiques complexes et divers.

Ainsi, adopter l'intégration de ces trois méthodologies de séquençage représente une tendance cruciale et une trajectoire de développement dans la recherche biologique.

Cas : Analyse de séquençage d'ARN à plusieurs échelles de l'environnement tumoral du TNBC et prédiction de la réponse aux ICI.

Objectif de recherche

Le cancer du sein triple négatif (CSTN) présente une prévalence notable de défauts de recombinaison homologue (DRH), qui ont émergé comme des biomarqueurs clés influençant la réponse aux inhibiteurs de points de contrôle immunitaire (IPCI). Cette étude visait à élucider l'impact des DRH sur le microenvironnement tumoral (MET) à différentes échelles, en s'appuyant sur des données provenant de séquençages RNA à cellule unique, spatiaux et en vrac. De plus, l'enquête cherchait à construire des modèles prédictifs pour la réponse au traitement basés sur les caractéristiques du MET, en utilisant des algorithmes d'apprentissage automatique à travers 11 cohortes de traitement par IPCI.

Single-cell, spatial, and bulk RNA-sequencing were collected to explore the role of HRD in the development of TME at multiple scales. (Kang et al., 2023)Des séquençages d'ARN unicellulaires, spatiaux et en vrac ont été collectés pour explorer le rôle de l'HRD dans le développement du TME à plusieurs échelles. (Kang et al., 2023)

Principales conclusions

  • Analyse unicellulaire de l'influence des HRD : Les données de séquençage d'ARN unicellulaire provenant de huit échantillons de TNBC, comprenant quatre échantillons HRD et quatre échantillons non-HRD, ont été analysées. La comparaison des distributions des types cellulaires entre les deux groupes a révélé une proportion plus élevée de cellules immunitaires et de cellules stromales dans la cohorte HRD. L'augmentation observée des lymphocytes infiltrants dans le groupe HRD suggère une association potentielle avec une expression accrue de néoantigènes attribuable aux HRD.
  • Aperçus de l'ARN-seq spatial sur l'architecture du TME : Une analyse d'ARN-seq spatial a été réalisée sur quatre échantillons de TNBC non-HRD pour délimiter les relations spatiales entre différents types cellulaires. Les fractions d'enrichissement pour chaque type cellulaire ont été dérivées et corrélées au sein de chaque échantillon d'ARN-seq spatial. Notamment, les myofibroblastes (myCAFs) et les CAFs inflammatoires (iCAFs) ont montré une exclusivité mutuelle significative à une échelle spatiale.

la dominance des myCAFs dans le TME : Au sein des loci étiquetés comme fibroblastes associés au cancer (CAFs), les myCAFs ont montré des scores d'enrichissement nettement plus élevés, en accord avec leur présence prédominante dans le TME des échantillons non-HRD.

Validation de la corrélation entre DPP4 et myCAFs : Les scores d'enrichissement des myCAFs aux loci DPP4+ étaient significativement plus élevés que ceux aux loci DPP4-, corroborant l'association entre l'expression de DPP4 et l'abondance des myCAFs à des échelles spatiales. De plus, DPP4 a montré une corrélation plus forte avec les myCAFs par rapport aux iCAFs, indiquant sa pertinence potentielle dans la dynamique du TME.

Ces résultats soulignent l'interaction complexe entre les DRH, la composition du TME et la réponse au traitement dans le TNBC. L'intégration des données de séquençage RNA à cellule unique, spatial et en vrac, associée à des modèles prédictifs basés sur l'apprentissage automatique, offre de nouvelles perspectives sur les bases moléculaires de la pathogénèse du TNBC et des résultats thérapeutiques.

Références :

  1. Kang, Kai, et al. "Déficit en recombinaison homologue dans le cancer du sein triple négatif : La transcriptomique multi-échelle révèle des microenvironnements tumoraux distincts et des limitations dans la prédiction de la réponse à l'immunothérapie." Informatique en biologie et médecine 158 (2023) : 106836.
  2. Sahraeian, Sayed Mohammad Ebrahim, et al. "Acquérir une compréhension biologique complète du transcriptome en réalisant une analyse RNA-seq à large spectre." Communications Nature 8.1 (2017) : 59.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut