Séquençage d'ARN en vrac, communément appelé RNA-seq en vrac, fournit des informations sur les niveaux d'expression génique moyens au sein d'un échantillon de tissu entier. Cette approche s'avère précieuse pour la transcriptomique comparative et les investigations de biomarqueurs. Cependant, elle ne permet pas de saisir l'hétérogénéité nuancée présente au sein des tissus.
L'ARN-seq en vrac, une technique fondamentale dans l'analyse des transcriptomes, a connu près de deux décennies d'utilisation généralisée, servant d'outil vital pour les chercheurs. Sa nomenclature, "en vrac", la distingue de l'avènement ultérieur de l'ARN-seq à cellule unique. L'ampleur de RNA-seq Les analyses englobent la comparaison de séquences, l'épissage des transcrits, la quantification de l'expression, l'analyse différentielle, la détection de gènes de fusion, l'épissage variable, l'édition de l'ARN et la détection de mutations.
Considérez le processus standard, illustré par des plateformes de séquençage de seconde génération à lecture courte et longue couramment utilisées, telles qu'Illumina et SOLiD :
Les services de séquençage à haut débit et de construction de bibliothèques de CD Genomics permettent une analyse approfondie des transcriptomes.
Séquençage RNA en vrac ouvre la voie à des aperçus profonds sur la dynamique de l'expression génique et les processus régulateurs. Le flux de travail d'analyse des données comprend :
Protocole complet d'analyse des données RNA-seq. (Sahraeian et al., 2017)
RNA-seq en vrac est une méthode conventionnelle pour séquencer l'ARN dans toutes les cellules en regroupant l'ARN de plusieurs cellules ou tissus. Cette approche offre un profil d'expression global représentant l'ensemble de la population cellulaire, facilitant l'identification des gènes exprimés de manière différentielle à travers les tissus, les conditions ou les points temporels.
L'objectif principal de RNA-seq en vrac il s'agit de comparer les niveaux d'expression génique moyens entre différentes conditions ou échantillons. Par exemple, les chercheurs l'utilisent couramment pour analyser les variations d'expression entre les tissus malades et sains, identifiant ainsi les gènes présentant des changements d'expression significatifs.
Cependant, le séquençage d'ARN en vrac n'a pas la capacité de discerner les disparités d'expression au niveau des cellules individuelles, ce qui peut obscurcir les sous-populations cellulaires rares, les variations transcriptionnelles subtiles ou les dynamiques d'expression génique temporelles. Par conséquent, pour les recherches nécessitant une résolution plus fine et l'exploration de la diversité cellulaire, des techniques plus sophistiquées comme le scRNA-seq deviennent impératives.
Le séquençage d'ARN à cellule unique (scRNA-seq) permet l'analyse de l'expression génique au sein de cellules individuelles, offrant des perspectives sur l'hétérogénéité cellulaire au-delà des capacités des méthodes de séquençage d'ARN traditionnelles telles que le séquençage d'ARN en vrac (Bulk RNA-seq).
Dans les expériences de scRNA-seq, les cellules sont isolées individuellement et leur ARN est extrait. Par la suite, l'ARN subit une transcription inverse en cDNA, suivie d'une amplification et d'un séquençage. Cette méthodologie haute résolution facilite l'identification des types cellulaires, des états et des sous-populations, révélant une diversité cellulaire cachée et des clusters cellulaires rares indétectables avec le RNA-seq en vrac.
L'objectif principal de l'analyse scRNA-seq est d'explorer l'hétérogénéité cellulaire et de délimiter des types ou états cellulaires distincts. Avec le scRNA-seq, des données d'expression génique sont acquises pour chaque cellule, permettant une compréhension nuancée des disparités et de la diversité cellulaires.
De plus, la scRNA-seq utilise des techniques d'analyse de clusters pour catégoriser les cellules en sous-groupes en fonction de leurs profils d'expression génique, révélant à la fois des similitudes et des distinctions entre les cellules. En annotant des gènes marqueurs cellulaires connus, les chercheurs peuvent valider et classer les types cellulaires nouvellement découverts.
De plus, le scRNA-seq facilite l'identification des gènes spécifiquement exprimés au cours de différentes étapes de développement, à travers divers types de tissus ou dans des conditions pathologiques distinctes.
Tableau 1 Différences entre le séquençage d'ARN unicellulaire (scRNA-seq), le séquençage d'ARN en vrac et le séquençage de transcriptome spatial
| Aspecte | Séquençage d'ARN à cellule unique (scRNA-seq) | Séquençage d'ARN en vrac | Séquençage de transcriptome spatial |
| Définition | Séquençage de cellules uniques pour obtenir des informations sur leur transcriptome. | Analyse de l'expression génique dans les tissus et les populations cellulaires. | Examine simultanément l'expression génique et les informations de localisation spatiale des cellules. |
| Traitement des échantillons | Isolation, lyse et amplification de cellules individuelles. | Extraction directe d'ARN et amplification de tissus et de populations cellulaires. | Sections ou fixation selon les besoins de l'échantillon. |
| Coûts expérimentaux | Plus élevé | Relativement bas | Plus élevé |
| Qualité des données | Difficile d'obtenir des données de haute qualité en raison de divers facteurs tels que le marquage fluorescent des cellules individuelles et la préparation de bibliothèques d'ARN. | Affecté par des facteurs tels que l'extraction et l'amplification de l'ARN, il existe un certain effet de lot. | Relativement difficile, mais peut fournir des informations spatiales de haute précision. |
| Analyse des données | Complexe à traiter et nécessite une analyse des caractéristiques individuelles des cellules. | Méthode d'analyse de l'expression différentielle relativement simple et couramment utilisée pour l'analyse. | Besoin de combiner avec la biologie moléculaire, l'imagerie et d'autres domaines pour une analyse complète. |
| Scénarios d'application | Analyse les phénotypes cellulaires individuels, les trajectoires de développement cellulaire, etc. | Analyser l'expression génique globale des tissus et des populations cellulaires pour étudier la fonction des gènes et les mécanismes physiologiques. | Analyse la structure spatiale des différents types de cellules dans les tissus, les interactions cellulaires, etc. |
Le séquençage à cellule unique, le séquençage d'ARN en vrac et le séquençage du transcriptome spatial offrent chacun des avantages uniques et rencontrent des limitations spécifiques. Cependant, l'intégration des trois approches peut atténuer les inconvénients individuels, aboutissant à une analyse plus complète, précise et éclairante des phénomènes biologiques.
Les principaux avantages de l'analyse combinée incluent :
Ainsi, adopter l'intégration de ces trois méthodologies de séquençage représente une tendance cruciale et une trajectoire de développement dans la recherche biologique.
Objectif de recherche
Le cancer du sein triple négatif (CSTN) présente une prévalence notable de défauts de recombinaison homologue (DRH), qui ont émergé comme des biomarqueurs clés influençant la réponse aux inhibiteurs de points de contrôle immunitaire (IPCI). Cette étude visait à élucider l'impact des DRH sur le microenvironnement tumoral (MET) à différentes échelles, en s'appuyant sur des données provenant de séquençages RNA à cellule unique, spatiaux et en vrac. De plus, l'enquête cherchait à construire des modèles prédictifs pour la réponse au traitement basés sur les caractéristiques du MET, en utilisant des algorithmes d'apprentissage automatique à travers 11 cohortes de traitement par IPCI.
Des séquençages d'ARN unicellulaires, spatiaux et en vrac ont été collectés pour explorer le rôle de l'HRD dans le développement du TME à plusieurs échelles. (Kang et al., 2023)
Principales conclusions
la dominance des myCAFs dans le TME : Au sein des loci étiquetés comme fibroblastes associés au cancer (CAFs), les myCAFs ont montré des scores d'enrichissement nettement plus élevés, en accord avec leur présence prédominante dans le TME des échantillons non-HRD.
Validation de la corrélation entre DPP4 et myCAFs : Les scores d'enrichissement des myCAFs aux loci DPP4+ étaient significativement plus élevés que ceux aux loci DPP4-, corroborant l'association entre l'expression de DPP4 et l'abondance des myCAFs à des échelles spatiales. De plus, DPP4 a montré une corrélation plus forte avec les myCAFs par rapport aux iCAFs, indiquant sa pertinence potentielle dans la dynamique du TME.
Ces résultats soulignent l'interaction complexe entre les DRH, la composition du TME et la réponse au traitement dans le TNBC. L'intégration des données de séquençage RNA à cellule unique, spatial et en vrac, associée à des modèles prédictifs basés sur l'apprentissage automatique, offre de nouvelles perspectives sur les bases moléculaires de la pathogénèse du TNBC et des résultats thérapeutiques.
Références :