Identification des états cellulaires liés à la maladie par séquençage à cellule unique
Ces dernières années, des avancées technologiques en génomique unicellulaire et spatiale ont ouvert de nouvelles voies pour les études de cartographie cellulaire et tissulaire en santé et en maladie. L'identification précise des états cellulaires dans les maladies à l'aide de la génomique unicellulaire peut fournir des informations sur la pathogénèse, les biomarqueurs et les cibles médicamenteuses potentielles. L'approche standard pour identifier les états cellulaires implique l'analyse combinée des données de séquençage d'ARN unicellulaire (scRNA-seq) provenant de tissus malades et de tissus de référence sains. Parmi celles-ci, la sélection des ensembles de données de référence sains est cruciale.
Actuellement, le Consortium Human Cell Atlas a réalisé des analyses à grande échelle d'échantillons sains et a publié des ensembles de données unifiés à grande échelle ou des ensembles de données d'atlas provenant de plusieurs organes, mais les caractéristiques des échantillons inclus dans cet atlas peuvent être très différentes de celles des échantillons dans les cohortes de maladies. La collecte d'échantillons de contrôle provenant de tissus sains qui correspondent à des échantillons de maladies avec des caractéristiques démographiques et cliniques similaires peut réduire considérablement les erreurs d'information dues à des facteurs de confusion.
L'équipe de recherche a évalué comment le choix de l'atlas de référence à cellule unique affecte l'identification des changements d'état cellulaire à partir des données scRNA-seq d'échantillons de maladie. En utilisant des données de transcriptome à cellule unique disponibles publiquement, un atlas de référence à cellule unique provenant d'individus en bonne santé a été créé, confirmant que l'utilisation de l'atlas pour l'apprentissage de l'espace latent (LST) et l'analyse de différence-en-différence des témoins appariés identifie mieux les cellules associées à la maladie, en particulier plusieurs types cellulaires perturbés. Cette étude fournit des orientations pour la conception d'études de cohortes de maladies et l'optimisation de l'utilisation des atlases cellulaires.
Utilisation de jeux de données de référence sains pour découvrir des états cellulaires associés à des maladies. (Dann et al., 2023)
Interféron (IFN) chez les patients atteints de COVID-19 Détection de l'état de stimulation
L'équipe de recherche a utilisé des ensembles de données scRNA-seq disponibles publiquement provenant de 90 patients atteints de COVID-19 et de 23 PBMC de donneurs sains ; et a sélectionné des profils scRNA-seq de 1 219 individus en bonne santé issus de 12 études comme ensemble de données de référence ; l'intégration potentiellement réalisée en utilisant des profils de PBMC sains (design ACR) a été comparée à un ensemble de données de référence utilisant uniquement des données COVID-19 et un ensemble de données de contrôle avec une intégration combinée (design CR) a été comparée à un ensemble de données de contrôle. Pour quantifier la capacité des différents designs à identifier des états associés à la maladie, l'équipe a examiné les cellules exprimant des gènes liés à la voie de signalisation de l'interféron (IFN), une voie clé de réponse antivirale et un marqueur reconnu pour le COVID-19.
En intégrant les données de la cohorte COVID-19 et de l'atlas cellulaire PBMC, l'équipe a constaté que l'utilisation d'un design ACR permettait une identification plus sensible des états cellulaires pathologiques transitoires et hétérogènes. Au sein du jeu de données COVID-19, l'équipe a capturé le statut IFNhi de différents types de cellules immunitaires, ainsi que subdivisé des sous-populations de monocytes CD14+ dysfonctionnels qui corrélaient avec la gravité de la maladie.
Détection des états cellulaires associés à la COVID-19 dans une cohorte cas-témoin avec un atlas sain. (Dann et al., 2023)
Détection de l'état cellulaire anormal dans la fibrose pulmonaire
Pour évaluer les avantages de l'utilisation conjointe des profils unicellulaires et des ensembles de données de contrôle dans d'autres contextes biologiques, l'équipe de recherche a analysé des ensembles de données scRNA-seq provenant d'échantillons de tissu pulmonaire de 32 patients atteints de fibrose pulmonaire idiopathique (FPI) et a étudié l'état de la maladie de la fibrose pulmonaire en utilisant des profils unicellulaires de tissu pulmonaire sain. L'étude a inclus des données provenant de 28 donneurs de contrôle et de 18 patients atteints de maladie pulmonaire obstructive chronique (MPOC), et l'ensemble de données principal de l'Atlas des cellules pulmonaires humaines (HLCA) a été sélectionné comme ensemble de données de référence.
L'équipe de recherche a utilisé un design ACR pour analyser les données des patients atteints de FPI et a identifié deux états cellulaires basaux anormaux rares associés à la maladie, les cellules basales KRT5-KRT17+ et les cellules basales KRT5+KRT17hi. Les cellules ci-dessus ont été caractérisées séparément pour identifier davantage les gènes exprimés différemment (DEGs) qui étaient exprimés différemment dans l'état basaloïde anormal et surexprimés par rapport aux cellules basales normales. Un total de 981 DEGs significatifs a été identifié, y compris 6 marqueurs de cellules basales anormales KRT17hi et 35 marqueurs de cellules basales décrits précédemment, améliorant la compréhension du phénotype des cellules basaloïdes dans la FPI.
Détection des états cellulaires associés à la FPI. (Dann et al., 2023)
Référence:
- Dann, Emma, et al. "Identification précise des états cellulaires modifiés dans la maladie à l'aide de références de cellules uniques saines." Nature Génétique (2023) : 1-11.