Conception de panneau spatial ciblé pour Xenium et CosMx : Un guide pratique de sélection de gènes à partir de données de référence unicellulaires
Pourquoi la conception de panneaux mérite son propre flux de travail
La plupart des conversations autour de transcriptomique spatiale ciblée par défaut aux spécifications de la plateforme. Quel instrument offre une résolution plus élevée ? La chimie préserve-t-elle mieux l'ARN sous différentes conditions de fixation ? Ce sont des points de départ raisonnables, mais ils passent à côté d'un goulot d'étranglement plus conséquent : une fois la plateforme choisie, vous devez encore décider quels 300 à 5 000 gènes composeront votre panneau personnalisé.
La qualité de cette décision est souvent la différence entre un ensemble de données qui résout clairement chaque type de cellule attendu et un autre qui vous laisse vous demander si un signal manquant est une véritable biologie ou un défaut de conception. Imaginez concevoir un panel de 400 gènes pour une étude sur le glioblastome, seulement pour découvrir après le premier pilote que vos trois principaux marqueurs de microglie sont indétectables parce que leurs transcrits sont plus courts que la longueur de sonde requise, et que vos sondes de contrôle négatif sont indiscernables des gènes de ménage. Ce n'est pas un problème de plateforme — c'est un problème de conception de panel. Et c'est bien plus courant que la plupart des chercheurs ne s'y attendent.
Un panel bien structuré, même avec une fraction des gènes disponibles sur une plateforme de transcriptome complet, peut générer des données spatiales ciblées et de haute confiance à travers des centaines d'échantillons. La différence réside dans un processus de sélection systématique : préparer correctement vos données de référence, organiser les gènes en couches fonctionnelles avec des critères de sélection clairs, tester sur des sections pilotes et itérer avant de s'engager sur une cohorte complète.
Pour la plupart des groupes de recherche, de haute qualité séquençage d'ARN à cellule unique Les données de référence sont déjà disponibles, soit à partir du même tissu, soit à partir d'atlas publics. Le défi consiste à traduire ces données d'expression en une liste de gènes compatible avec la plateforme, sans sacrifier la résolution biologique au profit d'une limite de nombre de gènes.
Figure 1 : Entonnoir d'attribution des gènes. Une illustration de funnel en trois dimensions montrant le processus de filtrage progressif du transcriptome entier (~20 000 gènes) à travers le filtrage scRNA-seq, la sélection de candidats marqueurs et la conception de panneaux jusqu'au panneau spatial final. Chaque étape de rétrécissement représente une décision clé de filtrage qui élimine les gènes peu susceptibles de bien fonctionner sur les plateformes spatiales ciblées.
Commencer avec une référence solide en scRNA-seq
L'exactitude de votre panel dépend directement de la qualité de vos données de départ. Plateformes spatiales ciblées peut mesurer seulement une fraction du transcriptome, donc chaque emplacement de gène doit mériter sa place par des preuves claires. Un panneau conçu à partir de données de cellules uniques bruyantes ou mal annotées propagera ces erreurs dans l'expérience spatiale.
Lorsque vous avez vos propres données de scRNA-seq
Les données unicellulaires appariées ou de tissus adjacents provenant du même système biologique constituent la norme d'excellence. Vos annotations de regroupement existantes et vos listes de gènes exprimés de manière différentielle ont déjà été validées par des pipelines d'analyse indépendants, ce qui signifie qu'elles comportent moins d'incertitudes que les données empruntées à des sources externes.
Avant d'utiliser ces données pour la conception du panneau, trois étapes de préparation sont essentielles.
Tout d'abord, travaillez à partir d'une matrice d'expression normalisée plutôt que de comptes bruts. Les comptes bruts reflètent la variation de profondeur de séquençage d'une cellule à l'autre, ce qui peut fausser le classement des gènes marqueurs. Un gène qui semble être un marqueur de premier plan simplement parce que son type cellulaire a été séquencé plus profondément est un faux positif pour les objectifs de conception de panneaux. Les méthodes de normalisation telles que CPM, SCTransform ou l'approche de déconvolution de scran éliminent cette variation technique et révèlent les motifs d'expression biologique qui importent.
Deuxièmement, vérifiez que vos annotations de types cellulaires sont stables. Les clusters définis à faible résolution ou validés par seulement quelques marqueurs peuvent propager des erreurs de classification dans le panneau. Un rapide contrôle croisé avec l'expression de marqueurs canoniques — soit dans vos propres données, soit par rapport à des atlas publiés — permet de détecter la dérive des annotations avant qu'elle n'affecte la sélection des gènes. Si un cluster change d'identité après un reclassement à une résolution plus élevée, les marqueurs dérivés de ce cluster ne sont pas fiables.
Troisièmement, établissez une liste de gènes candidats qui filtre à la fois sur la spécificité et l'abondance d'expression. Un gène qui est parfaitement spécifique à un type cellulaire rare mais exprimé à seulement un transcript par cellule dans le scRNA-seq est peu susceptible de produire un signal détectable sur une plateforme spatiale ciblée, où la sensibilité par gène est intrinsèquement plus faible que séquençage du transcriptome completFixer un seuil d'expression moyenne minimum — généralement le 25e percentile de tous les gènes détectés — élimine ces candidats à faible rendement dès le début du processus.
Quand vous devez utiliser des données publiques
Pour les projets sans données scRNA-seq correspondantes — une situation courante dans les cohortes cliniques FFPE, les modèles de maladies rares ou les organismes non-modèles — les ressources publiques peuvent combler le vide. Plusieurs atlas curés couvrent désormais les principaux tissus humains et murins avec une résolution suffisante pour la conception de panneaux :
Tabula Sapiens fournit des transcriptomes unicellulaires provenant de 24 types de tissus humains issus de donneurs individuels, préservant la comparabilité entre tissus appariés aux donneurs.
Le Programme Atlas BioMoléculaire Humain (HuBMAP) propose des données de cellules uniques spatialement enregistrées avec des métadonnées anatomiques détaillées, ce qui le rend particulièrement utile pour les projets qui nécessitent à la fois des informations sur les types cellulaires et un contexte spatial dès le départ.
L'Atlas cérébral d'Allen et ses dérivés couvrent à la fois le cerveau humain et le cerveau de la souris à une résolution fine des types cellulaires, y compris les sous-types de neurones inhibiteurs et excitatoires qui sont difficiles à distinguer avec des marqueurs génériques.
Pour des recherches de marqueurs plus simples, des bases de données comme CellMarker 2.0 et PanglaoDB compilent des marqueurs de types cellulaires publiés dans des centaines de contextes de tissus et de maladies. Celles-ci sont utiles pour la nomination initiale de candidats, mais doivent être croisées avec au moins une source supplémentaire, car la spécificité des marqueurs peut varier en fonction de l'état de la maladie, de la méthode de traitement des tissus et de la chimie de la plateforme.
L'architecture à quatre couches du panneau
Une erreur courante dans la conception de panneaux est de traiter la liste des gènes comme une collection plate de candidats intéressants. Une approche plus robuste consiste à organiser les gènes en quatre couches fonctionnelles, chacune ayant un but distinct et sa propre logique de sélection. Organiser les gènes en ces quatre couches transforme la conception du panneau d'un exercice réactif de remplissage d'emplacements en un processus proactif et basé sur des hypothèses. Voici comment chaque couche devrait être construite.
Couche 1 : Marqueurs de type cellulaire — La fondation non négociable
Chaque type cellulaire attendu dans votre tissu devrait être représenté par au moins trois à cinq gènes marqueurs bien validés. Ces marqueurs constituent la colonne vertébrale du panel car ils déterminent si le interprétation des données spatiales peut être fondé sur la composition des types cellulaires, qui est le point de départ pour la plupart des analyses en aval.
Les critères de sélection pour les marqueurs de couche 1 comprennent trois vérifications.
Spécificité à travers des sources indépendantes. Un gène qui apparaît comme un marqueur principal dans vos données de scRNA-seq mais qui n'est pas rapporté dans CellMarker 2.0 ou PanglaoDB pour le même tissu doit être traité avec précaution. Idéalement, chaque marqueur doit être confirmé dans au moins deux ensembles de données indépendants avant d'être intégré au panel. Un marqueur qui échoue à cette vérification de validation croisée s'avère souvent spécifique à l'ensemble de données plutôt que biologiquement universel.
Détection cohérente. Les gènes figurant parmi les 200 transcrits les plus abondants dans votre référence ont une forte probabilité de produire un signal spatial robuste. Les marqueurs dans la moitié inférieure de la distribution d'expression présentent un risque plus élevé d'échec sur la plateforme spatiale, où la sensibilité par gène est inférieure à celle du séquençage du transcriptome complet. Si un marqueur se classe haut par changement relatif mais bas par expression absolue, envisagez d'ajouter une sauvegarde.
Confirmation orthogonale. Si des images d'immunohistochimie ou de RNAscope publiées confirment le schéma spatial attendu pour un marqueur candidat, cela constitue une preuve solide. Pour les candidats sans données de validation spatiale, envisagez de les ajouter à un panel pilote plutôt que de les engager dans la liste finale des gènes. Les données pilotes révéleront rapidement si le marqueur produit la distribution spatiale attendue.
Pour un tissu typique avec huit à douze types de cellules attendus, la Couche 1 nécessite environ 30 à 60 gènes. Dans une étude sur les tumeurs où les macrophages, les monocytes et les cellules dendritiques doivent tous être distingués, la Couche 1 peut nécessiter huit à dix marqueurs rien que pour le compartiment myéloïde. Le principe clé est de couvrir tous les types de cellules attendus avec redondance, et non de maximiser le nombre de marqueurs par type de cellule.
Couche 2 : Marqueurs d'état et fonctionnels
Au-delà de l'identification des types cellulaires, la plupart des études spatiales visent à capturer des processus biologiques — activation immunitaire, reprogrammation métabolique, réponse hypoxique ou signalisation développementale. Les gènes de la couche 2 couvrent ces dimensions fonctionnelles.
La composition exacte de la couche 2 dépend de votre étude. Pour un projet sur le microenvironnement tumoral, les marqueurs pertinents pourraient inclure des gènes de réponse à l'interféron-gamma (IFNG, STAT1, IRF1), des marqueurs d'épuisement des cellules T (PDCD1, LAG3, TOX) et des facteurs d'hypoxie-inductibles (HIF1A, VEGFA). Pour une étude sur la neurodégénérescence, la liste se déplace vers des enzymes de traitement de l'amyloïde (BACE1, PSEN1), des protéines synaptiques (SYN1, DLG4) et des marqueurs de réactivité des astrocytes (GFAP, VIM).
Une directive pratique d'allocation consiste à réserver environ un tiers de votre budget génétique total pour la couche 2. Ajustez le ratio en fonction de votre objectif principal : une répartition de 70:30 pour les projets de cartographie des types cellulaires, ou 50:50 pour les études axées sur les mécanismes. L'essentiel est de décider du ratio avant le début de la sélection, plutôt que d'adapter des marqueurs fonctionnels dans les emplacements restants après le choix des marqueurs de type cellulaire.
Couche 3 : Contrôles techniques — L'essentiel le plus négligé
Les contrôles positifs devraient inclure deux à trois gènes de référence — GAPDH, ACTB et B2M sont des choix standards — qui sont exprimés de manière cohérente dans tous les types cellulaires attendus. Ces contrôles remplissent trois fonctions : ils confirment que la section de tissu contient de l'ARN détectable, ils fournissent une référence inter-échantillons pour normaliser l'intensité du signal, et ils signalent les échantillons présentant une dégradation généralisée de l'ARN lorsque leur signal tombe en dessous d'une plage attendue.
Les contrôles négatifs devraient inclure cinq à dix séquences de sondes non ciblantes conçues pour ne pas s'hybrider à aucun transcript connu dans l'espèce. Ces sondes quantifient l'autofluorescence de fond et la liaison non spécifique. Sans elles, tout signal spatialement structuré pourrait être une véritable biologie ou un artefact de coloration. Le coût en gènes des contrôles négatifs est négligeable — typiquement cinq à dix sondes sur plusieurs centaines ou milliers — mais leur valeur pour l'interprétation des données est énorme.
Couche 4 : Réserver des créneaux
Aucun panneau ne survit au premier contact avec un tissu réel sans changement. Réservez cinq à dix pour cent de votre budget génétique pour des marqueurs identifiés lors des tests pilotes. Cela peut inclure des remplacements pour les marqueurs de la couche 1 qui n'ont pas réussi à produire un signal, des cibles génétiques nouvellement publiées dans votre domaine, ou des gènes qui se sont révélés de manière inattendue informatifs à partir des données pilotes.
Une approche pratique consiste à remplir la couche 4 avec des candidats de remplacement lors de la synthèse des sondes, puis à mettre à jour la composition avant de commander les sondes pour la cohorte principale. Intégrer ce tampon dans la conception initiale évite le scénario coûteux de découvrir un écart critique après que la synthèse des sondes soit terminée.
Figure 2 : Architecture de panneau à quatre couches — Anneaux concentriques. Un diagramme en coupe montrant quatre anneaux imbriqués représentant les couches fonctionnelles d'un panneau spatial ciblé. L'anneau le plus intérieur (Marqueurs de type cellulaire) forme le noyau, entouré par des marqueurs d'état et fonctionnels, des contrôles techniques, et un anneau extérieur de slots de réserve avec une bordure en pointillés indiquant la flexibilité. Chaque couche est codée par couleur et étiquetée avec son allocation budgétaire génétique recommandée.
Maximiser la résolution dans un budget génétique fixe
Chaque plateforme spatiale ciblée impose une limite supérieure stricte sur le nombre de gènes pouvant être mesurés simultanément. Avec Xenium supportant jusqu'à 5 000 et CosMx jusqu'à 6 000, chaque choix de gène rivalise pour une place finie. Maximiser la résolution biologique dans ces limites nécessite deux stratégies : éliminer la redondance et concevoir des marqueurs de secours pour les types cellulaires critiques.
Éviter la redondance des familles de gènes
Un problème souvent négligé est l'inclusion de plusieurs membres de la même famille de gènes qui portent des informations spatiales presque identiques. Plusieurs gènes d'histones, des paralogues HLA ou des membres de la famille des kératines peuvent montrer des motifs d'expression hautement corrélés entre les types cellulaires. Les inclure tous consomme des emplacements sans ajouter de valeur biologique.
Une analyse de corrélation rapide sur vos données de référence scRNA-seq peut identifier ces candidats redondants. Lorsque deux gènes présentent une corrélation de Pearson supérieure à 0,9 entre les types cellulaires, il suffit généralement de conserver celui ayant une expression plus élevée ou une annotation spatiale plus spécifique. Cette seule étape peut récupérer de 5 à 15 % de votre budget génétique pour des marqueurs plus informatifs.
Stratégie de Marque de Sauvegarde
Pour les types de cellules qui sont critiques pour votre étude, désignez deux marqueurs de secours en plus du marqueur principal. Si le marqueur principal échoue en raison de la dégradation de l'ARN, d'une faible expression dans une région tissulaire spécifique ou de limitations de conception de sonde, le marqueur de secours garantit que le type cellulaire reste détectable.
Cette redondance est particulièrement importante pour les échantillons FFPE, où la fragmentation de l'ARN peut réduire l'efficacité de détection pour des sondes plus longues. Un marqueur avec une longueur de transcript inférieure à 2 kilobases est plus susceptible de survivre au traitement FFPE qu'un marqueur dépassant 3 kilobases.
Figure 4 : Budget génétique de la plateforme vs. graphique radar de résolution. Un graphique radar comparant Xenium, CosMx et GeoMx sur cinq axes de performance : budget génétique, résolution spatiale, compatibilité FFPE, débit et complexité d'analyse. Le graphique permet une comparaison visuelle directe des compromis entre les plateformes pour les projets de conception de panneaux ciblés.
Quand une course de découverte a du sens d'abord
Pour les types de tissus avec des données de référence spatiale limitées, une plateforme spatiale de transcriptome complet telle que Visium ou Visium HD peut servir de puissant précurseur à conception de panneau cibléLa couverture complète du transcriptome offre une vue impartiale de l'expression génique à travers les régions tissulaires, révélant des gradients spatiaux et des enrichissements régionaux que les données unicellulaires à elles seules peuvent ne pas capturer.
Ce flux de travail en cascade — phase de découverte Visium, suivie de panneau ciblé l'optimisation, suivie d'un profilage Xenium ou CosMx sur de grandes cohortes — est particulièrement efficace pour trois scénarios.
- Modèles de maladies novateurs ou tissus ingénierés où les motifs d'expression spatiale n'ont pas été décrits et les marqueurs publiés sont peu fiables. Dans ces contextes, tenter de concevoir un panel ciblé uniquement à partir des données de scRNA-seq risque de manquer des gènes spatialement informatifs qui ne deviennent apparents que dans le contexte tissulaire.
- Des études de grande cohorte où le coût de l'exécution de 100 à 200 échantillons sur une plateforme ciblée n'est justifié qu'après validation du jeu de gènes sur un plus petit ensemble de découverte. Un projet pilote Visium sur 4 à 6 sections coûte généralement une fraction d'une cohorte ciblée complète et peut éviter la dépense beaucoup plus importante de découvrir un mauvais choix de marqueurs au milieu du traitement des échantillons.
- Des projets qui combinent découverte et validation au sein d'un seul budget de subvention, où l'investissement initial dans Visium réduit le risque de choisir les mauvais gènes pour la phase ciblée. La décision d'inclure une phase de découverte doit être prise avant le début de la conception du panel, et non après un premier essai ciblé infructueux.
Un exemple concret : un chercheur étudiant l'infiltration immunitaire dans un modèle de cancer du pancréas transgénique sans données spatiales publiées réalise deux sections Visium HD et identifie 150 gènes enrichis régionalement absents de toute base de données publique. Ces 150 gènes deviennent le cœur d'un panneau Xenium personnalisé appliqué à 80 souris. Sans la phase de découverte, ces gènes informatifs sur le plan spatial n'auraient jamais été inclus.
Figure 3 : Flux de travail Visium vers Xenium. Un pipeline horizontal en trois étapes montrant le flux de travail séquentiel depuis la découverte du transcriptome complet Visium, à travers la conception et l'optimisation du panel, jusqu'au profilage ciblé Xenium de l'ensemble de la cohorte. Chaque étape est annotée avec des numéros d'échantillons et des points de décision clés, illustrant comment les résultats de la phase de découverte informent directement la composition du panel ciblé.
Choisir entre des panneaux préconçus et des panneaux sur mesure
Xenium et CosMx proposent tous deux des panneaux préconçus couvrant des types de tissus courants. Les panneaux Multi-Tissue et Human Brain de Xenium incluent de 250 à 500 gènes. Les panneaux de caractérisation cellulaire universels de CosMx servent un objectif similaire.
Les panneaux préconçus sont pratiques et validés sur plusieurs types de tissus. Leur limitation réside dans la largeur plutôt que dans la profondeur. Si votre étude cible une voie spécifique ou un mécanisme de maladie sous-représenté dans l'ensemble préconçu, un conception de panneau personnalisé fournira des données plus pertinentes.
Un chemin intermédiaire rentable : utiliser un panneau pré-conçu pour la caractérisation de faisabilité initiale, puis concevoir un panneau sur mesure pour la cohorte principale en fonction des résultats. Cette approche en deux phases garantit que le panneau sur mesure cible uniquement les gènes qui comptent pour votre question spécifique, tandis que le panneau pré-conçu réduit les risques de la phase de découverte.
Une considération supplémentaire est le cycle de mise à jour. Les panneaux préconçus sont mis à jour périodiquement par le fabricant — les nouvelles versions peuvent inclure des conceptions de sondes améliorées ou une couverture génétique élargie. Si le calendrier de votre étude couvre plusieurs versions de panneaux, tenez compte du coût de la revalidation lors du passage entre les itérations préconçues. Les panneaux personnalisés, une fois validés, restent stables tout au long du projet, ce qui simplifie la comparaison des données longitudinales.
Validation de votre panneau avant l'extension
Réaliser un essai sur une ou deux sections de tissu représentatives est le meilleur investissement en termes de retour dans le processus de conception du panel. Aucun montant d'analyse in silico ne peut prédire comment chaque gène se comportera sur un tissu fixé selon votre protocole spécifique. Un essai pilote unique coûte généralement une fraction d'un expérience de cohorte complète et peut éviter le coût beaucoup plus élevé de découvrir, après que tous les échantillons ont été traités, qu'un type cellulaire clé n'a jamais été détecté.
Métriques de QC pilote
Après le pilote, évaluez trois indicateurs.
- Taux de détection des gènes. Quelle fraction des gènes du panel produit un signal au-dessus du seuil de contrôle négatif ? Un taux inférieur à 70 % indique une mauvaise performance des sondes, une faible abondance de transcrits ou une qualité d'ARN inadéquate.
- Qualité de la segmentation cellulaire. Les tissus denses, les régions riches en lipides et les échantillons autofluorescents peuvent dégrader la précision de la segmentation. Inspectez manuellement les limites à travers plusieurs régions tissulaires.
- Rapport signal-sur-fond. Divisez l'intensité moyenne du contrôle positif par l'intensité moyenne du contrôle négatif. Un rapport inférieur à trois suggère que le test ne distingue pas le signal réel du fond.
Arbre de Décision Pilote
Trois résultats sont possibles après le pilote.
- Procéder. Tous les types de cellules détectables, taux de détection supérieur à 70 %, contrôles dans la plage. Le panneau est prêt pour le cohorte complète.
- Réviser et relancer. Types de cellules manquants ou mauvaise détection dans des régions spécifiques. Remplacer les marqueurs défaillants et effectuer un second essai.
- Réévaluez. Si la qualité de l'ARN ou la compatibilité de la plateforme est fondamentalement limitante, reconsidérez la préparation des échantillons ou le choix de la plateforme avant d'investir davantage.
Figure 5 : Arbre de décision du pilote. Un organigramme décisionnel vertical avec trois résultats terminaux : procéder à la cohorte complète, réviser et relancer, ou réévaluer la plateforme ou la préparation de l'échantillon. Chaque branche est déclenchée par un résultat de contrôle qualité spécifique : taux de détection supérieur ou inférieur à 70 pour cent, segmentation cellulaire réussie ou échouée, et rapport signal sur bruit supérieur ou inférieur à trois.
Conception de panneau sans données scRNA-seq
Lorsque aucune référence de cellule unique n'est disponible, la conception du panneau devient plus difficile mais pas impossible.
- Catalogues de marqueurs publics. PanglaoDB et CellMarker 2.0 fournissent des listes soigneusement sélectionnées croisées entre les études.
- Curation basée sur la littérature. Exploitez les données de RNA-seq ou de protéomique en vrac publiées pour identifier des marqueurs candidats dans votre tissu.
- Stratégie de pilote à petit panel. Commencez avec 30 à 50 gènes définissant la lignée, pilotez sur une section, évaluez la détectabilité et élargissez de manière itérative. Plus lent mais réduit le risque de s'engager dans un grand ensemble de gènes non testé.
Figure 6 : Comparaison des sources de données — Trois voies pour la conception du panneau. Un agencement de comparaison à trois colonnes montrant la qualité des données, l'effort de préparation et les scénarios d'utilisation optimale pour chacune des trois sources de données de référence : données scRNA-seq appariées, données d'atlas publiques et scénarios sans données de référence à cellule unique.
Erreurs courantes dans la conception de panneaux
Tous les marqueurs d'un seul cluster de référence. Une liste de gènes dérivée entièrement d'un seul cluster scRNA-seq risque de présenter un biais spatial — ce cluster peut refléter un artefact de dissociation ou une sous-population rare non représentative de l'ensemble du tissu. Croisez les marqueurs avec au moins deux sources indépendantes, de préférence l'une provenant d'un laboratoire ou d'une plateforme différente.
Gènes peu exprimés dans le panel. Un fort changement relatif mais un faible nombre absolu équivaut à un signal spatial faible. Remplacez tout marqueur en dessous du 25e percentile d'expression dans vos données de référence par une alternative plus abondante. Une solution courante consiste à vérifier si le gène a été détecté avec succès par RNAscope ou smFISH dans le même type de tissu — des données de détection positives sont un indicateur fort de la compatibilité avec la plateforme spatiale.
Ignorer les contraintes FFPE. FFPE réduit l'efficacité de détection pour les transcrits plus longs. Priorisez les transcrits de moins de 2 kb et incluez des contrôles supplémentaires de housekeeping. Un marqueur qui fonctionne bien dans les tissus congelés frais peut échouer complètement dans les FFPE. Lors de la planification pour FFPE, effectuez une prédiction rapide de la performance des sondes en utilisant le pipeline de conception du fabricant avant de vous engager dans la composition finale du panel.
Sauter les contrôles négatifs. Sans eux, chaque signal pourrait être de l'autofluorescence ou un lien non spécifique. Non négociable.
Surplombant le transfert de bioinformatiqueLa liste de gènes que vous concevez doit être compatible avec le pipeline d'analyse qui traitera les données spatiales. Si votre panel inclut des gènes avec des annotations ambiguës, des coordonnées génomiques qui se chevauchent ou des variants d'épissage mal caractérisés, ils peuvent être filtrés lors de l'alignement ou de la quantification, gaspillant ainsi ces emplacements. Vérifiez les identifiants de gènes par rapport à l'annotation du génome de référence de la plateforme avant de finaliser le panel.
Traiter la conception du panneau comme un exercice en une seule passe. L'erreur la plus coûteuse. Toujours inclure une phase pilote avec une porte de décision claire avant de s'engager sur un grand groupe. Un essai pilote de deux semaines peut faire économiser des mois de retravail sur un expérience ratée de 200 échantillons.
Comment CD Genomics soutient la conception de panneaux ciblés
La conception d'un panel spatial ciblé implique plusieurs étapes spécialisées : analyse des données scRNA-seq, sélection de gènes marqueurs, conception de sondes spécifiques à la plateforme, exécution pilote et contrôle qualité itératif. Chaque étape comporte ses propres modes de défaillance : un identifiant de gène mal spécifié, une corrélation négligée entre deux membres de la famille, une section FFPE non testée — qui peuvent dégrader silencieusement l'ensemble de données final.
CD Genomics offre un support complet tout au long de ce flux de travail, depuis le traitement des données de référence et la stratification des gènes jusqu'à la coordination des sondes personnalisées, les tests pilotes et transcriptomique spatiale à cohorte complèteQue vous commenciez avec vos propres données de cellules uniques, que vous travailliez à partir d'atlas publics ou que vous construisiez un panel à partir de marqueurs publiés, notre équipe peut vous aider à traduire votre question de recherche en un ensemble de gènes ciblé et rentable qui préserve la résolution des types cellulaires et le signal biologique. Contactez notre équipe pour discuter de votre projet de conception de panel, des exigences en matière de données de référence et de la stratégie pilote — nous pouvons vous aider à passer d'une liste de gènes à un panel spatial validé dans un flux de travail structuré et reproductible.
FAQ
Q1 : Je n'ai que des données Visium, pas de scRNA-seq. Puis-je quand même concevoir un panneau Xenium ?
Oui. Les données de transcriptome complet Visium peuvent remplacer le scRNA-seq à condition que les spots approchent une résolution de type cellulaire. Pour des spots plus grands, des outils comme cell2location ou RCTD estiment les proportions de types cellulaires et guident la sélection des marqueurs.
Q2 : Quelle est la principale différence entre les flux de conception de panneaux Xenium et CosMx ?
Les principes de conception sont similaires, mais les limites de taille des panneaux et la chimie des sondes diffèrent. Xenium prend en charge jusqu'à 5 000 gènes avec des sondes in situ fixes. CosMx prend en charge jusqu'à 6 000 avec une chimie modulaire. L'architecture à quatre couches s'applique aux deux.
Q3 : Quel ratio de marqueurs de type cellulaire à des marqueurs de voie recommandez-vous ?
60:40 pour les études de découverte ; 40:60 pour les projets axés sur les mécanismes. Les contrôles techniques sont séparés.
Q4 : Puis-je ajouter des gènes après la synthèse de la sonde ?
Oui, mais la commande de sondes supplémentaires entraîne des coûts et des délais supplémentaires. La stratégie de réserve de niveau 4 minimise les ajouts en cours de projet.
Q5 : Le tissu FFPE nécessite-t-il un design de panneau spécial ?
Oui. La fragmentation FFPE réduit l'efficacité de détection des transcrits plus longs. Priorisez les gènes plus courts, incluez des contrôles supplémentaires et réalisez toujours un essai avant de passer à l'échelle.
Q6 : Comment savoir si mon panneau est prêt avant de lancer l'expérience complète ?
La phase pilote est conçue pour répondre à cela. Si votre taux de détection des gènes dépasse 70 %, que votre rapport signal sur bruit est supérieur à trois et que tous les types cellulaires attendus sont identifiables dans les données pilotes, votre panel est prêt pour la cohorte complète. Si l'un de ces critères n'est pas respecté, utilisez l'arbre de décision dans la section de validation pour déterminer s'il faut réviser le panel ou réévaluer le choix de la plateforme.
Références
- Milholland B, et al. Sélection de panneaux géniques pour la transcriptomique spatiale ciblée. Genome Biol. 2024;25:31. doi : 10.1186/s13059-024-03174-1
- Van den Berge K, et al. Spapros : sélection de jeux de sondes pour la transcriptomique spatiale ciblée. Nat Methods. 2024 ; 21 : 2260-2270. doi : 10.1038/s41592-024-02496-z
- Tian L, et al. Sélection de gènes prédictive et robuste pour la transcriptomique spatiale. Nat Commun. 2023;14:2091. doi : 10.1038/s41467-023-37392-1
- Janesick A, et al. Évaluation systématique des plateformes d'imagerie de transcriptomique spatiale dans les tissus FFPE. Nat Commun. 2025 ; 16 : 64990. doi : 10.1038/s41467-025-64990-y
Services connexes
- Service de séquençage transcriptomique spatial 10x
- RNA-Seq
- Service de séquençage de panneaux génétiques
- Service Multi-Omique
- Séquençage de région ciblée
- Séquençage de l'exome entier
- Séquençage de Transcriptions Complètes (Iso-Seq)
- Service de séquençage CUT&Tag
- Séquençage de l'ARN bactérien
- Séquençage des petits ARN
Les applications décrites sont réservées à des fins de recherche uniquement. Non destinées à être utilisées dans des procédures de diagnostic. (RUO)