Service de séquençage d'isoformes à cellule unique
Le séquençage d'isoformes à cellule unique transforme le domaine de transcriptomique en fournissant des informations sans précédent sur l'expression et la régulation des gènes à la résolution unicellulaire. Cette approche sophistiquée est indispensable pour élucider des processus biologiques complexes et des mécanismes de maladie qui sont souvent obscurcis par le séquençage d'ARN en vrac traditionnel.
CD Genomics est à la pointe de cette innovation en offrant des services de séquençage d'isoformes à cellule unique de pointe. Grâce à l'utilisation de technologies avancées telles que le PacBio MAS-Seq, CD Genomics obtient des données d'isoformes complètes et à haute résolution, faisant ainsi progresser notre compréhension de l'hétérogénéité cellulaire et de la complexité moléculaire.
Qu'est-ce que le séquençage des isoformes à cellule unique ?
Le séquençage d'isoformes à cellule unique (scIso-Seq) se présente comme une technique robuste pour disséquer le transcriptome des cellules individuelles, révélant ainsi les nuances complexes de l'expression génique et des variations d'épissage qui sous-tendent la diversité et la fonction cellulaires. Contrairement au séquençage d'ARN conventionnel, qui agrège les profils d'expression génique d'une population de cellules, le scIso-Seq préserve l'hétérogénéité entre les cellules individuelles. Cette méthode facilite l'identification d'isoformes uniques et de variants d'épissage potentiellement cruciaux pour la santé et la maladie, offrant des perspectives plus approfondies sur les bases moléculaires des processus biologiques.
Importance du séquençage des isoformes à cellule unique
La complexité du transcriptome, définie par divers événements d'épissage et isoformes, influence de manière significative le comportement et la fonction cellulaires. Les méthodes de séquençage à lecture courte traditionnelles sont souvent insuffisantes pour résoudre ces complexités en raison de leur incapacité à capturer des transcrits de pleine longueur. En revanche, le scIso-Seq offre une vue d'ensemble du transcript entier, du site de début de transcription 5' à la queue poly-A 3', révélant des informations cruciales sur l'utilisation des exons, les jonctions d'épissage et les régions non traduites (UTR). Ce niveau de détail est essentiel pour une annotation génétique précise, la compréhension des mécanismes régulateurs et l'identification de nouvelles cibles thérapeutiques.
PacBio MAS-Seq pour le séquençage des isoformes à cellule unique
Le séquençage par matrices multiplexées de PacBio (MAS-Seq) représente une avancée significative dans la technologie de séquençage des isoformes à cellule unique. En combinant la synthèse de cDNA complet avec des capacités de séquençage à longues lectures, le MAS-Seq surmonte les limitations des méthodes traditionnelles à courtes lectures et améliore la résolution et le débit de la transcriptomique à cellule unique.
Principe de MAS-Seq
MAS-Seq implique la concaténation de molécules d'ADNc de pleine longueur en fragments plus grands, qui sont ensuite séquencés à l'aide de La technologie de lecture longue à haute fidélité (HiFi) de PacBioLe processus commence par la génération de cDNA à partir de cellules uniques, suivi de l'élimination des oligos de commutation de modèle (TSOs) et de la concaténation des molécules de cDNA en matrices ordonnées. Ces matrices sont ligaturées avec des adaptateurs MAS et séquencées sur des plateformes PacBio telles que Sequel II/IIe et les systèmes Revio.
Les lectures HiFi résultantes sont segmentées bioinformatique pour récupérer les séquences cDNA originales, garantissant une haute précision et un débit élevé. Cette méthode élimine le besoin de fragmentation et d'assemblage de courtes lectures, offrant une vue directe et complète du transcriptome au niveau de la cellule unique.
Avantages du MAS-Seq
- Informations sur l'isoforme complèteLe MAS-Seq capture des isoformes complètes, y compris toutes les régions exoniques, les jonctions d'épissage et les UTR, fournissant une carte détaillée du transcriptome.
- Haut débitLa stratégie de concaténation augmente considérablement le débit, permettant le séquençage de plusieurs molécules d'ADNc en une seule course. Cette efficacité est particulièrement bénéfique pour les études à grande échelle et les tissus complexes.
- Code-barres cellulaire précisLe MAS-Seq intègre le marquage des cellules uniques et un tag unique, garantissant une quantification et une identification précises des transcrits individuels.
- Coût-efficacitéEn maximisant l'utilisation de la capacité de séquençage, le MAS-Seq réduit le coût par cellule et par isoforme, en faisant une option viable pour des études approfondies sur les cellules uniques.
- Élimination du séquençage orthogonalMAS-Seq fournit des données d'isoformes complètes de manière indépendante, rationalisant le flux de travail et réduisant la complexité.
- Détection améliorée des isoformesLa capacité de MAS-Seq à capturer des isoformes de longueur complète offre une vue d'ensemble des événements d'épissage alternatif, des gènes de fusion et d'autres variations transcriptomiques souvent manquées par le séquençage à courtes lectures.
- Données haute résolutionLa technologie de séquençage à lecture longue utilisée dans le MAS-Seq offre une haute résolution et précision, permettant l'identification de changements transcriptomiques subtils et d'isoformes rares, essentiels pour comprendre les fonctions cellulaires et les mécanismes des maladies.
- Flux de travail rationaliséMAS-Seq simplifie le flux de travail de séquençage, réduisant le temps, le coût et la complexité des projets de séquençage d'isoformes à cellule unique.
- Compatibilité et FlexibilitéLe kit MAS-Seq est compatible avec l'ADNc généré à partir du système 10x Chromium, ce qui le rend adaptable à diverses applications de séquençage unicellulaire. Sa flexibilité permet aux chercheurs d'étudier un large éventail d'échantillons biologiques et de conditions expérimentales.
- Soutien bioinformatique robustePacBio fournit des outils bioinformatiques complets pour le traitement des données MAS-Seq, y compris la segmentation des lectures, la correction des étiquettes uniques et la classification des isoformes. Ces outils garantissent une analyse des données précise et efficace, facilitant les applications et les insights en aval.
Figure 1. Séquençage résolu des isoformes à cellule unique de cellules uniques avec MAS-ISO-seq.
Applications et impact de MAS-Seq
Le séquençage d'isoformes à cellule unique utilisant MAS-Seq a des implications significatives dans plusieurs domaines de la recherche biologique et de la médecine. Dans le contexte de la recherche sur le cancer, cette technologie facilite l'identification de mutations et d'événements d'épissage spécifiques aux isoformes qui sous-tendent la tumorigenèse et la résistance aux thérapies. En neurobiologie, elle permet un examen détaillé de la diversité neuronale et la détection de variations d'isoformes liées aux troubles neurologiques. De plus, MAS-Seq s'avère inestimable en génomique végétale, aidant à l'élucidation de transcriptomes complexes dans des espèces ayant des génomes vastes et diversifiés.
Notre service de séquençage d'isoformes à cellule unique par MAS-Seq
Chez CD Genomics, nous exploitons la technologie avancée MAS-Seq pour offrir une résolution inégalée dans les analyses transcriptomiques. Notre service capture des isoformes de longueur complète, fournissant une compréhension approfondie du splicing alternatif, des événements de fusion génique et d'autres variations transcriptomiques souvent obscurcies par les méthodes de séquençage conventionnelles.
En plus de nos capacités sophistiquées de séquençage des isoformes, nous nous engageons à offrir un séquençage RNA à cellule unique de haute qualité, un séquençage ADN à cellule unique, un séquençage de la méthylation de l'ADN à cellule unique et un séquençage à cellule unique 10X Genomics. Cette plateforme multidimensionnelle nous permet de répondre à un large éventail de besoins de recherche, fournissant des informations détaillées sur l'expression génique, les variations génétiques et les modifications épigénétiques au niveau de la cellule unique.
Flux de travail et contenu de l'analyse des données MAS-Seq
| Étape | Description | Détails |
|---|---|---|
| Prétraitement des données | Convertir les données MAS-Seq en un format d'analyse utilisable et ajouter des métadonnées pertinentes. | - Bibliothèques de capture d'ARN quantifiées et traitées ainsi que des bibliothèques de capture d'anticorps. - Identification des cellules conservatrices pour conserver davantage de gouttelettes viables. - Cellules non immunitaires et doublets supprimés. - Comptes d'anticorps capturés transformés par logarithme pour une analyse ultérieure. |
| Intégration des données | Intégrez les données de séquençage long et court pour garantir la cohérence et une analyse conjointe de haute qualité. | - Matrices de comptage au niveau des isoformes converties pour l'analyse. - A cartographié les transcriptions de romans et les gènes aux annotations connues. - Transcriptions ambiguës marquées et gènes récepteurs recoupés. - Ensembles de données harmonisés en conservant les codes-barres cellulaires mutuels, atteignant une haute fidélité d'identification. |
| Normalisation, regroupement et intégration | Normalisez les données, identifiez les caractéristiques très variables et effectuez une analyse de clustering. | - Transformation stabilisante de la variance appliquée aux comptages. - Sélection des gènes/isoformes principaux en tant que caractéristiques hautement variables. - Ensemble de fonctionnalités réduit utilisant l'analyse en composantes principales. - Graph des plus proches voisins construit pour l'embedding et le clustering. - Réalisé une analyse d'expression génique différentielle. |
| Analyse d'expression différentielle | Identifier les gènes d'expression différentielle entre différents types de cellules et annoter les populations cellulaires. | - Réalisé une analyse d'expression différentielle pour identifier les différences d'expression entre différents types de cellules. |
| Analyse de la trajectoire évolutive | Utilisez l'analyse du temps de diffusion pseudotime (DPT) pour cartographier les chemins de développement cellulaire. | - Réalisé une analyse de pseudotemps de diffusion pour déterminer les transitions d'état cellulaire. - Utilisé des comptes transformés pour une représentation graphique plus claire. |
| Affinage de l'annotation des isoformes de CD45 | Affiner les annotations GENCODE pour améliorer la spécificité des attributions d'isoformes. | - Annotations génétiques incomplètes raffinées - Amélioration de la spécificité pour les attributions d'isoformes en utilisant des méthodes améliorées. - Utilisation d'une affectation basée sur des décisions pour une détection précise des isoformes. |
| Identification des gènes épissés différemment | Effectuez des tests statistiques de splicing différentiel globaux et résolus par cluster pour identifier l'utilisation différentielle des isoformes à travers les populations cellulaires. | - Réalisation de tests de splicing différentiel globaux et de tests de splicing différentiel résolus par clusters pour identifier l'utilisation différentielle des isoformes dans différents clusters cellulaires. - P-values ajustés pour le taux de fausses découvertes (FDR) afin d'assurer la robustesse statistique. |
Flux de travail de notre service
Préparation des échantillons : Des suspensions de cellules uniques sont préparées et traitées à l'aide du kit 10x Chromium Next GEM Single Cell 3' pour générer de l'ADNc.
Synthèse et purification de l'ADNc : des molécules d'ADNc de pleine longueur sont synthétisées et purifiées pour éliminer les oligonucléotides de commutation de modèle (TSOs).
Concaténation et ligation d'adaptateurs : les molécules d'ADNc sont concaténées en tableaux ordonnés, et des adaptateurs MAS sont ligaturés pour faciliter le séquençage.
Séquençage Long-Read : Les bibliothèques de cDNA préparées sont séquencées sur des plateformes PacBio, telles que les systèmes Sequel II/IIe ou Revio, générant des lectures longues de haute fidélité.
Analyse des données : Les lectures HiFi sont segmentées bioinformatiquement pour récupérer les séquences cDNA originales, suivies d'une analyse détaillée du contenu en isoformes, du splicing alternatif et des fusions géniques.
Figure 2. Flux de travail MAS-ISO-seq
Exigence d'échantillon
Viabilité cellulaire : Une haute viabilité cellulaire (>90%) est cruciale pour générer des bibliothèques cDNA à cellule unique de qualité.
Numéro de cellule : Un minimum de 1 000 cellules est recommandé pour obtenir une couverture complète et une quantification précise des isoformes.
Pureté des échantillons : Les échantillons doivent être exempts de contaminants et de débris pour éviter toute interférence avec le processus de séquençage.
Intégrité de l'ARN : Une intégrité élevée de l'ARN (RIN > 7) est essentielle pour générer des molécules de cDNA de pleine longueur.
Comment garantissez-vous l'exactitude et la qualité des données ?
Nous utilisons la technologie de séquençage haute fidélité de PacBio et des outils bioinformatiques robustes pour garantir une grande précision et qualité dans nos résultats de données. De plus, notre équipe d'experts effectue des contrôles de qualité rigoureux tout au long du processus.
Pouvez-vous analyser des isoformes rares et à faible abondance ?
Oui, le MAS-Seq est très sensible et capable de détecter des isoformes rares et à faible abondance, offrant une vue d'ensemble complète du transcriptome.
Quels types d'échantillons pouvez-vous traiter ?
Nous pouvons traiter une large gamme d'échantillons unicellulaires, y compris ceux provenant de tissus, de lignées cellulaires et de cellules primaires. Veuillez nous contacter pour des exigences et des recommandations spécifiques concernant les échantillons.
Quel est le nombre minimum de cellules requis pour le séquençage d'isoformes à cellule unique ?
Pour des résultats optimaux, nous recommandons un minimum de 1 000 cellules. Cela garantit une couverture complète et une quantification précise des isoformes. Cependant, nous pouvons travailler avec un nombre de cellules plus petit si nécessaire, bien que cela puisse affecter la profondeur de l'analyse.
Quels types de plateformes de séquençage utilisez-vous pour le séquençage d'isoformes à cellule unique ?
Nous utilisons les systèmes PacBio Sequel II/IIe ou Revio pour le séquençage d'isoformes à cellule unique. Ces plateformes fournissent des lectures longues à haute fidélité, garantissant une analyse précise et détaillée des isoformes.
Comment gérez-vous la confidentialité et la sécurité des données ?
Chez CD Genomics, nous accordons la priorité à la confidentialité et à la sécurité des données. Toutes les données sont stockées sur des serveurs sécurisés avec un accès restreint, et nous respectons des protocoles de protection des données stricts pour garantir la confidentialité des informations de nos clients.
Pouvez-vous fournir de l'aide pour l'interprétation des données ?
Oui, notre équipe d'experts en bioinformatique est disponible pour vous aider à interpréter les données. Nous offrons un soutien complet pour vous aider à comprendre les résultats, y compris des rapports détaillés et des services de consultation.
Quels types d'échantillons sont compatibles avec votre service de séquençage d'isoformes à cellule unique ?
Notre service est compatible avec divers échantillons unicellulaires, y compris des tissus frais et congelés, des lignées cellulaires et des cellules primaires. Si vous avez des types d'échantillons spécifiques, veuillez nous contacter pour des recommandations détaillées.
Quel type d'analyse bioinformatique proposez-vous ?
Notre analyse bioinformatique comprend la correction des tags uniques, la classification des isoformes, l'analyse du splicing alternatif, la détection des fusions géniques et l'analyse de l'expression différentielle. Nous fournissons des rapports complets avec des visualisations pour faciliter l'interprétation des données.
Comment les échantillons doivent-ils être préparés et expédiés ?
Les échantillons doivent être préparés sous forme de suspensions cellulaires uniques avec une haute viabilité et pureté. Pour l'expédition, nous recommandons d'utiliser de la glace carbonique et un emballage approprié pour maintenir l'intégrité des échantillons pendant le transport. Des directives détaillées sur la préparation et l'expédition des échantillons seront fournies sur demande.
Votre service peut-il identifier des isoformes nouvelles ?
Oui, notre service de séquençage d'isoformes à cellule unique est conçu pour identifier de nouvelles isoformes. Les données haute résolution générées par MAS-Seq permettent la découverte d'isoformes précédemment non caractérisées, améliorant ainsi notre compréhension du transcriptome.
Votre service est-il adapté à la recherche clinique ?
Notre service est destiné uniquement à des fins de recherche et n'est pas adapté au diagnostic clinique ou aux tests. Cependant, il est très précieux pour les applications de recherche, y compris la recherche sur le cancer, les études sur les maladies rares et la médecine personnalisée.
Quel est le coût de votre service de séquençage d'isoformes à cellule unique ?
Le coût de notre service varie en fonction de l'étendue du projet, du nombre d'échantillons et des exigences spécifiques. Veuillez nous contacter pour un devis détaillé adapté à vos besoins.
Proposez-vous des solutions sur mesure pour des besoins de recherche spécifiques ?
Oui, nous proposons des solutions sur mesure pour répondre à des besoins de recherche spécifiques. Notre équipe travaillera avec vous pour concevoir une approche personnalisée qui répond à vos objectifs et défis de recherche uniques.
Comment puis-je commencer avec le service de séquençage d'isoformes à cellule unique de CD Genomics ?
Pour commencer, il vous suffit de nous contacter avec les détails et les exigences de votre projet. Notre équipe vous proposera une consultation pour discuter de vos besoins et définir les prochaines étapes pour la soumission d'échantillons et le lancement du projet.
Référence
- Al'Khafaji, A.M., Smith, J.T., Garimella, K.V. et al. Séquençage d'isoformes d'ARN à haut débit utilisant la concaténation de cDNA programmée. Nat Biotechnol 42, 582–586 (2024).