What is isoform discovery and alternative splicing analysis?

Isoform discovery identifies full-length transcript structures and novel transcript variants. Alternative splicing analysis detects how exons and introns are included, skipped, or rearranged across transcript forms.

When is short-read RNA-seq not enough for transcriptomics?

Short-read RNA-seq may not be enough when the main question depends on full-length transcript structure, novel isoforms, complex splicing, transcript switching, or isoform-level interpretation.

What deliverables can I expect from isoform and splicing analysis?

Deliverables may include QC summaries, transcript reconstruction results, full-length isoform catalogs, alternative splicing event tables, isoform expression matrices, differential isoform usage results, annotation files, genome browser tracks, and a project report.

Solution de découverte d'isoformes et d'analyse du splicing alternatif

Table des matières

Transcript-level bioinformatics output overview

Explore comment la découverte de transcrits complets, l'analyse de l'épissage et la bioinformatique sur mesure peuvent soutenir l'interprétation au niveau des transcrits.

Lorsque le RNA-Seq au niveau des gènes manque de complexité des transcrits

Le RNA-seq standard est un outil puissant pour mesurer l'expression des gènes, mais les comptages au niveau des gènes ne montrent pas toujours comment un gène est utilisé. Un gène peut produire plusieurs isoformes de transcrits, et ces isoformes peuvent différer par leur structure d'exons, leur séquence codante, leurs régions non traduites, leurs éléments régulateurs ou leur fonction biologique.

C'est là que la découverte d'isoformes et l'analyse du splicing alternatif peuvent apporter de la valeur. Dans certains projets, l'expression génique totale semble inchangée, mais l'utilisation des transcrits change de manière significative. Une isoforme peut augmenter, une autre peut diminuer, ou un événement de splicing peut modifier la façon dont votre équipe interprète un gène ou une voie candidate.

Ces changements au niveau des transcrits peuvent être importants dans les études de régulation des gènes, d'état cellulaire, de spécificité tissulaire, de réponse au traitement, de réponse au stress, de développement et de phénotypes complexes.

Le séquençage d'ARN à lecture courte peut soutenir l'analyse des jonctions d'épissage et la quantification de l'expression, mais les lectures courtes ne peuvent souvent pas reconstruire les structures de transcrits complets avec une grande confiance. Le séquençage de transcrits à lecture longue fournit une autre couche de preuves en lisant des molécules de transcrits plus longues, ce qui peut aider à résoudre les structures de transcrits, les isoformes nouvelles et les motifs d'épissage complexes.

Pour de nombreuses équipes de recherche, la question utile n'est pas seulement de savoir si un gène est exprimé. La question plus pratique est : quelles isoformes de transcrits sont présentes, comment sont-elles épissées et comment l'utilisation des isoformes change-t-elle en fonction de la conception de l'étude ?

Notre solution est conçue pour répondre à cette question grâce à un examen de la stratégie de séquençage, une évaluation de la qualité de l'ARN, une bioinformatique au niveau des transcrits, une visualisation et des livrables prêts à être rapportés.

Ce que cette solution vous aide à découvrir

Notre solution de découverte d'isoformes et d'analyse du splicing alternatif est conçue pour des projets où l'expression au niveau des gènes ne fournit pas une résolution suffisante.

Nouveaux isoformes et variantes de transcrits

Le séquençage des transcrits par lecture longue peut aider à révéler des structures de transcrits qui sont difficiles à assembler uniquement à partir de lectures courtes. Cela peut être utile lorsque votre projet nécessite d'identifier de nouveaux isoformes, de peaufiner les annotations génétiques, de découvrir des variantes de transcrits ou d'étudier une architecture complexe des transcrits dans un gène candidat ou un ensemble de données à l'échelle du génome.

Pour les organismes non-modèles, les plantes, les animaux ou les espèces avec des annotations incomplètes, la découverte d'isoformes peut également améliorer l'annotation du transcriptome et soutenir les études fonctionnelles en aval.

Événements d'épissage alternatif et motifs d'épissage

Le splicing alternatif peut générer plusieurs formes de transcrits à partir d'un même gène. Nous pouvons soutenir la détection et l'interprétation des principaux types d'événements de splicing.

Saut d'exon
Rétention d'intron
Sites d'épissage 5′ alternatifs
Sites d'épissage alternatifs 3′
Exons mutuellement exclusifs
Des motifs d'épissage complexes, lorsqu'ils sont soutenus par les données.

Utilisation différentielle des isoformes selon les conditions

Un projet d'isoforme utile nécessite souvent plus qu'une simple liste de transcrits. Vous pourriez avoir besoin de savoir si différents groupes utilisent des isoformes de transcrits différentes du même gène.

Nous pouvons soutenir la quantification au niveau des transcrits et l'analyse de l'utilisation différentielle des isoformes lorsque la conception de l'étude et les données le permettent.

Indices de transcription pour les biomarqueurs, cibles et voies.

Les résultats d'isoformes et d'épissage deviennent plus précieux lorsqu'ils sont liés à une interprétation biologique. En fonction de votre projet, nous pouvons relier les résultats au niveau des transcrits avec l'annotation fonctionnelle, l'enrichissement des voies, le potentiel de codage, les familles de gènes, les régions candidates, l'examen des transcrits de fusion ou l'interprétation multi-omiques.

Nos capacités de service pour les projets d'isoformes et d'épissage

Nous ne considérons pas la découverte d'isoformes comme un service de séquençage fixe. Le bon plan dépend de votre échantillon d'ARN, de l'espèce, de l'objectif de recherche, de la conception de l'étude, des données existantes et du niveau de détail des transcrits dont vous avez besoin.

Notre équipe vous aide à combiner les modules de séquençage et d'analyse dans un flux de travail adapté à votre question de recherche.

Découverte de transcriptions complètes avec le séquençage à longues lectures

Lorsque la structure des transcrits de longueur complète est au cœur de votre projet, le séquençage de transcrits à longues lectures peut fournir des preuves directes à travers les isoformes de transcrits. Nous pouvons soutenir des projets qui utilisent Séquençage de Transcriptions Complètes (Iso-Seq) ou Séquençage des transcrits complets par nanopore pour résoudre les structures des transcrits, les isoformes nouvelles, les schémas d'épissage alternatif et l'annotation des transcrits.

Pour les projets impliquant des caractéristiques de l'ARN natif ou des questions liées à la poly(A), Séquençage d'ARN direct par nanopore, Séquençage polyA, ou des stratégies liées à TAIL Iso-seq peuvent être envisagées lorsque cela est approprié.

Séquençage d'ARN à lecture courte et soutien au transcriptome hybride

Lecture courte RNA-Seq, séquençage d'ARNm, et Séquençage de l'ARN total rester précieux pour le profilage d'expression, le soutien des jonctions d'épissage et la quantification au niveau de groupe.

Dans de nombreux projets, une stratégie hybride est pratique. Les longues lectures peuvent aider à définir les structures des transcrits, tandis que les courtes lectures peuvent renforcer la quantification à travers des ensembles d'échantillons plus larges.

Épissage alternatif et bioinformatique au niveau des isoformes

La découverte d'isoformes et l'analyse de l'épissage dépendent d'une bioinformatique soignée. CD Genomics fournit Analyse des données transcriptomiques, Service d'analyse de données de séquençage à lecture longue, Analyse des données génomiqueset Bioinformatique soutien à la reconstruction de transcrits, classification des nouveaux isoformes, détection des événements d'épissage, quantification des isoformes, utilisation différentielle des isoformes, annotation et visualisation.

Intégration optionnelle de données unicellulaires, spatiales et multi-omiques

Lorsque le contexte cellulaire est important, l'interprétation des isoformes peut devoir se connecter à Séquençage d'ARN à cellule uniqueanalyse des isoformes à cellule unique, transcriptomique spatiale, ou Analyse multi-omiqueCes options peuvent aider lorsque les données de transcriptome en vrac n'expliquent pas l'utilisation des isoformes spécifiques au type cellulaire ou les différences entre les régions tissulaires.

Nous pouvons préparer des résultats qui aident votre équipe à examiner et à communiquer les résultats au niveau des transcrits, y compris des diagrammes de structure d'isoforme, des tableaux d'événements d'épissage, des résumés d'utilisation différentielle des isoformes, des graphiques de type sashimi, des pistes de navigateur génomique, des matrices d'expression, des tableaux d'annotation et des rapports de projet.

L'objectif est de fournir à votre équipe des résultats organisés qui sont plus faciles à interpréter, à réutiliser et à discuter.

Stratégie technologique : Lecture courte, lecture longue, cellule unique ou hybride ?

Aucune méthode de transcriptomique unique n'est la meilleure pour chaque projet d'isoforme ou d'épissage. La bonne stratégie dépend de la question à laquelle vous devez répondre : expression génique, structure des transcrits, caractéristiques de l'ARN natif, utilisation d'isoformes spécifiques au type cellulaire ou interprétation en aval.

Un référentiel de Nature Communications 2024, Évaluation complète des méthodes de détection des isoformes d'ARNm pour les données de séquençage à lecture longue, a évalué 13 méthodes provenant de 9 outils pour la détection des isoformes à longues lectures. L'étude a montré que la performance de détection des isoformes peut varier en fonction de la profondeur de lecture, de la complexité du transcriptome, de l'intégralité des lectures, des erreurs de séquençage, de l'exhaustivité des annotations et du choix du logiciel.

Cette preuve soutient un point important pour la planification de projet : la découverte d'isoformes n'est pas seulement une décision de séquençage. C'est une décision de flux de travail complet.

Stratégie	Meilleur ajustement	Valeur de la structure du transcript	Valeur d'analyse de splicing	Valeur de quantification	Sensibilité de l'échantillon	Les besoins en bioinformatique	Notes pratiques
Séquençage d'ARN à lecture courte	Expression au niveau des gènes, soutien aux jonctions d'épissage, ensembles d'échantillons plus importants	Limité pour les structures de transcription intégrale	Utile pour les signaux de découpage au niveau des événements.	Fort pour l'expression et la quantification au niveau du groupe	Dépend de la qualité de l'ARN et du type de bibliothèque.	Outils d'alignement, de quantification, d'expression différentielle et d'événements d'épissage	Utile lorsque l'expression génique est l'objectif principal ou lorsque les données de courtes lectures peuvent soutenir la découverte par longues lectures.
PacBio Iso-Seq	Découverte d'isoformes cDNA de longueur complète et affinement de l'annotation	Fort pour les modèles de transcription intégrale	Utile pour les isoformes novatrices et les structures d'épissage complexes.	Peut prendre en charge l'analyse au niveau des isoformes en fonction du design.	Nécessite une qualité d'ARN adéquate et une préparation de bibliothèque.	Reconstruction de transcript, effondrement, classification, annotation	Bon ajustement lorsque les structures d'isoformes complètes à haute confiance sont centrales.
Séquençage de transcrits complets par nanopore	Structure de transcript long et découverte flexible de transcript complet.	Fort puissant pour des lectures de transcriptions longues et la découverte d'isoformes.	Utile pour l'analyse de l'épissage complexe et de la structure des transcrits.	Peut prendre en charge la quantification au niveau des transcrits avec un design approprié.	Nécessite un examen minutieux de la qualité de l'ARN/cDNA.	Traitement de lecture conscient des ONT, reconstruction de transcrits, annotation	Bon choix lorsque la longueur de lecture et les preuves de transcriptomes flexibles à longues lectures sont importantes.
Séquençage d'ARN direct par nanopore	Analyse de l'ARN natif et preuves au niveau des transcrits sans conversion en cDNA	Utile pour les lectures de transcriptions natives.	Peut soutenir des questions sur les isoformes et les caractéristiques de l'ARN.	Dépendant du projet	Sensible à l'intégrité de l'ARN et à la qualité d'entrée	Traitement et interprétation directs des ARN.	Utile lorsque les caractéristiques de l'ARN natif, les questions liées au poly(A) ou les preuves sans amplification sont importantes.
Analyse des isoformes à cellule unique	Utilisation d'isoformes spécifiques au type cellulaire et hétérogénéité	Utile lorsque la diversité des transcriptions dépend de l'état cellulaire.	Peut révéler des motifs d'épissage contextuels des cellules.	Plus complexe et dépendant du design de l'étude.	La manipulation des échantillons et la qualité des cellules sont essentielles.	Analyse des transcrits et des isoformes en tenant compte des cellules uniques	Meilleur lorsque les données massives cachent des motifs de transcription spécifiques au type de cellule.
Stratégie hybride	Découverte d'isoformes par séquençage long et quantification par séquençage court	Forte lorsque les lectures longues définissent des structures et que les lectures courtes soutiennent la quantification.	Utile pour la comparaison au niveau du groupe sur Discovery Plus.	Fort lorsque les données RNA-seq existantes peuvent être réutilisées.	Dépend des deux types de données.	Intégration des données, affinement du modèle de transcript, quantification, utilisation différentielle	Utile lorsque le projet nécessite à la fois une structure de transcription et une confiance au niveau du groupe.

Comment nous aidons à sélectionner la stratégie

Avant de recommander un flux de travail, nous examinons votre objectif de recherche, l'état de l'échantillon d'ARN, l'espèce et le statut d'annotation, les données existantes et les besoins en livrables. Cette révision nous aide à élaborer une stratégie adaptée au projet plutôt que de forcer chaque projet dans le même flux de séquençage.

Flux de travail de bout en bout avec points de contrôle de qualité de l'ARN

De l'examen des échantillons d'ARN à la découverte au niveau des transcrits et à la livraison du rapport final.

Isoform and alternative splicing analysis workflow with RNA QC checkpoints

Nous commençons par examiner votre espèce, le type d'échantillon, le nombre d'échantillons, les groupes expérimentaux, la source d'ARN, l'état du génome de référence et la principale question de recherche. À ce stade, nous clarifions si le projet est axé sur la découverte de nouveaux isoformes, la détection d'événements d'épissage alternatif, l'annotation des transcrits, l'utilisation différentielle des isoformes, le suivi à cellule unique ou l'intégration avec des données RNA-seq existantes.

La qualité de l'ARN est examinée avant la construction de la bibliothèque. Pour la découverte de transcrits complets, l'intégrité de l'ARN est particulièrement importante car un ARN dégradé peut réduire la capacité à reconstruire des structures de transcrits complètes. Si le type d'échantillon ou la qualité de l'ARN ne correspondent pas au flux de travail prévu, nous examinons les ajustements possibles avant de procéder.

Selon la stratégie, les échantillons passent à la séquençage d'ARN à lecture courte, au séquençage de transcrits à lecture longue, au séquençage d'ARN direct, à l'analyse unicellulaire ou à un flux de travail hybride. Les lectures sont traitées, filtrées, alignées ou cartographiées, et utilisées pour la reconstruction des transcrits lorsque cela est approprié.

Les isoformes connues et nouvelles sont classées et annotées. Les événements d'épissage alternatif sont détectés lorsqu'ils sont soutenus par les données. La quantification au niveau des isoformes et l'analyse de l'utilisation différentielle des isoformes peuvent être ajoutées lorsque le design de l'étude inclut des groupes ou des conditions appropriés.

Vous recevez des fichiers de sortie et un rapport de projet qui résument le flux de travail, les résultats de contrôle qualité, la logique d'analyse et les principaux types de sortie. Lorsqu'ils sont inclus dans le périmètre du projet, nous pouvons préparer des diagrammes d'isoformes, des graphiques de type sashimi, des cartes thermiques, des pistes de navigateur génomique et des résumés prêts pour les figures.

Exigences d'échantillon et informations sur l'entrée de projet

La qualité de l'échantillon a un effet direct sur la découverte des isoformes et l'analyse du splicing alternatif. L'intégrité de l'ARN est particulièrement importante pour les flux de travail de transcriptome à lecture longue, car un ARN incomplet ou dégradé peut affecter la reconstruction des transcrits.

Les exigences finales d'échantillon dépendent de l'espèce, du type d'échantillon, de la qualité de l'ARN, de la plateforme et de l'objectif du projet. Avant la confirmation du projet, notre équipe examine les informations ci-dessous et recommande le flux de travail le plus adapté.

Type d'échantillon ou d'entrée	Ce que nous examinons	Concentration sur la qualité	Points de contrôle QC typiques	Notes
ARN total ou ARN poly(A)+	Source d'ARN, méthode d'extraction, concentration, pureté, intégrité, historique de l'échantillon	ARN de haute qualité avec une dégradation limitée	Révision de l'intégrité de l'ARN, vérification de la concentration, vérification de la pureté, contrôle de qualité de la bibliothèque.	Meilleur pour la découverte de transcriptions complètes et l'analyse de splicing lorsque la qualité de l'ARN soutient le flux de travail.
Données de séquençage d'ARN à lecture courte	Fichiers FASTQ/BAM, version de référence, type de bibliothèque, métadonnées de groupe	Compatibilité avec l'analyse et la quantification au niveau des transcrits	Vérification de l'intégrité des fichiers, lecture QC, révision de la cartographie, révision des métadonnées	Utile pour l'analyse hybride, l'expression différentielle et le soutien à la quantification.
Données de séquençage de transcriptome à lecture longue	Source de la plateforme, qualité de lecture, longueur de lecture, étiquettes d'échantillon, version de référence	Lisibilité du transcript et adéquation de la cartographie	Revue de la longueur de lecture, revue de la qualité, revue de l'alignement, revue de la reconstruction du transcript.	Peut soutenir la réanalyse, la découverte d'isoformes et le perfectionnement de l'annotation.
Données de transcriptomique unicellulaire ou spatiale	Métadonnées des cellules ou des spots, regroupement des échantillons, plateforme, annotation des gènes, résultats d'analyses antérieures.	Compatibilité du contexte cellulaire avec l'interprétation au niveau des isoformes	Revue des métadonnées, revue de la qualité des cellules/taches, revue de la faisabilité d'intégration	Utile lorsque le type de cellule ou la région tissulaire modifie l'interprétation des isoformes.
Matériau tissulaire, cellulaire, végétal, animal, microbien ou environnemental	Méthode de conservation, qualité attendue de l'ARN, faisabilité d'extraction, source de l'échantillon	Adéquation pour l'extraction d'ARN et le séquençage en aval	Inspection d'échantillons, examen de la faisabilité d'extraction, contrôle qualité de l'ARN après extraction.	Le support d'extraction peut être envisagé lorsque la soumission directe d'ARN n'est pas disponible.

Analyse bioinformatique et livrables

La valeur principale de cette solution ne réside pas seulement dans le séquençage. La valeur provient de la transformation des preuves de transcriptome en résultats organisés, réutilisables et interprétables.

Nous nous concentrons sur des résultats que votre équipe peut réellement utiliser : modèles de transcription, tableaux d'événements, matrices d'expression, fichiers d'annotation, pistes de visualisation et rapports qui expliquent ce qui a été fait.

Livrables minimums

Résumé de la QC des données brutes
Distribution de la longueur de lecture et de la qualité de lecture
Résultats de la reconstruction du transcript
Catalogue des isoformes complètes
Classification des isoformes connues et nouvelles
Table des événements d'épissage alternatif
Matrice d'expression au niveau des isoformes

Options supplémentaires

Analyse de l'épissage différentiel
Détection de transcrits de fusion
Analyse de la polyadénylation alternative
Prédiction du potentiel de codage
Annotation fonctionnelle et enrichissement
Analyse des isoformes à cellule unique
Intégration multi-omiques

Types de fichiers de sortie

Fichiers FASTQ, BAM ou CRAM le cas échéant
Fichiers d'annotation de transcrits GTF ou GFF
Séquences de transcrits FASTA
Tables d'isoformes et d'événements d'épissage au format TSV ou CSV
Matrice d'expression des isoformes
Pistes du navigateur génomique
rapport de projet au format PDF ou HTML

Comment choisir la bonne isoforme et la stratégie de découverte d'épissage ?

Une stratégie solide commence par la question de la transcriptomique. Nous vous aidons à déterminer quel niveau de preuve et quelle profondeur d'analyse sont nécessaires avant de passer à l'exécution du projet.

Choisissez d'abord le long format lorsque la structure de la transcription est centrale.

Une stratégie de lecture longue en premier est souvent appropriée lorsque votre projet se concentre sur des modèles de transcrits complets, des isoformes nouvelles, des motifs d'épissage complexes, la révision de transcrits de fusion ou le perfectionnement de l'annotation.

Choisissez un support à lecture courte lorsque la profondeur d'expression est importante.

Le séquençage RNA-seq à lecture courte reste utile lorsque votre projet nécessite un profilage d'expression au niveau de groupe solide, une large couverture d'échantillons ou un soutien à la quantification. Il peut également soutenir une analyse hybride lorsque les longues lectures définissent les structures des transcrits et que les courtes lectures renforcent la comparaison d'expression.

Ajoutez une analyse unicellulaire ou spatiale lorsque le contexte cellulaire est important.

Si l'utilisation des isoformes peut varier selon le type cellulaire, l'état cellulaire ou la région tissulaire, la transcriptomique unicellulaire ou spatiale peut apporter un contexte que les données en vrac peuvent manquer.

Ajoutez des bioinformatiques personnalisées lorsque l'interprétation est le véritable défi.

Un fichier modèle de transcript ou un tableau d'événements d'épissage peut ne pas répondre à votre question de recherche à lui seul. La bioinformatique personnalisée peut aider à relier les isoformes et les événements d'épissage aux gènes, aux voies, aux mécanismes candidats, aux différences entre groupes ou à des résumés prêts pour la visualisation.

Demande de plan de découverte

Références

Conformité / Avertissement

CD Genomics fournit ce service uniquement à des fins de recherche (RUO). Ce service n'est pas destiné à un diagnostic clinique, à une interprétation médicale directe ou à des tests destinés aux consommateurs.

Résultats de la démo

Les résultats de la démonstration aident votre équipe à comprendre à quoi pourraient ressembler les résultats finaux de l'analyse avant de commencer le projet. Ces exemples montrent des types de résultats, et non des conclusions biologiques fixes.

Vue de la structure de l'isoforme pleine longueur

Cette sortie montre les modèles de transcrits pour des isoformes connues et nouvelles du même gène, y compris la structure exon-intron, la longueur du transcrit, les régions codantes, les régions non traduites et l'état d'annotation.

Alternative splicing event visualization

Visualisation des événements d'épissage alternatif

Cette sortie montre des motifs d'événements d'épissage, tels que le saut d'exon, la rétention d'intron, des sites d'épissage alternatifs ou des exons mutuellement exclusifs.

Differential isoform usage and interpretation view

Utilisation différentielle des isoformes et point de vue d'interprétation

Cette sortie compare l'utilisation des transcrits entre les groupes et relie les motifs d'isoformes aux gènes candidats, aux voies ou aux annotations fonctionnelles.

FAQ

1. Qu'est-ce que la découverte d'isoformes et l'analyse du splicing alternatif ?

La découverte d'isoformes identifie les structures de transcrits complets et de nouveaux variants de transcrits. L'analyse du splicing alternatif détecte comment les exons et les introns sont inclus, omis ou réarrangés à travers les formes de transcrits. Ensemble, ils aident à expliquer la diversité des transcrits au-delà de l'expression au niveau des gènes.

2. Quand le séquençage d'ARN à lecture courte n'est-il pas suffisant pour la transcriptomique ?

Le séquençage RNA-seq à lecture courte peut ne pas suffire lorsque la question principale dépend de la structure des transcrits complets, des isoformes nouvelles, du splicing complexe, du changement de transcrit ou de l'interprétation au niveau des isoformes. Dans ces cas, des stratégies à lecture longue ou hybrides peuvent fournir de meilleures preuves de la structure des transcrits.

3. Quelle est la différence entre la découverte d'isoformes et la détection d'événements d'épissage alternatif ?

La découverte d'isoformes reconstruit des modèles de transcrits et identifie des isoformes de transcrits connues ou nouvelles. La détection d'événements d'épissage alternatif se concentre sur des motifs d'épissage spécifiques, tels que le saut d'exon, la rétention d'intron ou des sites d'épissage alternatifs.

4. Quelles sont les différences entre le séquençage Iso-Seq de PacBio et le séquençage de transcrits complets par Nanopore ?

La séquençage Iso-Seq de PacBio est souvent utilisé pour la découverte d'isoformes cDNA de pleine longueur avec une grande confiance. Le séquençage de transcrits de pleine longueur par nanopore fournit des preuves de transcrits à longues lectures et des options de flux de travail flexibles. Le meilleur choix dépend de la qualité de l'ARN, de l'objectif de recherche, du nombre d'échantillons, de la complexité des transcrits et des besoins en analyse en aval.

5. Quand devrais-je envisager le séquençage RNA direct par Nanopore ?

Le séquençage d'ARN direct par nanopore peut être utile lorsque des preuves d'ARN natif, un séquençage sans amplification, des questions liées à la poly(A) ou l'analyse des caractéristiques de l'ARN sont importantes pour le projet. Il doit être choisi en fonction de la qualité de l'échantillon et des objectifs de recherche.

6. Cette solution peut-elle fonctionner pour des organismes non-modèles ou des échantillons de plantes et d'animaux ?

Oui. De nombreux projets de transcriptome d'organismes non modèles, de plantes et d'animaux peuvent bénéficier de la découverte d'isoformes et du raffinement de l'annotation. La conception du flux de travail dépend de la qualité de l'ARN, de l'état du génome de référence, de l'exhaustivité de l'annotation et du type d'échantillon.

7. Quelles informations sur l'échantillon d'ARN sont nécessaires avant de recommander un flux de travail ?

Nous avons généralement besoin d'informations sur l'espèce, le type d'échantillon, la méthode d'extraction, la qualité de l'ARN, le nombre d'échantillons, les groupes expérimentaux, l'état du génome de référence, les données de séquençage existantes et la question de recherche principale.

8. Quels livrables puis-je attendre de l'analyse des isoformes et du splicing ?

Les livrables peuvent inclure des résumés de contrôle qualité, des résultats de reconstruction de transcrits, des catalogues d'isoformes complètes, des tableaux d'isoformes nouvelles, des tableaux d'événements d'épissage alternatif, des matrices d'expression d'isoformes, des résultats d'utilisation différentielle d'isoformes, des fichiers d'annotation, des pistes de navigateur génomique et un rapport de projet.

9. Les résultats des isoformes peuvent-ils être intégrés avec des données RNA-seq ou de cellules uniques existantes ?

Oui. Les données RNA-seq existantes peuvent soutenir la quantification et la comparaison de groupes. Les données unicellulaires ou spatiales peuvent aider à interpréter l'utilisation des isoformes spécifiques aux types cellulaires ou aux régions tissulaires lorsque le design de l'étude permet l'intégration.

10. Fournissez-vous des résultats prêts pour la visualisation, tels que des graphiques sashimi ou des pistes de navigateur génomique ?

Oui. Nous pouvons préparer des diagrammes de structure d'isoformes, des graphiques de type sashimi, des cartes thermiques d'utilisation des transcrits, des pistes de navigateur génomique et des résumés prêts pour les figures lorsque ces résultats sont inclus dans le plan d'analyse.

11. Comment devrais-je choisir entre une solution de séquençage uniquement et une solution de découverte complète ?

Le séquençage seul peut suffire si votre équipe dispose déjà d'un pipeline d'analyse au niveau des transcrits validé. Une solution de découverte complète est plus utile lorsque vous avez besoin d'aide pour la sélection de la plateforme, le contrôle qualité de l'ARN, la reconstruction des transcrits, l'analyse d'épissage, la quantification des isoformes, l'annotation, la visualisation et la production de rapports prêts à l'interprétation.

Cas de littérature : Évaluation comparative de la détection des isoformes à longues lectures pour la découverte de transcrits

Mise en avant de la recherche publiée

Évaluation complète des méthodes de détection des isoformes d'ARNm pour les données de séquençage à long terme.

Journal : Communications Nature
Publié : 2024

Contexte

Le splicing alternatif crée des isoformes de transcrits diversifiés, mais le séquençage d'ARN à lecture courte ne peut pas toujours reconstruire des transcrits de pleine longueur ou résoudre des structures isoformes complexes. Le séquençage d'ARN à lecture longue peut améliorer la découverte de la structure des transcrits, mais le résultat final dépend de la plateforme de séquençage, de la qualité des lectures, de l'annotation de référence et du flux de travail computationnel.

Méthodes

L'étude a évalué 13 méthodes provenant de 9 outils pour la détection des isoformes. Elle a utilisé des données RNA-seq simulées à lecture longue, des séquences RNA et des ensembles de données expérimentales. Le benchmark a inclus des conditions de données liées à Nanopore et PacBio et a évalué des facteurs tels que la profondeur de lecture, la complexité du transcriptome, l'exhaustivité des lectures, le taux d'erreur de séquençage, l'exhaustivité de l'annotation et l'utilisation des ressources informatiques.

Résultats

La Fig. 1 montre le flux de travail de référence global, y compris les ensembles de données simulées, les ensembles de données expérimentales de RNA-seq à longues lectures publiques de quatre espèces, les données de sequins, les ensembles de données hESC, la détection des isoformes, la classification, l'analyse de l'utilisation différentielle des isoformes et l'évaluation des ressources informatiques.
La Fig. 2 présente la précision et la sensibilité dans différents paramètres simulés liés à Nanopore et PacBio.
La figure compare comment la profondeur de lecture, la complexité du transcriptome, l'exhaustivité des lectures, l'exactitude des lectures et l'exhaustivité des annotations affectent la performance de détection des isoformes.
L'étude soutient la nécessité de planifier la découverte d'isoformes à longues lectures comme un flux de travail de génération de données et de bioinformatique, et pas seulement comme une course de séquençage.

Benchmark workflow for long-read RNA-seq isoform detection methods Une étude de référence illustre comment la détection des isoformes à longues lectures dépend de la génération de données, de l'exhaustivité de l'annotation, du choix du logiciel et de l'analyse en aval de l'utilisation différentielle des isoformes.

Conclusion

Ce cas de littérature soutient la logique décisionnelle derrière notre solution d'analyse de découverte d'isoformes et de splicing alternatif. La découverte d'isoformes ne devrait pas être planifiée comme une simple course de séquençage. Elle devrait être considérée comme un flux de travail complet qui relie le contrôle de qualité de l'ARN, la stratégie de séquençage, la reconstruction des transcrits, l'analyse du splicing alternatif, la quantification des isoformes, l'annotation, la visualisation et le reporting.

Publications connexes

Les publications suivantes soutiennent le raisonnement scientifique en faveur du séquençage des transcrits à longues lectures, de la découverte d'isoformes, de l'analyse du splicing alternatif et de la bioinformatique au niveau des transcrits.

Évaluation complète des méthodes de détection des isoformes d'ARNm pour les données de séquençage à long lecteur

Journal : Communications Nature

Année : 2024

Découverte et quantification précises des transcrits longs à résolution unicellulaire, pseudo-bulk et bulk avec Isosceles.

Journal : Communications Nature

Année : 2024

Le séquençage à lecture longue pour 29 sous-ensembles de cellules immunitaires révèle des isoformes liées à la maladie.

Journal : Nature Communications

Année : 2024

Le séquençage ciblé à lecture longue à cellule unique révèle une variation transcriptionnelle dans le cancer de l'ovaire.

Journal : Communications Nature

Année : 2024

Coordination de l'épissage alternatif et de la polyadénylation alternative révélée par le séquençage ciblé à longues lectures

Journal : Communications Nature

Année : 2023

Solution de découverte des isoformes et d'analyse du splicing alternatif

Lorsque le RNA-Seq au niveau des gènes manque de complexité des transcrits

Ce que cette solution vous aide à découvrir

Nouveaux isoformes et variantes de transcrits

Événements d'épissage alternatif et motifs d'épissage

Utilisation différentielle des isoformes selon les conditions

Indices de transcription pour les biomarqueurs, cibles et voies.

Nos capacités de service pour les projets d'isoformes et d'épissage

Découverte de transcriptions complètes avec le séquençage à longues lectures

Séquençage d'ARN à lecture courte et soutien au transcriptome hybride

Épissage alternatif et bioinformatique au niveau des isoformes

Intégration optionnelle de données unicellulaires, spatiales et multi-omiques

Stratégie technologique : Lecture courte, lecture longue, cellule unique ou hybride ?

Comment nous aidons à sélectionner la stratégie

Flux de travail de bout en bout avec points de contrôle de qualité de l'ARN

Exigences d'échantillon et informations sur l'entrée de projet

Analyse bioinformatique et livrables

Livrables minimums

Options supplémentaires

Types de fichiers de sortie

Comment choisir la bonne isoforme et la stratégie de découverte d'épissage ?

Choisissez d'abord le long format lorsque la structure de la transcription est centrale.

Choisissez un support à lecture courte lorsque la profondeur d'expression est importante.

Ajoutez une analyse unicellulaire ou spatiale lorsque le contexte cellulaire est important.

Ajoutez des bioinformatiques personnalisées lorsque l'interprétation est le véritable défi.

Références

Conformité / Avertissement

Résultats de la démo

FAQ

Cas de littérature : Évaluation comparative de la détection des isoformes à longues lectures pour la découverte de transcrits

Publications connexes