
Lorsque le RNA-Seq au niveau des gènes ne parvient pas à capturer la complexité des transcrits
Le RNA-seq standard est un outil puissant pour mesurer l'expression génique, mais les comptes au niveau des gènes ne montrent pas toujours comment un gène est utilisé. Un gène peut produire plusieurs isoformes de transcrits, et ces isoformes peuvent différer par leur structure d'exons, leur séquence codante, leurs régions non traduites, leurs éléments régulateurs ou leur fonction biologique.
C'est là que la découverte d'isoformes et l'analyse du splicing alternatif peuvent apporter de la valeur. Dans certains projets, l'expression génique totale semble inchangée, mais l'utilisation des transcrits change de manière significative. Une isoforme peut augmenter, une autre peut diminuer, ou un événement de splicing peut modifier la façon dont votre équipe interprète un gène ou une voie candidate.
Ces changements au niveau des transcrits peuvent être importants dans les études de régulation génique, d'état cellulaire, de spécificité tissulaire, de réponse au traitement, de réponse au stress, de développement et de phénotypes complexes.
Le séquençage RNA-seq à lecture courte peut soutenir l'analyse des jonctions d'épissage et la quantification de l'expression, mais les lectures courtes ne peuvent souvent pas reconstruire les structures de transcrits complets avec une grande confiance. Le séquençage de transcrits à lecture longue apporte une couche supplémentaire de preuves en lisant des molécules de transcrits plus longues, ce qui peut aider à résoudre les structures de transcrits, les isoformes nouvelles et les motifs d'épissage complexes.
Pour de nombreuses équipes de recherche, la question utile n'est pas seulement de savoir si un gène est exprimé. La question plus pratique est : quelles isoformes de transcrits sont présentes, comment sont-elles épissées et comment l'utilisation des isoformes change-t-elle selon le design de l'étude ?
Notre solution est conçue pour répondre à cette question grâce à un examen de la stratégie de séquençage, une évaluation de la qualité de l'ARN, une bioinformatique au niveau des transcrits, une visualisation et des livrables prêts à être rapportés.
Ce que cette solution vous aide à découvrir
Notre solution de découverte d'isoformes et d'analyse de l'épissage alternatif est conçue pour des projets où l'expression au niveau des gènes ne fournit pas une résolution suffisante.
Isoformes et variantes de transcrits novateurs
Le séquençage des transcrits en lecture longue peut aider à révéler des structures de transcrits qui sont difficiles à assembler uniquement à partir de lectures courtes. Cela peut être utile lorsque votre projet nécessite d'identifier de nouveaux isoformes, de peaufiner les annotations géniques, de découvrir des variantes de transcrits ou d'étudier une architecture de transcrits complexe dans un gène candidat ou un ensemble de données à l'échelle du génome.
Pour les organismes non-modèles, les plantes, les animaux ou les espèces avec des annotations incomplètes, la découverte d'isoformes peut également améliorer l'annotation du transcriptome et soutenir les études fonctionnelles en aval.
Événements d'épissage alternatif et motifs d'épissage
Le splicing alternatif peut générer plusieurs formes de transcrits à partir du même gène. Nous pouvons soutenir la détection et l'interprétation des principaux types d'événements de splicing.
- Saut d'exon
- Rétention d'intron
- Sites d'épissage alternatifs 5′
- Sites d'épissage alternatifs 3′
- Exons mutuellement exclusifs
- Des motifs d'épissage complexes, lorsqu'ils sont soutenus par les données.
Utilisation différentielle des isoformes selon les conditions
Un projet d'isoforme utile nécessite souvent plus qu'une liste de transcrits. Vous pourriez avoir besoin de savoir si différents groupes utilisent des isoformes de transcrits différentes du même gène.
Nous pouvons soutenir la quantification au niveau des transcrits et l'analyse de l'utilisation différentielle des isoformes lorsque la conception de l'étude et les données le permettent.
Indices au niveau de la transcription pour les biomarqueurs, cibles et voies.
Les résultats d'isoformes et d'épissage deviennent plus précieux lorsqu'ils sont liés à une interprétation biologique. Selon votre projet, nous pouvons relier les résultats au niveau des transcrits avec l'annotation fonctionnelle, l'enrichissement en voies, le potentiel codant, les familles de gènes, les régions candidates, la révision des transcrits de fusion ou l'interprétation multi-omique.
Nos capacités de service pour les projets d'isoformes et d'épissage
Nous ne considérons pas la découverte d'isoformes comme un service de séquençage fixe. Le bon plan dépend de votre échantillon d'ARN, de l'espèce, de l'objectif de recherche, de la conception de l'étude, des données existantes et du niveau de détail des transcrits dont vous avez besoin.
Notre équipe vous aide à combiner des modules de séquençage et d'analyse dans un flux de travail qui correspond à votre question de recherche.
Découverte de transcriptions complètes avec le séquençage à longues lectures
Lorsque la structure des transcrits de longueur complète est au cœur de votre projet, le séquençage de transcrits à longues lectures peut fournir des preuves directes à travers les isoformes de transcrits. Nous pouvons soutenir des projets qui utilisent Séquençage de Transcriptions Complètes (Iso-Seq) ou Séquençage des transcrits complets par nanopore pour résoudre les structures de transcrits, les isoformes nouvelles, les schémas d'épissage alternatif et l'annotation des transcrits.
Pour les projets impliquant des caractéristiques de l'ARN natif ou des questions liées à la poly(A), Séquençage d'ARN direct par nanopore, Séquençage polyA, ou des stratégies liées à TAIL Iso-seq peuvent être envisagées lorsque cela est approprié.
Séquençage d'ARN à lecture courte et soutien au transcriptome hybride
Lecture courte RNA-Seq, séquençage d'ARNm, et Séquençage de l'ARN total rester précieux pour le profilage d'expression, le soutien des jonctions d'épissage et la quantification au niveau de groupe.
Dans de nombreux projets, une stratégie hybride est pratique. Les longues lectures peuvent aider à définir les structures des transcrits, tandis que les courtes lectures peuvent renforcer la quantification à travers des ensembles d'échantillons plus larges.
Épissage alternatif et bioinformatique au niveau des isoformes
La découverte d'isoformes et l'analyse de l'épissage dépendent d'une bioinformatique soignée. CD Genomics fournit Analyse des données transcriptomiques, Service d'analyse de données de séquençage à lecture longue, Analyse des données génomiqueset Bioinformatique soutien à la reconstruction de transcrits, classification de nouveaux isoformes, détection d'événements d'épissage, quantification des isoformes, utilisation différentielle des isoformes, annotation et visualisation.
Intégration optionnelle des données unicellulaires, spatiales et multi-omiques
Lorsque le contexte cellulaire est important, l'interprétation des isoformes peut devoir se connecter à Séquençage d'ARN à cellule uniqueanalyse des isoformes à cellule unique, transcriptomique spatiale, ou Analyse multi-omiqueCes options peuvent aider lorsque les données de transcriptome en vrac n'expliquent pas l'utilisation des isoformes spécifiques aux types cellulaires ou les différences entre les régions tissulaires.
Nous pouvons préparer des résultats qui aident votre équipe à examiner et à communiquer les résultats au niveau des transcrits, y compris des diagrammes de structure d'isoforme, des tableaux d'événements d'épissage, des résumés d'utilisation différentielle des isoformes, des graphiques de type sashimi, des pistes de navigateur génomique, des matrices d'expression, des tableaux d'annotation et des rapports de projet.
L'objectif est de fournir à votre équipe des résultats organisés qui sont plus faciles à interpréter, à réutiliser et à discuter.
Stratégie technologique : lecture courte, lecture longue, cellule unique ou hybride ?
Aucune méthode de transcriptomique unique n'est la meilleure pour chaque projet d'isoforme ou d'épissage. La bonne stratégie dépend de la question à laquelle vous devez répondre : expression génique, structure des transcrits, caractéristiques de l'ARN natif, utilisation d'isoformes spécifiques à un type cellulaire ou interprétation en aval.
Un repère de Nature Communications 2024, Évaluation complète des méthodes de détection des isoformes d'ARNm pour les données de séquençage à long terme, a évalué 13 méthodes provenant de 9 outils pour la détection des isoformes à longues lectures. L'étude a montré que la performance de détection des isoformes peut varier en fonction de la profondeur de lecture, de la complexité du transcriptome, de la complétude des lectures, des erreurs de séquençage, de la complétude de l'annotation et du choix du logiciel.
Cette preuve soutient un point important pour la planification de projets : la découverte d'isoformes n'est pas seulement une décision de séquençage. C'est une décision de flux de travail complet.
| Stratégie | Meilleure adéquation | Valeur de la structure du transcript | Valeur d'analyse de splicing | Valeur de quantification | Sensibilité de l'échantillon | Les besoins en bioinformatique | Notes pratiques |
|---|---|---|---|---|---|---|---|
| Séquençage d'ARN à lecture courte | Expression au niveau des gènes, soutien des jonctions d'épissage, ensembles d'échantillons plus importants | Limité aux structures de transcription intégrale | Utile pour les signaux de découpage au niveau des événements | Fort pour l'expression et la quantification au niveau du groupe | Dépend de la qualité de l'ARN et du type de bibliothèque. | Outils d'alignement, de quantification, d'expression différentielle et d'événements d'épissage | Utile lorsque l'expression génique est l'objectif principal ou lorsque les données de courtes lectures peuvent soutenir la découverte par longues lectures. |
| PacBio Iso-Seq | Découverte d'isoformes de cDNA pleine longueur et affinement de l'annotation | Fort puissant pour les modèles de transcription intégrale | Utile pour les nouveaux isoformes et les structures d'épissage complexes | Peut prendre en charge l'analyse au niveau des isoformes en fonction du design. | Nécessite une qualité d'ARN appropriée et une préparation de bibliothèque. | Reconstruction de transcript, effondrement, classification, annotation | Bon ajustement lorsque des structures d'isoformes complètes à haute confiance sont centrales. |
| Séquençage de transcrits complets par nanopore | Structure de transcription longue et découverte de transcription intégrale flexible | Fort pour des lectures de transcriptions longues et la découverte d'isoformes. | Utile pour l'analyse complexe du splicing et de la structure des transcrits. | Peut prendre en charge la quantification au niveau des transcrits avec un design approprié. | Nécessite un examen attentif de la qualité de l'ARN/cDNA. | Traitement de lecture conscient de l'ONT, reconstruction de transcript, annotation | Bon choix lorsque la longueur de lecture et les preuves de transcriptions longues et flexibles sont importantes. |
| Séquençage d'ARN direct par nanopore | Analyse de l'ARN natif et preuves au niveau des transcrits sans conversion en cDNA. | Utile pour les lectures de transcriptions natives | Peut soutenir des questions sur les isoformes et les caractéristiques de l'ARN. | Dépendant du projet | Sensible à l'intégrité de l'ARN et à la qualité d'entrée | Traitement et interprétation directs sensibles à l'ARN | Utile lorsque les caractéristiques de l'ARN natif, les questions liées à la poly(A) ou les preuves sans amplification sont importantes. |
| Analyse des isoformes à cellule unique | Utilisation d'isoformes spécifiques à un type cellulaire et hétérogénéité | Utile lorsque la diversité des transcriptions dépend de l'état cellulaire. | Peut révéler des motifs d'épissage contextuels des cellules. | Plus complexe et dépendant du design de l'étude. | La manipulation des échantillons et la qualité des cellules sont essentielles. | Analyse des transcrits et des isoformes en tenant compte des cellules uniques | Meilleur lorsque les données en vrac cachent des motifs de transcription spécifiques au type de cellule. |
| Stratégie hybride | Découverte d'isoformes par séquençage long et quantification par séquençage court | Forte lorsque les lectures longues définissent des structures et que les lectures courtes soutiennent la quantification. | Utile pour la comparaison au niveau de groupe sur Discovery Plus. | Forte lorsque les données RNA-seq existantes peuvent être réutilisées. | Dépend des deux types de données. | Intégration des données, affinement du modèle de transcription, quantification, utilisation différentielle | Utile lorsque le projet nécessite à la fois une structure de transcription et une confiance au niveau du groupe. |
Comment nous aidons à sélectionner la stratégie
Avant de recommander un flux de travail, nous examinons votre objectif de recherche, l'état de l'échantillon d'ARN, l'espèce et le statut d'annotation, les données existantes et les besoins en livrables. Cette révision nous aide à élaborer une stratégie adaptée au projet plutôt que de forcer chaque projet dans le même flux de travail de séquençage.
Flux de travail de bout en bout avec points de contrôle de qualité de l'ARN
De l'examen des échantillons d'ARN à la découverte au niveau des transcrits et à la livraison du rapport final.

Nous commençons par examiner votre espèce, le type d'échantillon, le nombre d'échantillons, les groupes expérimentaux, la source d'ARN, l'état du génome de référence et la principale question de recherche. À ce stade, nous clarifions si le projet est axé sur la découverte de nouveaux isoformes, la détection d'événements d'épissage alternatif, l'annotation des transcrits, l'utilisation différentielle des isoformes, le suivi unicellulaire ou l'intégration avec des données RNA-seq existantes.
La qualité de l'ARN est examinée avant la construction de la bibliothèque. Pour la découverte de transcrits complets, l'intégrité de l'ARN est particulièrement importante car un ARN dégradé peut réduire la capacité à reconstruire des structures de transcrits complètes. Si le type d'échantillon ou la qualité de l'ARN ne correspondent pas au flux de travail prévu, nous examinons les ajustements possibles avant de continuer.
Selon la stratégie, les échantillons passent à la séquençage d'ARN à lecture courte, au séquençage de transcrits à lecture longue, au séquençage d'ARN direct, à l'analyse unicellulaire ou à un flux de travail hybride. Les lectures sont traitées, filtrées, alignées ou mappées, et utilisées pour la reconstruction des transcrits lorsque cela est approprié.
Les isoformes connues et nouvelles sont classées et annotées. Les événements d'épissage alternatif sont détectés lorsqu'ils sont soutenus par les données. La quantification au niveau des isoformes et l'analyse de l'utilisation différentielle des isoformes peuvent être ajoutées lorsque la conception de l'étude inclut des groupes ou des conditions appropriés.
Vous recevez des fichiers de sortie et un rapport de projet qui résument le flux de travail, les résultats de contrôle qualité, la logique d'analyse et les principaux types de sortie. Lorsqu'ils sont inclus dans le périmètre du projet, nous pouvons préparer des diagrammes d'isoformes, des graphiques de type sashimi, des cartes thermiques, des pistes de navigateur génomique et des résumés prêts pour les figures.
Exigences d'échantillon et informations sur l'entrée de projet
La qualité de l'échantillon a un effet direct sur la découverte des isoformes et l'analyse du splicing alternatif. L'intégrité de l'ARN est particulièrement importante pour les flux de travail de transcriptome à lecture longue, car un ARN incomplet ou dégradé peut affecter la reconstruction des transcrits.
Les exigences finales de l'échantillon dépendent de l'espèce, du type d'échantillon, de la qualité de l'ARN, de la plateforme et de l'objectif du projet. Avant la confirmation du projet, notre équipe examine les informations ci-dessous et recommande le flux de travail le plus adapté.
| Type d'échantillon ou d'entrée | Ce que nous examinons | Concentration sur la qualité | Points de contrôle QC typiques | Remarques |
|---|---|---|---|---|
| ARN total ou ARN poly(A)+ | Source d'ARN, méthode d'extraction, concentration, pureté, intégrité, historique de l'échantillon | ARN de haute qualité avec une dégradation limitée | Examen de l'intégrité de l'ARN, vérification de la concentration, vérification de la pureté, contrôle de qualité de la bibliothèque | Meilleur pour la découverte de transcriptions complètes et l'analyse de splicing lorsque la qualité de l'ARN soutient le flux de travail. |
| Données de séquençage RNA-seq à lecture courte | Fichiers FASTQ/BAM, version de référence, type de bibliothèque, métadonnées de groupe | Compatibilité avec l'analyse et la quantification au niveau des transcrits | Vérification de l'intégrité des fichiers, lecture QC, révision de la cartographie, révision des métadonnées | Utile pour l'analyse hybride, l'expression différentielle et le support de quantification. |
| Données de séquençage de transcriptome à lecture longue | Source de la plateforme, qualité de lecture, longueur de lecture, étiquettes d'échantillon, version de référence | Lisibilité du transcript et adéquation de la cartographie | Revue de la longueur de lecture, revue de la qualité, revue de l'alignement, revue de la reconstruction du transcript. | Peut soutenir la réanalyse, la découverte d'isoformes et le raffinement de l'annotation. |
| Données de transcriptomique unicellulaire ou spatiale | Métadonnées des cellules ou des points, regroupement d'échantillons, plateforme, annotation des gènes, résultats d'analyses antérieures. | Compatibilité du contexte cellulaire avec l'interprétation au niveau des isoformes | Revue des métadonnées, revue de la qualité des cellules/points, revue de la faisabilité d'intégration | Utile lorsque le type de cellule ou la région tissulaire modifie l'interprétation des isoformes. |
| Matériau tissulaire, cellulaire, végétal, animal, microbien ou environnemental | Méthode de préservation, qualité attendue de l'ARN, faisabilité de l'extraction, source de l'échantillon | Adéquation pour l'extraction d'ARN et le séquençage en aval | Inspection d'échantillons, examen de la faisabilité d'extraction, contrôle de qualité de l'ARN après extraction | Le soutien à l'extraction peut être envisagé lorsque la soumission directe d'ARN n'est pas disponible. |
Analyse bioinformatique et livrables
La principale valeur de cette solution ne réside pas seulement dans le séquençage. La valeur provient de la transformation des preuves de transcription en résultats organisés, réutilisables et interprétables.
Nous nous concentrons sur des résultats que votre équipe peut réellement utiliser : modèles de transcription, tableaux d'événements, matrices d'expression, fichiers d'annotation, pistes de visualisation et rapports qui expliquent ce qui a été fait.
Livrables minimums
- Résumé de la QC des données brutes
- Distribution de la longueur de lecture et de la qualité de lecture
- Résultats de la reconstruction de la transcription
- Catalogue des isoformes complètes
- Classification des isoformes connues et nouvelles
- Table des événements d'épissage alternatif
- Matrice d'expression au niveau des isoformes
Options supplémentaires
- Analyse de l'épissage différentiel
- Détection de transcrits de fusion
- Analyse de la polyadénylation alternative
- Prédiction du potentiel en programmation
- Annotation fonctionnelle et enrichissement
- Analyse des isoformes à cellule unique
- Intégration multi-omiques
Types de fichiers de sortie
- Fichiers FASTQ, BAM ou CRAM le cas échéant
- Fichiers d'annotation de transcrits GTF ou GFF
- Séquences de transcrits FASTA
- Tables d'isoformes et d'événements d'épissage au format TSV ou CSV
- Matrice d'expression des isoformes
- Pistes du navigateur génomique
- rapport de projet au format PDF ou HTML
Comment choisir la bonne isoforme et la stratégie de découverte d'épissage ?
Une stratégie solide commence par la question de la transcriptomique. Nous vous aidons à déterminer quel niveau de preuve et quelle profondeur d'analyse sont nécessaires avant de passer à l'exécution du projet.
Choisissez d'abord le long format lorsque la structure de la transcription est centrale.
Une stratégie de lecture longue en premier est souvent appropriée lorsque votre projet se concentre sur des modèles de transcrits complets, des isoformes nouvelles, des motifs d'épissage complexes, la révision de transcrits de fusion ou le raffinement de l'annotation.
Choisissez un support de lecture courte lorsque la profondeur d'expression est importante.
Le séquençage RNA-seq à lecture courte reste utile lorsque votre projet nécessite un profilage d'expression au niveau de groupe solide, une large couverture d'échantillons ou un soutien à la quantification. Il peut également soutenir une analyse hybride lorsque les longues lectures définissent les structures des transcrits et que les courtes lectures renforcent la comparaison d'expression.
Ajoutez une analyse unicellulaire ou spatiale lorsque le contexte cellulaire est important.
Si l'utilisation des isoformes peut différer selon le type de cellule, l'état de la cellule ou la région tissulaire, la transcriptomique unicellulaire ou spatiale peut apporter un contexte que les données en vrac peuvent manquer.
Ajoutez des bio-informatique personnalisée lorsque l'interprétation est le véritable défi.
Un fichier de modèle de transcript ou un tableau d'événements d'épissage peut ne pas répondre à votre question de recherche à lui seul. La bioinformatique personnalisée peut aider à relier les isoformes et les événements d'épissage aux gènes, aux voies, aux mécanismes candidats, aux différences de groupe ou aux résumés prêts pour la visualisation.
Références
- Évaluation complète des méthodes de détection des isoformes d'ARNm pour les données de séquençage à lecture longue
- Découverte et quantification précises de transcriptions à longues lectures à la résolution de cellule unique, pseudo-groupe et groupe avec Isosceles.
- Le séquençage à long terme de 29 sous-ensembles de cellules immunitaires révèle des isoformes liées à la maladie.
- Le séquençage ciblé à long-reads sur cellule unique révèle une variation transcriptionnelle dans le cancer de l'ovaire.
- Coordination de l'épissage alternatif et de la polyadénylation alternative révélée par le séquençage ciblé à longues lectures
Conformité / Avertissement
CD Genomics propose ce service uniquement à des fins de recherche (RUO). Ce service n'est pas destiné à un diagnostic clinique, à une interprétation médicale directe ou à des tests destinés aux consommateurs.
Résultats de la démo
Les résultats de la démonstration aident votre équipe à comprendre à quoi pourraient ressembler les résultats d'analyse finale avant de commencer le projet. Ces exemples montrent des types de résultats, et non des conclusions biologiques fixes.

Vue de la structure de l'isoforme pleine longueur
Cette sortie montre les modèles de transcrits pour des isoformes connues et nouvelles du même gène, y compris la structure exon-intron, la longueur du transcrit, les régions codantes, les régions non traduites et l'état d'annotation.

Visualisation des événements d'épissage alternatif
Cette sortie montre des motifs d'événements d'épissage, tels que le saut d'exon, la rétention d'intron, des sites d'épissage alternatifs ou des exons mutuellement exclusifs.

Utilisation différentielle des isoformes et point de vue d'interprétation
Cette sortie compare l'utilisation des transcrits entre les groupes et relie les motifs d'isoformes aux gènes candidats, aux voies ou aux annotations fonctionnelles.
FAQ
1. Qu'est-ce que la découverte d'isoformes et l'analyse du splicing alternatif ?
La découverte des isoformes identifie les structures de transcrits complets et de nouveaux variants de transcrits. L'analyse du splicing alternatif détecte comment les exons et les introns sont inclus, omis ou réarrangés à travers les formes de transcrits. Ensemble, ils aident à expliquer la diversité des transcrits au-delà de l'expression au niveau des gènes.
2. Quand le séquençage d'ARN à lecture courte n'est-il pas suffisant pour la transcriptomique ?
Le séquençage RNA-seq à lecture courte peut ne pas suffire lorsque la question principale dépend de la structure des transcrits complets, des isoformes nouvelles, du splicing complexe, du changement de transcrit ou de l'interprétation au niveau des isoformes. Dans ces cas, des stratégies à lecture longue ou hybrides peuvent fournir de meilleures preuves de la structure des transcrits.
3. Quelle est la différence entre la découverte d'isoformes et la détection d'événements d'épissage alternatif ?
La découverte d'isoformes reconstruit des modèles de transcrits et identifie des isoformes de transcrits connues ou nouvelles. La détection d'événements d'épissage alternatif se concentre sur des motifs d'épissage spécifiques, tels que le saut d'exon, la rétention d'intron ou des sites d'épissage alternatifs.
4. Quelles sont les différences entre le séquençage Iso-Seq de PacBio et le séquençage de transcrits complets par Nanopore ?
La méthode PacBio Iso-Seq est souvent utilisée pour la découverte d'isoformes de cDNA de pleine longueur avec une grande confiance. Le séquençage de transcrits de pleine longueur par nanopore fournit des preuves de transcrits à longues lectures et des options de flux de travail flexibles. Le meilleur choix dépend de la qualité de l'ARN, de l'objectif de recherche, du nombre d'échantillons, de la complexité des transcrits et des besoins en analyse en aval.
5. Quand devrais-je envisager le séquençage d'ARN direct par Nanopore ?
Le séquençage direct de l'ARN par nanopore peut être utile lorsque des preuves d'ARN natif, un séquençage sans amplification, des questions liées au poly(A) ou l'analyse des caractéristiques de l'ARN sont importants pour le projet. Il doit être choisi en fonction de la qualité de l'échantillon et des objectifs de recherche.
6. Cette solution peut-elle fonctionner pour des organismes non-modèles ou des échantillons de plantes et d'animaux ?
Oui. De nombreux projets de transcriptome d'organismes non modèles, de plantes et d'animaux peuvent bénéficier de la découverte d'isoformes et du raffinement de l'annotation. La conception du flux de travail dépend de la qualité de l'ARN, de l'état du génome de référence, de l'exhaustivité de l'annotation et du type d'échantillon.
7. Quelles informations sur l'échantillon d'ARN sont nécessaires avant de recommander un flux de travail ?
Nous avons généralement besoin d'informations sur l'espèce, le type d'échantillon, la méthode d'extraction, la qualité de l'ARN, le nombre d'échantillons, les groupes expérimentaux, l'état du génome de référence, les données de séquençage existantes et la question de recherche principale.
8. Quels livrables puis-je attendre de l'analyse des isoformes et du splicing ?
Les livrables peuvent inclure des résumés de contrôle qualité, des résultats de reconstruction de transcrits, des catalogues d'isoformes complètes, des tableaux d'isoformes nouvelles, des tableaux d'événements d'épissage alternatif, des matrices d'expression d'isoformes, des résultats d'utilisation différentielle d'isoformes, des fichiers d'annotation, des pistes de navigateur génomique et un rapport de projet.
9. Les résultats des isoformes peuvent-ils être intégrés avec des données RNA-seq ou de cellules uniques existantes ?
Oui. Les données RNA-seq existantes peuvent soutenir la quantification et la comparaison de groupes. Les données unicellulaires ou spatiales peuvent aider à interpréter l'utilisation des isoformes spécifiques aux types cellulaires ou aux régions tissulaires lorsque la conception de l'étude permet l'intégration.
10. Fournissez-vous des résultats prêts pour la visualisation, tels que des graphiques sashimi ou des pistes de navigateur génomique ?
Oui. Nous pouvons préparer des diagrammes de structure d'isoformes, des graphiques de type sashimi, des cartes thermiques d'utilisation des transcrits, des pistes de navigateur génomique et des résumés prêts pour les figures lorsque ces résultats sont inclus dans le plan d'analyse.
11. Comment devrais-je choisir entre une solution de séquençage uniquement et une solution de découverte complète ?
Le séquençage seul peut suffire si votre équipe dispose déjà d'un pipeline d'analyse au niveau des transcrits validé. Une solution de découverte complète est plus utile lorsque vous avez besoin d'aide pour la sélection de la plateforme, le contrôle de qualité de l'ARN, la reconstruction des transcrits, l'analyse d'épissage, la quantification des isoformes, l'annotation, la visualisation et la production de rapports prêts à l'interprétation.
Cas de littérature : Évaluation comparative de la détection des isoformes à longues lectures pour la découverte de transcrits
Point Forts de la Recherche Publiée
Journal : Communications Nature
Publié : 2024
Contexte
Le splicing alternatif crée des isoformes de transcrits diversifiés, mais le séquençage RNA à courtes lectures ne peut pas toujours reconstruire des transcrits de pleine longueur ni résoudre des structures isoformes complexes. Le séquençage RNA à longues lectures peut améliorer la découverte de la structure des transcrits, mais le résultat final dépend de la plateforme de séquençage, de la qualité des lectures, de l'annotation de référence et du flux de travail computationnel.
Méthodes
L'étude a évalué 13 méthodes provenant de 9 outils pour la détection des isoformes. Elle a utilisé des données simulées de séquençage RNA long-read, des séquences RNA et des ensembles de données expérimentales. Le benchmark a inclus des conditions de données liées à Nanopore et PacBio et a évalué des facteurs tels que la profondeur de lecture, la complexité du transcriptome, l'exhaustivité des lectures, le taux d'erreur de séquençage, l'exhaustivité de l'annotation et l'utilisation des ressources informatiques.
Résultats
- La Fig. 1 montre le flux de travail global de référence, y compris les ensembles de données simulées, les ensembles de données expérimentales publiques de RNA-seq à longues lectures provenant de quatre espèces, les données de sequins, les ensembles de données hESC, la détection des isoformes, la classification, l'analyse de l'utilisation différentielle des isoformes et l'évaluation des ressources informatiques.
- La Fig. 2 présente la précision et la sensibilité dans des paramètres simulés liés à Nanopore et PacBio.
- La figure compare comment la profondeur de lecture, la complexité du transcriptome, l'exhaustivité des lectures, la précision des lectures et l'exhaustivité des annotations affectent la performance de détection des isoformes.
- L'étude soutient la nécessité de planifier la découverte d'isoformes à longues lectures comme un flux de travail de génération de données et de bioinformatique, et pas seulement comme une course de séquençage.
Une étude de référence illustre comment la détection des isoformes à longues lectures dépend de la génération de données, de l'exhaustivité de l'annotation, du choix du logiciel et de l'analyse en aval de l'utilisation différentielle des isoformes.
Conclusion
Ce cas de littérature soutient la logique décisionnelle derrière notre solution d'analyse de découverte d'isoformes et de splicing alternatif. La découverte d'isoformes ne devrait pas être planifiée comme une simple course de séquençage. Elle devrait être considérée comme un flux de travail complet qui relie le contrôle de qualité de l'ARN, la stratégie de séquençage, la reconstruction des transcrits, l'analyse du splicing alternatif, la quantification des isoformes, l'annotation, la visualisation et le reporting.
Publications connexes
Les publications suivantes soutiennent le raisonnement scientifique en faveur du séquençage des transcrits à longues lectures, de la découverte des isoformes, de l'analyse du splicing alternatif et de la bioinformatique au niveau des transcrits.
Journal : Communications Nature
Année : 2024
Journal : Communications Nature
Année : 2024
Journal : Communications Nature
Année : 2024
Journal : Communications Nature
Année : 2024
Journal : Nature Communications
Année : 2023
