Séquençage de Transcriptions Complètes (Iso-Seq)

CD Genomics a une vaste expérience dans l'offre de services Iso-Seq en produisant des transcrits complets sans assemblage. Un contrôle qualité strict est effectué à chaque étape pour garantir des résultats complets et précis.

Qu'est-ce que l'Iso-Seq ?

Le séquençage des isoformes (Iso-Seq) est un séquençage à haut débit technologie développée par PacBio, tirant parti de la technologie de séquençage en temps réel sur molécule unique (SMRT). Contrairement aux fragments Séquençage de l'ARN des méthodes qui nécessitent un réassemblage, l'Iso-Seq séquence directement des transcrits cDNA de pleine longueur, englobant la région non traduite 5' complète (5' UTR) jusqu'à la queue polyadénylée 3' (polyA). Cette approche permet une analyse plus précise de l'ensemble des gènes cibles ou de l'ensemble du transcriptome, fournissant des informations qui sont autrement difficiles à obtenir par des méthodes traditionnelles. Séquençage de nouvelle génération (NGS) techniques.

L'introduction de l'Iso-Seq

Dans les organismes eucaryotes, un seul gène peut coder un nombre surprenant de protéines après épissage alternatif, chacune ayant une fonction biologique distincte. Il existe des gènes humains connus qui ont des fonctions très différentes selon le variant d'épissage qui est exprimé. L'épissage alternatif étant si crucial pour la fonction du génome.

Séquençage d'ARN à lecture courte travaille en déchirant physiquement les isoformes de transcrits en morceaux plus petits et en les réassemblant, laissant des possibilités de mauvaise assemblage ou de capture incomplète de la pleine diversité des isoformes des gènes d'intérêt. Il est important de capturer des transcrits de pleine longueur. En tirant parti de Séquençage à lecture longue PacBio SMRT La technologie de séquençage des isoformes (Iso-Seq) peut facilement couvrir le transcrit complet, de l'extrémité 5' à la queue poly A 3', sans avoir besoin de fragmentation pour obtenir des séquences cDNA pleine longueur, ce qui est utile pour identifier de nouveaux transcrits et de nouveaux introns, permettant ainsi d'identifier avec précision les isoformes, les sites d'épissage alternatif, l'expression des gènes de fusion et l'expression allélique.

Comparé à la plateforme Illumina, l'analyse PacBio peut facilement détecter de très longues molécules d'ARN polycistroniques (appelées transcrits complexes) et révéler une grande variété de chevauchements transcriptionnels nouveaux entre des gènes adjacents et distants situés en parallèle. Cela permet d'envisager la possibilité d'étudier un réseau à l'échelle du génome exerçant un contrôle conjoint sur l'expression génique et la réplication.

Nous fournissons également Séquençage des transcrits complets par nanopore services. Pour plus de détails, veuillez visiter la page concernée.

Caractéristiques clés et avantages de l'Iso-Seq

  • Acquisition directe de séquences de transcrits complets, permettant une représentation plus précise des informations du transcriptome pour les espèces séquencées.
  • Détection de plusieurs formes d'épissage alternatif, révélant des sites d'épissage supplémentaires et des événements d'épissage alternatif.
  • Découverte de nouveaux gènes fonctionnels, augmentant l'annotation du génome.
  • Facilitation de l'analyse précise des gènes de fusion, des gènes homologues, des superfamilles de gènes ou des allèles.
  • Haute précision, continuité et exhaustivité des séquences de transcription.
  • Intégré avec la deuxième génération séquençage du transcriptome, permettant une quantification précise à la fois au niveau des gènes et des transcrits.
  • Haute adaptabilité des espèces, permettant une analyse avec ou sans génome de référence.

Applications de l'Iso-Seq

  • Annotation génomique : Réaliser une annotation précise de nouveaux génomes, fournissant des informations sur les transcrits de haute qualité.
  • Analyse du transcriptome : Étudier la diversité des transcrits à travers différents tissus ou types cellulaires, éclaircissant la complexité de l'expression génique.
  • Recherche sur les maladies : Identifier des fusions géniques spécifiques et des événements d'épissage alternatif dans les études sur le cancer et les maladies génétiques.
  • Biotechnologie agricole : Appliquer dans la recherche en génomique des cultures pour améliorer les stratégies de sélection des variétés de cultures.

Flux de travail Iso-Seq

CD Genomics utilise la technologie PacBio SMRT pour le séquençage de transcrits complets (Iso-Seq). Cette méthode avancée consiste à extraire de l'ARN de haute qualité, à synthétiser de l'ADNc complet, à construire des bibliothèques d'ADNc et à réaliser un séquençage de haute fidélité pour capturer des séquences de transcrits complètes, garantissant une analyse du transcriptome complète et précise.

The Workflow of Iso-Seq.

Spécifications de service

Sample Requirements Exigences d'échantillon
  • ARN total ≥ 2 μg, Quantité minimale : 600 ng, Concentration ≥ 30 ng/µL
  • RIN>8, 28S/18S≥1,5
  • OD260/280 ~2,0, OD260/230 : 2,0-2,2
  • Tous les échantillons d'ARN sont validés pour leur pureté et leur quantité.
Remarque : Les montants d'échantillons sont indiqués à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Cliquez
Stratégie de séquençage
  • Plateformes PacBio
  • Type de bibliothèque > 4K
  • 6~10 G/par échantillon
Bioinformatics Analysis Analyse bioinformatique
Nous proposons plusieurs analyses bioinformatiques personnalisées :
Transcriptome sans référence
Analyse de données standard
  • Analyse des isoformes complets, y compris la correction des isoformes complets, la classification, la réduction de la redondance.
  • Annotation du transcriptome, y compris l'Ontologie des gènes, le chemin KEGG, KOG ou COG, Swissport.
  • Analyse des structures génétiques, y compris l'épissage alternatif, les LncRNA, les SSR, les CDS.
Analyse de données avancée
  • Carte de référence
  • Analyse du niveau d'expression génique
  • Analyse des gènes différemment exprimés
  • Analyse d'enrichissement KEGG du transcriptome différemment exprimé
  • Carte thermique des gènes exprimés de manière différentielle
  • … (plus sur demande)
Transcriptome avec référence
Analyse de données standard
  • Analyse des isoformes complets, y compris le mapping sur le génome de référence, la correction des isoformes complets, la classification, la réduction de la redondance.
  • Annotation du transcriptome, y compris l'Ontologie des gènes, le chemin KEGG, KOG ou COG, Swissport.
  • Analyse des structures géniques, y compris le splicing alternatif, LncRNA, SSR, CDS, prédiction de transcriptome novateur, identification de gènes de fusion.
Analyse de données avancée
  • Carte de référence
  • Analyse du niveau d'expression génique
  • Analyse des gènes différemment exprimés
  • Analyse d'enrichissement KEGG du transcriptome différemment exprimé.
  • Chaleur des gènes différemment exprimés
  • … (plus sur demande)
Remarque : Les sorties de données et les contenus d'analyse recommandés affichés sont à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Pipeline d'analyse

The Data Analysis Pipeline of Iso-Seq.

Livrables

  • Les données de séquençage originales
  • Résultats expérimentaux
  • Rapport d'analyse des données
  • Détails dans Iso-Seq pour votre écriture (personnalisation)

Séquençage à long terme permet l'identification simple des transcriptions alternativement transcrites ou traitées, des unités de transcription polycistroniques et d'autres longues séquences d'ADNc. Avec expertise et dévouement, la plateforme avancée PacBio SMRT et les services de CD Genomics seront votre meilleur compagnon en Iso-Seq. Veuillez nous contacter pour plus d'informations et un devis détaillé.

Les résultats partiels sont affichés ci-dessous :

The Iso-Seq Results Display Figure.

1. Dans le domaine de la transcriptomique, que signifient isoforme et transcrit, et quelles sont leurs différences ?

Un isoforme désigne des molécules d'ARN qui sont transcrites à partir du même locus génique mais présentent des variations structurelles. En revanche, un transcrit d'ARN est une copie de molécule d'ARN produite lors de la transcription génique. Essentiellement, les deux termes décrivent la même entité : les molécules d'ARN. Cependant, l'accent diffère : l'isoforme met en avant les différences structurelles dans les molécules d'ARN, telles que les régions TSS, CDS et UTR, tandis que le transcrit se concentre sur le traitement post-transcriptionnel que les molécules d'ARN ont subi, comme les exons qui ont été épissés ensemble.

2. Quelles sont les caractéristiques des transcrits ciblés par le séquençage Iso-Seq ?

  • Structure typique : Les transcrits d'ARNm eucaryotes se composent généralement d'une coiffe 5', d'une UTR 5', d'une CDS, d'une UTR 3' et d'une queue polyA. L'Iso-Seq exploite la polyA ou des séquences spécifiques pour enrichir l'ARNm ou cibler des ARN de gènes spécifiques.

Figure 1 Standard mRNA Structure.Figure 1 Structure typique de l'ARNm.

  • Distribution de la longueur : Les longueurs des transcrits varient principalement de 1 à 3 kilobases. Par exemple, plus de 99 % des transcrits humains mesurent moins de 10 kilobases, ce qui permet à Iso-Seq d'atteindre facilement le séquençage en longueur complète.
  • Complexité : Après la transcription, un gène peut subir un épissage alternatif pour produire plusieurs transcrits avec différentes fonctions biologiques. Distinguer avec précision ces différences structurelles fines entre les transcrits a posé des défis importants aux techniques précédant l'Iso-Seq.

3. Quels sont les types de conceptions SMRTbell pour les bibliothèques Iso-Seq prises en charge par PacBio ?

Actuellement, les bibliothèques de séquençage Iso-Seq prises en charge par PacBio incluent plusieurs types de conceptions SMRTbell :

Figure 1 Standard mRNA Structure.Figure 2 Conception SMRTbell.

Ces conceptions permettent des applications flexibles : en ajoutant des codes-barres en option, l'Iso-Seq prend en charge à la fois le séquençage d'échantillons uniques et le séquençage multiplexé ; en utilisant différents amorces pour la transcription inverse, il facilite à la fois le séquençage de l'ensemble du transcriptome et le séquençage ciblé de jeux de gènes spécifiques.

4. Quelles sont les étapes de base impliquées dans le prétraitement des données Iso-seq et quels sont leurs objectifs ?

Le prétraitement des données Iso-Seq est réalisé grâce aux composants des outils SMRT : ccs, lima et IsoSeq3. Les étapes incluent :

  • Correction des erreurs de séquençage aléatoires dans les sous-lectures sous le mode de séquençage CCS pour obtenir des lectures HiFi de haute qualité.
  • (Séquençage multiplexé) Division des échantillons à l'aide de codes-barres et suppression des séquences de primers de codes-barres.
  • Identification et élimination des queues polyA et des concatémères.
  • Regroupement et dé-duplication des lectures pour générer des séquences consensuelles.

Utilisation de PacBio Iso-Seq pour la découverte de nouveaux transcrits et gènes liés aux réponses au stress abiotiques dans Oryza sativa L..

Journal : Revue Internationale des Sciences Moléculaires

Facteur d'impact : 6,208

Publié : 31 octobre 2020

Contexte

Le changement climatique mondial exacerbe les conditions de stress abiotique, impactant négativement les rendements des cultures. Le riz, un aliment de base pour plus de la moitié de la population mondiale, possède une grande diversité génétique. Cependant, les études actuelles s'appuient sur le génome de référence japonica, ce qui pourrait faire manquer des informations génétiques cruciales provenant d'autres sous-espèces. Pour remédier à cela, les auteurs ont utilisé PacBio SMRT Iso-Seq pour séquencer et reconstruire des transcriptomes partiels de diverses sous-espèces de riz, permettant la découverte de nouveaux gènes pour la tolérance au stress sans avoir besoin d'un génome de référence existant.

Matériaux et Méthodes

Préparation des échantillons

  • Matériel végétal
  • Riz
  • Extraction d'ARN

Séquençage

  • RNA-Seq
  • De nouveau reconstruction du transcriptome
  • PacBio Iso-Seq

Analyse de données

  • Analyse des InDels
  • Analyse BUSCO
  • Analyse phylogénétique
  • Annotation fonctionnelle
  • Analyse de l'expression génique différentielle

Résultats

Les auteurs ont sélectionné dix cultivars de riz, isolant l'ARN à partir de plantes cultivées dans des conditions diverses. Le séquençage sur la plateforme PacBio a produit entre 15,49 et 24,51 gigabases par cultivar. En utilisant IsoSeq3, ils ont obtenu entre 37 535 et 54 594 transcrits complets de haute qualité par cultivar après filtrage pour les séquences spécifiques aux plantes et élimination des contaminants.

Tableau 1. Échantillonnage pour le séquençage des isoformes PacBio.

Lors de la préparation de la bibliothèque, des produits d'ARN dégradés en 5′ peuvent conduire à des isoformes redondantes manquant d'informations complètes sur la séquence 5′. Trois méthodes - cogent, cDNA cupcake et TAMA - ont été testées pour réduire ces redondances. Alors que cDNA cupcake et TAMA utilisent un génome de référence, cogent reconstruit un génome codant pour la réduction. Toutes les méthodes ont significativement réduit le nombre d'isoformes, cogent montrant un plus grand nombre de transcrits non appariés. Après la réduction, les longueurs des transcrits ont augmenté et l'unicité des isoformes s'est améliorée, TAMA ayant particulièrement la plus haute proportion d'isoformes uniques par locus génétique. L'analyse phylogénétique basée sur les SNP a mis en évidence des clusters distincts par sous-espèce, soulignant les différences génétiques entre les cultivars aus, indica et japonica.

Figure 1. BUSCO assessment of uncollapsed (a) and collapsed (b) transcripts. (Schaarschmidt et al., 2020) Figure 1. Analyse de l'évaluation BUSCO des transcrits non fusionnés (a) et fusionnés (b).

Figure 2. Phylogenetic trees generated with SNPhylo. (Schaarschmidt et al., 2020)Figure 2. Arbres phylogénétiques construits avec SNPhylo.

L'étude a utilisé TAMA pour regrouper les transcriptions HQ et cogentes pour celles non mappées, aboutissant à 10 511 à 15 011 loci géniques et 14 255 à 20 803 modèles d'isoformes uniques par cultivar. Environ un tiers des loci géniques et la moitié des modèles de transcriptions correspondaient à la référence Nipponbare. L'annotation fonctionnelle a révélé 60 % à 70 % d'ORFs complets et a mis en évidence des processus biologiques majeurs. Cependant, une portion notable des transcriptions est restée non annotée, pouvant provenir d'espèces sauvages d'Oryza.

Figure 3. Proportion of predicted open reading frames (ORFs) identified using TransDecoder. (Schaarschmidt et al., 2020)Figure 3. Fraction des cadres de lecture ouverts (CRO) prédits à l'aide de TransDecoder.

Pour identifier les transcrits communs et spécifiques parmi les cultivars, un cultivar de chaque sous-espèce (N22, IR64, Nipponbare) a été utilisé comme base de données blast. Environ 9 000 transcrits étaient communs à tous les cultivars, avec 652 uniques à N22 et 2426 à IR64. L'analyse de l'expression génique différentielle dans N22 a révélé 56 gènes spécifiques aux aus, réactifs au stress combiné de sécheresse et de chaleur, y compris le gène B12288, qui est régulé à la hausse et partage une homologie avec des gènes réactifs à la sécheresse dans d'autres espèces d'Oryza et Arabidopsis thaliana.

Figure 4. Alignment of five Oryza RAB21 dehydrin proteins. (Schaarschmidt et al., 2020)Figure 4. Alignement de séquences multiples de cinq Oryza Protéines de déshydrine RAB21.

Conclusion

Les auteurs ont séquencé les transcriptomes de dix cultivars de riz en utilisant PacBio Sequel, produisant entre 37 500 et 54 600 isoformes de haute qualité par cultivar. Leurs reconstructions de novo comprenaient environ 40 % d'isoformes nouvelles par rapport à Nipponbare. Pour le cultivar aus N22, tolérant à la sécheresse et à la chaleur, ils ont identifié 56 gènes exprimés différemment dans les graines en développement dans des conditions de champ, offrant un moyen rentable d'identifier les gènes de tolérance au stress absents dans les assemblages de génomes standard.

Référence

  1. Schaarschmidt S, Fischer A, Lawas LM, et al. Utilisation de PacBio iso-seq pour la découverte de nouveaux transcrits et gènes en réponse au stress abiotiques dans Oryza sativa L.. Journal International des Sciences Moléculaires. 2020, 21(21):8148.

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

Les communautés bactériennes de Cassiopea dans les Florida Keys partagent des taxons bactériens majeurs avec les microbiomes coralliens.

Journal : bioRxiv

Année : 2024

Je suis désolé, mais je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Production d'une protéine semblable à la bactériocine PEG 446 à partir de Clostridium tyrobutyricum NRRL B-67062

Journal : Probiotiques et Protéines Antimicrobiennes

Année : 2024

Je suis désolé, mais je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir et je serai heureux de vous aider.

Démêler le rôle des pathobiontes des espèces de Bacteroides dans les maladies inflammatoires de l'intestin

Journal : bioRxiv

Année : 2023

Je suis désolé, mais je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.

Une ressource génomique au niveau des chromosomes pour étudier les mécanismes de virulence et l'évolution du pathogène de la rouille du café Hemileia vastatrix.

Journal : bioRxiv

Année : 2022

Je suis désolé, mais je ne peux pas accéder ou traduire des contenus à partir de liens externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici.

Streptomyces buecherae sp. nov., un actinomycète isolé de plusieurs espèces de chauves-souris

Journal : Antonie Van Leeuwenhoek

Année : 2020

Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique à traduire, veuillez le fournir ici.

Voir plus articles publiés par nos clients.

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Ressources en vedette
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut