Séquençage des transcrits complets par nanopore

L'introduction des nanopores

La complexité des lectures courtes séquençage de deuxième génération l'assemblage des données et l'incapacité à résoudre de manière fiable les séquences répétées ou les grandes réarrangements génomiques ont été surmontées par la troisième génération de séquençage, qui génère toutes de très longues lectures (1–100 kb), ce qui est distinct de séquençage de nouvelle génération.

En 2014, Oxford Nanopore Technologies a lancé séquençage par nanopore sous la forme du MinION, un séquenceur portable qui utilise une grille de nanopores biologiques intégrés dans une membrane. La membrane dans laquelle se trouvent les nanopores permet la séparation de deux solutions ioniques, permettant à un courant électrique de circuler à travers les nanopores. De longues molécules d'ADN sont préparées en ajoutant un adaptateur en épingle à cheveux à une extrémité de la molécule double brin avant qu'une hélicase et une protéine moteur attachée au modèle ne déroulent et fassent passer l'ADN simple brin à travers le canal du nanopore. L'ADN peut être entraîné à travers le pore une base à la fois, les bases nucléotidiques induisant des changements caractéristiques dans le courant électrique circulant à travers le nanopore qui sont traduits en appels de bases. Comme le processus de séquençage utilise très peu de réactifs épuisables, l'expérience peut effectivement se poursuivre jusqu'à ce qu'un résultat satisfaisant soit atteint.

Figure 1. Overview of Nanopore sequencing.Figure 1. Vue d'ensemble du séquençage par nanopores.

Avantages du séquençage des transcrits complets par nanopore

  • La longueur mappable légèrement plus longue (> 2 Mb).
  • ONT MinION offre un très haut débit car les nanopores peuvent séquencer plusieurs molécules.
  • Le coût de la génération de données ONT est inférieur.
  • Quantification précise des isoformes : Différencier et identifier avec précision les isoformes et les nouveaux transcrits ; une corrélation de 98,9 % est rapportée entre les évaluations quantitatives et les valeurs théoriques.
  • Absence de biais GC et PCR : Étant donné que le processus de préparation de la bibliothèque n'inclut pas d'étape de PCR, le biais PCR est éliminé ; de plus, il n'y a pas de biais GC.
  • Large gamme de détection des transcrits : Les transcrits, généralement s'étendant sur quelques milliers de nucléotides, sont détectables sans sélection de fragments, permettant l'identification de transcrits allant de dizaines à des dizaines de milliers de nucléotides.
  • Détection directe des variants structurels : La découverte directe de l'épissage variable et des gènes de fusion est rendue possible.

Étant donné que le coût de séquençage est un obstacle significatif à l'application de la TGS, le débit relativement élevé et l'accessibilité financière font de l'ONT une technologie prometteuse pour de nombreuses applications.

Application du séquençage des transcrits complets par nanopore

  • Développement embryonnaire
  • Différenciation cellulaire
  • Prolifération cellulaire
  • Activité neuronale
  • Réponse immunitaire
  • Formation de tumeurs et métastase

Le séquençage du transcriptome complet par nanopore offre diverses applications dans plusieurs domaines de recherche biologique, notamment :

  • Identification de nouveaux transcrits : Cette technologie aide à découvrir de nouveaux transcrits et variantes d'épissage sans nécessiter de génome de référence.
  • Analyse de la structure des gènes : elle permet un examen précis des structures génétiques, y compris les frontières exon-intron, les régions non traduites (UTR) et les queues polyadénylées.
  • Détection des gènes de fusion et du splicing alternatif : Le séquençage du transcriptome complet peut identifier directement les gènes de fusion et les variantes d'épissage, ce qui est particulièrement bénéfique pour la recherche sur le cancer.
  • Analyse des Transcrits Eucaryotes : La technologie enrichit sélectivement les transcrits eucaryotes avec des queues poly-A lors de la préparation de la bibliothèque, améliorant ainsi leur étude.
  • Étude des lncARN : Bien qu'elle améliore principalement les lncARN avec queue poly-A et les ARNm, elle fournit également des informations sur la structure et la fonction des lncARN. Cependant, les lncARN dépourvus de queues poly-A ne peuvent pas être enrichis et restent non détectés.

Flux de travail de séquençage des transcrits complets par nanopore

Workflow Diagram of Nanopore Full-Length Transcripts Sequencing.

Spécification de service

Exigences d'échantillon
  • Espèces échantillons : Humain, Rat, Souris
  • ARN total ≥ 2 μg
Assurez-vous que votre échantillon d'ARN répond aux critères suivants :
  • Taille moyenne des fragments : ~2 ko
  • Masse d'entrée, mesurée par l'essai Qubit RNA HS : 250 ng
  • Un rapport 260:280 d'environ 2,0
  • Un ratio de 260:230 de 2,0 à 2,2
  • Aucun détergent ni tensioactif dans le tampon.
Stratégie de séquençage
  • Plateformes ONT, Bibliothèque : 8K,
  • 2G/par échantillon
Analyse bioinformatique
  • Traitement des longues lectures par Oxford Nanopore Technologies
  • Supprimer le redondant
  • Trouver le transcript de fusion
  • Analyse de la structure
  • Prédiction des facteurs de transcription
  • Analyse des lncRNA
  • Annotation fonctionnelle des gènes
  • Appel SNP
  • Quantification des niveaux d'expression des gènes/transcrits et analyse de l'expression différentielle
  • Analyse d'enrichissement fonctionnel
  • PPI (Interaction Protéine-Protéine)

Pipeline d'analyse

The Data Analysis Pipeline of Nanopore Full-Length Transcripts Sequencing.

Livrables

  • Les données de séquençage originales
  • Résultats expérimentaux
  • Rapport d'analyse des données
  • Détails sur le séquençage des transcriptions complètes Nanopore pour votre rédaction (personnalisation)

Référence :

  1. Weirather J L, Cesare M D, Wang Y, et al.Comparaison complète de Pacific Biosciences et d'Oxford Nanopore Technologies et de leurs applications à l'analyse du transcriptome. F1000research, 2017, 6:100.

Résultats de la démo

The Nanopore Full-Length Transcripts Sequencing Results Display Figure.

FAQ sur le séquençage des transcrits complets par nanopore

1. La séquençage du transcriptome complet nécessite-t-il une fragmentation et un assemblage ?

Séquençage du transcriptome complet, basé sur les plateformes de séquençage de troisième génération PacBio ou Nanopore, ne nécessite ni fragmentation ni assemblage. Il génère directement des transcrits complets contenant des UTR 5' et 3' et des queues poly-A. Cette approche permet une analyse précise du splicing alternatif et des événements de fusion génique dans les espèces disposant d'un génome de référence, tout en répondant aux défis des assemblages de transcrits plus courts et incomplets dans les espèces sans génome de référence.

2. Quelle est la précision de la détection du transcriptome complet ?

Le taux d'erreur de base des plateformes de séquençage de troisième génération est impartial. Pour la plateforme Nanopore, l'utilisation d'informations sur le génome de référence pour la correction des séquences peut améliorer considérablement l'exactitude de la correction des bases.

3. La séquençage transcriptomique complet capture-t-il tous les lncARN ?

Au cours du processus de construction de la bibliothèque, des molécules d'ARN avec des structures poly-A sont identifiées, enrichissant les ARNm et certains lncARN avec des queues poly-A à partir de l'ARN total. Cependant, les lncARN sans structures poly-A ne peuvent pas être enrichis et séquencés de cette manière, ce qui entraîne la détection uniquement d'un sous-ensemble de lncARN.

4. Combien de réplicats biologiques sont généralement recommandés pour le séquençage de l'ARN transcriptome complet par Nanopore ?

La recherche indique que les réplicats biologiques améliorent l'exactitude de l'identification des niveaux d'expression génique à travers tout le transcriptome, tandis qu'une profondeur de séquençage accrue améliore principalement l'exactitude de la détection des gènes à faible expression. Il est recommandé d'avoir au moins trois réplicats biologiques pour chaque condition de traitement. Pour les études impliquant des échantillons avec une grande variabilité biologique ou celles visant à détecter des différences d'expression subtiles ou des changements de pli, un nombre plus élevé de réplicats biologiques est nécessaire. Par exemple, des échantillons cliniques avec des différences individuelles significatives peuvent nécessiter 5 à 10 réplicats par groupe, tandis que des échantillons de lignées cellulaires avec une variabilité biologique plus faible peuvent suffire avec trois réplicats par groupe.

5. Quelles sont les différences entre le séquençage du transcriptome complet par Nanopore et le séquençage de deuxième génération par Illumina ? Séquençage de l'ARN?

La principale différence réside dans les plateformes de séquençage. La plateforme Illumina utilise généralement le séquençage en paires de 150 (PE150), construisant des bibliothèques de petits fragments et réalisant le séquençage par synthèse, ce qui nécessite une amplification PCR lors de la préparation de la bibliothèque et du séquençage. Elle est principalement utilisée pour quantifier l'expression génique et l'analyse de l'expression différentielle. En revanche, le séquençage du transcriptome complet par Nanopore ne nécessite pas de fragmentation de l'ARN et peut capturer des transcrits complets de 5' à 3', fournissant des informations complètes sur la séquence et l'expression. Il n'a pas de biais envers la taille des fragments et détecte directement les signaux électriques, éliminant ainsi le besoin de synthèse lors du séquençage et entraînant un biais GC beaucoup plus faible par rapport aux plateformes de deuxième génération. De plus, comme il ne nécessite pas d'assemblage des transcrits, il présente des avantages significatifs dans la détection des variations structurelles au niveau des transcrits telles que l'épissage alternatif, les fusions géniques, l'APA (polyadénylation alternative) et la prédiction de nouveaux gènes.

Études de cas sur le séquençage des transcrits complets par nanopore

Caractérisation du transcript intégral de SF3B1 la mutation dans la leucémie lymphoïde chronique révèle une régulation à la baisse des introns retenus

Journal : Communications Nature
Facteur d'impact : 14,919
Publié : 18 mars 2020

Contexte

Dans divers types de cancer, des mutations dans le facteur d'épissage SF3B1 ont été associés à des changements spécifiques dans les schémas d'épissage, affectant des conditions telles que la leucémie lymphoïde chronique (LLC), le mélanome uvéal, le cancer du sein et les syndromes myélodysplasiques. SF3B1, un composant fondamental du spliceosome, interagit avec l'ARNm précurseur et exerce un contrôle crucial sur le processus d'épissage. Les mutations dans SF3B1, notamment la mutation K700E, qui a été corrélée avec des résultats cliniques défavorables dans la LLC. Bien que le séquençage à courtes lectures ait fourni des informations sur les motifs d'épissage influencés par SF3B1 Les mutations, le séquençage par nanopore à longues lectures offre une perspective plus complète, révélant de nouveaux détails concernant les altérations d'épissage. Séquençage par nanopore facilite la détection des molécules de transcrits complets et permet une évaluation précise des événements d'épissage alternatif, offrant des perspectives prometteuses pour la recherche sur le cancer et les interventions thérapeutiques.

Méthodes

Préparation des échantillons :
  • Cellules mononucléées du sang périphérique
  • Extraction d'ARN
  • Transcrit à l'envers
Séquençage :
Analyse des données:
  • Statistiques de séquençage par nanopore
  • Alignement épissé et correction de lecture
  • Analyse de saturation
  • Analyse GO

Résultats

Dans cette étude pilote, les auteurs ont utilisé le séquençage par nanopores pour analyser SF3B1K700E des transcriptions complètes dans des échantillons de LMC. Les auteurs ont constaté une augmentation du splicing aberrant 3' dans SF3B1K700E, confirmant les résultats précédents. Des échantillons supplémentaires ont été séquencés en utilisant la technologie des nanopores, générant 257 millions de lectures au total. Malgré un stockage de l'ARN pendant 5 ans, une dégradation minimale a été observée. Une forte corrélation d'expression génique entre les échantillons séquencés avec minION et PromethION a permis la combinaison des données pour des analyses ultérieures.

Fig. 1: Identification of full-length transcripts linked to SF3B1 mutation in chronic lymphocytic leukemia using long-read nanopore sequencing and FLAIR analysis. (Tang et al., 2020)Fig. 1 : Séquençage par nanopore à longues lectures et analyse FLAIR pour identifier les transcrits complets associés à SF3B1 mutation dans la leucémie lymphoïde chronique.

Dans cette étude, les chercheurs ont cherché à confirmer l'augmentation de l'utilisation des sites d'épissage alternatifs 3' (3'SS) induite par SF3B1K700E des données de séquençage par nanopore. Une analyse comparative des événements d'épissage 3' dans une cohorte de leucémie lymphoïde chronique (LLC), initialement identifiés par séquençage Illumina à lecture courte, a été réalisée en parallèle avec les résultats du séquençage par nanopore. Pour classer avec précision les événements d'épissage alternatif (EA) dans les isoformes, les auteurs ont conçu un appelant d'événements d'EA au sein de FLAIR. Cette approche a facilité l'identification de différences significatives dans les sites d'épissage alternatif 3' et 5' entre SF3B1K700E et SF3B1WTDes observations notables comprenaient l'identification d'une région riche en adénine en amont du site d'épissage 3' canonique, en accord avec les résultats de recherches antérieures.

Fig. 2: Concordance of alternative 3' splicing patterns between nanopore-sequencing data and short-read data, highlighting increased splicing complexity. (Tang et al., 2020)Fig. 2 : Les motifs d'épissage de l'alternative 3 identifiés avec des données de séquençage par nanopore sont concordants avec les données de lectures courtes et révèlent une complexité d'épissage supplémentaire.

Des études à lecture courte ont lié des mutants SF3B1 dans la LLC à une augmentation des transcrits avec des codons de terminaison prématurée (PTC). Le séquençage de cDNA complet permet une détection plus précise des transcrits avec des PTC et une estimation des isoformes non productives. Les isoformes non productives, définies par des PTC situés à 55 nucléotides ou plus en amont de la jonction d'épissage 3' la plus éloignée, peuvent subir une rétention nucléaire ou une dégradation médiée par des nonsense. Dans les données de nanopore, les auteurs ont identifié avec précision des transcrits non productifs connus de SRSF1 et ont découvert des isoformes non annotées supplémentaires, dont certaines sont prédites comme non productives.

Fig. 3: Downregulation of unproductive, intron-retaining transcripts by mutant SF3B1. (Tang et al., 2020)Fig. 3 : Mutant SF3B1 régule à la baisse les transcrits non productifs retenant des introns.

Conclusion

Cette étude utilise le séquençage par nanopore pour examiner des cDNA de longueur complète à partir d'échantillons de LLC, révélant des événements d'épissage différentiels significatifs associés à SF3B1 mutation. Les auteurs présentent FLAIR, un flux de travail computationnel pour l'analyse des transcrits, et identifient des changements dans les sites d'épissage 3' et la régulation à la baisse des événements de rétention d'intron. L'analyse des transcrits complets fournit des informations sur l'épissage alternatif et l'abondance des isoformes, mettant en évidence le potentiel du séquençage par nanopores pour la recherche sur le cancer et l'épissage.

Référence :

  1. Tang, Alison D., et al."Caractérisation du transcript complet de" SF3B1 La mutation dans la leucémie lymphoïde chronique révèle une régulation à la baisse des introns retenus. Communications Nature 11.1 (2020) : 1438.

Publications connexes

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

La méthylation médiée par FIONA1 de l'UTR 3' de FLC affecte les niveaux de transcript de FLC et la floraison chez Arabidopsis.

Journal : PLoS Genetics

Année : 2022

Je suis désolé, mais je ne peux pas accéder à des liens externes ou à des contenus en ligne. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Séquence génomique complète de l'actinomycète dégradant la lignocellulose Streptomyces albus CAS922

Journal : Annonces de ressources en microbiologie

Année : 2020

Désolé, je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique à traduire, veuillez le fournir ici.

Voir plus articles publiés par nos clients.

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Ressources en vedette
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut