L'introduction des nanopores
La complexité des lectures courtes séquençage de deuxième génération l'assemblage de données et l'incapacité à résoudre de manière fiable les séquences répétées ou les grandes réarrangements génomiques ont été surmontées par la troisième génération de séquençage, qui génère toutes de très longues lectures (1 à 100 kb), ce qui est distinct de séquençage de nouvelle génération.
En 2014, Oxford Nanopore Technologies a lancé séquençage par nanopore sous la forme du MinION, un séquenceur portable qui utilise une grille de nanopores biologiques intégrés dans une membrane. La membrane dans laquelle se trouvent les nanopores permet la séparation de deux solutions ioniques, permettant à un courant électrique de circuler à travers les nanopores. De longues molécules d'ADN sont préparées en ajoutant un adaptateur en épingle à cheveux à une extrémité de la molécule double brin avant qu'une hélicase et une protéine motrice attachée au modèle ne déroulent et ne fassent passer l'ADN simple brin à travers le canal du nanopore. L'ADN peut être avancé à travers le pore base par base, les bases nucléotidiques induisant des changements caractéristiques dans le courant électrique circulant à travers le nanopore, qui sont traduits en appels de bases. Comme le processus de séquençage utilise très peu de réactifs épuisables, l'exécution peut continuer efficacement jusqu'à ce qu'un résultat satisfaisant soit obtenu.
Figure 1. Aperçu du séquençage par nanopore.
Avantages du séquençage des transcrits complets par nanopore
- La longueur mappable légèrement plus longue (> 2 Mb).
- ONT MinION offre un très haut débit car les nanopores peuvent séquencer plusieurs molécules.
- Le coût de la génération de données ONT est inférieur.
- Quantification précise des isoformes : différenciation et identification exactes des isoformes et des nouveaux transcrits ; une corrélation de 98,9 % est rapportée entre les évaluations quantitatives et les valeurs théoriques.
- Absence de biais PCR et GC : Étant donné que le processus de préparation de la bibliothèque n'inclut pas d'étape de PCR, le biais PCR est éliminé ; de plus, il n'y a pas de biais GC.
- Large éventail de détection des transcrits : Les transcrits, généralement s'étendant sur quelques milliers de nucléotides, sont détectables sans sélection de fragments, permettant l'identification de transcrits allant de dizaines à des dizaines de milliers de nucléotides.
- Détection directe des variants structurels : La découverte directe de l'épissage variable et des gènes de fusion est rendue possible.
Étant donné que le coût du séquençage est un obstacle majeur à l'application de la TGS, le débit relativement élevé et l'accessibilité financière d'ONT en font une solution prometteuse pour de nombreuses applications.
Application du séquençage des transcrits complets par nanopore
- Développement embryonnaire
- Différenciation cellulaire
- Prolifération cellulaire
- Activité neuronale
- Réponse immunitaire
- Formation de tumeurs et métastases
Le séquençage du transcriptome complet par nanopore offre diverses applications dans différents domaines de recherche biologique, notamment :
- Identification de nouveaux transcrits : Cette technologie aide à découvrir de nouveaux transcrits et variantes d'épissage sans nécessiter de génome de référence.
- Analyse de la structure des gènes : elle permet un examen précis des structures génétiques, y compris des frontières exon-intron, des régions non traduites (UTR) et des queues polyadénylées.
- Détection des gènes de fusion et du splicing alternatif : Le séquençage du transcriptome complet peut identifier directement les gènes de fusion et les variantes d'épissage, ce qui est particulièrement bénéfique pour la recherche sur le cancer.
- Analyse des Transcrits Eucaryotes : La technologie enrichit sélectivement les transcrits eucaryotes avec des queues poly-A lors de la préparation de la bibliothèque, améliorant ainsi leur étude.
- Étude des lncARN : Bien qu'elle améliore principalement les lncARN à queue poly-A et les ARNm, elle fournit également des informations sur la structure et la fonction des lncARN. Cependant, les lncARN dépourvus de queues poly-A ne peuvent pas être enrichis et restent non détectés.
Flux de travail de séquençage des transcriptions complètes par nanopore

Spécification de service
Exigences d'échantillon
|
|
Stratégie de séquençage
|
|
Analyse bioinformatique
|
Pipeline d'analyse

Livrables
- Les données de séquençage originales
- Résultats expérimentaux
- Rapport d'analyse des données
- Détails sur le séquençage des transcrits complets Nanopore pour votre rédaction (personnalisation)
Référence :
- Weirather J L, Cesare M D, Wang Y, et al.Comparaison complète de Pacific Biosciences et d'Oxford Nanopore Technologies et de leurs applications à l'analyse du transcriptome. F1000research, 2017, 6:100.

1. La séquençage du transcriptome complet nécessite-t-il une fragmentation et un assemblage ?
Séquençage du transcriptome complet, basé sur les plateformes de séquençage de troisième génération PacBio ou Nanopore, ne nécessite pas de fragmentation ni d'assemblage. Il génère directement des transcrits complets contenant des UTR 5' et 3' et des queues poly-A. Cette approche permet une analyse précise du splicing alternatif et des événements de fusion génique chez les espèces disposant d'un génome de référence, répondant ainsi aux défis des assemblages de transcrits plus courts et incomplets chez les espèces sans génome de référence.
2. Quelle est la précision de la détection des transcrits complets ?
Le taux d'erreur de base des plateformes de séquençage de troisième génération est impartial. Pour la plateforme Nanopore, l'utilisation des informations du génome de référence pour la correction des séquences peut améliorer considérablement l'exactitude de la correction des bases.
3. La séquençage transcriptomique complet capture-t-il tous les lncARN ?
Au cours du processus de construction de la bibliothèque, des molécules d'ARN avec des structures poly-A sont identifiées, enrichissant les ARNm et certains lncARN avec des queues poly-A à partir de l'ARN total. Cependant, les lncARN sans structures poly-A ne peuvent pas être enrichis et séquencés de cette manière, ce qui entraîne la détection uniquement d'un sous-ensemble de lncARN.
4. Combien de réplicats biologiques sont généralement recommandés pour le séquençage de transcriptome complet par Nanopore ?
La recherche indique que les réplicats biologiques améliorent l'exactitude de l'identification des niveaux d'expression génique à travers tout le transcriptome, tandis qu'une profondeur de séquençage accrue améliore principalement l'exactitude de la détection des gènes à faible expression. Il est recommandé d'avoir au moins trois réplicats biologiques pour chaque condition de traitement. Pour les études impliquant des échantillons avec une grande variabilité biologique ou celles visant à détecter des différences d'expression subtiles ou des changements de pli, un plus grand nombre de réplicats biologiques est nécessaire. Par exemple, les échantillons cliniques avec des différences individuelles significatives peuvent nécessiter 5 à 10 réplicats par groupe, tandis que les échantillons de lignées cellulaires avec une variabilité biologique plus faible peuvent suffire avec trois réplicats par groupe.
5. Quelles sont les différences entre le séquençage du transcriptome complet par Nanopore et la seconde génération Illumina ? Séquençage de l'ARN?
La principale différence réside dans les plateformes de séquençage. La plateforme Illumina utilise généralement le séquençage en paires de 150 (PE150), construisant des bibliothèques de petits fragments et effectuant le séquençage par synthèse, ce qui nécessite une amplification PCR lors de la préparation des bibliothèques et du séquençage. Elle est principalement utilisée pour quantifier l'expression génique et l'analyse de l'expression différentielle. En revanche, le séquençage du transcriptome complet par Nanopore ne nécessite pas de fragmentation de l'ARN et peut capturer des transcrits complets de 5' à 3', fournissant des informations complètes sur la séquence et l'expression. Il n'a pas de biais envers la taille des fragments et détecte directement les signaux électriques, éliminant ainsi le besoin de synthèse lors du séquençage et entraînant un biais GC beaucoup plus faible par rapport aux plateformes de deuxième génération. De plus, comme il ne nécessite pas d'assemblage des transcrits, il présente des avantages significatifs dans la détection des variations structurelles au niveau des transcrits telles que l'épissage alternatif, les fusions géniques, l'APA (polyadénylation alternative) et la prédiction de nouveaux gènes.
Caractérisation du transcript intégral de SF3B1 la mutation dans la leucémie lymphoïde chronique révèle une régulation à la baisse des introns retenus
Journal : Communications Nature
Facteur d'impact : 14,919
Publié : 18 mars 2020
Contexte
Dans divers types de cancer, des mutations dans le facteur d'épissage SF3B1 ont été associés à des changements spécifiques dans les schémas d'épissage, affectant des conditions telles que la leucémie lymphoïde chronique (LLC), le mélanome uvéal, le cancer du sein et les syndromes myélodysplasiques. SF3B1, un composant fondamental du spliceosome, interagit avec l'ARNm précurseur et exerce un contrôle crucial sur le processus d'épissage. Des mutations dans SF3B1, notamment la mutation K700E, qui a été corrélée avec des résultats cliniques défavorables dans la LLC. Bien que le séquençage à court terme ait fourni des informations sur les motifs d'épissage influencés par SF3B1 Les mutations, le séquençage par nanopore à longues lectures offre une perspective plus complète, révélant de nouveaux détails concernant les altérations d'épissage. Séquençage par nanopore facilite la détection des molécules de transcrits complets et permet une évaluation précise des événements d'épissage alternatif, offrant des perspectives prometteuses pour la recherche sur le cancer et les interventions thérapeutiques.
Méthodes
- Cellules mononucléées du sang périphérique
- Extraction d'ARN
- Transcrit à l'envers
- Préparation de la bibliothèque
- Séquençage Oxford Nanopore
- Séquençage PromethION
- Statistiques de séquençage par nanopore
- Alignement splicé et correction de lecture
- Analyse de saturation
- Analyse GO
Résultats
Dans cette étude pilote, les auteurs ont utilisé le séquençage par nanopores pour analyser SF3B1K700E des transcriptions complètes dans des échantillons de LMC. Les auteurs ont trouvé une augmentation du splicing aberrant 3' dans SF3B1K700E, confirmant les résultats précédents. Des échantillons supplémentaires ont été séquencés en utilisant la technologie des nanopores, générant 257 millions de lectures au total. Malgré un stockage de l'ARN pendant 5 ans, une dégradation minimale a été observée. Une forte corrélation d'expression génique entre les échantillons séquencés avec minION et PromethION a permis la combinaison des données pour des analyses ultérieures.
Fig. 1 : Séquençage par nanopore à longues lectures et analyse FLAIR pour identifier les transcrits complets associés à SF3B1 mutation dans la leucémie lymphoïde chronique.
Dans cette étude, les chercheurs ont cherché à confirmer l'augmentation de l'utilisation des sites d'épissage alternatifs 3' (3'SS) induite par SF3B1K700E les données de séquençage par nanopore. Une analyse comparative des événements d'épissage 3' dans une cohorte de leucémie lymphoïde chronique (LLC), initialement identifiée par séquençage Illumina à courtes lectures, a été réalisée parallèlement aux résultats du séquençage par nanopore. Pour classer avec précision les événements d'épissage alternatif (EA) dans les isoformes, les auteurs ont conçu un appelant d'événements d'EA au sein de FLAIR. Cette approche a facilité l'identification de différences significatives dans les sites d'épissage alternatifs 3' et 5' entre SF3B1K700E et SF3B1WTDes observations notables comprenaient l'identification d'une région riche en adénine en amont du 3'SS canonique, en accord avec les résultats de recherches précédentes.
Fig. 2 : Les motifs d'épissage de l'alternative 3 identifiés avec les données de séquençage par nanopore sont concordants avec les données de lectures courtes et révèlent une complexité d'épissage supplémentaire.
Des études à lecture courte ont lié des mutants SF3B1 dans la LLC à une augmentation des transcrits avec des codons de terminaison prématurée (PTC). Le séquençage de cDNA complet permet une détection plus précise des transcrits avec des PTC et une estimation des isoformes non productives. Les isoformes non productives, définies par des PTC situés à 55 nucléotides ou plus en amont de la jonction d'épissage 3' la plus éloignée, peuvent subir une rétention nucléaire ou une dégradation médiée par des nonsense. Dans les données de nanopore, les auteurs ont identifié avec précision des transcrits non productifs connus de SRSF1 et ont découvert des isoformes non annotées supplémentaires, dont certaines sont prédites comme non productives.
Fig. 3 : Mutant SF3B1 régule à la baisse les transcrits non productifs retenant des introns.
Conclusion
Cette étude utilise le séquençage par nanopore pour examiner des cDNA de longueur complète à partir d'échantillons de LLC, révélant des événements d'épissage différentiels significatifs associés à SF3B1 mutation. Les auteurs présentent FLAIR, un flux de travail computationnel pour l'analyse des transcrits, et identifient des changements dans les sites d'épissage 3' et une régulation à la baisse des événements de rétention d'intron. L'analyse des transcrits complets fournit des informations sur l'épissage alternatif et l'abondance des isoformes, mettant en évidence le potentiel du séquençage par nanopore pour la recherche sur le cancer et l'épissage.
Référence :
- Tang, Alison D., et al."Caractérisation du transcript complet de" SF3B1 "La mutation dans la leucémie lymphoïde chronique révèle une régulation à la baisse des introns retenus." Communications Nature 11.1 (2020) : 1438.
Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :
La méthylation médiée par FIONA1 de l'UTR 3' de FLC affecte les niveaux de transcript de FLC et la floraison chez Arabidopsis.
Journal : PLoS Genetics
Année : 2022
L'écrivain m6A FIONA1 méthyle l'UTR 3' de FLC et contrôle la floraison chez Arabidopsis.
Journal : bioRxiv
Année : 2022
Séquence génomique complète de l'actinomycète dégradant la lignocellulose Streptomyces albus CAS922
Journal : Annonces de ressources en microbiologie
Année : 2020
Voir plus articles publiés par nos clients.