PacBio Iso-Seq permettant une exploration approfondie du splicing alternatif

Épissage alternatif

Le splicing alternatif est un processus cellulaire fondamental qui permet à un seul gène de coder pour plusieurs isoformes protéiques, élargissant considérablement la diversité fonctionnelle du protéome. La caractérisation précise des événements de splicing alternatif est essentielle pour comprendre la régulation des gènes, les fonctions spécifiques aux tissus et les mécanismes de la maladie.

Les techniques de séquençage à lecture courte traditionnelles, bien qu'efficaces dans de nombreux contextes, échouent souvent à capturer avec précision le paysage complexe de l'épissage alternatif en raison des limitations des courtes longueurs de lecture et des taux d'erreur de séquençage élevés. La technologie Iso-Seq de PacBio a émergé comme un outil puissant pour l'analyse complète du transcriptome, offrant un haut débit, séquençage à lecture longue qui facilite l'exploration du splicing alternatif avec une précision et une profondeur sans précédent.

Des études récentes ont démontré de manière convaincante que plus de 90 % des gènes humains subissent un épissage alternatif étendu, produisant une vaste gamme d'isoformes. Fait remarquable, certains gènes présentent un répertoire étonnant de plus de 10 isoformes. Parallèlement, ces schémas d'épissage dynamiques ont souvent des implications cruciales pour la croissance, la susceptibilité aux maladies, la tumorigenèse et diverses formes de cancer. Étonnamment, les méthodes de séquençage conventionnelles à courtes lectures échouent souvent à capturer une partie substantielle—variant de 60 % à 80 %—de ces nuances transcriptomiques complexes. Entrez dans le Iso-Seq enquête, basée sur la technologie ingénieuse de PacBio, qui offre une solution éclairante en permettant la détection complète de molécules de cDNA de pleine longueur, augmentant considérablement notre capacité à déterrer ces isoformes insaisissables.

Étude de cas 1 : Iso-Seq révèle la diversité des transcrits dans le cancer du sein

  • Contexte

Le cancer du sein est une maladie hétérogène caractérisée par une large gamme d'altérations du transcriptome qui contribuent à la progression tumorale et aux résultats pour les patients. L'un des mécanismes clés sous-jacents à la diversité du transcriptome est l'épissage alternatif, qui génère plusieurs isoformes d'ARNm à partir d'un seul gène. Cependant, le spectre complet des sous-types d'épissage sélectif au niveau des isoformes dans le cancer du sein reste largement inconnu. Les méthodes traditionnelles de séquençage à lecture courte ont des limitations pour capturer avec précision les isoformes de pleine longueur et identifier les événements d'épissage spécifiques aux tumeurs. Dans cette étude de cas, les chercheurs ont visé à identifier et annoter de manière exhaustive les isoformes de pleine longueur et les événements d'épissage spécifiques aux tumeurs dans le cancer du sein en utilisant trois générations de la technologie Iso-seq.

  • Méthodes

L'étude a utilisé la technologie Iso-seq, qui est basée sur le séquençage à lecture longue de molécules uniques. Cette approche permet le séquençage direct de cDNAs de pleine longueur, facilitant l'identification d'isoformes complètes et la détection précise d'événements d'épissage complexes. Les chercheurs ont obtenu des échantillons de cancer du sein d'une cohorte diversifiée de patients représentant différents sous-types de cancer du sein. Ils ont réalisé un séquençage Iso-seq sur ces échantillons, générant des données transcriptomiques à lecture longue de haute qualité.

Pour identifier et annoter des isoformes de pleine longueur, les chercheurs ont développé un pipeline bioinformatique qui impliquait la correction d'erreurs, le regroupement d'isoformes et la génération de séquences consensuelles. Ils ont également utilisé des annotations de génomes de référence pour distinguer les isoformes connues des isoformes nouvelles. Pour identifier les événements d'épissage spécifiques aux tumeurs, les profils d'expression au niveau des isoformes des échantillons tumoraux ont été comparés avec ceux des échantillons de tissus normaux.

LR-seq identifies previously undetected isoforms in breast cancer.LR-seq identifie des isoformes précédemment non détectées dans le cancer du sein. (Veiga et al., 2022)

  • Résultats

De manière remarquable, 30 % de ces nouveaux isoformes ont présenté des altérations affectant les exons codants, indiquant le potentiel significatif de ces isoformes dans la biologie tumorale. Une validation croisée approfondie des isoformes et des événements d'épissage identifiés a été réalisée, renforçant la robustesse des résultats.

Dans l'ensemble, les chercheurs ont identifié 3 059 événements d'épissage spécifiques aux tumeurs mammaires qui n'avaient pas été caractérisés auparavant. Notamment, 35 de ces événements d'épissage étaient significativement associés à la survie des patientes, suggérant leur potentiel en tant que marqueurs pronostiques. Parmi ces gènes, 21 étaient absents des bases de données et de la littérature existantes, soulignant la puissance du séquençage à longues lectures dans la découverte de nouvelles caractéristiques transcriptomiques. De plus, 10 gènes ont été trouvés enrichis dans des sous-types spécifiques de cancer du sein, fournissant des informations sur le paysage d'épissage spécifique aux sous-types.

Étude de cas 2 : Iso-Seq révèle la diversité des promoteurs dans différents sous-types de cancer gastrique

  • Contexte

L'expression génique dysrégulée est une caractéristique déterminante du cancer, jouant un rôle crucial dans le développement et la progression des tumeurs. Les méthodes traditionnelles d'analyse de l'expression génique, souvent basées sur le séquençage de seconde génération, ont été limitées par leur incapacité à capturer des transcrits de pleine longueur, risquant ainsi de manquer des informations importantes sur le véritable paysage transcriptionnel dans les cellules cancéreuses. Pour surmonter cette limitation, une étude complète a été menée pour enquêter sur le profil transcriptionnel du cancer gastrique (CG) en utilisant une combinaison des technologies Iso-seq et RNA-seq. Cette étude visait à découvrir la diversité de l'utilisation des promoteurs et du splicing alternatif à travers différents sous-types de cancer gastrique.

  • Méthodes

L'étude s'est concentrée sur l'analyse du transcriptome complet de 10 lignées cellulaires de cancer gastrique, englobant quatre sous-types distincts de CG. Pour ce faire, les chercheurs ont utilisé une approche en deux volets impliquant les technologies Iso-seq et RNA-seq.

Technologie Iso-seq : La technologie Iso-seq, une méthode de séquençage à la pointe, a été utilisée pour capturer des transcrits complets. Cette méthode a fourni des longueurs de lecture plus longues par rapport au séquençage traditionnel, permettant une représentation plus précise de l'ensemble du transcrit. Cette approche a permis l'identification de nouveaux transcrits qui auraient pu être manqués par les techniques de séquençage précédentes.

Technologie RNA-seq : En plus de l'Iso-seq, la technologie RNA-seq a été utilisée pour obtenir des données quantitatives sur l'expression des gènes. Cette technologie a fourni des informations sur l'abondance relative des différents transcrits dans les lignées cellulaires.

Landscape of long-read transcriptome in gastric cancer cell lines.Paysage du transcriptome à longues lectures dans les lignées cellulaires du cancer gastrique. (Huang et al., 2021)

  • Résultats

Un nombre significatif de transcrits complets non redondants a été identifié, avec plus de 60 % représentant des transcrits nouvellement découverts. Cela souligne la puissance du séquençage longitudinale pour capturer des éléments du transcriptome précédemment non annotés. Des transcrits novateurs ont été trouvés spécifiques à des sous-types, suggérant un lien potentiel entre ces transcrits et les sous-types distincts du cancer gastrique. De plus, il semblait y avoir une préférence dépendante du sous-type pour l'épissage alternatif. Les transcrits nouvellement découverts présentaient des caractéristiques structurelles plus complexes par rapport aux transcrits précédemment connus, indiquant l'existence de mécanismes régulateurs complexes impliqués dans ces sous-types de cancer gastrique. Des promoteurs alternatifs ont été identifiés dans environ 25 % des gènes analysés. Il est important de noter que beaucoup de ces promoteurs alternatifs étaient associés à des changements fonctionnels dans les protéines qu'ils codent, pouvant avoir un impact sur la progression de la maladie. L'ensemble de données complet généré par cette étude a des implications au-delà de ses résultats immédiats. On s'attend à ce que les variantes de transcrits identifiées offrent un potentiel diagnostique amélioré et contribuent à des évaluations pronostiques plus précises pour différents sous-types de cancer gastrique.

Les résultats de l'étude ont également fourni une ressource précieuse de données de transcriptome en pleine longueur, non seulement pour une exploration plus approfondie du cancer gastrique, mais aussi pour l'étude d'autres malignités gastro-intestinales.

Références :

  1. Veiga, Diogo FT, et al. "Une plateforme d'analyse complète des isoformes à longues lectures et une ressource de séquençage pour le cancer du sein." Science Advances 8.3 (2022) : eabg6711.
  2. Huang, Kie Kyon, et al. "Le séquençage du transcriptome à longues lectures révèle une abondante diversité de promoteurs dans des sous-types moléculaires distincts du cancer gastrique." Biologie du génome 22 (2021) : 1-24.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut