Applications de l'Iso-Seq dans la recherche en génomique et en transcriptomique

Iso-Seq la technologie, développée par Pacific Biosciences, est une méthode de séquençage du transcriptome complet basée sur Séquençage en temps réel de molécules uniques PacBio La technologie (SMRT) séquence directement des cDNA de pleine longueur sans fragmenter les molécules d'ARN, permettant ainsi la génération de séquences de transcrits de haute qualité pouvant s'étendre jusqu'à 10 kb ou même plus. L'avantage clé de l'Iso-Seq réside dans sa capacité à offrir des informations complètes sur les transcrits, englobant la région non traduite 5' (5'UTR), la région non traduite 3' (3'UTR) et la queue polyA. Cela contourne les processus complexes de découpage et de reconstruction des transcrits inhérents à la technologie RNA-seq traditionnelle.

Iso-Seq peut identifier avec précision des phénomènes biologiques tels que les événements d'épissage alternatif, les sites de départ et d'arrêt alternatifs, les gènes de fusion et les ARN non codants longs (lncARN). Cela offre une nouvelle perspective pour étudier la régulation de l'expression génique, la complexité du transcriptome et la fonction des gènes. De plus, en raison de sa capacité à couvrir des transcrits de longueur complète, Iso-Seq est particulièrement bien adapté à l'étude d'espèces sans génome de référence. Il peut révéler des isomères de transcrits et de nouveaux gènes que les méthodes traditionnelles. RNA-seq les méthodes ont échoué à détecter.

Aperçu de l'importance de l'Iso-Seq en biologie

La technologie Iso-Seq revêt une importance significative dans génomique et transcriptomique recherche en raison de ses capacités de séquençage des transcrits complets. Elle améliore non seulement l'exactitude de l'annotation génomique, mais révèle également la complexité du transcriptome, favorise la découverte de nouveaux gènes et transcrits, et offre un outil précieux pour l'étude des espèces de génomes non référencés.

Améliorer la précision de l'annotation génomique : la technologie Iso-Seq génère des transcrits complets, permettant la détermination directe des frontières des exons, des sites d'épissage et des sites d'épissage alternatif. Cela conduit à une annotation des gènes plus précise. Par exemple, dans les études de transcriptome des plantes, les transcrits complets obtenus grâce à Iso-Seq ont considérablement amélioré le raffinement des modèles de gènes. De plus, Iso-Seq peut identifier des gènes de fusion et des sites de méthylation, augmentant ainsi les informations disponibles pour l'annotation génomique.

Révéler la complexité du transcriptome : La technologie Iso-Seq permet une analyse complète de la structure complexe du transcriptome, y compris les événements d'épissage alternatif, les ARN non codants, la dégradation de l'ARNm (NMD) et la polyadénylation. Dans les études sur les mammifères, par exemple, l'Iso-Seq a révélé de nombreux nouveaux gènes et transcrits qui n'étaient pas couverts par le transcriptome de référence, mettant en évidence sa supériorité dans l'exploration de la complexité du transcriptome.

Promouvoir la découverte de nouveaux gènes et de nouveaux transcrits : La capacité d'Iso-Seq à générer des séquences complètes offre un avantage distinct dans la découverte de nouveaux gènes et transcrits. Dans la recherche sur le soja, les données Iso-Seq ont couvert plus de 80 % des sites génétiques identifiés par RNA-Seq et ont découvert de nombreux gènes nouveaux. De plus, Iso-Seq a été utilisé pour détecter l'expression des pseudogènes chez les mammifères, éclairant ainsi le rôle des pseudogènes dans la dynamique du développement.

Applications en génomique

Découverte et annotation des gènes

a) Identification de nouveaux gènes et isoformes

La découverte de gènes est une tâche fondamentale dans la recherche en génomique. Les logiciels de bioinformatique modernes permettent aux chercheurs d'identifier efficacement des gènes à partir de séquences génomiques, en particulier chez les procaryotes tels que les bactéries, les archées et les virus, où le processus est relativement simple et précis.

Les technologies d'intelligence artificielle, en particulier les algorithmes d'apprentissage profond, jouent un rôle crucial dans l'annotation du génome. Ces algorithmes améliorent la précision et la rapidité de la prédiction des gènes. Par exemple, en intégrant des informations statistiques avec des comparaisons à des séquences codantes connues, l'algorithme du génome dual peut localiser avec précision de nouvelles régions géniques.

Differential expression levels of lncRNA (Zhang et al., 2022)Analyse de l'expression différentielle des lncRNA (Zhang et al., 2022)

b) Affinage des modèles génétiques

L'annotation génétique implique non seulement de localiser les gènes, mais aussi de définir avec précision leurs structures internes, telles que les introns et les exons. Ce processus nécessite généralement l'intégration de diverses méthodes computationnelles, y compris des comparaisons de séquences avec des bases de données de gènes connus et l'optimisation des résultats d'annotation à l'aide d'algorithmes d'apprentissage automatique. L'annotation à l'échelle du génome est particulièrement essentielle après l'achèvement du séquençage du génome de nouvelles espèces, car elle fournit une base pour les recherches fonctionnelles ultérieures.

Génomique comparative

a) Analyse inter-espèces des structures génétiques

La génomique comparative consiste à comparer les séquences génomiques de différentes espèces pour découvrir les relations évolutives et les éléments conservés. Cette approche aide non seulement à identifier les similitudes et les différences entre les espèces, mais elle contribue également à comprendre l'expansion et la contraction des familles de gènes. Par exemple, en analysant les régions codantes des gènes BPI dans plusieurs espèces, les chercheurs peuvent explorer leur diversité génétique et leurs disparités fonctionnelles à travers différents organismes.

b) Perspectives évolutives

La génomique comparative offre un outil puissant pour comprendre l'évolution des espèces. En analysant la protéine TCTP à travers différentes espèces, les chercheurs ont élucidé sa différenciation fonctionnelle et sa trajectoire évolutive. Les mécanismes de réplication des gènes, tels que le croisement, l'inversion et la multiplication des chromosomes, jouent également un rôle significatif dans l'évolution, facilitant l'émergence de nouvelles fonctions. En comparant les données génomiques de différentes espèces, les chercheurs peuvent explorer l'impact de la sélection génomique sur la variation des traits.

La découverte de gènes, l'annotation et la génomique comparative sont largement appliquées dans la recherche moderne en sciences de la vie. Dans des domaines tels que la médecine, l'agriculture et les sciences de l'environnement, les chercheurs peuvent mieux comprendre les motifs d'expression des gènes, les variations génétiques liées aux maladies et la base génétique des traits complexes grâce à l'annotation du génome et à l'analyse comparative. Avec l'avancement des technologies de calcul haute performance et de cloud computing, le traitement des données génomiques à grande échelle est devenu plus efficace, propulsant encore davantage la recherche dans ces domaines. Ces aspects de la recherche en génomique non seulement font progresser la science fondamentale, mais fournissent également un soutien crucial pour le diagnostic clinique, le développement de médicaments et les applications biotechnologiques.

The L1-lncRNA results of specific human sample (Raquel et al., 2023)L'ARNnc LINC01876 est un transcript spécifique à l'homme (Raquel et al., 2023)

Applications en transcriptomique

A. Études sur le splicing alternatif

a) Identification des variants d'épissage

Le splicing alternatif est un processus par lequel un seul gène génère plusieurs isoformes d'ARNm à travers différents schémas d'épissage, augmentant ainsi la diversité de l'expression génique. Les technologies de séquençage à haut débit, telles que RNA-Seq, fournir un moyen robuste pour étudier de manière exhaustive l'épissage alternatif. rMATS, par exemple, est une méthode statistique utilisée pour détecter et quantifier l'épissage alternatif différentiel dans des données RNA-Seq répétitives. Elle peut gérer des échantillons appariés, tels que des études cas-témoins, et tenir compte de la variation individuelle. Des outils comme IsoformSwitchAnalyzeR peuvent également prédire des variants d'épissage en calculant les changements dans les sites d'épissage.

b) Implications fonctionnelles des isoformes alternatives

Le splicing alternatif n'ajoute pas seulement de la complexité au transcriptome, mais peut également influencer la fonction des protéines. Certaines isoformes alternatives peuvent posséder des fonctions biologiques spécifiques, telles que la régulation de l'expression génique. Dans la recherche sur le cancer, il a été démontré que le splicing alternatif contribue au développement de la maladie en modifiant la structure et la fonction des protéines. De plus, des études ont révélé que les événements de splicing alternatif sont très spécifiques aux tissus et peuvent avoir un impact significatif sur la fonction cellulaire.

Alternative splicing results across affected brain regions mouse models (Hannah et al., 2024)Le splicing alternatif est dysrégulé dans les régions cérébrales affectées des modèles murins de SCA à expansion CAG (Hannah et al., 2024)

B. Profilage du transcriptome

a) Analyse quantitative de l'expression des isoformes

Une application clé de l'analyse du transcriptome est l'évaluation quantitative des niveaux d'expression des isoformes. Cela repose généralement sur des données RNA-Seq et est réalisé en identifiant les lectures à travers les sites d'épissage. L'algorithme MISO, par exemple, peut mesurer les niveaux d'expression relatifs des différentes isoformes résultant d'événements de saut d'exon. Une gamme de ressources informatiques et de méthodes statistiques a été développée pour calculer la diversité du transcriptome et des isoformes.

b) Utilisation différentielle des isoformes selon les conditions

Le splicing alternatif présente des différences significatives dans l'utilisation des isoformes selon les conditions. Par exemple, au cours du développement, l'abondance des événements de splicing alternatif augmente considérablement. Certaines études ont également révélé que le splicing alternatif subit des changements significatifs dans les états pathologiques, tels que le cancer, ce qui pourrait offrir de nouveaux biomarqueurs pour le diagnostic et le traitement des maladies.

Heat map results of 50 differentially expressed genes between two different stages in S. tora (Kang et al., 2020)Carte thermique des 50 gènes exprimés différemment entre les stades précoces et tardifs du développement des graines chez S. tora (Kang et al., 2020)

Le splicing alternatif et l'analyse du transcriptome sont des outils essentiels dans la recherche biologique moderne. Ils révèlent non seulement la complexité de l'expression génique, mais offrent également une nouvelle perspective pour comprendre la fonction des gènes et les mécanismes des maladies. En combinant séquençage à haut débit Grâce à la technologie et aux outils de bioinformatique avancés, les chercheurs peuvent réaliser des analyses plus complètes du splicing alternatif et de ses variations sous différentes conditions, favorisant ainsi le développement de la recherche fondamentale et clinique.

Études de cas sur l'Iso-Seq

Applications réussies de l'Iso-Seq dans des études publiées

La recherche sur le transcriptome des plantes : La technologie Iso-Seq a démontré des avantages remarquables dans les études sur le transcriptome des plantes. Grâce à PacBio Iso-Seq, les chercheurs peuvent générer des transcrits complets, évitant ainsi les problèmes associés à la reconstruction du transcriptome causés par la courte longueur des lectures de l'ARN-Seq traditionnel. Cela permet à Iso-Seq de bien performer dans l'annotation des gènes et la découverte de nouveaux gènes. identification des ARN longs non codants (lncRNA)et la détection des isomères de splicing.

Analyse the results of Iso-Seq data (Liu et al., 2022)Résumé des données Iso-Seq (Liu et al., 2022)

Amélioration de l'annotation génomique : Dans l'étude de plantes modèles comme Arabidopsis thaliana, la réanalyse de l'annotation génomique de TAIR10 utilisant la technologie Iso-Seq a permis de récupérer près de 60 % du modèle génétique et d'identifier de nouveaux loci géniques. Ce résultat met en évidence la capacité de l'Iso-Seq à améliorer significativement l'exactitude et l'exhaustivité de l'annotation génomique.

Analyse du transcriptome des plantes non-modèles : Les recherches sur Halogeton glomeratus ont montré que la technologie Iso-Seq peut fournir des données complètes sur le transcriptome et révéler les mécanismes moléculaires complexes des réponses au stress salin chez les plantes. Cela revêt une grande importance pour la sélection de cultures tolérantes au sel.

Application dans la recherche sur le cancer : La technologie Iso-Seq est largement utilisée dans la recherche sur le cancer. En séquençant l'ARN complet, elle peut révéler l'hétérogénéité des cellules tumorales et les motifs d'expression génique. Par exemple, la combinaison du kit d'ARN complet Kinnex avec la technologie Iso-Seq permet aux chercheurs d'obtenir des données de transcriptome cancéreux de haute qualité, offrant de nouvelles perspectives pour le traitement du cancer.

Biotechnologie agricole : Dans la recherche sur le blé, l'intégration de la technologie TeloPrime avec le séquençage Iso-Seq a permis aux chercheurs de construire une bibliothèque d'annotation de génome hexaploïde de blé de haute qualité. Cela fournit un soutien crucial pour les futures recherches sur la fonction des gènes du blé et le développement de nouvelles variétés.

Iso-Seq isoform functions in G. purpurascens (Abdul et al., 2024)Prédiction des fonctions des isoformes Iso-Seq dans G. purpurascens (Abdul et al., 2024)

Impact sur la recherche biomédicale et l'amélioration des plantes

Les applications de l'Iso-Seq dans la recherche biomédicale et l'amélioration des plantes ont eu un impact significatif dans ces domaines. Dans la recherche biomédicale, l'Iso-Seq a le potentiel d'identifier de nouveaux biomarqueurs et cibles thérapeutiques pour une variété de maladies, y compris le cancer, les troubles neurologiques et les maladies auto-immunes. En fournissant une image plus complète et précise du transcriptome, l'Iso-Seq peut aider les chercheurs à comprendre les mécanismes moléculaires sous-jacents au développement et à la progression des maladies.

Recherche biomédicale : Dans la recherche biomédicale, l'Iso-Seq a le potentiel d'identifier de nouveaux biomarqueurs et cibles thérapeutiques pour diverses maladies, y compris le cancer, les troubles neurologiques et les maladies auto-immunes. En fournissant une vue plus complète et précise du transcriptome, l'Iso-Seq aide les chercheurs à comprendre les mécanismes moléculaires sous-jacents au développement et à la progression des maladies. Le séquençage de l'ARN pleine longueur permet une identification plus précise des variantes d'épissage liées aux maladies, des gènes de fusion et des sites de mutation, ce qui est bénéfique pour comprendre les mécanismes de la maladie et fournir un soutien de données pour la médecine personnalisée.

Amélioration des plantes : Dans l'amélioration des plantes, la technologie Iso-Seq aide les chercheurs à mieux comprendre les réseaux régulateurs génétiques des plantes en fournissant des données complètes sur le transcriptome. Dans la recherche sur le coton, l'analyse des changements dynamiques du transcriptome sous différents stress abiotiques a révélé les mécanismes de réponse du coton à la sécheresse, à la salinité et à d'autres stress, fournissant des marqueurs moléculaires importants pour l'amélioration.

Results of Iso-Seq fills gaps in seed-storage proteins (Zhang et al., 2024)Iso-Seq comble les lacunes dans les transcrits codant des protéines de stockage des graines (Zhang et al., 2024)

Amélioration de la précision de l'annotation génomique : La technologie Iso-Seq améliore considérablement la précision de l'annotation génomique en générant des transcrits complets. Dans la recherche sur le soja (Glycine max), Iso-Seq a révélé plus de 80 % des loci géniques et détecté de nombreuses variations alléliques, posant ainsi les bases de l'amélioration génétique du soja et de la recherche sur les gènes fonctionnels.

Promouvoir le développement de la génomique fonctionnelle des plantes : L'application de la technologie Iso-Seq a considérablement avancé le développement de la génomique fonctionnelle des plantes. Dans la recherche sur le riz, la combinaison des données de RNA-Seq à lecture courte et d'Iso-Seq a permis aux chercheurs de construire une carte d'expression génique plus complète, fournissant une référence importante pour le croisement moléculaire du riz.

Promouvoir la protection de la biodiversité agricole : La technologie Iso-Seq joue également un rôle crucial dans la protection de la biodiversité agricole. Dans la recherche sur la mangue, l'analyse de la cartographie des associations génomiques utilisant la technologie Iso-Seq aide les chercheurs à mieux comprendre la base génétique de la qualité des fruits et de la résistance au stress, fournissant une base scientifique pour l'amélioration génétique de la mangue.

Conclusion

Iso-Seq représente une avancée formidable dans les domaines de la génomique et de la transcriptomique, offrant des capacités inégalées pour l'identification de nouveaux gènes et isoformes, le perfectionnement des modèles de gènes et l'analyse détaillée des structures génétiques à travers diverses espèces. Dans le domaine de la génomique, Iso-Seq facilite la découverte de nouveaux éléments génétiques et améliore la précision des annotations génétiques.

Dans le domaine de la transcriptomique, cela fournit des informations cruciales sur les mécanismes d'épissage alternatif et les paysages régulateurs de l'expression génique. De plus, l'Iso-Seq a été de plus en plus appliqué à la recherche sur les plantes, à l'oncologie et à la biotechnologie agricole, où il révèle des voies complexes de régulation génique, élucide les caractéristiques des tumeurs et aide à la construction d'annotations génomiques de haute fidélité.

En regardant vers l'avenir, l'intégration de l'Iso-Seq avec d'autres ensembles de données omiques promet de fournir des informations biologiques complètes. Ses applications cliniques potentielles, en particulier dans les domaines du diagnostic des maladies et des interventions thérapeutiques, semblent prometteuses. De plus, l'utilité de l'Iso-Seq dans la promotion de la sélection végétale durable constitue un pas en avant significatif. Ainsi, l'Iso-Seq est bien positionné pour apporter des contributions substantielles au domaine de la recherche scientifique dans un avenir prévisible.

Références:

  1. Nam V. Hoang, Agnelo Furtado, Patrick J. Mason, et al. "Une enquête sur le transcriptome complexe du génome de la canne à sucre hautement polyploïde utilisant le séquençage des isoformes en longueur complète et l'assemblage de novo à partir du séquençage à lecture courte." BMC Genomics (2017) 18:395. DOI 10.1186/s12864-017-3757-8
  2. Zhang Zekun, Wang Huiyuan, Wu Ji, et al. "Analyse transcriptomique complète du xylème en différenciation des tiges sous stress de compression dans Cunninghamia lanceolata." Frontières en génétique (2022) : 843269. www.frontiersin.org
  3. An Dong, Hieu X. Cao, Li Changsheng, et al. "Séquençage des isoformes et applications à la pointe de la technologie pour percer la complexité des transcriptomes végétaux." Gènes (2018) : 9. Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
  4. Khaled Moustafa, Joanna M. Cross, et al. "Approches génétiques pour étudier les réponses des plantes aux stress environnementaux : un aperçu." Biologie (2016) 5:20. doi:10.3390/biology5020020
  5. Matthias Lienhard, TwanvandenBeucken, BerndTimmermann, et al. "IsoTools : un flux de travail flexible pour l'analyse du séquençage du transcriptome à longues lectures." Bioinformatique (2023) 39 : 6. Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir et je serai heureux de vous aider.
  6. Raquel Garza, Diahann Atacho, Anita Adami, et al. "Les rétrotransposons L1 stimulent la complexité du transcriptome neuronal humain et la diversification fonctionnelle." bioRxiv (2023) : 6. Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique à traduire, veuillez le fournir et je serai heureux de vous aider.
  7. Sang-Ho Kang, So-Ra Han, Woo-Haeng Lee, et al. "Séquence du transcriptome de novo de Senna tora fournissant des informations sur la biosynthèse des anthraquinones." PLOS ONE (2020) 5:7. Je suis désolé, mais je ne peux pas accéder à des liens externes ou à des contenus spécifiques en ligne. Si vous avez un texte que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.
  8. Abdul Rehman, Chunyan Tian, Shoupu He, et al. "Dynamique du transcriptome de Gossypium purpurascens en réponse aux stress abiotiques par des données Iso-seq et RNA-seq." Données scientifiques (2024) 11 : 477. Désolé, je ne peux pas accéder à des liens ou du contenu externe. Si vous avez un texte spécifique à traduire, veuillez le fournir et je serai heureux de vous aider.
  9. Liu Jing, Chen Shengcai, Liu Min, et al. "Le séquençage du transcriptome complet révèle l'épissage alternatif et la régulation des lncRNA pendant le développement des nodules chez Glycine max." Int. J. Mol. Sci.. (2022) 23 : 7371. Je suis désolé, mais je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
  10. Zhang Zhaoheng, Liu Dan, Li Bingyong, et al. "Approche pangenomique basée sur Ak-mer pour cataloguer les gènes de protéines de stockage des graines dans le blé afin de faciliter la prédiction génotype-phénotype et l'amélioration de la qualité d'utilisation finale." Plante moléculaire (2024) : 1038-1053. Désolé, je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique à traduire, veuillez le fournir et je serai heureux de vous aider.
  11. Hannah K. Shorrock, Claudia D. Lennon, Asmer Aliyeva, et al. "Une dysrégulation généralisée de l'épissage alternatif se produit de manière présymptomatique dans les ataxies spinocérébelleuses à expansion de CAG." CERVEAU (2024) : 486-504. Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut