Appel de variantes

Qu'est-ce que l'appel de variantes ?

La variation génétique est un type de variation qui peut être héritée par la descendance, causée par des changements dans le matériel génétique d'un organisme. C'est cette variation qui amène les organismes à présenter une diversité génétique à différents niveaux. La diversité génétique est la base matérielle de la survie et du développement de la société humaine et des plantes. Il existe de nombreux types de variation génétique, allant de l'inversion chromosomique visible au microscope aux mutations de nucléotides uniques. Avec le développement de la génomique, les informations sur la variation génétique sont devenues plus complètes et ont inclus SNP, InDel, SV, CNV et mutations de transposons, et al.

L'appel de variantes fait référence à l'utilisation de séquençage à haut débit technologie pour séquencer et analyser les différences dans l'ensemble du génome d'un individu ou d'une population d'une espèce, afin d'obtenir une grande quantité d'informations sur la variation génétique, telles que Polymorphisme nucléotidique simple (SNP)Sites d'insertion et de suppression (InDel) et sites de variation structurelle (SV), variation du nombre de copies (CNV) et autres informations. L'appel de variants peut fournir la base de données la plus fondamentale et complète pour le cartographie fine fonctionnelle des gènes ultérieurs et analyser rapidement, avec précision et efficacité les différences entre les génomes, analyser chaque base du génome entier et obtenir les marqueurs moléculaires les plus étendus.

Méthodes de détection des variants structurels

La détection des variants structurels (SV) est un aspect essentiel de la recherche génomique. Plusieurs méthodologies ont été développées pour accomplir cette tâche, chacune ayant ses forces et ses applications spécifiques :

  • Méthode de lecture-paire (RP)

La méthode Read-Pair implique l'analyse des lectures de séquençage à paires pour examiner leurs relations spatiales. Les variants structurels sont déduits des anomalies dans les tailles d'insertion attendues ou des incohérences dans l'orientation des lectures appariées. Les écarts par rapport aux distances ou orientations anticipées suggèrent la présence de variants structurels.

  • Méthode de Lecture Scindée (SR)

La méthode Split-Read se concentre sur les cas où un segment d'une lecture se mappe au génome de référence tandis que son homologue ne le fait pas. Cette technique est particulièrement efficace pour identifier les insertions, les délétions et d'autres altérations structurelles complexes au sein du génome. La méthode excelle à localiser précisément les points de rupture des SVs.

  • Méthode de Lecture en Profondeur (RD)

La méthode Read-Depth évalue la profondeur des lectures de séquençage mappées à des régions génomiques spécifiques pour révéler des CNV. Les fluctuations de la profondeur de lecture peuvent signifier des augmentations ou des diminutions du nombre de copies génomiques, révélant ainsi des CNV. Cette méthode est avantageuse pour détecter des duplications ou des délétions à grande échelle.

  • Méthode d'assemblage (AS)

La méthode d'assemblage tire parti des technologies de séquençage de troisième génération, telles que PacBio SMRT ou Oxford Nanopore, en conjonction avec des approches d'assemblage de novo pour identifier des variants structurels étendus et complexes. Cette méthodologie facilite la caractérisation des altérations génomiques à longue portée et complexes directement à partir des données de séquençage brutes, offrant une vue d'ensemble des SVs.

Avantages et caractéristiques de l'appel de variantes

  • Abondance : Analyse approfondie de tous les aspects de la variation génétique, y compris les SNP, InDel, SV, SNV, gènes nouveaux, etc.
  • Flexibilité : avec ou sans référence est approprié.
  • Précision : différentes méthodes de séquençage peuvent être appliquées en fonction du matériel différent.

Applications de l'appel de variants

  • Recherche sur les maladies : La découverte de variants génétiques associés aux maladies éclaire leurs fondements génétiques et aide à identifier des biomarqueurs potentiels et des cibles de traitement.
  • Médecine personnalisée : Les connaissances génétiques permettent d'élaborer des plans de traitement personnalisés et d'améliorer l'utilisation des médicaments en identifiant les variantes qui influencent le métabolisme des médicaments.
  • Recherche Agricole : L'identification des variants génétiques liés à des traits souhaitables aide à développer de nouvelles souches et à augmenter la productivité dans l'élevage des plantes et des animaux.

Flux de travail d'appel de variantes

The Workflow of Variant Calling.

Spécifications de service

Exigences d'échantillon
  • Échantillon d'ADN : ~0,5 μg (concentration ≥ 10 ng/μl ; OD260/280=1,8~2,0)
Remarque : Les montants d'échantillons sont indiqués à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Cliquez
Stratégie de séquençage
  • 10X/détection pour SNP et petits InDel ; 20X/détection pour SV ; 30X/détection pour CNV.
  • GBS : 10~20W Étiquettes ; moyenne de 8 X/Étiquette
  • Plateforme Illumina Hiseq, plateforme de séquençage à longues lectures MGI DNBSEQ-T7/DNBSEQ-G400
  • Analyse des métriques de qualité de séquençage
Analyse bioinformatique
Nous proposons plusieurs analyses bioinformatiques personnalisées :
  • Contrôle qualité des données brutes
  • Alignement de référence ou assemblage
  • Informations sur la variante
  • Analyse personnalisée
Remarque : Les sorties de données et les contenus d'analyse recommandés affichés sont à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Pipeline de technologie de séquençage

The Data Analysis Pipeline of Variant Calling.

Livrables

  • Les données de séquençage originales
  • Résultats expérimentaux
  • Rapport d'analyse des données

Références

  1. Jansen S, Aigner B, Pausch H, et al. Évaluation de la variation génomique dans une population de bovins par le re-séquençage d'animaux clés à faible à moyen couverture. BMC Genomics, 2013, 14(1) : 1.
  2. Zheng L Y, Guo X S, He B, et al. Modèles de variation génétique à l'échelle du génome chez le sorgho sucré et le sorgho grain (Sorghum bicolor). Biologie du génome, 2011, 12(11):287-302.
  3. Alkan C, Coe BP, Eichler EE. Découverte et génotypage des variations structurelles du génome. Nature Reviews GeneticsMai 2011 ; 12(5) : 363-76.

Les résultats partiels sont présentés ci-dessous :

The Variant Calling Results Display Figure.

1. Quels types de variants génétiques peuvent être détectés ?

Les variants génétiques peuvent être largement classés en variants de séquence, tels que les SNP et les petites InDels, et en variants structurels, y compris les grandes délétions, duplications, inversions et translocations. Les variations du nombre de copies (CNV) sont un sous-type de SV et peuvent également être détectées.

2. Comment les technologies de séquençage à longues lectures bénéficient-elles à l'appel de variants ?

Séquençage à lecture longue technologies, comme Séquençage SMRT de PacBio et Oxford Séquençage par nanopore, offrent des avantages tels que la détection de variants dans des régions génomiques complexes qui sont difficiles à analyser avec des méthodes à court tirage. Ils offrent une grande précision, évitent le biais de PCR et permettent la résolution du phasage des variants.

3. Quel est le flux de travail typique pour l'appel de variants chez CD Genomics ?

Le flux de travail comprend le traitement des données et le contrôle de la qualité, le mapping des lectures sur le génome de référence, l'appel de variants, l'annotation des variants et la visualisation des résultats. Cela garantit une détection complète et précise des variants génétiques.

Assemblage du génome du pak choi non-heading et comparaison avec les génomes du chou chinois à tête et du sarson jaune oléagineux.

Journal : Journal de biotechnologie végétale
Facteur d'impact : 10,1
Publié : 07 décembre 2020

Contexte

Les cultures de Brassica comprennent des espèces diploïdes et des espèces amphidiploïdes. Le génome du pak choi, étroitement lié au sarson jaune et au chou chinois à pomme, a été assemblé en utilisant Séquençage de molécules uniques PacBio et les technologies Hi-C. Cette assemblée a identifié de nombreux variants génétiques, y compris des SNP, des indels et des gènes spécifiques à certaines espèces, améliorant notre compréhension de la diversité des cultures de Brassica et de la génétique des traits.

Matériaux et Méthodes

Préparation des échantillons

  • Matériaux végétaux
  • Échantillons de feuilles
  • Extraction d'ADN

Séquençage

Analyse de données

  • De nouveau assemblage
  • Assemblage et évaluation des chromosomes
  • Analyses du transcriptome
  • Répéter l'annotation
  • Prédiction génique
  • annotation fonctionnelle
  • Analyse de la variation structurelle
  • Analyse comparative du génome

Résultats

Dans une publication en ligne de 2020 sur le "Chou"[1]Une analyse comparative des variations parmi trois types de chou, y compris les variations de présence/absence (PAV) entre les gènes, les variants structurels (SV) au sein du génome et les polymorphismes de nucléotides uniques (SNP), a révélé des informations significatives. En particulier, des différences dans les SV au sein des gènes de forme de feuille (par exemple, KAN de la famille des facteurs de transcription GARP) et les rôles inhibiteurs des gènes liés à la floraison (par exemple, MAF4, SVP) ont été observés parmi les trois types morphologiques (comme illustré dans la Figure 1, à gauche). Ces résultats revêtent une importance cruciale pour déchiffrer les mécanismes moléculaires régissant la morphogenèse des organes et la floraison, ainsi que pour les améliorations génétiques, dans le chou et les cultures légumières apparentées.

Figure 1: Distribution of Presence–Absence Variants (PAV) and Specific Structural Variants (SVs) in the Cabbage Genome. (Li et al., 2020)Figure 1 : PAV et SV spécifiques dans le génome du chou[1]

Autres cas :

L'influence des variants structurels (SV) sur la structure des gènes et l'expression des gènes

Pour valider l'applicabilité de l'analyse SV et explorer son utilité dans les études évolutives de population, une publication en ligne de 2020 sur "la tomate"[2] une enquête a été menée. Les chercheurs ont obtenu un arbre évolutif systématique basé sur plus de 800 matériaux avec des SNP issus de données de séquençage à lecture courte (Figure 2A). Par la suite, ils ont sélectionné un ensemble représentatif de 100 matériaux provenant de 7 lignées et ont collecté des données de séquençage à lecture longue pour construire un diagramme en arbre basé sur des données de SV (Figure 2B).

Les résultats ont indiqué que les matériaux sélectionnés étaient répartis au sein de leurs groupes taxonomiques connus, en accord avec la classification basée sur les SNP. Cela démontre la pertinence des SV pour l'analyse génétique des populations.

Figure 2: Phylogenetic Tree of Tomato. (Alonge et al., 2020)Figure 2 : Arbre évolutif systématique de la tomate[2]

Dans une publication en ligne de 2020 sur le "riz"[3]Les chercheurs ont construit des diagrammes de structure de population basés à la fois sur des données SNP (Figure 3A) et des données SV (Figure 3B). L'analyse SNP a révélé une large division de la population en environ six groupes, avec une distinction claire entre les variétés de riz japonica et indica. Fait intéressant, l'analyse SV a produit des résultats très cohérents, soutenant davantage la différenciation observée dans l'analyse SNP.

Figure 3: Genetic Composition of Rice. (Yixuan et al., 2020)Figure 3 : Structure génétique du riz[3]

Spectre de fréquence des mutations de la population SV

Pour enquêter sur les impacts significatifs des variants délétères, la publication de 2020 sur le riz[3] spectres de fréquence calculés pour des sites non codants dans différents groupes (Figure 4-A, B, C). Chaque SFS comprend cinq types de SV (DUP, DEL, TRA, MEI et INV) et deux types de SNP (Syn, Nsyn) et révèle trois caractéristiques notables :

Des différences significatives existent entre les différents groupes de population, en accord avec un dérive génétique accrue lors des goulets d'étranglement de domestication et des changements dans les systèmes d'accouplement.

La proportion de SV fixes est inférieure à celle des SNP synonymes fixes et des SNP non synonymes. Les SV ont une fréquence plus faible dans le génome et sont plus susceptibles d'être éliminés après mutation, ce qui indique une probabilité plus élevée de dommages associés aux SV.

Les événements INV présentent les SFS les plus extrêmes, avec plus de 90 % des événements INV identifiés chez trois individus ou moins dans chaque groupe, ce qui implique que les événements INV peuvent être soumis à une forte sélection au cours du processus évolutif.

Les chercheurs ont effectué une analyse statistique des emplacements des SV et des SNP sur les chromosomes, et les résultats des tests indiquent une corrélation significative entre la diversité des SV et des SNP dans des fenêtres chromosomiques (Figure 4-D). Cela suggère que les SV fournissent des informations génétiques de population qui sont fondamentalement cohérentes avec les SNP.

Figure 4: Spectrum of Structural Variant (SV) Frequencies. (Yixuan et al., 2020)Figure 4 : Spectres de fréquence SV[3]

Analyse de déséquilibre de liaison avec des SVs

Dans l'étude sur le [riz][3], LD (Déséquilibre de Liaison) a été calculé pour trois groupes de population distincts en utilisant des données de SNP, SV et SNP+SV. En raison de leurs effets potentiellement nocifs, les SV présentent souvent des fréquences de population plus faibles par rapport aux SNP et peuvent connaître une décroissance du LD plus rapide sur des distances physiques (Figure 5). Les données de SNP ont montré qu'à environ 100 kb, le r2 pour les SNP japonica restait autour de 0,2, tandis que pour les indica, il était d'environ 0,1. À la même distance physique, le r2 pour les rufipogon était inférieur à 0,05. Cependant, les valeurs de r2 pour les SV étaient inférieures à celles des SNP dans tous les groupes de population, avec des valeurs dépassant 0,1 uniquement sur des distances très courtes (<15 kb).

Figure 5: Analysis of Linkage Disequilibrium. (Yixuan et al., 2020)Figure 5 : Analyse de déséquilibre de liaison[3]

Étude sur la domestication des populations

Dans la recherche menée sur le riz[3]Une évaluation des disparités génomiques entre les polymorphismes nucléotidiques uniques (SNPs) et les variants structurels (SVs) a révélé une distinction notable. L'étude a observé que l'estimation moyenne de FST pour les SNPs était nettement plus élevée par rapport aux SVs. Cette découverte indique que les SVs présentent généralement des fréquences de population plus faibles par rapport aux SNPs.

En intégrant ces données avec des gènes de domestication et d'amélioration bien établis, l'enquête a réaffirmé l'enrichissement substantiel de ces gènes au sein des intervalles FST des 1 % et 10 % supérieurs. Par conséquent, cela a fourni des informations précieuses sur les gènes fonctionnels associés aux processus physiologiques, aux caractéristiques morphologiques et à la qualité des aliments (Figure 3).

Figure 6: Characteristics of Structural Variants (SVs) Related to Domestication. (Yixuan et al., 2020)Figure 6 : Caractéristiques SV associées à la domestication[3]

Analyse d'association à l'échelle du génome entier

Dans la publication de 2020 sur [colza][4]Une étude d'association à l'échelle du génome (GWAS) a été réalisée en utilisant les PAV identifiés à partir de huit variétés de colza. Cette analyse a révélé des relations causales entre les PAV et des traits tels que la longueur des siliques, le poids des graines et le temps de floraison. Fait intéressant, ces découvertes significatives ont été négligées dans les résultats du SNP-GWAS (Figure 7).

De même, dans la publication de 2021 sur [pêche][5]Des SVs candidats associés à des traits tels que la maturation précoce des fruits, la couleur du péricarpe autour du noyau, la forme des fruits et la formation de formes plates ont été observés (Figure 8).

Figure 7: GWAS Analysis Results for Presence–Absence Variants (PAV) in Canola. (Song et al., 2020)Figure 7 : Résultats de l'analyse PAV_GWAS sur le colza[4]

Figure 8: GWAS Analysis Results for Structural Variants (SVs) in Peach. (Jiantao et al., 2021)Figure 8 : Résultats de l'analyse SV_GWAS de la pêche[5]

Références

  1. Li P, Su T, Zhao X, et al. Assemblage du génome du pak choi non pommé et comparaison avec les génomes du chou chinois pommé et du sarson jaune oléagineux. Journal de biotechnologie des plantes, 2020.
  2. Alonge M, Wang X, Benoit M, et al. Impacts majeurs de la variation structurelle généralisée sur l'expression génique et l'amélioration des cultures dans la tomate. Cellule, 2020.
  3. Yixuan K, Yi L, Tuomas T, et al. Génétique évolutive de la variation structurelle dans la domestication du riz asiatique (Oryza sativa). Biologie moléculaire et évolution, 2020.
  4. Song J, Guan Z, Hu J, et al. Huit génomes de haute qualité révèlent l'architecture du pan-génome et la différenciation des écotypes de Brassica napus. Plantes de la nature, 2020.
  5. Jiantao G, Yaoguang X, Yang Y, et al. Les analyses de variation de la structure du génome de la pêche révèlent la dynamique des populations et une inversion causale de 1,67 Mb pour la forme des fruits. Biologie du Génome, 2021.

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

Collection de données génétiques dans des études basées sur l'ethnicité parmi les Aymaras, Quechuas et Mestizos : les défis de l'étude sur la génétique de la maladie d'Alzheimer dans la population péruvienne (GAPP).

Journal : Alzheimer et Démence

Année : 2022

Désolé, je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici.

Évaluation des biomarqueurs plasmatiques pour la classification A/T/N de la maladie d'Alzheimer chez les adultes d'ethnie hispano-caribéenne.

Journal : JAMA Network Open

Année : 2023

Désolé, je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici.

Augmentation de la production de spores fongiques pathogènes et aériennes lors de l'exposition d'une mycobiote du sol à des polluants chlorés aromatiques.

Journal : Microbiology Spectrum

Année : 2023

Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai ravi de vous aider.

Une variante d'épissage dans le gène SLC16A8 entraîne un déficit de transport de lactate dans les cellules épithéliales pigmentaires rétiniennes dérivées de cellules iPS humaines.

Journal : Cellules

Année : 2021

Désolé, je ne peux pas accéder à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici.

Voir plus articles publiés par nos clients.

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Ressources en vedette
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut