What types of genetic variants can be detected?

Genetic variants can be broadly classified into sequence variants, such as SNPs and small InDels, and structural variants, including large deletions, duplications, inversions, and translocations. Copy number variations (CNVs) are a subtype of SVs and can also be detected.

How do long-read sequencing technologies benefit Variant Calling?

Long-read sequencing technologies, like PacBio SMRT sequencing and Oxford Nanopore sequencing , provide advantages such as detecting variants in complex genomic regions that are challenging for short-read methods. They offer high precision, avoid PCR bias, and enable the resolution of variant phasing.

What is the typical workflow for Variant Calling at CD Genomics?

The workflow includes data processing and quality control, mapping reads to the reference genome, performing variant calling, annotating variants, and visualizing the results. This ensures comprehensive and accurate detection of genetic variants.

Appel de variantes - CD Genomics

Qu'est-ce que l'appel de variantes ?

La variation génétique est un type de variation qui peut être héritée par la descendance, causée par des changements dans le matériel génétique d'un organisme. C'est cette variation qui amène les organismes à présenter une diversité génétique à différents niveaux. La diversité génétique est la base matérielle de la survie et du développement de la société humaine et des plantes. Il existe de nombreux types de variation génétique, allant de l'inversion chromosomique visible au microscope aux mutations de nucléotides uniques. Avec le développement de la génomique, les informations sur la variation génétique sont devenues plus complètes et ont inclus SNP, InDel, SV, CNV et mutations de transposons, et al.

L'appel de variants fait référence à l'utilisation de séquençage à haut débit technologie pour séquencer et analyser les différences dans l'ensemble du génome d'un individu ou d'une population d'une espèce, afin d'obtenir une grande quantité d'informations sur la variation génétique, telles que Polymorphisme nucléotidique simple (SNP)Sites d'insertion et de suppression (InDel) et sites de variation structurelle (SV), variation du nombre de copies (CNV) et autres informations. L'appel de variants peut fournir la base de données la plus fondamentale et complète pour le cartographie fine fonctionnelle des gènes ultérieurs et analyser rapidement, avec précision et efficacité les différences entre les génomes, analyser chaque base du génome entier et obtenir les marqueurs moléculaires les plus étendus.

Méthodes de détection des variants structurels

La détection des variants structurels (SV) est un aspect essentiel de la recherche génomique. Plusieurs méthodologies ont été développées pour accomplir cette tâche, chacune ayant ses forces et applications spécifiques :

Méthode de Lecture-Paire (RP)

La méthode Read-Pair implique l'analyse des lectures de séquençage à paires pour examiner leurs relations spatiales. Les variants structurels sont déduits des anomalies dans les tailles d'insertion attendues ou des incohérences dans l'orientation des lectures appariées. Les écarts par rapport aux distances ou orientations anticipées suggèrent la présence de variants structurels.

Méthode de Lecture Fractionnée (SR)

La méthode Split-Read se concentre sur les cas où un segment d'une lecture s'aligne sur le génome de référence tandis que son homologue ne le fait pas. Cette technique est particulièrement efficace pour identifier les insertions, les délétions et d'autres altérations structurelles complexes au sein du génome. La méthode excelle à localiser des points de rupture précis des SV.

Méthode de Lecture en Profondeur (RD)

La méthode de profondeur de lecture évalue la profondeur des lectures de séquençage mappées à des régions génomiques spécifiques pour révéler des CNV. Les fluctuations de la profondeur de lecture peuvent signifier des augmentations ou des diminutions du nombre de copies génomiques, révélant ainsi des CNV. Cette méthode est avantageuse pour détecter des duplications ou des délétions à grande échelle.

Méthode d'assemblage (AS)

La méthode d'assemblage tire parti des technologies de séquençage de troisième génération, telles que PacBio SMRT ou Oxford Nanopore, en conjonction avec des approches d'assemblage de novo pour identifier des variants structurels étendus et complexes. Cette méthodologie facilite la caractérisation des altérations génomiques à longue portée et complexes directement à partir des données de séquençage brutes, offrant une vue d'ensemble des SVs.

Avantages et caractéristiques de l'appel de variantes

Abondance : Analyse approfondie de tous les aspects de la variation génétique, y compris les SNP, InDel, SV, SNV, gène nouveau, etc.
Flexibilité : avec ou sans référence est adapté.
Précision : différentes méthodes de séquençage peuvent être appliquées en fonction du matériel différent.

Applications de l'appel de variantes

Recherche sur les maladies : La découverte de variants génétiques associés à des maladies éclaire leurs fondements génétiques et aide à identifier des biomarqueurs potentiels et des cibles de traitement.
Médecine personnalisée : Les connaissances génétiques permettent des plans de traitement personnalisés et une utilisation améliorée des médicaments en identifiant les variantes qui influencent le métabolisme des médicaments.
Recherche Agricole : L'identification des variants génétiques liés à des traits souhaitables aide à développer de nouvelles souches et à augmenter la productivité dans l'élevage des plantes et des animaux.

Flux de travail d'appel de variantes

The Workflow of Variant Calling.

Spécifications du service

	Exigences d'échantillon Échantillon d'ADN : ~0,5 μg (concentration ≥ 10 ng/μl ; OD260/280=1,8~2,0) Remarque : Les montants d'échantillons sont indiqués à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.
Cliquez	Stratégie de séquençage 10X/détection pour SNP et petits InDel ; 20X/détection pour SV ; 30X/détection pour CNV. GBS : 10~20W Étiquettes ; moyenne de 8 X/Étiquette Plateforme Illumina Hiseq, plateforme de séquençage à longues lectures MGI DNBSEQ-T7/DNBSEQ-G400 Analyse des métriques de qualité de séquençage
	Analyse bioinformatique Nous proposons plusieurs analyses bioinformatiques personnalisées : Contrôle qualité des données brutes Alignement de référence ou assemblage Informations sur la variante Analyse personnalisée Remarque : Les sorties de données et les contenus d'analyse recommandés affichés sont à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Pipeline de technologie de séquençage

Basé sur assemblage du génome entier
Basé sur rééchantillonnage du génome complet
Basé sur le séquençage du génome à représentation réduite

The Data Analysis Pipeline of Variant Calling.

Livrables

Les données de séquençage originales
Résultats expérimentaux
Rapport d'analyse des données

Références

Jansen S, Aigner B, Pausch H, et al. Évaluation de la variation génomique dans une population bovine par le re-séquençage d'animaux clés avec une couverture faible à moyenne. BMC Genomics, 2013, 14(1) : 1.
Zheng L Y, Guo X S, He B, et al. Modèles de variation génétique à l'échelle du génome chez le sorgho sucré et le sorgho grain (Sorghum bicolor). Biologie du génome, 2011, 12(11):287-302.
Alkan C, Coe BP, Eichler EE. Découverte et génotypage des variations structurelles du génome. Revue de la nature : génétiqueMai 2011 ; 12(5) : 363-76.

Résultats de la démo

Les résultats partiels sont affichés ci-dessous :

The Variant Calling Results Display Figure.

FAQ sur l'appel de variants

1. Quels types de variants génétiques peuvent être détectés ?

Les variants génétiques peuvent être largement classés en variants de séquence, tels que les SNPs et les petits InDels, et en variants structuraux, y compris les grandes délétions, duplications, inversions et translocations. Les variations du nombre de copies (CNVs) sont un sous-type de SVs et peuvent également être détectées.

2. Comment les technologies de séquençage à longues lectures bénéficient-elles à l'appel de variants ?

Séquençage à lecture longue technologies, comme Séquençage SMRT de PacBio et Oxford Séquençage par nanopore, offrent des avantages tels que la détection de variants dans des régions génomiques complexes qui sont difficiles à analyser avec des méthodes de séquençage à court terme. Ils offrent une haute précision, évitent le biais PCR et permettent la résolution du phasage des variants.

3. Quel est le flux de travail typique pour l'appel de variants chez CD Genomics ?

Le flux de travail comprend le traitement des données et le contrôle de qualité, le mapping des lectures sur le génome de référence, l'appel de variants, l'annotation des variants et la visualisation des résultats. Cela garantit une détection complète et précise des variants génétiques.

Études de cas sur l'appel de variants

Assemblage du génome du pak choi non-heading et comparaison avec les génomes du chou chinois heading et du sarson jaune oléagineux.

Journal : Journal de biotechnologie végétale
Facteur d'impact : 10,1
Publié : 07 décembre 2020

Contexte

Les cultures de Brassica comprennent des espèces diploïdes et des espèces amphidiploïdes. Le génome du pak choi, étroitement lié au sarson jaune et au chou chinois à pomme, a été assemblé en utilisant Séquençage de molécules uniques PacBio et les technologies Hi-C. Cette assemblée a identifié de nombreux variants génétiques, y compris des SNP, des indels et des gènes spécifiques à certaines espèces, améliorant notre compréhension de la diversité des cultures de Brassica et de la génétique des traits.

Matériaux et Méthodes

Préparation des échantillons

Matériaux végétaux
Échantillons de feuilles
Extraction d'ADN

Séquençage

Séquençage du génome
Séquençage SMRT PacBio
RNA-seq

Analyse des données

De nouveau assemblage
Assemblage et évaluation des chromosomes
Analyses du transcriptome
Répéter l'annotation
Prédiction génique
annotation fonctionnelle
Analyse de la variation structurelle
Analyse comparative du génome

Résultats

Dans une publication en ligne de 2020 sur le "Chou"^[1]Une analyse comparative des variations parmi trois types de chou, y compris les variations de présence/absence (PAV) entre les gènes, les variants structurels (SV) au sein du génome, et les polymorphismes nucléotidiques simples (SNP), a révélé des informations significatives. Plus précisément, des différences dans les SV au sein des gènes de forme des feuilles (par exemple, KAN de la famille des facteurs de transcription GARP) et les rôles inhibiteurs des gènes liés à la floraison (par exemple, MAF4, SVP) ont été observés parmi les trois types morphologiques (comme illustré dans la Figure 1, à gauche). Ces résultats revêtent une importance cruciale pour déchiffrer les mécanismes moléculaires régissant la morphogenèse des organes et la floraison, ainsi que pour les améliorations génétiques, dans le chou et les cultures légumières apparentées.

Figure 1: Distribution of Presence–Absence Variants (PAV) and Specific Structural Variants (SVs) in the Cabbage Genome. (Li et al., 2020) Figure 1 : PAV et SV spécifiques dans le génome du chou^[1]

Autres cas :

L'influence des variants structuraux (SV) sur la structure des gènes et l'expression des gènes

Pour valider l'applicabilité de l'analyse SV et explorer son utilité dans les études évolutives de population, une publication en ligne de 2020 sur "la tomate"^[2] une enquête a été menée. Les chercheurs ont obtenu un arbre évolutif systématique basé sur plus de 800 matériaux avec des SNP issus de données de séquençage à lecture courte (Figure 2A). Par la suite, ils ont sélectionné un ensemble représentatif de 100 matériaux provenant de 7 lignées et ont collecté des données de séquençage à lecture longue pour construire un diagramme en arbre basé sur des données de SV (Figure 2B).

Les résultats ont indiqué que les matériaux sélectionnés étaient répartis au sein de leurs groupes taxonomiques connus, en accord avec la classification basée sur les SNP. Cela démontre l'adéquation des SV pour l'analyse génétique des populations.

Figure 2: Phylogenetic Tree of Tomato. (Alonge et al., 2020) Figure 2 : Arbre évolutif systématique de la tomate^[2]

Dans une publication en ligne de 2020 sur le "riz"^[3]Les chercheurs ont construit des diagrammes de structure de population basés à la fois sur des données de SNP (Figure 3A) et sur des données de SV (Figure 3B). L'analyse des SNP a révélé une large division de la population en environ six groupes, avec une distinction claire entre les variétés de riz japonica et indica. Fait intéressant, l'analyse des SV a produit des résultats très cohérents, soutenant davantage la différenciation observée dans l'analyse des SNP.

Figure 3: Genetic Composition of Rice. (Yixuan et al., 2020) Figure 3 : Structure génétique du riz^[3]

Spectre de fréquence des mutations de la population SV

Pour enquêter sur les impacts significatifs des variants délétères, la publication de 2020 sur le riz^[3] spectres de fréquence calculés pour des sites non codants dans différents groupes (Figure 4-A, B, C). Chaque SFS comprend cinq types de SV (DUP, DEL, TRA, MEI et INV) et deux types de SNP (Syn, Nsyn) et révèle trois caractéristiques notables :

Des différences significatives existent entre les différents groupes de population, en accord avec un dérive génétique accrue lors des goulets d'étranglement de domestication et des changements dans les systèmes d'accouplement.

La proportion de SV fixes est inférieure à celle des SNP synonymes fixes et des SNP non synonymes. Les SV ont une fréquence plus faible dans le génome et sont plus susceptibles d'être éliminés après mutation, ce qui indique une probabilité plus élevée de préjudice associé aux SV.

Les événements INV présentent le SFS le plus extrême, avec plus de 90 % des événements INV identifiés chez trois individus ou moins dans chaque groupe, ce qui implique que les événements INV peuvent être soumis à une forte sélection au cours du processus évolutif.

Les chercheurs ont effectué une analyse statistique des emplacements des SV et des SNP sur les chromosomes, et les résultats des tests indiquent une corrélation significative entre la diversité des SV et des SNP dans les fenêtres chromosomiques (Figure 4-D). Cela suggère que les SV fournissent des informations génétiques de population qui sont fondamentalement cohérentes avec les SNP.

Figure 4: Spectrum of Structural Variant (SV) Frequencies. (Yixuan et al., 2020) Figure 4 : Spectres de fréquence SV^[3]

Analyse de déséquilibre de liaison avec des SVs

Dans l'étude sur le [riz]^[3]LD (disequilibre de liaison) a été calculé pour trois groupes de populations distincts en utilisant des données SNP, SV et SNP+SV. En raison de leurs effets potentiellement nocifs, les SV présentent souvent des fréquences de population plus faibles par rapport aux SNP et peuvent connaître une décroissance du LD plus rapide sur des distances physiques (Figure 5). Les données SNP ont montré qu'à l'intérieur d'environ 100 kb, le r2 pour les SNP japonica restait autour de 0,2, tandis que pour les indica, il était d'environ 0,1. À la même distance physique, le r2 pour les rufipogon était inférieur à 0,05. Cependant, les valeurs de r2 pour les SV étaient inférieures à celles des SNP dans tous les groupes de population, avec des valeurs dépassant 0,1 uniquement sur des distances très courtes (<15 kb).

Figure 5: Analysis of Linkage Disequilibrium. (Yixuan et al., 2020) Figure 5 : Analyse de déséquilibre de liaison^[3]

Étude sur la domestication des populations

Dans la recherche menée sur le riz^[3]Une évaluation des disparités génomiques entre les polymorphismes mononucléotidiques (SNP) et les variants structurels (SV) a révélé une distinction notable. L'étude a observé que l'estimation moyenne de FST pour les SNP était nettement plus élevée par rapport aux SV. Cette découverte indique que les SV présentent généralement des fréquences de population plus faibles par rapport aux SNP.

En intégrant ces données avec des gènes de domestication et d'amélioration bien établis, l'enquête a réaffirmé l'enrichissement substantiel de ces gènes au sein des intervalles FST des 1 % et 10 % supérieurs. Par conséquent, cela a fourni des informations précieuses sur les gènes fonctionnels associés aux processus physiologiques, aux caractéristiques morphologiques et à la qualité des aliments (Figure 3).

Figure 6: Characteristics of Structural Variants (SVs) Related to Domestication. (Yixuan et al., 2020) Figure 6 : Caractéristiques SV associées à la domestication^[3]

Analyse d'association à l'échelle du génome entier

Dans la publication de 2020 sur [le colza]^[4]Une étude d'association à l'échelle du génome (GWAS) a été réalisée en utilisant les PAV identifiés à partir de huit variétés de colza. Cette analyse a révélé des relations causales entre les PAV et des traits tels que la longueur des siliques, le poids des graines et le temps de floraison. Fait intéressant, ces découvertes significatives ont été négligées dans les résultats du SNP-GWAS (Figure 7).

De même, dans la publication de 2021 sur [la pêche]^[5]Des SVs candidates associés à des traits tels que la maturation précoce des fruits, la couleur du péricarpe autour du noyau, la forme des fruits et la formation de formes plates ont été observés (Figure 8).

Figure 7: GWAS Analysis Results for Presence–Absence Variants (PAV) in Canola. (Song et al., 2020) Figure 7 : Résultats de l'analyse PAV_GWAS sur le colza^[4]

Figure 8: GWAS Analysis Results for Structural Variants (SVs) in Peach. (Jiantao et al., 2021) Figure 8 : Résultats de l'analyse SV_GWAS de la pêche^[5]

Références

Li P, Su T, Zhao X, et al. Assemblage du génome du pak choi non pommé et comparaison avec les génomes du chou chinois pommé et du sarson jaune oléagineux. Journal de biotechnologie végétale, 2020.
Alonge M, Wang X, Benoit M, et al. Impacts majeurs de la variation structurelle répandue sur l'expression génique et l'amélioration des cultures dans la tomate. Cellule, 2020.
Yixuan K, Yi L, Tuomas T, et al. Génomique évolutive de la variation structurelle dans la domestication du riz asiatique (Oryza sativa). Biologie moléculaire et évolution, 2020.
Song J, Guan Z, Hu J, et al. Huit génomes de haute qualité révèlent l'architecture du pan-génome et la différenciation des écotypes de Brassica napus. Plantes de la nature, 2020.
Jiantao G, Yaoguang X, Yang Y, et al. Les analyses de variation de la structure du génome de la pêche révèlent la dynamique des populations et une inversion causale de 1,67 Mb pour la forme du fruit. Biologie des génomes, 2021.

Publications connexes

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

Collection de données génétiques dans des études basées sur l'ethnicité chez les Aymaras, Quechuas et Mestizos : les défis de l'étude sur la génétique de la maladie d'Alzheimer dans la population péruvienne (GAPP).

Journal : Alzheimer et Démence

Année : 2022

Désolé, je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai ravi de vous aider.

Évaluation des biomarqueurs plasmatiques pour la classification A/T/N de la maladie d'Alzheimer chez les adultes d'origine hispanique des Caraïbes

Journal : JAMA Network Open

Année : 2023

Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Augmentation de la production de spores fongiques pathogènes et aéroportées lors de l'exposition d'une mycobiote du sol à des polluants chlorés aromatiques.

Journal : Microbiology Spectrum

Année : 2023

Désolé, je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici.

Une variante d'épissage dans le gène SLC16A8 entraîne un déficit de transport de lactate dans les cellules épithéliales pigmentaires rétiniennes dérivées de cellules iPS humaines.

Journal : Cellules

Année : 2021

Je suis désolé, mais je ne peux pas accéder ou traduire le contenu de l'URL fournie. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le partager ici.

Voir plus articles publiés par nos clients.