What is structural variant and haplotype analysis?

Structural variant and haplotype analysis identifies large genome changes and organizes variants by allele or linked genomic background.

When is SNP-only variant analysis not enough?

SNP-only analysis may be insufficient when the research signal involves large insertions, deletions, inversions, duplications, CNVs, translocations, repeats, or linked allele-specific patterns.

Why are long reads useful for structural variant detection?

Long reads can span larger genomic regions, repetitive sequences, and variant breakpoints, which makes them useful for detecting and resolving structural variants.

Solution d'analyse des variants structurels et des haplotypes

Table des matières

Genome variation analysis output overview

Explore comment les preuves de longues lectures, l'appel de variations structurelles, le phasage des haplotypes et la bioinformatique personnalisée peuvent soutenir l'interprétation complexe du génome.

Quand les SNP ne suffisent pas : pourquoi les variants structurels et les haplotypes sont importants

Les SNPs et les petites indels sont utiles, mais ils ne représentent qu'une seule couche de variation génomique. De nombreuses questions de recherche dépendent de changements génomiques plus importants, tels que des variations du nombre de copies, de grandes insertions, des inversions, des translocations, des variants associés aux répétitions ou des combinaisons de variants spécifiques à un allèle.

Un projet d'analyse des variants structurels et des haplotypes va au-delà des changements de bases isolés. Il pose une question plus pratique : quelle architecture génomique est liée à la différence biologique que vous étudiez ?

Les variants structurels peuvent affecter la dose génique, les séquences codantes, les régions régulatrices, l'organisation du génome et les intervalles candidats. L'analyse des haplotypes ajoute une autre couche en montrant quels variants se produisent ensemble sur le même allèle ou le même contexte génomique. Ce contexte peut être important lorsque le signal de recherche dépend de blocs hérités, d'allèles parentaux, de la structure de la population, des différences entre souches ou de variations au niveau des cultivars.

Le séquençage à lecture longue est souvent précieux dans ce domaine car les longues lectures peuvent couvrir des régions répétitives, des réarrangements complexes et des variants liés que les courtes lectures peuvent ne pas résoudre efficacement. Des études récentes ont montré que le séquençage à lecture longue peut améliorer la découverte de variants structurels et l'analyse prenant en compte les haplotypes dans des régions génomiques difficiles.

Pour de nombreuses équipes, la question principale n'est pas simplement de savoir si les SV sont présents. La question plus utile est de savoir si les SV et les haplotypes peuvent être reliés à des gènes candidats, des régions candidates, des différences entre groupes ou une interprétation en aval. C'est là qu'une solution planifiée est importante.

Ce que cette solution vous aide à résoudre

Notre solution d'analyse des variants structurels et des haplotypes est conçue pour des projets où l'analyse standard des variants laisse des questions importantes sans réponse.

Interprétation des traits complexes et des régions candidates

Si votre Étude d'association à l'échelle du génome (GWAS), QTL-seq, Analyse de ségrégation en vrac (BSA)ou l'analyse de la population pointe vers une région candidate, les résultats au niveau des SNP peuvent ne pas expliquer l'intégralité du signal.

Examiner les régions candidates pour les variations structurelles
Connectez les SV avec les gènes et les annotations à proximité.
Organiser des preuves par étapes autour de la question de recherche.

Comparaison de la population, de la souche, du cultivar ou du matériel génétique

Dans Génétique des populations, la recherche sur l'élevage et les études au niveau des souches, la même région génique peut porter différentes formes structurelles selon les groupes.

Comparer les modèles SV entre les groupes
Résumer les structures haplotypiques par population ou lignée.
Soutenir les études sur le matériel génétique et la diversité

Analyse des génomes complexes d'organismes non-modèles

De nombreuses plantes, animaux, microbes et organismes environnementaux présentent des régions répétitives, une qualité de référence variable, une forte hétérozygotie, de la polyploïdie ou des ressources génomiques incomplètes.

Réviser la taille du génome et le statut de référence
Évaluer la qualité des échantillons avant la sélection de la plateforme.
Adapter l'analyse à la complexité du génome.

Intégration avec l'analyse en aval

Les résultats des SV et des haplotypes sont les plus utiles lorsqu'ils se connectent au reste de l'étude.

Nos capacités de service pour les projets SV et haplotypes

Nous ne considérons pas l'analyse des SV et des haplotypes comme un seul pipeline standard. Un plan de projet utile dépend de votre échantillon, de l'espèce, de la structure du génome, des données existantes et de la question biologique.

Conception de stratégie de séquençage

Nous examinons si votre projet est mieux adapté à un séquençage à court ou à long reads, ou à une stratégie hybride. Les projets axés sur de grands SV, des répétitions, des haplotypes, des loci complexes ou des génomes non modèles bénéficient souvent de preuves à long read.

Lorsque le séquençage à longues lectures est approprié, nous pouvons vous aider à évaluer des options telles que Séquençage SMRT de PacBio et Séquençage par nanopores.

Détection et annotation des variants structurels

Suppressions
Insertions
Inversions
Duplications
Translocations
CNVs
Réarrangements complexes, lorsqu'ils sont étayés par les données.

Pour les projets axés sur les CNV, Services de séquençage CNV peut être considéré comme un module connexe.

Phasage des haplotypes et interprétation tenant compte des haplotypes

Le phasage des haplotypes aide à organiser les variants par allèle ou par contexte génomique. Cela peut aider votre équipe à comprendre si les variants sont liés, comment ils diffèrent entre les groupes, et si une région candidate contient des motifs de variants phasés qui sont importants pour l'interprétation.

Bioinformatique sur mesure

Les projets SV et haplotype ont souvent besoin de plus qu'une exportation de fichier par défaut. CD Genomics fournit Bioinformatique, Analyse des données génomiqueset Service d'analyse de données de séquençage à lecture longue pour des projets nécessitant une conception d'analyse personnalisée, une logique de filtrage, une comparaison de cohortes ou une visualisation prête pour le rapport.

Nous pouvons préparer des résultats qui aident votre équipe à examiner et à communiquer les résultats, y compris des tableaux récapitulatifs SV, des fichiers de variantes par phases, des tableaux d'annotation, des pistes de navigateur génomique, des figures récapitulatives et des rapports de projet.

Stratégie technologique : Longue lecture, courte lecture ou hybride ?

La meilleure stratégie dépend de ce que vous devez résoudre. Aucune plateforme ou méthode d'analyse unique n'est la meilleure pour chaque projet de SV et d'haplotype. Un benchmark de 2024 publié dans Nature Communications comparant les méthodes de détection de SV basées sur l'alignement et celles basées sur l'assemblage a révélé des compromis clairs. Les méthodes basées sur l'assemblage ont bien performé pour les grands SV, en particulier les insertions, tandis que les méthodes basées sur l'alignement ont montré des avantages pour la précision du génotypage à faible couverture et pour certaines classes de SV complexes. L'étude a également souligné qu'il n'existe pas d'outil universellement supérieur dans tous les scénarios.

Stratégie	Meilleur ajustement	Valeur de détection SV	Valeur de haplotype	Sensibilité de l'échantillon	Les besoins en bioinformatique	Notes pratiques
Séquençage génomique à lecture courte	Découverte de SNP/Indel, séquençage large, données de cohortes existantes	Limité pour les SVs grands ou complexes ; utile pour les petites variantes et les preuves de soutien.	Phasage limité sauf s'il est soutenu par des données supplémentaires.	Généralement plus tolérant à l'ADN fragmenté que les flux de travail à lecture longue.	Appel de variantes standard, filtrage, annotation	Utile lorsque des données de variantes petites au niveau de la cohorte sont nécessaires.
Séquençage à long terme HiFi de PacBio	Découverte précise de variantes à longues lectures, régions complexes, analyse prenant en compte les haplotypes	Forte pour les insertions, les suppressions, les variants associés aux répétitions et les régions complexes.	Forte lorsque la longueur de lecture et la précision soutiennent le phasage.	Nécessite de l'ADN génomique de haute qualité	Alignement de longues lectures, appel de SV, phasage, annotation	Bon choix lorsque la précision de la séquence et le contexte des longues lectures sont importants.
Séquençage à longue lecture d'Oxford Nanopore	Lectures longues, potentiel de lectures ultra-longues, régions structurelles complexes	Utile pour les grands SV, les lectures couvrant des répétitions et les réarrangements.	Peut prendre en charge le phasage lorsque la couverture, la qualité de lecture et la conception du pipeline sont appropriées.	Nécessite un examen minutieux de l'intégrité de l'ADN, en particulier pour les objectifs ultra-longs.	Alignement conscient de l'ONT, appel de SV, stratégie de polissage ou de filtrage	Bon choix lorsque la longueur de lecture et la puissance de couverture sont des priorités.
Lecture hybride à courtes et longues lectures	Données de séquençage à court terme existantes plus nouvelles preuves de séquençage à long terme	Combine un large contexte de variantes avec des preuves de SV à longues lectures.	Peut améliorer la confiance lorsque plusieurs couches de preuves s'accordent.	Dépend des deux types de données.	Intégration, validation croisée, rapport fusionné	Utile lorsque le projet dispose déjà de données de séquençage génomique à lecture courte ou de resequencage.
Assemblage résolu par haplotype	Génomes complexes, haute hétérozygotie, pan-génome ou études spécifiques aux allèles	Forte pour la découverte structurelle lorsque la qualité d'assemblage est élevée.	Forte pour la structure génomique spécifique à l'allèle	Nécessite une entrée de haute qualité et une planification plus approfondie.	Assemblage, polissage, phasage, comparaison, annotation	Meilleur lorsqu'une base génomique de référence ou résolue par allèle est nécessaire.

Flux de travail de bout en bout avec points de contrôle de QC

De la réception du projet aux résultats SV et haplotypes prêts pour le rapport.

End-to-end structural variant and haplotype analysis workflow with QC checkpoints

Nous commençons par examiner votre espèce, le type d'échantillon, le nombre d'échantillons, l'état du génome de référence, l'objectif de recherche, les types de variants cibles et les besoins en analyses en aval. À ce stade, nous clarifions si le projet est axé sur la découverte de SV à l'échelle du génome entier, une région candidate, une comparaison de population, une comparaison de matériel de reproduction, une variation au niveau des souches ou une intégration avec des résultats existants.

Après la soumission de l'échantillon, la qualité de l'ADN génomique est vérifiée avant la préparation de la bibliothèque. Pour les flux de travail à longues lectures, l'intégrité de l'ADN est particulièrement importante car de longues molécules améliorent la capacité à couvrir les répétitions, les points de rupture et les blocs d'haplotype. Si l'échantillon ne correspond pas au flux de travail prévu, nous examinons les ajustements possibles avant de continuer.

En fonction de la stratégie confirmée, les échantillons passent à un séquençage à lecture courte, à lecture longue ou hybride. Pour les projets à lecture longue, l'objectif est de générer des lectures capables de soutenir la détection de variations structurales (SV), la résolution de points de rupture et le phasage lorsque les données le permettent. Les lectures sont ensuite alignées sur le génome de référence ou utilisées dans un flux de travail tenant compte de l'assemblage lorsque cela est approprié.

Les variants structurels sont appelés, filtrés, classés et annotés. Le phasage des haplotypes est effectué lorsque les données et la conception de l'étude le permettent. Les résultats peuvent ensuite être reliés à des gènes, des régions régulatrices, des intervalles candidats, des groupes de population ou des régions associées à des traits. Vous recevez des fichiers de sortie et un rapport de projet qui résument la logique d'analyse, les types de résultats clés, la structure des fichiers et les sorties prêtes pour la visualisation.

Exigences d'échantillon et informations sur l'entrée de projet

La qualité de l'échantillon affecte directement l'analyse des SV et des haplotypes à longues lectures. L'ADN de haute masse moléculaire est particulièrement important lorsque le projet dépend de preuves à longues lectures à travers des répétitions, des points de rupture de SV ou des régions phasées.

Les exigences finales en matière d'échantillons dépendent de l'espèce, de la taille du génome, du type d'échantillon, de la plateforme et de l'objectif du projet. Avant la confirmation du projet, notre équipe examine les informations ci-dessous et recommande le flux de travail le plus adapté.

Type d'échantillon ou d'entrée	Ce que nous examinons	Orientation qualité	Points de contrôle QC typiques	Notes
ADN génomique à haut poids moléculaire pour l'analyse à long terme	Intégrité de l'ADN, concentration, pureté, méthode d'extraction, historique de l'échantillon	Longs fragments d'ADN, faible dégradation, faible contamination	Qubit, NanoDrop, gel, PFGE ou révision de la taille des fragments le cas échéant	Idéal pour les projets qui s'appuient sur des preuves à longues lectures à travers des répétitions, des points de rupture SV ou des régions phasées.
ADN génomique standard pour le séquençage à lecture courte (WGS)	Quantité d'ADN, pureté, dégradation, cohérence de l'échantillon	Qualité d'entrée stable pour la construction de bibliothèques	Qubit, NanoDrop, contrôle de gel, QC de bibliothèque	Utile lorsque les données de courtes lectures soutiennent une analyse au niveau des cohortes ou hybride.
Fichiers FASTQ, BAM, CRAM ou VCF existants	Format de fichier, source de la plateforme, métadonnées d'échantillon, version du génome de référence	Intégrité des fichiers, complétude des métadonnées, compatibilité avec l'analyse prévue	Vérification de l'intégrité des fichiers, vérification du format, examen des métadonnées	Peut soutenir la réanalyse, l'intégration hybride ou l'interprétation en aval.
Matériel tissulaire, cellulaire, végétal, microbien ou environnemental	Échantillon source, condition de conservation, qualité d'ADN attendue, faisabilité d'extraction	Adéquation pour l'extraction d'ADN et le séquençage en aval	Inspection d'échantillons, examen de la faisabilité d'extraction, contrôle qualité des entrées après extraction.	Le soutien à l'extraction peut être envisagé lorsque la soumission directe d'ADN n'est pas disponible.
Données existantes de GWAS, QTL, BSA, pan-génome ou de population	Conception de l'étude, étiquettes de groupe, régions candidates, version de référence, format des résultats	Compatibilité avec SV et interprétation des haplotypes	Revue des métadonnées, revue du système de coordonnées, revue du fichier de résultats	Aide à relier les résultats de SV et de haplotypes avec des questions biologiques en aval.

Analyse bioinformatique et livrables

La principale valeur de cette solution ne réside pas seulement dans la génération de données. La valeur provient de la transformation des preuves de SV et de haplotypes en résultats organisés, réutilisables et interprétables.

Nous nous concentrons sur les résultats que votre équipe peut réellement utiliser : des fichiers pour réanalyse, des tableaux pour révision, des pistes pour visualisation et des rapports qui expliquent ce qui a été fait.

Livrables minimums

Résumé de la QC des données brutes
Distribution de la longueur et de la qualité des lectures
Résumé de l'alignement
Résumé de la couverture
Ensemble d'appels de variantes structurelles
table d'annotation SV
Résultats de phasage des haplotypes

Options supplémentaires

Analyse axée sur les CNV
Comparaison des SV au niveau de la population
Comparaison de la fréquence des haplotypes
Intégration de GWAS, QTL-seq ou BSA
Comparaison du pan-génome
Annotation de région candidate

Types de fichiers de sortie

Fichiers FASTQ, BAM ou CRAM le cas échéant
Fichiers VCF ou fichiers VCF phasés
Fichiers d'annotation au format BED ou GFF
Tableaux récapitulatifs TSV ou CSV
Pistes du navigateur génomique
rapport de projet au format PDF ou HTML

Comment choisir la bonne stratégie d'analyse des SV et des haplotypes

Une bonne stratégie commence par la question biologique. Nous vous aidons à décider quelles couches de preuves et quelle profondeur d'analyse sont nécessaires avant de passer à l'exécution du projet.

Choisissez d'abord la lecture longue lorsque la complexité structurelle est centrale.

Une stratégie de lecture longue en premier est souvent appropriée lorsque votre projet se concentre sur de grandes insertions, des suppressions, des inversions, des translocations, des répétitions, des loci complexes ou des blocs haplotypiques.

Choisissez l'analyse hybride lorsque les données de séquençage à court terme existantes peuvent apporter de la valeur.

Si vous disposez déjà de données de WGS à lecture courte, de resequencage, d'études d'association génomique (GWAS), de QTL ou de BSA, une stratégie hybride peut aider à réutiliser les preuves existantes tout en ajoutant un soutien à lecture longue pour les questions de SV et de phasage.

Ajoutez une analyse de la population ou des traits lorsque l'interprétation dépend des groupes.

Si votre recherche compare des populations, des souches, des cultivars, des familles ou des groupes phénotypiques, l'analyse ne doit pas se limiter à l'appel de SV sur un seul échantillon.

Ajoutez des bioinformatiques personnalisées lorsque les sorties standard ne suffisent pas.

Un fichier VCF standard peut ne pas répondre à votre question de recherche. La bioinformatique personnalisée peut aider à relier les SV et les haplotypes aux gènes, intervalles, annotations fonctionnelles, différences entre groupes ou visualisations prêtes à être rapportées.

Plan d'analyse de la demande

Références

Conformité / Avertissement

CD Genomics fournit ce service uniquement à des fins de recherche (RUO). Ce service n'est pas destiné à un diagnostic clinique, à une interprétation médicale directe ou à des tests destinés aux consommateurs.

Résultats de la démonstration

Les résultats de la démonstration aident votre équipe à comprendre à quoi pourrait ressembler l'analyse finale avant de commencer le projet. Ces exemples montrent des types de résultats, pas des conclusions biologiques fixes.

Résumé du paysage SV

Cette sortie résume les suppressions, insertions, inversions, duplications, translocations et CNV à travers les échantillons ou les régions.

Bloc d'haplotype et vue des variants phasés

Cette sortie montre des variantes phasées à travers une région, vous aidant à voir quelles variantes apparaissent ensemble sur le même haplotype.

Candidate-region interpretation view integrating SVs and gene annotation

Interprétation intégrée de la région candidate

Cette sortie combine des appels SV, des variants phasés, l'annotation des gènes et des signaux de comparaison de groupes dans une seule région.

FAQ

1. Qu'est-ce que l'analyse des variants structurels et des haplotypes ?

L'analyse des variants structurels et des haplotypes identifie de grands changements génomiques et organise les variants par allèle ou contexte génomique lié. Cela peut inclure l'appel de variants structurels, l'analyse des CNV, l'examen des points de rupture, le phasage, l'annotation, la visualisation et l'interprétation en aval.

2. Quand l'analyse des variants uniquement SNP n'est-elle pas suffisante ?

L'analyse uniquement basée sur les SNP peut être insuffisante lorsque le signal de recherche implique de grandes insertions, des délétions, des inversions, des duplications, des CNV, des translocations, des répétitions ou des motifs spécifiques d'allèles liés. Si une région candidate semble importante mais que les SNP n'expliquent pas le motif, l'analyse des SV et des haplotypes peut être utile.

3. Pourquoi les longues lectures sont-elles utiles pour la détection des variants structurels ?

Les lectures longues peuvent couvrir de plus grandes régions génomiques, des séquences répétitives et des points de rupture de variants. Cela les rend utiles pour détecter et résoudre des SV qui peuvent être difficiles à caractériser uniquement avec des lectures courtes.

4. Quelles sont les différences entre PacBio et Nanopore pour les projets de SV et d'haplotypes ?

Les workflows de type PacBio sont souvent appréciés pour leurs lectures longues précises, tandis que les workflows de type Nanopore peuvent fournir des lectures très longues et une forte capacité de couverture. Le meilleur choix dépend de la qualité de l'échantillon, de la complexité du génome, des types de variants cibles, des besoins en longueur de lecture et des objectifs d'analyse en aval.

5. Cette solution peut-elle fonctionner pour des organismes non-modèles ?

Oui, de nombreux projets sur des organismes non-modèles sont adaptés, mais la conception du flux de travail est importante. Nous examinons la qualité du génome de référence, la taille du génome, le contenu en répétitions, l'hétérozygotie, la ploïdie et la qualité des échantillons avant de recommander une stratégie.

6. Quelles informations d'échantillon sont nécessaires avant de recommander un flux de travail ?

Nous avons généralement besoin de l'espèce, du type d'échantillon, du nombre d'échantillons, de la quantité d'ADN disponible, de la qualité de l'ADN, de l'état du génome de référence, des données de séquençage existantes, des types de variants cibles et de la question de recherche principale.

7. Quels livrables puis-je attendre ?

Les livrables peuvent inclure des résumés de contrôle qualité, des fichiers d'alignement, des ensembles d'appels de variants structuraux, des sorties de variants phasés, des tableaux d'annotation, des fichiers prêts pour la visualisation, des pistes pour le navigateur génomique et un rapport de projet. Les résultats optionnels peuvent inclure une comparaison de cohortes ou une interprétation de régions candidates.

8. Les résultats de SV et d'haplotype peuvent-ils être intégrés avec GWAS, QTL-seq, BSA ou l'analyse du pan-génome ?

Oui. Les résultats de SV et de haplotypes peuvent être liés à des intervalles cartographiés, des régions candidates, des groupes de population, des motifs de présence/absence dans le pan-génome ou des signaux associés aux traits lorsque la conception de l'étude le permet.

9. Fournissez-vous des résultats prêts pour la visualisation ?

Oui. Nous pouvons préparer des chiffres résumés, des pistes de navigateur génomique, des graphiques au niveau des régions, des résumés de classes de SV, des vues de blocs d'haplotypes et des panneaux de régions candidates lorsque ces résultats sont inclus dans le plan d'analyse.

10. Comment devrais-je décider entre une solution uniquement de séquençage et une solution d'analyse complète ?

Le séquençage seul peut suffire si votre équipe dispose déjà d'un pipeline validé et d'un plan d'interprétation clair. Une solution d'analyse complète est plus utile lorsque vous avez besoin d'aide pour la sélection de la plateforme, l'appel des SV, le phasage, l'annotation, la visualisation et l'interprétation biologique en aval.

Cas de littérature : Découverte de SV à longues lectures et résolution de haplotypes à l'échelle de la population

Point Forts de Recherche Publiés

Variation structure chez 1 019 humains divers basée sur le séquençage à longues lectures.

Journal : Nature
Publié : 2025

Contexte

Les projets de génomes à l'échelle de la population se sont souvent appuyés sur des ressources de courtes lectures. Les courtes lectures sont utiles pour de nombreuses petites variantes, mais elles peuvent ne pas résoudre correctement les variantes structurelles, les changements médiés par des répétitions et les régions génomiques difficiles. Cela est important car les variantes structurelles contribuent à la diversité génétique et peuvent façonner l'architecture génomique spécifique à une population.

Une étude de Nature de 2025 a abordé ce problème en appliquant le séquençage à longues lectures à un large et diversifié cohort de génomes. L'étude a utilisé 1 019 échantillons provenant de 26 populations, en faisant un exemple public solide de la manière dont les données à longues lectures peuvent améliorer la construction de ressources SV et l'analyse tenant compte des haplotypes.

Méthodes

L'étude a combiné le séquençage à long fragment d'Oxford Nanopore avec une analyse basée sur des génomes linéaires et graphiques. Les auteurs ont aligné les lectures contre des références linéaires et graphiques, utilisé la découverte et le génotypage de variations structurelles (SV) sensibles aux graphes, et construit une ressource de variations structurelles à l'échelle de la population.

L'analyse a également pris en compte la distribution de la population, l'activité des éléments mobiles, les répétitions en tandem de nombre variable multiallélique et l'analyse liée aux haplotypes. Ce design plus large est pertinent pour les équipes de recherche planifiant la génomique des populations, l'analyse de la diversité ou l'interprétation des variants complexes.

Résultats

L'étude a rapporté plus de 100 000 variants structurels bialléliques résolus par séquence et a génotypé 300 000 répétitions en tandem à nombre variable d'allèles.
Il a caractérisé des délétions, des duplications, des insertions et des inversions à travers les populations.
La cohorte comprenait 1 019 génomes provenant de 26 groupes de population auto-déclarés répartis sur cinq zones continentales.
La figure 1 présente le séquençage à longues lectures et le cadre SAGA, y compris la répartition de la population, la couverture de séquence, la longueur des lectures et la découverte et le génotypage des SV sensibles au graphe.
La Fig. 10 des Données Étendues se concentre sur l'exactitude du haplotypage ciblé, ce qui est particulièrement pertinent pour les projets où des loci complexes nécessitent une interprétation au niveau des haplotypes.

Long-read structural variation study framework and population-scale analysis overview L'analyse à grande échelle par lecture longue peut soutenir la découverte de variations structurelles, le génotypage et l'interprétation tenant compte des haplotypes.

Conclusion

Ce cas de littérature soutient un point de décision clé pour les projets SV et haplotypes : les preuves provenant de lectures longues peuvent révéler des variations structurelles et des motifs haplotypiques qui sont difficiles à capturer avec des approches uniquement basées sur les SNP ou les lectures courtes.

Pour la planification de projet, la leçon est claire. Un projet SV utile ne doit pas se limiter à la séquençage ou à l'appel de variantes. Il doit relier la sélection de la plateforme, la révision de la QC, l'appel de SV, le phasage, l'annotation, la visualisation et la production de rapports prêts à l'interprétation.

Publications connexes

Les publications suivantes soutiennent le raisonnement scientifique pour la détection des variants structurels, le phasage des haplotypes, le séquençage à longues lectures et l'interprétation des variants.

Variation structure chez 1 019 humains divers basée sur le séquençage à longues lectures

Journal : Nature

Année : 2025

Compromis dans les méthodes d'alignement et d'assemblage pour la détection des variants structurels avec des données de séquençage à longues lectures

Journal : Communications Nature

Année : 2024

Duet : Appel de variants structurels assisté par SNP et phasage utilisant le séquençage par nanopores Oxford

Journal : BMC Bioinformatique

Année : 2022

Le haplotypage local permet un appel précis des petites variantes à partir de longues lectures.

Journal : Nature Communications

Année : 2024