Le taux de duplication fait référence au pourcentage de lectures dupliquées dans l'ensemble des séquences séquencées. Plus le taux de duplication est élevé, moins l'utilisation des données est efficace et plus le coût de séquençage est gaspillé.
• Détection de variantes complète : Reséquençage du génome entier permet la détection de divers types de variants génétiques, offrant une vue d'ensemble du génome. Cela inclut à la fois des variants communs et rares à travers l'ensemble du génome.
• Haute résolution : Le resequencement offre un niveau de résolution élevé, permettant la détection même des variations génétiques subtiles.
• Découverte de variantes nouvelles : Le séquençage complet du génome peut révéler des variantes auparavant inconnues ou rares qui peuvent être associées à des maladies ou des traits spécifiques, permettant ainsi de nouvelles découvertes et des éclaircissements sur la génétique humaine.
Le resequencement est effectué avec un génome de référence pour identifier des variants génétiques, tandis que le séquençage et l'assemblage de novo sont utilisés lorsqu'aucun génome de référence n'est disponible pour reconstruire l'ensemble du génome à partir de zéro.
• valeurs dupliquées dues aux échantillons eux-mêmes : petite taille d'échantillon, faible diversité d'échantillon (par exemple, ctDNA, etc.), etc.
• valeurs dupliquées résultant du processus de construction de la bibliothèque :
fragmentation : aléatoire, homogénéité et taille des fragments ;
ligation de jonction : plus l'efficacité de la ligation est élevée, meilleure est la diversité moléculaire, et plus le taux de duplication est bas.
• Amplification par PCR : la teneur en GC du fragment est liée à l'efficacité d'amplification de l'échantillon.
• Effet de la génération de clusters sur dup : densité appropriée de la génération de clusters
• Dup causé par la résolution optique : erreurs dans la collecte du signal.
Le choix de la plateforme de séquençage dépend de facteurs tels que les objectifs de l'expérience, l'organisme et les ressources disponibles. Illumina est couramment utilisée pour le resequencement et la détection de variants, tandis que PacBio ou Oxford Nanopore sont meilleurs pour l'assemblage de novo et détection de grandes variantes structurellesIllumina est rentable, et le séquençage à longues lectures est utile pour les génomes complexes. Prenez en compte les exigences du projet pour prendre une décision éclairée.
La couverture requise pour le séquençage dépend de divers facteurs tels que les objectifs spécifiques de votre expérience, l'organisme étudié et le niveau de confiance souhaité dans la détection des variants ou l'assemblage du génome. Voici quelques recommandations générales pour la couverture :
NGS (par exemple, Illumina) :
• Analyse des variants germinaux/fréquents : couverture de 20 à 50x.
• Analyse des variants somatiques/rares : couverture de 100 à 1000x.
• Comparaison tumeur vs. normal : couverture ≥60x pour la tumeur, couverture ≥30x pour le normal.
• Études de population : couverture de 20 à 50x.
• Assemblage de novo : couverture de 100 à 1000x. Séquençage à lecture longue (par exemple, PacBio) :
• Remplissage des lacunes et échafaudage : couverture 10x.
• Détection de grandes variantes structurelles : couverture 10x.
• Analyse des variants germinaux/fréquents : couverture de 20 à 50x.
• Assemblage de novo : couverture de 50 à 100x.
Sur la plateforme PacBio Sequel, des longueurs de lecture moyennes de 10 à 15 kb sont généralement atteintes, avec des longueurs de lecture maximales atteignant jusqu'à 60 kb. Il est important de noter que les longueurs de lecture réelles obtenues peuvent varier en fonction de plusieurs facteurs, y compris les conditions de séquençage spécifiques, la qualité de l'échantillon d'ADN et la méthode de préparation de la bibliothèque utilisée.
Le dépistage est généralement effectué par fréquence et impact fonctionnel dans les bases de données publiques, puis par informations sur le phénotype de la maladie ou le motif génétique, et ensuite des facteurs tels que le risque protéique et la conservation sont pris en compte.
Le séquençage du génome entier pour analyser les mutations somatiques (direction tumorale) nécessite des échantillons appariés, tels que des tissus cancéreux et des tissus para-cancéreux du même patient, ou des tissus cancéreux et du sang total du même patient.
Il existe deux principales méthodes pour fragmenter l'ADN : la fragmentation physique et la fragmentation enzymatique. La fragmentation physique utilise principalement la fragmentation mécanique pour briser le génome de manière aléatoire, comme la fragmentation ultrasonique, l'aérosolisation, etc. La fragmentation enzymatique utilise principalement la fonction de cisaillement des enzymes pour fragmenter le génome. La méthode de fragmentation enzymatique est simple à utiliser, mais la méthode de fragmentation physique offre une meilleure randomisation de la fragmentation.
Selon que l'enrichissement par amplification PCR est nécessaire lors de la préparation de la bibliothèque, il existe deux types d'options de préparation de bibliothèque : amplifiée par PCR et sans PCR.
Voir notre Directives de Soumission d'Échantillons pour des instructions sur la préparation et l'envoi de vos échantillons pour le séquençage du génome entier.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.