La caractérisation complète des variantes génomiques humaines est importante pour mieux comprendre les traits génétiques et les maladies. Pour les études sur les maladies rares, il est particulièrement crucial d'identifier des cartes complètes de tous les types de variantes, y compris les indels, les répétitions en tandem courtes (STR) et les variants structurels (SV). Un défi particulier pour l'exactitude du séquençage du génome est mutation de novo (DNM), qui a été montré comme une cause majeure de maladies sporadiques, sévères et à début précoce. Chaque génome humain contient en moyenne environ 40 à 90 DNM, mais ce sont également parmi les variantes les plus difficiles à identifier. Par conséquent, la détection complète de tous les types de DNM nécessite des données de séquençage de haute qualité.
Bien que le séquençage à court terme puisse détecter avec précision de petites variantes, il a une sensibilité limitée pour les grands STR, CNV et SV. Le séquençage à long terme a été largement utilisé pour l'assemblage de novo du génome humain et pour les SV non détectés par le séquençage à court terme, mais sa faible précision à la résolution d'une seule paire de bases (pb) empêche la détection fiable de variantes plus petites que 50 pb. Pour répondre au double besoin d'une longue longueur de lecture et d'une haute précision dans l'analyse du génome, PacBio a développé Séquençage long-read HiFi technologie qui combine à la fois une longue longueur de lecture et une grande précision, rendant séquençage à lecture longue également adapté à la détection de petites variantes.
Un article de recherche intitulé "Découverte complète de mutations de novo avec le séquençage long-read HiFi" a été publié dans Médecine GénomiqueL'équipe a construit le jeu de données de mutations le plus complet avec une seule technique, le séquençage HiFi à longues lectures, permettant une détection précise des substitutions, des indels, des STR et des SV. La précision de la technique permet même une détection sensible des DNM à tous les niveaux de mutation différents et permet également le phasage, ce qui aide à distinguer les DNM vrais positifs des faux positifs.
Découverte complète de mutations de novo avec le séquençage long-read HiFi. (Kucuk et al., 2023)
La précision de base accrue du séquençage HiFi est particulièrement bénéfique pour la détection de petites mutations de novo (DNM) par rapport au séquençage à lecture courte, et peut même améliorer la sensibilité. De plus, contrairement à d'autres technologies de séquençage à lecture longue, la technologie HiFi n'a pas de chimie hautement instable, sa qualité de données est plus stable, et le séquençage HiFi peut atteindre une précision de 99,9 %. HiFi peut donc être un outil puissant pour relever des défis complexes dans la recherche génomique.
Pour démontrer l'utilité du séquençage à longues lectures dans la détection de mutations de novo, l'équipe a séquencé les génomes de huit trios parent-enfant en utilisant un séquençage à longues lectures PacBio HiFi à haute couverture (~30x) et un séquençage du génome entier à courtes lectures Illumina (~50x). Pour le séquençage à longues lectures HiFi, la longueur moyenne des lectures obtenues dans l'étude était de 17 kb. Plus de 99,0 % des 5,7 millions de lectures par échantillon se sont alignées sur le génome de référence, avec une qualité de cartographie de 46,5.
Les données ont montré qu'en moyenne, 3,8 millions de mutations de substitution par échantillon étaient partagées entre les deux plateformes de séquençage, correspondant à une concordance de 94,0 % entre les tests de séquençage à lecture longue et à lecture courte. Selon les résultats, le séquençage à lecture longue HiFi offrait environ 240 Mb de couverture de séquence pour le génome, contrairement au séquençage à lecture courte. De plus, le taux d'erreur génétique mendélien pour le séquençage à lecture longue HiFi n'était que de 2,1 %, indiquant que la majorité des appels de variants étaient précis.
Pour les indels, le séquençage long à haute fidélité (HiFi) a permis d'obtenir en moyenne 1 million de mutations par échantillon, tandis que le séquençage à court lire a donné en moyenne 900 000 indels. La concordance était de 63,1 % pour le séquençage à court lire et de 58,0 % pour le séquençage long HiFi, avec environ 25 % des indels détectés dans des régions non couvertes par le séquençage à court lire. De plus, le ratio MIE des indels uniques au séquençage long HiFi (8,9 %) était inférieur à celui des indels uniques au séquençage à court lire (13,0 %), ce qui indique que le séquençage long HiFi est meilleur pour détecter les indels.
Dans l'ensemble, la précision du séquençage à longues lectures HiFi permet une identification sensible des DNM au niveau de toutes les variantes, et permet également la fixation, ce qui aide à distinguer les DNM vrais positifs des faux positifs.
mutation de novo (DNM). (Kucuk et al., 2023)
Un complet WGS Un ensemble de données peut être généré par une seule technologie, le séquençage long-read HiFi, permettant une identification précise des substitutions, des indels, des STR et des SV. Cela signifie que les patients atteints de maladies rares d'origine génétique suspectée peuvent être testés de manière vraiment complète avec un seul test global. La précision de cette technologie est significative pour le diagnostic des maladies graves à début précoce.
Référence: