Séquençage à haut débit : Définition, Technologie, Avantages, Application et Flux de travail

Qu'est-ce que le séquençage à haut débit ?

Séquençage à haut débit (HTS), communément appelé Séquençage de nouvelle génération (NGS) incarne l'avancée technologique révolutionnaire qui transforme la discipline de la génomique. Cette approche innovante permet aux chercheurs de séquencer des molécules d'ADN et d'ARN rapidement à une échelle sans précédent. Cela contraste fortement avec le séquençage Sanger traditionnel basé sur la méthode de terminaison de chaîne, qui a été considérablement limité par son faible débit et son coût élevé.

En lieu de cela, Séquençage à haut débit les méthodologies exploitent le potentiel du traitement parallèle, capable de gérer des millions de fragments d'ADN simultanément. Cela favorise un séquençage rapide et économique de génomes ou de transcriptomes entiers.

De telles plateformes HTS tirent parti d'une série de techniques de séquençage par synthèse ou par ligation pour l'élucidation des séquences d'ADN ou d'ARN. Au cœur de ces techniques se trouve la fragmentation des molécules d'ADN ou d'ARN en fragments minuscules, auxquels des adaptateurs ou des amorces sont ensuite fixés. Ces fragments subissent une amplification, aboutissant à la génération de clusters composés de séquences homologues sur une structure de support solide.

La procédure de séquençage englobe la détermination itérative de la séquence de nucléotides au sein de chaque cluster, réalisée par la détection de l'intégration de nucléotides marqués par luminescence ou par la clivage de marqueurs luminescents.

Avantages du séquençage à haut débit

Précision et exactitude

La précision et l'exactitude prééminentes de HTS surpassent celles des méthodes de séquençage conventionnelles. Elles offrent des données de séquençage d'une qualité impeccable et avec des erreurs minimales, fournissant aux chercheurs des résultats hautement fiables. Cette précision revêt une importance cruciale dans des domaines tels que l'appel de variants et la détection de mutations, où la détection exacte des altérations génétiques est indispensable pour déchiffrer les processus pathologiques et concevoir des thérapies sur mesure.

Évolutivité

La fonctionnalité d'évolutivité de l'HTS permet le séquençage de grandes quantités d'ADN ou d'ARN dans un seul dispositif expérimental. Cet attribut est essentiel pour les projets nécessitant une couverture de séquençage approfondie, y compris des analyses complètes. séquençage du génome ou complexe transcriptomique études utilisant RNA-seqEn utilisant un débit d'échantillons élevé, le HTS facilite l'analyse exhaustive de l'hétérogénéité génétique, le profilage de l'expression génique et les réseaux régulateurs à travers une variété de systèmes biologiques.

Vitesse et efficacité

De plus, le séquençage à haut débit (HTS) confère un avantage significatif en termes de rapidité et d'efficacité par rapport aux techniques de séquençage traditionnelles. Avec la capacité de générer d'énormes volumes de données de séquençage en une fraction du temps habituel, il permet aux chercheurs d'accélérer les expériences et d'accélérer la génération d'aperçus scientifiques. Cela s'est avéré transformateur dans le diagnostic clinique, où la détection rapide des mutations est essentielle dans la gestion des maladies.

Polyvalence

Les techniques HTS sont dotées d'un haut degré de polyvalence et sont applicables à un large éventail de domaines génomiques et transcriptomique analyses. Leur utilisation va du séquençage de génomes entiers et d'exomes au ChIP-seq et RNA-seq L'utilisation extensive des techniques HTS a suscité des avancées révolutionnaires dans plusieurs disciplines, y compris la génomique du cancer, la biologie du développement et la microbiologie, enrichissant ainsi notre compréhension de la vie au niveau moléculaire.

Technologie de séquençage à haut débit

Séquençage Illumina : Une pierre angulaire du HTS

Le séquençage Illumina, une technologie révolutionnaire dans Séquençage à haut débita considérablement propulsé le domaine de la recherche génomique en raison de son évolutivité, de sa précision et de son rapport coût-efficacité inégalés. Cette technique de haute performance, officiellement appelée « séquençage par synthèse », englobe la fragmentation des échantillons d'ADN, l'ajout d'adaptateurs de séquençage et leur amplification subséquente par réaction en chaîne par polymérase (PCR).

À l'issue de ce processus, ces fragments augmentés sont séquencés simultanément de manière massivement parallèle, chaque base intégrée étant détectée par des signaux fluorescents correspondants. Il est remarquable que les séquenceurs Illumina possèdent la capacité de séquencer simultanément des millions de ces fragments d'ADN, ce qui en fait un outil idéal pour diverses applications, telles que le séquençage de génomes entiers, le séquençage d'exomes et l'analyse de séquences d'ARN ou RNA-seq.

Compte tenu de sa fiabilité et de sa flexibilité remarquables, le séquençage Illumina est devenu la technique privilégiée dans un large éventail d'études génomiques, allant de la recherche fondamentale aux diagnostics cliniques. Par conséquent, cette méthode a fondamentalement modifié le paysage de la génomique et continue de promettre beaucoup dans la réalisation de la médecine de précision.

Illumina sequencing process (Lu Zhang et al,. 2021)Processus de séquençage Illumina (Lu Zhang et al., 2021)

Séquençage Oxford Nanopore : capacités en temps réel et en lectures longues

En revanche, Séquençage Oxford Nanopore propulse un changement de paradigme en offrant des capacités de séquençage en temps réel avec des longueurs de lecture étendues, redéfinissant ainsi les dynamiques de la recherche en génomique. Cette méthode contemporaine repose sur le principe de transport des molécules d'ADN ou d'ARN à travers une série de structures nanoporeuses intégrées dans une membrane. Les perturbations du courant électrique, observées lorsque ces molécules traversent les nanopores, sont enregistrées et interprétées en données de séquence d'ADN. Caractérisée par son séquençage rapide, mobile et direct du matériel génétique, cette technologie dispense de la nécessité de pré-amplification ou de fragmentation. Le séquençage Oxford Nanopore s'est révélé transformateur dans le domaine de la génomique, en particulier dans des niches nécessitant un séquençage à longue lecture tel que l'assemblage de génomes de novo, la détection de variants structuraux et la surveillance en temps réel des pathogènes. En intégrant un design polyvalent et accessible, le séquençage Oxford Nanopore a élargi les horizons de l'exploration génomique, équipant ainsi les chercheurs d'un outil dynamique capable de séquencer l'ADN ou l'ARN à leur convenance et au lieu de leur choix.

Principle of nanopore sequencing Yunhao (Wang et al, 2021)Principe du séquençage par nanopore Yunhao (Wang et al, 2021)

Séquençage Pacific Biosciences : Technologie de temps réel à molécule unique (SMRT)

Séquençage de Pacific Biosciences (PacBio), basé sur la technologie de séquençage en temps réel à molécule unique (SMRT), offre à la communauté scientifique des capacités de séquençage à longues lectures combinées à une précision considérable. Divergeant d'Illumina et Séquençage Oxford Nanopore méthodologies, le séquençage PacBio témoigne de la synthèse de l'ADN directement en temps réel, exploitant l'application de nucléotides marqués par fluorescence. Cette approche inventive facilite le séquençage de fragments d'ADN étendus, permettant ainsi l'identification de variants structurels, de réarrangements génomiques complexes et de modifications épigénétiques. Cette technique a connu une vaste application dans des domaines tels que l'assemblage de génomes, la métagénomique et transcriptomiqueoù la capacité à générer de longues lectures est essentielle pour déchiffrer des régions génomiques complexes et capturer des transcrits de pleine longueur. Bien que le séquençage PacBio présente souvent un débit inférieur par rapport au séquençage Illumina, sa capacité à produire de longues lectures de haute fidélité en fait une ressource inestimable pour des analyses génomiques spécifiques, complétant ainsi les atouts des plateformes de séquençage alternatives.

PacBio Sequencing Anthony Rhoads (et al, 2015)Séquençage PacBio Anthony Rhoads (et al, 2015)

Séquençage Ion Torrent : Séquençage basé sur des semi-conducteurs

Le séquençage Ion Torrent, une création de Life Technologies (actuellement intégré à Thermo Fisher Scientific), utilise la technologie des semi-conducteurs pour le séquençage de l'ADN. Cette méthode distinctive détecte les ions hydrogène libérés lors du processus d'intégration des nucléotides, facilitant la surveillance en temps réel de la synthèse de l'ADN. Les séquenceurs Ion Torrent offrent des délais d'exécution rapides et une capacité de sortie modifiable, les rendant adaptés à un large éventail d'applications, y compris, mais sans s'y limiter, le séquençage d'amplicons ciblés, l'analyse génomique microbienne et la caractérisation des mutations cancérigènes. Bien que les longueurs de lecture offertes par le séquençage Ion Torrent ne dépassent pas celles des plateformes concurrentes, sa rapidité et sa procédure opérationnelle élémentaire en font un instrument indispensable pour les activités de séquençage habituelles dans les laboratoires de recherche ainsi que dans les environnements cliniques. La facilité d'utilisation, associée à l'efficacité économique du séquençage Ion Torrent, souligne son acceptation répandue dans de nombreuses disciplines de recherche génomique, enrichissant ainsi le spectre des technologies de séquençage à haut débit.

Aperçu comparatif des technologies de séquençage à haut débit

Technologie de séquençage à haut débit Séquençage Illumina Séquençage Oxford Nanopore Séquençage Pacific Biosciences Séquençage Ion Torrent
Principe Séquençage par synthèse Basé sur des nanopores Temps Réel à Molécule Unique (SMRT) Basé sur des semi-conducteurs
Longueur de lecture Court à moyen Longue Longue Court à moyen
Précision Élevé Variable Élevé Modéré à élevé
Débit Élevé Modéré à élevé Modéré Modéré à élevé
Exigence de fragmentation Oui Non Non Oui
Séquençage en temps réel Non Oui Oui Oui
Portabilité Limité Oui Non Limité
Applications Séquençage du génome entier, séquençage de l'exome, RNA-seq Assemblage de génome de novo, détection de variants structurels, surveillance en temps réel des pathogènes Assemblage de génome, métagénomique, transcriptomique Séquençage d'amplicons ciblés, génomique microbienne, profilage des mutations cancéreuses

Application de séquençage à haut débit

Application de séquençage à haut débit en transcriptomique

Transcriptomiques, un examen perspicace des transcrits d'ARN engendrés par le génome, a connu d'énormes avancées grâce à l'avènement des technologies de séquençage à haut débit (HTS). Le séquençage des molécules d'ARN, extraites méticuleusement de cellules ou de tissus spécifiques, permet aux chercheurs de déchiffrer les motifs d'expression génique, les cas d'épissage alternatif, ainsi que les modifications post-transcriptionnelles. Avec ses applications à large spectre s'étendant sur plusieurs spécialités, la transcriptomique basée sur le HTS trouve son utilité dans le profilage de l'expression génique, la découverte d'ARN non codants et le détail des modifications de l'ARN.

Profilage de l'expression génique :

Une des applications rudimentaires mais essentielles de la HTS dans le domaine de transcriptomiqueLe profilage de l'expression génique consiste à quantifier l'abondance des transcrits d'ARN au sein d'un spécimen biologique. Le séquençage du transcriptome permet aux chercheurs d'identifier les gènes exprimés différemment dans des conditions expérimentales variables, des états cliniques ou des phases de développement. Les informations recueillies sont indispensables à la compréhension des mécanismes cellulaires, des voies de signalisation et des réseaux régulateurs qui sous-tendent les phénomènes biologiques. Par exemple, le profilage de l'expression génique basé sur l'ARN-seq a été avantageux pour examiner des aspects de la progression du cancer, du développement et des interventions thérapeutiques, révélant ainsi des biomarqueurs et des cibles thérapeutiques potentielles.

Identification des ARN non codants :

L'avènement des technologies HTS a été essentiel pour découvrir et comprendre les ARN non codants (ncARN), qui exercent une influence significative sur la régulation des gènes et les mécanismes cellulaires. La réalisation du séquençage du transcriptome permet d'identifier diverses sous-classes de ncARN, y compris les microARN (miARN), les longs ARN non codants (lncARN) et les ARN circulaires (circARN). Ces ncARN influencent divers rôles biologiques tels que le remodelage de la chromatine, l'épissage de l'ARN et la régulation post-transcriptionnelle des gènes. Par exemple, les miARN ont été impliqués dans différents aspects du développement et de la progression du cancer, influençant ainsi l'expression des gènes impliqués dans la prolifération cellulaire, l'apoptose et la métastase.

Caractérisation des modifications de l'ARN :

De plus, basé sur le HTS transcriptomiqueCela facilite également l'étude des modifications de l'ARN telles que la méthylation m6A, la pseudouridylation et l'édition de l'ARN, qui jouent des rôles essentiels dans la détermination de la stabilité de l'ARN, de l'efficacité de la traduction et des interactions protéine-ARN. Le séquençage des molécules d'ARN avec une grande précision permet aux chercheurs de cartographier et de quantifier les modifications de l'ARN à travers tout le transcriptome. Ces informations recueillies enrichissent notre compréhension de la régulation dynamique de l'expression génique et des répercussions fonctionnelles des modifications de l'ARN dans la santé et la maladie. Des preuves suggèrent que la dérégulation de la méthylation m6A est impliquée dans une myriade de maladies humaines, y compris le cancer, les troubles neurodéveloppementaux et les maladies métaboliques.

Application de séquençage à haut débit dans la recherche génomique

L'avènement de Séquençage à haut débit les technologies ont catalysé une profonde évolution dans le domaine de la recherche en génomique ; facilitant la capacité à examiner les génomes, les transcriptomes et les épigénomes avec un détail et une exactitude sans précédent. À mesure que la capacité du HTS s'est développée, elle a prospéré dans de multiples frontières scientifiques, trouvant des bases solides dans les domaines de la génomique du cancer, du diagnostic clinique, de la génomique environnementale et de la génomique personnelle.

Génomique du cancer :

On peut dire que l'une des applications les plus monumentales du HTS réside dans le domaine de la génomique du cancer. Cela a fondamentalement recalibré notre perception de l'architecture moléculaire sous-jacente des tumeurs et engendré le domaine pionnier de l'oncologie de précision. En séquençant à la fois le tissu génomique et transcriptomique de ces cellules rebelles, les scientifiques peuvent extraire des informations clés, y compris les mutations conductrices, la fonctionnalité des voies oncogéniques et des cibles thérapeutiques cruciales (Schwaederlé et al., 2015). Un exemple est l'identification de mutations hautement spécifiques dans des gènes pivots tels que EGFR, BRAF et ALK, qui ont orienté la création de thérapies ciblées révolutionnant les résultats cliniques pour les patients atteints de types de cancer spécifiques (Hyman et al., 2017). De plus, la mise en œuvre du HTS de manière non invasive, comme les biopsies liquides, offre une surveillance robuste de la progression tumorale et de la réponse au traitement, fournissant des informations précieuses sur l'avancement de la maladie et une approche de traitement personnel stratégique (Diaz et Bardelli, 2014).

Diagnostics cliniques :

Dans le domaine du diagnostic clinique, le HTS est devenu un outil révolutionnaire, offrant un diagnostic complet et un protocole de traitement personnalisé. En séquençant les exomes ou les génomes centrés sur le patient, les cliniciens peuvent décoder l'existence de mutations pathogènes, de prédispositions génétiques et de marqueurs pharmacogénomiques essentiels pour qualifier les réponses au traitement (Yang et al., 2013). Cette approche guidée par le HTS s'est révélée particulièrement influente dans le diagnostic des maladies génétiques rares, où les diagnostics conventionnels rencontrent souvent des résultats non concluants (Bick et al., 2017).

Génomique environnementale :

HTS a des applications robustes qui vont au-delà des milieux cliniques. En génomique environnementale, elle a offert une perspective novatrice pour étudier les communautés microbiennes, la biodiversité et la dynamique des écosystèmes. En séquençant des échantillons environnementaux par le biais de méthodologies métagénomiques, les chercheurs peuvent percer les mystères de la diversité microbienne et de leur rôle dans les cycles biogéochimiques (Tringe et Hugenholtz, 2008). Une compréhension améliorée des dynamiques d'expression génique grâce à la transcriptomique et à la métatranscriptomique informe les stratégies de gestion et de conservation efficaces des écosystèmes.

Génomique personnelle :

Dans la génomique personnelle, l'utilité des technologies de séquençage à haut débit (HTS) se manifeste, permettant aux individus d'obtenir des informations sur leurs prédispositions génétiques, leurs généalogies et leurs risques pour la santé. Cela permet aux services de tests génétiques directs aux consommateurs d'offrir aux individus un accès à des informations génomiques personnalisées pour la cartographie des ancêtres, l'analyse des traits et la prédiction de la prédisposition aux maladies (Tandy-Connor et al., 2018). De plus, le HTS a des applications significatives en pharmacogénomique en identifiant les variantes génétiques qui affectent le métabolisme des médicaments et les réponses aux traitements, ouvrant la voie à des régimes médicamenteux personnalisés adaptés au génotype unique d'un individu (Caudle et al., 2014). Ces avancées soulignent l'impact profond et transformateur du HTS dans la recherche génomique, propulsant des percées dans les domaines de la médecine, de l'écologie et des soins de santé personnalisés.

Application de séquençage à haut débit en épigénomique

ÉpigénomiqueL'encapsulation des complexités de l'impact des altérations épigénétiques sur l'expression génique et les phénotypes cellulaires constitue une discipline cruciale à l'interface de la biologie et de la médecine. L'inception des technologies de séquençage à haut débit a catalysé un changement de paradigme dans la recherche épigénomique, permettant une analyse exhaustive des signatures épigénétiques dispersées à travers le génome. Les applications du séquençage à haut débit sont multipartites, rationalisant la cartographie de la méthylation de l'ADN, des motifs de modification des histones, de l'accessibilité de la chromatine, et offrant un aperçu des architectures chromatiniennes tridimensionnelles.

Profilage de la méthylation de l'ADN :

La méthylation de l'ADN, caractérisée par l'ajout de groupes méthyle aux bases de cytosine, est essentielle à la régulation de l'expression génique, soutenant la stabilité génomique et aidant à la différenciation cellulaire. Les méthodes orientées vers le HTS, telles que le séquençage au bisulfite et le séquençage au bisulfite à représentation réduite (RRBS), ont propulsé le profilage de la méthylation de l'ADN à l'échelle du génome dans un domaine de résolution à un nucléotide (Cokus et al., 2008). Le séquençage de l'ADN traité au bisulfite aide à révéler les cytosines méthylées et non méthylées, dévoilant ainsi les motifs de méthylation de l'ADN qui imprègnent le génome. Une telle connaissance est monumentale pour comprendre l'importance de la méthylation de l'ADN dans le développement normal, le vieillissement, ainsi que les vulnérabilités aux maladies comme le cancer et les troubles neurologiques (Meissner et al., 2008).

Cartographie des modifications des histones :

Les modifications des histones, englobant l'acétylation, la méthylation, la phosphorylation et l'ubiquitination, sont essentielles à la structuration de la chromatine, à la régulation des gènes et à l'organisation du génome. Les méthodes intégrées à HTS, telles que l'immunoprécipitation de la chromatine suivie du séquençage (ChIP-seq), ont révolutionné la cartographie des modifications des histones à travers le génome (Barski et al., 2007). Le séquençage des fragments d'ADN enrichis pour des modifications spécifiques des histones facilite l'identification des régions génomiques liées à des états de chromatine actifs ou répressifs. Cette connaissance est cruciale pour éclairer les mécanismes régulateurs qui pilotent l'expression des gènes, l'activité des enhancers et la dynamique de la chromatine à travers le spectre de la santé et de la maladie (Heintzman et al., 2007).

Essais d'accessibilité de la chromatine :

L'accessibilité de la chromatine, un indicateur de la capacité de l'ADN à interagir avec des protéines régulatrices et des facteurs de transcription, est centrale à l'expression des gènes et à la fonctionnalité des éléments régulateurs. Des essais pilotés par HTS tels que l'essai de chromatine accessible aux transposases utilisant le séquençage (ATAC-seq) et DNase-seq, permettent un profilage de l'accessibilité de la chromatine à haute résolution et à l'échelle du génome (Buenrostro et al., 2013). Le séquençage des régions de chromatine accessibles aide à identifier les facteurs régulateurs actifs, y compris les promoteurs, les amplificateurs et les isolateurs, et à exposer leurs rôles dans la régulation des gènes et l'identité cellulaire. De telles informations s'avèrent cruciales pour déconstruire la fondation épigénétique de la différenciation cellulaire, de l'évolution des tissus et de l'étiologie des maladies (Song et Crawford, 2010).

Architecture chromatin tridimensionnelle :

Les dernières avancées dans les technologies HTS ont également facilité l'exploration de l'architecture chromatinienne tridimensionnelle et de l'organisation génomique. Des protocoles tels que Hi-C, l'analyse des interactions chromatiniennes par séquençage de tags en paires (ChIA-PET) et HiChIP permettent aux chercheurs d'explorer l'organisation spatiale du génome et de discerner les formations de boucles et de domaines chromatiniennes (Lieberman-Aiden et al., 2009 ; Fullwood et al., 2009). Le séquençage des interactions chromatiniennes facilite la reconstruction de modèles génomiques tridimensionnels et la discernement des interactions à longue distance entre les facteurs régulateurs et les gènes cibles. Ces informations sont essentielles pour comprendre la structure chromatinienne supérieure, les principes de repliement du génome et l'organisation spatiale du génome au sein du noyau (Rao et al., 2014).

Application de séquençage à haut débit dans l'analyse du microbiome

La recherche sur le microbiome, axée sur les communautés microbiennes omniprésentes dans divers écosystèmes, a connu des avancées significatives avec l'avènement de Séquençage à haut débit technologies. Cette critique met en avant le rôle central des HTS dans l'élucidation de la composition et de la fonction du microbiome, soulignant les applications dans l'exploration de la diversité microbienne, la discernement des structures communautaires, l'effectuation du profilage fonctionnel et l'élucidation des associations complexes entre le microbiome et l'hôte.

Caractérisation de la diversité microbienne :

HTS est apparu comme une approche révolutionnaire pour démystifier la diversité microbienne, offrant un portrait exhaustif des communautés microbiennes à travers divers écosystèmes tels que l'intestin humain, le sol, l'océan et les milieux atmosphériques. Grâce à des techniques telles que le séquençage d'amplicons du gène de l'ARN ribosomal 16S et séquençage métagénomique par tir aléatoire de génome completla composition taxonomique et l'abondance des constituants microbiens au sein des échantillons deviennent discernables (Turnbaugh et al., 2007). En facilitant l'analyse parallèle de millions de séquences d'ADN, le séquençage à haut débit (HTS) permet aux chercheurs d'identifier des espèces microbiennes insaisissables et relativement rares, de déchiffrer la dynamique des communautés et d'évaluer l'influence des variables environnementales sur la diversité microbienne.

Déchiffrer la structure communautaire :

Au-delà du profilage taxonomique, le séquençage à haut débit (HTS) détient un potentiel considérable pour élucider l'architecture et la composition des communautés microbiennes. En produisant des données complexes sur les populations microbiennes, le HTS permet de reconnaître les changements au sein des communautés, les liens écologiques et les espèces clés au sein d'écosystèmes microbiens complexes. Des approches telles que le séquençage métagénomique fournissent des preuves solides du potentiel fonctionnel des communautés microbiennes, offrant des perspectives sur leur rôle dans le cycle des nutriments, la bioremédiation et la propagation des maladies (Gilbert et al., 2010). L'évolution de la technique de séquençage à cellule unique a en outre révélé la diversité génomique, les capacités métaboliques et les réseaux interactifs des cellules microbiennes individuelles au sein d'une communauté.

Profilage fonctionnel et métagénomique :

Le déploiement de HTS dans séquençage métagénomique facilite l'exploration du potentiel fonctionnel des communautés microbiennes grâce à l'examen du contenu génétique collectif dans un échantillon. Les enquêtes métagénomiques révèlent les nuances du métabolisme microbien, des fonctionnalités des gènes et des voies impliquées dans les opérations environnementales et l'interaction hôte-microbiome (Qin et al., 2010). En annotant les gènes et en prédisant les voies métaboliques, la métagénomique permet d'identifier des traits microbiens pertinents pour le cycle biogéochimique, la résistance aux antibiotiques et le bien-être de l'hôte. Complémentaires à la métagénomique, les méthodes métatranscriptomiques et métaprotéomiques, qui révèlent respectivement la transcription active des gènes et les profils protéiques des communautés microbiennes, fournissent ainsi des aperçus dynamiques sur les activités fonctionnelles.

Interactions entre le microbiome et l'hôte :

HTS sous-tend une compréhension nuancée des interactions microbiome-hôte et de leur impact sur la santé humaine et la manifestation des maladies. Les enquêtes soutenues par HTS ont éclairé le rôle du microbiome intestinal dans la modulation du métabolisme de l'hôte, de la réponse immunitaire et de la vulnérabilité à un éventail de conditions, y compris l'obésité, les maladies inflammatoires de l'intestin et les syndromes métaboliques (Arumugam et al., 2011). L'intégration de données multi-omiques provenant d'échantillons de microbiome et d'hôte permet aux chercheurs de décoder la réciprocité complexe entre les communautés microbiennes et la réponse physiologique de l'hôte, permettant potentiellement des stratégies de médecine personnalisée ciblant le microbiome.

Schematic diagram summarizing the applications of high throughput sequencing for studies of the epidemiology, evolution and pathogenesis of bacterial infections. (Paul R McAdam et al, 2014)Diagramme schématique résumant les applications du séquençage à haut débit pour les études de l'épidémiologie, de l'évolution et de la pathogénie des infections bactériennes. (Paul R McAdam et al, 2014)

Étapes de séquençage à haut débit

Préparation de la bibliothèque :

La phase initiale dans Séquençage à haut débit nécessite la création d'une bibliothèque dans laquelle des échantillons d'ADN ou d'ARN subissent une fragmentation, sont marqués avec des adaptateurs de séquençage et sont ensuite amplifiés, ce qui entraîne la production de bibliothèques de séquençage. Bien que les exigences spécifiques de chaque application et la plateforme de séquençage utilisée puissent légèrement modifier ce processus, l'approche standard implique des réactions enzymatiques, des processus de purification et l'évaluation du contrôle de qualité pour garantir que les bibliothèques de séquençage résultantes possèdent intégrité et fiabilité.

Séquençage :

Suite à la préparation réussie des bibliothèques de séquençage, la prochaine étape consiste à charger ces bibliothèques préparées sur la plateforme de séquençage. À ce stade, une séquence de bases nucléotidiques est progressivement intégrée dans la formation de brins d'ADN en croissance. À chaque incorporation individuelle d'une base, l'instrument de séquençage l'enregistre et l'identifie. Les plateformes de séquençage utilisées dans les procédures à haut débit génèrent une énorme quantité de données brutes de séquençage. Ces données brutes nécessitent un traitement et une analyse ultérieurs pour extraire des informations biologiquement significatives.

Analyse des données :

Séquençage à haut débit soulignent l'importance cruciale de l'analyse des données, qui implique la gestion, l'alignement et l'interprétation des données de séquençage générées. Des pipelines de bioinformatique sont utilisés pour couper les lectures brutes, les faire correspondre aux génomes ou transcriptomes de référence, et discerner les variations génétiques ou les motifs d'expression génique différentielle. Grâce à des mécanismes et des algorithmes informatiques avancés, les chercheurs sont en mesure d'obtenir des informations biologiques à partir de jeux de données de séquençage à grande échelle, facilitant ainsi de nouvelles découvertes dans divers domaines de recherche tels que la base génétique des maladies, la biologie évolutive et la médecine personnalisée.

Schematic diagram summarizing the applications of high throughput sequencing for studies of the epidemiology, evolution and pathogenesis of bacterial infections. (Paul R McAdam et al, 2014)Séquençage ADN à haut débit.
(A) Étapes de laboratoire humide et (B) étapes de laboratoire sec. Les détails de chaque étape sont décrits dans le texte. (Maloyjo Joyraj Bhattacharjee, Basant K. Tiwary, dans Biotechnologie dans les soins de santé, 2022)

Analyse des données dans le séquençage à haut débit

L'analyse des données est un élément crucial des flux de travail de séquençage à haut débit, car elle implique le traitement, l'interprétation et l'extraction d'informations significatives à partir des vastes quantités de données de séquençage générées par les plateformes de HTS. La complexité des données de HTS, qui peut varier de millions à des milliards de courtes séquences d'ADN ou d'ARN, nécessite des outils de bioinformatique sophistiqués et des algorithmes informatiques pour extraire des informations biologiques de manière précise et efficace.

Prétraitement et Contrôle de Qualité

La première étape de l'analyse des données HTS implique le prétraitement et le contrôle de la qualité pour garantir l'exactitude et la fiabilité des données de séquençage. Cela inclut la coupe des séquences d'adaptateurs, le filtrage des lectures de faible qualité et l'élimination des artefacts de séquençage et des séquences contaminantes. Des outils tels que FastQC, Trimmomatic et Cutadapt sont couramment utilisés pour l'évaluation de la qualité et le prétraitement des données HTS (Andrews et al., 2010 ; Bolger et al., 2014 ; Martin, 2011).

Lecture de la cartographie et de l'alignement

Une fois que les données de séquençage brutes ont été prétraitées, l'étape suivante est le mappage et l'alignement des lectures, où les courtes séquences de lectures sont alignées à un génome ou transcriptome de référence pour identifier leurs origines génomiques ou transcriptomiques. Ce processus implique d'aligner chaque lecture à la séquence de référence, en permettant des erreurs, des insertions et des suppressions. Les algorithmes de mappage de lectures populaires incluent Bowtie, BWA et HISAT2, qui emploient différentes stratégies pour un alignement efficace et précis des courtes lectures (Langmead et al., 2009 ; Li et Durbin, 2009 ; Kim et al., 2015).

Appel et détection de variantes

L'appel de variants est une étape cruciale dans l'analyse des données de séquençage à haut débit (HTS), en particulier dans les études génomiques, où il s'agit d'identifier des variants de nucléotides uniques (SNV), des insertions, des délétions et des variations structurelles dans les génomes séquencés. Les algorithmes d'appel de variants tels que GATK, FreeBayes et VarScan utilisent des modèles statistiques et des approches d'apprentissage automatique pour détecter les variants à partir des lectures de séquençage alignées, en tenant compte des erreurs de séquençage, de la profondeur de lecture et de la qualité de mappage (McKenna et al., 2010 ; Garrison et Marth, 2012 ; Koboldt et al., 2012).

Quantification des transcrits et analyse de l'expression différentielle

Dans les études transcriptomiques, l'analyse des données HTS implique la quantification des niveaux d'expression des gènes et l'identification des gènes exprimés de manière différentielle entre les conditions expérimentales. Cela nécessite généralement de mapper les lectures RNA-seq à un transcriptome de référence et d'estimer les abondances des transcrits à l'aide d'outils tels que Salmon, Kallisto et RSEM (Patro et al., 2017 ; Bray et al., 2016 ; Li et al., 2011). L'analyse d'expression différentielle qui suit utilise des méthodes statistiques telles que DESeq2, edgeR et limma pour identifier les gènes qui sont significativement régulés à la hausse ou à la baisse entre les groupes expérimentaux (Love et al., 2014 ; Robinson et al., 2010 ; Ritchie et al., 2015).

Annotation fonctionnelle et analyse des voies métaboliques

Pour obtenir des informations biologiques à partir des données de HTS, une annotation fonctionnelle et une analyse des voies sont réalisées pour annoter les gènes, prédire leurs fonctions et identifier les voies biologiques ou les termes d'ontologie génique enrichis. Des outils tels que DAVID, Enrichr et g:Profiler sont couramment utilisés pour l'analyse d'enrichissement fonctionnel, permettant aux chercheurs d'interpréter la signification biologique des gènes ou des variants génétiques exprimés de manière différentielle (Huang et al., 2009a, 2009b ; Chen et al., 2013 ; Raudvere et al., 2019).

Défis et Opportunités

Bien que le HTS offre des opportunités sans précédent pour la recherche génomique, il présente également plusieurs défis, notamment en matière d'analyse des données. La gestion et l'interprétation de grands volumes de données de séquençage nécessitent des méthodes computationnelles sophistiquées et une infrastructure bioinformatique robuste. De plus, garantir la qualité et la reproductibilité des données est primordial, nécessitant une validation rigoureuse et une évaluation des pipelines d'analyse. Cependant, les avancées en apprentissage automatique, en informatique en nuage et en visualisation des données améliorent les capacités des outils bioinformatiques et permettent aux chercheurs d'extraire des informations plus approfondies à partir des données HTS.

FAQ sur le séquençage à haut débit

NGS et HTS sont-ils la même chose ?

NGS et HTS font référence à la même technologie : le séquençage de nouvelle génération et le séquençage à haut débit sont des termes synonymes utilisés de manière interchangeable dans le domaine de la génomique.

Quel est le but du séquençage à haut débit ?

Le but de Séquençage à haut débit est de séquencer rapidement des molécules d'ADN et d'ARN à grande échelle, révolutionnant la recherche génomique. Cette technologie permet aux chercheurs d'analyser efficacement des génomes ou des transcriptomes entiers, fournissant des informations sur la variation génétique, l'expression des gènes et d'autres processus biologiques.

Références :

  1. Reuter JA, Spacek DV, Snyder MP. Technologies de séquençage à haut débit. Mol Cell. 2015
  2. Turnbaugh, P.J., Ley, R.E., Hamady, M., Fraser-Liggett, C.M., Knight, R., et Gordon, J.I. (2007). Le projet du microbiome humain. Nature 449, 804–810.
  3. Gilbert, J.A., Meyer, F., Antonopoulos, D., Balaji, P., Brown, C.T., Brown, C.T., Desai, N., Eisen, J.A., Evers, D., Field, D., et al. (2010). Rapport de réunion : L'atelier de métagénomique Terabase et la vision d'un projet sur le microbiome terrestre. Normes en sciences génomiques 3, 243–248.
  4. Qin, J., Li, R., Raes, J., Arumugam, M., Burgdorf, K.S., Manichanh, C., Nielsen, T., Pons, N., Levenez, F., Yamada, T., et al. (2010). Un catalogue de gènes microbiens humains établi par séquençage métagénomique. Nature 464, 59–65.
  5. Arumugam, M., Raes, J., Pelletier, E., Le Paslier, D., Yamada, T., Mende, D.R., Fernandes, G.R., Tap, J., Bruls, T., Batto, J.-M., et al. (2011). Entérotypes du microbiome intestinal humain. Nature 473, 174–180.
  6. Schwaederlé, M.C., Patel, S.P., Husain, H. et al. Utilité de l'évaluation génomique de l'ADN tumoral circulant dérivé du sang (ctDNA) chez les patients atteints d'adénocarcinome pulmonaire avancé. Clin Cancer Res 21, 3196–3203 (2015). Hyman, D.M., Puzanov, I., Subbiah, V. et al. Vemurafénib dans plusieurs cancers non mélanomes avec des mutations BRAF V600. N Engl J Med 373, 726–736 (2015).
  7. Diaz, L.A. Jr & Bardelli, A. Biopsies liquides : génotypage de l'ADN tumoral circulant. J Clin Oncol 32, 579–586 (2014).
  8. Yang, Y., Muzny, D.M., Reid, J.G. et al. Séquençage de l'exome entier clinique pour le diagnostic des troubles mendéliens. N Engl J Med 369, 1502–1511 (2013).
  9. Bick, D., Fraser, P., Gutzeit, M.F. et al. Application réussie du séquençage de l'exome entier prénatal dans un cadre clinique. Diagnostique prénatal 37, 1215–1220 (2017).
  10. Bianchi, D.W., Parker, R.L., Wentworth, J. et al. Séquençage de l'ADN versus dépistage standard des aneuploïdies prénatales. N Engl J Med 370, 799–808 (2014).
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut