Qu'est-ce que le séquençage de novo de l'ensemble du génome des plantes et des animaux ?
Séquençage de novo de génomes entiers de plantes et d'animaux fait référence à l'assemblage d'un génome complet sans s'appuyer sur une séquence de référence existante. Cette approche est essentielle lorsqu'on travaille avec des espèces qui n'ont pas de génome de référence, qui ont des génomes mal assemblés ou qui présentent des caractéristiques génomiques complexes telles qu'une forte hétérozygotie, la polyploïdie ou des régions répétitives étendues.
Au lieu d'aligner les lectures de séquençage à un génome connu, l'assemblage de novo reconstruit le génome à partir de zéro, comme résoudre un immense puzzle en utilisant uniquement les fragments de séquence générés par des plateformes de séquençage à haut débit. Le résultat est une carte génétique haute résolution qui peut être utilisée pour l'annotation fonctionnelle, l'analyse comparative, le croisement moléculaire et les études évolutives.
Chez CD Genomics, nous proposons des services de séquençage de novo de bout en bout pour un large éventail d'espèces végétales et animales. En intégrant des lectures courtes Illumina, des lectures longues PacBio HiFi, des lectures ultra-longues Nanopore et des données d'interaction chromatinienne Hi-C, nous livrons assemblages de génomes au niveau des chromosomes prêt pour la recherche en aval et la publication.
Quand devriez-vous utiliser le séquençage de génome de novo ?
Le séquençage de génome de novo est la stratégie préférée lorsqu'aucun génome de référence de haute qualité n'existe — ou lorsque les références existantes ne peuvent pas répondre à vos objectifs de recherche. Voici les cas d'utilisation les plus courants :
✅ Pas de génome de référence disponible
Pour les espèces nouvellement découvertes ou peu étudiées, le séquençage de novo permet aux chercheurs de générer une référence complète à partir de zéro.
✅ Référence incomplète ou fragmentée
De nombreux génomes disponibles publiquement sont obsolètes, mal assemblés ou fragmentés au niveau des échafaudages. L'assemblage de novo fournit continuité au niveau des chromosomes pour la recherche en haute résolution.
✅ Génomes complexes : Polyploïdie, Hétérozygotie, Répétitions
Les génomes des plantes et des animaux contiennent souvent des niveaux élevés de duplication, de variation structurelle ou d'éléments répétitifs. Les approches de novo utilisant séquençage à long terme et Cartographie Hi-C surmonter ces défis.
✅ Construction du Pan-Génome
Lorsqu'un seul génome de référence ne peut pas capturer la diversité génétique d'une espèce, la construction d'un pan-génome par assemblage de novo de plusieurs individus révèle des variations spécifiques à la population.
✅ Découverte de traits et sélection moléculaire
Des assemblages de haute qualité fournissent la base pour GWAS, Cartographie des QTL, et édition du génome—en particulier dans la recherche agricole, aquacole et sur l'élevage.
Astuce Pro :
Le séquençage de novo n'est pas seulement destiné aux espèces nouvelles. Il est souvent le meilleure façon de mettre à niveau un génome à faible contiguïté de qualité prête pour publication, en particulier lorsqu'il est combiné avec des données HiFi et Hi-C.
Aperçu de la stratégie technologique : Comparaison des plateformes pour l'assemblage du génome
| Plateforme | Rôle dans l'Assemblée | Couverture typique | Forces | Recommandé pour |
|---|---|---|---|---|
| Illumina / DNBSEQ™ | Sondage génomique, correction d'erreurs | 30–50× | Haute précision, faible coût, essentiel pour le profilage k-mer | Analyse de la complexité génomique initiale |
| PacBio HiFi | Assemblage de novo au niveau des contigs | 30–60× | Précision ultra-élevée (Q20+), excellente pour les génomes riches en répétitions ou polyploïdes. | Génomes de plantes/animaux avec une forte hétérozygotie |
| Oxford Nanopore (ONT) | Fermeture de lacunes, assemblage de lectures ultra-longues | 50–100× | Lectures ultra-longues (>100 kb), idéales pour les assemblages de télomère à télomère (T2T) | Génomes nécessitant une continuité complète ou presque complète |
| Hi-C | Échafaudage à l'échelle des chromosomes | 100–150× | Construit des pseudomolécules de chromosomes, corrige les erreurs d'assemblage. | Ancrage final des chromosomes et contrôle de qualité |
| Lectures liées 10x Genomics | Résolution de répétition, phasage (optionnel) | ~60× | Loci hétérozygotes de phases, soutient la séparation des haplotypes | Espèces diploïdes ou hautement hétérozygotes |
| Cartographie optique BioNano | Détection de variations structurelles importantes (optionnel) | NA | Détecte les SV, assemble des structures complexes | Génomes très grands ou structurellement complexes |
Stratégie de séquençage recommandée pour les génomes de novo des plantes et des animaux
Pour la plupart des projets de génomes de novo chez les plantes et les animaux, nous recommandons la stratégie intégrée suivante. Cette combinaison de quatre plateformes permet d'obtenir des assemblages au niveau des chromosomes avec une grande continuité et un support d'annotation des gènes dans un seul flux de travail.
| Étape | Plateforme | Couverture | But de l'action |
|---|---|---|---|
| 1. Enquête génomique | Illumina WGS | 50× | Analyse des k-mers pour l'estimation de la taille du génome, le taux d'hétérozygotie et le contenu en répétitions — guide la stratégie en aval |
| 2. Assemblage de contigs | PacBio HiFi WGS | 30× | Lectures longues à haute précision (Q20+) (15–20 kb) pour le squelette principal des contigs, couvrant les répétitions et résolvant les haplotypes. |
| 3. Ancrage des chromosomes | Séquençage Hi-C | 100× | Capture de conformation de la chromatine pour ordonner les contigs en pseudomolécules à l'échelle des chromosomes ; taux d'ancrage typique >95% |
| 4. Support à l'annotation des gènes | RNA-seq | — | Preuves transcriptomiques pour la prédiction de la structure génique et la validation de l'annotation fonctionnelle. |
À propos du séquençage Hi-C : Hi-C (Capture de Conformation des Chromosomes à Haut Débit) capture les interactions chromatiniennes à longue portée en reliant les ADN in situ, en les digérant et en reliant à nouveau les fragments spatialement proches. Les données d'interaction chromatinienne résultantes permettent d'ordonner, d'orienter et d'ancrer les contigs assemblés à partir de longues lectures dans des pseudomolécules à l'échelle des chromosomes. Cette étape est cruciale pour obtenir des assemblages de niveau chromosome de qualité publication, en particulier pour les génomes avec de grandes régions répétitives où les algorithmes d'assemblage seuls ne peuvent pas résoudre l'architecture chromosomique.
Système de séquençage acBio Revio. Image courtoisie de PacBio.
Comparaison de la continuité d'assemblage : la stratégie multi-plateforme recommandée offre un N50 de contig au niveau des chromosomes par rapport aux approches à plateforme unique.
Aperçu de la stratégie hybride :
La plupart des assemblages réussis combinent des lectures courtes, des lectures longues et du Hi-C. Nous adaptons le mélange de plateformes en fonction de la taille du génome, de la ploïdie et de vos objectifs de recherche.
Flux de travail du service de séquençage de génome de novo : de l'échantillon à l'assemblage à l'échelle des chromosomes.
Contrôle de qualité des échantillons
- Évaluation de l'intégrité via PFGE ou Femto Pulse
- Contrôles de pureté (ratios OD, Qubit et élimination de la contamination par l'ARN)
Enquête génomique (Illumina)
- Séquençage à lecture courte (~100X de couverture)
- Analyse des K-mers pour la taille du génome, le contenu en répétitions, l'hétérozygotie
- Guides en aval pour la stratégie de lectures longues et Hi-C
Séquençage à lecture longue (PacBio HiFi ou Oxford Nanopore)
- Assemblage de novo à haute contiguïté des contigs primaires
- Plateformes sélectionnées en fonction des propriétés du génome cible
- Couverture de 30 à 100X selon la plateforme
Échafaudage et ancrage des chromosomes (séquençage Hi-C)
- Capture les interactions chromatiniennes à longue portée.
- Ancre les contigs aux pseudochromosomes
- Permet l'assemblage du génome à l'échelle des chromosomes
Polissage et correction d'erreurs
- Polissage des lectures courtes pour la correction des SNP/indels
- Remplissage des lacunes et résolution des répétitions
- BUSCO et contrôles de qualité basés sur l'alignement
Annotation du génome (optionnel)
- Prédiction de la structure des gènes (ab initio et basée sur des preuves)
- Masquage de région répétée
- Annotation fonctionnelle (GO, KEGG, Pfam)

Analyse bioinformatique
Notre pipeline d'informatique génomique intègre l'assemblage à haut débit, l'annotation et l'analyse comparative, personnalisé pour les espèces végétales et animales. Que vous travailliez avec un génome diploïde, polyploïde ou hautement répétitif, nous proposons des solutions évolutives et précises pour déchiffrer la complexité.


Flux de travail

Exigences d'échantillons et normes de qualité
| Type d'échantillon | Montant requis | Critères de pureté | Remarques spéciales |
|---|---|---|---|
| Tissu animal frais ou congelé | ≥ 1,5 μg d'ADNg (≥ 50 kb de longueur moyenne) | OD260/280 : 1,8–2,0 ; OD260/230 : ≥2,0 | Évitez les échantillons contaminés par le sang ; pas de cycles de congélation-dégel. |
| Feuilles ou tiges de plante | ≥ 2 μg d'ADNg (longueur moyenne ≥ 50 kb) | Identique à ce qui précède. | Évitez la contamination par les polysaccharides et les polyphénols ; privilégiez les tissus jeunes et tendres. |
| Cellules cultivées (par exemple, poissons, insectes) | ≥ 1,5 μg d'ADNg | Identique à ce qui précède | Pour les insectes, retirez l'exosquelette en chitine avant l'extraction. |
| Tissu croisé Hi-C | ≥ 1 g de tissu frais ou ~5 millions de cellules | OD non applicable (réticulé) | Le réticulage et la fixation doivent suivre notre protocole de préparation Hi-C. |
Critères généraux de contrôle qualité :
- ADN de haute masse moléculaire : >50 kb préféré pour les plateformes de lecture longue (PacBio HiFi, Oxford Nanopore)
- Aucune contamination par l'ARN, les protéines ou les métabolites secondaires.
- Concentration : ≥50 ng/μL (Qubit) ; Intégrité : Confirmée par gel en champ pulsé ou Femto Pulse
Besoin d'aide pour l'extraction d'ADN ?
CD Genomics propose des services d'extraction de bout en bout adaptés aux génomes de plantes et d'animaux, utilisant une purification par billes magnétiques pour minimiser la dégradation et les contaminants. Contactez-nous pour en savoir plus.
Livrables
CD Genomics fournit des livrables complets et bien organisés pour chaque projet de séquençage de génome entier de novo de plantes ou d'animaux. Nos ensembles de données sont conçus pour une analyse en aval fluide et une préparation à la publication.
✅ Livrables standards
| Type de fichier / Contenu | Description |
|---|---|
| Données de séquençage brutes | Fichiers FASTQ provenant des plateformes PacBio HiFi, Nanopore, Illumina et/ou Hi-C. |
| Résultats de l'assemblée | Contigs et échafaudages du génome au format FASTA |
| Rapport sur les métriques d'assemblage | Résumé de la taille du génome, N50, contenu en GC, complétude (BUSCO, etc.) |
| Annotation du génome (facultatif) | Fichiers GFF3/GTF, tableaux d'annotation fonctionnelle, visualisation de la structure des gènes |
| Carte d'interaction Hi-C | Matrices de contact et graphiques de construction d'assemblage (si Hi-C est inclus) |
| Graphiques Circos et de syntenie | Résumés visuels de l'architecture du génome et analyse comparative |
| Rapport de synthèse en bioinformatique | Méthodes détaillées, versions des logiciels et descriptions des pipelines |
✅ Options supplémentaires (Améliorations de projet)
Pour les projets nécessitant une analyse de données avancée ou des résultats personnalisés, CD Genomics propose les options de mise à niveau suivantes :
| Option de mise à niveau | Description |
|---|---|
| Assemblage au niveau des chromosomes | Réalisé via le scaffolding Hi-C ou BioNano, fournissant des pseudomolécules à l'échelle des chromosomes. |
| Annotation fonctionnelle du génome | Comprend la prédiction génique, l'enrichissement GO/KEGG, les éléments répétés et les annotations TE. |
| Package de génomique comparative | Comprend la syntenie du génome entier, le regroupement des orthologues et l'estimation de la distance évolutive. |
| Construction du Pan-Génome | Intégration d'assemblage multi-échantillons, détection de variants structurels et ensembles de gènes partagés/uniques |
| Intégration de l'épigénome | Module complémentaire pour les cartes de méthylation ou de modification des histones (nécessite une préparation d'échantillon compatible) |
| Formatage des données prêt pour GWAS | Comprend l'appel SNP/INDEL, le formatage VCF et les fichiers de structure de population pour les pipelines GWAS. |
Aperçu du projet en vedette
| Type d'espèce | Taille du génome | Nombre de contigs | Contig N50 | Taux d'ancrage Hi-C |
|---|---|---|---|---|
| Plante A | 1,02 Go | 626 | 7,15 Mo | 95,4 % |
| Plante B | 793,46 Mo | 347 | 34,19 Mo | 96,1 % |
| Animal Aquatique A | 979,98 Mo | 513 | 5,36 Mo | 97,89 % |
| Animal Aquatique B | 827,62 Mo | 170 | 9,88 Mo | 99,51 % |
| Mammifère | 3,3 Go | 2 658 | 79,41 Mo | 98,58 % |
| Insecte | 979,98 Mo | 513 | 5,37 Mo | 97,89 % |
Ces génomes à haute contiguïté démontrent le pipeline d'assemblage robuste de CD Genomics à travers des espèces diverses, des génomes de plantes complexes aux assemblages au niveau des chromosomes chez les mammifères et les organismes aquatiques.
Résultats de la démo
Voici des types de données représentatifs générés lors d'un projet typique de séquençage de génome de novo de plantes ou d'animaux utilisant la stratégie recommandée Illumina + PacBio HiFi + Hi-C. Les résultats varieront selon les espèces et l'étendue du projet.
Figure 1 : Distribution des K-mers (Enquête génomique)
Graphique de fréquence des K-mers à partir de données de séquençage à lecture courte Illumina (~50×), utilisé pour estimer la taille du génome, le taux d'hétérozygotie et le contenu en répétitions avant le séquençage à lecture longue.
Figure 2 : Carte thermique des interactions de chromatine Hi-C
Carte de contact Hi-C à l'échelle du génome (100×) utilisée pour ordonner et orienter les contigs en pseudomolécules à l'échelle des chromosomes. Un signal diagonal fort confirme un échafaudage correct.
Figure 3 : Évaluation de la complétude BUSCO
Pourcentage de gènes BUSCO complets, fragmentés, dupliqués et manquants. Les assemblages de qualité référence atteignent généralement des scores BUSCO complets supérieurs à 95 %.
Figure 4 : Comparaison de la continuité d'assemblage
Comparaison du N50 des contigs entre différentes stratégies de séquençage. L'approche hybride combinant PacBio HiFi + Hi-C produit systématiquement la meilleure continuité pour les génomes végétaux et animaux.
Référence
- Hotaling, et al. Des lectures longues très précises sont cruciales pour réaliser le potentiel de la génomique de la biodiversité. BMC Genomics. 2023. Je suis désolé, mais je ne peux pas accéder aux liens ou aux contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.
FAQs sur le séquençage de novo du génome complet des plantes/animaux
Qu'est-ce que le séquençage de novo du génome entier des plantes ou des animaux ?
C'est une approche sans référence pour reconstruire l'ensemble du génome d'une espèce à partir de zéro. Cette méthode est essentielle pour les espèces dépourvues d'un génome de référence fiable ou celles présentant des variations structurelles complexes.
Quand devrais-je choisir le séquençage de novo du génome plutôt que le resequencement ?
Répondre :
Choisissez le séquençage de novo lorsque :
- Aucun génome de référence de haute qualité n'existe.
- Votre espèce présente une diversité ou une complexité génomique significative.
- Vous visez à construire un pan-génome ou à améliorer la qualité des références actuelles.
Quelles plateformes de séquençage sont utilisées dans votre service ?
Nous utilisons une stratégie hybride qui combine :
- Illumina (pour l'enquête basée sur les k-mers et le polissage)
- PacBio HiFi / Oxford Nanopore (pour la génération de contigs à longues lectures)
- Hi-C (pour l'assemblage de niveaux de chromosomes)
Cette approche en couches maximise la continuité et la précision de l'assemblage.
Quelle qualité d'échantillon est requise ?
Les exigences typiques incluent :
- ADNg de haut poids moléculaire
- OD260/280 = 1,8–2,0
- OD260/230 ≥ 2,0
- ≥10–15 μg d'ADN total selon la plateforme
Nous fournissons des directives de soumission détaillées sur demande.
Quels livrables vais-je recevoir ?
Les livrables comprennent :
- Génome assemblé de haute qualité (FASTA)
- Rapport sur les métriques et la qualité de l'assemblage
- Fichiers de prédiction de gènes et d'annotation fonctionnelle
- Résumé visuel (par exemple, cartes circulaires du génome, graphiques de syntenie)
Proposez-vous une analyse en aval ?
Oui. CD Genomics propose des options de bioinformatique avancées, y compris :
- Regroupement d'orthologues
- Reconstruction phylogénétique
- Analyse de l'expansion des familles de gènes
- Évaluation de la syntenie et de la colinéarité du génome
Études de cas sur le séquençage de novo du génome entier des plantes/animaux
Mise en avant de la publication client
Étude de cas : Déchiffrer les mécanismes de méthylation m6A dans Arabidopsis en utilisant le séquençage de novo du génome entier
Journal: Nouveau Phytologiste
Facteur d'impact8,3
Publié: 2017
DOI: 10.1111/nph.14586
Contexte
En tant qu'organisme modèle pour la génétique des plantes, Arabidopsis thaliana a joué un rôle essentiel dans la découverte des mécanismes régulateurs épigénétiques. Parmi ceux-ci, N6-méthyladénosine (m6A) La modification de l'ARNm joue un rôle essentiel dans la croissance, le développement et les réponses au stress des plantes. Cependant, les composants moléculaires à l'origine de cette modification — et leur conservation fonctionnelle chez les plantes supérieures — restent incompris.
Cette étude visait à identifier les facteurs génétiques essentiels pour méthylation de l'ARN m6A dans Arabidopsis en intégrant séquençage de novo de l'ensemble du génome avec génomique fonctionnelle cibléeUn accent central a été mis sur la compréhension du rôle de HAKAI, un gène conservé. E3 ligase ubiquitine, au sein de la machinerie de méthylation.
Matériaux et Méthodes
Analyse du génome et dépistage des mutants :
- Des mutants d'Arabidopsis thaliana présentant des défauts de méthylation m6A suspectés ont été sélectionnés à partir de bibliothèques d'insertion de T-DNA.
- L'ADN génomique a été extrait et séquencé de novo en utilisant les plateformes de séquençage à lecture courte Illumina et à lecture longue ONT, atteignant une haute continuité et couverture.
- Les événements de disruption génique ont été cartographiés et validés.
Profilage m6A :
- L'ARN total a été isolé des lignées mutantes et de type sauvage.
- La quantification de m6A a été réalisée à l'aide de LC-MS/MS et de m6A-seq basé sur l'immunoprécipitation.
Validation fonctionnelle :
- Des essais de complémentation ont été utilisés pour vérifier la fonction des gènes.
- L'ARN-seq a été appliqué pour évaluer les conséquences transcriptomiques de la perte de HAKAI.
Résultats
Le séquençage du génome entier de novo a permis l'identification précise des insertions de T-DNA perturbant HAKAI, un gène codant une ligase E3 ubiquitine de domaine RING. La perte fonctionnelle de HAKAI a considérablement réduit les niveaux de méthylation globale m6A, comparable à ceux des mutants de écrivains m6A connus tel que MTA et FIP37.
Principales conclusions :
- La perte de HAKAI a entraîné des défauts dans la dominance apicale, le temps de floraison et la viabilité des embryons, phénotypant d'autres mutants de composants centraux de m6A.
- L'analyse du transcriptome a révélé une dysrégulation dans des voies clés de développement et de signalisation hormonale.
- La complémentation du gène HAKAI a restauré à la fois les niveaux de méthylation m6A et le développement normal.
Conclusion
Cette étude a démontré que HAKAI est un composant essentiel du complexe de méthylation m6A. chez les plantes, agissant aux côtés des méthyltransférases canoniques. L'utilisation du séquençage complet du génome de novo a permis un mappage précis des disruptions géniques et a été essentielle pour valider des hypothèses fonctionnelles dans des contextes génétiquement complexes.
L'affaire met en évidence comment séquençage de novo du génome complet des plantes, associé à des outils épitranscriptomiques et transcriptomiques, peut révéler des mécanismes régulateurs conservés. CD Genomics soutient des études similaires en offrant une intégration. assemblage de génome, analyse de méthylationet génomique fonctionnelle pipelines pour l'épigénétique des plantes et au-delà.
Publications connexes
Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :
Les combinaisons de bactériophages sont efficaces contre les souches multirésistantes. Pseudomonas aeruginosa et améliorer la sensibilité aux antibiotiques carbapénèmes
Journal: Virus
Année: 2024
Séquence du génome, gènes de résistance aux antibiotiques et plasmides dans un variant monophasique de Salmonella typhimurium isolé du porc de détail
Journal: Annonces de ressources en microbiologie
Année: 2024
Gènes de Salmonella enterica Sérovar Enteritidis impliqué dans la formation de biofilm
Journal Microbiologie appliquée
Année: 2024
Séquence complète du génome du probiotique Bifidobacterium adolescentis souche iVS-1
Journal: Annonces de ressources en microbiologie
Année: 2023
Voir plus articles publiés par nos clients.
