Assemblage de génome haute résolution pour les plantes et les animaux — Sans référence requise

CD Genomics propose des solutions complètes. Séquençage de novo du génome complet des plantes et des animaux services pour décoder des génomes complexes sans s'appuyer sur des références existantes. Notre plateforme combine Illumina, PacBio HiFi, Oxford Nanopore, et Technologies Hi-C pour fournir des assemblages au niveau des chromosomes avec une continuité et une précision exceptionnelles. Que vous étudiiez des cultures polyploïdes, des espèces sauvages ou des organismes modèles, notre équipe propose des stratégies personnalisées, une analyse experte et des données prêtes pour publication.

Directives de soumission d'échantillons

Four-step genome assembly workflow for plant and animal whole genome de novo sequencing with Illumina, PacBio, Nanopore,

  • Séquençage génomique de novo de bout en bout pour les espèces végétales et animales
  • Intégration de la plateforme HiFi/Nanopore + Hi-C pour un assemblage à haute continuité
  • De l'extraction d'ADN à l'assemblage du génome au niveau des chromosomes
  • Stratégies personnalisées pour les génomes complexes, répétitifs et polyploïdes
  • Soutien expert pour l'assemblage du génome, l'annotation et les études d'évolution.
Table des matières

    Qu'est-ce que le séquençage de novo de l'ensemble du génome des plantes et des animaux ?

    Séquençage de novo de génomes entiers de plantes et d'animaux fait référence à l'assemblage d'un génome complet sans s'appuyer sur une séquence de référence existante. Cette approche est essentielle lorsqu'on travaille avec des espèces qui n'ont pas de génome de référence, qui ont des génomes mal assemblés ou qui présentent des caractéristiques génomiques complexes telles qu'une forte hétérozygotie, la polyploïdie ou des régions répétitives étendues.

    Au lieu d'aligner les lectures de séquençage à un génome connu, l'assemblage de novo reconstruit le génome à partir de zéro, comme résoudre un immense puzzle en utilisant uniquement les fragments de séquence générés par des plateformes de séquençage à haut débit. Le résultat est une carte génétique haute résolution qui peut être utilisée pour l'annotation fonctionnelle, l'analyse comparative, le croisement moléculaire et les études évolutives.

    Chez CD Genomics, nous proposons des services de séquençage de novo de bout en bout pour un large éventail d'espèces végétales et animales. En intégrant des lectures courtes Illumina, des lectures longues PacBio HiFi, des lectures ultra-longues Nanopore et des données d'interaction chromatinienne Hi-C, nous livrons assemblages de génomes au niveau des chromosomes prêt pour la recherche en aval et la publication.

    Quand devriez-vous utiliser le séquençage de génome de novo ?

    Le séquençage de génome de novo est la stratégie préférée lorsqu'aucun génome de référence de haute qualité n'existe — ou lorsque les références existantes ne peuvent pas répondre à vos objectifs de recherche. Voici les cas d'utilisation les plus courants :

    ✅ Pas de génome de référence disponible

    Pour les espèces nouvellement découvertes ou peu étudiées, le séquençage de novo permet aux chercheurs de générer une référence complète à partir de zéro.

    ✅ Référence incomplète ou fragmentée

    De nombreux génomes disponibles publiquement sont obsolètes, mal assemblés ou fragmentés au niveau des échafaudages. L'assemblage de novo fournit continuité au niveau des chromosomes pour la recherche en haute résolution.

    ✅ Génomes complexes : Polyploïdie, Hétérozygotie, Répétitions

    Les génomes des plantes et des animaux contiennent souvent des niveaux élevés de duplication, de variation structurelle ou d'éléments répétitifs. Les approches de novo utilisant séquençage à long terme et Cartographie Hi-C surmonter ces défis.

    ✅ Construction du Pan-Génome

    Lorsqu'un seul génome de référence ne peut pas capturer la diversité génétique d'une espèce, la construction d'un pan-génome par assemblage de novo de plusieurs individus révèle des variations spécifiques à la population.

    ✅ Découverte de traits et sélection moléculaire

    Des assemblages de haute qualité fournissent la base pour GWAS, Cartographie des QTL, et édition du génome—en particulier dans la recherche agricole, aquacole et sur l'élevage.

    Astuce Pro :

    Le séquençage de novo n'est pas seulement destiné aux espèces nouvelles. Il est souvent le meilleure façon de mettre à niveau un génome à faible contiguïté de qualité prête pour publication, en particulier lorsqu'il est combiné avec des données HiFi et Hi-C.

    Aperçu de la stratégie technologique : Comparaison des plateformes pour l'assemblage du génome

    Plateforme Rôle dans l'Assemblée Couverture typique Forces Recommandé pour
    Illumina / DNBSEQ™ Sondage génomique, correction d'erreurs 30–50× Haute précision, faible coût, essentiel pour le profilage k-mer Analyse de la complexité génomique initiale
    PacBio HiFi Assemblage de novo au niveau des contigs 30–60× Précision ultra-élevée (Q20+), excellente pour les génomes riches en répétitions ou polyploïdes. Génomes de plantes/animaux avec une forte hétérozygotie
    Oxford Nanopore (ONT) Fermeture de lacunes, assemblage de lectures ultra-longues 50–100× Lectures ultra-longues (>100 kb), idéales pour les assemblages de télomère à télomère (T2T) Génomes nécessitant une continuité complète ou presque complète
    Hi-C Échafaudage à l'échelle des chromosomes 100–150× Construit des pseudomolécules de chromosomes, corrige les erreurs d'assemblage. Ancrage final des chromosomes et contrôle de qualité
    Lectures liées 10x Genomics Résolution de répétition, phasage (optionnel) ~60× Loci hétérozygotes de phases, soutient la séparation des haplotypes Espèces diploïdes ou hautement hétérozygotes
    Cartographie optique BioNano Détection de variations structurelles importantes (optionnel) NA Détecte les SV, assemble des structures complexes Génomes très grands ou structurellement complexes

    Pour la plupart des projets de génomes de novo chez les plantes et les animaux, nous recommandons la stratégie intégrée suivante. Cette combinaison de quatre plateformes permet d'obtenir des assemblages au niveau des chromosomes avec une grande continuité et un support d'annotation des gènes dans un seul flux de travail.

    Étape Plateforme Couverture But de l'action
    1. Enquête génomique Illumina WGS 50× Analyse des k-mers pour l'estimation de la taille du génome, le taux d'hétérozygotie et le contenu en répétitions — guide la stratégie en aval
    2. Assemblage de contigs PacBio HiFi WGS 30× Lectures longues à haute précision (Q20+) (15–20 kb) pour le squelette principal des contigs, couvrant les répétitions et résolvant les haplotypes.
    3. Ancrage des chromosomes Séquençage Hi-C 100× Capture de conformation de la chromatine pour ordonner les contigs en pseudomolécules à l'échelle des chromosomes ; taux d'ancrage typique >95%
    4. Support à l'annotation des gènes RNA-seq Preuves transcriptomiques pour la prédiction de la structure génique et la validation de l'annotation fonctionnelle.

    À propos du séquençage Hi-C : Hi-C (Capture de Conformation des Chromosomes à Haut Débit) capture les interactions chromatiniennes à longue portée en reliant les ADN in situ, en les digérant et en reliant à nouveau les fragments spatialement proches. Les données d'interaction chromatinienne résultantes permettent d'ordonner, d'orienter et d'ancrer les contigs assemblés à partir de longues lectures dans des pseudomolécules à l'échelle des chromosomes. Cette étape est cruciale pour obtenir des assemblages de niveau chromosome de qualité publication, en particulier pour les génomes avec de grandes régions répétitives où les algorithmes d'assemblage seuls ne peuvent pas résoudre l'architecture chromosomique.

    PacBio Revio sequencing system — official product imageSystème de séquençage acBio Revio. Image courtoisie de PacBio.

    Assembly contiguity comparison demonstrating the effectiveness of the recommended Illumina + PacBio HiFi + Hi-C + RNA-seq strategyComparaison de la continuité d'assemblage : la stratégie multi-plateforme recommandée offre un N50 de contig au niveau des chromosomes par rapport aux approches à plateforme unique.

    Genome assembly workflow from Illumina to PacBio/ONT to Hi-C to chromosome-level sequencingAperçu de la stratégie hybride :

    La plupart des assemblages réussis combinent des lectures courtes, des lectures longues et du Hi-C. Nous adaptons le mélange de plateformes en fonction de la taille du génome, de la ploïdie et de vos objectifs de recherche.

    Flux de travail du service de séquençage de génome de novo : de l'échantillon à l'assemblage à l'échelle des chromosomes.

    Contrôle de qualité des échantillons

    • Évaluation de l'intégrité via PFGE ou Femto Pulse
    • Contrôles de pureté (ratios OD, Qubit et élimination de la contamination par l'ARN)

    Enquête génomique (Illumina)

    • Séquençage à lecture courte (~100X de couverture)
    • Analyse des K-mers pour la taille du génome, le contenu en répétitions, l'hétérozygotie
    • Guides en aval pour la stratégie de lectures longues et Hi-C

    Séquençage à lecture longue (PacBio HiFi ou Oxford Nanopore)

    • Assemblage de novo à haute contiguïté des contigs primaires
    • Plateformes sélectionnées en fonction des propriétés du génome cible
    • Couverture de 30 à 100X selon la plateforme

    Échafaudage et ancrage des chromosomes (séquençage Hi-C)

    • Capture les interactions chromatiniennes à longue portée.
    • Ancre les contigs aux pseudochromosomes
    • Permet l'assemblage du génome à l'échelle des chromosomes

    Polissage et correction d'erreurs

    • Polissage des lectures courtes pour la correction des SNP/indels
    • Remplissage des lacunes et résolution des répétitions
    • BUSCO et contrôles de qualité basés sur l'alignement

    Annotation du génome (optionnel)

    • Prédiction de la structure des gènes (ab initio et basée sur des preuves)
    • Masquage de région répétée
    • Annotation fonctionnelle (GO, KEGG, Pfam)

    plant/animal genome sequencing workflow from sample QC to data delivery, on a white background.

    Analyse bioinformatique

    Notre pipeline d'informatique génomique intègre l'assemblage à haut débit, l'annotation et l'analyse comparative, personnalisé pour les espèces végétales et animales. Que vous travailliez avec un génome diploïde, polyploïde ou hautement répétitif, nous proposons des solutions évolutives et précises pour déchiffrer la complexité.

    Genome assembly and annotation pipeline from long-read sequencing to functional databases.

    comparative, pangenome, and population analysis options in genome informatics.

    Flux de travail

    FIntegrated workflow for tumor organoid sequencing and analysis

    Exigences d'échantillons et normes de qualité

    Type d'échantillon Montant requis Critères de pureté Remarques spéciales
    Tissu animal frais ou congelé ≥ 1,5 μg d'ADNg (≥ 50 kb de longueur moyenne) OD260/280 : 1,8–2,0 ; OD260/230 : ≥2,0 Évitez les échantillons contaminés par le sang ; pas de cycles de congélation-dégel.
    Feuilles ou tiges de plante ≥ 2 μg d'ADNg (longueur moyenne ≥ 50 kb) Identique à ce qui précède. Évitez la contamination par les polysaccharides et les polyphénols ; privilégiez les tissus jeunes et tendres.
    Cellules cultivées (par exemple, poissons, insectes) ≥ 1,5 μg d'ADNg Identique à ce qui précède Pour les insectes, retirez l'exosquelette en chitine avant l'extraction.
    Tissu croisé Hi-C ≥ 1 g de tissu frais ou ~5 millions de cellules OD non applicable (réticulé) Le réticulage et la fixation doivent suivre notre protocole de préparation Hi-C.

    Critères généraux de contrôle qualité :

    • ADN de haute masse moléculaire : >50 kb préféré pour les plateformes de lecture longue (PacBio HiFi, Oxford Nanopore)
    • Aucune contamination par l'ARN, les protéines ou les métabolites secondaires.
    • Concentration : ≥50 ng/μL (Qubit) ; Intégrité : Confirmée par gel en champ pulsé ou Femto Pulse

    Besoin d'aide pour l'extraction d'ADN ?

    CD Genomics propose des services d'extraction de bout en bout adaptés aux génomes de plantes et d'animaux, utilisant une purification par billes magnétiques pour minimiser la dégradation et les contaminants. Contactez-nous pour en savoir plus.

    Livrables

    CD Genomics fournit des livrables complets et bien organisés pour chaque projet de séquençage de génome entier de novo de plantes ou d'animaux. Nos ensembles de données sont conçus pour une analyse en aval fluide et une préparation à la publication.

    ✅ Livrables standards

    Type de fichier / Contenu Description
    Données de séquençage brutes Fichiers FASTQ provenant des plateformes PacBio HiFi, Nanopore, Illumina et/ou Hi-C.
    Résultats de l'assemblée Contigs et échafaudages du génome au format FASTA
    Rapport sur les métriques d'assemblage Résumé de la taille du génome, N50, contenu en GC, complétude (BUSCO, etc.)
    Annotation du génome (facultatif) Fichiers GFF3/GTF, tableaux d'annotation fonctionnelle, visualisation de la structure des gènes
    Carte d'interaction Hi-C Matrices de contact et graphiques de construction d'assemblage (si Hi-C est inclus)
    Graphiques Circos et de syntenie Résumés visuels de l'architecture du génome et analyse comparative
    Rapport de synthèse en bioinformatique Méthodes détaillées, versions des logiciels et descriptions des pipelines

    Options supplémentaires (Améliorations de projet)

    Pour les projets nécessitant une analyse de données avancée ou des résultats personnalisés, CD Genomics propose les options de mise à niveau suivantes :

    Option de mise à niveau Description
    Assemblage au niveau des chromosomes Réalisé via le scaffolding Hi-C ou BioNano, fournissant des pseudomolécules à l'échelle des chromosomes.
    Annotation fonctionnelle du génome Comprend la prédiction génique, l'enrichissement GO/KEGG, les éléments répétés et les annotations TE.
    Package de génomique comparative Comprend la syntenie du génome entier, le regroupement des orthologues et l'estimation de la distance évolutive.
    Construction du Pan-Génome Intégration d'assemblage multi-échantillons, détection de variants structurels et ensembles de gènes partagés/uniques
    Intégration de l'épigénome Module complémentaire pour les cartes de méthylation ou de modification des histones (nécessite une préparation d'échantillon compatible)
    Formatage des données prêt pour GWAS Comprend l'appel SNP/INDEL, le formatage VCF et les fichiers de structure de population pour les pipelines GWAS.
    Type d'espèce Taille du génome Nombre de contigs Contig N50 Taux d'ancrage Hi-C
    Plante A 1,02 Go 626 7,15 Mo 95,4 %
    Plante B 793,46 Mo 347 34,19 Mo 96,1 %
    Animal Aquatique A 979,98 Mo 513 5,36 Mo 97,89 %
    Animal Aquatique B 827,62 Mo 170 9,88 Mo 99,51 %
    Mammifère 3,3 Go 2 658 79,41 Mo 98,58 %
    Insecte 979,98 Mo 513 5,37 Mo 97,89 %

    Ces génomes à haute contiguïté démontrent le pipeline d'assemblage robuste de CD Genomics à travers des espèces diverses, des génomes de plantes complexes aux assemblages au niveau des chromosomes chez les mammifères et les organismes aquatiques.

    Résultats de la démo

    Voici des types de données représentatifs générés lors d'un projet typique de séquençage de génome de novo de plantes ou d'animaux utilisant la stratégie recommandée Illumina + PacBio HiFi + Hi-C. Les résultats varieront selon les espèces et l'étendue du projet.

    K-mer distribution plot for genome size and heterozygosity estimation

    Figure 1 : Distribution des K-mers (Enquête génomique)
    Graphique de fréquence des K-mers à partir de données de séquençage à lecture courte Illumina (~50×), utilisé pour estimer la taille du génome, le taux d'hétérozygotie et le contenu en répétitions avant le séquençage à lecture longue.

    Hi-C chromatin interaction heatmap for chromosome scaffolding validation

    Figure 2 : Carte thermique des interactions de chromatine Hi-C
    Carte de contact Hi-C à l'échelle du génome (100×) utilisée pour ordonner et orienter les contigs en pseudomolécules à l'échelle des chromosomes. Un signal diagonal fort confirme un échafaudage correct.

    BUSCO completeness assessment bar chart

    Figure 3 : Évaluation de la complétude BUSCO
    Pourcentage de gènes BUSCO complets, fragmentés, dupliqués et manquants. Les assemblages de qualité référence atteignent généralement des scores BUSCO complets supérieurs à 95 %.

    Assembly contiguity comparison across sequencing strategies

    Figure 4 : Comparaison de la continuité d'assemblage
    Comparaison du N50 des contigs entre différentes stratégies de séquençage. L'approche hybride combinant PacBio HiFi + Hi-C produit systématiquement la meilleure continuité pour les génomes végétaux et animaux.

    Référence

    1. Hotaling, et al. Des lectures longues très précises sont cruciales pour réaliser le potentiel de la génomique de la biodiversité. BMC Genomics. 2023. Je suis désolé, mais je ne peux pas accéder aux liens ou aux contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

    FAQs sur le séquençage de novo du génome complet des plantes/animaux

    Qu'est-ce que le séquençage de novo du génome entier des plantes ou des animaux ?

    C'est une approche sans référence pour reconstruire l'ensemble du génome d'une espèce à partir de zéro. Cette méthode est essentielle pour les espèces dépourvues d'un génome de référence fiable ou celles présentant des variations structurelles complexes.

    Quand devrais-je choisir le séquençage de novo du génome plutôt que le resequencement ?

    Répondre :

    Choisissez le séquençage de novo lorsque :

    • Aucun génome de référence de haute qualité n'existe.
    • Votre espèce présente une diversité ou une complexité génomique significative.
    • Vous visez à construire un pan-génome ou à améliorer la qualité des références actuelles.

    Quelles plateformes de séquençage sont utilisées dans votre service ?

    Nous utilisons une stratégie hybride qui combine :

    • Illumina (pour l'enquête basée sur les k-mers et le polissage)
    • PacBio HiFi / Oxford Nanopore (pour la génération de contigs à longues lectures)
    • Hi-C (pour l'assemblage de niveaux de chromosomes)

    Cette approche en couches maximise la continuité et la précision de l'assemblage.

    Quelle qualité d'échantillon est requise ?

    Les exigences typiques incluent :

    • ADNg de haut poids moléculaire
    • OD260/280 = 1,8–2,0
    • OD260/230 ≥ 2,0
    • ≥10–15 μg d'ADN total selon la plateforme

    Nous fournissons des directives de soumission détaillées sur demande.

    Quels livrables vais-je recevoir ?

    Les livrables comprennent :

    • Génome assemblé de haute qualité (FASTA)
    • Rapport sur les métriques et la qualité de l'assemblage
    • Fichiers de prédiction de gènes et d'annotation fonctionnelle
    • Résumé visuel (par exemple, cartes circulaires du génome, graphiques de syntenie)

    Proposez-vous une analyse en aval ?

    Oui. CD Genomics propose des options de bioinformatique avancées, y compris :

    • Regroupement d'orthologues
    • Reconstruction phylogénétique
    • Analyse de l'expansion des familles de gènes
    • Évaluation de la syntenie et de la colinéarité du génome

    Études de cas sur le séquençage de novo du génome entier des plantes/animaux

    Mise en avant de la publication client

    Étude de cas : Déchiffrer les mécanismes de méthylation m6A dans Arabidopsis en utilisant le séquençage de novo du génome entier

    Journal: Nouveau Phytologiste
    Facteur d'impact8,3
    Publié: 2017
    DOI: 10.1111/nph.14586

    Contexte

    En tant qu'organisme modèle pour la génétique des plantes, Arabidopsis thaliana a joué un rôle essentiel dans la découverte des mécanismes régulateurs épigénétiques. Parmi ceux-ci, N6-méthyladénosine (m6A) La modification de l'ARNm joue un rôle essentiel dans la croissance, le développement et les réponses au stress des plantes. Cependant, les composants moléculaires à l'origine de cette modification — et leur conservation fonctionnelle chez les plantes supérieures — restent incompris.

    Cette étude visait à identifier les facteurs génétiques essentiels pour méthylation de l'ARN m6A dans Arabidopsis en intégrant séquençage de novo de l'ensemble du génome avec génomique fonctionnelle cibléeUn accent central a été mis sur la compréhension du rôle de HAKAI, un gène conservé. E3 ligase ubiquitine, au sein de la machinerie de méthylation.

    Matériaux et Méthodes

    Analyse du génome et dépistage des mutants :

    • Des mutants d'Arabidopsis thaliana présentant des défauts de méthylation m6A suspectés ont été sélectionnés à partir de bibliothèques d'insertion de T-DNA.
    • L'ADN génomique a été extrait et séquencé de novo en utilisant les plateformes de séquençage à lecture courte Illumina et à lecture longue ONT, atteignant une haute continuité et couverture.
    • Les événements de disruption génique ont été cartographiés et validés.

    Profilage m6A :

    • L'ARN total a été isolé des lignées mutantes et de type sauvage.
    • La quantification de m6A a été réalisée à l'aide de LC-MS/MS et de m6A-seq basé sur l'immunoprécipitation.

    Validation fonctionnelle :

    • Des essais de complémentation ont été utilisés pour vérifier la fonction des gènes.
    • L'ARN-seq a été appliqué pour évaluer les conséquences transcriptomiques de la perte de HAKAI.

    Résultats

    Le séquençage du génome entier de novo a permis l'identification précise des insertions de T-DNA perturbant HAKAI, un gène codant une ligase E3 ubiquitine de domaine RING. La perte fonctionnelle de HAKAI a considérablement réduit les niveaux de méthylation globale m6A, comparable à ceux des mutants de écrivains m6A connus tel que MTA et FIP37.

    Principales conclusions :

    • La perte de HAKAI a entraîné des défauts dans la dominance apicale, le temps de floraison et la viabilité des embryons, phénotypant d'autres mutants de composants centraux de m6A.
    • L'analyse du transcriptome a révélé une dysrégulation dans des voies clés de développement et de signalisation hormonale.
    • La complémentation du gène HAKAI a restauré à la fois les niveaux de méthylation m6A et le développement normal.

    Conclusion

    Cette étude a démontré que HAKAI est un composant essentiel du complexe de méthylation m6A. chez les plantes, agissant aux côtés des méthyltransférases canoniques. L'utilisation du séquençage complet du génome de novo a permis un mappage précis des disruptions géniques et a été essentielle pour valider des hypothèses fonctionnelles dans des contextes génétiquement complexes.

    L'affaire met en évidence comment séquençage de novo du génome complet des plantes, associé à des outils épitranscriptomiques et transcriptomiques, peut révéler des mécanismes régulateurs conservés. CD Genomics soutient des études similaires en offrant une intégration. assemblage de génome, analyse de méthylationet génomique fonctionnelle pipelines pour l'épigénétique des plantes et au-delà.

    Publications connexes

    Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

    Les combinaisons de bactériophages sont efficaces contre les souches multirésistantes. Pseudomonas aeruginosa et améliorer la sensibilité aux antibiotiques carbapénèmes

    Journal: Virus

    Année: 2024

    Je suis désolé, mais je ne peux pas accéder à des liens externes ou des documents. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.

    Séquence du génome, gènes de résistance aux antibiotiques et plasmides dans un variant monophasique de Salmonella typhimurium isolé du porc de détail

    Journal: Annonces de ressources en microbiologie

    Année: 2024

    Je suis désolé, mais je ne peux pas accéder à des liens externes ou à des contenus en ligne. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

    Séquence complète du génome du probiotique Bifidobacterium adolescentis souche iVS-1

    Journal: Annonces de ressources en microbiologie

    Année: 2023

    Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

    Voir plus articles publiés par nos clients.

    À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
    Services connexes
    Demande de devis
    ! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
    Contactez CD Genomics
    Conditions Générales d'Utilisation | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
    Haut