Explorer l'abondance et la distribution des séquences répétées dans les génomes d'insectes

Qu'est-ce qu'une séquence répétée ?

Les séquences répétées jouent un rôle crucial dans la complexité et la fonctionnalité des génomes, et elles peuvent être largement classées en deux types : les séquences répétées éparpillées et les séquences répétées en tandem. Les répétitions éparpillées, telles que les transposons, sont dispersées dans tout le génome, tandis que les répétitions en tandem, comme les séquences d'ADN satellite, se produisent de manière contiguë. Cette étude se penche sur l'analyse des séquences répétées dans les génomes d'environ 600 espèces d'insectes, mettant en lumière leur diversité et leur distribution.

Le paysage des séquences répétées dans les génomes d'insectes

La prévalence des séquences répétées dans les génomes d'insectes est tout à fait remarquable, variant de 1,6 % à un impressionnant 81,5 %. Les transposons d'ADN se révèlent être le type de séquences répétées le plus abondant, particulièrement présents dans le Coléoptères ordre, tandis que Lépidoptères les espèces présentent une proportion relativement plus faible de transposons d'ADN.

The repetitive element landscape of insects.Le paysage des éléments répétitifs des insectes. (Sproul et al., 2023)

Transposons en ligne - Un proche second

Les transposons de type ligne, bien qu'ils soient les deuxièmes séquences répétées les plus abondantes, présentent une variation substantielle parmi les ordres d'insectes. Ils sont relativement moins courants dans Hyménoptèresreprésentant seulement 1,8 % ± 1,7 % du génome.

Rétrotransposons de type LTR

En revanche, les rétrotransposons de type LTR sont moins répandus chez les insectes mais sont remarquablement abondants dans Drosophile espèces. Il est essentiel de reconnaître que l'identification des transposons LTR peut être difficile en raison de leur structure plus grande et plus complexe, ce qui peut entraîner une sous-estimation de leur prévalence chez d'autres insectes.

Statistical summaries of insect repetitive element dynamics, technology impacts.Résumé statistique des dynamiques des éléments répétitifs des insectes, impacts technologiques. (Sproul et al., 2023)

La taille du génome compte

De manière intrigante, l'étude révèle une corrélation entre la taille du génome et la présence de séquences répétées chez les insectes. Les génomes plus grands ont tendance à abriter une plus grande abondance de ces séquences.

Impact des méthodes de séquençage

L'enquête évalue en outre l'effet des méthodes de séquençage sur l'identification des séquences répétitives dans les génomes. Longue lecture Le séquençage surpasse le séquençage à court terme en identifiant 36,1 % de séquences répétées en plus. Cette différence est particulièrement marquée pour les LTR, avec une augmentation spectaculaire de 162 % pour les longueurs de lecture longues, suivie d'un gain de 47 % dans l'identification des transposons d'ADN.

Gènes avec des séquences répétitives

En comparant les gènes contenant des séquences répétitives (BUSCOs associés aux RE), l'étude trouve une association positive entre la présence de transposons LINE et le nombre de tels gènes. Par exemple, chez les insectes comme Coléoptères et Hémiptèresces gènes peuvent constituer jusqu'à 25 % de tous les gènes, tandis que Hyménoptères et Diptera les espèces présentent un pourcentage beaucoup plus bas, allant de 1 % à 2 %.

Insect representation in repetitive element databases and effects on RE detection.Représentation des insectes dans les bases de données d'éléments répétitifs et effets sur la détection des éléments répétitifs. (Sproul et al., 2023)

Impact des bases de données de référence

L'identification des séquences répétitives repose fortement sur des bases de données de référence, telles que RepBase et Dfam. Notamment, cette étude révèle que la divergence des espèces d'insectes par rapport à Drosophila melanogaster est associée à une capacité réduite à identifier et classer les séquences répétitives. Par exemple, Drosophile Les espèces présentent seulement 13,1 % de répétitions non classées, tandis que d'autres classes d'insectes peuvent afficher jusqu'à 40,5 %. Il est important de noter que ces répétitions non classées sont généralement plus courtes en longueur.

Biais de base de données

La prédominance des séquences répétitives des familles de moustiques et de mouches des fruits dans la base de données RepBase souligne l'impact significatif du biais des bases de données de référence sur l'annotation et l'identification des génomes d'insectes.

Conclusion

Cette étude fournit un aperçu complet de l'abondance et de la distribution des séquences répétées dans le génomes de diverses espèces d'insectes. Les résultats soulignent le rôle de la taille du génome, des méthodes de séquençage et des bases de données de référence dans notre compréhension des séquences répétées. De plus, le maintien de génomes plus grands avec une plus grande abondance de séquences répétées peut conférer des avantages adaptatifs à certaines espèces d'insectes, comme observé chez le papillon de pierre (trichoptère), où les clades avec des génomes plus grands tendent à présenter un polymorphisme plus élevé et à occuper des niches écologiques plus larges.

Référence:

  1. Sproul, John, et al. "Plus de 600 génomes d'insectes révèlent la dynamique des éléments répétitifs et mettent en lumière les défis d'annotation des répétitions à l'échelle de la biodiversité." Recherche sur le génome (2023) : gr-277387.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut