Les séquences répétées jouent un rôle crucial dans la complexité et la fonctionnalité des génomes, et elles peuvent être largement classées en deux types : les séquences répétées éparpillées et les séquences répétées en tandem. Les répétitions éparpillées, telles que les transposons, sont dispersées dans tout le génome, tandis que les répétitions en tandem, comme les séquences d'ADN satellite, se produisent de manière contiguë. Cette étude se penche sur l'analyse des séquences répétées dans les génomes d'environ 600 espèces d'insectes, mettant en lumière leur diversité et leur distribution.
La prévalence des séquences répétées dans les génomes d'insectes est tout à fait remarquable, variant de 1,6 % à un impressionnant 81,5 %. Les transposons d'ADN se révèlent être le type de séquences répétées le plus abondant, particulièrement présents dans le Coléoptères ordre, tandis que Lépidoptères les espèces présentent une proportion relativement plus faible de transposons d'ADN.
Le paysage des éléments répétitifs des insectes. (Sproul et al., 2023)
Les transposons de type ligne, bien qu'ils soient les deuxièmes séquences répétées les plus abondantes, présentent une variation substantielle parmi les ordres d'insectes. Ils sont relativement moins courants dans Hyménoptèresreprésentant seulement 1,8 % ± 1,7 % du génome.
En revanche, les rétrotransposons de type LTR sont moins répandus chez les insectes mais sont remarquablement abondants dans Drosophile espèces. Il est essentiel de reconnaître que l'identification des transposons LTR peut être difficile en raison de leur structure plus grande et plus complexe, ce qui peut entraîner une sous-estimation de leur prévalence chez d'autres insectes.
Résumé statistique des dynamiques des éléments répétitifs des insectes, impacts technologiques. (Sproul et al., 2023)
De manière intrigante, l'étude révèle une corrélation entre la taille du génome et la présence de séquences répétées chez les insectes. Les génomes plus grands ont tendance à abriter une plus grande abondance de ces séquences.
L'enquête évalue en outre l'effet des méthodes de séquençage sur l'identification des séquences répétitives dans les génomes. Longue lecture Le séquençage surpasse le séquençage à court terme en identifiant 36,1 % de séquences répétées en plus. Cette différence est particulièrement marquée pour les LTR, avec une augmentation spectaculaire de 162 % pour les longueurs de lecture longues, suivie d'un gain de 47 % dans l'identification des transposons d'ADN.
En comparant les gènes contenant des séquences répétitives (BUSCOs associés aux RE), l'étude trouve une association positive entre la présence de transposons LINE et le nombre de tels gènes. Par exemple, chez les insectes comme Coléoptères et Hémiptèresces gènes peuvent constituer jusqu'à 25 % de tous les gènes, tandis que Hyménoptères et Diptera les espèces présentent un pourcentage beaucoup plus bas, allant de 1 % à 2 %.
Représentation des insectes dans les bases de données d'éléments répétitifs et effets sur la détection des éléments répétitifs. (Sproul et al., 2023)
L'identification des séquences répétitives repose fortement sur des bases de données de référence, telles que RepBase et Dfam. Notamment, cette étude révèle que la divergence des espèces d'insectes par rapport à Drosophila melanogaster est associée à une capacité réduite à identifier et classer les séquences répétitives. Par exemple, Drosophile Les espèces présentent seulement 13,1 % de répétitions non classées, tandis que d'autres classes d'insectes peuvent afficher jusqu'à 40,5 %. Il est important de noter que ces répétitions non classées sont généralement plus courtes en longueur.
La prédominance des séquences répétitives des familles de moustiques et de mouches des fruits dans la base de données RepBase souligne l'impact significatif du biais des bases de données de référence sur l'annotation et l'identification des génomes d'insectes.
Cette étude fournit un aperçu complet de l'abondance et de la distribution des séquences répétées dans le génomes de diverses espèces d'insectes. Les résultats soulignent le rôle de la taille du génome, des méthodes de séquençage et des bases de données de référence dans notre compréhension des séquences répétées. De plus, le maintien de génomes plus grands avec une plus grande abondance de séquences répétées peut conférer des avantages adaptatifs à certaines espèces d'insectes, comme observé chez le papillon de pierre (trichoptère), où les clades avec des génomes plus grands tendent à présenter un polymorphisme plus élevé et à occuper des niches écologiques plus larges.
Référence: