Jul 22, 2023
Le metiltransferasi vaganti generano un paesaggio epigenetico a mosaico e influenzano l'evoluzione nel gruppo Bacteroides fragilis
Nature Communications volume 14, numero articolo: 4082 (2023) Cita questo articolo 3810 Accessi 41 Dettagli metriche altmetriche Tre tipi di modifiche metiliche del DNA sono state rilevate nei batteri
Nature Communications volume 14, numero articolo: 4082 (2023) Citare questo articolo
3810 accessi
41 Altmetrico
Dettagli sulle metriche
Tre tipi di modifiche metiliche del DNA sono state rilevate nei genomi batterici e studi meccanicistici hanno dimostrato il ruolo della metilazione del DNA in funzioni fisiologiche che vanno dalla difesa dei fagi al controllo trascrizionale della virulenza e alle interazioni ospite-patogeno. Nonostante l’ubiquità delle metiltransferasi e l’immensa varietà di possibili modelli di metilazione, la diversità epigenomica rimane inesplorata per la maggior parte delle specie batteriche. I membri del gruppo Bacteroides fragilis (BFG) risiedono nel tratto gastrointestinale umano come attori chiave nelle comunità simbiotiche, ma possono anche stabilire infezioni anaerobiche sempre più resistenti a più farmaci. In questo lavoro, utilizziamo tecnologie di sequenziamento a lunga lettura per eseguire analisi pangenomiche (n = 383) e panepigenomiche (n = 268) di isolati clinici BFG coltivati da infezioni osservate presso il Centro clinico NIH per oltre quattro decenni. La nostra analisi rivela che le singole specie BFG ospitano centinaia di motivi di metilazione del DNA, con la maggior parte delle combinazioni di motivi individuali che si verificano unicamente in singoli isolati, implicando un'immensa diversità di metilazione non campionata all'interno degli epigenomi BFG. L'estrazione dei genomi del BFG ha identificato più di 6000 geni della metiltransferasi, circa 1000 dei quali erano associati a profagi intatti. L'analisi della rete ha rivelato un flusso genico sostanziale tra genomi di fagi disparati, implicando un ruolo per lo scambio genetico tra fagi BFG come una delle fonti ultime che guidano la diversità dell'epigenoma BFG.
La metilazione del DNA genomico è stata rilevata in tutti e tre i domini della vita cellulare e nei virus1,2,3. I genomi eucariotici mostrano una metilazione dinamica della citosina nella posizione C5 (5mC) all'interno di determinati contesti CpG (5'-CG-3') e la regolazione di questa metilazione CpG in siti specifici influenza la trascrizione4, le dinamiche di riparazione del genoma e la compattazione del genoma5. Al contrario, i batteri mostrano una metilazione del DNA specifica per il motivo (ad esempio, 5'-CC-6mA-TGG-3') dove quasi tutte le istanze di un dato motivo possono essere metilate6. Similmente ai genomi eucariotici, le modifiche 5mC sono comuni; tuttavia, i genomi batterici mostrano un'ulteriore metilazione nella posizione N4 delle citosine (4mC) e, più comunemente, nella posizione N6 delle adenine (6mA)6. La metilazione del DNA batterico è condotta dalle DNA metiltransferasi, alcune delle quali sembrano essere presenti e attive in tutti i ceppi di una data specie (ad esempio, Dam, che modifica il GATC in Escherichia coli), mentre altre DNA metiltransferasi e i geni che le codificano sono transitoriamente acquisiti e persi nel tempo e non sono essenziali per la vitalità della cultura7. Classicamente, la metilazione del DNA batterico è stata intesa principalmente come un sottoprodotto della difesa antifagica basata su sistemi di modifica della restrizione8. Tuttavia, altre conseguenze fisiologiche del mantenimento del DNA metilato, spesso in migliaia di loci, sono ora diventate chiare. Gli studi hanno dimostrato il ruolo della metilazione del DNA batterico nella regolazione dell'attività trascrizionale che controlla i fenotipi di virulenza9,10,11 e altri programmi fisiologici12,13, la stabilità del genoma14,15 e influenza la frequenza di mutazione all'interno dei motivi metilati16,17, simili alle osservazioni nei sistemi eucariotici.
I batteri del gruppo Bacteroides fragilis (BFG) rappresentano più di una dozzina di specie nei generi Bacteroides, Parabacteroides e Phocaeicola recentemente introdotti18. Questi abbondanti simbionti possono essere facilmente trovati mentre vivono in condizioni anaerobiche nei tratti gastrointestinali umani e sono stati implicati in molte importanti funzioni metaboliche e immunitarie19,20,21. Sono anche tra i batteri più comunemente riscontrati nelle infezioni anaerobiche extra-intestinali e sono sempre più resistenti a molti antibiotici, tra cui cefalosporine e carbapenemi22,23. La loro ampia portata fenotipica è resa possibile in parte dalla variazione di fase, da una serie di loci di utilizzo dei polisaccaridi e dal loro uso di promotori invertibili24,25.
5 kb each) could be detected in assemblies (Supplementary Fig. 1C). The numbers of identified rRNA operons per circular chromosome corresponded to the expected values for the species in almost all cases based on data derived from the Ribosomal RNA Database27./p>20,000 sampled genes within the dataset, implying that an immense number of additional gene families await discovery within the BFG. This pangenome openness is largely consistent with gut-derived Bacteroides metagenome assembled genomes32./p>3 kb in length encoding only accessory genes, Supplementary Data 3) were extracted from 414 genomes representing 13 species for which three or more genomes were available (378 genomes from this study and 36 genomes from NCBI)33. Comparison of each accessory region sequence with all others in this set demonstrated that >10% of such regions were shared between species, suggesting horizontal transfer (Fig. 2c). Each accessory region was probed for a variety of features, and it was found that phage, phage defense systems, DNA methyltransferases, conjugative machinery, episomes/plasmids, and antimicrobial resistance (AMR) genes were all more common in accessory regions detected in three or more species (Fig. 2c). For instance, accessory regions encoding the tetracycline resistance gene tet(Q) and/or a cassette with genes tet(X)1, tet(X)2, and the aminoglycoside modifying enzyme aadS were detected in 12 of 13 species analyzed (Fig. 2 and Supplementary Fig. 4), likely confirming a history of selective pressure from tetracycline and aminoglycoside compounds./p>95% average nucleotide identity (see Methods) (Supplementary Fig. 5A). The majority of circular contigs (550 out 575; 95.7%) had recognizable plasmid genes such as replicases or relaxases (see Methods), and a proportion of the remainder may represent replicative intermediates of transposons, but this was not analyzed further. Despite the ubiquity of both plasmids/episomes and AMR genes in the sequencing data, we found that most of these AMR genes were not located on plasmids/episomes (53 out of 1911 AMR genes were located within circular plasmid/episome contigs) among BFG species. The overwhelming majority (>97.2%) of AMR genes appeared to be located within chromosomes, and many were associated with integrative elements23. Many of the AMR genes encoded by plasmids/episomes also appeared associated with integration of integrative elements into plasmid backbones, consistent with possible shuttling of AMR genes between chromosomes and plasmids/episomes (Supplementary Fig. 5B)./p>90% of genomes in a species, ‘Shell’ was defined as presence in >10% and ≤90% genomes in a species, and ‘Cloud’ was defined as presence in <10% of genomes in a species./p>90% amino acid identity to previously identified DNA methyltransferases. Interestingly, in the course of our analysis, we observed that within each species, there is a positive correlation between genome size and number of putative DNA methyltransferases (Supplementary Fig. 6). BFG-632 is the longest genome in the entire collection, consistent with the greatest number of methyltransferases./p> = 95 and AF > = 85 were counted. Note that accessory region sequences can often consist of multiple mobile genetic elements or genomic islands in tandem, and no attempt was made to separate individual elements within these regions with the exception of bacteriophages./p>50 copies per chromosome), and in some cases these high copy number plasmids/episomes were represented in lower copy number in companion libraries sequenced on the same flow cell. We assessed that this was likely library cross-contamination and to reduce the likelihood of artifactual assignment of plasmids/episomes to the incorrect library, we excluded circular contigs with coverage that was either 80% of the coverage value of the bacterial chromosome or less or if the coverage was less than 30-fold on average across the sequence. This may have resulted in an underestimate of the true number of plasmids/episomes. Furthermore, the Flye assembler occasionally artifactually assembles sequences as concatemers of two or more tandem copies. Each circular sequence was aligned to itself with BLASTN, and, if the total length of the alignment was greater than 140% of the total length of the sequence, the episome was trimmed down to one unit length to eliminate potential artifactual tandem duplications. To determine if the filtered sequences had plasmid-associated genes, each sequence was run through MOBsuite75 followed by RPS-BLAST against the CDD database76 with flags “ -evalue 1e-2 -seg yes”. Hits were then cross-checked against a list of models related to plasmid replicases, relaxases, conjugative machinery, integrases, and transposes (Supplementary Data 14). Also, Abricate was run as described above on each sequence. Plasmids/episomes were clustered into approximate operational taxonomic units (OTUs) using anicalc and aniclust from CheckV with flags “--min_ani 95 --min_tcov 85” (minimum ANI = 95%, minimum AF = 85%). The network graph was visualized in Cytoscape77./p>10 Tb). Requests for materials associated this work require a standard NIH Material Transfer Agreement with the NIH and U.S. Government. Requests for materials should be addressed to John Dekker at [email protected]./p>