304 roestvrij staal gelaste opgerolde buis / tubing zhemische zomponent, biosynthetisch potentieel van het mondiale mariene microbioom

Bedankt voor uw bezoek aan Nature.com.U gebruikt een browserversie met beperkte CSS-ondersteuning.Voor de beste ervaring raden wij u aan een bijgewerkte browser te gebruiken (of de compatibiliteitsmodus in Internet Explorer uit te schakelen).Om voortdurende ondersteuning te garanderen, tonen we de site bovendien zonder stijlen en JavaScript.
Sliders met drie artikelen per dia.Gebruik de knoppen Vorige en Volgende om door de dia's te bladeren, of de knoppen op de schuifregelaar aan het einde om door elke dia te bladeren.

Gedetailleerde productbeschrijving

304 roestvrij staal gelaste opgerolde buis/buis
1. Specificatie: roestvrijstalen spiraalbuis / buis
2. Type: gelast of naadloos
3. Standaard: ASTM A269, ASTM A249
4. Roestvrijstalen spoelbuis OD: 6 mm tot 25,4 mm
5. Lengte: 600-3500MM of vanaf de eis van de klant.
6. Wanddikte: 0,2 mm tot 2,0 mm.

7. Tolerantie: buitendiameter: +/-0,01 mm;Dikte: +/-0,01%.

8. Grootte van het binnengat van de spoel: 500 MM - 1500 MM (kan worden aangepast aan de eisen van de klant)

9. Spoelhoogte: 200 MM-400 MM (kan worden aangepast aan de eisen van de klant)

10. Oppervlak: helder of gegloeid
11. Materiaal: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, legering 625, 825, 2205, 2507, enz.
12. Verpakking: geweven zakken in houten kist, houten pallet, houten schacht of volgens de eis van de klant
13. Test: chemische component, vloeigrens, treksterkte, hardheidsmeting
14. Garantie: Inspectie door derden (bijvoorbeeld: SGS TV), enz.
15. Toepassing: decoratie, meubels, olietransport, warmtewisselaar, reling maken, papier maken, auto's, voedselverwerking, medisch, enz.

Alle chemische samenstelling en fysische eigenschappen voor roestvrij staal, zoals hieronder:

Materiaal ASTM A269 Chemische samenstelling % Max
C Mn P S Si Cr Ni Mo Let op Nb Ti
TP304 0,08 2.00 0,045 0,030 1.00 18.0-20.0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1.00 18.0-20.0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1.00 16.0-18.0 10,0-14,0 2.00-3.00 uur ^ ^ ^
TP316L 0,035 D 2.00 0,045 0,030 1.00 16.0-18.0 10,0-15,0 2.00-3.00 uur ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1.00 17.0-19.0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1.00 17.0-19.0 9,0-12,0 10C -1,10 ^

 

Materiaal Hittebehandeling Temperatuur F (C) Min. Hardheid
Brinell Rockwell
TP304 Oplossing 1900 (1040) 192HBW/200HV 90 HRB
TP304L Oplossing 1900 (1040) 192HBW/200HV 90 HRB
TP316 Oplossing 1900(1040) 192HBW/200HV 90 HRB
TP316L Oplossing 1900(1040) 192HBW/200HV 90 HRB
TP321 Oplossing 1900(1040) V 192HBW/200HV 90 HRB
TP347 Oplossing 1900(1040) 192HBW/200HV 90 HRB

 

O.D., duim OD Tolerantie inch (mm) WT-tolerantie% Lengte Tolerantie inch (mm)
+ -
≤ 1 / 2 ± 0,005 (0,13) ± 15 1 / 8 (3,2) 0
> 1 / 2 ~1 1 / 2 ± 0,005(0,13) ± 10 1 / 8 (3,2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0,010(0,25) ± 10 3 / 16 (4,8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0,015 (0,38) ± 10 3 / 16 (4,8) 0
> 5 1 / 2 ~< 8 ± 0,030(0,76) ± 10 3 / 16 (4,8) 0
8~< 12 ± 0,040(1,01) ± 10 3 / 16 (4,8) 0
12~< 14 ± 0,050 (1,26) ± 10 3 / 16 (4,8) 0

Natuurlijke microbiële gemeenschappen zijn fylogenetisch en metabolisch divers.Naast onderbelichte groepen organismen1 biedt deze diversiteit ook een rijk potentieel voor de ontdekking van ecologisch en biotechnologisch belangrijke enzymen en biochemische verbindingen2,3.Het bestuderen van deze diversiteit om de genomische routes te bepalen die dergelijke verbindingen synthetiseren en binden aan hun respectievelijke gastheren blijft echter een uitdaging.Het biosynthetische potentieel van micro-organismen in de open oceaan blijft grotendeels onbekend vanwege beperkingen in de analyse van resolutiegegevens van het hele genoom op mondiale schaal.Hier onderzoeken we de diversiteit en diversiteit van biosynthetische genenclusters in de oceaan door ongeveer 10.000 microbiële genomen uit gekweekte cellen en afzonderlijke cellen te integreren met meer dan 25.000 nieuw gereconstrueerde ontwerpgenomen uit meer dan 1.000 zeewatermonsters.Deze inspanningen hebben ongeveer 40.000 vermoedelijke, voornamelijk nieuwe biosynthetische genclusters geïdentificeerd, waarvan sommige zijn gevonden in voorheen onvermoede fylogenetische groepen.In deze populaties hebben we een afstammingslijn geïdentificeerd die verrijkt is met biosynthetische genclusters (“Candidatus Eudormicrobiaceae”) die tot een niet-gecultiveerde bacteriële fylum behoorden en enkele van de meest biosynthetisch diverse micro-organismen in deze omgeving omvatten.Hiervan hebben we de fosfatase-peptide- en pytonamide-routes gekarakteriseerd, waarbij we respectievelijk gevallen van ongebruikelijke bioactieve verbindingsstructuur en enzymologie hebben geïdentificeerd.Concluderend laat deze studie zien hoe op het microbioom gebaseerde strategieën de verkenning van voorheen onbeschreven enzymen en natuurlijke voedingsmiddelen in een slecht begrepen microbiota en omgeving mogelijk kunnen maken.
Microben sturen mondiale biogeochemische cycli aan, onderhouden voedselwebben en houden planten en dieren gezond5.Hun enorme fylogenetische, metabolische en functionele diversiteit vertegenwoordigt een rijk potentieel voor de ontdekking van nieuwe taxa1, enzymen en biochemische verbindingen, waaronder natuurlijke producten6.In ecologische gemeenschappen voorzien deze moleculen micro-organismen van een verscheidenheid aan fysiologische en ecologische functies, van communicatie tot competitie 2, 7 .Naast hun oorspronkelijke functies bieden deze natuurlijke producten en hun genetisch gecodeerde productieroutes voorbeelden voor biotechnologische en therapeutische toepassingen2,3.De identificatie van dergelijke routes en verbindingen is enorm vergemakkelijkt door de studie van gekweekte microben.Taxonomische studies van natuurlijke omgevingen hebben echter aangetoond dat de overgrote meerderheid van de micro-organismen niet is gekweekt8.Deze culturele vooringenomenheid beperkt ons vermogen om de functionele diversiteit te exploiteren die door veel microben wordt gecodeerd4,9.
Om deze beperkingen te overwinnen heeft de technologische vooruitgang van de afgelopen tien jaar het onderzoekers mogelijk gemaakt om direct (dat wil zeggen, zonder voorafgaande kweek) microbiële DNA-fragmenten uit hele gemeenschappen (metagenomics) of afzonderlijke cellen te sequencen.Het vermogen om deze fragmenten samen te voegen tot grotere genoomfragmenten en respectievelijk meerdere metagenomisch geassembleerde genomen (MAG's) of enkelvoudige geamplificeerde genomen (SAG's) te reconstrueren, opent een belangrijke mogelijkheid voor taxocentrische studies van het microbioom (dwz microbiële gemeenschappen en het microbioom).nieuwe paden effenen.eigen genetisch materiaal in een bepaalde omgeving) 10,11,12.Recente studies hebben de fylogenetische representatie van de microbiële diversiteit op aarde enorm uitgebreid1, 13 en hebben veel van de functionele diversiteit in individuele microbiële gemeenschappen onthuld die voorheen niet werd gedekt door referentiegenoomsequenties (REF's) van gekweekte micro-organismen14.Het vermogen om onontdekte functionele diversiteit in de context van het gastheergenoom te plaatsen (dwz genoomresolutie) is van cruciaal belang voor het voorspellen van nog niet gekarakteriseerde microbiële lijnen die vermoedelijk coderen voor nieuwe natuurlijke producten 15,16 of voor het herleiden van dergelijke verbindingen tot hun oorspronkelijke producent 17.Een gecombineerde metagenomische en eencellige genomische analyse-aanpak heeft bijvoorbeeld geleid tot de identificatie van Candidatus Entotheonella, een groep metabolisch rijke spons-geassocieerde bacteriën, als producenten van een verscheidenheid aan medicijnmogelijkheden18.Ondanks recente pogingen tot genomische verkenning van diverse microbiële gemeenschappen16,19 ontbreekt echter nog steeds meer dan tweederde van de mondiale metagenomische gegevens voor de grootste oceaan van ecosystemen op aarde16,20.Over het algemeen blijven het biosynthetische potentieel van het mariene microbioom en zijn potentieel als opslagplaats van nieuwe enzymatische en natuurlijke producten dus grotendeels onderbelicht.
Om het biosynthetische potentieel van mariene microbiomen op wereldschaal te onderzoeken, hebben we eerst mariene microbiële genomen verzameld die zijn verkregen met behulp van cultuurafhankelijke en niet-cultuurmethoden om een ​​uitgebreide database van fylogenetica en genfunctie te creëren.Onderzoek van deze database bracht een grote verscheidenheid aan biosynthetische genclusters (BGC's) aan het licht, waarvan de meeste tot nog niet gekarakteriseerde genclusterfamilies (GCF) behoren.Daarnaast hebben we een onbekende bacteriefamilie geïdentificeerd die tot nu toe de hoogst bekende diversiteit aan BGC's in de open oceaan vertoont.We selecteerden twee ribosomale synthese- en post-translationeel gemodificeerde peptide (RiPP) routes voor experimentele validatie op basis van hun genetische verschillen met de momenteel bekende routes.De functionele karakterisering van deze routes heeft onverwachte voorbeelden van enzymologie aan het licht gebracht, evenals structureel ongebruikelijke verbindingen met protease-remmende activiteit.
In eerste instantie wilden we een mondiale gegevensbron voor genoomanalyse creëren, waarbij we ons concentreerden op de bacteriële en archaeale componenten ervan.Daartoe hebben we metagenomische gegevens en 1038 zeewatermonsters samengevoegd van 215 wereldwijd verspreide bemonsteringslocaties (breedtegraad = 141,6 °) en verschillende diepe lagen (van 1 tot 5600 m diep, die de pelagische, mesopelagische en afgrondzones bestrijken).Achtergrond (figuur 1a, uitgebreide gegevens, figuur 1a en aanvullende tabel 1).Deze selectief gefilterde monsters boden niet alleen een brede geografische dekking, maar lieten ons ook verschillende componenten van het mariene microbioom vergelijken, waaronder virusrijk (<0,2 µm), prokaryootrijk (0,2-3 µm), deeltjesrijk (0,8 µm ).–20 µm) en virusarme (>0,2 µm) kolonies.
a. Een totaal van 1038 openbaar beschikbare genomen (metagenomics) van mariene microbiële gemeenschappen verzameld op 215 wereldwijd verspreide locaties (62°ZB tot 79°N en 179°W tot 179°O).Kaarttegels © Esri.Bronnen: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ en Esri.b, deze metagenomen werden gebruikt om MAG's (methoden en aanvullende informatie) te reconstrueren, die verschillen in kwantiteit en kwaliteit (methoden) in de datasets (gemarkeerd in kleur).De gereconstrueerde MAG's werden aangevuld met openbaar beschikbare (externe) genomen, waaronder handgemaakte MAG26, SAG27 en REF.27 Stel OMD samen.c, vergeleken met eerdere rapporten die alleen op SAG (GORG)20 of MAG (GEM)16 zijn gebaseerd, verbetert OMD de genomische karakterisering van mariene microbiële gemeenschappen (metagenomic read mapping rate; methode) met twee tot drie keer met een meer consistente representatie in de diepte en breedtegraad..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD-groepering in soortclustersniveau (95% gemiddelde nucleotide-identiteit) identificeert een totaal van ongeveer 8300 soorten, waarvan meer dan de helft nog niet eerder is gekarakteriseerd volgens taxonomische annotaties met behulp van de GTDB (versie 89). De classificatie van soorten op genoomtype heeft aangetoond dat MAG, SAG en REF’s elkaar goed aanvullen in het weerspiegelen van de fylogenetische diversiteit van het mariene microbioom.Met name 55%, 26% en 11% van de soorten waren specifiek voor respectievelijk MAG, SAG en REF.BATS, Bermuda Atlantic Time Series;GEM, genomen van het microbioom van de aarde;GORG, mondiaal oceaanreferentiegenoom;HOT, tijdreeks Hawaiiaanse Oceaan.
Met behulp van deze dataset hebben we in totaal 26.293 MAG's gereconstrueerd, voornamelijk bacterieel en archaeaal (figuur 1b en uitgebreide gegevens, figuur 1b).We hebben deze MAG's gemaakt op basis van assemblages van afzonderlijke in plaats van samengevoegde metagenomische monsters om de ineenstorting van de natuurlijke sequentievariatie tussen monsters van verschillende locaties of tijdstippen (methoden) te voorkomen.Daarnaast hebben we genomische fragmenten gegroepeerd op basis van hun prevalentiecorrelaties over een groot aantal monsters (van 58 tot 610 monsters, afhankelijk van het onderzoek; methode).We ontdekten dat dit een tijdrovende maar belangrijke stap24 is die werd overgeslagen bij verschillende grootschalige reconstructiewerkzaamheden van de MAG16, 19, 25 en die de kwantiteit (gemiddeld 2,7 maal) en kwaliteit (+20% gemiddeld) van de genoom.gereconstrueerd op basis van het hier bestudeerde mariene metagenoom (uitgebreide gegevens, figuur 2a en aanvullende informatie).Over het geheel genomen resulteerden deze inspanningen in een 4,5-voudige toename van mariene microbiële MAG's (6-voudig als alleen MAG's van hoge kwaliteit in aanmerking worden genomen) vergeleken met de meest uitgebreide MAG-bron die momenteel beschikbaar is16 (methoden).Deze nieuw gemaakte MAG-set werd vervolgens gecombineerd met 830 zorgvuldig geselecteerde MAG26's, 5969 SAG27's en 1707 REF's.Zevenentwintig soorten mariene bacteriën en archaea vormden een combinatorische verzameling van 34.799 genomen (Fig. 1b).
Vervolgens hebben we de nieuw gecreëerde hulpbron geëvalueerd om het vermogen ervan om mariene microbiële gemeenschappen te vertegenwoordigen te verbeteren en de impact van de integratie van verschillende genoomtypen te beoordelen.Gemiddeld hebben we vastgesteld dat het ongeveer 40-60% van de mariene metagenomische gegevens bestrijkt (Figuur 1c), twee tot drie keer de dekking van eerdere MAG-rapporten, zowel in diepte als in breedtegraad. Meer serial 16 of SAG20.Om de taxonomische diversiteit in gevestigde collecties systematisch te meten, hebben we bovendien alle genomen geannoteerd met behulp van de Genome Taxonomy Database (GTDB) toolkit (methoden) en een gemiddelde genoombrede nucleotide-identiteit van 95% gebruikt.28 om 8.304 soortenclusters (soorten) te identificeren.Twee derde van deze soorten (inclusief nieuwe clades) was niet eerder in de GTDB verschenen, waarvan er 2790 werden ontdekt met behulp van de MAG die in dit onderzoek werd gereconstrueerd (Fig. 1d).Bovendien ontdekten we dat verschillende soorten genomen zeer complementair zijn: respectievelijk 55%, 26% en 11% van de soorten bestaan ​​volledig uit MAG, SAG en REF (Fig. 1e).Bovendien omvatte MAG alle 49 typen die in de waterkolom voorkomen, terwijl SAG en REF respectievelijk slechts 18 en 11 daarvan vertegenwoordigden.SAG vertegenwoordigt echter beter de diversiteit van de meest voorkomende clades (uitgebreide gegevens, Fig. 3a), zoals Pelagic Bacteriales (SAR11), waarbij SAG bijna 1300 soorten omvat en MAG slechts 390 soorten.Met name overlapten REF's zelden met MAG's of SAG's op soortniveau en vertegenwoordigden ze> 95% van de ongeveer 1000 genomen die niet worden aangetroffen in de hier bestudeerde metagenomische sets in de open oceaan, voornamelijk als gevolg van interacties met andere soorten geïsoleerde representatieve mariene specimens (bijv. sedimenten) .of host-medewerker).Om het breed beschikbaar te maken voor de wetenschappelijke gemeenschap, kan deze mariene genoombron, die ook niet-geclassificeerde fragmenten omvat (bijvoorbeeld van voorspelde fagen, genomische eilanden en genoomfragmenten waarvoor er onvoldoende gegevens zijn voor MAG-reconstructie), worden vergeleken met taxonomische gegevens .Krijg toegang tot annotaties samen met genfunctie en contextuele parameters in de Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Vervolgens gingen we op zoek naar de rijkdom en nieuwigheid van het biosynthetische potentieel in microbiomen in de open oceaan.Daartoe hebben we eerst antiSMASH gebruikt voor alle MAG's, SAG's en REF's gevonden in 1038 mariene metagenomen (methoden) om in totaal 39.055 BGC's te voorspellen.We hebben deze vervolgens gegroepeerd in 6907 niet-redundante GCF's en 151 genclusterpopulaties (GCC's; aanvullende tabel 2 en methoden) om rekening te houden met inherente redundantie (dat wil zeggen, dezelfde BGC kan in meerdere genomen worden gecodeerd) en metagenomische gegevens Fragmentatie van geconcentreerde BGC's.Onvolledige BGC's verhoogden respectievelijk niet significant (aanvullende informatie) het aantal GCF's en GCC's, met ten minste één intact BGC-lid in 44% en 86% van de gevallen.
Op GCC-niveau vonden we een grote verscheidenheid aan voorspelde RiPP's en andere natuurlijke producten (figuur 2a).Onder hen behoren bijvoorbeeld arylpolyenen, carotenoïden, ectoïnen en sideroforen tot GCC's met een brede fylogenetische verspreiding en een hoge overvloed aan oceanische metagenomen, wat kan duiden op een brede aanpassing van micro-organismen aan het mariene milieu, inclusief resistentie tegen reactieve zuurstofsoorten. oxidatieve en osmotische stress..of ijzerabsorptie (meer informatie).Deze functionele diversiteit staat in contrast met een recente analyse van ongeveer 1,2 miljoen BGC's onder ongeveer 190.000 genomen opgeslagen in de NCBI RefSeq-database (BiG-FAM/RefSeq, hierna RefSeq genoemd)29, waaruit bleek dat niet-ribosomale synthetasepeptiden (NRPS) en polyketidesynthase (PKS) BGC's (aanvullende informatie).We vonden ook dat 44 (29%) GCC's slechts in de verte gerelateerd waren aan enige RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; Fig. 2a en methoden) en 53 (35%) GCC's alleen in MAG, wat het potentieel benadrukt om voorheen onbeschreven chemicaliën in OMD te detecteren.Gegeven dat elk van deze GCC's waarschijnlijk zeer diverse biosynthetische functies vertegenwoordigt, hebben we gegevens op GCF-niveau verder geanalyseerd in een poging een meer gedetailleerde groepering van BGC's te verschaffen waarvan wordt voorspeld dat ze coderen voor vergelijkbare natuurlijke producten .Een totaal van 3861 (56%) geïdentificeerde GCF's overlapt niet met RefSeq, en> 97% van de GCF's was niet aanwezig in MIBiG, een van de grootste databases van experimenteel gevalideerde BGC's (Figuur 2b).Hoewel het niet verrassend is om veel potentiële nieuwe routes te ontdekken in omgevingen die niet goed worden vertegenwoordigd door het referentiegenoom, verschilt onze methode voor het derepliceren van BGC's in GCF's vóór benchmarking van eerdere rapporten 16 en stelt ons in staat een onpartijdige beoordeling van nieuwheid te geven.Het grootste deel van de nieuwe diversiteit (3012 GCF of 78%) komt overeen met voorspelde terpenen, RiPP of andere natuurlijke producten, en het grootste deel (1815 GCF of 47%) is gecodeerd in onbekende typen vanwege hun biosynthetisch potentieel.In tegenstelling tot PKS- en NRPS-clusters is het minder waarschijnlijk dat deze compacte BGC's gefragmenteerd raken tijdens metagenomische assemblage 31 en maken ze een meer tijd- en middelenintensieve functionele karakterisering van hun producten mogelijk.
In totaal waren 39.055 BGC's gegroepeerd in 6.907 GCF's en 151 GCC's.a, gegevensrepresentatie (intern extern).Hiërarchische clustering van BGC-afstanden op basis van GCC, waarvan er 53 alleen door MAG worden vastgelegd.De GCC bevat BGC's van verschillende taxa (In-getransformeerde poortfrequentie) en verschillende BGC-klassen (de cirkelgrootte komt overeen met de frequentie ervan).Voor elke GCC vertegenwoordigt de buitenste laag het aantal BGC's, de prevalentie (percentage monsters) en de afstand (minimale BGC-cosinusafstand (min (dMIBiG))) van BiG-FAM tot BGC.GCC's met BGC's die nauw verwant zijn aan experimenteel geverifieerde BGC's (MIBiG) zijn gemarkeerd met pijlen.b Door GCF te vergelijken met voorspelde (BiG-FAM) en experimenteel gevalideerde (MIBiG) BGC's, werden 3861 nieuwe (d–>0,2) GCF's gevonden.De meeste (78%) hiervan coderen voor RiPP, terpenen en andere vermeende natuurlijke producten.c, alle genomen in de OMD gevonden in 1038 mariene metagenomen werden in de GTDB-basisboom geplaatst om de fylogenetische dekking van de OMD te tonen.Clades zonder genomen in de OMD worden grijs weergegeven.Het aantal BGC's komt overeen met het grootste aantal voorspelde BGC's per genoom in een bepaalde clade.Voor de duidelijkheid: de laatste 15% van de knooppunten zijn samengevouwen.Pijlen geven clades aan die rijk zijn aan BGC (> 15 BGC), met uitzondering van Mycobacterium, Gordonia (tweede alleen na Rhodococcus) en Crocosphaera (tweede alleen na Synechococcus).d, onbekend c.Eremiobacterota vertoonde de hoogste biosynthetische diversiteit (Shannon-index gebaseerd op natuurlijk producttype).Elke band vertegenwoordigt het genoom met de meeste BGC's in de soort.T1PKS, PKS type I, T2/3PKS, PKS type II en type III.
Naast rijkdom en nieuwigheid onderzoeken we de biogeografische structuur van het biosynthetische potentieel van het mariene microbioom.Groepering van monsters op basis van de gemiddelde metagenomische GCF-kopieaantalverdeling (methoden) toonde aan dat gemeenschappen op lage breedtegraden, oppervlakte-, prokaryoten-rijke en virusarme gemeenschappen, meestal uit oppervlakte- of diepere, zonovergoten wateren, rijk waren aan RiPP- en BGC-terpenen.Daarentegen werden polaire, diepzee-, virus- en deeltjesrijke gemeenschappen geassocieerd met hogere hoeveelheden NRPS en PKS BGC (uitgebreide gegevens, figuur 4 en aanvullende informatie).Ten slotte ontdekten we dat goed bestudeerde tropische en pelagische gemeenschappen de meest veelbelovende bronnen van nieuwe terpenen zijn (Augmented Data Figure).Hoogste potentieel voor PKS, RiPP en andere natuurlijke producten (Figuur 5a met uitgebreide gegevens).
Als aanvulling op onze studie van het biosynthetische potentieel van mariene microbiomen, probeerden we hun fylogenetische verspreiding in kaart te brengen en nieuwe BGC-verrijkte clades te identificeren.Daartoe hebben we de genomen van mariene microben in een genormaliseerde GTDB13 bacteriële en archaeale fylogenetische boom geplaatst en de vermeende biosynthetische routes die ze coderen over elkaar heen gelegd (Fig. 2c).We hebben gemakkelijk verschillende BGC-verrijkte clades (vertegenwoordigd door meer dan 15 BGC's) gedetecteerd in zeewatermonsters (methoden) die bekend staan ​​om hun biosynthetische potentieel, zoals cyanobacteriën (Synechococcus) en Proteus-bacteriën, zoals Tistrella, of hebben onlangs de aandacht getrokken vanwege hun natuurlijke producten .zoals Myxococcota (Sandaracinaceae), Rhodococcus en Planctomycetota34,35,36.Interessant genoeg hebben we in deze clades verschillende voorheen onontdekte geslachten gevonden.De soorten met het rijkste biosynthetische potentieel in de phyla Planctomycetota en Myxococcota behoorden bijvoorbeeld tot respectievelijk niet-gekarakteriseerde kandidaat-orden en geslachten (aanvullende tabel 3).Alles bij elkaar genomen suggereert dit dat de OMD toegang biedt tot voorheen onbekende fylogenetische informatie, waaronder micro-organismen, die nieuwe doelen kunnen vormen voor de ontdekking van enzymen en natuurlijke producten.
Vervolgens hebben we de met BGC verrijkte clade gekarakteriseerd door niet alleen het maximale aantal BGC's te tellen dat door de leden ervan wordt gecodeerd, maar ook door de diversiteit van deze BGC's te beoordelen, wat de frequentie van verschillende soorten natuurlijke kandidaatproducten verklaart (figuur 2c en methoden). )..We ontdekten dat de meest biosynthetisch diverse soorten in deze studie werden vertegenwoordigd door speciaal ontworpen bacteriële MAG's.Deze bacteriën behoren tot de niet-gecultiveerde phylum Candidatus Eremiobacterota, die grotendeels onontgonnen blijft, afgezien van enkele genomische studies37,38.Opmerkelijk is dat “ca.Het geslacht Eremiobacterota is alleen geanalyseerd in een terrestrische omgeving en er zijn geen leden bekend die verrijkt zijn met BGC.Hier hebben we acht MAG’s van dezelfde soort gereconstrueerd (nucleotide-identiteit > 99%) 23. Daarom stellen we de soortnaam “Candidatus Eudoremicrobium malaspinii” voor, genoemd naar de nereïde (zeenimf), een prachtig geschenk in de Griekse mythologie en expedities.'Ka.Volgens fylogenetische annotatie 13 heeft E. malaspinii geen eerder bekende verwanten onder het sequentieniveau en behoort hij dus tot een nieuwe bacteriële familie die wij voorstellen “Ca.E. malaspinii” als typesoort en “Ca.Eudormicrobiaceae” als de officiële naam (aanvullende informatie).Korte metagenomische reconstructie van 'Ca.Het E. malaspinii-genoomproject werd gevalideerd door zeer lage input, lang gelezen metagenomische sequencing en gerichte assemblage van een enkel monster (methoden) als een enkel lineair chromosoom van 9,63 Mb met een duplicatie van 75 kb.als de enige resterende onduidelijkheid.
Om de fylogenetische context van deze soort vast te stellen, hebben we door middel van gerichte genoomreconstructie naar 40 nauw verwante soorten gezocht in aanvullende eukaryotische-verrijkte metagenomische monsters van de Tara Ocean-expeditie.In het kort hebben we metagenomische metingen gekoppeld aan genomische fragmenten geassocieerd met “Ca.E. malaspinii” en veronderstelde dat een verhoogd rekruteringspercentage in deze steekproef duidt op de aanwezigheid van andere familieleden (methoden).Als resultaat vonden we 10 MAG's, een combinatie van 19 MAG's die vijf soorten in drie geslachten vertegenwoordigen binnen een nieuw gedefinieerde familie (dwz "Ca. Eudormicrobiaceae").Na handmatige inspectie en kwaliteitscontrole (uitgebreide gegevens, figuur 6 en aanvullende informatie) ontdekten we dat “Ca.Eudormicrobiaceae-soorten hebben grotere genomen (8 Mb) en een rijker biosynthetisch potentieel (14 tot 22 BGC per soort) dan andere “Ca”-leden.Clade Eremiobacterota (tot 7 BGC) (Fig. 3a – c).
a, Fylogenetische posities van de vijf 'Ca.Soorten van Eudormicrobiaceae vertoonden een BGC-rijkdom die specifiek is voor de mariene lijnen die in dit onderzoek zijn geïdentificeerd.De fylogenetische boom omvat alle 'Ca.MAG Eremiobacterota en leden van andere fyla (genoomnummers tussen haakjes) verstrekt in GTDB (versie 89) werden gebruikt voor evolutionaire achtergrond (methoden).De buitenste lagen vertegenwoordigen classificaties op familieniveau (“Ca. Eudormicrobiaceae” en “Ca. Xenobiaceae”) en op klassenniveau (“Ca. Eremiobacteria”).De vijf soorten die in dit onderzoek worden beschreven, worden weergegeven door alfanumerieke codes en voorgestelde binomiale namen (aanvullende informatie).b, oké.Eudormicrobiaceae-soorten delen zeven gemeenschappelijke BGC-kernen.De afwezigheid van BGC in de A2-clade was te wijten aan de onvolledigheid van de representatieve MAG (aanvullende tabel 3).BGC's zijn specifiek voor “Ca.Amphithomicrobium” en “Ca.Amphithomicrobium” (clades A en B) worden niet getoond.c, Alle BGC's gecodeerd als "Ca.Eudoremicrobium taraoceanii bleek tot expressie te komen in 623 metatranscriptomen uit de oceanen van Tara.Gevulde cirkels geven actieve transcriptie aan.Oranje cirkels geven log2-getransformeerde vouwveranderingen aan onder en boven de huishoudgenexpressiesnelheid (methoden).d, relatieve overvloedcurven (methoden) die 'Ca.Soorten Eudormicrobiaceae zijn wijdverspreid in de meeste oceaanbekkens en in de gehele waterkolom (van het oppervlak tot een diepte van minstens 4000 m).Op basis van deze schattingen vonden we dat 'Ca.E. malaspinii' is verantwoordelijk voor maximaal 6% van de prokaryote cellen in diepzee-pelagische graangeassocieerde gemeenschappen.We beschouwden een soort als aanwezig op een locatie als deze werd aangetroffen in een fractie van de grootte van een bepaalde dieptelaag.IO – Indische Oceaan, NAO – Noord-Atlantische Oceaan, NPO – Noordelijke Stille Oceaan, RS – Rode Zee, SAO – Zuid-Atlantische Oceaan, SO – Zuidelijke Oceaan, SPO – Zuidelijke Stille Oceaan.
Het bestuderen van de overvloed en verspreiding van Ca.Eudormicrobiaceae, die, zoals we ontdekten, de overhand heeft in de meeste oceaanbekkens, evenals in de gehele waterkolom (Fig. 3d).Lokaal vormen ze 6% van de mariene microbiële gemeenschap, waardoor ze een belangrijk onderdeel vormen van het mondiale mariene microbioom.Bovendien vonden we het relatieve gehalte aan Ca.Eudormicrobiaceae-soorten en hun BGC-expressieniveaus waren het hoogst in de eukaryotische verrijkte fractie (Fig. 3c en uitgebreide gegevens, Fig. 7), hetgeen wijst op een mogelijke interactie met fijn stof, inclusief plankton.Deze waarneming vertoont enige gelijkenis met 'Ca.Eudoremicrobium BGC's die cytotoxische natuurlijke producten produceren via bekende routes kunnen roofzuchtig gedrag vertonen (aanvullende informatie en uitgebreide gegevens, figuur 8), vergelijkbaar met andere roofdieren die specifiek metabolieten produceren zoals Myxococcus41.Ontdekking van Ca.Eudormicrobiaceae in minder beschikbare (diepe oceaan) of eukaryotische in plaats van prokaryotische monsters zou kunnen verklaren waarom deze bacteriën en hun onverwachte BGC-diversiteit onduidelijk blijven in de context van onderzoek naar natuurlijke voeding.
Uiteindelijk probeerden we de belofte van ons microbioomgebaseerde werk bij het ontdekken van nieuwe routes, enzymen en natuurlijke producten experimenteel te valideren.Van de verschillende klassen van BGC's is bekend dat de RiPP-route codeert voor een rijke chemische en functionele diversiteit als gevolg van verschillende post-translationele modificaties van het kernpeptide door volwassen enzymen42.Dus kozen we voor twee 'Ca.De RiPP BGC's van Eudoremicrobium (figuren 3b en 4a-e) zijn gebaseerd op hetzelfde als elke bekende BGC (\(\bar{d}\)MIBiG en \(\bar{d}\)RefSeq boven 0,2).
a – c, In vitro heterologe expressie en in vitro enzymatische testen van een nieuw (\(\bar{d}\)RefSeq = 0,29) cluster van RiPP-biosynthese specifiek voor diepzee Ca-soorten.E. malaspinii' leidde tot de productie van gedifosforyleerde producten.c, modificaties geïdentificeerd met behulp van MS/MS met hoge resolutie (HR) (fragmentatie aangegeven door b- en y-ionen in de chemische structuur) en NMR (uitgebreide gegevens, figuur 9).d, dit gefosforyleerde peptide vertoont een lage micromolaire remming van neutrofiele elastase van zoogdieren, die niet wordt aangetroffen in het controlepeptide en het dehydraterende peptide (door chemische verwijdering geïnduceerde dehydratie).Het experiment werd drie keer herhaald met vergelijkbare resultaten.De heterologe expressie van een tweede nieuwe \(\bar{d}\)RefSeq = 0,33) cluster van eiwitbiosynthese verheldert bijvoorbeeld de functie van vier volwassen enzymen die het kernpeptide van 46 aminozuren modificeren.Residuen worden gekleurd op basis van de plaats van modificatie voorspeld door HR-MS/MS, isotopenlabeling en NMR-analyse (aanvullende informatie).Gestippelde kleuring geeft aan dat de modificatie plaatsvindt bij een van de twee residuen.De figuur is een compilatie van talrijke heterologe constructen om de activiteit van alle volwassen enzymen op dezelfde kern te tonen.h, Illustratie van NMR-gegevens voor N-methylering van hoofdketenamide.De volledige resultaten worden getoond in Fig.10 met uitgebreide gegevens.i, fylogenetische positie van het volwassen FkbM-eiwitcluster-enzym tussen alle FkbM-domeinen gevonden in de MIBiG 2.0-database onthult een enzym van deze familie met N-methyltransferase-activiteit (aanvullende informatie).Schematische diagrammen van BGC's (a, e), precursorpeptidestructuren (b, f) en vermeende chemische structuren van natuurlijke producten (c, g) worden getoond.
De eerste RiPP-route (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) werd alleen gevonden in diepzeesoorten “Ca.E. malaspinii” en codes voor Peptide-precursor (Fig. 4a, b).In dit volwassen enzym hebben we een enkel functioneel domein geïdentificeerd dat homoloog is aan het dehydratatiedomein van lantipeptidesynthase dat normaal gesproken fosforylatie en daaropvolgende verwijdering van 43 katalyseert (aanvullende informatie).Daarom voorspellen we dat de modificatie van het precursorpeptide een dergelijke tweestaps-dehydratatie met zich meebrengt.Met behulp van tandemmassaspectrometrie (MS / MS) en nucleaire magnetische resonantiespectroscopie (NMR) identificeerden we echter een polygefosforyleerd lineair peptide (Fig. 4c).Hoewel onverwacht, hebben we verschillende bewijzen gevonden die ondersteunen dat het het eindproduct is: twee verschillende heterologe gastheren en geen dehydratie in in vitro testen, identificatie van sleutelresiduen die zijn gemuteerd op de katalytische dehydratatieplaats van het volwassen enzym.allemaal gereconstrueerd door "Ca".Het E. malaspinii-genoom (uitgebreide gegevens, figuur 9 en aanvullende informatie) en, ten slotte, de biologische activiteit van het gefosforyleerde product, maar niet de chemisch gesynthetiseerde gedehydrateerde vorm (figuur 4d).In feite hebben we ontdekt dat het een lage micromolaire protease-remmende activiteit vertoont tegen neutrofiele elastase, vergelijkbaar met andere verwante natuurlijke producten in het concentratiebereik (IC50 = 14,3 μM) 44, ondanks het feit dat de ecologische rol nog moet worden opgehelderd.Op basis van deze resultaten stellen wij voor om de route “fosfeptine” te noemen.
Het tweede geval is een complexe RiPP-route die specifiek is voor 'Ca.Er werd voorspeld dat het geslacht Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) codeert voor natuurlijke eiwitproducten (Fig. 4e).Deze routes zijn van bijzonder biotechnologisch belang vanwege de verwachte dichtheid en verscheidenheid aan ongebruikelijke chemische modificaties die tot stand worden gebracht door de enzymen die worden gecodeerd door de relatief korte BGC's45.We ontdekten dat dit eiwit verschilt van eerder gekarakteriseerde eiwitten doordat het zowel het belangrijkste NX5N-motief van polyceramiden als de lanthionine-lus van landornamides mist 46 .Om de beperkingen van gemeenschappelijke heterologe expressiepatronen te overwinnen, hebben we ze samen met een aangepast Microvirgula aerodenitrificans-systeem gebruikt om vier volwassen route-enzymen (methoden) te karakteriseren.Met behulp van een combinatie van MS/MS, isotooplabeling en NMR hebben we deze volwassen enzymen gedetecteerd in de kern van 46 aminozuren van het peptide (Fig. 4f, g, uitgebreide gegevens, Figuren 10-12 en aanvullende informatie).Onder de volwassen enzymen karakteriseerden we de eerste verschijning van een FkbM O-methyltransferase-familielid 47 in de RiPP-route en ontdekten we onverwachts dat dit volwassen enzym N-methylering van de ruggengraat introduceert (Fig. 4h, i en aanvullende informatie).Hoewel deze modificatie bekend is in natuurlijke NRP48-producten, is enzymatische N-methylering van amidebindingen een complexe maar biotechnologisch significante reactie die tot nu toe van belang is geweest voor de RiPP-familie van borosines.Specificiteit 50,51.De identificatie van deze activiteit in andere families van enzymen en RiPP kan nieuwe toepassingen openen en de functionele diversiteit van eiwitten 52 en hun chemische diversiteit vergroten.Op basis van de geïdentificeerde wijzigingen en de ongebruikelijke lengte van de voorgestelde productstructuur stellen we een routenaam “pythonamide” voor.
De ontdekking van een onverwachte enzymologie in een functioneel gekarakteriseerde familie van enzymen illustreert de belofte van omgevingsgenomica voor nieuwe ontdekkingen, en illustreert ook het beperkte vermogen tot functionele gevolgtrekking op basis van alleen sequentiehomologie.Samen met rapporten over niet-canonieke bioactieve polygefosforyleerde RiPP's tonen onze resultaten dus de hulpbronnenintensieve maar cruciale waarde aan voor inspanningen in de synthetische biologie om de functionele rijkdom, diversiteit en ongebruikelijke structuren van biochemische verbindingen volledig bloot te leggen.
Hier demonstreren we het bereik van biosynthetisch potentieel gecodeerd door microben en hun genomische context in het mondiale mariene microbioom, waardoor toekomstig onderzoek wordt vergemakkelijkt door de resulterende hulpbron beschikbaar te stellen aan de wetenschappelijke gemeenschap (https://microbiomics.io/ocean/).We ontdekten dat veel van de fylogenetische en functionele nieuwigheid ervan alleen kan worden verkregen door het reconstrueren van MAG's en SAG's, vooral in onderbenutte microbiële gemeenschappen die toekomstige bioprospectie-inspanningen zouden kunnen sturen.Hoewel we ons hier zullen concentreren op 'Ca.Eudormicrobiaceae” als een afstammingslijn die vooral biosynthetisch “getalenteerd” is, coderen veel van de BGC’s die voorspeld zijn in de onontdekte microbiota waarschijnlijk voor voorheen onbeschreven enzymologieën die verbindingen opleveren met ecologische en/of biotechnologisch significante acties.
Metagenomische datasets van grote oceanografische en tijdreeksstudies met voldoende sequentiediepte werden opgenomen om de dekking van mondiale mariene microbiële gemeenschappen in oceaanbekkens, diepe lagen en in de loop van de tijd te maximaliseren.Deze datasets (aanvullende tabel 1 en figuur 1) omvatten metagenomica van monsters verzameld in de oceanen van Tara (viraal verrijkt, n=190; prokaryotisch verrijkt, n=180) en de BioGEOTRACES-expeditie (n=480).Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 en de Malaspina-expeditie (n = 58)23.Sequencing-lezingen van alle metagenomische fragmenten werden gefilterd op kwaliteit met behulp van BBMap (v.38.71) door sequencing-adapters uit reads te verwijderen, reads te verwijderen die waren toegewezen aan kwaliteitscontrolesequenties (PhiX-genomen), en door trimq = 14 te gebruiken, negeert maq = 20 slechte leeskwaliteit, maxns = 0 en minlength = 45. Daaropvolgende analyses werden uitgevoerd of samengevoegd met QC-lezingen, indien gespecificeerd (bbmerge.sh minoverlap=16).QC-metingen werden genormaliseerd (bbnorm.sh target = 40, mind Depth = 0) voorafgaand aan het bouwen met behulp van metaSPAdes (v.3.11.1 of v.3.12 indien nodig)53.De resulterende scaffold-contigs (hierna scaffolds genoemd) werden uiteindelijk gefilterd op lengte (> 1 kb).
De 1038 metagenomische monsters werden in groepen verdeeld en voor elke groep monsters werden de metagenomische kwaliteitscontrolewaarden van alle monsters aan de haakjes van elk monster afzonderlijk gekoppeld, wat resulteerde in het volgende aantal paarsgewijs tussen haakjes geplaatste groepslezingen: Tara Marine Viruses – Enriched (190×190), Prokaryoten verrijkt (180×180), BioGEOTRACES, HOT en BATS (610×610) en Malaspina (58×58).Het in kaart brengen werd gedaan met behulp van Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, waarmee metingen kunnen worden gekoppeld aan secundaire locaties (met behulp van de vlag -a).Uitlijningen werden gefilterd om ten minste 45 basen lang te zijn, een identiteit van ≥97% te hebben en een bereik van ≥80% te hebben.De resulterende BAM-bestanden werden verwerkt met behulp van het jgi_summarize_bam_contig_ Depths-script voor MetaBAT2 (v.2.12.1)55 om voor elke groep intra- en inter-sample dekking te bieden.Ten slotte werden haakjes gegroepeerd om de gevoeligheid te vergroten door MetaBAT2 individueel uit te voeren op alle monsters met –minContig 2000 en –maxEdges 500. We gebruiken MetaBAT2 in plaats van een ensemble-bokser, omdat in onafhankelijke tests is aangetoond dat dit de meest effectieve enkele bokser is.en 10 tot 50 keer sneller dan andere veelgebruikte boksers57.Om het effect van correlaties in overvloed te testen, gebruikte een willekeurig geselecteerde substeekproef van metagenomica (10 voor elk van de twee Tara Ocean-datasets, 10 voor BioGEOTRACES, 5 voor elke tijdreeks en 5 voor Malaspina) bovendien alleen monsters.Interne monsters worden gegroepeerd om dekkingsinformatie te verkrijgen.(Extra informatie).
Bij de daaropvolgende analyse werden aanvullende (externe) genomen betrokken, namelijk 830 handmatig geselecteerde MAG's uit een subset van de Tara Oceans26-dataset, 5287 SAG's uit de GORG20-dataset en gegevens uit de MAR-database (MarDB v. 4) uit 1707 geïsoleerde REF's en 682 SAGs) 27. Voor de MarDB-dataset worden genomen geselecteerd op basis van beschikbare metadata als het monstertype overeenkomt met de volgende reguliere expressie: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] geïsoleerd'.
De kwaliteit van elke metagenomische container en externe genomen werd beoordeeld met behulp van CheckM (v.1.0.13) en Anvi'o's Lineage Workflow (v.5.5.0)58,59.Als CheckM of Anvi'o ≥50% volledigheid/volledigheid en ≤10% besmetting/redundantie rapporteert, bewaar dan metagenomische cellen en externe genomen voor latere analyse.Deze scores werden vervolgens gecombineerd in gemiddelde volledigheid (mcpl) en gemiddelde besmetting (mctn) om de genoomkwaliteit als volgt te classificeren volgens gemeenschapscriteria60: hoge kwaliteit: mcpl ≥ 90% en mctn ≤ 5%;goede kwaliteit: mcpl ≥ 70%, mctn ≤ 10%, gemiddelde kwaliteit: mcpl ≥ 50% en mctn ≤ 10%, redelijke kwaliteit: mcpl ≤ 90% of mctn ≥ 10%.De gefilterde genomen werden vervolgens als volgt gecorreleerd met kwaliteitsscores (Q en Q'): Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabiliteit van de stam)/100 + 0,5 x log[N50] .(geïmplementeerd in dRep61).
Om vergelijkende analyse tussen verschillende gegevensbronnen en genoomtypen (MAG, SAG en REF) mogelijk te maken, werd met behulp van dRep (v.2.5.4) van 34.799 genomen de referentie verwijderd op basis van genoombrede gemiddelde nucleotide-identiteit (ANI).Herhalingen)61 met 95% ANI-drempels28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) en markergenen voor één kopie die SpecI63 gebruiken en zorgen voor genoomclustering op soortniveau.Voor elk dRep-cluster werd een representatief genoom geselecteerd volgens de hierboven gedefinieerde maximale kwaliteitsscore (Q'), die als representatief voor de soort werd beschouwd.
Om de mappingsnelheid te evalueren, werd BWA (v.0.7.17-r1188, -a) gebruikt om alle 1038 sets metagenomische metingen in kaart te brengen met 34.799 genomen in de OMD.Kwaliteitsgecontroleerde metingen werden in kaart gebracht in de single-ended-modus en de resulterende uitlijningen werden gefilterd om alleen uitlijningen met een lengte van ≥45 bp te behouden.en identiteit ≥95%.De weergaveverhouding voor elk monster is het percentage metingen dat overblijft na filtratie, gedeeld door het totale aantal kwaliteitscontrolemetingen.Met behulp van dezelfde aanpak werd elk van de 1038 metagenomen teruggebracht tot 5 miljoen inserts (uitgebreide gegevens, figuur 1c) en gekoppeld aan GORG SAG in OMD en in alle GEM16.De hoeveelheid MAG's die in de GEM16-catalogus uit zeewater werd teruggevonden, werd bepaald door trefwoordquery's van metagenomische bronnen, waarbij zeewatermonsters werden geselecteerd (bijvoorbeeld in tegenstelling tot mariene sedimenten).Concreet selecteren we “aquatisch” als “ecosysteem_categorie”, “marien” als “ecosysteem_type” en filteren we “habitat” als “diepe oceaan”, “marien”, “maritiem oceanisch”, “pelagische zee”, “zeewater”, “Oceaan”, “Zeewater”, “Oppervlakte-zeewater”, “Oppervlakte-zeewater”.Dit resulteerde in 5903 MAG’s (734 hoge kwaliteit) verdeeld over 1823 OTU’s (bekijk hier).
Prokaryotische genomen werden taxonomisch geannoteerd met behulp van GTDB-Tk (v.1.0.2)64 met standaardparameters gericht op GTDB r89 versie 13. Anvi'o werd gebruikt om eukaryote genomen te identificeren op basis van domeinvoorspelling en -herinnering ≥50% en redundantie ≤ 10%.De taxonomische annotatie van een soort wordt gedefinieerd als een van zijn representatieve genomen.Met uitzondering van eukaryoten (148 MAG), werd elk genoom eerst functioneel geannoteerd met behulp van prokka (v.1.14.5)65, waarbij volledige genen werden benoemd en waar nodig ‘archaea’- of ‘bacteriën’-parameters werden gedefinieerd, wat ook wordt gerapporteerd voor niet- coderende genen.en CRISPR-regio's, naast andere genomische kenmerken.Annoteer voorspelde genen door universele single-copy markergenen (uscMG) te identificeren met behulp van fetchMG (v.1.2)66, orthologe groepen toe te wijzen en te vragen met behulp van emapper (v.2.0.1)67 op basis van eggNOG (v.5.0)68.KEGG-database (gepubliceerd op 10 februari 2020) 69. De laatste stap werd uitgevoerd door eiwitten te matchen met de KEGG-database met behulp van DIAMOND (v.0.9.30) 70 met een zoekopdracht en onderwerpdekking van ≥70%.De resultaten werden verder gefilterd volgens NCBI Prokaryotische Genome Annotation Pipeline71 op basis van bitrate ≥ 50% van de maximaal verwachte bitrate (link zelf).Gensequenties werden ook gebruikt als input om BGC's in het genoom te identificeren met behulp van antiSMASH (v.5.1.0)72 met standaardparameters en verschillende clusterexplosies.Alle genomen en annotaties zijn in OMD verzameld, samen met contextuele metadata die beschikbaar zijn op internet (https://microbiomics.io/ocean/).
Vergelijkbaar met eerder beschreven methoden12,22 hebben we CD-HIT (v.4.8.1) gebruikt om >56,6 miljoen eiwitcoderende genen uit bacteriële en archaeale genomen van OMD te clusteren in 95% identiteit en kortere genen (90% dekking)73 tot >17,7 miljoen genenclusters.De langste sequentie werd gekozen als het representatieve gen voor elk gencluster.De 1038 metagenomen werden vervolgens gekoppeld aan >17,7 miljoen BWA (-a) clusterleden en de resulterende BAM-bestanden werden gefilterd om alleen uitlijningen met ≥95% procent identiteit en ≥45 basisuitlijningen te behouden.De lengte-genormaliseerde genenabundantie werd berekend door eerst inserts van de beste unieke uitlijning te tellen en vervolgens, voor fuzzy-mapped inserts, fractionele tellingen toe te voegen aan de overeenkomstige doelgenen evenredig aan hun aantal unieke inserts.
De genomen van de uitgebreide OMD (met extra MAG's van "Ca. Eudormicrobiaceae", zie hieronder) werden toegevoegd aan de mOTUs74-database voor metagenomische analysetools (v.2.5.1) om een ​​uitgebreide mOTU-referentiedatabase te creëren.Slechts zes genomen met één kopie (23.528 genomen) overleefden van de tien uscMG's.De uitbreiding van de database resulteerde in 4.494 extra clusters op soortniveau.1038 metagenomen werden geanalyseerd met behulp van standaard mOTU-parameters (v.2).Een totaal van 989 genomen in 644 mOTU-clusters (95% REF, 5% SAG en 99,9% behorend tot MarDB) werd niet gedetecteerd door het mOTU-profiel.Dit weerspiegelt verschillende aanvullende bronnen van mariene isolatie van de MarDB-genomen (de meeste niet-gedetecteerde genomen worden geassocieerd met organismen geïsoleerd uit sedimenten, mariene gastheren, enz.).Om ons in dit onderzoek te blijven concentreren op de open oceaanomgeving, hebben we ze uitgesloten van de stroomafwaartse analyse, tenzij ze werden gedetecteerd of opgenomen in de uitgebreide mOTU-database die in dit onderzoek was gemaakt.
Alle BGC's van MAG, SAG en REF in OMD (zie hierboven) werden gecombineerd met BGC's geïdentificeerd in alle metagenomische scaffolds (antiSMASH v.5.0, standaardparameters) en gekarakteriseerd met behulp van BiG-SLICE (v.1.1) (PFAM-domein) .Op basis van deze kenmerken hebben we alle cosinusafstanden tussen BGC's berekend en deze gegroepeerd (gemiddelde koppelingen) in GCF en GCC met behulp van afstandsdrempels van respectievelijk 0,2 en 0,8.Deze drempels zijn een aanpassing van drempels die eerder werden gebruikt met behulp van Euclidische afstand samen met cosinusafstand, wat een deel van de fout in de oorspronkelijke BiG-SLICE-clusterstrategie verlicht (aanvullende informatie).
BGC's werden vervolgens gefilterd om slechts ≥5 kb gecodeerd op steigers te behouden om het risico op fragmentatie te verminderen zoals eerder beschreven en om MarDB REF's en SAG's uit te sluiten die niet in 1038 metagenomen voorkomen (zie hierboven).Dit resulteerde in een totaal van 39.055 BGC's die werden gecodeerd door het OMD-genoom, terwijl nog eens 14.106 werden geïdentificeerd op metagenomische fragmenten (dwz niet gecombineerd in MAG's).Deze "metagenomische" BGC's werden gebruikt om het aandeel van het biosynthesepotentieel van het mariene microbioom te schatten dat niet in de database was vastgelegd (aanvullende informatie).Elke BGC werd functioneel gekarakteriseerd volgens voorspellende producttypen gedefinieerd door anti-SMASH of grovere productcategorieën gedefinieerd in BiG-SCAPE76.Om steekproefvertekening bij de kwantificering (taxonomische en functionele samenstelling van GCC/GCF, afstand van GCF en GCC tot referentiedatabases en metagenomische overvloed van GCF) te voorkomen, door voor elke soort alleen de langste BGC per GCF te behouden, werden 39.055 BGC's verder ontdubbeld, wat resulteerde in een totaal van 17.689 BGC.
De nieuwheid van GCC en GCF werd beoordeeld op basis van de afstand tussen de berekende database (RefSeq-database in BiG-FAM) en de experimenteel geverifieerde (MIBIG 2.0) BGC.Voor elk van de 17.689 representatieve BGC's kozen we de kleinste cosinusafstand tot de respectieve database.Deze minimumafstanden worden vervolgens gemiddeld (gemiddeld) volgens GCF of GCC, al naar gelang van toepassing.Een GCF wordt als nieuw beschouwd als de afstand tot de database groter is dan 0,2, wat overeenkomt met een ideale scheiding tussen de (gemiddelde) GCF en de referentie.Voor GCC kiezen we 0,4, wat twee keer de drempel is die door GCF is gedefinieerd, om een ​​langetermijnrelatie met links vast te leggen.
De metagenomische overvloed van BGC werd geschat als de gemiddelde overvloed van zijn biosynthetische genen (zoals bepaald door anti-SMASH) beschikbaar op basis van profielen op genniveau.De metagenomische overvloed van elke GCF of GCC werd vervolgens berekend als de som van representatieve BGC's (van de 17.689).Deze overvloedkaarten werden vervolgens genormaliseerd voor cellulaire samenstelling met behulp van de mOTU-telling per monster, die ook verantwoordelijk was voor sequencing-inspanningen (uitgebreide gegevens, figuur 1d).De prevalentie van GCF of GCC werd berekend als het percentage monsters met een overvloed > 0.
De Euclidische afstand tussen monsters werd berekend op basis van het genormaliseerde GCF-profiel.Deze afstanden werden verkleind met behulp van UMAP77 en de resulterende inbedding werd gebruikt voor ongecontroleerde, op dichtheid gebaseerde clustering met behulp van HDBSCAN78.Het optimale minimumaantal punten voor een cluster (en dus het aantal clusters) dat door HDBSCAN wordt gebruikt, wordt bepaald door de cumulatieve waarschijnlijkheid van clusterlidmaatschap te maximaliseren.De geïdentificeerde clusters (en een willekeurig gebalanceerde substeekproef van deze clusters om rekening te houden met bias in permutationele multivariate variantieanalyse (PERMANOVA)) werden getest op significantie ten opzichte van niet-gereduceerde Euclidische afstanden met behulp van PERMANOVA.De gemiddelde genoomgrootte van de monsters werd berekend op basis van de relatieve overvloed aan mOTU en de geschatte genoomgrootte van de leden van de genomen.In het bijzonder werd de gemiddelde genoomgrootte van elke mOTU geschat als het gemiddelde van de genoomgroottes van zijn leden, gecorrigeerd voor volledigheid (na filtering) (een 75% compleet genoom met een lengte van 3 Mb heeft bijvoorbeeld een aangepaste grootte van 4 Mb). MB).voor middelgrote genomen met integriteit ≥70%.De gemiddelde genoomgrootte voor elk monster werd vervolgens berekend als de som van de mOTU-genoomgroottes, gewogen naar relatieve overvloed.
Een gefilterde reeks genoomgecodeerde BGC's in de OMD wordt getoond in bacteriële en archaeale GTDB-bomen (in raamwerken van ≥5 kb, met uitzondering van REF en SAG MarDB die niet worden aangetroffen in 1038 metagenomen, zie hierboven) en hun voorspelde productcategorieën op basis van de fylogenetische positie van het genoom (zie hierboven).We hebben eerst de gegevens per soort teruggebracht, waarbij we het genoom met de meeste BGC's in die soort als representatief hebben gebruikt.Voor visualisatie werden de vertegenwoordigers verder onderverdeeld in boomgroepen, en opnieuw werd voor elke celclade het genoom met het grootste aantal BGC's als vertegenwoordiger geselecteerd.Met BGC verrijkte soorten (ten minste één genoom met> 15 BGC's) werden verder geanalyseerd door de Shannon Diversity Index te berekenen voor de producttypen gecodeerd in die BGC's.Als alle voorspelde producttypen hetzelfde zijn, worden chemische hybriden en andere complexe BGC’s (zoals voorspeld door anti-SMAH) geacht tot hetzelfde producttype te behoren, ongeacht hun volgorde in het cluster (bijv. eiwit-bacteriocine en bacteriocine-proteoproteïnefusie). lichaam).hybride).
Resterend DNA (naar schatting 6 ng) van Malaspina-monster MP1648, overeenkomend met biologisch monster SAMN05421555 en gekoppeld aan Illumina SRR3962772 metagenomische leesset voor kort lezen, verwerkt volgens PacBio-sequencingprotocol met ultralage input voor gebruik van PacBio-kit SMRTbell gDNA-monsteramplificatie kit (100-980-000) en SMRTbell Express 2.0 sjabloonvoorbereidingskit (100-938-900).In het kort werd het resterende DNA geknipt, gerepareerd en gezuiverd (ProNex-kralen) met behulp van Covaris (g-TUBE, 52104).Gezuiverd DNA wordt vervolgens onderworpen aan bibliotheekvoorbereiding, amplificatie, zuivering (ProNex-kralen) en grootteselectie (>6 kb, Blue Pippin) vóór een laatste zuiveringsstap (ProNex-kralen) en sequencing op het Sequel II-platform.
Reconstructie van de eerste twee ca.Voor MAG Eremiobacterota hebben we zes extra ANI's >99% geïdentificeerd (deze zijn opgenomen in Figuur 3), die aanvankelijk werden gefilterd op basis van besmettingsscores (later geïdentificeerd als genduplicaties, zie hieronder).We vonden ook een dienblad met het opschrift "Ca".Eremiobacterota” uit verschillende onderzoeken23 en gebruikte ze samen met acht MAG’s uit onze studie als referentie voor metagenomische metingen van 633 eukaryotisch verrijkte (>0,8 µm) monsters met behulp van BWA (v.0.7.17) Ref -r1188, – een vlag) voor downsampling mapping (5 miljoen lezingen).Op basis van verrijkingsspecifieke kaarten (gefilterd op 95% uitlijningsidentiteit en 80% leesdekking), werden 10 metagenomen (verwachte dekking ≥5×) geselecteerd voor assemblage en nog eens 49 metagenomen (verwachte dekking ≥1×) voor inhoudscorrelatie.Met behulp van dezelfde parameters als hierboven werden deze monsters weggegooid en werden 10 extra 'Ca's toegevoegd.MAG Eremiobacterota is hersteld.Deze 16 MAG's (de twee die al in de database staan ​​niet meegerekend) brengen het totale aantal genomen in de uitgebreide OMD op 34.815.MAG's krijgen taxonomische rangen toegewezen op basis van hun genomische gelijkenis en positie in de GTDB.18 MAG's werden gederepliceerd met behulp van dRep in 5 soorten (intraspecifieke ANI>99%) en 3 geslachten (intragenere ANI 85% tot 94%) binnen dezelfde familie79.Soortvertegenwoordigers werden handmatig geselecteerd op basis van integriteit, besmetting en N50.De voorgestelde nomenclatuur vindt u in de aanvullende informatie.
Beoordeel de integriteit en verontreiniging van 'Ca.MAG Eremiobacterota, hebben we de aanwezigheid van uscMG beoordeeld, evenals lijn- en domeinspecifieke markergensets met enkele kopie die worden gebruikt door CheckM en Anvi'o.De identificatie van 2 duplicaten van de 40 uscMG's werd bevestigd door fylogenetische reconstructie (zie hieronder) om elke mogelijke besmetting uit te sluiten (dit komt overeen met 5% op basis van deze 40 markergenen).Een aanvullende studie van vijf representatieve MAG's 'Ca.Het lage niveau van verontreinigingen in deze gereconstrueerde genomen werd bevestigd voor Eremiobacterota-soorten met behulp van de interactieve Anvi'o-interface op basis van correlaties van overvloed en sequentiesamenstelling (aanvullende informatie) .
Voor fylogenomische analyse hebben we vijf representatieve MAG's "Ca" geselecteerd.Eudormicrobiaceae”, alle soorten “Ca.Het genoom van Eremiobacterota en leden van andere phyla (waaronder UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria en Planctomycetota) is verkrijgbaar bij GTDB (r89)13.Al deze genomen werden geannoteerd zoals eerder beschreven voor genextractie van markers met één kopie en BGC-annotatie.De GTDB-genomen werden geconserveerd volgens de bovenstaande integriteits- en besmettingscriteria.Fylogenetische analyse werd uitgevoerd met behulp van de Anvi'o Phylogenetics59-workflow.De boom werd geconstrueerd met behulp van IQTREE (v.2.0.3) (standaardopties en -bb 1000) op een uitlijning van 39 tandem ribosomale eiwitten geïdentificeerd door Anvi'o (MUSCLE, v.3.8.1551)81.Zijn posities werden verkleind.om ten minste 50% van het genoom te dekken82 en Planctomycecota werd gebruikt als een outgroup op basis van de GTDB-boomtopologie.Er werd één boom van 40 uscMG's gebouwd met dezelfde tools en parameters.
We gebruikten Traitar (v.1.1.2) met standaardparameters (fenotype, van nucleotiden) om gemeenschappelijke microbiële eigenschappen te voorspellen.We hebben een potentiële roofzuchtige levensstijl onderzocht op basis van een eerder ontwikkelde roofzuchtige index84 die afhangt van de inhoud van een eiwitcoderend gen in het genoom.Concreet gebruiken we DIAMOND om eiwitten in het genoom te vergelijken met de OrthoMCL-database (v.4)85 met behulp van de opties –gevoeliger –id 25 –query-cover 70 –subject-cover 70 –top 20 EN tellen de genen die overeenkomen met de markergenen voor roofdieren en niet-roofdieren.De index is het verschil tussen het aantal roofzuchtige en niet-roofzuchtige markeringen.Als extra controle analyseerden we ook het "Ca" -genoom.De Entotheonella TSY118-factor is gebaseerd op de associatie met Ca.Eudoremicrobium (grote genoomomvang en biosynthetisch potentieel).Vervolgens hebben we potentiële verbanden getest tussen markergenen van roofdieren en niet-roofdieren en het biosynthetische potentieel van Ca.Eudormicrobiaceae” en ontdekte dat niet meer dan één gen (van welk type markergen dan ook, dat wil zeggen roofdier/niet-roofdiergen) overlapt met BGC, wat erop wijst dat BGC predatiesignalen niet verwart.Aanvullende genomische annotatie van gecodeerde replicons werd uitgevoerd met behulp van TXSSCAN (v.1.0.2) om specifiek het secretiesysteem, pili en flagella te onderzoeken.
Vijf representatieve 'Ca's werden in kaart gebracht door 623 metatranscriptomen uit de prokaryotische en eukaryotische verrijkingsfracties van de Tara-oceanen in kaart te brengen (met behulp van BWA, v.0.7.17-r1188, -a vlag).Eudormicrobiaceae-genoom.BAM-bestanden werden verwerkt met FeatureCounts (v.2.0.1)88 na 80% leesdekking en 95% identiteitsfiltering (met opties featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Telt de aantal inserts per gen.De gegenereerde kaarten werden genormaliseerd voor genlengte en markergen-abundantie mOTU (lengte-genormaliseerde gemiddelde insertietelling voor genen met insertietelling> 0) en log-getransformeerd naar 22,74 om de relatieve expressie per cel van elk genniveau te verkrijgen, wat ook de variabiliteit van monster tot monster tijdens sequencing.Dergelijke verhoudingen maken vergelijkende analyses mogelijk, waardoor samenstellingsproblemen worden verminderd bij het gebruik van gegevens over relatieve overvloed.Alleen monsters met> 5 van de 10 mOTU-markergenen kwamen in aanmerking voor verdere analyse om een ​​voldoende groot deel van het genoom te kunnen detecteren.
Het genormaliseerde transcriptoomprofiel van 'Ca.E. taraoceanii werd onderworpen aan dimensionaliteitsreductie met behulp van UMAP en de resulterende representatie werd gebruikt voor onbewaakte clustering met behulp van HDBSCAN (zie hierboven) om de expressiestatus te bepalen.PERMANOVA test de significantie van verschillen tussen geïdentificeerde clusters in de oorspronkelijke (niet verkleinde) afstandsruimte.Differentiële expressie tussen deze aandoeningen werd over het hele genoom getest (zie hierboven) en 201 KEGG-routes werden geïdentificeerd in 6 functionele groepen, namelijk: BGC, secretiesysteem- en flagellaire genen van TXSSCAN, afbraakenzymen (protease en peptidasen), en roofzuchtige en niet- roofzuchtige genen.roofzuchtige indexmarkeringen.Voor elk monster berekenden we de mediaan genormaliseerde expressie voor elke klasse (merk op dat de BGC-expressie zelf wordt berekend als de mediaan expressie van biosynthetische genen voor die BGC) en getest op significantie tussen staten (Kruskal-Wallis-test aangepast voor FDR).
Synthetische genen werden gekocht bij GenScript en PCR-primers werden gekocht bij Microsynth.Voor DNA-amplificatie werd Phusion-polymerase van Thermo Fisher Scientific gebruikt.Voor DNA-zuivering werden NucleoSpin-plasmiden, NucleoSpin-gel en PCR-zuiveringskit van Macherey-Nagel gebruikt.Restrictie-enzymen en T4 DNA-ligase werden gekocht bij New England Biolabs.Andere chemicaliën dan isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) en 1,4-dithiothreitol (DTT, AppliChem) werden gekocht bij Sigma-Aldrich en zonder verdere zuivering gebruikt.De antibiotica chlooramfenicol (Cm), spectinomycine dihydrochloride (Sm), ampicilline (Amp), gentamicine (Gt) en carbenicilline (Cbn) werden gekocht bij AppliChem.Mediacomponenten Bacto Tryptone en Bacto Yeast Extract werden gekocht bij BD Biosciences.Trypsine voor sequencing werd gekocht bij Promega.
Gensequenties werden geëxtraheerd uit anti-SMASH voorspelde BGC 75,1.E. malaspinii (aanvullende informatie).
De genen embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4) en embAM (inclusief intergene regio's) werden gesequenced als synthetische constructen in pUC57 (AmpR) met en zonder codons geoptimaliseerd voor expressie in E wanneer.Het embA-gen werd gesubkloneerd in de eerste meervoudige kloneringsplaats (MCS1) van pACYCDuet-1(CmR) en pCDFDuet-1(SmR) met BamHI- en HindIII-splitsingsplaatsen.De embM- en embMopt-genen (codon-geoptimaliseerd) werden gesubkloneerd in MCS1 pCDFDuet-1 (SmR) met BamHI en HindIII en geplaatst in de tweede meervoudige kloonplaats van pCDFDuet-1 (SmR) en pRSFDuet-1 (KanR) (MCS2) met NdeI/ChoI.De embAM-cassette werd gesubkloneerd in pCDFDuetl(SmR) met BamHI- en HindIII-splitsingsplaatsen.Het orf3 / embI-gen (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) werd geconstrueerd door overlap-extensie-PCR met behulp van primers EmbI_OE_F_NdeI en EmbI_OE_R_XhoI, gedigereerd met NdeI / XhoI en geligeerd in pCDFDuet-1-EmbM (MCS1) met behulp van dezelfde restrictie-enzymen (aanvullende tafel).6).Restrictie-enzymdigestie en ligatie werden uitgevoerd volgens het protocol van de fabrikant (New England Biolabs).

 


Posttijd: 14 maart 2023