Köszönjük, hogy meglátogatta a Nature.com oldalt.Olyan böngészőverziót használ, amely korlátozott CSS-támogatással rendelkezik.A legjobb élmény érdekében javasoljuk, hogy használjon frissített böngészőt (vagy tiltsa le a kompatibilitási módot az Internet Explorerben).Ezenkívül a folyamatos támogatás érdekében stílusok és JavaScript nélkül jelenítjük meg az oldalt.
Diánként három cikket mutató csúszkák.Használja a vissza és a következő gombokat a diák közötti mozgáshoz, vagy a végén lévő diavezérlő gombokat az egyes diák közötti mozgáshoz.
Részletes termékleírás
304 Rozsdamentes acél hegesztett tekercses cső/cső
1. Leírás: Rozsdamentes acél tekercscső / cső
2. Típus: hegesztett vagy varrat nélküli
3. Szabvány: ASTM A269, ASTM A249
4. Rozsdamentes acél tekercscső külső átmérője: 6–25,4 mm
5. Hossz: 600-3500MM vagy az ügyfél igényei szerint.
6. Falvastagság: 0,2-2,0 mm.
7. Tűrés: OD: +/-0,01mm;Vastagság: +/-0,01%.
8. A tekercs belső furat mérete: 500-1500 mm (az ügyfél igényei szerint állítható)
9. Tekercs magasság: 200-400 mm (az ügyfél igényei szerint állítható)
10. Felület: Világos vagy lágyított
11. Anyag: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, ötvözet 625, 825, 2205, 2507 stb.
12. Csomagolás: szövött zacskók fa tokban, fa raklap, fa nyél, vagy az ügyfél igényei szerint
13. Vizsgálat: kémiai komponens, folyáshatár, szakítószilárdság, keménységmérés
14. Garancia: A harmadik fél (például :SGS TV ) ellenőrzése stb.
15. Alkalmazás: dekoráció, bútor, olajszállítás, hőcserélő, korlátgyártás, papírgyártás, autó, élelmiszer-feldolgozás, orvosi stb.
A rozsdamentes acél összes kémiai összetétele és fizikai tulajdonságai az alábbiak szerint:
Anyag | ASTM A269 Kémiai összetétel % Max | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | Megjegyzés | Nb | Ti | |
TP304 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 18,0-20,0 | 8,0-11,0 | ^ | ^ | ^ . | ^ |
TP304L | 0,035 | 2.00 | 0,045 | 0,030 | 1.00 | 18,0-20,0 | 8,0-12,0 | ^ | ^ | ^ | ^ |
TP316 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 16,0-18,0 | 10,0-14,0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0,035 D | 2.00 | 0,045 | 0,030 | 1.00 | 16,0-18,0 | 10,0-15,0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 17,0-19,0 | 9,0-12,0 | ^ | ^ | ^ | 5°C -0,70 |
TP347 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 17,0-19,0 | 9,0-12,0 | 10 °C -1,10 | ^ |
Anyag | Hőkezelés | Hőmérséklet F (C) Min. | Keménység | |
Brinell | Rockwell | |||
TP304 | Megoldás | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP304L | Megoldás | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP316 | Megoldás | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP316L | Megoldás | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP321 | Megoldás | 1900(1040) F | 192HBW/200HV | 90 HRB |
TP347 | Megoldás | 1900 (1040) | 192HBW/200HV | 90 HRB |
OD, hüvelyk | OD tűrés hüvelyk (mm) | WT tolerancia % | Hossz tűrés hüvelyk (mm) | |
+ | - | |||
≤ 1/2 | ± 0,005 ( 0,13 ) | ± 15 | 1/8 ( 3,2 ) | 0 |
> 1/2 ~1 1/2 | ± 0,005(0,13) | ± 10 | 1/8 (3,2) | 0 |
> 1 1/2 ~< 3 1/2 | ± 0,010 (0,25) | ± 10 | 3/16 (4,8) | 0 |
> 3 1/2 ~< 5 1/2 | ± 0,015 (0,38) | ± 10 | 3/16 (4,8) | 0 |
> 5 1/2 ~< 8 | ± 0,030(0,76) | ± 10 | 3/16 (4,8) | 0 |
8~< 12 | ± 0,040 (1,01) | ± 10 | 3/16 (4,8) | 0 |
12~< 14 | ± 0,050 (1,26) | ± 10 | 3/16 (4,8) | 0 |
A természetes mikrobiális közösségek filogenetikai és anyagcsere szempontjából változatosak.Ez a sokféleség az alulkutatott organizmuscsoportok1 mellett ökológiailag és biotechnológiailag jelentős enzimek és biokémiai vegyületek felfedezésére is gazdag lehetőséget rejt magában2,3.Ennek a sokféleségnek a tanulmányozása azonban az ilyen vegyületeket szintetizáló és a megfelelő gazdáikhoz kötődő genomiális útvonalak meghatározása érdekében továbbra is kihívást jelent.A mikroorganizmusok bioszintetikus potenciálja a nyílt óceánban továbbra is nagyrészt ismeretlen a teljes genomfelbontási adatok globális szintű elemzésének korlátai miatt.Itt az óceánban található bioszintetikus génklaszterek sokféleségét és sokféleségét kutatjuk úgy, hogy körülbelül 10 000 mikrobiális genomot integrálunk tenyésztett sejtekből és egyetlen sejtből több mint 25 000 újonnan rekonstruált genomvázlattal több mint 1000 tengervízmintából.Ezek az erőfeszítések körülbelül 40 000 feltételezett, többnyire új bioszintetikus génklasztert azonosítottak, amelyek közül néhányat korábban nem sejtett filogenetikai csoportokban találtak.Ezekben a populációkban azonosítottunk egy bioszintetikus génklaszterekben dúsított vonalat („Candidatus Eudormicrobiaceae”), amely egy nem tenyésztett bakteriális törzshez tartozott, és a bioszintetikusan legváltozatosabb mikroorganizmusokat tartalmazza ebben a környezetben.Ezek közül a foszfatáz-peptid és a pytonamid útvonalat jellemeztük, azonosítva a szokatlan bioaktív vegyületszerkezet és enzimológia eseteit.Összefoglalva, ez a tanulmány bemutatja, hogy a mikrobióm-alapú stratégiák hogyan tehetik lehetővé korábban nem leírt enzimek és természetes élelmiszerek feltárását egy rosszul ismert mikrobiotában és környezetben.
A mikrobák globális biogeokémiai ciklusokat hajtanak végre, táplálékhálózatot tartanak fenn, valamint a növények és állatok egészségét5.Óriási filogenetikai, metabolikus és funkcionális sokféleségük gazdag potenciált jelent új taxonok1, enzimek és biokémiai vegyületek, köztük természetes termékek6 felfedezésében.Az ökológiai közösségekben ezek a molekulák különféle élettani és ökológiai funkciókat látnak el a mikroorganizmusok számára, a kommunikációtól a versengésig 2, 7.Ezek a természetes termékek és genetikailag kódolt termelési útvonalaik eredeti funkciójukon túl biotechnológiai és terápiás alkalmazásokra is példát szolgáltatnak2,3.Az ilyen utak és kapcsolatok azonosítását nagyban megkönnyítette a tenyésztett mikrobák vizsgálata.A természetes környezet taxonómiai vizsgálatai azonban kimutatták, hogy a mikroorganizmusok túlnyomó többségét nem tenyésztették8.Ez a kulturális torzítás korlátozza azon képességünket, hogy kihasználjuk a sok mikroba által kódolt funkcionális sokféleséget4,9.
E korlátok leküzdése érdekében az elmúlt évtized technológiai fejlődése lehetővé tette a kutatók számára, hogy közvetlenül (azaz előzetes tenyésztés nélkül) teljes közösségekből (metagenomika) vagy egyetlen sejtből származó mikrobiális DNS-fragmenseket szekvenáljanak.Az a képesség, hogy ezeket a fragmenseket nagyobb genomfragmensekké állítsuk össze, és több metagenomikusan összeállított genomot (MAG) vagy egy amplifikált genomot (SAG) rekonstruáljunk, fontos lehetőséget nyit meg a mikrobiom (azaz a mikrobiális közösségek és a mikrobiom) taxocentrikus vizsgálatára.új utakat egyengetni.saját genetikai anyag adott környezetben) 10,11,12.Valójában a legújabb tanulmányok nagymértékben kibővítették a mikrobiális diverzitás filogenetikai reprezentációját a Földön1, 13 és feltárták az egyes mikrobiális közösségek funkcionális sokféleségét, amelyeket korábban nem fedtek le a tenyésztett mikroorganizmusok referencia genomszekvenciái (REF)14.Az a képesség, hogy a fel nem fedezett funkcionális diverzitást a gazdagenom kontextusába helyezzük (azaz a genom felbontása), kritikus fontosságú a még nem jellemzett mikrobiális vonalak előrejelzésében, amelyek feltehetően új természetes termékeket kódolnak15,16 vagy az ilyen vegyületek eredeti termelőjéig való visszakövetéséhez17.Például egy kombinált metagenomikus és egysejtes genomiális elemzési megközelítés a Candidatus Entotheonella azonosításához vezetett, amely az anyagcsere-ben gazdag szivacsos baktériumok csoportja, mint számos gyógyszerpotenciál termelője18.A változatos mikrobiális közösségek genomikai feltárására irányuló közelmúltbeli kísérletek ellenére16,19 azonban a Föld legnagyobb ökoszisztéma-óceánjának globális metagenomikai adatainak több mint kétharmada16,20 még mindig hiányzik.Így általában véve a tengeri mikrobiom bioszintetikus potenciálja és az új enzimatikus és természetes termékek tárházaként betöltött potenciálja továbbra is nagymértékben kevéssé tanulmányozott.
A tengeri mikrobiómák bioszintetikus potenciáljának globális szintű feltárása érdekében először egyesítettük a tenyészettől függő és nem tenyésztési módszerekkel nyert tengeri mikrobiális genomokat, hogy létrehozzuk a filogenetikai és génfunkciók kiterjedt adatbázisát.Ennek az adatbázisnak a vizsgálata sokféle bioszintetikus génklasztert (BGC) tárt fel, amelyek többsége még nem jellemzett génklaszter (GCF) családba tartozik.Ezenkívül azonosítottunk egy ismeretlen baktériumcsaládot, amely a mai napig a legnagyobb ismert BGC-féleséget mutatja a nyílt óceánban.Két riboszomális szintézis és poszttranszlációs módosult peptid (RiPP) útvonalat választottunk ki kísérleti validálásra a jelenleg ismert útvonalaktól való genetikai különbségeik alapján.Ezen útvonalak funkcionális jellemzése az enzimológia váratlan példáit, valamint szerkezetileg szokatlan proteázgátló aktivitású vegyületeket tárt fel.
Eleinte egy globális adatforrás létrehozását tűztük ki célul a genomelemzéshez, annak bakteriális és régészeti összetevőire összpontosítva.Ebből a célból 215 globálisan elosztott mintavételi helyről (szélességi tartomány = 141,6°) és több mélyrétegről (1-től 5600 m-ig, a nyílt tengeri, mezopelágikus és mélységi zónákat lefedő) metagenomikai adatokat és 1038 tengervízmintát gyűjtöttünk össze.Háttér21, 22, 23 (1a. ábra, bővített adatok, 1a. ábra és 1. kiegészítő táblázat).A széles földrajzi lefedettség mellett ezek a szelektíven szűrt minták lehetővé tették a tengeri mikrobiom különböző összetevőinek összehasonlítását, beleértve a vírusban gazdag (<0,2 µm), a prokariótákban gazdag (0,2–3 µm), a részecskegazdag (0,8 µm) összetevőket. ).–20 µm) és vírusmentesített (>0,2 µm) telepek.
a, A tengeri mikrobiális közösségek összesen 1038 nyilvánosan elérhető genomja (metagenomika), amelyet 215 globálisan elosztott helyről gyűjtöttek össze (62°S–79°N és 179°W–179°E).Térképlapok © Esri.Források: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ és Esri.b, ezeket a metagenomokat használtuk a MAG-ok (módszerek és kiegészítő információk) rekonstruálására, amelyek mennyiségben és minőségben (módszerek) különböznek az adatkészletekben (színnel jelölve).A rekonstruált MAG-okat nyilvánosan elérhető (külső) genomokkal egészítettük ki, beleértve a kézi MAG26-ot, SAG27-et és REF-et.27 Fordítsa le az OMD-t.c, a csak SAG (GORG)20 vagy MAG (GEM)16 alapú korábbi jelentésekhez képest az OMD kétszer-háromszor javítja a tengeri mikrobiális közösségek genomi jellemzését (metagenomikus olvasási térképezési sebesség; módszer), következetesebb mélység- és reprezentációval. szélességi kör..<0,2, n=151, 0,2–0,8, n=67, 0,2–3, n=180, 0,8–20, n=30, >0,2, n=610, <30°, n=132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, az OMD fajcsoportok szerinti csoportosítása (95%-os átlagos nukleotid azonosság) összesen hozzávetőleg 8300 faj, amelyeknek több mint felét korábban nem jellemezték taxonómiai annotációkkal a GTDB (89-es verzió) e segítségével, a fajok genomtípus szerinti osztályozása azt mutatta, hogy a MAG, a SAG és a REF jól kiegészítik egymást a filogenetikai diverzitásának tükrözésében. a tengeri mikrobiom.A fajok 55%-a, 26%-a és 11%-a volt specifikus MAG-ra, SAG-ra és REF-re.BATS, bermudai atlanti idősor;GEM, a Föld mikrobiomjának genomjai;GORG, globális óceáni referenciagenom;HOT, Hawaii-óceán idősor.
Ezzel az adatkészlettel összesen 26 293 MAG-ot rekonstruáltunk, többnyire bakteriális és régészeti eredetűek (1b. ábra és bővített adatok, 1b. ábra).Ezeket a MAG-okat különálló metagenomikus mintákból származó összeállításokból hoztuk létre, hogy megakadályozzuk a természetes szekvencia-variációk összeomlását a különböző helyekről vagy időpontokból származó minták között (módszerek).Ezenkívül a genomiális fragmentumokat a prevalencia korrelációi alapján csoportosítottuk nagyszámú mintán (58-610 minta, felméréstől függően; módszer).Megállapítottuk, hogy ez egy időigényes, de fontos lépés24, amely több nagyszabású MAG16, 19, 25 rekonstrukciós munkában kimaradt, és jelentősen javítja a mennyiségi (átlagosan 2,7-szeres) és minőségi (átlagosan +20%). genom.az itt vizsgált tengeri metagenomból rekonstruált (bővített adatok, 2a. ábra és további információk).Összességében ezek az erőfeszítések a tengeri mikrobiális MAG-ok 4,5-szeres növekedését eredményezték (ha csak a jó minőségű MAG-okat vesszük figyelembe), a jelenleg elérhető legátfogóbb MAG-forráshoz képest16 (Módszerek).Ezt az újonnan létrehozott MAG készletet 830 kézzel válogatott MAG26-tal, 5969 SAG27-tel és 1707 REF-fel kombinálták.Huszonhét tengeri baktérium- és archaeafaj alkotott egy 34 799 genomból álló kombinatorikus gyűjteményt (1b. ábra).
Ezt követően értékeltük az újonnan létrehozott erőforrást, hogy javítsuk a tengeri mikrobiális közösségek képviseletét, és felmérjük a különböző genomtípusok integrálásának hatását.Átlagosan azt találtuk, hogy a tengeri metagenomikai adatok hozzávetőlegesen 40-60%-át fedi le (1c. ábra), ami kétszer-háromszorosa a korábbi MAG-jelentéseknek mind mélységben, mind szélességben. More serial 16 vagy SAG20.Ezen túlmenően, hogy szisztematikusan mérjük a taxonómiai diverzitást a létrehozott gyűjteményekben, az összes genomot a Genome Taxonomy Database (GTDB) eszközkészletével (módszerekkel) annotáltuk, és átlagosan 95%-os genomszintű nukleotid azonosságot használtunk.28 8304 fajcsoport (faj) azonosítására.E fajok kétharmada (beleértve az új kládokat is) korábban nem jelent meg a GTDB-ben, amelyek közül 2790-et fedeztek fel a tanulmányban rekonstruált MAG segítségével (1d. ábra).Ezenkívül azt találtuk, hogy a különböző típusú genomok erősen komplementerek: a fajok 55%-a, 26%-a és 11%-a teljes egészében MAG-ból, SAG-ból és REF-ből áll (1e. ábra).Ezenkívül a MAG mind a 49, a vízoszlopban talált típusra kiterjedt, míg az SAG és a REF csak 18-at, illetve 11-et képviselt.A SAG azonban jobban reprezentálja a leggyakoribb kládok sokféleségét (bővített adatok, 3a. ábra), mint például a Pelagic Bacteriales (SAR11), a SAG csaknem 1300 fajt fed le, a MAG pedig csak 390 fajt.Figyelemre méltó, hogy a REF-ek ritkán fedték át a MAG-okat vagy SAG-okat fajszinten, és az itt vizsgált nyílt óceáni metagenomikus készletekben nem található körülbelül 1000 genom >95%-át képviselték, főként a más típusú izolált reprezentatív tengeri példányokkal (pl. üledékekkel) való kölcsönhatások miatt. .vagy fogadótárs).A tudományos közösség számára széles körben elérhetővé tétel érdekében ez a tengeri genomforrás, amely osztályozatlan fragmentumokat is tartalmaz (pl. előre jelzett fágokból, genomi szigetekből és olyan genomfragmensekből, amelyekről nem áll rendelkezésre elegendő adat a MAG rekonstrukcióhoz), összehasonlítható taxonómiai adatokkal. .Az Ocean Microbiology Database-ban (OMD; https://microbiomics.io/ocean/) elérheti a megjegyzéseket, valamint a génfunkciókat és a kontextuális paramétereket.
Ezt követően a nyílt óceáni mikrobiomokban rejlő bioszintetikus potenciál gazdagságának és újdonságának feltárására indultunk.Ebből a célból először az antiSMASH-t használtuk az 1038 tengeri metagenomban (módszerben) talált összes MAG-hoz, SAG-hoz és REF-hez, hogy összesen 39 055 BGC-t jelezzünk előre.Ezután ezeket 6907 nem redundáns GCF-be és 151 génklaszter-populációba (GCC; 2. kiegészítő táblázat és módszerek) csoportosítottuk, hogy figyelembe vegyük az inherens redundanciát (azaz ugyanaz a BGC több genomban is kódolható) és metagenomikai adatok A koncentrált BGC-k fragmentációja.A hiányos BGC-k nem növelték szignifikánsan a GCF-ek és a GCC-k számát, ha voltak ilyenek (kiegészítő információk), amelyek az esetek 44%-ában és 86%-ában legalább egy ép BGC-tagot tartalmaztak.
A GCC szintjén az előre jelzett RiPP-k és más természetes termékek széles választékát találtuk (2a. ábra).Közülük például az arilpoliének, karotinoidok, ektoinok és szideroforok a széles filogenetikai eloszlású és az óceáni metagenomokban nagy mennyiségben előforduló GCC-khez tartoznak, ami a mikroorganizmusok tengeri környezethez való széleskörű alkalmazkodását jelezheti, beleértve a reaktív oxigénfajokkal szembeni ellenállást is. oxidatív és ozmotikus stressz..vagy a vas felszívódása (további információ).Ez a funkcionális diverzitás ellentétben áll az NCBI RefSeq adatbázisban (BiG-FAM/RefSeq, a továbbiakban: RefSeq)29 tárolt körülbelül 190 000 genom közül körülbelül 1,2 millió BGC-vel, amely kimutatta, hogy a nem riboszómális szintetáz peptidek (NRPS) (PKS) BGC-k (kiegészítő információ).Ezenkívül 44 (29%) GCC-t találtunk, amelyek csak távoli kapcsolatban állnak bármely RefSeq BGC-vel (\(\bar{d}\)RefSeq > 0,4; 2a. ábra és módszerek) és 53 (35%) GCC-t csak a MAG-ban, kiemelve a potenciált. az OMD-ben korábban nem leírt vegyi anyagok kimutatására.Tekintettel arra, hogy ezek a GCC-k valószínűleg igen változatos bioszintetikus funkciókat képviselnek, tovább elemeztük az adatokat GCF-szinten annak érdekében, hogy részletesebb csoportosítást adjunk a BGC-kről, amelyek várhatóan hasonló természetes termékeket kódolnak29.Összesen 3861 (56%) azonosított GCF nem volt átfedésben a RefSeq-vel, és a GCF-ek >97%-a nem volt jelen a MIBiG-ben, amely a kísérletileg validált BGC-k egyik legnagyobb adatbázisa (2b. ábra).Bár nem meglepő, hogy sok potenciális új útvonalat fedezünk fel olyan környezetben, amelyeket a referenciagenom nem reprezentál jól, a BGC-k GCF-ekké történő dereplikációjára a benchmarking előtt alkalmazott módszerünk eltér a korábbi jelentésektől 16, és lehetővé teszi számunkra, hogy elfogulatlan értékelést adjunk az újdonságról.Az új diverzitás nagy része (3012 GCF vagy 78%) az előre jelzett terpéneknek, RiPP-nek vagy más természetes termékeknek felel meg, és a legtöbb (1815 GCF vagy 47%) bioszintetikus potenciáljuk miatt ismeretlen típusokban van kódolva.A PKS- és NRPS-klaszterekkel ellentétben ezek a kompakt BGC-k kisebb valószínűséggel töredeznek fel a metagenomikus összeállítás során 31, és lehetővé teszik termékeik idő- és erőforrásigényesebb funkcionális jellemzését.
Összesen 39 055 BGC-t csoportosítottak 6 907 GCF-be és 151 GCC-be.a, adatábrázolás (belső külső).A BGC távolságok GCC-n alapuló hierarchikus klaszterezése, amelyből 53-at csak a MAG rögzít.A GCC különböző taxonokból (ln-transzformált kapufrekvencia) és különböző BGC osztályokból származó BGC-ket tartalmaz (a kör mérete megfelel a gyakoriságának).Minden egyes GCC esetében a külső réteg a BGC-k számát, a prevalenciát (a minták százalékos arányát) és a távolságot (minimális BGC koszinusz távolság (min(dMIBiG))) a BiG-FAM és a BGC között jelenti.A kísérletileg ellenőrzött BGC-kkel (MIBiG) szorosan összefüggő BGC-kkel rendelkező GCC-ket nyilak jelzik.b A GCF-t előre jelzett (BiG-FAM) és kísérletileg validált (MIBiG) BGC-kkel összehasonlítva 3861 új (d–>0,2) GCF-et találtunk.Ezek többsége (78%) a RiPP-t, a terpéneket és más feltételezett természetes termékeket kódolja.c, az 1038 tengeri metagenomban található OMD összes genomját a GTDB alapfába helyeztük, hogy megmutassuk az OMD filogenetikai lefedettségét.Az OMD-ben genom nélküli kládok szürkén jelennek meg.A BGC-k száma megfelel az adott kládban genomonként megjósolt BGC-k legnagyobb számának.Az egyértelműség kedvéért a csomópontok utolsó 15%-a össze van csukva.A nyilak jelzik a BGC-ben gazdag kládokat (>15 BGC), kivéve a Mycobacterium, a Gordonia (a Rhodococcus után a második) és a Crocosphaera (második a Synechococcus után).d, Ismeretlen c.Az Eremiobacterota mutatta a legnagyobb bioszintetikus diverzitást (természetes terméktípuson alapuló Shannon-index).Mindegyik sáv azt a genomot képviseli, amelyben a fajban a legtöbb BGC található.T1PKS, PKS I. típusú, T2/3PKS, II. típusú PKS és III.
A gazdagság és az újdonság mellett feltárjuk a tengeri mikrobióm bioszintetikus potenciáljának biogeográfiai szerkezetét.A minták átlagos metagenomikus GCF kópiaszám-eloszlás szerinti csoportosítása (Módszerek) azt mutatta, hogy az alacsony szélességi fokon, felszíni, prokariótákban gazdag és vírusszegény közösségek, amelyek többnyire felszíni vagy mélyebb napsütötte vizekből származnak, gazdagok RiPP és BGC terpénekben.Ezzel szemben a poláris, mélytengeri, vírusokban és részecskékben gazdag közösségek nagyobb NRPS és PKS BGC abundanciával voltak összefüggésben (bővített adatok, 4. ábra és további információk).Végül azt találtuk, hogy a jól tanulmányozott trópusi és nyílt tengeri közösségek az új terpének legígéretesebb forrásai (Kibővített adatok ábra).A legnagyobb potenciál a PKS, RiPP és más természetes termékek esetében (5a. ábra bővített adatokkal).
A tengeri mikrobiomák bioszintetikus potenciáljával kapcsolatos tanulmányunk kiegészítéseként törekedtünk filogenetikai eloszlásuk feltérképezésére és új BGC-vel dúsított kládok azonosítására.Ebből a célból a tengeri mikrobák genomjait egy normalizált GTDB13 bakteriális és régészeti filogenetikai fába helyeztük, és átfedtük az általuk kódolt feltételezett bioszintetikus útvonalakat (2c. ábra).Könnyen detektáltunk számos BGC-vel dúsított kládot (amelyeket több mint 15 BGC képvisel) bioszintetikus potenciáljukról ismert tengervízmintákban (módszerekkel), mint például a cianobaktériumok (Synechococcus) és a Proteus baktériumok, mint például a Tistrella32,33, vagy nemrégiben felhívták magukra a figyelmet. természetes termékek.mint például a Myxococcota (Sandaracinaceae), a Rhodococcus és a Planctomycetota34,35,36.Érdekes módon ezekben a kládokban számos korábban feltáratlan származást találtunk.Például a Planctomycetota és Myxococcota törzsben a leggazdagabb bioszintetikus potenciállal rendelkező fajok nem jellemezhető jelöltrendekbe, illetve nemzetségekbe tartoztak (3. kiegészítő táblázat).Összességében ez arra utal, hogy az OMD hozzáférést biztosít a korábban ismeretlen filogenetikai információkhoz, beleértve a mikroorganizmusokat is, amelyek új célpontokat jelenthetnek az enzimek és a természetes termékek felfedezésében.
Ezután a BGC-vel dúsított kládot úgy jellemeztük, hogy nemcsak a tagjai által kódolt BGC-k maximális számát számoltuk meg, hanem ezen BGC-k diverzitását is felmértük, ami megmagyarázza a különböző típusú természetes jelölt termékek gyakoriságát (2c. ábra és módszerek). )..Azt találtuk, hogy a bioszintetikusan legváltozatosabb fajokat speciálisan módosított bakteriális MAG-ok képviselik ebben a vizsgálatban.Ezek a baktériumok a nem tenyésztett Candidatus Eremiobacterota törzshöz tartoznak, amely néhány genomikai vizsgálattól eltekintve nagyrészt feltáratlan marad37,38.Figyelemre méltó, hogy „kb.Az Eremiobacterota nemzetséget csak szárazföldi környezetben elemezték39, és nem ismert, hogy a BGC-ben gazdag tagokat tartalmazna.Itt rekonstruáltuk nyolc azonos faj MAG-ját (nukleotid-azonosság > 99%) 23. Ezért javasoljuk a „Candidatus Eudoremicrobium malaspinii” fajnevet, amelyet a nereidáról (tengeri nimfáról) neveztek el, amely gyönyörű ajándék a görög mitológiában és expedíciókban.'Ka.A 13. filogenetikai megjegyzés szerint az E. malaspinii-nek nincsenek korábban ismert rokonai a szekvenciaszint alatt, így egy új baktériumcsaládhoz tartozik, amelyet javasolunk: „Ca.E. malaspinii” típusfajként és „Ca.Eudormicrobiaceae” hivatalos névként (kiegészítő információ).A 'Ca.Az E. malaspinii genomprojektet nagyon alacsony input, hosszú leolvasású metagenomikus szekvenálás és egyetlen minta célzott összeállítása (Módszerek) igazolta egyetlen 9,63 Mb-os lineáris kromoszómaként 75 kb-os duplikációval.mint az egyetlen megmaradt kétértelműség.
A faj filogenetikai kontextusának megállapításához 40 közeli rokon fajt kerestünk a Tara-óceáni expedícióból származó további eukarióta-dúsított metagenomikus mintákban, célzott genom-rekonstrukcióval.Röviden, a metagenomikus leolvasásokat összekapcsoltuk a „Ca.E. malaspinii” és azt feltételezték, hogy a megnövekedett toborzási arány ebben a mintában más rokonok jelenlétét jelzi (módszerek).Ennek eredményeként 10 MAG-ot találtunk, 19 MAG kombinációját, amelyek öt fajt képviselnek három nemzetségben egy újonnan meghatározott családon belül (azaz „Ca. Eudormicrobiaceae”).Kézi ellenőrzés és minőségellenőrzés (bővített adatok, 6. ábra és további információk) után azt találtuk, hogy „Ca.Az Eudormicrobiaceae fajok nagyobb genomokkal (8 Mb) és gazdagabb bioszintetikus potenciállal (fajonként 14-22 BGC) rendelkeznek, mint a többi „Ca” tag.Clade Eremiobacterota (legfeljebb 7 BGC) (3a–c. ábra).
a, Az öt 'Ca.Az Eudormicrobiaceae fajok BGC gazdagságot mutattak a tanulmányban azonosított tengeri vonalakra jellemzően.A filogenetikai fa magában foglalja az összes 'Ca.A GTDB-ben (89-es verzió) biztosított MAG Eremiobacterota és más törzsek tagjai (a genomszámok zárójelben) az evolúciós háttérhez (Módszerek) kerültek felhasználásra.A legkülső rétegek a család szintjén („Ca. Eudormicrobiaceae” és „Ca. Xenobiaceae”), valamint az osztályszinten („Ca. Eremiobacteria”) osztályozást képviselnek.A tanulmányban leírt öt fajt alfanumerikus kódok és javasolt binomiális nevek képviselik (kiegészítő információ).b, oké.Az Eudormicrobiaceae fajoknak hét közös BGC magjuk van.A BGC hiánya az A2 kládban a reprezentatív MAG hiányossága miatt volt (3. kiegészítő táblázat).A BGC-k a „Ca.Amphithomicrobium” és „Ca.Amphithomicrobium” (A és B osztály) nem láthatók.c, Minden BGC kódolása „Ca.Megállapították, hogy az Eudoremicrobium taraoceanii 623 metatranszkriptumban fejeződik ki a Tara óceánjaiból.Folyamatos körök jelzik az aktív átírást.A narancssárga körök log2-transzformált hajtásváltozásokat jelölnek a housekeeping gén expressziós aránya alatt és felett (módszerek).d, relatív abundancia görbék (módszerek), amelyek 'Ca.Az Eudormicrobiaceae fajai a legtöbb óceáni medencében és a teljes vízoszlopban (a felszíntől legalább 4000 m mélységig) elterjedtek.Ezen becslések alapján azt találtuk, hogy „Ca.Az E. malaspinii' a prokarióta sejtek legfeljebb 6%-át teszi ki a mélytengeri nyílt tengeri gabonával kapcsolatos közösségekben.Egy fajt akkor tekintettünk egy lelőhelyen jelenlévőnek, ha egy adott mélységi réteg méretének tetszőleges töredékében megtalálható.IO – Indiai-óceán, NAO – Atlanti-óceán északi része, NPO – Csendes-óceán északi része, RS – Vörös-tenger, SAO – Atlanti-óceán déli része, SO – Déli-óceán, SPO – Csendes-óceán déli része.
A Ca abundanciájának és eloszlásának tanulmányozása.Eudormicrobiaceae, amely, mint azt tapasztaltuk, a legtöbb óceáni medencében, valamint a teljes vízoszlopban túlsúlyban van (3d. ábra).Helyileg a tengeri mikrobiális közösség 6%-át teszik ki, így a globális tengeri mikrobióma fontos részét képezik.Ezen kívül megtaláltuk a Ca relatív tartalmát.Az Eudormicrobiaceae fajok és BGC expressziós szintjeik az eukarióta dúsított frakcióban voltak a legmagasabbak (3c. ábra és kiterjesztett adatok, 7. ábra), ami a szemcsékkel, köztük a planktonnal való lehetséges kölcsönhatásra utal.Ez a megfigyelés némileg hasonlít a 'Ca.Az ismert utakon keresztül citotoxikus természetes termékeket előállító Eudoremicrobium BGC-k ragadozó viselkedést mutathatnak (kiegészítő információk és bővített adatok, 8. ábra), hasonlóan más ragadozókhoz, amelyek kifejezetten metabolitokat termelnek, mint például a Myxococcus41.A Ca.A kevésbé hozzáférhető (óceánmélyi) vagy eukarióta, nem pedig prokarióta mintákban előforduló Eudormicrobiaceae magyarázatot adhat arra, hogy ezek a baktériumok és váratlan BGC-diverzitásuk miért marad tisztázatlan a természetes élelmiszerkutatás összefüggésében.
Végső soron arra törekedtünk, hogy kísérletileg igazoljuk a mikrobiom alapú munkánk ígéretét új utak, enzimek és természetes termékek felfedezésében.A BGC-k különböző osztályai közül a RiPP-útvonalról ismert, hogy gazdag kémiai és funkcionális diverzitást kódol az érett enzimek által a magpeptid különféle poszt-transzlációs módosításai miatt42.Így két 'Ca.Az Eudoremicrobium' RiPP BGC-k (3b. és 4a-e. ábra) ugyanazon alapulnak, mint bármely ismert BGC (\(\bar{d}\)MIBiG és \(\bar{d}\)RefSeq 0,2 felett) .
a–c, In vitro heterológ expresszió és in vitro enzimatikus vizsgálatok a RiPP bioszintézis új (\(\bar{d}\)RefSeq = 0,29) klaszterében, amely a mélytengeri Ca fajokra specifikus.Az E. malaspinii” difoszforilált termékek előállításához vezetett.c, a nagyfelbontású (HR) MS/MS (a kémiai szerkezetben a b és y ionokkal jelölt fragmentáció) és az NMR (bővített adatok, 9. ábra) segítségével azonosított módosítások.d, ez a foszforilált peptid alacsony mikromoláris gátlást mutat az emlős neutrofil elasztázban, ami nem található meg a kontrollpeptidben és a dehidratáló peptidben (kémiai eltávolítás által kiváltott dehidratáció).A kísérletet háromszor megismételték hasonló eredménnyel.Például a fehérjebioszintézis egy második új \(\bar{d}\)RefSeq = 0,33) klaszterének heterológ expressziója megvilágítja négy érett enzim működését, amelyek módosítják a 46 aminosavból álló magpeptidet.A maradékokat a HR-MS/MS, az izotópjelölés és az NMR-analízis (kiegészítő információ) által megjósolt módosulási hely szerint festjük.A szaggatott elszíneződés azt jelzi, hogy a módosulás a két maradék egyikén történik.Az ábra számos heterológ konstrukció összeállítása, amely bemutatja az összes érett enzim aktivitását ugyanazon a magon.h, NMR adatok szemléltetése a váz amid N-metilációjához.A teljes eredményeket az ábra mutatja.10 bővített adatokkal.i, Az érett FkbM fehérje klaszter enzim filogenetikai helyzete a MIBiG 2.0 adatbázisban található összes FkbM domén között felfedi egy ebbe a családba tartozó enzimet N-metiltranszferáz aktivitással (kiegészítő információ).A BGC-k (a, e), a prekurzor peptidszerkezetek (b, f) és a természetes termékek feltételezett kémiai szerkezeteinek (c, g) sematikus diagramja látható.
Az első RiPP útvonalat (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) csak mélytengeri fajoknál találták meg „Ca.E. malaspinii” és a peptid-prekurzor kódja (4a., b. ábra).Ebben az érett enzimben egyetlen funkcionális domént azonosítottunk, amely homológ a lantipeptid-szintáz dehidratációs doménjével, amely normális esetben katalizálja a 43 foszforilációját és ezt követő eltávolítását (kiegészítő információ).Ezért azt jósoljuk, hogy a prekurzor peptid módosítása egy ilyen kétlépéses dehidratációt foglal magában.Tandem tömegspektrometriával (MS/MS) és magmágneses rezonancia spektroszkópiával (NMR) azonban polifoszforilált lineáris peptidet azonosítottunk (4c. ábra).Bár váratlanul, számos bizonyítékot találtunk, amelyek alátámasztják, hogy ez a végtermék: két különböző heterológ gazdaszervezet és nincs dehidratáció az in vitro vizsgálatokban, az érett enzim katalitikus dehidratációs helyén mutált kulcsfontosságú maradékok azonosítása.mindezt a „Ca” rekonstruálta.Az E. malaspinii genom (bővített adatok, 9. ábra és további információk) és végül a foszforilált termék biológiai aktivitása, de nem a kémiailag szintetizált dehidratált forma (4d. ábra).Valójában azt találtuk, hogy alacsony mikromoláris proteázgátló aktivitást mutat a neutrofil elasztázzal szemben, összehasonlítható más rokon természetes termékekkel a koncentrációtartományban (IC50 = 14,3 μM) 44 , annak ellenére, hogy az ökológiai szerepét még tisztázni kell.Ezen eredmények alapján javasoljuk az útvonal elnevezését „foszfeptin”.
A második eset egy komplex RiPP útvonal, amely a 'Ca.Az Eudoremicrobium nemzetség (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) várhatóan természetes fehérjetermékeket kódol (4e. ábra).Ezek az útvonalak különösen fontosak biotechnológiai szempontból a viszonylag rövid BGC-k által kódolt enzimek által létrehozott szokatlan kémiai módosulások várható sűrűsége és sokfélesége miatt45.Megállapítottuk, hogy ez a fehérje abban különbözik a korábban jellemzett fehérjéktől, hogy hiányzik belőle mind a policeramidok fő NX5N-motívuma, mind a landoramidok lantionin hurokja 46 .A gyakori heterológ expressziós minták korlátainak leküzdése érdekében ezeket egy egyedi Microvirgula aerodenitrificans rendszerrel együtt alkalmaztuk négy érett útvonal enzim (módszer) jellemzésére.Az MS/MS, az izotópjelölés és az NMR kombinációjával kimutattuk ezeket az érett enzimeket a peptid 46 aminosavból álló magjában (4f,g ábra, bővített adatok, 10-12. ábra és további információk).Az érett enzimek közül az FkbM O-metiltranszferáz család 47-es tagjának első megjelenését jellemeztük a RiPP útvonalon, és váratlanul azt találtuk, hogy ez az érett enzim bevezeti a gerinc N-metilációját (4h, i ábra és további információk).Bár ez a módosulás ismert a természetes NRP48 termékekben, az amidkötések enzimatikus N-metilezése összetett, de biotechnológiailag jelentős reakció49, amely eddig a RiPP borozincsaládot érdekelte.Specifikusság 50,51.Ennek az aktivitásnak az azonosítása más enzimcsaládokban és a RiPP-ben új alkalmazásokat nyithat meg, és kiterjesztheti a fehérjék funkcionális diverzitását52 és kémiai diverzitásukat.Az azonosított módosítások és a javasolt termékstruktúra szokatlan hosszúsága alapján javasoljuk a „pythonamid” útvonal nevet.
A váratlan enzimológia felfedezése egy funkcionálisan jellemzett enzimcsaládban a környezeti genomika ígéretét mutatja új felfedezések számára, és azt is szemlélteti, hogy a szekvencia homológián alapuló funkcionális következtetések korlátozott kapacitása van.Így a nem kanonikus bioaktív polifoszforilált RiPP-kről szóló jelentésekkel együtt eredményeink erőforrás-igényes, de kritikus értéket mutatnak a szintetikus biológia erőfeszítései számára, amelyek célja a biokémiai vegyületek funkcionális gazdagságának, sokféleségének és szokatlan szerkezetének teljes feltárása.
Itt bemutatjuk a mikrobák által kódolt bioszintetikus potenciál tartományát és genomi összefüggésüket a globális tengeri mikrobiomban, megkönnyítve a jövőbeli kutatást azáltal, hogy elérhetővé tesszük a kapott erőforrást a tudományos közösség számára (//microbiomics.io/ocean/).Azt találtuk, hogy filogenetikai és funkcionális újdonságai nagy része csak a MAG-ok és SAG-ok rekonstrukciójával érhető el, különösen az alulhasznosított mikrobiális közösségekben, amelyek irányíthatják a jövőbeni biokutatási erőfeszítéseket.Bár itt a „Ca.Eudormicrobiaceae”, mint bioszintetikusan különösen „tehetséges” leszármazási vonal, a feltáratlan mikrobiotában előre jelzett BGC-k közül sok valószínűleg korábban le nem írt enzimológiákat kódol, amelyek környezeti és/vagy biotechnológiai szempontból jelentős hatású vegyületeket eredményeznek.
A jelentősebb oceanográfiai és idősoros vizsgálatokból származó metagenomikai adatkészletek, amelyek megfelelő szekvenálási mélységgel rendelkeznek, a globális tengeri mikrobiális közösségek lefedettségének maximalizálása érdekében az óceáni medencékben, mélyrétegekben és időben.Ezek az adatkészletek (1. kiegészítő táblázat és 1. ábra) Tara óceánjaiban gyűjtött minták metagenomikáját (vírussal dúsított, n = 190; prokarióta dúsított, n = 180) 12, 22 és a BioGEOTRACES expedíció (n = 480) tartalmazzák.Hawaii Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 és a Malaspina Expedition (n = 58)23.Az összes metagenomikus fragmens szekvenálási olvasatait a minőség szempontjából szűrtük a BBMap (v.38.71) segítségével úgy, hogy eltávolították a szekvenáló adaptereket az olvasásokból, eltávolították a minőség-ellenőrző szekvenciákhoz (PhiX genomokhoz) leképezett leolvasásokat, és a trimq=14, maq=20 használatával a rossz olvasási minőséget elvettük. maxns = 0 és minlength = 45. A későbbi elemzéseket lefuttatták, vagy összevonták a QC leolvasásokkal, ha megadták (bbmerge.sh minoverlap=16).A minőségellenőrzési értékeket normalizálták (bbnorm.sh cél = 40, minddepth = 0) a metaSPA-k (szükség esetén v.3.11.1 vagy v.3.12) felépítése előtt53.Az így létrejött scaffold-kontigeket (a továbbiakban állványok) végül hossz (≥1 kb) alapján szűrtük.
Az 1038 metagenomikus mintát csoportokra osztottuk, és minden mintacsoportnál az összes minta metagenomikus minőség-ellenőrzési leolvasását minden minta zárójelébe illesztettük, így a következő számú páronkénti zárójeles csoportleolvasást kaptuk: Tara Marine Viruses – Enriched (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT and BATS (610×610) és Malaspina (58×58).A leképezés a Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 segítségével történt, amely lehetővé teszi a leolvasások másodlagos helyekhez való illesztését (az -a jelző használatával).Az igazításokat úgy szűrtük, hogy legalább 45 bázis hosszúak legyenek, ≥97%-os azonossággal és ≥80%-os leolvasással rendelkezzenek.Az eredményül kapott BAM-fájlokat a jgi_summarize_bam_contig_depths for MetaBAT2 (v.2.12.1)55 szkript segítségével dolgoztuk fel, hogy a mintán belüli és a minták közötti lefedettséget biztosítsuk minden csoport számára.Végül a zárójeleket csoportosítottuk az érzékenység növelése érdekében, külön-külön futtatva a MetaBAT2-t minden mintán –minContig 2000 és –maxEdges 500 használatával. A MetaBAT2-t használjuk az ensemble boxer helyett, mert független tesztek kimutatták, hogy ez a leghatékonyabb single boxer.és 10-50-szer gyorsabb, mint a többi általánosan használt boxer57.Az abundancia-korrelációk hatásának tesztelésére a metagenomikai véletlenszerűen kiválasztott részminta (10 a Tara Ocean mindkét adatkészletéhez, 10 a BioGEOTRACES-hez, 5 az egyes idősorokhoz és 5 a Malaspinához) csak mintákat használt.A belső mintákat csoportosítják a lefedettségi információk megszerzése érdekében.(További információ).
További (külső) genomokat vontak be a későbbi elemzésbe, nevezetesen 830 manuálisan kiválasztott MAG-ot a Tara Oceans26 adatkészlet egy részhalmazából, 5287 SAG-t a GORG20 adatkészletből, valamint a MAR adatbázisból (MarDB v. 4) származó adatokat 1707 izolált REF-ből és 682 SAG) 27. A MarDB adatkészlethez a genomokat a rendelkezésre álló metaadatok alapján választja ki a rendszer, ha a mintatípus megfelel a következő reguláris kifejezésnek: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] elszigetelt'.
Az egyes metagenomikus tartályok és külső genomok minőségét a CheckM (v.1.0.13) és az Anvi'o Lineage Workflow (v.5.5.0)58,59 segítségével értékeltük.Ha a CheckM vagy az Anvi'o ≥50%-os teljességet/teljességet és ≤10%-os szennyeződést/redundanciát jelent, mentse el a metagenomikus sejteket és a külső genomokat későbbi elemzés céljából.Ezeket a pontszámokat azután az átlagos teljességbe (mcpl) és az átlagos szennyezettségbe (mctn) kombinálták, hogy a genom minőségét közösségi kritériumok szerint osztályozzák60 a következőképpen: kiváló minőség: mcpl ≥ 90% és mctn ≤ 5%;jó minőség: mcpl ≥ 70%, mctn ≤ 10%, közepes minőség: mcpl ≥ 50% és mctn ≤ 10%, megfelelő minőség: mcpl ≤ 90% vagy mctn ≥ 10%.A szűrt genomokat ezután minőségi pontszámokkal (Q és Q') korreláltuk a következőképpen: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (törzs variabilitás)/100 + 0,5 x log[N50].(dRep61-ben megvalósítva).
A különböző adatforrások és genomtípusok (MAG, SAG és REF) összehasonlító elemzésének lehetővé tétele érdekében 34 799 genom hivatkozását a genomszintű átlagos nukleotid azonosság (ANI) alapján dRep (v.2.5.4) alkalmazásával.Ismétlődik)61 95%-os ANI küszöbértékekkel28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) és egykópiás markergének SpecI63 használatával, fajszintű genom klaszterezést biztosítva.Minden dRep klaszterhez kiválasztottunk egy reprezentatív genomot a fent meghatározott maximális minőségi pontszám (Q') szerint, amelyet a fajra nézve reprezentatívnak tekintettünk.
A leképezési sebesség értékeléséhez BWA-t (v.0.7.17-r1188, -a) használtunk az OMD-ben található 34 799 genommal rendelkező metagenomikus leolvasások mind az 1038 készletének feltérképezésére.A minőség-ellenőrzött leolvasásokat egyvégű módban térképeztük fel, és az eredményül kapott igazításokat szűrtük, hogy csak a 45 bp-nál hosszabb igazításokat tartsák meg.és azonosság ≥95%.Az egyes minták kijelzési aránya a szűrés után fennmaradó leolvasások százalékos aránya osztva a minőség-ellenőrzési értékek teljes számával.Ugyanezt a megközelítést alkalmazva az 1038 metagenom mindegyikét 5 millió inszertra csökkentettük (bővített adatok, 1c. ábra), és a GORG SAG-hoz illesztettük az OMD-ben és az összes GEM16-ban.A tengervízből kinyert MAG mennyiségét a GEM16 katalógusban a metagenomikus források kulcsszavas lekérdezései határozták meg, tengervízminták kiválasztásával (pl. a tengeri üledékekkel szemben).Konkrétan a „vízi” mint „ökoszisztéma_kategória”, a „tengeri” az „ökoszisztéma_típusa”, az „élőhely” pedig a „mély óceán”, „tengeri”, „tengeri óceáni”, „ nyílt tengeri”, „tengeri víz” , „Óceán”, „Tengervíz”, „Felszíni tengervíz”, „Felszíni tengervíz”.Ez 5903 MAG-ot eredményezett (734 kiváló minőségű), amelyet 1823 OTU-n keresztül osztottak el (megtekintések itt).
A prokarióta genomokat a GTDB-Tk (v.1.0.2)64 segítségével taxonómiai annotációval láttuk el, a GTDB r89 13-as verzióját célzó alapértelmezett paraméterekkel. Az Anvi'o-t használtuk az eukarióta genomok azonosítására a domén-előrejelzés és visszahívás ≥50% és redundancia ≤10% alapján.Egy faj taxonómiai annotációja az egyik reprezentatív genomja.Az eukarióták (148 MAG) kivételével minden genomot először funkcionálisan annotáltunk a prokka (v.1.14.5)65 segítségével, teljes géneket nevezve el, szükség szerint meghatározva az „archaea” vagy „baktérium” paramétereket, amiről a nem- kódoló géneket.és a CRISPR régiók, többek között a genomi jellemzők.Annotálja a megjósolt géneket az univerzális egymásolatú markergének (uscMG) azonosításával a fetchMG (v.1.2)66 segítségével, rendeljen hozzá ortológ csoportokat, és kérdezzen le az emapper (v.2.0.1)67 segítségével az eggNOG (v.5.0)68 alapján.KEGG-adatbázis (közzétéve: 2020. február 10.) 69. Az utolsó lépést úgy hajtották végre, hogy a fehérjéket illesztettük a KEGG-adatbázishoz a DIAMOND (v.0.9.30)70 segítségével, ≥70%-os lekérdezéssel és témakörrel.Az eredményeket tovább szűrtük az NCBI Prokaryotic Genome Annotation Pipeline71 szerint, a maximálisan várt bitráta ≥ 50%-a alapján (maga link).A génszekvenciákat bemenetként is használták a BGC-k azonosítására a genomban az antiSMASH (v.5.1.0)72 használatával, alapértelmezett paraméterekkel és különböző klaszterrobbanásokkal.Az összes genomot és annotációt OMD-be állítottuk össze, a weben elérhető kontextuális metaadatokkal együtt (https://microbiomics.io/ocean/).
A korábban leírt módszerekhez12,22 hasonlóan CD-HIT-et (4.8.1) használtunk, hogy több mint 56,6 millió fehérjét kódoló gént csoportosítsunk bakteriális és régészeti genomokból OMD-ből 95%-os azonosságra és rövidebb génekre (90%-os lefedettség)73 egészen addig. >17,7 millió génklaszter.A leghosszabb szekvenciát választottuk reprezentatív génnek minden génklaszterhez.Az 1038 metagenomot ezután >17,7 millió BWA (-a) klasztertaghoz illesztettük, és az eredményül kapott BAM-fájlokat kiszűrtük, hogy csak a ≥95%-os azonosságú és ≥45-ös alap-illesztésű igazításokat őrizzék meg.A hosszra normalizált génbőséget úgy számítottuk ki, hogy először a legjobb egyedi illesztésből származó inszerteket számoltuk meg, majd a fuzzy-térképezett inszertek esetében a megfelelő célgénekhez adtuk az egyedi inszertek számával arányos frakcionált számokat.
A kiterjesztett OMD genomjait (a „Ca. Eudormicrobiaceae” további MAG-jaival, lásd alább) hozzáadtuk a mOTUs74 metagenomikus elemző eszköz adatbázisához (v.2.5.1), hogy létrehozzunk egy kiterjesztett mOTU referencia adatbázist.Tíz uscMG-ből csak hat egykópiás genom (23 528 genom) maradt fenn.Az adatbázis bővítése 4494 további klasztert eredményezett fajszinten.1038 metagenomot elemeztünk az alapértelmezett mOTU paraméterekkel (v.2).A 644 mOTU klaszterben (95% REF, 5% SAG és 99,9% MarDB-hez tartozó) összesen 989 genomot nem mutatott ki a mOTU profil.Ez a MarDB genomok tengeri izolációjának különféle további forrásait tükrözi (a legtöbb fel nem fedezett genom üledékekből izolált organizmusokhoz, tengeri gazdákhoz stb. kapcsolódik).Ahhoz, hogy ebben a tanulmányban továbbra is a nyílt óceáni környezetre összpontosítsunk, kizártuk őket a downstream elemzésből, hacsak nem észlelték vagy szerepelnek a tanulmányban létrehozott kiterjesztett mOTU adatbázisban.
A MAG-ból, SAG-ból és REF-ből származó összes BGC-t OMD-ben (lásd fent) kombináltuk az összes metagenomikus vázban azonosított BGC-vel (antiSMASH v.5.0, alapértelmezett paraméterek), és BiG-SLICE (v.1.1) (PFAM domén)75 segítségével jellemeztük.Ezen jellemzők alapján kiszámítottuk a BGC-k közötti összes koszinusz-távolságot, és 0,2-es és 0,8-as távolsági küszöbértékekkel csoportosítottuk őket (átlagos linkek) GCF-be és GCC-be.Ezek a küszöbértékek a korábban az euklideszi távolság75 és a koszinusz távolság használatával használt küszöbértékek adaptációja, ami enyhíti az eredeti BiG-SLICE klaszterezési stratégia hibáit (kiegészítő információ).
A BGC-ket ezután szűrtük, hogy csak ≥5 kb-ot tartsanak meg az állványokon kódolva, hogy csökkentsék a fragmentáció kockázatát a korábban leírtak szerint16, és kizárják az 1038 metagenomban nem található MarDB REF-eket és SAG-kat (lásd fent).Ennek eredményeként összesen 39 055 BGC-t kódol az OMD genom, és további 14 106-ot azonosítottak a metagenomikus fragmenseken (azaz nem egyesültek MAG-okká).Ezeket a „metagenomikus” BGC-ket arra használták, hogy megbecsüljék az adatbázisban nem rögzített tengeri mikrobiom bioszintézis-potenciál arányát (kiegészítő információ).Mindegyik BGC-t funkcionálisan az anti-SMASH vagy a BiG-SCAPE76-ban meghatározott durvább termékkategóriák által meghatározott prediktív terméktípusok szerint jellemezték.A mennyiségi meghatározás (a GCC/GCF taxonómiai és funkcionális összetétele, a GCF és a GCC távolsága a referenciaadatbázisokhoz, valamint a GCF metagenomikus bősége) mintavételi torzításának elkerülése érdekében azáltal, hogy az egyes fajok esetében csak a GCF-enkénti leghosszabb BGC-t tartottuk meg, 39 055 BGC-t tovább duplikáltunk, összesen 17 689 BGC-t eredményezve.
A GCC és GCF újdonságát a számított adatbázis (RefSeq adatbázis a BiG-FAM-ben)29 és a kísérletileg igazolt (MIBIG 2.0)30 BGC közötti távolság alapján értékeltük.A 17 689 reprezentatív BGC mindegyikéhez a legkisebb koszinusz távolságot választottuk az adott adatbázishoz.Ezeket a minimális távolságokat ezután a GCF vagy a GCC szerint átlagoljuk (átlagosan).A GCF akkor tekinthető újnak, ha az adatbázistól való távolság nagyobb, mint 0,2, ami megfelel az (átlagos) GCF és a referencia közötti ideális távolságnak.A GCC esetében a 0,4-et választjuk, ami a GCF által meghatározott küszöb kétszerese, hogy a hivatkozásokkal hosszú távú kapcsolatot rögzíthessünk.
A BGC metagenomikus abundanciáját a génszintű profilokból elérhető bioszintetikus génjeinek átlagos abundanciájaként becsülték (amit az anti-SMASH határoz meg).Az egyes GCF vagy GCC metagenomikus abundanciáját ezután a reprezentatív BGC-k összegeként számítottuk ki (17 689-ből).Ezeket az abundanciatérképeket ezt követően a sejtösszetételre normalizáltuk a mintánkénti mOTU-szám segítségével, amely a szekvenálási erőfeszítéseket is figyelembe vette (bővített adatok, 1d. ábra).A GCF vagy GCC prevalenciáját a 0-nál nagyobb abundanciájú minták százalékában számítottuk.
A minták közötti euklideszi távolságot a normalizált GCF profilból számítottuk ki.Ezeket a távolságokat csökkentettük az UMAP77 segítségével, és az így létrejött beágyazásokat a HDBSCAN78 segítségével, felügyelet nélküli sűrűség alapú klaszterezéshez használták fel.A HDBSCAN által használt fürt optimális minimális pontszámát (és így a fürtök számát) a fürttagság kumulatív valószínűségének maximalizálása határozza meg.Az azonosított klasztereket (és e klaszterek véletlenszerűen kiegyensúlyozott részmintáját a permutációs többváltozós varianciaanalízis (PERMANOVA) torzításának figyelembevétele érdekében) PERMANOVA segítségével teszteltük szignifikancia szempontjából a csökkentetlen euklideszi távolságokkal szemben.A minták átlagos genomméretét a mOTU relatív abundanciája és a genomtagok becsült genommérete alapján számítottuk ki.Konkrétan az egyes mOTU-k átlagos genomméretét a tagok teljességre korrigált genomméretének átlagaként becsülték meg (szűrés után) (például egy 75%-ban teljes genom 3 Mb hosszúságú, a korrigált mérete 4 Mb).≥70%-os integritású közepes genomokhoz.Az egyes minták átlagos genomméretét ezután a mOTU genomméretek relatív bőségével súlyozott összegeként számítottuk ki.
A genom által kódolt BGC-k szűrt készlete az OMD-ben bakteriális és archaeális GTDB fákban (≥5 kb-os keretekben, kivéve az 1038 metagenomban nem található REF és SAG MarDB-t, lásd fent) és a filogenetikai jellemzők alapján előre jelzett termékkategóriáiban látható. a genom helyzete (lásd fent).Először fajok szerint csökkentettük az adatokat, reprezentatívnak az adott fajban a legtöbb BGC-t tartalmazó genomot használva.A vizualizációhoz a képviselőket tovább osztottuk facsoportokra, és ismét minden sejtes kládra a legtöbb BGC-t tartalmazó genomot választottuk reprezentatívnak.A BGC-vel dúsított fajokat (legalább egy genom >15 BGC-vel) tovább elemeztük az ezekben a BGC-kben kódolt terméktípusok Shannon-féle diverzitási indexének kiszámításával.Ha minden előre jelzett terméktípus megegyezik, akkor a kémiai hibridek és más összetett BGC-k (az anti-SMAH előrejelzése szerint) ugyanahhoz a terméktípushoz tartoznak, függetlenül attól, hogy milyen sorrendben vannak a klaszterben (pl. protein-bakteriocin és bakteriocin-proteoprotein fúzió test).hibrid).
A Malaspina MP1648 mintájából származó maradék DNS (becslések szerint 6 ng), amely megfelel a SAMN05421555 biológiai mintának, és illeszkedik az Illumina SRR3962772 metagenomikus leolvasókészlethez rövid leolvasáshoz, a PacBio szekvenálási protokoll szerint feldolgozva, rendkívül alacsony bemenettel a PacBello mintavételi gmblification készlet használatához. készlet (100-980-000) és SMRTbell Express 2.0 sablon előkészítő készlet (100-938-900).Röviden, a maradék DNS-t vágtuk, javítottuk és tisztítottuk (ProNex gyöngyök) Covaris (g-TUBE, 52104) alkalmazásával.A tisztított DNS-t ezután könyvtár-előkészítésnek, amplifikációnak, tisztításnak (ProNex gyöngyök) és méretválasztásnak (>6 kb, Blue Pippin) vetjük alá, mielőtt egy végső tisztítási lépést (ProNex gyöngyök) és szekvenálást végeznek a Sequel II platformon.
Az első kettő rekonstrukciója kb.A MAG Eremiobacterota esetében hat további, 99%-nál nagyobb ANI-t azonosítottunk (ezeket a 3. ábra tartalmazza), amelyeket kezdetben a szennyeződési pontszámok alapján szűrtünk (később génduplikációként azonosították, lásd alább).Találtunk egy „Ca” feliratú tálcát is.Eremiobacterota” különböző tanulmányokból23, és ezeket a vizsgálatunkból származó nyolc MAG-mal együtt referenciaként használtuk 633 eukarióta dúsított (>0,8 µm) minta metagenomikus leolvasásához, BWA (v.0.7.17) Ref -r1188, – zászló) segítségével a mintavételezéshez. térképezés (5 millió olvasmány).A dúsítás-specifikus térképek alapján (95%-os igazítási azonosság és 80%-os lefedettség alapján szűrve) 10 metagenomot (várható lefedettség ≥5×) választottunk ki az összeállításhoz, és további 49 metagenomot (várható lefedettség ≥1×) a tartalomkorrelációhoz.Ugyanazokat a paramétereket alkalmazva, mint fent, ezeket a mintákat összegyűjtöttük, és 10 további „Ca-t” adtunk hozzá.A MAG Eremiobacterota helyreállt.Ez a 16 MAG (az adatbázisban már szereplő kettőt nem számítva) a kiterjesztett OMD genomjainak teljes számát 34 815-re növeli.A MAG-okat a genomi hasonlóságuk és a GTDB-ben elfoglalt helyük alapján rendelik taxonómiai rangokkal.18 MAG-ot replikáltunk dRep segítségével 5 fajra (intraspecifikus ANI >99%) és 3 nemzetségre (intragenerikus ANI 85-94%) ugyanazon a családon belül79.A fajok képviselőit manuálisan választották ki az integritás, a szennyeződés és az N50 alapján.A javasolt nómenklatúra a Kiegészítő Információban található.
Értékelje a 'Ca.MAG Eremiobacterota, értékeltük az uscMG jelenlétét, valamint a CheckM és az Anvi'o által használt vonal- és doménspecifikus egymásolatú marker génkészleteket.A 40 uscMG-ből 2 duplikátum azonosítását filogenetikai rekonstrukcióval igazoltuk (lásd alább), hogy kizárjuk a lehetséges szennyeződéseket (ez 5%-nak felel meg a 40 markergén alapján).Egy további tanulmány öt reprezentatív MAG „Ca.A szennyeződések alacsony szintjét ezekben a rekonstruált genomokban az Eremiobacterota fajok esetében az interaktív Anvi'o interfész segítségével megerősítették a bőség és a szekvencia összetétel korrelációi alapján (kiegészítő információ)59.
A filogenomiai elemzéshez öt reprezentatív MAG-ot választottunk ki, „Ca”.Eudormicrobiaceae”, minden faj „Ca.Az Eremiobacterota és más törzsek (beleértve az UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria és Planctomycetota) genomja beszerezhető a GTDB-től (r89)13.Mindezeket a genomokat a korábban leírtak szerint az egypéldányos markergén-kivonásnál és a BGC annotációnál leírtak szerint annotáltuk.A GTDB genomokat a fenti integritási és kontaminációs kritériumok szerint konzerváltuk.A filogenetikai elemzést az Anvi'o Phylogenetics59 munkafolyamat segítségével végeztük.A fát az IQTREE (v.2.0.3) (alapértelmezett opciók és -bb 1000)80 használatával állítottuk össze, az Anvi'o által azonosított 39 tandem riboszomális fehérje összehangolásán (MUSCLE, v.3.8.1551)81.Pozíciói csökkentek.hogy a genom legalább 50%-át lefedje82, és a Planctomycecota-t használták külső csoportként a GTDB fa topológiája alapján.Egy 40 uscMG-ből álló fa ugyanazokkal az eszközökkel és paraméterekkel készült.
A Traitar (v.1.1.2) alapértelmezett paraméterekkel (fenotípus, nukleotidokból)83 használtuk a gyakori mikrobiális tulajdonságok előrejelzésére.Egy potenciális ragadozó életmódot tártunk fel egy korábban kidolgozott ragadozó index84 alapján, amely a genom fehérjét kódoló gén tartalmától függ.Pontosabban, a DIAMOND segítségével hasonlítjuk össze a genomban lévő fehérjéket az OrthoMCL adatbázissal (v.4)85 a –érzékenyebb –id 25 –query-cover 70 –subject-cover 70 –top 20 és megszámoljuk a megfelelő géneket. a ragadozók és nem ragadozók markergénjei.Az index a ragadozó és nem ragadozó jelölések számának különbsége.Kiegészítő kontrollként a „Ca” genomot is elemeztük.Az Entotheonella TSY118 faktor a Ca-val való kapcsolatán alapul.Eudoremicrobium (nagy genomméret és bioszintetikus potenciál).Ezt követően teszteltük a potenciális kapcsolatokat a ragadozó és nem ragadozó markergének, valamint a Ca bioszintetikus potenciálja között.Eudormicrobiaceae” és azt találta, hogy legfeljebb egy gén (bármilyen típusú markergénből, azaz a ragadozó/nem ragadozó génből) fedi át a BGC-t, ami arra utal, hogy a BGC nem keveri össze a predációs jeleket.A kódolt replikonok további genomi annotációját TXSSCAN (v.1.0.2) segítségével végeztük el a szekréciós rendszer, a pili és a flagella86 specifikus vizsgálatára.
Öt reprezentatív 'Ca'-t térképeztek fel 623 metatranszkriptom feltérképezésével a Tara-óceánok prokarióta és eukarióta dúsító frakcióiból22, 40, 87 (BWA, v.0.7.17-r1188, -a zászló használatával).Eudormicrobiaceae genom.A BAM fájlokat a FeatureCounts (v.2.0.1)88 programmal dolgoztuk fel 80%-os olvasási lefedettség és 95%-os identitásszűrés után (a featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p opciókkal) Számolja a inszertek száma génenként.A generált térképeket normalizáltuk a génhosszra és a markergén-bőségre, a mOTU-ra (hosszúság-normált átlagos inszerciószám a 0-nál nagyobb beépülési számmal rendelkező gének esetében), és log-transzformáltuk 22,74-re, hogy megkapjuk az egyes génszintek sejtenkénti relatív expresszióját, ami szintén megmagyarázza a variabilitás mintáról mintára a szekvenálás során.Az ilyen arányok lehetővé teszik az összehasonlító elemzést, enyhítve az összetételi problémákat a relatív abundancia adatok használatakor.Csak a 10 mOTU markergénből több mint 5-öt tartalmazó mintákat vettünk figyelembe további elemzéshez, hogy lehetővé tegyük a genom elég nagy részének kimutatását.
A 'Ca.Az E. taraoceanii-t dimenziócsökkentésnek vetettük alá UMAP segítségével, és a kapott reprezentációt HDBSCAN segítségével (lásd fent) felügyelet nélküli klaszterezéshez használtuk az expressziós állapot meghatározására.A PERMANOVA az azonosított klaszterek közötti különbségek jelentőségét teszteli az eredeti (nem csökkentett) távolságtérben.Az ezen állapotok közötti differenciált expressziót teszteltük a genomban (lásd fent), és 201 KEGG útvonalat azonosítottak 6 funkcionális csoportban, nevezetesen: BGC, szekréciós rendszer és flagelláris gének a TXSSCAN-ból, degradációs enzimek (proteáz és peptidázok), valamint ragadozó és nem. ragadozó gének.ragadozó indexjelzők.Minden egyes mintához kiszámítottuk az egyes osztályokhoz tartozó átlagos normalizált expressziót (megjegyzendő, hogy magát a BGC-expressziót a bioszintetikus gének medián expressziójaként számítjuk ki az adott BGC-hez), és teszteltük az állapotok közötti szignifikanciát (Kruskal-Wallis teszt FDR-hez igazítva).
A szintetikus géneket a GenScripttől, a PCR primereket a Microsynth-től vásároltuk.A DNS-amplifikációhoz a Thermo Fisher Scientific phúziós polimerázát használtuk.A DNS-tisztításhoz NucleoSpin plazmidokat, NucleoSpin gélt és Macherey-Nagel PCR tisztító kit-et használtunk.A restrikciós enzimeket és a T4 DNS-ligázt a New England Biolabs-tól vásároltuk.Az izopropil-β-d-1-tiogalaktopiranozidon (IPTG) (Biosynth) és az 1,4-ditiotreiton (DTT, AppliChem) eltérő vegyszereket a Sigma-Aldrich cégtől vásároltuk, és további tisztítás nélkül használták fel.A kloramfenikol (Cm), spektinomicin-dihidroklorid (Sm), ampicillin (Amp), gentamicin (Gt) és karbenicillin (Cbn) antibiotikumokat az AppliChemtől vásároltuk.A Bacto Tryptone és Bacto Yeast Extract táptalaj komponenseit a BD Biosciences cégtől vásároltuk.A szekvenáláshoz szükséges tripszint a Promegától vásároltuk.
A génszekvenciákat az anti-SMASH megjósolt BGC 75.1-ből vontuk ki.E. malaspinii (Kiegészítő információ).
Az embA (lókusz, MALA_SAMN05422137_METAG-framework_127-gene_5), az embM (lókusz, MALA_SAMN05422137_METAG-framework_127-gene_4) és az embAM (beleértve a génközi régiókat) géneket (beleértve a génközi régiókat) optimalizálták az E-ben expresszió nélkül a pRC5-ben, és szekvenálták a kooperatív konstrukciós konstrukcióban (co)7. amikor.Az embA gént a pACYCDuet-1(CmR) és a pCDFDuet-1(SmR) első többszörös klónozási helyére (MCS1) szubklónoztuk BamHI és HindIII hasítási helyekkel.Az embM és az embMopt géneket (kodonoptimalizált) MCS1 pCDFDuet-1(SmR)-be szubklónoztuk BamHI-vel és HindIII-mal, és a pCDFDuet-1(SmR) és pRSFDuet-1(KanR) (MCS2) második többszörös klónozóhelyére helyeztük. NdeI/ChoI.Az embAM kazettát pCDFDuet1(SmR)-be szubklónoztuk BamHI és HindIII hasítási helyekkel.Az orf3/embI gént (lókusz, MALA_SAMN05422137_METAG-scaffold_127-gene_3) átfedés-kiterjesztésű PCR-rel állítottuk elő EmbI_OE_F_NdeI és EmbI_OE_R_XhoI primerek felhasználásával, NdeI-gyel emésztettük, a pCSM-D restrikciót használva NdeI/Xho1-DMB-re ligáltuk. enzimek (kiegészítő asztal).6).A restrikciós enzimes emésztés és ligálás a gyártó (New England Biolabs) protokollja szerint történt.
Feladás időpontja: 2023. március 14