Склапање транскриптома и откриће гена меснате стабљике Цистанцхе Десертицола-Ⅰ
Sep 06, 2024
Позадине
Цистанцхе десертицола је потпуно нефотосинтетичка паразитска биљка велике медицинске вредности и углавном је распрострањена у пустињи северозападне Кине. Његова осушена месната стабљика је кључни тоник утрадиционална кинеска медицинаса улогама углавном побољшања мушке сексуалне функције и јачања имунитета, али је неколико механичких студија спроведено делимично због недостатка геномских и транскриптомских ресурса.

ПРИРОДНА ЦИСТАНЦХЕ ТУБУЛОСА КИНЕСКА ТРАДИЦИОНАЛНА МЕДИЦИНА ПХГС75% ЕЦХ 30% АЦТ 12%
Резултати
У овој студији, извршили смо дубоко секвенцирање транскриптома у меснатом стаблу Ц. десертицола, и око 80 милиона читања је генерисано коришћењем Иллумина секвенцирања парних крајева на платформи ХиСек2000. Користећи тринити асемблер, добили смо 95.787 секвенци транскрипта са дужинама транскрипта у распону од 200 бп до 15.698 бп, са просечном дужином од 950 база и дужином Н50 од 1.519 база. 63.957 транскрипата је идентификовано као активно експримирано са ФПКМ већим или једнаким 0,5, у којима је 30.098 транскрипата означено описима гена или терминима онтологије гена анализом сличности секвенци у неколико јавних база података (Унипрот, НР и Нт у НЦБИ и КЕГГ) . Штавише, идентификовали смо кључне ензимске гене укључене у биосинтезу лигнина и фенилетаноидних гликозида (ПхГ) за које се зна да су примарни активни састојци. Четири гена фенилаланин амонијак-лијазе (ПАЛ), први кључни ензим у биосинтези лигнина и ПхГ, идентификована су на основу поређења секвенци и филогенетске анализе. Такође су први пут предложена два пута биосинтезе ПхГ.
Закључци
Све у свему, завршили смо глобалну анализу транскриптома меснате стабљике Ц. десертицола користећи РНА-сек технологију. Колекција ензимских гена повезаних са биосинтезом лигнина и фенилетаноидних гликозида идентификована је из састављених и анотираних транскрипата, а такође је предвиђена и породица гена ПАЛ-а. Подаци о секвенци из ове студије ће обезбедити драгоцен ресурс за спровођење будућих истраживања биосинтезе фенилетаноидних гликозида и функционалних геномских студија у овој важној лековитој биљци.
Увод
Ц. десертицола је светски род вишегодишњих пустињских биљака из породице Оробанцхацеае и потпуно је нефотосинтетичка врста и обично расте подземна холопаразитска биљка. Паразитира на корену псамофита Халокилон аммодендрон (Цхеноподиацеае), који углавном насељава пустиње и полупустиње због високе толеранције на сушу и сланост. Ц. десертицола показује јаку отпорност на оштре услове животне средине и углавном је распрострањена у северозападној Кини, посебно у Унутрашњој Монголији, Гансуу и Синђијангу. Последњих година се сматра угроженом дивљом врстом због повећане потрошње људи. Ц. десертицола, који се често назива пустињски гинсенг, опште је познат као пустињска репа, а осушена месната стабљика се већ дуги низ година увелико користи као традиционално важан тоник у Кини и Јапану. Првобитно је забележен у Схен Нонг Бен Цао Јинг (Речник кинеске Материа Медица, 1977) пре отприлике 1800 година и сматран је једним од главних извораКинеска лековита биљка Цистанцхе.

ПРИРОДНА ЦИСТАНЦХЕ ТУБУЛОСА ЗА ПОБОЉШАЊЕ СЕКСУАЛНЕ ФУНКЦИЈЕ ПХГС75% ЕЦХ 30% АЦТ 12%
Екстракти Ц. десертицола поседују широк спектар лековитих функција, посебно за употребу у побољшању сексуалне функције, тонизацији бубрега, заштити јетре, апериентној активности, побољшању памћења, имуномодулаторном, антиоксидативном деловању, антиинфламаторном, антивирусном деловању итд. главне биоактивне компоненте Ц. десертицола су фенилетаноидни гликозиди (ПхеГс, ПхГс). До данас је више од 20 фенилетаноидних гликозида изоловано из сочне стабљике Ц.десертицола. међу њима,актеозид и ехинакозидсу две главне компоненте са значајним фармаколошким активностима и документоване су као стандарди квалитета Ц. десертицола у кинеској фармакопеји (издања из 2005. и 2010.). Три хемијске компоненте ПхГ су органска киселина, сахарид и фенилетаноид, међутим, детаљи који се тичу путева биосинтезе фенилетаноида остају слабо схваћени код Ц.десертицола.
Упркос комерцијалном и медицинском значају Ц.десертицола, геномски и транскриптомски подаци ове врсте су веома ограничени. Нема доступних ЕСТ у бази података НЦБИ и комплетне информације о геному за ову врсту остају недоступне осим за секвенцу генома хлоропласта. Ограничени транскриптомски подаци ометају проучавање биосинтетских механизама ПхГ. РНА-сек технологија може да генерише секвенце експримираних делова циљаног генома и идентификује гене [18] користећи НГС технолошке платформе (као што су Апплиед Биосистемс СОЛиД, Иллумина ХиСек и Роцхе 454). Постаје све популарнији у склапању транскриптома де ново, пошто је то исплатив и моћан приступ са високом резолуцијом и широким динамичким опсегом, посебно зато што има предност да истражује транскрипте са малом количином. Због различитих предности, РНА-сек је посебно привлачан за немоделне организме са ограниченим генетским ресурсима. Међутим, не постоји детаљна истраживања о транскриптому Ц. десертицола помоћу РНА-сек.
У овој студији смо глобално секвенцирали транскриптом стабла за Ц. десертицола користећи Иллумина Хисек2000 платформу и добили 7,9Г необрађених података. Састављањем и анотацијом, ископали смо гене укључене у биосинтезу ПхГ и гене одговорне за целокупну биосинтезу лигнина. Наша РНА-сек анализа створила је први консензус транскриптом Ц. десертицола и пружила нове увиде у свеобухватно разумевање медицинске вредности Ц. десертицола. Поред тога, овде описана метода може се широко применити на профилисање транскриптома како би се олакшало откривање гена укључених у путеве биосинтезе специфичних медицинских компоненти у другој лековитој биљци са веома ограниченим геномским ресурсима.
Материјали и методе
Сакупљање биљног материјала
Свеже сочно стабло за Ц. десертицола у фази ископавања сакупљено је из базе биљака у БаианХот Цити оф Алка Леагуе у Унутрашњој Монголији у северозападној Кини. Дозвола за сакупљање добијена је од власника (ХонгКуи ЦонгРонг Гроуп) базе фабрике. Узорак ваучера депонован је у језгру геномске установе на Пекиншком институту за геномику Кинеске академије наука. Након чишћења, ткива сочне стабљике су исечена на мале комаде и одмах замрзнута у течном азоту, а затим ускладиштена на -80 степени до даље обраде.
Екстракција РНК, конструкција библиотеке цДНК и секвенцирање Иллумина
Укупна РНК је екстрахована из сукулентне стабљике коришћењем ТРИзол реагенса (Инвитроген Инц., Калифорнија, САД) према упутствима произвођача. Добијени узорци су третирани са ДНазом И да би се уклонила било каква геномска ДНК. Екстраховане РНК су квантификоване коришћењем Агилент 2100 биоанализера (Агилент Тецхнологиес) и проверене на интегритет коришћењем електрофорезе денатуришућег агарозног гела са бојењем етидијум бромидом. У наредним анализама коришћени су узорци РНК са односом А260/А280 између 1,9 и 2,1, односом РНК 28С:18С већим од 1,0 и бројевима интегритета РНК (РИН) -8.5.
РНА-сек библиотеке су генерисане коришћењем комплета за припрему узорака Иллумина Трусек РНА. Поли(А)+ РНК је изолована из укупне РНК коришћењем Динал лиго(дТ)25 куглица према упутствима произвођача. После пречишћавања, додат је пуфер за фрагментацију да би се мРНА разбила на кратке фрагменте. цДНК првог ланца је синтетизован коришћењем ових кратких фрагмената као шаблона, заједно са СуперСцрипт ИИИ реверзном транскриптазом и Н6 случајним хексамерним прајмером. Други ланац цДНК је затим синтетизован коришћењем пуфера, дНТПс, РНасеХ и ДНК полимеразе И. Резултујућа дволанчана цДНК је подвргнута крајњој поправци коришћењем Т4 ДНК полимеразе, ДНК полимеразе И Кленов фрагмента и Т4 полинуклеотид киназе, и везана за адаптери који користе Т4 ДНК лигазу. Адаптор-лигирани фрагменти су пречишћени коришћењем КиаКуицк ПЦР екстракционог комплета и елуирани са ЕБ пуфером. После анализе применом електрофорезе у агарозном гелу, одговарајући фрагменти су одабрани као шаблони за ПЦР амплификацију. Секвенцирање резултујуће библиотеке цДНК је изведено са Иллумина ХиСек 2000 системом.
Транскрипти де ново склапање и квантификација експресије гена
Необрађена читања генерисана секвенцирањем су очишћена уклањањем секвенци адаптера (АТЦТЦГТАТГЦЦГТЦ) коришћењем интерне методе. Затим смо спровели строги процес филтрирања ниског квалитета. Прво, базе са оценом квалитета пхред нижим од 20 би се исецале од 3' краја низа, све док не наиђу на једну базу са вишим квалитетом (већи или једнак 20). Ако је дужина читања била краћа од 50 бп, била би одбачена. Друго, читања ће бити додатно филтрирана по критеријуму да 70% база у једном читању има висококвалитетне оцене (веће или једнако 20). Треће, за даљу монтажу су коришћена само читања упарених крајева. Де ново састављање транскрипта је спроведено коришћењем Тринити издања_20130216 [30] које се састојало од три узастопна софтверска модула: Инцхворм, Цхрисалис и Буттерфли. Параметри склопа су постављени на следећи начин: -секТипе фк-ЈМ 300Г -мин_цонтиг_дужина 200-ЦПУ 20-инчни црв_цпу {{21} }бфлиЦПУ 20.
Да би се квантификовала обиље транскрипта, секвенцирана читања на крају пара су поново поравната са састављеним транскриптима користећи скрипту у Тринити-у. Мапирана очитавања су коришћена за квантификацију помоћу софтвера РСЕМ (РНА-Сек би Екпецтатион Макимизатион). Обиље гена или изоформе је представљено вредношћу фрагмента по килобази транскрипта на милион фрагмената мапираних (ФПКМ), они транскрипти са вредношћу ФПКМ једнаким или већим од 0.05 дефинисани су као изражени.
Функционална анотација изражених транскрипата
Не постоје скупови генских анотација Ц. десертицола осим генома хлоропласта [1]. Означили смо изражене транскрипте тако што смо их упоредили са Генбанк Нт, Генбанк Нр и ТАИР10_ пеп_20101214_ажурираним скуповима података одвојено користећи програм БЛАСТ (Е< = 1e-20). Meanwhile, all expressed transcripts were translated into potential proteins according to ORF prediction by TransDecoder and predicated for the conserved domains based on the Pfam database.
Онтологија гена и напомена КЕГГ путање Усклађивањем сличности секвенци са Унипрот базом података (Гене онтологи (ГО) анотација свих састављених транскрипата добијена је коришћењем асоцијације преузете са (фтп://фтп.еби.ац.ук/пуб/) базе података/ГО/гоа/УНИПРОТ/гене_унипрот.гз груписање изражених гена је спроведено коришћењем прилагођених скрипти, а ми смо обележили гене на четвртом нивоу. ЦЦ, БП и МФ категорије одвојено.
Информације о КЕГГ путањи додељене су за све предвиђене секвенце протеина коришћењем онлајн алата КААС (КЕГГ Аутоматиц Аннотатион Сервер) [34]. Секвенце у фаста формату су достављене на захтев КААС-а, а резултујуће датотеке са свим информацијама о путевима у вези са транскриптомом стабла Ц. десертицола су преузете. 13 скупова генских података биљних организама у КЕГГ коришћено је за анотацију коришћењем ББХ (би-дирецтионал бест хит) методе.

ПРИРОДНИ ЦИСТАНЦХЕ ТУБУЛОСА ЦИСТАНЦХЕ ЕКСТРАКТ ПХГС75% ЕЦХ 30% АЦТ 12%
РТ-кПЦР анализа
После дигестије са ДНазом И, приближно 5 уг укупне РНК је претворено у цДНК првог ланца путем реакције реверзне транскрипције са олиго(дТ)15 прајмерима и ГоСцрипт системом реверзне транскрипције (Промега). цДНК производи су затим разблажени 10- пута дејонизованом водом без нуклеаза пре употребе као шаблон у ПЦР-у у реалном времену. Специфичне цДНК су амплификоване помоћу ГоТак 2-Степ РТ-кПЦР система (Промега) у запремини од 20 ул. ПЦР амплификација је изведена на температури жарења од 60 степени са 7500 Реал-Тиме ПЦР Детецтион Систем (Апплиед Биосистемс) према упутствима произвођача. Релативна заступљеност транскрипта је израчуната методом прага упоредног циклуса са геном "цомп10579_ц0" као интерним стандардом, коришћењем софтвера 7500 Манагер.
Парови прајмера за РТ-ПЦР дизајнирани су на основу онлајн софтвера (хттп://пример3.ут.ее/) и наведени су у С1 скупу података.
Резултати
Секвенцирање РНК и де ново састављање транскриптома меснатог стабла Ц. десертицола
Стабљика Ц. десертицола се већ дуги низ година увелико користи као традиционално важан тоник у Кини и Јапану. Да бисмо добили глобални преглед експресије гена у меснатом стаблу Ц. десертицола, сакупили смо узорке стабљике Ц. десертицола исте биљне базе 2013. и 2014. године. Укупне РНК су екстраховане и полиА+ РНК су пречишћене да би се конструисале РНА-сек библиотеке са упареним крајевима. 79,433,734 и 86,019,176 читања на крају пара који одговарају скоро 8 милијарди и 8,6 милијарди база секвенце добијено је коришћењем Иллумина ХиСек 2000 секвенцирања

платформа у узорцима 2013-године и 2014-године (табела 1). Након уклањања секвенци адаптера и филтрирања читања ниског квалитета (погледајте детаље у Методама), 64,831,040 висококвалитетних читања на крају пара у узорку 2013-године коришћено је за ново састављање транскриптома. Користећи Тринити секвенциони монтажер [30], генерисано је 51.719 гена и 95.787 секвенци транскрипта са дужинама транскрипта у распону од 200 бп до 15.698 бп. Просечна дужина састављених транскрипата је 950 основа, а дужина Н50 је 1.519 основа. Број транскрипата различитих дужина открио је да је 57,32% састављених транскрипата било око 500 бп или дуже (слика 1А). Висококвалитетна читања на крају у пару у узорку 2014- године су мапирана у састављени транскриптом. Поред тога, открили смо да је број транскрипта за сваки састављени ген варирао и да је 69% гена са једном експримираном изоформом, док је 31% гена експримирало два или више транскрипата (слика 1Б).
Квантификација експресије и функционална анотација састављених транскрипата
Обиље гена или транскрипта је квантификовано коришћењем пакета РСЕМ, у коме су секвенцирана читања поново поравната са окупљеним генима или секвенцама транскрипата користећи Бовтие, а та мапирана очитавања су коришћена за квантификацију. Израчуната је вредност ФПКМ за сваки ген или транскрипт и на крају смо идентификовали 63.957 и 52.857 активно експримираних транскрипата (ФПКМ вредност већа или једнака 0.5) у узорцима меснатих стабљика Ц. десертицола у 2{{17} }13. односно 2014. године. 44.776 транскрипата (70,01% у 2013-годишњем узорку, 84,71% у 2014-}годишњем узорку) је уобичајено изражено у две реплике, а корелација (Пирсонов коефицијент корелације: 0,91979) њихових података о експресији је била приказано на С1 слици. Необрађени подаци о секвенцирању су учитани у НЦБИ СРА базу података (приступни бројеви: СРКС857402 и СРКС858938). Користили смо експримиране гене идентификоване у 2013-годишњем узорку за даљу анализу. Функционалне напомене за све изражене транскрипте добијене су коришћењем две методе. Прво, сви експримирани транскрипти су одвојено усклађени са познатим базама података нуклеотида (ГенБанк нт) и пептидних секвенци (ГенБанк нр и Арабидопсис пептид) помоћу БЛАСТ алгоритма. Од 63.957 исказаних транскрипата,

29.220 (45,7%) је означено и показало хомологију са секвенцама у било којој од три базе података са Е-вредношћу граничне вредности 1е-20. У међувремену, региони кандидати за кодирање за све експримиране секвенце транскрипта су предвиђени коришћењем софтвера ТрансДецодер, а најдужи ОРФ-ови за сваки транскрипт су коришћени за претрагу Пфам домена. Као резултат тога, 21.358 (33,4%) транскрипата је означено на основу Пфам базе података. Све у свему, 30.098 (47,1%) транскрипата је значајно усклађено са познатим генима у јавним базама података комбиновањем две горе наведене методе. Комплетна листа експресних транскрипата са напоменом функције приказана је у допунским подацима (С2 Датасет).
Испитали смо 20 најизраженијих транскрипата (Табела 2) који одговарају 18,99% свих очитавања секвенцирања и открили да су већина њих гени који реагују на абиотичке

стресни стимуланс. Дехидрин (ДХНс), класа хидрофилних и термостабилних стресних протеина са великим бројем наелектрисаних аминокиселина које припадају породици са обиљем касне ембриогенезе (ЛЕА) групе ИИ, је ген са највећом експресијом. Три различита транскрипта Дехирина (цомп28713_ц0_сек1/2/4) су откривена као високо изражена у меснатим стабљикама које могу бити укључене у заштиту ћелија од оштећења изазваних стресом од суше. Утврђено је да су и други гени повезани са стресом, као што су протеин топлотног шока, протеин повезан са патогеном и металотионеин, веома изражени, што може бити повезано са тешким окружењем за преживљавање. Поред тога, неки конститутивни гени укључујући 26С рибосомалну РНК ген (цомп22329_ц2_сек1), ауксином потиснут/протеин повезан са мировањем (цомп20999_ц0_сек1), Фактор АДП-рибозилације (цомп20499_ ц0_сек1) је такође високо транскрибован.

ПРИРОДНА ЦИСТАНЦХЕ ТУБУЛОСА ЗА ПОБОЉШАЊЕ ИМУНИТЕТА ПХГС75% ЕЦХ 30% АЦТ 12%







