Niestabilne utajone transkrypty w mutantach egzorybonukleazy 5'-3' XRN3 Arabidopsis thaliana – ich biogeneza i znaczenie dla funkcjonowania komórki. mgr Michał Krzysztoń Instytut Genetyki i Biotechnologii, Wydział Biologii, Uniwersytet Warszawski Promotor: prof. dr hab. Joanna Kufel Recenzenci: prof. dr hab. Małgorzata Boguta Zakład Genetyki, Instytut Biochemii i Biofizyki, Polska Akademia Nauk prof. dr hab. Artur Jarmołowski Zakład Ekspresji Genów, Wydział Biologii, Uniwersytet im. Adama Mickiewicza w Poznaniu Egzorybonukleazy pełnią rozliczne funkcje niezbędne do prawidłowego działania komórki, co sprawia, że najważniejsze z nich, takie jak białka XRN czy kompleks egzosomu, są silnie konserwowane u wszystkich organizmów eukariotycznych. Białka z rodziny XRN degradują RNA od końca 5' cząsteczki, a wszystkie zbadane Eukaryota posiadają co najmniej dwa jego paralogii: jeden zlokalizowany w cytoplazmie a drugi w jądrze komórkowym. Do najlepiej zbadanych jądrowych przedstawicieli tej rodziny białek należą Rat1 z Saccharomyces cerevisiae i XRN2 z komórek ludzkich. W większości przypadków do funkcji jądrowych egzorybonukleaz 5'-3', oprócz roli w degradacji różnego typu cząsteczek RNA wspólnej z jego cytoplazmatycznymi odpowiednikami, należy także dojrzewanie niezbędnych strukturalnych RNA takich jak rybosomalne i małe jąderkowe RNA. Jednak przede wszystkim mają one ważny udział w potranskrypcyjnych procesach związanych z działaniem kompleksów DNA-zależnych polimeraz RNA I i II (Pol II). Jednym z podstawowych zadań tych białek jest terminacja transkrypcji Pol II, która zachodzi według mechanizmu torpedowo-allosterycznego. Rozpoczyna się ona od cięcia endonukleolitycznego nowopowstającego transkryptu przeprowadzanego przez kompleks cięcia i poliadenylacji formujący koniec 3' mRNA. Jednocześnie powstaje monofosforylowany koniec 5' cząsteczki RNA, który jest ciągle związany z kompleksem Pol II, będący substratem dla jądrowych białek z rodziny Rat1/XRN2. Jego skracanie umożliwia dogonienie kompleksu Pol II, który wcześniej ulega spowolnieniu na różnego rodzaju sekwencjach pomocniczych, i w konsekwencji prowadzi do uwolnienia polimerazy z matrycy DNA. W modelowym organizmie roślinnym Arabidopsis thaliana występują dwa bardzo zbliżone do siebie sekwencją jądrowe białka XRN: AtXRN2 i AtXRN3, pełniące dosyć słabo poznane, ale jednak prawdopodobnie w dużej mierze odmienne funkcje. W przeciwieństwie do AtXRN2, brak AtXRN3 jest letalny, co sugeruje jego podstawowe znaczenie dla działania komórki. Istnieje niewiele prac opisujących funkcje białka AtXRN3, ale wydaje się, że to nie ich zaburzenia wywołują śmierć embrionu roślinnego. W większości przypadków ich wyniki oparte są o stosunkowo słabego hipomorficznego mutanta xrn3-3 lub o mutację w genie FRY1, którego produkt jest odpowiedzialny za usuwanie cząsteczek adenozyno-5',3'bisfosforanu (pAp) - inhibitora wszystkich białek rodziny XRN, ale białko FRY1 posiada także dodatkowe, niezależne funkcje. Otrzymana w naszym laboratorium linia xrn3-8 z częściowo wyciszonym genem AtXRN3 charakteryzuje się bardzo niskim poziomem jego mRNA jednocześnie unikając wątpliwości co do źródła obserwowanych fenotypów, co ma miejsce w mutancie fry1-6. W ramach tej pracy badałem funkcje egzorybonukleazy AtXRN3 w terminacji transkrypcji kompleksu Pol II. Jedną z podstawowych konsekwencji związanych z defektem tego procesu jest gromadzenie się transkryptów z rejonów poniżej końca 3' genów. W większości prac fenotyp ten jest badany jedynie na podstawie wybranych genów referencyjnych, jednak jednym z elementów szerokiego projektu, którego ta praca stanowi część, jest globalne zidentyfikowanie skutków zaburzeń terminacji transkrypcji. Trzy różne wysokoprzepustowe eksperymenty (włączone jedynie fragmentarycznie do tej pracy doktorskiej) wykazały akumulację cząsteczek RNA pochodzących z rejonów bezpośrednio poniżej końca 3' bardzo dużej liczby genów. Równolegle została przeprowadzona analiza wybranych loci przy pomocy półilościowego i ilościowego PCR potwierdzając tą obserwację i sugerując nawet szersze rozpowszechnienie tej klasy cząsteczek, nazwanej XAT (ang. XRN3-associated transcripts), niż można wnioskować na podstawie danych wysokoprzepustowych. Jest to spowodowane wysoką czułością technik opartych o amplifikację oraz stosunkowo niskim i zróżnicowanym poziomem przedstawicieli XAT. Eksperyment związany z indukcją ekspresji genów przy pomocy kwasu abscysynowego w mutancie xrn3-8 wskazał, że akumulacja XAT zależy od poziomu ekspresji genu leżącego powyżej nich, co stanowi silną przesłankę na temat ich biogenezy jako rezultatu defektu terminacji transkrypcji. Zbadałem także bezpośrednio obecność kompleksów Pol II w rejonach powstawania XAT przy pomocy immunoprecypitacji chromatyny, jednak interpretacja otrzymanych wyników jest dużo trudniejsza ze względu na to, że wiele z nich pokrywa się z promotorami kolejnych genów. Powoduje to, że poziom polimerazy jest wypadkową ilości kompleksów inicjacyjnych Pol II i najprawdopodobniej niewielkiej liczby kompleksów tworzących XAT, przez co bardziej związany jest ze zmianami ekspresji danego genu niż z zaburzeniami terminacji transkrypcji genu leżącego powyżej niego. Jednak nawet uwzględniając to zastrzeżenie większość rejonów wykazuje wzbogacenie Pol II w mutancie xrn3-8 zgodnie z rolą białka AtXRN3 w uwalnianiu kompleksu polimerazy z matrycy DNA. Określenie budowy i położenia końców 5' i 3' XAT stanowi istotne źródło informacji na temat ich biogenezy. Uzyskane informacje wskazują, że oba końce większości cząsteczek XAT powstają prawdopodobnie przy udziale kompleksu cięcia i poliadenylacji. Koniec 5' dla dużej części zidentyfikowanych XAT mapuje się bezpośrednio w pobliżu sekwencji cięcia i poliadenylacji genu będącego jego źródłem, jednak istnieją od tego bardzo liczne odstępstwa, a ich przyczyny mogą być złożone. Pozostałości AtXRN3 lub inne jądrowe egzorybonukleazy mogą powodować skracanie XAT lub też niedobór tego białka może powodować wybór bardziej dystalnych sekwencji cięcia mRNA. Innym wyjaśnieniem może być zaobserwowane funkcjonowanie w niektórych rejonach kilku utajonych, normalnie nieaktywnych sekwencji cięcia i poliadenylacji prowadzących do fragmentacji nowopowstającego XAT na szereg kolejnych cząsteczek, z których, z powodu użycia specyficznych starterów, wykrywana jest tylko jedna. Działanie kompleksu cięcia i poliadenylacji prowadzi do powstania RNA z grupą monofosforanową na końcu 5', co dla XAT znajduje potwierdzenie w wynikach immunoprecypitacji cząsteczek ze strukturą kapu i uzyskanych produktach ligacji RNA. Jednak pomimo przewagi tego typu cząsteczek, jak się wydaje, istnieje również prawdopodobnie niewielka klasa XAT posiadająca strukturę kapu. Podobnie analiza ilościowa dowodzi, że znakomita większość XAT jest poliadenylowana, jednak zastosowanie sekwencjonowania produktów circular RT-PCR sugeruje istnienie także licznej klasy XAT pozbawionych tej modyfikacji. Obecność ogona poli(A) wynika prawdopodobnie z aktywacji utajonych, międzygenowych sekwencji cięcia i poliadenylacji, które być może mniej efektywne niż kanoniczne sekwencje, powodują wytworzenie dużej heterogenności położenia końca 3' XAT. Jeśli brak jest tego typu sekwencji międzygenowych terminacja XAT może zachodzić na normalnej sekwencji formującej koniec 3' mRNA kolejnego genu. Zmienność położenia końca 3' XAT może być także wywołana innymi sposobami uwalniania kompleksu Pol II, np. zwykłym odłączaniem na skutek zderzeń z innymi kompleksami Pol II, co jest zgodne z zaobserwowaną w dwóch przypadkach terminacją w pobliżu miejsca startu transkrypcji kolejnego genu, charakteryzującym się zazwyczaj dużą gęstością kompleksów inicjacyjnych polimeraz. W większości sekwencjonowanych XAT liczba dodanych reszt adeninowych jest stosunkowo niewielka co może wskazywać na albo szybką deadenylację albo na oligoadenylację, co w obu przypadkach prowadzi do degradacji ze strony 3' i może odpowiadać za zmienność położenia tego końca cząsteczek. Niski poziom, obecność frakcji cząsteczek niepoliadenylowanych oraz częściowa heterogenność położenia obu końców XAT sugeruje, że są one mało stabilne. Pomiar ich tempa degradacji po zahamowaniu transkrypcji przy pomocy kordycepiny potwierdza to przypuszczenie. Zweryfikowałem także hipotezę czy XAT rzeczywiście są specyficzne do mutantów genu AtXRN3 w tym celu wybierając reprezentacyjne linie mutantów z różnych ścieżek degradacji i kontroli jakości RNA. Transkrypty te akumulują się wyraźnie jedynie w trzech liniach wymienionych wraz z rosnącą ilością XAT: xrn3-3, fry1-6 i xrn3-8. Brak ich z kolei w mutantach innych białek XRN: xrn2-3 i xrn4-5, w mutancie cer7-3 komponentu kompleksu egzosomu usuwającym RNA z końca 3', w rrp6l1-2 rrp6l2-1 podwójnym mutancie jego jądrowych kofaktorów oraz w mutancie genu UPF1 kodującym kluczowy czynnik kontroli jakości RNA z przedwczesnym kodonem stop. Jedynie w linii cstf64-2 z uszkodzonym genem kodującym jeden z kluczowych składników kompleksu cięcia i poliadenylacji również akumulują się niewielkie ilości transkryptów z rejonów poniżej genu, ale ze względu na jego funkcje prawdopodobnie ich budowa i pochodzenie jest zupełnie inne. Obniżenie poziomu AtXRN3 powoduje także zmiany poziomu mRNA licznych genów, co zaskakujące prawdopodobnie dzięki mechanizmowi transkrypcyjnemu, a nie zaburzeniom ich degradacji. Interesującą hipotezą wydaje się powiązanie tych zmian z pojawieniem się transkrypcji XAT. Zaobserwowałem dwa loci z tandemowo ułożonymi genami za każdym, z których, w mutancie xrn3-8 pojawia się XAT, jednocześnie zmianom ekspresji ulegają przynajmniej niektóre geny z tych szeregów. Najbardziej uderzającym przykładem jest pierwsze locus w którym pierwszy wysoko wyrażany gen jest źródłem dużej ilości XAT. Mają one być może dwojaki wpływ: obniżają ekspresję genu swojego pochodzenia (np. na skutek zaburzeń tworzenia pętli genowych) oraz częściowo zachodząc na położony poniżej nisko wyrażany gen aktywują jego ekspresję (najprawdopodobniej przejście Pol II otwiera strukturę chromatyny promotorowej). XAT z tego kolejnego genu aktywują kolejny i tak, jak się wydaje, dochodzi do szeregowej aktywacji czterech kolejnych jednostek transkrypcyjnych prawdopodobnie poprzez wpływ na wiązanie inicjacyjnych kompleksów Pol II. Stanowiłoby to ciekawy przykład regulacji ekspresji genów przez niekodujące transkrypty, być może mający także znaczenie fizjologiczne, gdyż istnieją przesłanki, że w pewnych warunkach stresowych cząsteczki XAT mogą gromadzić się w komórce. Jednak proces prowadzący do zmiany profilu ekspresji za pośrednictwem XAT pozostaje niejasny, gdyż nie stwierdziłem w rejonach ich powstawia znaczących zmian w modyfikacjach postranslacyjnych histonu H3 związanych z przebudową chromatyny. Równie tajemnicze pozostaje kolejne istotne zagadnienie – w jednej z przeprowadzonych analiz wysokoprzepustowych (DRS, ang. Direct RNA Sequencing) została zidentyfikowana frakcja poli- lub oligoadenylowanych cząsteczek w mutancie xrn3-8 w skład których wchodzą niektóre introny z dosyć licznej grupy genów. Analiza ta niestety, choć bardzo czuła, jest w stanie wykazać jedynie położenie i ilość końców 3' tego typu cząsteczek bez informacji na temat reszty ich budowy. Próby potwierdzenia akumulacji wytypowanych intronów lub większych cząsteczek w skład których mogłyby one wchodzić zakończyły się niepowodzeniem. Prawdopodobnie zastosowana metoda – DRS jest dużo czulsza od licznych pozostałych, które zostały przetestowane, i jako jedyna zapewnia detekcję tej klasy cząsteczek, akumulujących się być może na skutek braku jakiejś ścieżki kontroli jakości zachodzącej przy udziale AtXRN3. Podsumowując, udało mi się potwierdzić rolę egzorybonukleazy AtXRN3 w terminacji transkrypcji Pol II głównie poprzez identyfikację i określenie właściwości niekodujących transkryptów XAT akumulujących się przy niedoborze jej aktywności. Choć wydają się one jedynie produktem pośrednim wadliwego procesu to maja one duży potencjał wpływania na ekspresję genów. Ponad to białko AtXRN3 posiada dodatkowe funkcje, które być może uda się zidentyfikować poprzez bardziej szczegółową analizę uzyskanych danych wysokoprzepustowych.