Białka PPR — molekularne czynniki regulujące ekspresję genomów organelli STRESZCZENIE B iałka PPR stanowią najliczniejszą zidentyfikowaną do tej pory rodzinę białek wiążących RNA. Występują one prawie wyłącznie w plastydach i mitochondriach organizmów eukariotycznych. Szczególnie uderzająca jest ekspansja genów kodujących białka PPR u roślin naczyniowych, która prawdopodobnie towarzyszyła opanowaniu lądów przez tę grupę organizmów. Białka PPR biorą udział w stabilizacji RNA, aktywacji translacji, redagowaniu, wycinaniu intronów, degradacji oraz obróbce transkryptów policistronowych w mitochondriach i plastydach. Choć u organizmów nieroślinnych występuje zdecydowanie mniej białek PPR, nadal odgrywają one kluczową rolę w ekspresji mtDNA, a ich mutacje przeważnie niosą ze sobą poważne konsekwencje fenotypowe związane z defektami oddechowymi. Roślinne białka PPR wiążą RNA w sposób specyficzny względem sekwencji nukleotydowej, gdzie pojedynczy motyw rozpoznaje jeden nukleotyd docelowego transkryptu. Otwiera to perspektywy tworzenia od podstaw syntetycznych sekwencji białkowych oddziałujących specyficznie z wybranymi cząsteczkami RNA, umożliwiając precyzyjne modulowanie ekspresji informacji genetycznej zapisanej w mtDNA i ctDNA. WPROWADZENIE Rodzinę białek PPR (ang. pentatricopeptide repeats) zidentyfikowano w następstwie poznania pierwszej kompletnej sekwencji genomu roślinnego, rzodkiewnika zwyczajnego (Arabidopsis thaliana), w roku 2000. Białka PPR charakteryzują się tandemowo powtórzonymi, 35-cio aminokwasowymi motywami. Pojedynczy motyw PPR tworzy dwie antyrównoległe α-helisy. Większa liczba następujących po sobie motywów PPR układa się w strukturę superhelisy z długą, dodatnio naładowaną bruzdą (Ryc. 1) [1,2]. Pomimo niewątpliwego pokrewieństwa (oraz podobieństwa strukturalnego) do motywów TPR (ang. tetratricopeptide repeats), które uczestniczą w oddziaływaniach białko-białko, motywy PPR warunkują wiązanie RNA w sposób wysoce specyficzny względem sekwencji nukleotydowej. Białka PPR (z nielicznymi wyjątkami) występują w mitochondriach i plastydach. W samym genomie rzodkiewnika zwyczajnego zidentyfikowano około 450-ciu genów kodujących białka PPR, co czyni je najliczniejszą rodziną białek wiążących RNA [3]. Dystrybucja białek PPR w zbadanych organizmach każe podejrzewać, że pojawiły się one na wczesnym etapie ewolucji eukariontów lub u bezpośredniego przodka pierwszej komórki eukariotycznej. Są one obecne u wszystkich eukariontów posiadających mtDNA i praktycznie nieobecne u prokariontów. Nieliczne organizmy prokariotyczne posiadające geny kodujące białka PPR to albo patogeny, albo symbionty organizmów eukariotycznych, co pozwala przypuszczać, że uzyskały te sekwencje na drodze horyzontalnego transferu genów [4,5]. U Opisthokonta (supergrupa obejmująca grzyby, zwierzęta i niektóre protista) liczba genów kodujących białka PPR nie przekracza trzydziestu u pojedynczego organizmu. U roślin naczyniowych nastąpiła gwałtowna ekspansja rodziny PPR, gdzie liczba genów PPR sięga od 400 do ponad 1000 na genom (Ryc. 2) [6,7]. O ile u glonów liczba białek PPR nie jest znacząco większa niż u Opisthokonta, mchy wykazują wartości pośrednie (około 100 genów PPR na genom [8]). W związku z tym, ekspansję białek PPR u roślin należy wiązać z okresem wyjścia na ląd. Bartosz Zapisek Jakub Piątkowski Instytut Genetyki i Biotechnologii; Wydział Biologii, Uniwersytet Warszawski, Warszawa Instytut Genetyki i Biotechnologii; Wydział Biologii Uniwersytetu Warszawskiego, ul. Pawińskiego 5a, 02-106 Warszawa; tel.: (22) 592 22 44, e-mail: [email protected] Artykuł otrzymano 21 sierpnia 2015 r. Artykuł zaakceptowano 5 października 2015 r. Słowa kluczowe: mitochondria, plastydy, białka PPR, metabolizm RNA, mtDNA, regulacja ekspresji Wykaz skrótów: ctDNA — chloroplastowy DNA; CMS (ang. cytoplasmatic male sterility) — cytoplazmatyczna męska sterylność; HMM (ang. hidden Markov model) — ukryty model Markova; MIOREX (ang. mitochondrial organization of gene expresion) — organizacja ekspresji genów mitochondrialnych; mtDNA — mitochondrialny DNA; PCMP (ang. plant combinatorial and modular proteins) — kombinatoryczne i modularne białka roślinne; PPR (ang. pentatricopeptide repeat) — polska nazwa; TALEs (ang. transcription-activator-like effectors) — efektory podobne do aktywatorów transkrypcyjnych); TPR (ang. tetratricopeptide repeat) — polska nazwa; UTR (ang. untranslated region) — region nieulegający translacji BIAŁKA PPR U ROŚLIN Funkcje oraz mechanizm działania białek PPR najintensywniej badane były na przykładzie białek PPR w roślinach naczyniowych. Upośledzenia ekspresji genów kodujących białka PPR niosą ze sobą zazwyczaj poważne konsekwencje fenotypowe, co wskazuje na niezwykle istotną rolę tej rodziny w koewolucji genomów organellarnych oraz genomu jądrowego, jak i na niewielką redundancję pod względem funkcji. Ten drugi wniosek znajduje dalsze potwierdzenie w stosunkowo niewielkiej zmianie w liczbie genów kodujących białka PPR pomiędzy liniami ewolucyjnymi roślin, gdzie miała miejsce duplikacja genomu oraz gdzie Postępy Biochemii 61 (4) 2015 403 Rycina 1. Struktura białka PPR na przykładzie roślinnego białka PPR10 (A) oraz struktura pojedynczego motywu PPR (B). Rycina 2. Liczba genów kodujących białka PPR w genomach wybranych organizmów. taka duplikacja nie zaszła (co świadczy o tym, że „nadmiarowe” geny PPR tracone były szybciej niż te kodujące inne białka) (Ryc. 3). Białka PPR pełnią szeroki zakres funkcji związanych z potranskrypcyjną ekspresją genomów organellowych, w tym podczas: wycinania intronów, redagowania (ang. RNA editing), stabilizacji, degradacji, obróbki transkryptów policistronowych oraz inicjacji translacji [6,9]. Roślinne białka PPR dzielą się na dwie podrodziny. Sekwencja aminokwasowa białek z podrodziny P składa się prawie wyłącznie z kanonicznych, 35-cio aminokwasowych motywów PPR oraz N-końcowej sekwencji kierującej do mitochondrium. Powszechnie uważa się, że wobec braku innych motywów funkcjonalnych, białka z tej podrodziny często pełnią funkcję adaptorową. W skład podrodziny PLS (lub PCMP, ang. plant combinatorial and modular proteins) wchodzą białka z naprzemiennie 404 powtarzającym się motywem kanonicznym (P), długim (36 reszt aminokwasowych — L) i krótkim (przeważnie 31 reszt aminokwasowych — S). Białka PLS przeważnie posiadają dodatkowe motywy C-końcowe oznaczone jako E i DYW (Ryc. 4). Biorą one udział w redagowaniu transkryptów, a sam motyw DYW wykazuje podobieństwo do domeny deaminazy cytydynowej [10-12]. Białka PPR z podrodziny P, obok stabilizowania 5’ i 3’ końców transkryptów, aktywowania translacji, udziału w splicingu i wyznaczania miejsc cięcia endonukleolitycznego [13-15], stanowią również większość zidentyfikowanych do tej pory czynników cofających męską cytoplazmatyczną sterylność (CMS, ang. cytoplasmatic male sterility), będącą przejawem tzw. „międzygenomowego wyścigu zbrojeń” pomiędzy genomem jądrowym a mitochondrialnym [16,17]. Białka z podrodziny P wiążą swoje docelowe RNA silniej niż białka PLS, co może wynikać z faktu, że ochrona przed egzorybonukleazą (bardziej niż deaminacja cytydyny) wymaga stworzenia stabilniejszego kompleksu białko–RNA. www.postepybiochemii.pl Rycina 3. Porównanie wzrostu liczebności poszczególnych grup białek w następstwie powielenia genomu roślinnego na przykładzie sorgo dwubarwnego (Sorghum bicolor) i kukurydzy zwyczajnej (Zea mays). Opis w tekście (Piątkowski, dane niepublikowane). Fenotypy dysrupcji genów kodujących białka PPR u roślin obejmują: defekty w procesie fotosyntezy, defekty w rozwoju nasion i zarodków, nadwrażliwość na stres abiotyczny, zmiany w zabarwieniu liści oraz wrażliwość na kwas abscysynowy [6]. Wszystkie tak bardzo zróżnicowane fenotypy mają swoje źródło w jednym mechanizmie molekularnym - wiązaniu konkretnych sekwencji transkryptów organelli. MECHANIZM DZIAŁANIA ROŚLINNYCH BIAŁEK PPR Jak wspomniano w poprzednim rozdziale artykułu, przewidywana struktura motywu PPR wykazuje znaczne podobieństwo do struktury motywu TPR, pomimo pełnienia odmiennej funkcji. Już w oparciu o wczesne przewidywania strukturalne sugerowano, że mechanizm rozpoznawania docelowego RNA przez białka PPR odbywa się na zasadzie jeden motyw — jeden nukleotyd, gdzie sekwencja aminokwasowa każdego motywu z osobna warunkuje jego specyficzność względem konkretnego nukleotydu. Tego rodzaju modularny mechanizm potwierdzono już wcześniej w przypadku dwóch innych rodzin białek wiążących kwasy nukleinowe w sposób specyficzny względem sekwencji: białek wiążących RNA z rodziny PUF (PUMILIO/FBF) jak i oddziałujących z DNA białek TALEs (ang. transcription activator like effectors) [18,19]. W obydwu przypadkach specyficzność względem konkretnego nukleotydu warunkują tylko nieliczne (odpowiednio: trzy i dwie) pozycje aminokwasowe w motywie. Przyjmując założenie, że podobny mechanizm działa w przypadku białek PPR, można było przeprowadzić bioinformatyczną próbę odnalezienia „kodu PPR”, opierając się o doświadczalnie ustalone docelowe sekwencje RNA rozpoznawane przez konkretne białka PPR. Analiza oparta o sekwencję rozpoznawaną przez białko PPR10 z kukurydzy zwyczajnej (Zea mays) wskazała, że kluczowe dla rozpoznawania określonych nukleotydów są pozycje aminokwasowe 5 i 35 (lub 6 i 1’ — w zależności od przyjętego systemu numeracji) [20]. Ze względu na większą wygodę (aminokwasy oddziałujące z danym nukleotydem mieszczą się w tych samych umownych granicach motywu), w tej pracy posługiwać będziemy się tym pierwszym systemem numeracji. Asparagina w pozycji 5 (gdzie indziej 6) wykazuje silną preferencję względem pirymidyny (cytydyny lub urydyny) w sekwencji RNA, podczas gdy seryna lub treonina koreluje z obecnością puryny (czyli adenozyną lub guanozyną) w rozpoznawanej sekwencji. W pozycji Rycina 4. Schematyczne przedstawienie struktury białek z podrodziny P i PLS. Opis motywów P, L, S, E i DYW w tekście. Postępy Biochemii 61 (4) 2015 405 Tabela 1. Tabela roślinnego „kodu PPR” wg [6]. Pozycja 5/6 T S S N N T S N P Pozycja 35/1’ N N S N S D D D D Preferowany nukleotyd A A A C C G G U U 35 (gdzie indziej 1’) asparaginian zwiększa powinowactwo względem urydyny lub guanozyny, podczas gdy asparagina względem cytydyny lub adenozyny (Tab. 1 i Ryc. 5) W powyższy sposób udało się określić prosty kod, umożliwiający przewidywanie docelowych sekwencji RNA rozpoznawanych przez roślinne białka PPR. Aminokwasy w pozycjach 5 i 35 znajdują się blisko siebie w strukturze przestrzennej, a łatwość tworzenia wiązań wodorowych przez ich łańcuchy boczne nasuwa skojarzenia z mechanizmem podobnym do parowania Watsona-Cricka w dupleksach kwasów nukleinowych. PPR10 było również pierwszym białkiem z rodziny PPR, dla którego udało się poznać strukturę na drodze krystalografii rentgenowskiej. Struktura białka ze związanym docelowym RNA zasadniczo potwierdziła przewidywania teoretyczne odnośnie „kodu PPR”. Wykazano też, że białka PPR przed związaniem RNA występują pod postacią homodimeru. Po związaniu RNA dimer może, ale nie musi ulec rozdysocjowaniu [2]. W przypadku innego białka PPR, THA8, stwierdzono zjawisko odwrotne, gdzie monomery THA8 dimeryzują dopiero po związaniu RNA [21]. Ta zadziwiająca różnica może wynikać z rozmiarów białka i różnej liczby powtórzeń PPR (PPR10 zawiera 19, a THA8 5 motywów PPR). Z pewną dozą ostrożności można stwierdzić, że białka PPR wykazują zdolność do dimeryzacji, na którą wpływ ma wiązanie ich docelowego RNA. EWOLUCJA ROŚLINNYCH BIAŁEK PPR Większość genów kodujących białka PPR w roślinach naczyniowych nie zawiera intronów. Tymczasem, większość z ok. 100 genów PPR mchu czareczki otwartej (Physcomitrella patens) posiada liczne introny. Można zatem wywnioskować, że gwałtowna ekspansja rodziny PPR w tej linii roślin naczyniowych zaszła na drodze retrotranspozycji [7]. Nie tłumaczy to jednak mechanizmu presji ewolucyjnej, która do tak uderzającej ekspansji doprowadziła. Wysunięto liczne potencjalne wyjaśnienia. Hipoteza „korekcji błędów w genomie” (ang. genome-debugging) postuluje, że szybko różnicujące białka PPR umożliwiają korektę mutacji akumulujących się w aseksualnie rozmnażających się organellach [22]. Duża liczba białek PLS, które wyraźnie korelują z liczbą miejsc redagowania w danym organizmie może wynikać też z większego narażenia na promieniowanie UV u roślin lądowych, a co za tym idzie — zmiany udziału poszczególnych zasad w mtDNA i ctDNA [23]. Wyjaśnienie opierające się o wizję „międzygenomowego wyścigu zbrojeń” [16,17,24] wskazuje na miejscami rozbieżne „interesy” reprodukcyjne genomów organelli i genomu jądrowego. Genom jądrowy przekazywany jest zarówno w linii męskiej, jak i żeńskiej. W związku z tym, u wielu roślin hemafrodytyzm okazuje się optymalną strategią rozrodczą. Organella są natomiast przekazywane wyłącznie w linii żeńskiej, w związku z czym produkcja gamet męskich nie przynosi genomom organelli żadnej przewagi rozrodczej. Wręcz przeciwnie, w populacji hemafrodytycznych organelle osobnika, który przestaje produkować pyłek zyskują przewagę rozrodczą nad organellami osobników, które nadal produkują zarówno gamety żeńskie jak i męskie. W efekcie mamy do czynienia z doborem preferującym warianty genomu mitochondrialnego, który produkuje nietypowe hydrofobowe białka wywołujące obumieranie pyłku. Zachodzi to jednak kosztem sukcesu reprodukcyjnego genomu jądrowego (choć są też populacje, gdzie CMS zapewnia wytworzenie korzystnej równowagi między roślinami żeńskimi a hermafrodytycznymi). Stąd liczne (kodowane jądrowo) białka PPR cofają fenotyp męskiej bezpłodności, poprzez wygaszanie syntezy białek mitochondrialnych ją wywołujących (m.in. na drodze cięcia endonukleolitycznego w określonej pozycji transkryptu mitochondrialnego lub jego destabilizacji). Białka PPR mogą również służyć koordynacji i regulowaniu poziomów syntezy białek jądrowych i organellowych. Powyższe hipotezy nie wykluczają się wzajemnie. Rycina 5. Schemat rozpoznawania nukleotydów w cząsteczce RNA przez motywy PPR. 406 Warto też wspomnieć o hipotezie silnie zakorzenionej w założeniach ewolucji neutralnej, gdzie nadmiarowe białka PPR, niespecyficznie wiążące pewne transkrypty, „rozluźniają” działający na nie dobór oczyszczający i umożliwiają pojawienie się mutacji w innej sytuacji letalnych (albo bardzo silnie obniżających dostosowanie rośliny) [25,26]. Na przykład, białko PPR wiążące 3’ koniec transkryptu, może chronić go przed egzorybonukleazami, tym samym umożliwiając wystąpienie mutacji destabilizujących strukturę www.postepybiochemii.pl spinki do włosów, która wcześniej pełniła tą sama funkcję. W efekcie, obecność takiego białka szybko staje się niezbędna dla zachowania stabilności transkryptu. RÓŻNICE POMIĘDZY BIAŁKAMI PPR U ROŚLIN I OPISTHOKONTA Przytłaczająca większość poznanych białek PPR to białka roślinne. W efekcie, początkowo tworzone profile motywu PPR nie były reprezentatywne dla białek PPR u wszystkich organizmów eukariotycznych, co z kolei doprowadziło do zaniżenia liczby białek PPR wykrywanych w genomach Opisthokonta. Wyszukiwania oparte o profile nieroślinne pomogły wykryć wcześniej niezidentyfikowane białka PPR, choć ich liczba dla większości Opisthokonta nadal nie przekracza kilkunastu. U Opisthokonta nie występuje podrodzina PLS, co nie powinno dziwić, biorąc pod uwagę brak zjawiska redagowania transkryptów organellowych w tej grupie organizmów. Jednak nawet w porównaniu z kanonicznym roślinnym motywem P, profil motywów PRR u organizmów nieroślinnych wykazuje pewną odmienność. Biorąc za przykład profile motywów PPR z dwóch gatunków drożdży: drożdży piekarskich (Saccharomyces cerevisiae) i drożdży rozszczepkowych (Schizosaccharomyces pombe), można stwierdzić, że drożdżowe motywy PPR są znacząco słabiej zachowane w ewolucji niż roślinne (Ryc. 6). Pomimo, że drożdżowe biał- Rycina 6. Profile logo dla motywów PPR białek z drożdży piekarskich, drożdży rozszczepkowych oraz białek PPR roślinnych. Należy zwrócić uwagę na inną skalę na osi y (względna entropia) dla profili drożdżowych i profilu roślinnego. Wskazuje to na znacznie wyższy poziom zachowania sekwencji roślinnych motywów PPR w ewolucji (zmodyfikowano wg [27]). Postępy Biochemii 61 (4) 2015 407 ka PPR nadal zachowują tę samą podstawową funkcję na poziomie molekularnym [27] (tj. wiązanie transkryptów mitochondrialnych), nie udało się do tej pory zidentyfikować u nich jednoznacznego i prostego „kodu PPR”, jak to miało miejsce w przypadku białek roślinnych. Podobne, choć słabiej zachowane profile dla pozycji aminokwasowych kluczowych w roślinnym „kodzie PPR” każą podejrzewać, że mechanizm rozpoznawania RNA przez białka PPR u Opisthokonta jest jednak zbliżony do tego w roślinach. W roku 2013 zidentyfikowano pierwszą podrodzinę białek PPR występującą wyłącznie u organizmów nieroślinnych: PPR-TGM. Obok ciągu motywów PPR, białka z tej podrodziny charakteryzują się C-końcową domeną metylotransferazy guaninowej o sugerowanej funkcji w metylacji tRNA [28]. Geny kodujące białka PPR-TMG występują wyłącznie u mikroorganizmów eukariotycznych należących do tak zróżnicowanych grup (i supergrup) jak: Amebozoa, Alveolata, Chlorophyta, Cryptophyta, Haptophyta i Straminopyla. Wart zauważenia jest fakt, iż do niektórych wyżej wymienionych grup taksonomicznych należą gatunki posiadające geny kodujące białka PPR z domeną DYW. Nie zidentyfikowano natomiast jeszcze żadnego gatunku, w którego genomie występowałyby jednocześnie geny kodujące białka PPR z motywem DYW i z motywem TGM [29]. Może to świadczyć o pewnej redundancji funkcjonalnej między tymi podrodzinami. Białka PPR-TGM zidentyfikowano m.in. u stanowiącego istotne zagrożenie gospodarcze pasożyta ostryg Perkinsus marinus oraz u wywołującego pełzakowicę u ludzi Entamoeba histolytica (rocznie notuje się około 50 mln zachorowań oraz ok. 100 tys. zgonów wywołanych przez tego pasożyta [30]). Uwzględniając, że związki hamujące proces metylacji RNA były już w przeszłości wykorzystywane w celach terapeutycznych, białka PPR-TGM mogą stanowić obiecujący cel dla przyszłych leków przeciwpasożytniczych. EKSPRESJA MITOCHONDRIALNEGO DNA U DROŻDŻY Drożdże, a w szczególności drożdże piekarskie oraz drożdże rozszczepkowe, są jednym z najczęściej wybieranych modeli badawczych do studiowania ekspresji genomu mitochondrialnego (mtDNA) oraz biogenezy kompleksów łańcucha oddechowego [31,32]. Rycina 7. Schematyczne przedstawienie ekspresji genomu mitochondrialnego drożdży piekarskich. mtDNA — mitochondrialne DNA; Kompleks III — cytochrom bc1; Kompleks IV — oksydaza cytochromu c; Kompleks V — mitochondrialna syntaza ATP; LSU (ang. large subunit) — duża podjednostka rybosomu; SSU (ang. small subunit) — mała podjednostka rybosomu. Rpo41 — mitochondrialna polimeraza RNA wymagająca do inicjacji transkrypcji białka Mtf1. Opis w tekście. 408 www.postepybiochemii.pl łańcucha oddechowego, zarówno poprzez kodowanie jego strukturalnych podjednostek, jak i przez uczestniczenie w obróbce RNA i procesie translacji mitochondrialnej (Ryc. 7). Mimo, iż mitochondria posiadają swój własny genom, jego replikacja, naprawa i ekspresja jest całkowicie zależna od czynników kodowanych jądrowo. Przewiduje się, że u drożdży piekarskich nawet do 800 białek kodowanych jądrowo może występować w mitochondrium, z czego 1/4 może być zaangażowana tylko w ekspresję mtDNA [33]. W konsekwencji, prawidłowa biogeneza mitochondriów wymaga skoordynowanej ekspresji dwóch różnych genomów i ich wzajemnej komunikacji na drodze oddziaływań jądrowo-mitochondrialnych [34]. W przeciwieństwie do genomu jądrowego, gdzie ekspresja na poziomie DNA jest wysoce regulowana przez wiele czynników działających zarówno cis, jak i trans (oraz przez zmianę struktury chromatyny), regulacja ekspresji genomu mitochondrialnego drożdży na etapie transkrypcji jest prosta [35-37]. Produktami transkrypcji mtDNA u drożdży są policistronowe transkrypty, które następnie podlegają złożonym procesom obróbki w celu wytworzenia dojrzałych cząsteczek RNA. Większość obecnej wiedzy na temat metabolizmu mitochondrialnego RNA pochodzi z badań na drożdżach piekarskich oraz rozszczepkowych [38]. Porównanie podstawowych cech mtDNA i jego ekspresji u drożdży piekarskich, rozszczepkowych oraz dodatkowo dla człowieka (Homo sapiens) zostało przedstawione poniżej (Tab. 2). DNA mitochondrialny u drożdży koduje jedynie kilka białek. Zarówno u drożdży piekarskich, jak i u drożdży rozszczepkowych, mtDNA koduje 8 białek, w tym jedno białko małej podjednostki mitorybosomu (VAR1 u drożdży piekarskich i RPS3 u drożdży rozszczepkowych) oraz 7 kluczowych podjednostek łańcucha oddechowego: CYTB dla kompleksu III (cytochrom cb1), COX1, COX2 i COX3 dla kompleksu IV (oksydaza cytochromu c) oraz AtTP6, ATP8 i ATP9 dla kompleksu syntazy ATP. Dodatkowo, mtDNA koduje własny zestaw 24 tRNA, dwa rRNA (15S dla małej podjednostki, 21S dla dużej podjednostki rybosomu mitochondrialnego) oraz jeden komponent dla kompleksu RNazy P (RPM1 RNA u drożdży piekarskich i rnpB u drożdży rozszczepkowych). Tym samym, wszystkie cząsteczki RNA kodowane przez mtDNA są niezbędne dla biogenezy Mimo, iż dojrzałe transkrypty powstają z tych samych policistronowych jednostek, ich poziom może się znacząco między sobą różnić, co może być wynikiem różnego tempa dojrzewania i degradacji indywidualnych transkryptów [40]. Z tego powodu, to właśnie czynniki potranskrypcyjne zaangażowane w dojrzewanie i degradację RNA wydają się odgrywać istotną rolę w regulacji ekspresji mtDNA. Co Tabela 2. Porównanie wybranych cech mtDNA i metabolizmu RNA pomiędzy drożdżami piekarskimi, rozszczepkowymi oraz człowiekiem. Na podstawie [32,38,39]. Wielkość mtDNA [kpz] Sekwencje niekodujące Miejsca replikacji Jednostki transkrypcyjne Kodowane podjednostki Kompleks I Kompleks III Kompleks IV Syntaza ATP Mitorybosom Główne mechanizmy dojrzewania RNA 5’ UTR mRNA Drożdże piekarskie od ok.75 do ok.85 zależnie od szczepu ok. 70% 8 ori 11 różne zestawienia mRNA, rRNA i tRNA 8 – CYTB COX1, 2, 3 ATP6, 8, 9 VAR1 splicing (do 8 intronów) częściowa interpunkcja tRNA RNaza P obróbka 5’ końca obróbka 3’ końca za sekwencją dodekameru (AAUAAUAUUCUU) Drożdże rozszczepkowe Człowiek ok.19 16 ok. 25% nieznane 2 różne zestawienia mRNA, rRNA i tRNA 8 – CYTB COX1, 2, 3 ATP6, 8, 9 RPS3 0% 2 (OH i OL) 3 różne zestawienia mRNA, rRNA i tRNA 13 ND1, 2, 3, 4, 4L, 5, 6 CYTB COX1, 2, 3 ATP6, 8 – splicing (do 3 intronów) pełna interpunkcja tRNA generująca dojrzały 5’ koniec RNaza P niezidentyfikowana obróbka 3’ końca za sekwencją C-core (CCCCC) brak intronów interpunkcja tRNA RNaza P poliadenylacja na 3’ końcu przez MTPAP długie krótkie długie, krótkie lub brak (zależnie od transkryptu) brak „struktury typu cap” na 5’ końcach mRNA brak sekwencji Shine-Dalgarno 3’ UTR mRNA brak ogona poli (A), sekwencja dodekameru lub C-Core chroniąca przed degradacją od 3’ końca Degradacja RNA głównie degradacja egzorybonukleolityczna np. degradosom mitochondrialny (mtEXO) i białko Pet127. Liczba tRNA i ich rozmieszczenie w mtDNA 25 zgrupowane 25 częściowo zgrupowane rRNA 15S, 21S rns, rnl RNaza P 9S RNA, białko RPM2 rnpB RNA, nieznana część białkowa Postępy Biochemii 61 (4) 2015 ogon poli (A) na 3’ końcu kompleks degradacyjny PNPase-hSUV3 22 rozproszone pomiędzy mRNA i rRNA 12S, 16S tylko białkowe podjednostki MRPP1, 2, 3, 409 ciekawe, również translacja różnych transkryptów może zachodzić na różnym poziomie, w czym udział biorą liczne i specyficzne (względem transkryptu) tzw. aktywatory translacyjne, których obecność często jest niezbędna dla zaistnienia samej translacji i stabilności mitochondrialnego mRNA [41]. Najnowsze badania pokazały również, że u drożdży piekarskich rybosom mitochondrialny oddziałuje z ogromną liczbą różnych czynników potranskrypcyjnych, tworząc wyżej zorganizowane struktury nazwane kompleksami MIOREX (ang. mitochondrial organization of gene expression) [42]. Sugerowaną rolą kompleksów MIOREX jest sterowanie ekspresją mtDNA poprzez odpowiednie organizowanie (w czasie i przestrzeni) dojrzewania, translacji i degradacji mitochondrialnego RNA. Dodatkowo, część kompleksów MIOREX współwystępuje z nukleoidem mitochondrialnym, gdzie przypuszczalnie bierze udział we wczesnych etapach jego ekspresji takich jak transkrypcja. Podsumowując, kluczowe etapy regulacji ekspresji mtDNA zachodzą na poziomie potranskrypcyjnym poprzez kontrolowaną obróbkę, stabilizację i degradację mitochondrialnych RNA oraz regulację ich translacji przez rybosom mitochondrialny i oddziałujące z nim białka. Tym samym, ekspresja genomu mitochondrialnego jest bardziej zorganizowana przestrzennie i czasowo niż wcześniej sądzono. Nadal jednak, mimo identyfikacji licznych białek kodowanych jądrowo zaangażowanych w ekspresje genów mitochondrialnych u drożdży, wiele z nich jest nadal bardzo słabo scharakteryzowanych. IDENTYFIKACJA I ROLA DROŻDŻOWYCH BIAŁEK PPR W EKSPRESJI MITOCHONDRIALNEGO DNA Identyfikacja białek typu PPR w analizach genomowych jest wymagająca ze względu na fakt, że motyw PPR jest krótki i charakteryzuje się wysokim stopniem zróżnicowania. Większość metod bioinformatycznych, które pozwoliły na identyfikację dużej liczby białek PPR u roślin, bazowała na metodach analizy wykorzystujących tzw. ukryte modele Markova (HMM, ang. hidden Markov model) [43]. Innym podejściem były próby wykrywania białek z tandemowymi powtórzeniami specyficznych sekwencji poprzez stosowanie takich programów jak TPRpred [44]. Metody te jednak korzystały z profili stworzonych w oparciu o liczne roślinne białka PPR i nie były efektywne w analizie genomów drożdżowych oraz zwierzęcych. Opracowanie bioinformatycznego narzędzia SCIPHER, opartego na algorytmie HMM i zmodyfikowanym drożdżowo-specyficznym profilu pozwoliło ostatecznie na adnotacje ponad 150 drożdżowych białek jako białka PPR (o różnej liczbie motywów PPR w sekwencji), z czego 15 znaleziono u drożdży piekarskich, a 10 u drożdży rozszczepkowych [45,46]. Wszystkie znane drożdżowe białka PPR mają przewidywane lub potwierdzone występowanie mitochondrialne i tym samym wskazuje się, że ich celami molekularnymi są cząsteczki mitochondrialnego RNA (Tab. 3). Ponieważ motyw PPR jest wysoce dywergentny, powstaje pytanie czy przeprowadzone dotychczas poszukiwania zidentyfikowały wszystkie geny kodujące białka z tej rodzi- Tabela 3. Spis białek PPR i ich sugerowane funkcje u drożdży piekarskich i rozszczepkowych. Na podstawie [27,46] oraz nieopublikowanych wyników własnych. Drożdże piekarskie Rpo41 Cbp1 Pet309 Pet111 Rpm2 Rmd9 Dmr1/Ccm1/Rrg2 Mrx1 Sov1 Aep1/Nca1 Aep2/Atp13 Aep3 Atp22/Tcm10 Rmd9L Msc6 Drożdże rozszczepkowe Ppr1 Ppr2 Ppr3 Ppr4 Ppr5 Ppr6 Ppr7 Ppr8 Rpo41 Ppr10 410 Nazwa systematyczna Sugerowane cele RNA Główna funkcja Yfl036w Yjl209w Ylr067c Ymr257c Yml091c Ygl107c Ygr150c Yer077c Ymr066w Ymr064w Ymr282c Ypl005w Ydr350c Ybr238c Yor354c wszystkie COB COX1 COX2 wszystkie tRNA mRNA i rRNA 15S rRNA, COB mRNA i rRNA VAR1 ATP9 ATP9 ATP6/8 ATP6/8 ? ? mitochondrialna polimeraza RNA stabilizacja i translacja stabilizacja i translacja translacja dojrzewanie tRNA stabilizacja stabilizacja stabilizacja i translacja stabilizacja translacja stabilizacja i i translacja stabilizacja i translacja translacja ? ? Spbc1604.02c Spbc18H10.11c Spbc19G7.07c Spac8C9.06c Spac1093.01 Spcc11E10.04 Spbc16A3.03c Spbc1289.06c Spac26H5.12 Spbc106.19 cox2, cox3 ? 15S rRNA cox1 ? atp9 atp6 cox1? wszystkie ? stabilizacja pozytywny regulator translacji stabilizacja translacja negatywny regulator translacji stabilizacja stabilizacja translacja mitochondrialna polimeraza RNA translacja www.postepybiochemii.pl ny w genomach drożdżowych. Przede wszystkim, zastanawiający jest brak u drożdży rozszczepkowych białka PPR zaangażowanego w obróbkę tRNA przez kompleks RNazy P, w którym zarówno u drożdży piekarskich, jak i u ludzi obecne jest białko PPR [47]. Brak białka o homologicznej funkcji u drożdży rozszczepkowych może sugerować, że RNaza P uległa znaczącej dywergencji w tej linii ewolucyjnej lub proces obróbki tRNA w tych drożdżach zachodzi w odmienny sposób. Choć wiele genów i mechanizmów pomiędzy drożdżami rozszczepkowymi i piekarskimi jest zachowanych, należy pamiętać, że dystans ewolucyjny, który dzieli te dwa gatunki jest bardzo znaczny. Tak jak zostało wspomniane wcześniej, mimo iż przeciętny genom roślinny koduje setki białek PPR, jedynie kilkanaście takich białek zostało zidentyfikowanych u drożdży. Jakie są więc przyczyny leżące u podstaw tak dużej różnicy liczebności tych białek pomiędzy poszczególnymi domenami? Jednym z głównych powodów mniejszej ekspansji tych białek u drożdży wydaje się być mniej złożony metabolizm RNA, w którym brak takich procesów jak trans-splicing, poliadenylacja czy redagowanie RNA, angażujących liczne roślinne białka PPR. Dodatkowo, splicing mitochondrialnego RNA, jeśli obecny u danego gatunku drożdży, zachodzi zazwyczaj tylko dla kilku transkryptów. Co więcej, żadne ze zbadanych białek PPR u drożdży nie wydaje się być wymagane dla tego procesu. Jaka jest więc dokładna funkcja białek PPR w mitochondriach drożdży? Komórki drożdżowe, u których usunięto geny kodujące białka PPR (np. w wyniku delecji sekwencji kodującej w genomie jądrowym), zazwyczaj charakteryzują się utratą zdolności oddechowych (brak wzrostu tlenowego), wynikających z zaburzeń dojrzewania i translacji mitochondrialnych RNA. Przeprowadzone w ostatnich latach analizy funkcjonalne dla większości znanych białek PPR z drożdży piekarskich i rozszczepkowych wskazują na rolę tych białek w ekspresji mtDNA, głównie poprzez zaangażowanie w stabilizację i translację RNA (Ryc. 8). Funkcja tych białek może być zarówno specyficzna względem transkryptu (np. Cbp1p i Pet111p), jak i bardziej ogólna wpływając na metabolizm większości RNA (np. Rpo41p, Rpm2p, Rmd9p i Mrx1p) oraz jego translację (np. regulatory translacji Ppr2 i Ppr5). Szczególnie istotne wydają się również białka PPR zaangażowane w metabolizm rybosomalnego RNA (np. Dmr1p i Ppr3). Stabilizując i chroniąc przed degradacją rRNA grają one kluczową rolę w biogenezie rybosomu mitochondrialnego, a tym samym pośrednio ich funkcja jest niezbędna dla biosyntezy wszystkich białek kodowanych mitochondrialnie. Ponieważ drożdżowe białka PPR składają się tylko z motywów PPR, a tym samym ich jedyną aktywnością jest wiązanie RNA, sugeruje się, że mogą pełnić one rolę adaptorową podobnie jak podrodzina P u roślin. Poza samą stabilizacją transkryptów, szczególnie interesujące jest pytanie o dokładną rolę tych białek w translacji mitochondrialnego RNA. Z jednej strony wydaje się, że poprzez wiązanie mRNA w obrębie sekwencji 5’ UTR białka PPR mogą uczestniczyć Rycina 8. Schematyczne przedstawienie głównych funkcji białek PPR w ekspresji genomu mitochondrialnego u drożdży piekarskich. mtDNA — mitochondrialne DNA; LSU (ang. large subunit) — duża podjednostka rybosomu; SSU (ang. small subunit) — mała podjednostka rybosomu. Wszystkie białka PPR zostały przedstawione kolorem fioletowym. Postępy Biochemii 61 (4) 2015 411 w lokowaniu transkryptów w miejscu ich translacji w pobliżu wewnętrznej błony mitochondrialnej. Dane z dotychczas otrzymanych wyników sugerują, że zasadniczo wszystkie etapy ekspresji mtDNA zachodzą w pobliżu wewnętrznej błony mitochondrialnej, z którą związany jest rybosom mitochondrialny [48]. Dodatkowo, wiele czynników potranskrypcyjnej ekspresji mtDNA, jak i białek PPR (np. Rmd9p), jest częściowo zlokalizowana przy wewnętrznej błonie [41]. Jest to logiczne ze względu na fakt, że kodowane przez mtDNA białka mają wysoce hydrofobowy charakter. Przybłonowy proces translacji tych białek ułatwia ich sprawne i szybkie umiejscowienie w wewnętrznej błonie, gdzie następują kolejne etapy składania kompleksów oddechowych. Z drugiej strony, odpowiednie stabilizowanie mRNA w kompleksie rybosomalnym dla jego efektywnej translacji również może być istotną funkcją tych białek PPR, które są zaangażowane w translację. Dotychczas najlepiej zbadanymi aktywatorami translacyjnymi, będącymi białkami PPR, są białka Pet111 i Pet309 z drożdży piekarskich [27]. Wszystkie roślinne białka plastydowe, u których potwierdzono wiązanie regionu 5› UTR danego transkryptu biorą jednocześnie udział w aktywacji translacji. Pierwotna hipoteza, wedle której wyższy poziom syntezy białka wynika z samej stabilizacji transkryptu przez białko PPR nie znalazła potwierdzenia w danych doświadczalnych. Okazuje się natomiast, że związanie 5’ UTR transkryptu może zapobiegać tworzeniu się struktury spinki do włosów, która pod nieobecność białka PPR hamuje inicjację translacji. Podobnego mechanizmu nie udało się jednak stwierdzić w przypadku sprzyjających translacji białek PPR w mitochondriach roślinnych. Wobec braku ustalonych doświadczalnie konkretnych sekwencji wiązanych przez drożdżowe białka PPR, tym trudniejsze jest postulowanie mechanizmu działania tych białek, w przypadku których stwierdzono udział w aktywacji translacji (takich jak Cbp1p lub Pet309p). W przypadku białka Pet309 sugeruje się jego udział (pośredni bądź bezpośredni) w rekrutowaniu rybosomu do kodonu AUG [27]. W tym kontekście szczególnie interesujące są liczne wyniki wskazujące na oddziaływanie drożdżowych białek PPR z rybosomem mitochondrialnym lub innymi czynnikami translacyjnymi [27]. Ostatnie badania skupiające się na określeniu specyficznego interaktomu mitorybosomu u drożdży piekarskich wskazują na jego niezwykle bogatą sieć oddziaływań. Oprócz identyfikacji większości znanych aktywatorów translacyjnych wykryto również wiele białek odpowiedzialnych za dojrzewanie mRNA, a wcześniej nie wiązanych z procesem translacji, w tym wszystkie znane drożdżowe białka PPR [42]. Dokładniejsze analizy, wykorzystujące metody frakcjonowania kompleksu rybosomalnego w gradiencie stężeń sacharozy wskazują, że niektóre z tych białek specyficznie komigrują tylko z małą podjednostką (np. białka Rmd9 i Dmr1), podczas gdy inne migrują wspólnie z dużą podjednostką rybosomu mitochondrialnego, jak np. białko Mrx1 (Zapisek, dane niepublikowane). U drożdży rozszczepkowych, w porównaniu do drożdży piekarskich i znanych gatunków roślin lądowych, wiedza na temat biochemii białek PPR jest jednak nadal bardzo uboga. Niemniej, wstępne wyniki również wskazują na ich oddziaływanie z rybosomem mitochondrialnym, sugerując równie 412 istotną rolę w procesie translacji mitochondrialnej (Zapisek, dane niepublikowane). EWOLUCJA RODZINY BIAŁEK PPR U DROŻDZY Rodzina PPR u drożdży podlega niezwykle szybkiej ewolucyjnej dywergencji w porównaniu do innych rodzin białkowych [45]. Analiza dopasowania sekwencji pomiędzy parami ortologów białek PPR z różnych gatunków drożdży wskazuje bardzo szybką dywergencję tych białek. Wydaje się również, że szybka ewolucja tej rodziny nie jest zależna od ich właściwości strukturalnych ponieważ strukturalnie podobne białka TPR ewoluują znacznie wolniej [45]. Jednym z możliwych wyjaśnień jest zrozumienie procesu koewolucji białka i wiązanej przez nie cząsteczki RNA. Dywergencja wiązanych sekwencji, takich jak sekwencje międzygenowe w pierwotnych transkryptach lub regiony nieulegające translacji w mRNA, zdaje się być kluczowa w procesie napędzania ewolucji białek PPR. Dość istotny w tym przypadku jest również fakt, że dywergencja genomu mitochondrialnego zazwyczaj postępuje szybciej niż genomu jądrowego. Prawie wszystkie mitochondrialne białka zaangażowane w ekspresję mtDNA są kodowane jądrowo, a prawidłowa interakcja obu genomów jest niezbędna do biogenezy funkcjonalnego łańcucha oddechowego. Brak kompatybilności pomiędzy genomami jądrowym i mitochondrialnym może prowadzić do sterylności takich hybryd oraz odpowiadać za izolację reprodukcyjną u drożdży z rodzaju Saccharomyces, a tym samym jest wskazywany jako jeden z mechanizmów napędzających specjację [49]. Rolę w tym procesie zdają się również grać białka PPR, czego interesującym przykładem jest funkcjonowanie białka Aep2 z dwóch blisko spokrewnionych gatunków z rodzaju Sacchcaromyces, mianowicie drożdży piekarskich i winiarski (Saccharomyces bayanus). Ortolog Aep2p z drożdży winiarskich nie rozpoznaje 5’ UTR mRNA genu atp9 z drożdży piekarskich, czego skutkiem jest brak translacji tego białka i defekt oddechowy [50]. Tak więc, koewolucja kodowanego jądrowo białka i wiązanego przez niego mitochondrialnego transkryptu wydaje się być kluczowa do zrozumienia powodów szybkiej ewolucji białek PPR u drożdży. BIAŁKA PPR CZŁOWIEKA U człowieka zidentyfikowano dotychczas siedem białek PPR, wszystkie o potwierdzonej lub przewidywanej lokalizacji mitochondrialnej [51]. Tak jak u drożdży, ludzka mitochondrialna polimeraza RNA (POLRMT) również posiada domenę PPR o nieznanej funkcji, choć sugeruje się jej udział w posttranskrypcyjnym metabolizmie mtRNA poprzez oddziaływanie z innymi białkami PPR [52]. Najlepiej zbadanym ludzkim białkiem PPR jest LRPPRC/LRP130, które zawiera również największą liczbę przewidzianych motywów PPR. Początkowo sugerowano, że białko to jest zaangażowane w obróbkę transkryptów genów cox1 i cox3, jednak najnowsze badania wskazują na bardziej ogólną rolę LRPPRC w regulacji poziomu wszystkich mitochondrialnych mRNA poprzez wpływ na ich transkrypcję i stabilizację [53-55]. Mutacje www.postepybiochemii.pl w LRPPRC są odpowiedzialne za kanadyjsko-francuską odmianę syndromu Leigha (miopatia mitochondrialna), mającą swoje podłoże w defekcie aktywności mitochondrialnej oksydazy cytochromu c [56]. Co ciekawe, białko LRPPRC jest także obecne w jądrze komórkowym, gdzie oddziałuje z transkrypcyjnym koaktywatorem PGC-1α odpowiedzialnym za regulacje glukoneogenezy i ekspresje genów zaangażowanych w biogenezę mitochondrialnego łańcucha oddechowego [57]. Dodatkowo, LRPPRC może również grać rolę koaktywatora PGC-1α dla jego funkcji w rozwoju i różnicowaniu komórek brązowej tkanki tłuszczowej. Działające w dwóch różnych przedziałach komórkowych, aby regulować metabolizm mitochondrialny białko LRPPRC jest doskonałym przykładem białka PPR zaangażowanego w oddziaływania jądrowo-mitochondrialne. Inne znane, choć nie tak dobrze zbadane, przykłady białek PPR człowieka to białka PTCD1, PTCD2 i PTCD3 [58-60]. PTCD1 jest negatywnym regulatorem tRNA dla leucyny, podczas gdy PTCD2 wydaje się być zaangażowany w obróbkę pierwotnego transkryptu dla genu cytB, a jego mutacja powoduje spadek aktywności kompleksu III. Wyciszenie PTCD3 skutkuje redukcją poziomu translacji mitochondrialnej, co prawdopodobnie związane jest z jego powinowactwem do rybosomalnego 12S rRNA. Tak jak u drożdży piekarskich, również jedno z białek PPR człowieka, MRPP3, jest podjednostką kompleksu RNazy P [47]. Co ciekawe, u człowieka kompleks ten składa się aż z 3 białek i nie posiada żadnego komponentu RNA [61]. Ostatnim ludzkim białkiem PPR jest białko małej podjednostki rybosomu mitochondrialnego MRPS27, wymagane do translacji mitochondrialnych transkryptów [62]. Ponieważ genom mitochondrialny i jego ekspresja u drożdży rozszczepkowych wykazuje pewne podobieństwa do wyższych eukariontów, organizm ten jest również pomocnym modelem do badań mitochondrialnych [31]. Przykładowo, biorąc pod uwagę znany zbiór białek PPR z drożdży rozszczepkowych, można znaleźć funkcjonalne podobieństwa aż do 4 ludzkich białek PPR, to jest; MRPS27 (Ppr2); PTCD1 (Ppr5); PTCD3 (Ppr3) oraz LRPPRC (Ppr4). Szczególnie istotna dla genomu mitochondrialnego wydaje się funkcja białek PTCD3 i LRPPRC, jako że ich funkcjonalne homologi (Dmr1p oraz Pet309p, odpowiednio) można też znaleźć u tak odległego ewolucyjnie gatunku jak drożdże piekarskie. Mimo wszystko, duża część drożdżowych białek PPR wydaje się być specyficzna tylko dla danego organizmu (np. funkcja Ppr1 u drożdży rozszczepkowych lub Sov1p i Rmd9p u drożdży piekarskich). Można to wytłumaczyć przez fakt, że pierwotne jednostki transkrypcyjne u odległych ewolucyjnie gatunków często różnią sie liczbą i składem genowym, a tym samym mogą wymagać unikatowych, specyficznych genowo czynników do ich obróbki i ekspresji. Przykładowo, brak jest intronów w ludzkim mtDNA, który dodatkowo koduje 7 podjednostek dla kompleksu I, nieobecnego u drożdży piekarskich i rozszczepkowych. Niemniej, ze względu na problematyczne wykrywanie motywów PPR w genomach nieroślinnych, wydaje się, że wszystkie białka PPR zarówno u drożdży, jak i u człowieka nie zostały nadal zidentyfikowane. Postępy Biochemii 61 (4) 2015 POTENCJALNIE ZASTOSOWANIA PRAKTYCZNE BIAŁEK PPR Białka PPR, choć jeszcze nie tak dokładnie zbadane pod względem strukturalnym jak rodziny białek TALEs i PUF, jako białka syntetyczne mają potencjał stać się bardzo użytecznym narzędziem w biologii molekularnej. Tym bardziej, że w teorii powinny umożliwiać rozpoznawanie dłuższych sekwencji RNA niż białka PUF (do 9-ciu nukleotydów) [18]. W ostatnich latach liczne badania poświęcono rodzinie białek TALEs, których modularna struktura, wraz z przewidywalnym kodem wiązania, umożliwia tworzenie nowych, syntetycznych białek wiążących konkretne sekwencje DNA [19,63]. Białka TALEs, podobnie jak białka PUF i PPR należą do nadrodziny alfa-solenoidowej. W przypadku białek TALEs i PUF eksperymenty dążące do projektowania białek wiążących konkretne sekwencje DNA i RNA zakończyły się sukcesem [64,65]. W odpowiedni sposób zaprojektowane białka PPR mogą szczególnie dobrze nadawać się do wpływania na regulację ekspresji genomów organelli. Należy jednak brać pod uwagę, iż żadne występujące w przyrodzie białko nie jest wyłącznie modularne, w związku z czym sekwencja poszczególnych motywów PPR ewoluowała nie tylko w kierunku rozpoznawania poszczególnych nukleotydów RNA, istotnym czynnikiem selekcyjnym niewątpliwie była także stabilność struktury trzeciorzędowej białka jako całości [66]. Niemniej, pierwsze próby projektowania i produkcji syntetycznych białek PPR zostały już podjęte, a otrzymane syntetyczne białko synthPPR charakteryzuje się, w przeciwieństwie do natywnych białek PPR, wysoką rozpuszczalnością i stabilnością w roztworach [67]. Tym samym, dalsze badania nad dokładną rolą pojedynczych aminokwasów w wiązaniu RNA wydają się być niezbędne, aby umożliwić szersze zastosowanie białek PPR w biologii syntetycznej i biotechnologii. PIŚMIENICTWO 1. Ban T, Ke J, Chen R, Gu X, Tan MH, Zhou XE, Kang Y, Melcher K, Zhu JK, Xu HE (2013) Structure of a PLS-class pentatricopeptide repeat protein provides insights into mechanism of RNA recognition. J Biol Chem 288: 31540-31548 2. Yin P, Li Q, Yan C, Liu Y, Liu J, Yu F, Wang Z, Long J, He J, Wang HW, Wang J, Zhu JK, Shi Y, Yan N (2013) Structural basis for the modular recognition of single-stranded RNA by PPR proteins. Nature 504: 168171 3. Rivals E, Bruyere C, Toffano-Nioche C, Lecharny A (2006) Formation of the Arabidopsis pentatricopeptide repeat family. Plant Physiol 141: 825-839 4. Cazalet C, Gomez-Valero L, Rusniok C, Lomma M, Dervins-Ravault D, Newton HJ, Sansom FM, Jarraud S, Zidane N, Ma L, Bouchier C, Etienne J, Hartland EL, Buchrieser C (2010) Analysis of the Legionella longbeachae genome and transcriptome uncovers unique strategies to cause Legionnaires’ disease. PLoS Genet 6: e1000851 5. Schallenberg-Rudinger M, Lenz H, Polsakiewicz M, Gott JM, Knoop V (2013) A survey of PPR proteins identifies DYW domains like those of land plant RNA editing factors in diverse eukaryotes. RNA Biol 10: 1549-1556 6. Barkan A, Small I (2014) Pentatricopeptide repeat proteins in plants. Annu Rev Plant Biol 65: 415-442 413 7. O’Toole N, Hattori M, Andres C, Iida K, Lurin C, Schmitz-Linneweber C, Sugita M, Small I (2008) On the expansion of the pentatricopeptide repeat gene family in plants. Mol Biol Evol 25: 1120-1128 8. Sugita M, Ichinose M, Ide M, Sugita C (2013) Architecture of the PPR gene family in the moss Physcomitrella patens. RNA Biol 10: 1439-1445 9. Mach J (2009) Chloroplast RNA editing by pentatricopeptide repeat proteins. Plant Cell 21: 17 10.Nakamura T, Sugita M (2008) A conserved DYW domain of the pentatricopeptide repeat protein possesses a novel endoribonuclease activity. FEBS Lett 582: 4163-4168 11.Robbins JC, Heller WP, Hanson MR (2009) A comparative genomics approach identifies a PPR-DYW protein that is essential for C-to-U editing of the Arabidopsis chloroplast accD transcript. RNA 15: 11421153 12.Wagoner JA, Sun T, Lin L, Hanson MR (2015) Cytidine deaminase motifs within the DYW domain of two pentatricopeptide repeat-containing proteins are required for site-specific chloroplast RNA editing. J Biol Chem 290: 2957-2968 13.Chateigner-Boutin AL, des Francs-Small CC, Delannoy E, Kahlau S, Tanz SK, de Longevialle AF, Fujii S, Small I (2011) OTP70 is a pentatricopeptide repeat protein of the E subgroup involved in splicing of the plastid transcript rpoC1. Plant J 65: 532-542 14.Meierhoff K, Felder S, Nakamura T, Bechtold N, Schuster G (2003) HCF152, an Arabidopsis RNA binding pentatricopeptide repeat protein involved in the processing of chloroplast psbB-psbT-psbH-petB-petD RNAs. Plant Cell 15: 1480-1495 15.Pfalz J, Bayraktar OA, Prikryl J, Barkan A (2009) Site-specific binding of a PPR protein defines and stabilizes 5’ and 3’ mRNA termini in chloroplasts. EMBO J 28: 2042-2052 16.Fujii S, Toriyama K (2009) Suppressed expression of Retrograde-Regulated Male Sterility restores pollen fertility in cytoplasmic male sterile rice plants. Proc Natl Acad Sci USA 106: 9513-9518 17.Kazama T, Nakamura T, Watanabe M, Sugita M, Toriyama K (2008) Suppression mechanism of mitochondrial ORF79 accumulation by Rf1 protein in BT-type cytoplasmic male sterile rice. Plant J 55: 619-628 18.Lu G, Dolgner SJ, Hall TM (2009) Understanding and engineering RNA sequence specificity of PUF proteins. Curr Opin Struct Biol 19: 110-115 19.Moscou MJ, Bogdanove AJ (2009) A simple cipher governs DNA recognition by TAL effectors. Science 326: 1501 20.Barkan A, Rojas M, Fujii S, Yap A, Chong YS, Bond CS, Small I (2012) A combinatorial amino acid code for RNA recognition by pentatricopeptide repeat proteins. PLoS Genet 8: e1002910 21.Ke J, Chen RZ, Ban T, Zhou XE, Gu X, Tan MH, Chen C, Kang Y, Brunzelle JS, Zhu JK, Melcher K, Xu HE (2013) Structural basis for RNA recognition by a dimeric PPR-protein complex. Nat Struct Mol Biol 20: 1377-1382 22.Schmitz-Linneweber C, Small I (2008) Pentatricopeptide repeat proteins: a socket set for organelle gene expression. Trends Plant Sci 13: 663-670 23.Fujii S, Small I (2011) The evolution of RNA editing and pentatricopeptide repeat genes. New Phytol 191: 37-47 24.Castandet B, Araya A (2012) The nucleocytoplasmic conflict, a driving force for the emergence of plant organellar RNA editing. IUBMB Life 64: 120-125 25.Gray MW, Lukeš J, Archibald JM, Keeling PJ, Doolittle WF (2010) Cell biology. Irremediable complexity? Science 330: 920-921 26.Lukeš J, Archibald JM, Keeling PJ, Doolittle WF, Gray MW (2011) How a neutral evolutionary ratchet can build cellular complexity. IUBMB Life 63: 528-537 27.Herbert CJ, Golik P, Bonnefoy N (2013) Yeast PPR proteins, watchdogs of mitochondrial gene expression. RNA Biol 10: 1477-1494 28.Manna S, Barth C (2013) Identification of a novel pentatricopeptide repeat subfamily with a C-terminal domain of bacterial origin acquired via ancient horizontal gene transfer. BMC Res Notes 6: 525 30.Tanyuksel M, Petri WA, Jr. (2003) Laboratory diagnosis of amebiasis. Clin Microbiol Rev 16: 713-729 31.Chiron S, Gaisne M, Guillou E, Belenguer P, Clark-Walker GD, Bonnefoy N (2007) Studying mitochondria in an attractive model: Schizosaccharomyces pombe. Methods Mol Biol 372: 91-105 32.Lipiński KA, Kaniak-Golik A, Golik P (2010) Maintenance and expression of the S. cerevisiae mitochondrial genome — from genetics to evolution and systems biology. Biochim Biophys Acta 1797: 1086-1098 33.Perocchi F, Jensen LJ, Gagneur J, Ahting U, von Mering C, Bork P, Prokisch H, Steinmetz LM (2006) Assessing systems properties of yeast mitochondria through an interaction map of the organelle. PLoS Genet 2: e170 34.Cannino G, Di Liegro CM, Rinaldi AM (2007) Nuclear-mitochondrial interaction. Mitochondrion 7: 359-366 35.Deshpande AP, Patel SS (2012) Mechanism of transcription initiation by the yeast mitochondrial RNA polymerase. Biochim Biophys Acta 1819: 930-938 36.Jiang H, Sun W, Wang Z, Zhang J, Chen D, Murchie AI (2011) Identification and characterization of the mitochondrial RNA polymerase and transcription factor in the fission yeast Schizosaccharomyces pombe. Nucleic Acids Res 39: 5119-5130 37.Deshpande AP, Patel SS (2014) Interactions of the yeast mitochondrial RNA polymerase with the +1 and +2 promoter bases dictate transcription initiation efficiency. Nucleic Acids Res 42: 11721-11732 38.Schafer B (2005) RNA maturation in mitochondria of S. cerevisiae and S. pombe. Gene 354: 80-85 39.Nicholls TJ, Rorbach J, Minczuk M (2013) Mitochondria: mitochondrial RNA metabolism and human disease. Int J Biochem Cell Biol 45: 845-849 40.Krause K, Dieckmann CL (2004) Analysis of transcription asymmetries along the tRNAE-COB operon: evidence for transcription attenuation and rapid RNA degradation between coding sequences. Nucleic Acids Res 32: 6276-6283 41.Herrmann JM, Woellhaf MW, Bonnefoy N (2013) Control of protein synthesis in yeast mitochondria: the concept of translational activators. Biochim Biophys Acta 1833: 286-294 42.Kehrein K, Schilling R, Moller-Hergt BV, Wurm CA, Jakobs S, Lamkemeyer T, Langer T, Ott M (2015) Organization of mitochondrial gene expression in two distinct ribosome-containing assemblies. Cell Rep, in press 43.Eddy SR (2004) What is a hidden Markov model? Nat Biotechnol 22: 1315-1316 44.Karpenahalli MR, Lupas AN, Söding J (2007) TPRpred: a tool for prediction of TPR-, PPR- and SEL1-like repeats from protein sequences. BMC Bioinformatics 8: 2 45.Lipiński KA, Puchta O, Surendranath V, Kudła M, Golik P (2011) Revisiting the yeast PPR proteins-application of an Iterative Hidden Markov Model algorithm reveals new members of the rapidly evolving family. Mol Biol Evol 28: 2935-2948 46.Kuhl I, Dujeancourt L, Gaisne M, Herbert CJ, Bonnefoy N (2011) A genome wide study in fission yeast reveals nine PPR proteins that regulate mitochondrial gene expression. Nucleic Acids Res 39: 8029-8041 47.Holzmann J, Frank P, Loffler E, Bennett KL, Gerner C, Rossmanith W (2008) RNase P without RNA: identification and functional reconstitution of the human mitochondrial tRNA processing enzyme. Cell 135: 462-474 48.Pfeffer S, Woellhaf MW, Herrmann JM, Forster F (2015) Organization of the mitochondrial translation machinery studied in situ by cryoelectron tomography. Nat Commun 6: 6019 49.Chou JY, Hung YS, Lin KH, Lee HY, Leu JY (2010) Multiple molecular mechanisms cause reproductive isolation between three yeast species. PLoS Biol 8: e1000432 50.Lee HY, Chou JY, Cheong L, Chang NH, Yang SY, Leu JY (2008) Incompatibility of nuclear and mitochondrial genomes causes hybrid sterility between two yeast species. Cell 135: 1065-1073 29.Manna S (2015) An overview of pentatricopeptide repeat proteins and their applications. Biochimie 113: 93-99 414 www.postepybiochemii.pl 51.Lightowlers RN, Chrzanowska-Lightowlers ZM (2013) Human pentatricopeptide proteins: only a few and what do they do? RNA Biol 10: 1433-1438 52.Arnold JJ, Smidansky ED, Moustafa IM, Cameron CE (2012) Human mitochondrial RNA polymerase: structure-function, mechanism and inhibition. Biochim Biophys Acta 1819: 948-960 53.Gohil VM, Nilsson R, Belcher-Timme CA, Luo B, Root DE, Mootha VK (2010) Mitochondrial and nuclear genomic responses to loss of LRPPRC expression. J Biol Chem 285: 13742-13747 54.Ruzzenente B, Metodiev MD, Wredenberg A, Bratic A, Park CB, Camara Y, Milenkovic D, Zickermann V, Wibom R, Hultenby K, Erdjument-Bromage H, Tempst P, Brandt U, Stewart JB, Gustafsson CM, Larsson NG (2012) LRPPRC is necessary for polyadenylation and coordination of translation of mitochondrial mRNAs. EMBO J 31: 443456 55.Sasarman F, Brunel-Guitton C, Antonicka H, Wai T, Shoubridge EA, Consortium L (2010) LRPPRC and SLIRP interact in a ribonucleoprotein complex that regulates posttranscriptional gene expression in mitochondria. Mol Biol Cell 21: 1315-1323 56.Debray FG, Morin C, Janvier A, Villeneuve J, Maranda B, Laframboise R, Lacroix J, Decarie JC, Robitaille Y, Lambert M, Robinson BH, Mitchell GA (2011) LRPPRC mutations cause a phenotypically distinct form of Leigh syndrome with cytochrome c oxidase deficiency. J Med Genet 48: 183-189 57.Cooper MP, Uldry M, Kajimura S, Arany Z, Spiegelman BM (2008) Modulation of PGC-1 coactivator pathways in brown fat differentiation through LRP130. J Biol Chem 283: 31960-31967 58.Davies SM, Rackham O, Shearwood AM, Hamilton KL, Narsai R, Whelan J, Filipovska A (2009) Pentatricopeptide repeat domain protein 3 associates with the mitochondrial small ribosomal subunit and regulates translation. FEBS Lett 583: 1853-1858 59.Rackham O, Davies SM, Shearwood AM, Hamilton KL, Whelan J, Filipovska A (2009) Pentatricopeptide repeat domain protein 1 lowers the levels of mitochondrial leucine tRNAs in cells. Nucleic Acids Res 37: 5859-5867 60.Xu F, Ackerley C, Maj MC, Addis JB, Levandovskiy V, Lee J, Mackay N, Cameron JM, Robinson BH (2008) Disruption of a mitochondrial RNA-binding protein gene results in decreased cytochrome b expression and a marked reduction in ubiquinol-cytochrome c reductase activity in mouse heart mitochondria. Biochem J 416: 15-26 61.Gobert A, Pinker F, Fuchsbauer O, Gutmann B, Boutin R, Roblin P, Sauter C, Giege P (2013) Structural insights into protein-only RNase P complexed with tRNA. Nat Commun 4: 1353 62.Davies SM, Lopez Sanchez MI, Narsai R, Shearwood AM, Razif MF, Small ID, Whelan J, Rackham O, Filipovska A (2012) MRPS27 is a pentatricopeptide repeat domain protein required for the translation of mitochondrially encoded proteins. FEBS Lett 586: 3555-3561 63.Boch J, Scholze H, Schornack S, Landgraf A, Hahn S, Kay S, Lahaye T, Nickstadt A, Bonas U (2009) Breaking the code of DNA binding specificity of TAL-type III effectors. Science 326: 1509-1512 64.Cooke A, Prigge A, Opperman L, Wickens M (2011) Targeted translational regulation using the PUF protein family scaffold. Proc Natl Acad Sci USA 108: 15870-15875 65.Zhang F, Cong L, Lodato S, Kosuri S, Church GM, Arlotta P (2011) Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription. Nat Biotechnol 29: 149-153 66.Filipovska A, Rackham O (2013) Pentatricopeptide repeats: modular blocks for building RNA-binding proteins. RNA Biol 10: 1426-1432 67.Gully BS, Shah KR, Lee M, Shearston K, Smith NM, Sadowska A, Blythe AJ, Bernath-Levin K, Stanley WA, Small ID, Bond CS (2015) The design and structural characterization of a synthetic pentatricopeptide repeat protein. Acta Crystallogr D Biol Crystallogr 71: 196-208 PPR proteins — modular factors regulating expression of organellar genomes Bartosz Zapisek, Jakub Piątkowski Institute of Genetics and Biotechnology; Faculty of Biology, University of Warsaw, 5a Pawińskiego St., 02-106 Warsaw, Poland e-mail: [email protected] Key words: mitochondria, plastids, PPR protein, RNA metabolism, mtDNA, regulation of expression ABSTRACT PPR proteins make up the most numerous family of RNA-binding proteins identified to date. They localize almost exclusively to plastids and mitochondria of eukaryotic organisms. The most striking feature of this family is the expansion of PPR protein-encoding genes in vascular plants, which likely coincided with plants colonizing land. PPR proteins participate in stabilizing, editing, splicing, degradation and processing of policistronic transcripts, as well as translation activation in mitochondria and plastids. Although the number of PPR proteins in non-plant organisms is significantly smaller than in plants, they still play a crucial role in regulating the expression of mtDNA. Disruptions of PPR protein-encoding genes usually result in severe phenotypic consequences. Plant PPR proteins bind RNA in a sequence-specific manner, where a single PPR motif recognizes an individual nucleotide in a given sequence. This opens up possibilities for engineering de novo synthetic protein sequences that would interact with precisely determined organellar sequences, thus enabling modulation of mtDNA and ctDNA expression. Postępy Biochemii 61 (4) 2015 415