Izolacja i oczyszczanie białek Cel, w jakim ma być wykorzystane białko, determinuje dobór materiału biologicznego, z którego jest ono izolowane oraz metody jego oczyszczania. Zależą one od tego, czy otrzymywane białko powinno zachować swoją formę natywną i aktywność biologiczną, np. przy badaniach enzymatycznych, czy powinno zostać oczyszczone do pełnej jednorodności (homogenności), np. przy badaniach strukturalnych lub czy ma być zastosowane jako lek. Najkorzystniejszym źródłem białka będzie materiał zawierający jak najwięcej izolowanego białka dającego się łatwo otrzymać w roztworze w formie stabilnej, a jednocześnie ubogi w zanieczyszczenia i możliwie najtańszy. Obecnie coraz częściej w celu uzyskania potrzebnych białek przeprowadza się ich produkcję w komórkach bakteryjnych i eukariotycznych: drożdżowych, w hodowlach komórek owadzich, ssaczych a także w komórkach alg. Otrzymane w ten sposób białka nazywane są białkami rekombinowanymi. Zaletą takiego podejścia jest możliwość otrzymania dużej ilości potrzebnego białka, a jego oczyszczanie do homogenności jest stosunkowo proste. Dla każdego białka powinno się zastosować indywidualny schemat oczyszczania, wykorzystujący jego własności fizykochemiczne i biologiczne. Oczyszczanie białka można podzielić na kilka etapów: 1. wyodrębnianie z materiału biologicznego • rozdrobnienie materiału, rozbicie tkanek i komórek (homogenizacja dla tkanek, rozbicie ultradźwiękami dla komórek ), • ekstrakcja białka do roztworu wodnego i usunięcie pozostałego materiału poprzez odwirowanie lub przesączenie, 2. oczyszczanie wstępne (opcjonalne) • wytrącenie białka z roztworu poprzez frakcjonowanie wzrastającymi stężeniami siarczanu amonu (tzw. wysolenie), a następnie rozpuszczenie białek i usunięcie soli za pomocą dializy, 3. oczyszczanie właściwe • chromatografia , 4. zmiana warunków jonowych (opcjonalne) • dializa , 5. analiza jakości i czystości preparatu • elektroforeza • dla białek enzymatycznych oznaczenie aktywności. Z reguły, izolację białek przeprowadza się w niskiej temperaturze (2- 4°C) i w obecności inhibitorów proteaz. Chromatografia jest to szeroki zakres metod używanych do rozdzielania i/lub analizowania złożonych mieszanin związków różniących się właściwościami fizykochemicznymi (ładunkiem, polarnością, rozpuszczalnością, wielkością, kształtem), a także właściwościami biologicznymi. Metodami chromatograficznymi można rozdzielać aminokwasy, peptydy, białka, ale także nukleotydy, kwasy nukleinowe, cukry i lipidy. Cząsteczki podlegające rozdziałowi chromatograficznemu dzielą się pomiędzy dwie fazy: fazę stacjonarną (nieruchomą) i fazę ruchomą, która przepływa przez fazę stacjonarną. W zależności od formy fazy stacjonarnej i fazy ruchomej wyróżniamy chromatografię: kolumnową, cienkowarstwową i bibułową oraz cieczową i gazową. Białka rozdzielamy metodą chromatografii cieczowej, gdzie fazą stacjonarną jest złoże, które mogą stanowić odpowiednio modyfikowane substancje nierozpuszczalne w wodzie takie jak: agaroza, dekstran lub polimer akrylamidu, wypełniające rurkę (szklaną, plastikową czy metalową, tzw. kolumnę, czyli jest to także chromatografia kolumnowa) i zrównoważone buforem o odpowiednim składzie jonowym i pH. Mieszaninę białek wprowadzamy na kolumnę w buforze fazy ruchomej. Im większe powinowactwo białka do fazy stacjonarnej, tym wolniej przesuwa się ono w kolumnie. Białka są eluowane (wymywane) z kolumny kolejnymi porcjami buforu w zależności od ich powinowactwa do złoża – najsłabiej związane pojawią się w eluacie jako pierwsze, najsilniej – jako ostatnie. Właściwości złoża fazy stacjonarnej należy dobrać do cech rozdzielanych białek (tab. 1). Aby otrzymać wysoce oczyszczone białko na ogół trzeba zastosować procedurę składającą się z kilku rozdziałów chromatograficznych. Cecha białka Chromatografia Typ złoża wielkość i/lub kształt filtracja żelowa neutralne (z porami) ładunek chromatografia jonowymienna dołączone grupy wymieniające jony hydrofobowość chromatografia hydrofobowa dołączone grupy hydrofobowe specyficzność biologiczna chromatografia powinowactwa dołączony ligand wiązany przez białko Tab. 1. Wybrane typy chromatografii białek. Znaczniki (tagi) białek rekombinowanych Zaletą białek rekombinowanych jest to, że można wzbogacać je o krótkie sekwencje peptydowe lub uzyskiwać ich syntezę w fuzji z innym białkiem, czyli dodawać tzw. znaczniki. Takie operacje mają zwykle na celu albo ułatwienie izolacji i oczyszczenia białka albo zwiększenie jego rozpuszczalności. Dołączanie odpowiedniej sekwencji aminokwasowej może również zapewnić pożądaną lokalizację wewnątrzkomórkową lub sekrecję rekombinowanego białka. Wprowadzając dodatkowo miejsce rozpoznawane przez proteazę można usunąć dodaną sekwencję po oczyszczeniu rekombinowanego białka. W wielu przypadkach znacznik można dodawać albo na N-końcu albo na C-końcu białka (np. 6×His). W przypadku niektórych znaczników zalecane jest dostawianie w określonym miejscu (np. GST na Nkońcu białka). Dostępne obecnie znaczniki mają swoje wady i zalety. Nie ma jednego idealnego znacznika, który zapewniałby same korzyści. Czasami aby uzyskać oczekiwany efekt należy zastosować kombinację kilku znaczników. Porównanie wad, zalet i zastosowań wybranych znaczników zamieszczono poniżej. 6×His Krótka sekwencja peptydowa wiązana przez kationy metali kolorowych, np. niklu (oczyszczanie białka metodą chromatografii powinowactwa do jonów metali, tzw. IMAC) Specyficzność wiązania do złoża w chromatografii typu IMAC jest niższa niż w innych metodach oczyszczania z użyciem znaczników, ale złoże jest stosunkowo tanie Łagodne warunki elucji ze złoża – bufor zawierający wysokie stężenie imidazolu (elucja wydajna) Nie zwiększa rozpuszczalności białka rekombinowanego FLAG, HA, c-myc, T7, V5, Xpress Krótkie sekwencje peptydowe będące epitopami rozpoznawanymi przez specyficzne przeciwciała: FLAG: syntetyczny peptyd: DYKDDDDK HA: fragment białka hemaglutyniny wirusa grypy: YPYDVPDYA c-myc: fragment białka kodowanego przez ludzki gen c-myc: EQKLISEEDL T7: fragment białka kodowanego przez gen 10 faga T7: MASMTGGQQMG V5: peptyd będący pochodną małego epitopu (Pk) obecnego w białkach P i V paramyksowirusa SV5: GKPIPNPLLGLDST Xpress: fragment białka kodowanego przez gen 10 faga T7: DLYDDDDK Do oczyszczania stosuje się złoża zawierające unieruchomione przeciwciała – kosztowne, ale bardzo specyficzne Elucja w drastycznych warunkach (np. niskie pH) – wydajna albo buforem zawierającym syntetyczny peptyd odpowiadający wykorzystywanemu epitopowi – zwykle mało wydajna Częściej wykorzystywane do identyfikacji immunologicznej białka lub przy immunoprecypitacji niż do oczyszczania metodą chromatografii Nie zwiększają rozpuszczalności białka rekombinowanego GST (S-transferaza glutationowa) Białko o masie 26 kDa pochodzące z przywry Schistosoma japonicum Do oczyszczania stosuje się złoże z unieruchomionym glutationem (tanie), a do elucji ze złoża – bufor zawierający glutation (łagodne warunki elucji, elucja wydajna) Zwiększa rozpuszczalność białka rekombinowanego MBP (białko wiążące maltozę) Białko o masie 40 kDa pochodzące z Escherichia coli Do oczyszczania stosuje się złoże zawierające unieruchomioną amylozę (tanie), a do elucji bufor zawierający maltozę (łagodne warunki elucji) Zwiększa rozpuszczalność białka rekombinowanego Strep-tag II (peptyd wiążący streptawidynę) Syntetyczny peptyd: WSHPQFEK Oczyszczanie na złożu z unieruchomioną streptawidyną (kosztowne, ale wysoka specyficzność wiązania), elucja buforem zawierającym biotynę lub jej pochodne (łagodne warunki elucji) Nie zwiększa rozpuszczalności białka rekombinowanego S-tag Peptyd S: KETAAAKFERQHMDS Oczyszczanie na złożu z unieruchomionym białkiem S (kosztowne). Peptyd S i białko S są fragmentami RNazy A. Wiążą się silnie między sobą, co prowadzi do odbudowania aktywności rybonukleazy (tworzą tzw. RNazę S, która stanowi część RNazy A). To oddziaływanie zapewnia wysoką specyficzność wiązania do złoża, ale elucja wymaga drastycznych warunków (2M tiocyjanian sodu) lub proteolitycznego odcięcia znacznika na kolumnie. Nie zwiększa rozpuszczalności białka rekombinowanego CBP (peptyd wiążący kalmodulinę) Peptyd KRRWKKNFIAVSAANRFKKISSSGAL pochodzący z kinazy lekkiego łańcucha miozyny. Oczyszczanie na złożu z unieruchomioną kalmoduliną, w obecności jonów Ca2+ (kosztowne, ale wysoka specyficzność wiązania), elucja buforem zawierającym EDTA lub EGTA (chelatuje jony Ca2+, łagodne warunki elucji). CBP wykazuje wysokie powinowactwo do kalmoduliny w obecności jonów Ca2+. Kiedy jony Ca2+ zostają usunięte ze środowiska, w cząsteczce kalmoduliny zachodzą zmiany konformacyjne, które powodują, że CBP traci powinowactwo do kalmoduliny Nie zwiększa rozpuszczalności białka rekombinowanego Tioredoksyna (Trx tag) Białko o masie 11,7 kDa pochodzące z Escherichia coli charakteryzujące się dobrą rozpuszczalnością i wspomagające formowanie wiązań dwusiarczkowych Zwiększa rozpuszczalność białka rekombinowanego Nie jest stosowany do oczyszczania białka, może być wykorzystywany do identyfikacji immunologicznej SET (solubility enhancing tag) Peptyd będący pochodną białka kodowanego przez gen 10B faga T7 i charakteryzujący się wypadkowym ładunkiem ujemnym. Istnieje kilka wariantów peptydu SET. Zwiększa rozpuszczalność białka rekombinowanego. Wymienione wcześniej znaczniki zwiększające rozpuszczalność działają przede wszystkim w ten sposób, że same są łatwo rozpuszczalne i przez to wspomagają rozpuszczalność białka, do którego są dołączone. Peptyd SET ma charakter wysoce kwaśny i dzięki temu zwiększa odpychanie elektrostatyczne miedzy białkami i zapobiega ich agregacji Nie jest stosowany do oczyszczania białka GFP (zielone białko fluorescencyjne) i inne białka fluorescencyjne Znaczniki stosowane głównie do badania rekombinowanych białek wewnątrzkomórkowo. Szerokie spektrum stosowanych metod obejmuje badania lokalizacji wewnątrzkomórkowej, oddziaływań białek, ruchliwości (np. techniki FRET, FRAP) Sekwencje kierujące do przestrzeni periplazmatycznej i pozwalające na sekrecję do podłoża hodowlanego W przestrzeni periplazmatycznej panują bardziej dogodne warunki do fałdowania białek i tworzenia wiązań dwusiarczkowych niż w cytoplazmie, gdzie występuje wysoki potencjał redukujący i dlatego dołączenie znacznika kierującego do przestrzeni periplazmatycznej może poprawiać jakość rekombinowanego białka. Jako takie znaczniki stosuje się m. in. pochodzące z Escherichia coli białka DsbA i DsbC (zawierają sekwencje kierujące do periplazmy) oraz peptyd pelB. PelB jest sekwencją sygnałową kierującą do przestrzeni periplazmatycznej. W przestrzeni periplazmatycznej pelB jest odtrawiany przez specyficzną peptydazę pelB. Białka DsbA i DsbC dodatkowo są enzymami katalizującymi formowanie (DsbA) i izomeryzację (DsbC) wiązań dwusiarczkowych. W niektórych przypadkach korzystne może okazać się wzbogacenie rekombinowanego białka o sekwencję sygnałową warunkującą sekrecję do podłoża hodowlanego. Białko wydzielone do pożywki daje się łatwiej oczyścić niż białko pozostające w komórkach, ponieważ stosunek białka rekombinowanego do białek gospodarza jest bardziej korzystny w pożywce niż w lizacie komórkowym. Ponadto takie podejście może być szczególnie pomocne przy ekspresji białek toksycznych. Sekrecję białek można stosować nie tylko przy ekspresji białek w bakteriach, ale także w innych systemach. Np. sygnałem do sekrecji białka z komórek owadzich przy ekspresji w systemie bakulowirusowym jest 36aminokwasowy peptyd gp67. W czasie transportu przez błonę komórkową peptyd jest odcinany a natywne białko może zostać wyizolowane z pożywki hodowlanej. Sygnałem stosowany do sekrecji białek z komórek drożdżowych może być np. sekwencja SUC2. W niektórych przypadkach, zwłaszcza przy ekspresji genów w komórkach eukariotycznych, może być pożądane skierowanie białka do konkretnego przedziału komórkowego, co uzyskuje się także przez dodanie specyficznej sekwencji sygnałowej, np. wydajną lokalizację jądrową w komórkach ssaków zapewnia sekwencja NLS z dużego antygenu T wirusa SV40 (DPKKKRKV) Miejsca cięcia dla proteaz Znaczniki dołączone do rekombinowanych białek mogą czasami wpływać na aktywność biologiczną białek, zaburzać krystalizację lub w inny sposób wpływać na te białka. Dlatego też często pożądane jest usunięcie znacznika po wyizolowaniu i oczyszczeniu białka. W tym celu między sekwencją rekombinowanego białka a znacznika umieszcza się sekwencję rozpoznawaną przez proteazę. Wybrana proteaza powinna trawić wysoce specyficznie a rozpoznawana przez nią sekwencja nie może występować w rekombinowanym białku. Najwygodniej używać proteaz unieruchomionych na złożu (np. agarozowym), co pozwala na szybkie i proste usunięcie enzymu przez odwirowanie. W tabeli poniżej wymieniono proteazy najczęściej obecnie stosowane do usuwania znaczników. W zależności od wybranej proteazy i od lokalizacji miejsca cięcia (tzn. czy jest zlokalizowane na N-końcu białka, czy na jego C-końcu) po trawieniu możemy otrzymać albo białko rekombinowane bez dodatkowych reszt aminokwasowych albo białko z dołączoną jedną lub kilkoma resztami. Proteaza trombina enterokinaza czynnik Xa TEV PreScission Informacje podstawowe czynnik krzepnięcia krwi, katalizuje proteolityczne przekształcenie fibrynogenu w fibrynę enzym produkowany w komórkach błony śluzowej jelita cienkiego, katalizuje proteolityczne przekształcenie trypsynogenu w trypsynę czynnik krzepnięcia krwi, katalizuje przekształcenie protrombiny w trombinę proteaza z wirusa wżerkowej plamistości tytoniu, ang. tobacco etch virus proteaza z ludzkiego wirusa nieżytu nosa (rhinovirus) Tabela 2. Proteazy stosowane do odcinania znaczników od białek rekombinowanych. * miejsce cięcia zaznaczono symbolem / Sekwencja rozpoznawana* LVPR/GS DDDDK/ IEGR/ ENLYFQ/G LEVLFQ/GP Systemy ekspresyjne Białka można uzyskiwać w rozmaitych systemach ekspresyjnych- wykorzystujących do produkcji białka bakterie, drożdże oraz linie komórkowe owadzie, ssacze lub roślinne. Alternatywą jest ekspresja białka w systemach bezkomórkowych. Dobór systemu ekspresyjnego uzależniony jest od charakteru białka i celu w jakim ma być użyte, istotnym czynnikiem są też koszty, czas potrzebny do uzyskania białka oraz skala produkcji. Posługując się komórkowymi systemami ekspresyjnymi należy wprowadzić cDNA kodujące pożądane białko do komórek, używając w tym celu specjalnie skonstruowanych wektorów. Wektor musi spełniać szereg wymogów uzależnionych od rodzaju komórek wyrażających białko. Ekspresja w komórkach bakteryjnych Najpopularniejszą i najtańszą metodą jest produkcja rekombinowanych białek w systemach prokariotycznych. Geny kodujące białka mogą być wprowadzane na wektorach będących pochodnymi plazmidów bakteryjnych lub fagów. Najpopularniejszym gospodarzem jest Escherichia coli, inne popularnie używane bakterie pochodzą z Bacillus sp (zwłaszcza przy ekspresji białek wydzielanych do pożywki) i Lactococcus lactis. Wektory plazmidowe są niewielkimi kolistymi cząsteczkami DNA posiadającymi autonomiczne miejsce rozpoczęcia replikacji (origin), propagującymi się niezależnie od chromosomu bakteryjnego. Plazmidy bakteryjne skonstruowane metodami inżynierii genetycznej posiadają marker selekcyjny będący z reguły genem oporności na antybiotyk, unikalne miejsca restrykcyjne do wklonowania wstawki (polilinker , MCS) oraz origin. W powszechnie używanych wektorach skonstruowanych do bakterii E.coli najczęściej spotykane origin pochodzi z plazmidu ColE1. Gdy origin plazmidu ColE1 towarzyszy niewielki gen rpo, plazmid występuje w komórce w niewielkiej liczbie kopii (10-40 np. pBR322), gdy genu rpo nie ma, lub jest zmutowany, plazmid jest wielokopijny (100-200 kopii na komórkę np. pUC). Dokładna liczba kopii na komórkę plazmidu z origin ColE1 jest różna dla poszczególnych rodzajów plazmidów, ale mieści się w zakreślonych powyżej granicach. Wysokokopijne plazmidy bakteryjne mogą pomieścić wstawki o wielkości do 10kb. Do wydajnej ekspresji bakteryjnej potrzebne są odpowiednie sekwencje odpowiadające za wydajną transkrypcję i translację (patrz dalej). Do ekspresji używane są promotory bakteryjne lub fagowe. Inną grupą są wektory na bazie bakteriofagów, choć w obecnej chwili do nadekspresji białek używane są przede wszystkim wektory plazmidowe. Produkcja białek w systemach prokariotycznych jest tania, wydajna i szybka. Przeciętna wydajność to 5500 mg białka na litr hodowli bakteryjnej. Takie systemy ekspresyjne stosuje się często chcąc uzyskać homogenne preparaty białkowe do badań in vitro (np. badania enzymatyczne, badania interakcji in vitro, krystalografia, białka do immunizacji). Należy jednak pamiętać, że białka eukariotyczne wyrażane w takim systemie odbiegają od białek natywnych brakiem poststanslacyjnych modyfikacji, istnieje także niebezpieczeństwo niewłaściwego sfałdowania. Ponadto niektóre białka są dla komórek bakteryjnych tak toksyczne, że uzyskanie ich w takim systemie ekspresyjnym jest niemożliwe. Z powyższych względów rozwinięto szereg technik ekspresji w komórkach eukariotycznych. Ekspresja w komórkach drożdżowych Najwygodniejszym do manipulacji metodami inżynierii genetycznej organizmem eukariotycznym są drożdże. Popularne gatunki używane do wyrażania białek to Saccharomyces cerevisiae i Pichia pastoris, choć na rynku można znaleźć wiele systemów opartych o inne gatunki (Kluyveromyces lactis, Hansenula and Yarrowia). Plazmidy drożdżowe są wektorami bifunkcyjnymi – czyli zdolnymi do propagacji zarówno w komórkach bakteryjnych jak i drożdżowych - posiadającymi zarówno origin bakteryjne jak i drożdżowe wraz z odpowiednimi markerami selekcyjnymi dla każdego z organizmów. Umożliwia to proste manipulacje powielania plazmidu i klonowania cDNA w bakteriach, a ekspresji białka w układzie drożdżowym. Łatwość wprowadzania wektorów, stosunkowo krótki czas podziału, możliwość kontrolowanej indukcji ekspresji w połączeniu z zaletami ekspresji w komórkach eukariotycznych zadecydowały o popularności systemów drożdżowych. Także koszty produkcji białek w komórkach drożdżowych są najniższe wśród eukariotycznych systemów ekspresyjnych. Ekspresji białek pochodzących z wyższych eukariontów sprzyja eukariotyczny aparat transkrypcji i translacji a także eukariotyczne systemy wspomagające fałdowanie białek i obecność modyfikacji posttranslacyjnych (choć te ostatnie mogą się różnić od modyfikacji, które występują u organizmów wyższych- np wzorem glikozylacji). Pomimo tych zalet są to systemy mniej wydajne niż bakteryjne, a obecność ściany komórkowej utrudnia izolację białek wyrażanych wewnątrzkomórkowo, a także plazmidów. Saccharomyces cerevisiae Pierwotne wektory używane do transformacji drożdży były prostymi pochodnymi wektorów bakteryjnych zaopatrzonymi w sekwencje promotorów i markerów drożdżowych i odpowiedniego locus drożdżowego. Aby taki konstrukt był stabilny musiała zajść homologiczna rekombinacja wbudowująca plazmid do genomu gospodarza w pożądanym locus. Jednakże w komórkach drożdżowych możliwa jest także ektopiczna (pozachromosomalna) ekspresja, co jest rzadkością w komórkach eukariotycznych. Istotną zaletą drożdży jest występowanie naturalnego plazmidu posiadającego autonomicznie replikujące się origin nazwane ori 2 µ. Istnieje szeroka gama wysokokopijnych wektorów drożdżowych powstałych na bazie ori 2 µ. Inną możliwością propagacji jest dodanie do plazmidu sekwencji ARS (autonomous replication sequence - origin chromosomu drożdżowego) wraz z sekwencją centromerową CEN zapewniającą równomierny rozdział episomalnego plazmidu między potomne komórki (włókna wrzeciona kariokinetycznego łączą się z sekwencją CEN). Wektory te występują w mniejszej liczbie kopii. Drożdżowe markery selekcyjne są z reguły markerami pokarmowymi, komplementującymi auksotrofię szczepu docelowego, choć zdarzają się markery oporności na antybiotyki. Istnieje też szeroka gama promotorów drożdżowych (patrz dalej) Pichia pastoris Pichia pastoris jest gatunkiem drożdży zdolnych do wzrostu na metanolu jako źródle węgla. W przeciwieństwie do Saccharomyces cerevisiae posiada naturalny, silny indukowalny promotor. Pierwszy enzym szlaku katabolizującego metanol - oksydaza alkoholowa jest białkiem, którego produkcja zachodzi tylko podczas obecności metanolu w pożywce (przy braku glukozy) i wtedy stanowi on powyżej 30% rozpuszczalnych białek komórki. Promotor genu kodującego oksydazę alkoholową (AOX1) został użyty do konstrukcji wektorów ekspresyjnych z indukowalną ekspresją w Pichia pastoris. System ten wymaga wycofania glukozy z pożywki (derepresja) a następnie dodania induktora- metanolu (indukcja). Zapewnia to wysoki poziom produkcji białka w systemie eukariotycznym. Zarazem także ten system ekspresyjny odznacza się łatwą i stosunkowo niedrogą hodowlą w dużych objętościach pożywki. Alternatywą jest konstytutywna wysoka ekspresja z promotora dehydrogenazy aldehydu 3-fosfoglicerynowego (GAP). Wektory do Pichia pastoris są wektorami integracyjnymi (integrują w locus zajmowanym przez użyty w wektorze promotor) a produkowane białka mogą być wyrażane wewnątrzkomórkowo lub kierowane do pożywki. W tym systemie ekspresyjnym można uzyskać z litra pożywki od 20 mg do 12 g białka i jest to wydajność przeszło 10 krotnie wyższa niz w Saccharomyces cerevisiae. Ekspresja w komórkach owadzich Bakulowirus (Autographa californica nuclear polyhedrosis virus [AcNPV]) System bakulowirusowy jest używany do wyrażania białek w komórkach owadzich (linii komórkowej Sf i HF wywodzących się odpowiednio z komórek jajnikowych ćmy Spodoptera frugiperda oraz Trichoplusia ni). Zaletą tego systemu jest eukariotyczny aparat translacji i transkrypcji, zdolność do wyrażania dużych białek wydajnością 1% do 20% całkowitej produkcji. W komórkach owadzich zachodzi także duża część modyfikacji posttranslacyjnych obecnych w komórkach ssaczych, co sprawia, że wyrażane tam ssacze białka są funkcjonalnie i antygenowo podobne do naturalnych (choć nadmierna glikozylacja może nadal być problemem). Łatwo jest także zwiększyć skalę hodowli komórek owadzich, ze względu na zdolność do wzrostu przy dużej gęstości hodowli i brak wymagania CO2. Zmienna wielkość kapsydów wirusowych pozwala także na wprowadzanie dużych ilości obcego cDNA. AcNPV jest bardzo dużym (150 kb) wirusem zakażającym komórki owadzie. Ze względu na wielkość nie jest wygodnym materiałem do manipulacji genetycznych, takich jak klonowanie. Stąd uzyskanie komórek wyrażających pożądane białko odbywa się dwuetapowo. 1. Najpierw gen interesującego nas białka klonowany jest do małego plazmidu niosącego gen białka płaszcza bakulowirusa (polihedryny) wraz z niewielkimi otaczającymi go fragmentami genomu bakulowirusa tak, żeby sekwencję genu płaszcza bakulowirusa wymienić na pożądany gen. Następnie plazmid ten powinien ulec rekombinacji z genomem bakluowirusa dając pożadane cząsteczki niosące klonowany gen zamiast genu polihedryny. Dostępne na rynku komercyjne systemy skracają i podnoszą wydajność tej procedury oferując specjalnie skonstruowane szczepy bakteryjne, w których po wprowadzeniu plazmidu ze sklonowanym genem zachodzi transpozycja sklonowanego genu do bakmidu. 2. W drugim etapie procedury bakmid, po izolacji z bakterii, jest wprowadzany do komórek owadzich i tam namnaża się, dając początek aktywnym bakulowirusom używanym do zakażenia następnej puli komórek, które produkują pożądane białko. Białko płaszcza może stanowić 50% produkcji komórkowej, stąd pod ten promotor podłączane są rekombinowane białka. Można w ten sposób uzyskać do 500mg białka z 1 l hodowli. Białka wyrażane mogą być kierowane albo do pożywki albo zostawać w komórce w tzw ciałach okluzyjnych generowanych w czasie poźnej fazy rozwoju wirusa. Ekspresja białka w komórkach Drosophila melanogaster Alternatywą do systemu bakulowirusowego jest wyrażanie białka w komórkach Drosophila melanogaster (Schneider S2 - linia wywodząca się z embrionów muszki owocowej). Taka ekspresja posiada wszystkie zalety powyżej opisanego systemu z tą różnicą, że białko wyrażane jest w komórkach zdrowych, nie zakażonych wirusem, więc nie zachodzi proteoliza białka w czasie lizy komórek owadzich. Gen jest wprowadzany na prostym plazmidzie i jest wyrażany przejściowo, a produkt białkowy można wykryć po kilku dniach od transfekcji. W celu uzyskania stabilnej linii potrzebna jest kotransfekcja specjalnie przygotowanym wektorem niosącym gen oporności na antybiotyk. Komórki Schneider S2 mają unikalną właściwość integrowania dużych ilości transfekowanych plazmidów do swojego genomu, stąd gen wprowadzonego białka istnieje w wielu kopiach, co zapewnia ekspresję na wyższym poziomie niż w systemach ssaczych. Tabela 3 Porównanie ekspresji białka ssaczego w różnych systemach komórkowych Bakterie Drożdże Komórki owadzie Komórki ssacze tempo wzrostu (czas podziału) szybkie (30 min) szybkie (90 min) wolne (18-24 godz) wolne (24 godz) koszty hodowli niskie niskie wysokie wysokie poziom ekspresji wysoki niski do wysokiego niski do wysokiego niski do średniego możliwość produkcji białek sekrecyjnych sekrecja do peryplazmy sekrecja do pożywki sekrecja do pożywki sekrecja do pożywki N-glikozylacja brak duży procent mannozy prosta, bez kw. sialowego złożona, kompletna O- glikozyalcja brak obecna obecna obecna fosforylacja acetylacja, acylacja brak obecna obecna obecna gamma-karboksylacja brak brak brak obecna przeciętna wydajność (mg na litr pożywki) 5-500 10-200 10-200 0.1-100 prawdopodobieństwo sukcesu (białko aktywne i sfałdowane) 40-60 50-70 50-70 80-95 Ekspresja w komórkach ssaczych W badaniach, których celem jest ustalenie jak funkcjonuje dane białko w komórce, wyrażanie go w komórkach pochodzących z organizmu odległego ewolucyjnie jest często niewystarczające. Eksperymenty in vivo, określanie lokalizacji i przemieszczania się białka, jego kontekstu białkowego i innych aspektów funkcjonalnych wymaga wyrażenia białka w komórkach pochodzących z tego samego lub blisko spokrewnionego gatunku. Stąd opracowane zostały sposoby wprowadzania genów do komórek ssaczych. Tego typu manipulacje mogą mieć na celu wyrażenie białka w celu jego izolacji i oczyszczania (np. izolacja kompleksów białkowych przy identyfikacji białek oddziałujących) i wtedy korzystna jest wysoka ekspresja produkowanego białka. Często jednak do analizy zachowania białka in vivo wysoka ekspresja nie jest konieczna, a wręcz zaburza fizjologiczny stan komórki. Ekspresja białek w komórkach ludzkich jest też intensywnie badana ze względu na ewentualne korzyści, jakie może przynieść terapia genowa. Rozróżniamy dwa typy ekspresji w komórkach - przejściową i stabilną. Przejściowa zakłada wyrażanie białka z genu wbudowanego do wektora i ustaje wraz ze zmniejszaniem się ilości wektora w puli komórek. Stabilna polega na wbudowaniu genu do genomu komórki i niezmienioną ekspresję po kolejnych podziałach komórkowych. W ten sposób wyprowadzane są linie komórkowe wyrażające dane białko. Kolejną możliwością są systemy ekspresji opartej o indukcję/ represję. Obecność lub brak pewnych substancji w pożywce (składniki pokarmowe, antybiotyki) pozwala na kontrolowaną ekspresję. Pozwalają one na precyzyjne wyznaczenie momentu startu produkcji białka, co może być istotne dla badań funkcjonalnych lub w przypadku białek toksycznych dla komórek. Wektory do komórek ssaczych są pochodnymi wirusów lub plazmidami zawierającymi elementy wirusowe. Wektory plazmidowe Wektory te są plazmidami z możliwością propagacji w komórkach bakteryjnych. Po transfekcji komórek ssaczych jednakże nie są one zdolne do funkcjonowania przez dłuższy czas jako episom. Taka transfekcja jest przejściowa i białko można zaobserwować i badać tylko przez stosunkowo krótki okres. Jednak z pewną częstością następuje niehomologiczna rekombinacja wprowadzonego plazmidu z genomem gospodarza i takie komórki można wyselekcjonować doprowadzając do utworzenia stabilnej linii wyrażającej interesujące nas białko. Zasada selekcji zakłada, że wraz z klonowanym białkiem wyraża się także gen oporności na antybiotyk kodowany na plazmidzie i taki gen także integruje się do genomu. Wektory oparte o SV40 (Simian Virus) SV40 jest wirusem DNA o wielkości 5,2 kb. Zakaża komórki nerki małpiej jako wirus lityczny. Do replikacji tego wirusa niezbędna jest kodowana w jego genomie helikaza- duży antygen T. Po wyrażeniu dużego antygenu T genom SV40 ulega replikacji w jądrze komórkowym, następuje produkcja kolejnych białek wirusowych, składanie kapsydów i następnie liza komórki. wektory plazmidowe oparte o SV40 Wektory te są typowymi wektorami bifukcyjnymi zawierającymi sekwencje niezbędne do propagacji w E.coli. Kodują duży antygen T i mają ori z SV40. Mogą się powielać w komórkach i przejściowo funkcjonować jako episom. Z niewielką częstością mogą być wbudowywane do genomu komórki. Są stabilnie utrzymywane w bakteriach, ale bez integracji do genomu gubione przy kolejnych podziałach ssaczych komórek. Alternatywnym rozwiązaniem jest transfekcja plazmidu z origin SV40 do zmodyfikowanej linii komórkowej. Linii tej, na drodze genetycznych manipulacji, wstawiono do genomu fragment genomu SV40 zawierający uszkodzone origin, koduje ona natomiast funkcjonalny duży antygen T. Obecność tego fragmentu umożliwia każdemu kolistemu DNA posiadającemu funkcjonalne origin SV40 replikację niezależną od komórkowego DNA (episomalną). Wektory wirusowe Pośród wektorów wirusowych istnieją wektory zdolne do samodzielnej infekcji lub też (bardziej popularne) niezdolne do niej. W tych ostatnich zostały usunięte geny pewnych białek (z reguły białek płaszcza wirusowego). W ten sposób w genomie wirusa pojawia się miejsce na wstawkę, a zarazem nie jest on zdolny do samodzielnej, niekontrolowanej wirulencji. Zostawione są rejony odpowiedzialne za replikację (lub odwrotną transkrypcję i replikację), integrację do genomu gospodarza oraz sygnały pakowania do cząstek wirusowych. Tym samym niezaburzona jest replikacja i propagacja genomu wirusowego, a zarazem niesionej wstawki, w komórce docelowej. W celu uzyskania wirulentnych cząstek do zakażenia komórek docelowych konieczne są specjalnie skonstruowane komórki pakujące. Dostarczają one brakujących białek wirusowych, których geny zostały metodami inżynierii genetycznej zintegrowane z genomem komórek pakujących. Komórki pakujące dostarczają też glikoprotein płaszcza wirusa, które decydują o tym, jaki typ komórek docelowych wirus będzie zakażał. Z chwilą, gdy wirus zainfekuje komórki docelowe, dalsza produkcja cząstek infekcyjnych jest zbędna. W przypadku pracy z wirusami zdolnymi do zakażania ludzkich komórek niezbędne jest używanie defektywnych wirusów ze względów bezpieczeństwa. Konstrukcja ssaczego wektora wirusowego jest kilkuetapowa. W pierwszym etapie należy wklonować interesującą wstawkę w bakteryjny wektor nośnikowy. Następnie gen z wektora nośnikowego jest przestawiany do genomu wektora wirusowego albo na drodze rekombinacji albo klonowania. Potem wektor jest wprowadzany do komórek pakujących i odzyskiwany jako infekcyjny wektor wirusowy. Wtedy może być użyty do transfekcji komórek docelowych. Wiele typów wirusów zostało użyte jako wektory, poniżej są podane niektóre przykłady. Adenovirus Adeno-associated virus Baculovirus Epstein-Barr virus Herpes simplex virus Lentiviruses Poliovirus Retroviruses Semliki Forest virus Simian virus 40 Sindbis virus Vaccinia virus Tabela 4. Wirusy, których pochodne są używane jako wektory do transfekcji komórek ssaczych Wektory retrowirusowe Retrowirusy są wirusami RNA, których genom dzięki wprowadzanej wraz z wirusem odwrotnej transkryptazie i integrazie ulega przepisaniu na DNA i integracji do genomu gospodarza. Z uwagi na zdolność do integracji retrowirusa do genomu gospodarza, jego stabilną replikację i przekazywanie komórkom potomnym stosuje się je do transfekcji komórek dzielących się, choć nowsze generacje wektorów infekują także komórki niereplikujące się. Konstrukcja wektora retrowirusowego zasadza się na usuwaniu sekwencji retrowirusowych na rzecz heterologicznego genu mającego ulegać ekspresji (wstawki mogą mieć wielkość do 7 kb). Wektor retrowirusowy powinien zawierać: pochodzący z wirusa promotor oraz sygnał poliadenylacji; wirusowy sygnał pakowania wirusowego RNA do wirionów; sygnały wymagane do odwrotnej transkrypcji- PBS (transfer RNA binding site), trakt polipurynowy PPT niezbędny do inicjacji syntezy pierwszej i drugiej nici DNA, a także rejon R wymagany do przejścia syntezy między dwoma nićmi DNA; oraz umiejscowioną w obrębie wirusowych LTR (long terminal repeat) krótką sekwencję będącą częściowo odwróconym powtórzeniem istotną dla integracji wirusa do genomu gospodarza. Geny wprowadzone wbudowują się do genomu gospodarza i mogą być wyrażane z promotora wirusowego (umiejscowionego w LTR), przy czym można wzmocnić ekspresję przez użycie swoistych tkankowo enhancerów, mogą być także wyrażane z wewnętrznych promotorów, co pozwala na bardziej elastyczną kontrolę ekspresji. Można w ten sposób wyrażać jeden lub więcej genów. W przypadku ekspresji pojedynczego genu, gdy kodowane przez niego białko nie może służyć jako marker, konieczna jest kotransfekcja z plazmidem niosącym marker selekcyjny. W przypadku wyrażania dwóch lub więcej genów możliwe są różne strategie- między innymi- użycie wewnętrznych promotorów lub genów ulegających alternatywnemu splicingowi a także konstruowanie białek fuzyjnych czy tzw. policistonowych genów, gdzie umieszczenie sekwencji IRES między genami pozwala na wyrażanie kilku białek z jednego transkryptu. Użycie genów policistronowych ma dododatkową zaletę ekspresji białka docelowego na poziomie białka markerowego. Białka markerowe używane w tego typu wektorach są często białkami bakteryjnymi odpowiadającymi za odporność na antybiotyki np. za odporność na neomycynę (G418) lub higromycynę, także białkami bakteryjnymi umożliwiającymi wzrost na nietypowych źródłach składników odżywczych np. gen hisD umożliwiający wzrost na histydynolu zamiast histydynie, ale także gen mdr odpowiadający za oporność wielolekową. Wektory adenowirusowe Adenowirus jest DNA wirusem o wielkości 36 kb, który w swoim cyklu życiowym nie przechodzi przez stadium RNA i odwrotną transkrypcję. Jest wirusem litycznym, nie integrującym się do genomu gospodarza i stąd transfekcje tym wirusem są z założenia przejściowe, ponieważ jego DNA jest gubione podczas podziałów komórek. Dużą zaletą jest fakt możliwości transfekcji komórek stacjonarnych. Można użyć go jako wektora i wprowadzać obce geny do wirusa (mieści wstawki do 8 kb) usunąwszy pewne geny wczesnych białek. Wstawienie genu do genomu adenowirusa wymaga zajścia rekombinacji homologicznej między przeciętym, liniowym DNA adenowirusa a plazmidem dostarczającym wstawkę. Proces ten zachodzi z pewną częstością w komórkach E. coli recA+. Powstały w ten sposób konstrukt jest izolowany, przecinany i transfekowany do komórek, dostarczających defektywnemu adenowirusowi niezbędnych białek, co pozwala utworzyć się infekcyjnym adenowirusom. Uzyskane cząstki adenowirusa są używane do zakażenia komórek docelowych. Niestety z powodu dużego skomplikowania regulacji ekspresji białek wirusowych nie wszystkie białka wirusa są dostarczane przez komórki pakujące. Geny pozostające w wektorze adenowirusowum są wyrażane w komórkach docelowych obok wprowadzonego białka i mogą powodować odpowiedź immunologiczną transgenicznego organizmu. Wektory oparte o wirus towarzyszący adenowirusom (AAV-Adeno-Associated Virus) Jest to mały wirus o genomie składającym się z pojedynczego DNA, niezdolny do samodzielnego tworzenia cząstek infekcyjnych. Wiriony są tworzone dopiero przy kotransfekcji z wirusem pomocniczym (adenowirusem). AAV może infekować komórki w fazie stacjonarnej i integrować się do ich genomu. W intensywnie dzielących się komórkach jest gubiony chyba, że ulegnie wstawieniu do genomu gospodarza, co zdarza się z niewielką częstością. Wektory ekspresyjne oparte o ten wirus są w stanie nieść wstawkę do 4,5 kb. Zaletą tego wirusa jest niezdolność do własnej wirulencji, przez co praca z nim jest stosunkowo bezpieczna. Ponadto nie posiadając większości białek adenowirusowych nie wywołuje on znaczącej odpowiedzi immunologicznej. Tak jak w przypadku innych wektorów opartych na wirusach, wstawkę niosącą cDNA heterologicznego genu klonuje się do plazmidu bakteryjnego, skąd przenosi się ją jako kasetę ekspresyjną do DNA wirusa i transfekuje komórki pakujące . W przypadku AAV potrzebna jest dodatkowa kotransfekcja albo wirusem pomocniczym albo plazmidami niosącymi geny białek potrzebnych do namnożenia wirusa. Komórki pakujące dostarczają białek płaszcza wirusowego. Utworzone w komórkach pakujących wirulentne cząstki są następnie użyte do transfekcji komórek docelowych. Ekspresja w komórkach alg Kolejną możliwością jest ekspresja białka w hodowlach komórek algi Chlamydomonas reinhardtii. Podstawy metody są podobne jak w przypadku wprowadzania wektorów plazmidowych do komórek ssaczych- wektory bifukcyjne umożliwiają klonowanie wstawki, a następnie są wprowadzane do komórek roślinnych. Można projektować wektory skierowane wbudowania wstawki do genomu jądrowego, chloroplastowego lub mitochondrialnego. Zaletą tego systemu jest zdolność zarówno do prototroficznego jak i heterotroficznego wzrostu i czas podziału około 8 godzin. W komórkach roślinnych można z sukcesem produkować białka zwierzęce - np. przeciwciała. Pozakomórkowe systemy ekspresji Tego typu systemy ekspresyjne są przydatne dla uzyskiwania białek toksycznych dla komórek lub też słabo rozpuszczalnych i tworzących ciała inkluzyjne, a także ulegających szybkiej degradacji w komórkach. Systemy ekspresji pozakomórkowej dostarczają wszelkich niezbędnych składników do zajścia transkrypcji i translacji in vitro. Bazują one na lizatach z komórek przystosowanych do wysokiego poziomu syntezy białek. Z reguły są to lizaty trzech typów komórek- E.coli, króliczych retikulocytów i pszenicy. Zawierają one rybosomy, tRNA, syntetazy aminoacylo-tRNA, czynniki inicjacji, elongacji i terminacji translacji. Dodatkowo są uzupełniane aminokwasami, ATP lub GTP, źródłem do regeneracji energii (fosforanem kreatyny wraz z fosfokinazą kreatyny dla komórek eukariotycznych i fosfoenolopirogronianem wraz z kinazą pirogronianową dla E.coli) oraz odpowiednimi jonami. Możliwe są dwa rodzaje systemów w zależności od zastosowanej matrycy. Gdy dostarczamy mRNA ulega ono translacji, z reguły z zastosowaniem lizatów retikulocytów lub pszenicy. Można też posłużyć się DNA jako matrycą, która zostanie przepisana na mRNA z zastosowaniem fagowej polimerazy dostarczonej do lizatu (warunkiem jest tu podłączenie genu pod promotor fagowy - T7, T3, SP6). Takie mRNA ulega następnie translacji w lizatach bazujących na komórkach eukariotycznych lub też połączonej transkrypcji/translacji w lizatach E. coli. Sekwencje wchodzące w skład wektorów ekspresyjnych Sekwencje wykorzystywane do kontroli transkrypcji genu Bakterie (Escherichia coli) Promotor operonu lac współpracujący z represorem laktozowym (białko lacI kodowane przez gen lacI, wiążące się do operatora lacO1), indukowany laktozą (dokładniej jej izomerem – allolaktozą, powstałym z przekształcenia laktozy) lub jej syntetycznym analogiem - IPTG, współpracuje z polimerazą RNA z E. coli. Na ogół w komórce gospodarza znajdują się dodatkowe kopie genu lacI w celu zwiększenia "podaży" represora, często z mutacją lacIq, zwiększającą jego powinowactwo do operatora. Zwiększona "podaż" wynika ze zwiększonego "popytu" - większej liczby operatorów lacO1 w komórce (ma go każda kopia wprowadzonego wektora ekspresyjnego i dlatego też wektor taki może dodatkowo zawierać gen lacI). Promotor lac jest także reprymowany przez glukozę (represja kataboliczna) na drodze obniżenia wewnątrzkomórkowego stężenia cAMP, a w konsekwencji braku aktywnego kompleksu aktywatora CAP z cAMP. Po wyczerpaniu się glukozy, wzrasta poziom cAMP i następuje derepresja promotora. Zmodyfikowany (trzy punktowe mutacje) promotor lac – lacUV5, różniący się od dzikiego promotora znacznie zmniejszoną czułością na cAMP, którego poziom rośnie przy braku glukozy lub przy wzroście gęstości hodowli bakteryjnej (promotor trudniej ulega derepresji przy gęstych hodowlach – jest mniej "przeciekający", co jest istotne przy produkcji toksycznych dla bakterii białek). Promotor operonu trp reprymowany przez represor tryptofanowy w kompleksie z korepresorem – tryptofanem, współpracuje z polimerazą RNA z E. coli. Promotor PL z bakteriofaga λ współpracujący z represorem λ (produktem genu cI faga) wiążącym się do operatora OL1/OL2, silny promotor z bardzo ścisłą kontrolą ekspresji, współpracuje z polimerazą RNA z E. coli. Gen dla represora λ może być wstawiony w chromosom bakteryjny stosownego gospodarza pod kontrolą np. promotora trp. Promotor genu 10 (białka kapsydu) bakteriofaga T7 współpracujący z polimerazą RNA z faga T7 (produkt genu 1 faga T7), której aktywność może być regulowana lizozymem z faga T7 (produkt genu 3.5 faga T7). Promotor nie jest rozpoznawany przez polimerazę RNA z E. coli i jest ciągłą sekwencją o długości 23 bp. Gen kodujący polimerazę RNA z faga T7 może być wstawiony w chromosom bakteryjny, np. jako część profaga lambda lub znajdować się na plazmidzie. Promotor bakteriofaga T3 (fag podobny do T7) współpracujący z polimerazą RNA z faga T3 oraz promotor bakteriofaga SP6 (fag podobny do T7, infekujący Salmonella typhimurium) współpracujący z polimerazą RNA z faga SP6. Obydwa promotory nie są rozpoznawane przez polimerazę RNA z E. coli ani też z faga T7 i mają głównie zastosowanie w systemach do transkrypcji/translacji in vitro wykorzystujących polimerazy RNA z faga SP6 lub T3 (ze swoim promotorem do tych celów jest także wykorzystywana polimeraza RNA z faga T7). Hybrydowe promotory T7lac (promotor genu 10 z T7 (17 bp) z operatorem lacO1 (25 bp)) i trc (promotor trp z operatorem lacO1) współpracujące odpowiednio z polimerazą RNA z faga T7 i polimerazą RNA z E. coli, oba indukowane przez IPTG i regulowane przez represor lacI produkowany z genu lacIq. Syntetyczny promotor EM-7, o długości 67 bp, konstytutywny, współpracuje z polimerazą RNA z E. coli. Terminator t0 z bakteriophaga λ, współpracuje z polimerazą RNA z E. coli. Terminator z bakteriofaga fd, współpracuje z polimerazą RNA z E. coli. Terminator z genu 10 faga T7, współpracuje z polimerazą RNA z faga T7. Terminator T1 operonu rrnB (geny kodujące rRNA), współpracuje z polimerazą RNA z E. coli i z faga T7 Drożdże (Saccharomyces cerevisiae) UAS z genu 1 metabolizmu galaktozy drożdży (UASGAL1), współpracuje z aktywatorem GAL4 (lub domeną wiążącą DNA białka GAL4), poziom ekspresji zależy od liczby zastosowanych elementów i może być wysoki dla pełnego promotora genu GAL1 (PGAL1), zawierającego cztery sekwencje UAS. Do indukcji przez galaktozę i represji przez glukozę wymaga obecności w komórce czynników GAL80 i GAL3. Syntetyczny UAS współpracujący z aktywatorem GAL4 (UASG), poziom ekspresji zależy od liczby zastosowanych elementów - w powiązaniu z minimalnym promotorem (tylko TATA box, bardzo słabym) genu CYC1 dla pewnych celów ten poziom może być z założenia niski; podobnie UAS z genu dehydratazy imidazologlicerolofosforanu drożdży (UASHIS3), współpracuje z aktywatorem GCN4 Minimalny promotor z genu dehydratazy imidazologlicerolofosforanu drożdży (oba TATA boxy HIS3, w tym jeden konstytutywny), w powiązaniu np. z kilkoma UASGAL1 możliwy pewien poziom konstytutywnej ekspresji, która może być podniesiona do wysokiej przez aktywator GAL4 Promotor z genu izoformy 1 dehydrogenazy alkoholowej drożdży (PADH1), reprymowany w późnej fazie logarytmicznej przez powstający etanol, wysoka ekspresja Skrócony promotor z genu izoformy 1 dehydrogenazy alkoholowej drożdży, konstytutywny (nie hamowany etanolem), wysoki ekspresja Promotor genu sulfhydrylazy O-acetylohomoseryny drożdży (PMET25), reprymowany metioniną Promotor z genu czynnika elongacyjnego transkrypcji 1 drożdży (PTEF1), konstytutywny, wysoka ekspresja Operator z genu lexA E.coli (lexAop), współpracuje z domeną wiążącą DNA białka lexA, poziom ekspresji zależy od liczby zastosowanych elementów i może być wysoki Terminator z genu izoformy 1 cytochromu c drożdży (CYC1 TT) Terminator z genu izoformy 1 dehydrogenazy alkoholowej drożdży (ADH1 TT) Owady Promotor z genu polihedryny z bakulowirusa (PPH), konstytutywny Promotor z genu metalotioneiny muszki owocowej (PMT), indukowany jonami Cu2+, wysoka ekspresja Promotor z genu aktyny 5C muszki owocowej (PAc5), konstytutywny, wysoka ekspresja Pomotor z transpozonu copia muszki owocowej (Pcopia), konstytutywny Sygnał poliadenylacji z wirusa małpiego 40 (SV40 pA) Sygnał poliadenylacji z genu kinazy tymidynowej z wirusa opryszczki pospolitej (HSV pA) Ssaki Promotor z wirusa cytomegalii (PCMV), konstytutywny, wysoka ekspresja Promotor z SV40 (PSV40), konstytutywny, wysoka ekspresja Promotor z retrowirusów: wirusa leukemii mysiej Moloney'a (MoMuLV, P5'LTR), konstytutywny lub z wirusa mięsaka Rous'a (PRSV), konstytutywny, wysoka ekspresja Promotor z genu czynnika elongacyjnego 1α człowieka (PEF-1α), konstytutywny, wysoka ekspresja, nie wirusowy Promotor z genu ubikwityny C (PUbC), konstytutywny, wyrównana ekspresja w rozmaitych tkankach Promotor z genu β-kazeiny kozy (PBC), wysoka i tkankowo specyficzna ekspresja (prawie wyłącznie gruczoł mleczny, białko w mleku samicy transgenicznego zwierzęcia) Hybrydowy promotor zawierający skrócony promotor z CMV i operator(y) z bakteryjnego operonu oporności na tetracyklinę (np. CMV/tetO2), współpracujący z represorem tetracyklinowym (białko TR), represja usuwana tetracykliną lub jej pochodnymi, ekspresja wyższa niż z samego PCMV. Sygnał poliadenylacji z wirusa małpiego 40 (SV40 pA) Sygnał poliadenylacji z genu kinazy tymidynowej z wirusa opryszczki pospolitej (HSV pA) Sygnał poliadenylacji z genu hormonu wzrostu wołu (BGH pA) Sygnał poliadenylacji z genu β-globiny królika (β-globin pA) Sekwencje wspomagające rozpoznawanie pierwszego kodonu ATG przez rybosom Plazmid ekspresyjny powinien zawierać sekwencje umożliwiające prawidłową translację mRNA, czyli przede wszystkim kodon inicjujący translację w otoczeniu pozwalającym na efektywne wiązanie się rybosomu do mRNA oraz kodon stop kończący syntezę białka. W zależności od typu wektora ekspresyjnego, pierwszy kodon ATG może być umieszczony w sekwencji wektora lub trzeba go dostawić razem z całą sekwencją kodującą rekombinowane białko. Jeśli kodon start znajduje się w wektorze, wstawiając sekwencję białka, należy pamiętać o zachowaniu odpowiedniej ramki odczytu. Bakterie (Escherichia coli) sekwencja Shine-Dalgarno (w obrębie RBS, z ang.: ribosome-binding site). Konsensus E.coli: GGAGG, sekwencja zlokalizowana 5 do 13 nukleotydów przed pierwszym kodonem ATG. Sekwencja Shine-Dalgarno jest komplementarna do 3' końca 16S rRNA wchodzącego w skład małej podjednostki 30S rybosomu. Drożdże (Saccharomyces cerevisiae) sekwencja bogata w A. Konsensus: (A/Y)A(A/T)AATGTCT, obejmuje pierwszy kodon ATG. Ssaki Sekwencja Kozak. Konsensus: GCC(A/G)CCATGG, obejmuje pierwszy kodon ATG. Sekwencja działa spowalniająco na rybosom przesuwający się wzdłuż mRNA przez co zwiększa prawdopodobieństwo rozpoznania kodonu start. IRES (z ang.: internal ribosome entry site). Sekwencja umożliwiająca translację dwóch otwartych ramek odczytu z pojedynczego mRNA. IRES umieszczony jest między dwiema sekwencjami kodującymi białka i ma długość kilkuset nukleotydów. Ewolucyjnie konserwowana jest struktura drugorzędowa, jaką przyjmuje mRNA w miejscu IRES, a nie jego sekwencja nukleotydowa. Klasyczna inicjacja translacji wymaga obecności na końcu 5’ mRNA tzw. czapeczki, czyli zmodyfikowanego nukleotydu guaninowego, który jest dołączany ko-transkrypcyjnie. IRES umożliwia przyłączenie się rybosomu i rozpoczęcie translacji bez udziału czapeczki. Mechanizm inicjacji translacji wykorzystujący IRES jest charakterystyczny przede wszystkim dla wirusów, chociaż występuje także przy translacji nielicznych mRNA Eukaryota. W komercyjnych ssaczych plazmidach ekspresyjnych wykorzystuje się wirusowe sekwencje IRES. Sekwencje IRES można wykorzystywać w sytuacji, gdy chcemy uzyskać ekspresję dwóch rekombinowanych białek w jednej komórce, np. dwóch podjednostek białka oligomerycznego. Drugie zastosowanie wiąże się z selekcją komórek, które przyjęły plazmid ekspresyjny. Do selekcji stosuje się zwykle antybiotyk, na który oporność niesie używany wektor ekspresyjny. W praktyce nie wszystkie komórki wyselekcjonowane jako oporne na antybiotyk, wykazują ekspresję rekombinowanego białka. Wykorzystanie wektora pozwalającego na syntezę białka oporności na antybiotyk i białka rekombinowanego w oparciu o wspólny mRNA zwiększa prawdopodobieństwo, że w wyselekcjonowanych komórkach zachodzi ekspresja białka rekombinowanego. Owady sekwencja analogiczna do sekwencji Kozak. Konsensus: CAAAACATG Podobnie, jak w przypadku kodonu start, kodon stop może być albo umieszczony w wektorze albo trzeba go dostawić razem z sekwencją kodującą rekombinowane białko. Zalecane jest dostawienie więcej niż jednego kodonu stop, co ma wykluczyć sytuację, gdy jeden z kodonów stop zostanie omyłkowo odczytany jako kodujący aminokwas i synteza białka nie zostanie zahamowana. W komercyjnych wektorach ekspresyjnych często umieszczone są trzy kodony stop, każdy w innej ramce odczytu, co umożliwia wstawienie sekwencji kodującej białko rekombinowane w dowolnej ramce odczytu.