Spis treści 4.1 Hierarchiczna budowa białek .................................................................................................. 51 4.1.1 Struktura pierwszorzędowa ............................................................................................. 51 4.1.2 Struktura drugorzędowa .................................................................................................. 53 4.1.3 Struktura trzeciorzędowa ................................................................................................. 60 4.1.4 Rodzaje oddziaływań stabilizujących strukturę ............................................................... 61 4.1.5 Struktura czwartorzędowa ............................................................................................... 67 4.1 Hierarchiczna budowa białek 4.1.1 Struktura pierwszorzędowa Łańcuch polipeptydowy Strukturę jaką posiada natywne białko opisuje się w sposób hierarchiczny Struktura I-rzędowa: kolejność, sekwencja aminokwasów w łańcuchu (skład i kolejność kolejność decydują strukturze i funkcji) Podstawowa (pierwotna) informacja o białku zawarta jest w jego sekwencji, czyli kolejności aminokwasów w łańcuchu. Skład i kolejność aminokwasów odpowiadają za późniejszą funkcje i strukturę przestrzenną. To znaczy, że łańcuch polipeptydowy o określonej sekwencji w naturalnych warunkach utworzy zawsze taką samą cząsteczkę. Ten poziom opisu budowy nazywany jest strukturą I-rzędową białka, liniową lub jednowymiarową. Aminowasy połaczone są wiązaniem peptydowym w ustalonej kolejności. Sekwencję aminokwasową odczytuje sie zawsze od tzw. N-końca (wolna grupa aminowa) w kierunkuC-konca (wolna grupa karbosylowa (Rysunek) Skrypt Bioinformatyka DRAFT Strona 51 Rysunek. Łańcuch polipeptydowy i jego zapis w kodzie 3 i 1-literowym 4.1.1.1 Wiązanie peptydowe Aminokwasy łączą się w łańcuchy polipeptydowe. wiązanie peptydowe H + H3N α C H H O C + + - O H3N α C H H 2O O H + H3N C - O α C H O C H α N C H H O C O- Rysunek Powstawanie wiązania peptydowego między dwoma cząsteczkami glicyny. Łańcuch aminokwasów: 2-10 – oligopeptyd, 10-100 – polipeptyd, powyżej 100 reszt aminokwasowych – białko. W nazwie oligopeptydów umieszcza się czasem przedrostek określający liczbę merów (di-, tri, tetra-, itd.), lub cyfrę arabską (2-, 3-, 4-, itd.) Skrypt Bioinformatyka DRAFT Strona 52 a) b) R1 + H3N C H H α C N C O H α R3 O C R2 α N C H H H C O N H C O α C O R4 N- koniec - C- koniec Rysunek. a) 4-Alanina lub tetra-Alanina, czyli łańcuch peptydowy złożony z czterech alanin., b) tetrapeptyd o sekwencji R1R2R3R4, Ri – oznacza dowolną resztę aminokwasową. kąty walencyjne i długości wiązań R2 O 1.23 Å H 123.2o 121.1o C C 115.6o N 119.5o H R1 C 121.9o 119.5o 118.2o C 1.0 Å NH3+ H O 4.1.2 Struktura drugorzędowa Struktura II- rzędowa białka dotyczy ułożenia w przestrzeni poszczególnych sąsiadujących ze sobą w sekwencji aminokwasów, zdefiniowana za pomocą trzech katów torsyjnych: φ,ψ i ω. Naturalnie skręcony lub rozciągnięty łańcuch białkowy tworzy regularne formy: helisy i β-struktury (struktury Skrypt Bioinformatyka DRAFT Strona 53 pofałdowanej kartki, β-arkusze), zwroty, oraz nieregularne pętle. Struktura stabilizowana jest głównie przez wiązania wodorowe. Cztery atomy biorące udział w wiązaniu peptydowym (-Cα-C-N-Cα-) leżą zawsze w jednej płaszczyźnie. Kąt torsyjny ω (kąt obrotu) wokół tego wiązania wynosi ~180o, utrzymując konformację TRANS. Pozostałe kąty φ (-N- Cα-C-N-) i ψ (-C-N- Cα-C-) mogą przyjmować różne wartości z określonych przedziałów (patrz Tabelka, i wykres Ramachandrana). 4.1.2.1 Kąty torsyjne Kąt torsyjny jest to kąt obrotu wokół wiązania 2-3 w łańcuchu utworzonym przez cztery połączone ze sobą atomy 1-2-3-4. W widoku wzdłuż wiązania 2-3, wiązanie 1-2 obraca się względem wiązania 3-4 (Rysunek). Zgodnie z przyjętą konwencją (Klyne&Prelog, 1960) [Klyne, W. and Prelog, V. 1960. Description of steric relationships across single bonds. Experientia 16:521--523.] D B D C B A A C Rysunek. Definicja kąta torsyjnego Obrót wokół wiązania opisany może zostać również za pomocą wartości kąta dwuściennego (dihedral angle). Analogicznie jak w przypadku kąta torsyjnego kąt dwuścienny definiuje się w oparciu u cztery atomy. Trzy pierwsze (-A-B-C-) wyznaczają jedną płaszczyznę, druga płaszczyzna wyznaczona jest przez atomy (-B-C-D-). Wiązanie między atomem B i C pokrywa się z linią przecięcia płaszczyzn, a kąt dwuścienny to kąt między tymi płaszczyznami. Skrypt Bioinformatyka DRAFT Strona 54 R2 O H ω=180o NH3+ C C C N H H R1 C O Rysunek. Kąt torsyjny ω=180o, konformacja TRANS. Przestrzenne ułożenie łańcucha może zostać opisane za pomocą kątów torsyjnych φ i ψ. Skrypt Bioinformatyka DRAFT Strona 55 4.1.2.2 Elementy struktury II-rzędowej helisy: prawoskrętna α helisa 310 helisa π helisa reszt aminkwasowych na skręt przesunięcie na resztę (Å) wiązania wodorowe helisa φ ψ ω α helisa -57 -47 180 3,6 1,5 i+4 310 helisa -49 -26 180 3,0 2,0 i+3 π helisa -57 -70 180 4,4 1,2 i+5 α - helisa 310 - helisa π - helisa (22-reszty aminokwasowe) Skrypt Bioinformatyka DRAFT Strona 56 beta-harmonijki, (β-kartki, struktury pofałdowanej kartki β-harmonijki): równoległe antyrównoległe mieszane harmonijka φ ψ ω reszt na skręt przesunięcie na resztę równoległa -139 135 180 2 3,2 antyrównoległa -119 113 -175 2 3,4 β-Struktura równoległa (fragment: 1o94.pdb) β-Struktura antyrównoległa (fragment profiliny: 1CQA.pdb) Skrypt Bioinformatyka DRAFT Strona 57 Wykres Ramachandrana Wykres Ramachandrana dla białka Skrypt Bioinformatyka DRAFT Strona 58 φ -119 -139 -57 -49 -57 β - harmonijka równoległa β - harmonijka antyrównoległa α -helisa 310 - helisa π -helisa Łamacze i wzmacniacze Struktura α -helisa β - harmonijka równoległa β - harmonijka antyrównoległa kłębek i zwrot ψ 113 135 -47 -26 -70 Wazmacniacze MLECA VIFMLY Łamacze PGYTS PGDEANSK QTRHWC GPDNSY, naładowane dla β – harmonijki Wiązania wodorowe dla α - helisy Skrypt Bioinformatyka DRAFT Strona 59 Wiązania wodorowe dla zwrotu (skrętu, β-turn) 4.1.3 Struktura trzeciorzędowa Przestrzenne ułożenie elementów struktury II-rzędowej pojedynczego łańcucha Skrypt Bioinformatyka DRAFT Strona 60 Rysunek. Struktura III-rzedowa białka EF (E.coli) na podstawie współrzędnych z 1ETU.pdb , żółte strzałki – betastuktury, czerwone spirale – alfa-helisy, zielone atomy należą do dwufosforamu guanozyny. 4.1.3.1 Klasyfikacja struktur białkowych (do uzupełnienia) CATH - CATH Protein Structure Classification http://en.wikipedia.org/wiki/CATH http://www.cathdb.info/ SCOP - The Structural Classification of Proteins http://en.wikipedia.org/wiki/Structural_Classification_of_Proteins http://scop.mrc-lmb.cam.ac.uk/scop/ Domeny, motywy, rodziny, superrodziny domeny - odrębne strukturalnie fragmenty białek Domeny, motywy, rodziny, superrodziny motywy strukturalne - struktury naddrugorzędowe: motyw all-α Domeny, motywy, rodziny, superrodziny motywy strukturalne - struktury naddrugorzędowe: motyw all-β Rodzina - homologi Rodziny 4.1.4 Rodzaje oddziaływań stabilizujących strukturę oddziaływania wodorowe oddziaływania hydrofobowe oddziaływania van der Waalsa Skrypt Bioinformatyka DRAFT Strona 61 mostki dwu-siarczkowe mostki solne 4.1.4.1 Wiązanie wodorowe Wiązania wodorowe • oddz. elektrostatyczne między dwoma względnie elektroujemnymi atomami • energia: 4 - 13 kJ/mol (energia wiązań kowalencyjnych: 418 kJ/mol) Wiązanie wodorowe Skrypt Bioinformatyka DRAFT Strona 62 4.1.4.2 Oddziaływania hydrofobowe Oddziaływania hydrofobowe -spontaniczne zwijanie białek Skrypt Bioinformatyka DRAFT Strona 63 4.1.4.3 Oddziaływania van der Waalsa ładunek - dipol dipol - dipol dyspersja (indukowane dipole) Skrypt Bioinformatyka DRAFT Strona 64 4.1.4.4 Mostek dwu-siarczkowy CYS6 CYS11 ―CH2-S-S-CH2― Rysunek. Fragment łańcucha A (5-13) insuliny świńskiej (sus scorfa, PDB ID:1ZNI) łańcuch A S łańcuch B S GIVEQCCTSICSLYQLENYCN łańcuch B S S S S FVNQHLCGSHLVEALYLVCGERGFFYTP K Rysunek. Sekwencja i struktura insuliny świńskiej łańcuch A Białka rozpuszczalne w wodzie, zawsze tworzą upakowane, globularne struktury z hydrofobowym, niepolarnym rdzeniem i hydrofilową powierzchnią. Struktura stabilizowana jest wieloma oddziaływaniami: wiązaniami wodorowymi, mostakami dwusiarczkowymi, mostkami solnymi, oddziaływaniami hydrofobowymi itd. Białka proste składają się wyłącznie z aminokwasów, białka złożone posiadają niebiałkowa grupę prostetyczna (pomocniczą), niezbędną do pełnego funkcjonowania białka. (Atomy grup protetycznych np. hem, lub inne np. cząsteczki wody nie należące do białka, ale związane z jego strukturą, definiowane są w plikach PDB jako heteroatomy) Wiedza o strukturze przestrzennej białek i kwasów nukleinowych począwszy od budowy na poziome II-rzędowym rozwinęła się znacząco wraz z narodzinami krystalografii rentgenowskiej (rozwiązanie struktury mioglobiny przez Maxa Perutza i Johna Cowdery Kendrewa w 1958, Nobel) i spektroskopii Skrypt Bioinformatyka DRAFT Strona 65 NMR. Dopiero wówczas możliwe było zweryfikowanie hipotez dotyczących pofałdowania białek i kwasów nukleinowych. Obie metody dostarczają informacji o strukturze cząsteczek na poziome atomowym, to znaczy w postaci współrzędnych atomów w przestrzeni 3D. Pliki z zapisem struktury w takiej postaci w formacie PDB przechowywane są w ProteinDataBank [.....] Obie techniki rozwiązywania struktur mają zarówno wady jaki i zalety, które znajdują swoje odzwierciedlenie w jakości deponowanych danych. Technika spektroskopii NMR ograniczona jest na razie do białek nie większych niż 40kDa. Ponadto obserwacje nie dotyczą pojedynczej cząsteczki, ale zbioru cząsteczek w roztworze, zatem otrzymany wynik jest pewnego rodzaju średnią struktur jakie może przyjmować cząsteczka. Tak więc na podstawie analizy widma NMR otrzymuje się rodzinę nieznacznie różniących się od siebie konformacji przyjmowanych przez białko. (Rys) Różnice między modelami wynikają z braku precyzji danych eksperymentalnych oraz z wewnętrznej dynamiki białka. Rys. Rodzina 10 struktur heksameru insuliny otrzymana dzięki spektroskopii NMR (1ai0.PDB). Problemy krystalografii rentgenowskiej dotyczą głównie pozyskiwania wysokiej jakości kryształów. Nie wszystkie białka udaje się skrystalizować i też nie wszystkie kryształy nadają się do badań. Analiza wyników pochodzących z dyfrakcji na niedoskonałych kryształach jest utrudniona. Jakość rozwiązania struktury (rozdzielczość) określa się w Angstremach (Å). Najlepsza rozdzielczość struktur większości białek wynosi na ogół 2 Å. Skrypt Bioinformatyka DRAFT Strona 66 Nie jest to jednak gwarancja, że wszystkie atomu zostały poprawnie zlokalizowane. Często zdarza się, ze gorzej zlokalizowane atomy, aminokwasy, lub całe fragmenty białka nie są umieszczone w pliku PDB. 4.1.5 Struktura czwartorzędowa Przestrzenne ułożenie dwóch lub więcej łańcuchów polipeptydowych tworzących natywną cząsteczkę białka Struktura IV –rzędowa opisuje przestrzenne ułożenie podjednostek białkowych. Każda podjednostka jest odrębnym łańcuchem białkowy wchodzący w skład funkcjonalnego białka. Białka mogą mieć strukturę monomeryczną (jednodomenową), ale często spotyka się białka złożone z wielu podjednostek. W najprostszym przypadku jest homodimer złożony z dwóch identycznych łańcuchów. Hemoglobina transportująca tlen w organizmie jest tertramerem o budowie α2β2 (Rys.) Rys. Dimer αβ i tetramer α2β2 hemoglobiny na przykładzie 1G0B.pdb Jeszcze ciekawszym przykładem struktury IV-rzędowej jest ferrytyna odpowiedzialna za magazynowanie tlenu, która jest 24-merem (Rys.) Rys. Ferrytyna - 24mer (1BG7.pdb) Skrypt Bioinformatyka DRAFT Strona 67