Struktury danych 1. Dynamiczne struktury danych Zmienna dynamiczna jest to zmienna, która pojawia się (i znika) wtedy gdy jest potrzebna (lub nie jest) podczas wykonywania się programu. Zwykłe zmienne statyczne, istnieją przez cały czas wykonywania się programu. Odwołania do zmiennych dynamicznych odbywają się poprzez wskazy1 , a nie przez nazwy definiowane przez użytkownika, jak to ma miejsce w przypadku zwykłych zmiennych statycznych. W skazy. Sytuację tę możemy graficznie przedstawić tak jak pokazano niżej. z w −→ Wskaz ’w’ (pointer) pokazuje jakąś wielkość ’z’, której wartość umieszczona jest w jakimś miejscu pamięci komputera (reprezentowanym na rysunku przez prostokąt). Jak zadeklarować zmienną dynamiczną? Można dokonać tego przez zgłoszenie, zdefiniowanie typu ( patrz diagram poniżej). -->( type )-->[ Nazwa typu ]-->( = )-->( ^ )-->[ Typ bazowy ]-->( ; )--> Przykład. type intwskaz=\^{~}integer;\\ var iw: intwskaz; W ten sposób iw jest zmienną wskazującą wielkości typu integer. Wartość zmiennej wskazanej przez iw jest zadana przez iw^. 5 iw −→ iw^=5. W przedstawionej sytuacji wartość zmiennej pokazywanej przez iw jest równa 5 (to zawartość obszaru wskazywanego przez iw). Przykład. Innym przykładem jest zmienna wk typu wrek zdefiniowana następująco: type wrek=^kalendarz kalendarz=record miesiac: (Sty,Lut,Mar,Kwi,Maj,Cze,Lip,Sie,Wrz,Paz,Lis,Gru); dzien : 1..31 1 Czasami używa się też nazwy wskaźniki co może się mylić ze wskaźnikami tablic lub nazwy angielskiej pointers. 1 end; var wk: wrek; Zmienna wk jest wskazem do zmiennej o dwóch polach skalarnych: miesiac i dzien. wk −→ Gru | 28 Pola rekordu zawierającego fragment kalendarza są dostępne poprzez następujące wielkości wk^.miesiac wk^.dzien Istnieją dwie procedury Turbo Pascala, które tworzą lub usuwają (niszczą) zmienne dynamiczne. Są to new(p) oraz dispose(p) Wywołanie procedury new(p) powoduje nadanie wartości wskazowi p oraz utworzenie zmiennej wskazywanej przez p. Wywołanie podprogramu dispose(p) powoduje zwolnienie pamięci zarezerwowanej dla zmiennej wskazywanej przez p oraz "wyzerowanie"p: p=nil. Wielkość nil jest słowem zarezerwowanym języka Pascal i oznacza ńic". Zmienna o wartości nil nic nie pokazuje. Wskazy mogą pokazywać złożone struktury danych Pascala. Mogą to być np. drzewa binarne (patrz dalej). A /\ / \ / / B /\ / \ / C \ \ E /\ / \ \ / \ D F G / /\ I J K / \ Drzewo binarne type wskaz=^wezel; wezel=record lewywskaz : wskaz; nazwa : char prawywskaz: wskaz; end; var p, root: wskaz; 2 Każdy węzeł zawiera trzy pola: dwa wskazania do innych węzłów, lewego i prawego (lewywskaz, prawywskaz) oraz "wartość", nazwa, którą jest pojedynczy znak. Chcę zwrócić uwagę, że nie deklarujemy zmiennych typu wezel lecz wskazy! do zmiennych tego typu. Są to wskazy p oraz root. Chcąc utworzyć drzewo o jednym węźle napiszemy new(root); { rezerwacja miejsca + nadanie wartości zmiennej root } { definicja pola nazwy węzła } { brak węzła z lewej strony } { brak węzła z prawej strony } root^.nazwa:=’a’; root^.lewywskaz:=nil; root^.prawywskaz:=nil; Schematycznie ygląda to następująco: root −→ nil | a | nil Jeśli chcemy by któryś ze wskazów pokazywał inny węzeł, tak jak np. tutaj root −→ nil | a | * −→ nil | b | nil to możemy to zapisać tak new(p); root^.prawywskaz:=p; { rezerwacja miejsca + nadanie wartości zmiennej p } { prawy wskaz pokazuje nowy węzeł } p^.nazwa:=’b’; p^.lewywskaz:=nil; p^.prawywskaz:=; { definicja pola nazwy węzła } { brak węzła z lewej strony } { brak węzła z prawej strony } Jeśli teraz chcielibyśmy usunąć utworzony właśnie węzeł, zapiszemy: root^.prawywskaz:=nil; dispose(p) { usuwa zarezerwowaną wcześniej przestrzeń zajmowaną przez zmienną wskazywaną przez p } L isty jednostronne. Przykładem zastosowania rekordów i wskazów jest jednostronna lista połączona. Jest to struktura, której węzły zawierają dane i pokazują następne elementy listy. -nagłówek- −→ dane| −→ dane| −→ . . . −→ dane| −→ Włączanie nowych elementów do listy jednostronnej. Załóżmy, że mamy następującą listę. 5| −→ 10| −→ 15| −→ Jeśli między dwa elementy, np. [10| ], [15| ] tej listy, chcemy wprowadzić element [12| ] wystarczy zarezerwować miejsce w pamięci na element 3 [12| ]. W elemencie [12| ] wstawić wartość wskazu do elementu [15| ] i następnie wstawić wartość wskazu do elementu [12| ] w elemencie [10| ]. Przykładem konkretnej realizacji może być terminarz spotkań, który zawiera godzinę, nazwisko osoby oraz wskażuje następne spotkanie. Wykonanie terminarza przy użyciu tablic nie byłoby tak proste jak to z użyciem list. Napiszemy program, który definiuje listę spotkań. Przykład. type wsk=^spotkania; spotkania=record dane=record osoba: array[1..20] of char; godzina: 0..23; minuta: 0..59 end; nastepny: wsk { wskaz do następnego spotkania } end; var naglowek: wsk; Zadanie 1. Organizator spotkań 3 Napisz program, organizator spotkań, który pozwala założyć i modyfikować listę spotkań (wstawiać, usuwać). Elementami listy niech będą godzina, minuta, osoba (nazwisko) i miejsca spotkania (adres). [Spis ] M acierze kwadratowe. Duże macierze kwadratowe, np. macierz o wymiarach 5000×5000, czyli zawierająca 25000000 elementów, stwarzają duży problem numeryczny. Jak zorganizować dane i program, który musi nimi operować? Jednym z możliwych rozwiązań jest następujące. Można wczytywać z pliku jeden wiersz macierzy i mieć szybki dostęp do 5000 elementów na raz. Co jednak zrobić gdy potrzebne są dwa lub więcej wierszy na raz? Tak jest np. w przypadku mnożenia macierzy. Zadanie 2. Złożoność 2 Napisz program, który czyta plik z tablicą liczb rzeczywistych o wymiarach 1000 × 1000. Oceń stopień złożoności programu. Znajdż czas obliczania sumy elementów takiej tablicy. [Spis ] Zadanie 3. Wyznacznik 2 Policz wyznacznik tablicy 1000 × 1000 złożonej z liczb losowych z przedziału <0,1> wygenerowanych przez funkcje rand() Turbo Pascala. [Spis ] Literatura: Cormen Leiserson, Rievest, ... Do dynamicznych struktur danych należą stosy, kolejki, drzewa itp. Jak zawsze, z każdym typem danych, związane są typowe dla danej struktury operacje. Operacje wykonywane na zbiorach dynamicznych, takie jak wstawianie elementów, usuwanie elementów oraz sprawdzanie przynależności elementu do zbioru można podzielić na zapytania i operacje modyfikujace. Są to Search, Insert, Delete, Minimum, Maximum, Successor, Predecessor, itp. W kolejnych częściach omówimy różne struktury danych dynamicznych wraz z odpowiadającymi im operacjami. 4 1.1. Stosy, kolejki, listy, drzewa S tos S jest dynamiczną strukturą danych, w której element najpóźniej dodany do struktury usuwany jest jako pierwszy (Last in, First out; jest to tzw. struktura LiFo). Zwyczajowo, operacja Insert nosi nazwę Push, a operacja Delete nazywa się Pop. Przykłady: stos talerzy w barach samoobsługowych, stos rozkazów i danych w pamięci komputera, itp. Stos o liczbie elementów nie większej niż n można zaimplementować w tablicy S[1..n]. Dodatkowa cecha (atrybut) top[S] określa aktualną długość stosu S. Elementem na dnie stosu jest S[1], a S[top[S]] jest ostatnim elementem stosu. Jeśli top[S] = 0 to stos jest pusty (Stack-Empty). Próba zdjęcia elementu ze stosu pustego nazywa się niedomiarem., W przypadku gdy top[S] > n (przekroczona dopuszczalna długość stosu) mówimy, że stos jest przepełniony. Poniżej przedstawione są algorytmy typowych operacji na stosach. Stack-Empty(S) 1 if top[S]=0 2 then return True 3 else return False Push(S,x) 1 top[S] <- top[S]+1 2 S[top[S]] <- x Pop(S) 1 if Stack-Empty(S) 2 then error ,,niedomiar’’ 3 else top[S] <- top[S]-1 4 return S[top[S]+1] Rysunek przedstawia działanie operacji Push i Pop na stosie S. (a) (b) 1 2 3 4 5 xxxxx 6xxxxx 7xxxxx 8 xxxxx 9xxxxx 10 xxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxx S 12 5 7 8 2xxxxx xxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxx (c) 1 2 3 4 5 6 7 8 9 10 xxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx xxxxxxxxxx S 12 5 7 8 2 4 3 xxxxxx xxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx top[S]=5 top[S]=7 Zadanie 4. Palindromy 1 2 3 4 5 6xxxxx 7xxxxx 8 xxxxx 9xxxxx 10 xxxxxxxxxxxxxxxxxxxx xxxxxxxxxx xxxxx xxxxxxxxxxxxxxx 3 xxxxx S 12 5 7 8 2 4 xxxxx xxxxx xxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxx top[S]=6 2 Napisać program, który rozpoznaje palindromy, wykorzystując [Spis ] stos i operacje na stosie. K olejki reprezentują np. kolejki ludzi na poczcie, w banku lub sklepie, kolejka samochodów na skrzyżowaniu, itp. Operacja wstawiania do kolejki nazywana jest Enqueue, a operacją usuwania elementu z kolejki jest Dequeue. Kolejka posiada początek, head (głowę) oraz koniec tail (ogon). Element może być usunięty z kolejki jeśli tylko wtedy gdy znajduje się na jej początku. 5 Rysunek poniżej przedstawia implementację kolejki o maksymalnej liczbie elementów n−1 = 10 oraz działanie operacji Enqueue i Dequeue na tej kolejce. Tutaj przyjęto, że tablica reprezentująca kolejkę jest cykliczna, tzn. pozycja o numerze 1 jest następnikiem pozycji o numerze n. (a) (b) (c) 1 2 3 4 5 6 7 8 9 10 11 1 2 3 4 5 6 7 8 9 10 11 xxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxx xxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxx xxxxx xxxxxxxxxxxxxxxxxxxxxxxxx xxxxx Q xxxxx 7 8 xxxxx Q xxxxxxxxxx 7 8 2 12xxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxx 2 12 6 1 9 5 4 xxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxx head[Q]=3 tail[Q]=7 tail[Q]=3 head[Q]=5 1 2 3 4 5 6 7 8 9 10 11 xxxxxxxxxxxxxxx xxxxxxxxxxxxxxx xxxxxxxxxx 2 12 6 1 9 5 4 Q 7 8 xxxxx xxxxxxxxxxxxxxx xxxxxxxxxxxxxxx tail[Q]=3 head[Q]=5 Algorytmy dodawania elementów do kolejki i usuwania elementów z kolejki przedstawiamy poniżej. Enqueue(Q,x) /* wstaw element x do kolejki 1 Q[tail[Q]] <- x 2 if tail[Q]=length[Q] 3 then tail[Q] <- 1 4 else tail[Q] <- tail[Q]+1 Dequeue(Q) /* Usun element z kolejki 1 x <- Q[head[Q]] 2 if head[Q]=length[Q] 3 then head[Q] <- 1 4 else head[Q] <- head[Q]+1 5 return Zadanie 5. Kolejki */ */ 3 Kolejka dwustronna (dwukierunkowa) jest strukturą danych pozwalającą na wstawianie i usuwanie elementów na obu jej końcach. Napisz cztery procedury, służące do wstawiania i usuwania elementów z obu końców kolejki przechowywanej [Spis ] w tablicy. Zadanie 6. Kolejki i stosy 2 Pokaż, jak zaimplementować kolejkę, używając dwóch stosów. Oszacuj czas działania operacji na takiej kolejce. [Spis ] Zadanie 7. Stosy i kolejki 2 Pokaż, jak zaimplementować stos za pomocą dwóch kolejek. [Spis ] Oszacuj czas działania operacji na takim stosie. L ista z dowiązaniami jest strukturą danych, w której elementy są ułożone w liniowym porządku. Porządek wyznaczają indeksy, wskazy, związane z każdym elementem listy. Lista posiada początek (head) i koniec (tail). Elementy listy mają swoje poprzedniki (prev, od previous) oraz następniki (next). Często mamy doczynienia z listami posortowanymi. Operacje związane z listami to: wyszukiwanie, wstawianie elementów i usuwanie elementów. Elementy listy składają sie z pól zawierających wskazy do elementów poprzedniego i następnego. Jeśli takich elementów nie ma to wskaz zawiera wartość Nil. Oprócz pól zawierających wskazy, elementy listy zawierają pola zwane kluczami (key). Pola te mogą być dowolnego typu. 6 Mogą to być np. różnego rodzaju rekordy itp. listy pokazany jest na rysunku. head prev 7 next tail 9 Nil Przykład bardzo prostej 14 4 key (klucz) Nil List-Search(L,k) 1 x <- head[L] 2 while x <> Nil i key[x] <> k 3 do x <- next[x] 4 return List-Insert /* wstaw na poczatek listy L 1 next[x] <- head[L] 2 if head[L] <> Nil 3 then prev[head[L]] <- x 4 head[L] <- x 5 prev[x] <- Nil */ Algorytm ten pozwala wstawiać element x na początek listy. Następny algorytm usuwa element listy. W realizacji list za pomocą tablic wartość usuwanego elementu tablicy pozostaje niezmieniona. W ten sposób zaśmieca się pamięć (tablicę) reprezentującą listę. Podobnie dzieje się gdy korzystamy bezpośrednio z zasobów pamięci komputera używając wskazów. List-Delete(L,k) 1 if prev[x] <> Nil 2 then next[prev[x]] <- next[x] 3 else head[L] <- next[x] 4 if next[x] <> Nil 5 then prev[next[x]] <- prev[x] Jeśli udałoby się pominąć warunki brzegowe dotyczące głowy i ogona listy dwukierunkowej, wówczas treść procedury Delete byłaby prostsza. List-Delete(L, x) 1 next[prev[x]] <- next[x] 2 prev[next[x]] <- prev[x] Można to osiągnąć wprowadzając tzw. wartownika, który jest elementem NIL listy. Jeśli każdy wskażnik do Nil zamienimy wskaźnikiem do wartownika to lista staje się listą cykliczną. wartownik 9 14 4 nil[L] Zadanie 8. Listy 2 Napisać procedurę List-Search i List-Insert dla przypadku listy cyklicznej (z wartownikiem). [Spis ] 7 Zadanie 9. Sortowanie list 3 Napisać procedurę, która łączy dwie listy jednokierunkowe, posortowane w jedną listę posortowaną i jednokierunkową, bez używania wartowników. Następnie, zmodyfikować ją dodając wartownika o kluczu ∞ na koniec każdej z list. Porównać [Spis ] stopień komplikacji obu procedur. Zadanie 10. Odwracanie list 3 Napisać nierekurencyjną procedurę odwracającą kolejność elementów listy jednokierunkowej, działającą w czasie Θ(n). Dodatkowa pamięć (oprócz tej zajętej przez listę) powinna być stała (tj. niezależna od liczby elementów na liście). [Spis ] D rzewa binarne są w zasadzie połączonymi listami, w których każdy węzeł (ojciec) może zawierać wskazy do pary synów: lewego i prawego. Najwyższy węzeł nosi nazwę pnia (korzenia). Drzewa zawierające tylko węzeł główny noszą nazwą drzew o zerowej wysokości (czasami o jednostkowej). Każdy nowy poziom węzłów (znajdujących się na jednakowej wysokości) zwiększa wysokość drzewa o jeden. Drzewo całkowicie wypełnione posiada 2wysokość drzewa węzłów. Drzewo poszukiwań binarnych (binary search tree, BST) jest drzewem o uporzadkowanych węzłach, przy czym, porządek węzłów zadany jest wg. jakiejś operacji binarnej lub boolowskiej. Najczęściej porządek jest następujący. Numer schodzącego węzła porównywany jest z numerem pnia i jeśli jest on mniejszy lub równy numerowi pnia to węzeł umieszczany jest z lewej jego strony. W przeciwnym wypadku węzeł umieszczany jest po prawej stronie pnia. Operacja powtarzana jest na każdym poziomie drzewa, aż do momentu gdy osiągnie się poziom ostatni gdzie umieszcza się ów węzeł. W ten sposób drzewo posiada strukturę logiczną. Istnieje kilka metod przechodzenia (przemiatania) drzewa binarnego. Są to metoda preorder, metoda inorder oraz metoda postorder. Metoda preorder polega na wypisaniu klucza pnia drzewa w pierwszej kolejności, a następnie jego lewego poddrzewa. W następnym kroku przechodzi się do poddrzewa prawego. W każdym przypadku (lewego lub prawego poddrzewa) stosuje się również metodę preorder. W metodzie postorder wypisuje się klucz korzenia po wypisaniu wartości znajdujących się w poddrzewach: lewym i prawym. W metodzie przechodzenia drzewa zwanej inorder klucz korzenia wypisuje się pomiędzy kluczami z jego poddrzewa lewego i poddrzewa prawego. 5 7 4 8 5 3 nil 3 2 8 Zadanie 11. Skanowanie drzewa 3 Zaprojektuj algorytmy przechodzenia drzewa metodami inorder, postorder i preorder. [Spis ] Zadanie 12. Drzewa 2 Narysuj drzewa poszukiwań binarnych o wierzchołkach (węzłach) [Spis ] 1, 4, 5, 10, 16, 17, 21 o wysokościach 2, 3, 4, 5. P liki są strukturami danych które zawierają sekwencje elementów jednego typu. Dostęp do nich, w przeciwieństwie do tablic, jest sekwencyjny, tzn. element pliku jest dostępny gdy odpowiedni wskaz pokazuje ten element (patrz niżej). Przykład. Zadeklarujemy kilka typów plikowych. type PlikDanych: file of integer; PlikKolorow: file of (r, g, b); PlikZnakowy: file of char; Plik Tablic: file of array [1..10] of real; PlikPersonaliow: file of record Nazwisko: array [1..20] of char; RodzajZatrudnienia: (stałe, godzinowe, zlecone) end; { rekordu } var x: PlikDanych; y: PlikKolorow; z: PlikTablic; Spis: PlikPersonaliow; Podanie po zmiennej plikowej znaku ˆ pozwala wyłuskać wartość zmiennej z pliku (lub wstawić ją). Np. xôznacza liczbę całkowitą, yĵest jedną z wartości r, b lub g koloru. zĵest tablicą 10-o elementową. Pisząc zˆ [7] mamy dostęp do 7-go elementu tej tablicy. Pola rekordów z pliku Spis osiągalne są za pomocą konstrukcji: Spis^.Nazwisko[1] ... Spis^.Nazwisko[20] Spis^.RodzajZatrudnienia Funkcje związane z plikami (file) Z typami danych deklarowanych z pomocą file of wiążą się funkcje operujące na tych strukturach. Są to — eof(plik) – boolean, = true jeśli jest koniec struktury plik; — reset(plik) – ustawia wskaz do pierwszego elementu struktury plik; pozwala czytać plik; — rewrite(plik) – ustawia plik do zapisu; eof(plik)=true; — get(plik) – przesuwa wskaz do następnego elementu pliku i pobiera ten element; ... — put(plik) – dopisuje do pliku odpowiadający element Pliki tekstowe. W języku Pascal (w innych językach jest podobnie) istnieje specjalny typ predefiniowany, który zawiera znaki. Jest to typ text. Plik ten składa się z linii tekstu (line) oddzielonych znakiem nowej linii (W systemach Unix: new line; w systemach Dos, Win9x: new line + carriage return). Linie składają się ze znaków (char). 9 Z plikami tekstowymi związane są następujące operacje (zmienna plik jest typu text, zmienna znak jest typu char): — eoln(plik) – boolean; =true jeśli koniec linii — read(plik, znak) – czytanie znaku; — readln(plik, znak) – z:=plik^; while not eoln(plik) do get(plik); get(plik); — write(plik, z) – plikˆ:=z; put(plik); — writeln(plik,z) – z:=plik^; put(plik); plik^:="znl"; put(plik); Tutaj znl jest znakiem nowej linii. 10