GIS - Definicje - Aragorn Server

advertisement
WPROWADZENIE
Informacja przestrzenna to dowolna informacja o środowisku geograficznym, o
obiektach i zjawiskach w przestrzeni otaczającej człowieka. Geoinformacja jest to
prezentowanie danych o dowolnych obiektach otoczenia, zagospodarowania i uzbrojenia za
pomocą skonstruowanych do tego celu technologii. Przez obiekty przestrzenne można
rozumieć obiekty naturalne i sztuczne związane z powierzchnią Ziemi oraz różne zjawiska
(przyrodnicze, społeczne, ekonomiczne), które mogą być rozpatrywane w odniesieniu do
położenia na Ziemi. Zaletą geoinformacji (patrz. Systemów Informacji Geograficznej,
Przestrzennej i Terenowej) jest to, że zjawiskom niezwiązanym bezpośrednio z położeniem
na Ziemi - przypisać można dodatkowy wymiar - miejsce określone za pomocą
współrzędnych geograficznych.
Informacja przestrzenna została wprowadzona do użycia w Polsce w roku 1988 przez
Polskie Towarzystwo Informacji Przestrzennej. Jest to pojęcie, które ma o wiele szersze
znaczenie logiczne oraz jest bardzo ogólne w ujęciu tematyki przechowywanych zbiorów.
Można stwierdzić, że geoinformacja to dowolne dane tekstowe wzbogacone o dodatkowy
atrybut - położenie i zasięg geograficzny. Rozumieć przez to należy wszelkie dane, które
definiują położenie cechy, jej charakter (punktowy, liniowy lub obszarowy) oraz czasokres
wystąpienia. Nawiązując do jednej ze znanych definicji informacji można określić informacje
przestrzenne jako znaczenie (treść) przyporządkowane danym przestrzennym
(geograficznym) przy zastosowaniu odpowiednich konwencji. Za dane przestrzenne (geodane, dane geo-referencyjne) należy rozumieć surowe liczby i fakty odzwierciedlające
pojedynczy aspekt obiektu geograficznego (którym może być każdy obiekt umiejscowiony w
przestrzeni).
Dyscyplinami, które wiążą się bezpośrednio z informacją przestrzenną są: geodezja,
kartografia, fotogrametria, teledetekcja, systemy informacji przestrzennej, kataster. Z powodu
wielu współzależności i powiązań między tymi dyscyplinami, przyjęło się nazywać je razem geomatyką. Na rangę i ważność jaką ma dziś dziedzina informacji przestrzennej wskazują
następujące fakty:
--zawrotne tempo rozwoju w tej dziedzinie, które mierzone wzrostem rynku światowego
wynosi 18-30% w skali rocznej.
--znaczna większość informacji znajdujących się obecnie w obiegu wiąże się z danymi
przestrzennymi.
--blisko 80% funkcji realizowanych w trakcie działań zarówno gospodarczych jak i
publicznych można odnieść bezpośrednio do danych przestrzennych.
--graficzne zobrazowanie danych przestrzennych należy do kategorii informacji objętych
percepcją wzrokową, stanowiącą ponad 80% wszystkich możliwych informacji, odbieranych
przez człowieka.
DEFINICJE
Podstawowe definicje od których należało by zacząć to geodezja, kartografia, forogrametria,
teledetekcja, informatyka, kataster i systemy informacji geograficznej. Są to dziedziny
podstawowe, które tworzą model rzeczywistości.
GEODEZJA [gr.], jedna z nauk o Ziemi zajmująca się wyznaczaniem jej kształtu i rozmiarów
oraz sporządzaniem modelu mat. rzeczywistej bryły ziemskiej (również wyznaczaniem
kształtu i rozmiarów tej części powierzchni Ziemi, która nie poddaje się modelowaniu;
geoida), a także określaniem wzajemnego położenia punktów na wyznaczonej powierzchni.
Ostatnio zainteresowania geodezji rozszerzyły się również na badania i pomiary deformacji
powierzchni Ziemi wywołanych przez ruchy płyt tektonicznych (ruchy kontynentów).
Sporządzenie modelu mat. polega na wyznaczeniu powierzchni zamkniętej najbliższej
rzeczywistym kształtom bryły ziemskiej i możliwej do opisania równaniem mat. oraz na
obliczeniu wartości liczbowych parametrów tego równania. /http://encyklopedia.pwn.pl/
KARTOGRAFIA [gr.], dziedzina nauki i techniki obejmująca teorię oraz metody
sporządzania i użytkowania map, a także atlasów, globusów, modeli plast. i in.; również
dziedzina działalności organiz. i usługowej związana z opracowywaniem, reprodukowaniem i
rozpowszechnianiem map. Według nowszych definicji kartografia jest dziedziną zajmującą
się przekazywaniem informacji odniesionych do przestrzeni (gł. geogr.), zakodowanych w
formie graf. lub cyfrowej. Obejmuje ona wszystkie etapy od pozyskania informacji do jej
prezentacji /http://encyklopedia.pwn.pl/
FOTOGRAMETRIA [gr.], nauka o metodach odtwarzania kształtu, rozmiarów i wzajemnego
położenia obiektów na danym terenie na podstawie zdjęć fot. tego terenu (fotogramów),
wykonywanych za pomocą specjalnych aparatów fot.; dzieli się na fotogrametrię naziemną
(terrofotogrametrię) i fotogrametrię lotniczą (aerofotogrametrię); zależnie od sposobu
wykorzystania zdjęć rozróżnia się fotogrametrię płaską (1-obrazową) i fotogrametrię
przestrzenną (2-obrazową), zw. również stereofotogrametrią, w której uzyskuje się
przestrzenny model sfotografowanego przedmiotu lub terenu na podstawie stereogramu, tj.
pary zdjęć wykonanych z dwu różnych punktów przestrzeni /http://encyklopedia.pwn.pl/
TELEDETEKCJA [gr.-łac.], metoda pozyskiwania, przetwarzania i analizy danych o
powierzchni Ziemi oraz innych planet i ich księżyców za pomocą zdalnego pomiaru przede
wszystkim promieniowania elektromagnetycznego., a także fal akustycznych., grawitacyjnych
i pola magnetycznego. Pomiary przeprowadza się przy użyciu specjalnych urządzeń
umieszczanych na pokładach samolotów i sztucznych satelitów. /http://encyklopedia.pwn.pl/
INFORMATYKA [łac.], ogół dyscyplin nauk. i techn. zajmujących się (ogólnie ujmując)
informacją, a w szczególności jej komputerowym przetwarzaniem; obejmuje: teorie
informatyczne, budowanie systemów informatycznych (w tym programowanie), budowę i
działanie sprzętu komputerowego, zastosowania metod informatycznych w różnych
dziedzinach działalności ludzkiej i in. Teorie informatyczne zajmują się badaniem zjawisk
związanych z operowaniem informacją — jej przedstawianiem, przechowywaniem,
uzyskiwaniem, porządkowaniem, przetwarzaniem. /http://encyklopedia.pwn.pl/
KATASTER [łac.], urzędowy opis gruntów i budynków, służący do oznaczenia
nieruchomości przy zakładaniu i prowadzeniu ksiąg wieczystych, wodnych, górn. i in. oraz
przy wymiarze podatków; zawiera m.in. dane o właścicielu, o powierzchni gruntu,
dochodowości; w Polsce zamiast k. wprowadzono 1955 jednolitą ewidencję; gruntów i
budynków; obecnie zasady ewidencji gruntów i budynków reguluje ustawa z 1989; 2)
dawniej również podatek nałożony na nieruchomość. /http://encyklopedia.pwn.pl/
GIS, ang. Geographical Information Systems, systemy informacji geograficznej, programy
komputerowe przeznaczone do przechowywania i przetwarzania informacji o obiektach
lokalizowanych na mapach; umożliwia zestawianie map o żądanej treści, odwzorowaniu i
skali. http://encyklopedia.pwn.pl/
Analizując głębiej zagadnienie systemów informacyjnych można wysnuć kolejne rozwinięcie
definicji GIS.
- GIS jest to system informatyczny zaprojektowany do pracy z danymi, które są odniesione do
przestrzennych lub geograficznych współrzędnych. Innymi słowy GIS jest zarówno systemem
bazodanowym z możliwością przechowywania przestrzennie odniesionych danych, jak i
zbiorem funkcji przeznaczonych do przetwarzania tych danych.
- GIS jest systemem przeznaczonym do zbierania, przechowywania, weryfikacji,
integrowania, manipulowania, analizy i wizualizacji danych przestrzennie odniesionych do
powierzchni Ziemi. GIS jest zautomatyzowanym systemem do gromadzenia,
przechowywania, wyszukiwania, analizowania i wyświetlania danych przestrzennych.
- GIS to system składający się ze sprzętu, oprogramowania i procedur zaprojektowany dla
zbierania, zarządzania, manipulowania, analizowania, modelowania i wizualizacji danych
odniesionych przestrzennie, w celu rozwiązywania skomplikowanych problemów
planistycznych i organizacyjnych.
Geograficzne systemy informacyjne to dyscyplina rozwinięta w krajach anglosaskich. Termin
GIS jest znany na całym świecie jako najlepiej oddający charakter realizowanych zadań. W
Polsce używany jest inny termin: Systemy Informacji Terenowej (SIT) wraz z Systemem
Informacji Przestrzennej (SIP). W przekonaniu środowiska geodezyjnego różnice odkrywają
sie głównie w skali opracowania map. Przyjmuje się, systemy bazujące na mapach w skali
1:5000 i mniej uznawane są za systemy informacji terenowej, natomiast te pracujące na
mapach o większych skalach nazywamy systemami informacji geograficznej. Zasadność
podziału jest jednak ukryta głębiej i dotyczy szczegółowości opracowań niesionych na
różnych materiałach kartograficznych. Generalizacja szczegółów na różnych skalach map,
począwszy od map zasadniczych w skali 1:500 do map przeglądowych w skali 1:10000 jest
tutaj kluczowa. Charakter danych jest uznany za techniczny i geodezyjny. Zbliża się on swoją
tematyką do określania położenia , wielkości i zasięgu elementów zagospodarowania terenu,
uzbrojenia podziemnego, różnic w użytkowaniu gruntów, sposobu wykorzystania gruntów,
rejestrowania zmian własnościowych, itp. W systemach uważanych za geograficzne specyfika
dotyczy raczej rodzaju i kategorii przechowywanych danych. Dotyczą one głównie informacji
o zasięgu regionalnym, kulturowym, administracyjnym. Tematyka danych zbliża się do
zagadnień komunikacyjnych, społecznych, socjologicznych, planistycznych, przemysłowych
itp.
Przytoczone powyżej definicje są w dużej mierze zbieżne i wskazują na techniczną stronę
systemów GIS. Taki punkt widzenia wynika z historycznego rodowodu systemów GIS,
czerpiących zarówno z aplikacji typu CAD, produktów wspierających cyfrową kartografię,
jak i systemów zarządzania bazami danych. Systemy informacji przestrzennej wiążą się na
wielu płaszczyznach z kartografią, a szczególnie z tzw. cyfrową kartografią, będącą jednym z
obecnie dominujących trendów w rozwoju tej nauki.
Z podanych definicji wynikają trzy główne cechy systemu GIS:
- GIS udostępnia mechanizmy wprowadzania, gromadzenia i przechowywania danych
przestrzennych oraz zarządzania nimi, zapewnia ich integralność i spójność oraz pozwala na
ich wstępną weryfikację.
- Na podstawie zgromadzonych w systemie danych możliwe jest przeprowadzenie
specyficznych analiz opierających się m.in. na relacjach przestrzennych między obiektami.
- Wyniki analiz przestrzennych i operacji charakterystycznych dla programów bazodanowych
przedstawione mogą być w postaci opisowej (tabelarycznej) lub graficznej (mapa, diagramy,
wykresy, rysunki), stąd cechą SIP jest wizualizacja i udostępnianie informacji przestrzennych
w żądanej postaci.
K. Miksa definiuje SIG jako "system informatyczny wspierający gromadzenie, analizę i
udostępnianie danych o obiektach jednoznacznie zlokalizowanych przestrzennie". Jądrem
SIG jest baza danych geograficznych, często określana jako cyfrowe odzwierciedlenie mapy,
będąca złożeniem trzech zbiorów:
1. mapy numerycznej, w której przechowywany jest zapis współrzędnych obiektów,
2. topologii, gdzie przechowywany jest zapis relacji przestrzennych obiektów geograficznych,
3. atrybutów, cech jakościowych i ilościowych poszczególnych obiektów lub ich klas.
Baza danych geograficznych (BDG) jako integralny składnik SIG jest "zbiorem
danych numerycznych odnoszących się do obiektów o charakterze geograficznym,
jednoznacznie zlokalizowanych przestrzennie, wraz z oprogramowaniem zarządzającym,
które wspólnie z danymi pozwala na realizację określonego, ścisłego, formalnego modelu
rzeczywistości w ujęciu geograficznym".
Kryterium wyróżniającym SIT jest nie tylko dokładność, szczegółowość danych
zawartych w bazie danych systemu. Charakterystyczny dla SIT jest aspekt instytucjonalny,
uwzględniający ogół zależności prawnych, politycznych, ekonomicznych i społecznych,
związanych z funkcjonowaniem systemu, a także aspekt organizacyjny, obrazujący zależność
między środkami technicznymi, zasobami informacyjnymi oraz użytkownikami
wykorzystującymi system. Zgodnie z definicją podaną przez Międzynarodową Federację
Geodetów "SIT jest narzędziem do podejmowania prawnych, administracyjnych i
gospodarczych decyzji oraz pomocą w planowaniu i rozwoju. Składa się on z bazy danych
zawierającej dane przestrzenne dotyczące określonego obszaru oraz procedur i technik dla
systematycznego zbierania, aktualizacji i udostępniania tych danych".
Informatyczna baza danych SIT jest "zbiorem danych numerycznych odnoszących się
do elementów terenu jednoznacznie lokalizowanych przestrzennie, osób nimi władających i
relacji ich wiążących, oraz oprogramowania zarządzającego i technik organizacyjnych
gwarantujących wiarygodność i właściwą ochronę danych, realizujących wspólnie ścisły i
formalny model zarządzania danym obszarem terenu".
Ponieważ SIT jest elementem infrastruktury organizacyjnej państwa, jest wpisany w
system prawny jako forma organizacji procesu zarządzania (administrowania) terenem,
charakteryzuje się wewnętrznym sprzężeniem zwrotnym, tj. wpływa na rzeczywistość, którą
sam odwzorowuje. Projektowanie i rozwój SIT jest przedsięwzięciem znacznie bardziej
skomplikowanym i złożonym niż wdrażanie SIG, dlatego niektórzy zwracają uwagę na
konieczność szczelnej kontroli obiegu informacji w ramach SIT. Wynika to również z faktu,
iż SIT jest w głównej mierze systemem urzędniczym, nakierowanym na odbiorcę z kręgu
administracji. W ostatnich latach w publikacjach na jego temat podnoszona jest sprawa
powszechnej dostępności do danych przestrzennych.
Wdrożenie systemu GIS jest procesem długotrwałym i kosztownym, gdyż całe
przedsięwzięcie opiera się na zgromadzeniu zasobów informacji graficzno-opisowych
dotyczących obiektów, które mają być objęte systemem. Przy opracowywaniu wymagań jakie
winien spełniać system GIS przyjmuje się, że systemem muszą zostać objęte wszystkie typy
urządzeń, dla których istotną cechą jest lokalizacja i połączenie z innymi urządzeniami.
Dotyczy to wszystkich rodzajów sieci. Istotne jest prowadzenie w systemie różnych, lecz
powiązanych ze sobą warstw. Wymagane jest zachowanie połączeń i relacji między
obiektami w poszczególnych warstwach tak, aby zmiany zachodzące w jednej warstwie były
odzwierciedlane w drugiej. System powinien posiadać następujące właściwości:
- bezproblemowa (pod względem ilości, jakości i interwału czasowego) aktualizacja
wszystkich danych
- wybór treści, obszaru i skali wyświetlania,
- wyszukiwanie i wybieranie elementów na podstawie ich cech opisowych,
- analizy przestrzenne wykonywane zarówno w trybie graficznym jak i bazodanowym,
- tworzenie i modyfikacja zależności topologicznych między obiektami,
- prowadzenie systemu w taki sposób, aby przepływ aktualizowanych danych był
niezauważalny (dotyczy to wymiany niemal całych pakietów danych w różnych przedziałach
czasowych, np. dane statystyczne są aktualizowane raz na rok; dane ewidencyjne kwartalnie; dane finansowe - miesięcznie; dane pogodowe - dziennie lub kilka razy na dzień,
dane o natężeniu ruchu drogowego - bez przerwy) oraz zmiany architektury i technologii
powinno zakładać częste modernizacje (system oparty na nowych technologiach zastaje z
reguły wdrożony po czasie kilku lat - wtedy może ona już wychodzić z użycia)
- mechanizmy zabezpieczeń udostępniania wersji projektowych innym użytkownikom,
zatwierdzania tych wersji i wprowadzania ich do użycia,
- dopasowanie adresów tzw. geokodowanie (proces, dzięki któremu na mapie można
ulokować obiekt na podstawie adresu), możliwość prowadzenia warstwy geograficznej
sprzężonej interaktywnie ze schematami,
- połączenie z zewnętrzną bazą danych i współpraca z aplikacjami zewnętrznymi, wymiana
danych z innymi systemami (eksport / import) z możliwością definiowania struktur danych i
formatów użytkownika,
- bogate możliwości tworzenia raportów i ich prezentacja w popularnych środowiskach
pakietów biurowych oraz w systemach zarządzania informacją (IMS - Information
Management System),
- dynamiczne wyświetlanie danych na mapie w czasie rzeczywistym, technika dołączania
obiektów multimedialnych.
BAZA DANYCH - (źródło: http://www.wsp.krakow.pl/~wmkolasa/bazy/101full.html , a
dalej: artykuł ze słownika encyklopedycznego informacji, języków i systemów informacyjnowyszukiwawczych. Oprac. B. Bojar. Warszawa 2002, s. 27-28): uporządkowany zbiór
informacji (danych) z określonej dziedziny lub tematyki, przeznaczony do wyszukiwania.
Termin baza danych upowszechnił się wraz z rozwojem informatyki, umożliwiającym
tworzenie baz danych na maszynowym nośniku informacji. Obecnie oznacza zazwyczaj
kom­puterową bazę danych. Ostatnio daje się zaobserwować tendencja zamiennego
stosowania terminów baza danych i system informacyjny (system informacyjnowyszukiwawczy). Często, zwłaszcza w literaturze z zakresu informatyki, terminem baza
danych określany jest zbiór danych wraz z oprogramowaniem i innymi środkami służącymi
do przetwarzania danych. Baza danych składa się z wielu zbiorów (plików), z których
najważniejszymi są zbiór główny i indeks (indeksy). Rekordy w bazie oraz pola w rekordach
mogą być wzajemnie powiązane. Istnieje wiele modeli danych, ale w praktyce bardzo często
przy projektowaniu baz danych stosowane są rozwiązania własne. Przez wiele lat rozróżniano
trzy podstawowe modele struktury bazy: hierarchiczny, sieciowy i relacyjny, a w ostatniej
dekadzie bardzo się roz­powszechnił model obiektowy. Zdefiniowanie bazy danych polega na
określeniu: (l) formatu rekordu (i ew. powiązań między rekordami), (2) formatu (formularza
wejściowego) wprowadzania informacji do bazy, (3) zasad tworzenia indeksu (indeksów), (4)
formatu wyświetlania/wydruku. Podczas projek­towania bazy danych należy określić zasady
tworzenia zapytań informacyjnych kierowa­nych do bazy. Tworzenie i użytkowanie baz
danych wymaga korzystania z oprogramowania. Pakiety programów do obsługi baz danych są
obecnie bardzo zróżnicowane, najogólniej należy rozróż­niać oprogramowanie wewnętrzne,
składające się na system zarządzania bazą danych, oraz oprogramowanie zewnętrzne, służące
do realizacji konkretnej bazy danych. Baza danych może się fizycznie znajdować: (l) u
dysponenta (producenta i/lub dystrybutora) bazy, użytkownik korzysta z bazy online za
pośrednictwem sieci komputerowych lub zleca przeprowadzenie wyszukiwania w trybie
wsadowym, (2) u użytkownika, który pozyskuje bazę na nośniku informacji (CD-ROM,
taśma magnetyczna, dyskietka) do własnego przetwa­rzania: na jednym komputerze, na kilku
komputerach lub w sieci lokalnej. Rozpowszechnia się także korzystanie z rozproszonych baz
danych w modelu klient/serwer. Zaproponowano wiele typologii baz danych. Wyróżnia się
rodzaje baz danych najczęściej zależnie od: a) Rodzaju gromadzonej w nich informacji:
bibliograficzne, zawierające informację dokumentacyjną, i faktograficzne, zawierające
informację faktograficzną; b) Rodzaju denotacji utrwalonych danych: źródłowe, denotujące
obiekty rzeczywistości poza językowej, np. bazy danych faktograficzne i bazy danych
odsyłające, denotujące zbiory dokumentów, czyli pełniące funkcję metainformacyjną
względem innych zbiorów informacji. Bazę danych odsyłającą może stanowić baza danych
bibliograficznych lub faktograficznych, np. baza danych terminologicznych (słownikowa)
zawierająca terminologię danej dziedziny wiedzy lub słownik języka informacyjnowyszukiwawczego, służąca jako pomoc przy formułowaniu strategii wyszukiwawczej, np.
baza danych Chemname, Vocabulary Switching System (VSS). Bazy danych
faktograficznych odsyłające do innych baz nazywane są często bazami skierowującymi, np.
Dialindex w systemie Lockheed-Dialog; c) Zakresu tematycznego (pola semantycznego)
danych: jednodziedzinowe i wielodziedzinowe. Wśród baz wielodziedzinowych wyróżnia się
bazy transdyscyplinowe zawierające dane jednej głównej dziedziny, np. medycyny oraz w
ograniczonym zakresie dane z innych dziedzin komplementarnych z punktu widzenia
przedmiotu i metod badań, np. chemii, biologii; d) Rodzaju bazy notacyjnej danych:
numeryczne, tekstowo-numeryczne i ikonograficzne; e) Poziomu opisu organizacji danych na
nośniku informacji: logiczne, reprezentujące przyję­ty w danym systemie informacyjnowyszukiwawczym model danych oraz fizyczne, reprezentujące realizację danego modelu na
konkretnym nośniku informacji; f) Przyjętego modelu danych (struktury danych):
hierarchiczne, sieciowe, relacyjne; g) Zakresu realizacji funkcji wyszukiwawczej w
charakterystykach wyszukiwawczych dokumentów (2). Z tego punktu widzenia wydziela się
bazy danych: pełnotekstowe, za­wierające teksty dokumentów pierwotnych, odróżniane od
baz danych bibliograficz­nych, w których możliwe jest realizowanie funkcji wyszukiwawczej
w pełnym zakresie charakterystyki wyszukiwawczej dokumentu. Por. wyszukiwanie
pełnotekstowe; h) Przeznaczenia, które może polegać na zaspokajaniu potrzeb
informacyjnych określonej kategorii użytkowników. Wyróżnia się tzw. bazy ukierunkowane
zadaniowo, np. baza danych NASA, IN1S, ERDA. Wszystkie stosowane w praktyce podziały
baz danych nie są podziałami logicznymi, po­nieważ do ich uzyskania zastosowano
jednocześnie różne kryteria. Typowymi elementami opisu baz danych w katalogach baz
danych są: nazwa; skrót naz­wy; inne wersje nazwy i skrótu nazwy; producent (często z
rozróżnieniem na producenta in­formacji i na producenta bazy, np. na dysku CD-ROM);
źródła informacji zawartych w bazie; język; typ; zakres geograficzny; zakres czasowy; zakres
przedmiotowy (tematyka, opis zawartości); odpowiedniki drukowane i/lub na nośnikach
maszynowych; informatyczne wymagania użytkowania; ograniczenia licencyjne;
oprogramowanie; producent oprogra­mowania; data pierwszego wydania; częstotliwość
aktualizacji; aktualna wersja bazy; cena (np. prenumeraty na jedno stanowisko, na wiele
stanowisk, w sieci, w serwisach online);
BAZA DANYCH, (źródło: http://encyklopedia.pwn.pl/6376_1.html) zbiór wzajemnie
powiązanych danych wraz z oprogramowaniem umożliwiającym ich definiowanie,
wykorzystywanie i modyfikowanie. Powiązane tematycznie dane są grupowane w jednostki
zw. rekordami i zapamiętywane w plikach; rekord odpowiada na ogół pewnemu konkretnemu
opisywanemu obiektowi (osobie, rzeczy, pojęciu), pliki zaś grupują rekordy o podobnej
strukturze. Programy baz danych — wyszukujące lub zmieniające dane — zawierają wiedzę o
strukturze plików i rekordów: fiz. (metoda zapisu w pamięci) i log. (interpretacja
programisty). Struktura bazy danych zależy od celu jej stworzenia, tzn. od rodzaju
zastosowań, do których będzie używana.
Zorganizowanie wielkiej liczby danych oraz efektywne zarządzanie nimi (przy łatwym
dostępie dużej liczby użytkowników z różnych, często odległych miejsc) wymagało
stworzenia specjalnego oprogramowania obsługującego bazy danych, zw. systemami
zarządzania baz danych lub systemami baz danych. Należą one do najbardziej
skomplikowanych rodzajów oprogramowania — mają zarówno cechy kompilatorów, jak i
systemów operacyjnych. Systemy baz danych są używane w fabrykach, bankach, szpitalach,
urzędach itp., gdzie na co dzień korzysta się z wielu danych. Sposób reprezentowania
obiektów modelowanego świata oraz zachodzących między nimi związków zależy od
przyjętego modelu danych. Najczęściej używanymi modelami danych były (chronologicznie):
hierarchiczny, sieciowy i relacyjny. Ten tradycyjny podział traci jednak powoli na
aktualności.
W latach 70. i 80. dominowały scentralizowane systemy baz danych, w których wszystkie
dane były zarządzane przez jeden komputer. Ostatnio zaczęły powstawać systemy
rozproszonych baz danych, tj. takie, w których dane są przechowywane w różnych,
oddalonych od siebie komputerach; za pośrednictwem sieci komputerowej system steruje
dostępem do tych danych.
Od systemów baz danych (scentralizowanych i rozproszonych) wymaga się zapewnienia
m.in.: integralności (poprawności) danych, współbieżnej obsługi żądań dostępu do baz
danych, zgłaszanych jednocześnie przez różnych użytkowników, kontroli dostępu do danych,
możliwości odtworzenia bazy danych (np. jej stanu przed awarią sprzętu).
Do poł. lat 80. uporano się zasadniczo z problemami sprawnego zarządzania dużymi zbiorami
danych, efektywnej realizacji żądań użytkowników, a także niezawodności oraz ochrony
dużych baz danych. Wraz z rozwojem systemów baz danych wykształciły się nowe potrzeby
ich użytkowników: 1) lepszego modelowania świata rzeczywistego (zwł. w przypadku
obiektów o złożonej strukturze); 2) sprawnego zarządzania danymi niesformatowanymi, np.
tekstami, obrazami, mapami, sygnałami dźwiękowymi itp.; 3) przechowywania wiedzy o
modelowanym świecie nie tylko za pomocą faktów, ale i w postaci ogólnych reguł, a także
dokonywania na ich podstawie wnioskowania. Bazy danych spełniające wymagania 1 i 2 zw.
są obiektowymi (obiektowo zorientowanymi), a wymaganie 3 — dedukcyjnymi;
dotychczasowe rozwiązania (1990) mają raczej charakter badawczy i prototypowy.
SQL (źródło: http://pl.wikipedia.org/wiki/SQL) to skrót od Structured Query Language (ang.
strukturalny język zapytań). Jest to język programowania opracowany w latach
siedemdziesiątych w firmie IBM. Stał się on standardem w komunikacji z serwerami
relacyjnych baz danych, takimi jak IBM-owskie DB2 i SQL/DS, a także MySQL,
PostgreSQL, Oracle, Microsoft SQL Server, Microsoft Access, Sybase Adaptive Server
Enterprise, Sybase SQL Anywhere, Computer Associates Ingres, Informix, mSQL, First SQL
i inne. Można powiedzieć, że korzystanie z relacyjnych baz danych, to korzystanie z SQLa.
Pierwszą firmą, która włączyła SQL do swojego produktu komercyjnego, był Oracle. Dalsze
wprowadzanie SQLa, w produktach innych firm, wiązało się nierozłącznie z wprowadzaniem
modyfikacji pierwotnego języka. Wkrótce utrzymanie dalszej jednolitości języka wymagało
wprowadzenia standardu.
W 1986 roku SQL stał się oficjalnym standardem, wspieranym przez Międzynarodową
Organizację Normalizacyjną (ISO) i jej członka, Amerykański Narodowy Instytut
Normalizacji (ANSI). Wczesne wersje specyfikacji (SQL86 i SQL89) były w dużej mierze
jedynie określeniem wspólnej płaszczyzny łączącej różne istniejące wówczas produkty i
pozostawiały wiele swobody twórcom implementacji. Z czasem jednak systemy
komputerowe uległy integracji i rynek zaczął domagać się aplikacji oraz ich funkcji
faktycznie współpracujących z wieloma różnymi bazami danych. Pojawiła się potrzeba
określenia standardu ściślejszego. Mógł on jednocześnie obejmować nowe elementy, nieujęte
do tej pory w języku. Tak powstał SQL92, obowiązujący w produktach komercyjnych do
dziś.
Z technicznego punktu widzenia, SQL jest podjęzykiem danych. Oznacza to, że jest on
wykorzystywany wyłącznie do komunikacji z bazą danych. Nie posiada on cech
pozwalających na tworzenie kompletnych programów. Jego wykorzystanie może być trojakie
i z tego względu wyróżnia się trzy formy SQLa:
SQL interakcyjny lub autonomiczny wykorzystywany jest przez użytkowników w celu
bezpośredniego pobierania lub wprowadzania informacji do bazy. Przykładem może być
zapytanie prowadzące do uzyskania zestawienia aktywności kont w miesiącu. Wynik jest
wówczas przekazywany na ekran, z ewentualną opcją jego przekierowania do pliku lub
drukarki.
Statyczny kod SQL (Static SQL) nie ulega zmianom i pisany jest wraz z całą aplikacją,
podczas której pracy jest wykorzystywany. Nie ulega zmianom w sensie zachowania
niezmiennej treści instrukcji, które jednak zawierać mogą odwołania do zmiennych lub
parametrów przekazujących wartości z lub do aplikacji. Statyczny SQL występują w dwóch
odmianach.
Embedded SQL (Osadzony SQL) oznacza włączenie kodu SQL do kodu źródłowego innego
języka. Większość aplikacji pisana jest w takich językach jak C++ czy Java, jedynie
odwołania do bazy danych realizowane są w SQL. W tej odmianie statycznego SQLa do
przenoszenia wartości wykorzystywane są zmienne.
Język modułów. W tym podejściu moduły SQL łączone są z modułami kodu w innym języku.
Moduły kodu SQL przenoszą wartości do i z parametrów, podobnie jak to się dzieje przy
wywoływaniu podprogramów w większości języków proceduralnych. Jest to pierwotne
podejście, zaproponowane w standardzie SQL. Embedded SQL został do oficjalnej
specyfikacji włączony nieco później.
Dynamiczny kod SQL (Dynamic SQL) generowany jest w trakcie pracy aplikacji.
Wykorzystuje się go w miejsce podejścia statycznego, jeżeli w chwili pisania aplikacji nie jest
możliwe określenie treści potrzebnych zapytań - powstaje ona w oparciu o decyzje
użytkownika. Tę formę SQL generują przede wszystkim takie narzędzia jak graficzne języki
zapytań. Utworzenie odpowiedniego zapytania jest tu odpowiedzią na działania użytkownika.
Wymagania tych trzech form różnią się i znajduje to odbicie w wykorzystywanych przez nie
konstrukcjach językowych. Zarówno statyczny, jak i dynamiczny SQL uzupełniają formę
autonomiczną cechami odpowiednimi tylko w określonych sytuacjach. Większość języka
pozostaje jednak dla wszystkich form identyczna.
Download