Informacja z komputeraKiedy potrzebne są bazy danych?Najważniejsze zastosowanie komputerów - gromadzenie informacji. Biblioteka Kongresu Narodowego (Congress Library), ok. 20 Terabajtów. Digital Library Initiative, np. http://sunsite.berkeley.edu/Collections/ - wszystko cyfrowe bo brakuje pieniędzy! Organizacja dostępu do informacji multimedialnej przez WWW: teksty, mapy, obrazy, papirusy, filmy. Kiedy potrzebne są bazy danych? Niewielkie listy (adresy, telefony, książki) - wystarczy prosty edytor tekstów, można wówczas drukować na wąskim pasku papieru. Zalety programów DBMS: szybkość wyszukiwania informacji, zdalny dostęp, łatwość gromadzenia, możliwość prezentacji tej samej informacji w różny sposób. PIM (Personal Information Manager) - programy do zarządzania podręczną informacjąPodstawowe pojęciaDBMS (od angielskiego akronimu Data Base Management Systems) Dzielą się na: DSS (Decision Support Systems) i OLTP (On Line Transaction Processing) Transakcja - pełny obieg danych i aktualizacja bazy Bazy danych i banki danychODBS (Open Data Base Systems) ODBC (Open DataBase Connectivity), otwarta komunikacja pomiędzy bazami danych, standard wymiany danychDwa poziomy - logiczna i fizyczna struktury zapisu, pola, rekordy, indeksy Typy bazy danych: bazy tekstowe, bazy danych bez struktury (free form), bazy proste (flat file), bazy relacyjne, bazy obiektowo zorientowane. Formaty: wolny, struktury rekordów o zmiennej lub ustalonej długości. Repozytoria lub słowniki danych, czyli centralne "magazyny informacji" Hurtownie danych (data warehouse) Administrator baz danych (DBA, DataBase Administrator) Relacyjne bazy danych, RDBMS Podstawowe pojęcia: encje, atrybuty, klucze, związki encji, 1NF, czyli pierwsza forma normalna bazy danych. Rodzaje baz danychDSS (Decision Support Systems); OLTP (On Line Transaction Processing), transakcje ODBS (Open Data Base Systems) Sieciowe bazy danych , udostępnianie baz danych przez WWW: Lotus Domino - bardzo popularna sieciowa baza danych i system wspomagający pracę grupową. 4th Dimension 6.0, Borland IntraBuilder 1.01, askSam Web Publisher 3.0, Oracle WebServer 2.1 Do projektowania logicznej struktury danych w hierarchicznych i sieciowych bazach danych używany jest język definicji danych (DDL, Data Definition Language) a do korzystania z systemu służy język manipulacji danymi (DML, Data Manipulation Language). Obiektowo zorientowane bazy danych; rozproszone bazy danych Replikacja, temporalne bazy danych. OLAP - On-Line Analytical Processing, czyli proces podsumowania dużych ilości informacji na bieżąco. Typowe cechy programów DBMSFormularze, menu i raporty Język zapytań SQLSQL (Structured Query Language),czyli Strukturalny Język Zapytań: Standard SQL 2 opracowany w 1992 roku, rozszerzony o ODBC w 1995 roku; Standard SQL 3 wzbogacony o rozszerzenia obiektowe jest w opracowaniu i powinien się pojawić około 1999 roku. PDQ (Parallel Data Query), czyli SQL na wiele procesorów Przykłady i porównanie programów zarządzających bazami danychDuże systemy zarządzania bazami danych, stosowane przez agendy rządowe i duże firmy: miliony rekordów i gigabajty danych, systemy wielodostępne, na wieloprocesorowe komputery. Social Security, USA: 40.000 terminali, 20 milionów transakcji dziennie. NASA - przyrost 100 MB/dzień W Polsce ZUS, PZU, kasy chorych ... Niektóre instutucje naukowe, np. medyczne, skanują wiele gigabajtów obrazów dziennie.Systemy profesjonalneOracle Corporation (wg. wielkości obrotów) około 50%, Informix i Ingres około 15% Oracle to druga co do wielkości po Microsofcie firma zajmująca się oprogramowaniem.Oracle DBMS - na około 90 platformach sprzętowych, Personal Oracle na PC, Oracle Media Server, Oracle Video Server, obsługa hurtowni danych PROGRESS Application Development Environment - jeden z najbardziej popularnych w Polsce DB/2 (IBM) lub DRDA (Distributed Relational DataBase Architecture), Rozproszona Relacyjna Architektura Baz Danych. Informix Software Polska, w Polsce od 1994 rokuIngres (Computer Associates, CA) , w Polsce Rodan Systems Sp. z.o.oSybase PL Adabas C, Siemens Nixdorf Polska Gupta SQLBase (Centura Corporation)Microsoft SQL Server for Windows NTDBMS dla mniejszych firmMałe systemy na komputery osobiste i stacje robocze: dBase (Borland), od 1981 roku (dBase II pod CP/M), wersja polska ISIS wzorowany na dBase, darmowy FoxPro (Microsoft) pod DOS, Windows, Mac, Unix, wersja polska Paradox (Borland) - Query by Example, pytania przez analogie Microsoft Access (Windows) - łatwy, SQL, język Access Basic HyperCard (MacIntosh) - prosta baza hipertekstowaStandardy: IDAPI (Integrated Database Application Programming Interface), oraz ODBC ( Open Data Base Connectivity) Bazy danych bez strukturyLotus Agenda Textract, http://www.textract.com/ - bazy tekstowe, np. archiwum gazety, dla setek gigabajtów, szybkie wyszukiwanie i indeksacja informacji. Hiperkarta i hiperbazyHyperCard na Macintosha Hiperbazy w Internecie: bezpośrednie połączenia (linki) pomiędzy fragmentami tekstów. GIS, Systemy Informacji GeograficznychBazy danych połączone z cyfrowymi mapami. Proste możliwości - Lotus 123 GIS i kartografia, Smallworld GISPrzykłady banków danych i elektronicznych archiwówFundacje: fundacja im. Stefana Batorego, fundacja Sorosa, Polskie banki danych9.BIS, baza informacji skierowującej, zawiera dane o polskich firmach świadczących profesjonalne usługi informacyjne. Business Foundation - bazy danych o polskim biznesie, oferowanych towarach, firmach poszukujących partnerów zagranicznych. BMB Promotions - posiada bazę danych o wszystkich gminach w Polsce - wszystkie znaczące podmioty gospodarcze CINP - Centrum Informacji Naukowej i Przemysłowej, reprezentant STN International w Polsce, bazy danych dotyczące współpracy między firmami polskimi i zagranicznymi, bazy handlowoekonomiczne, dostęp do światowych baz informacyjnych, bazy danych dla przemysłu chemicznego. Dun & Bradstreet (D&B) Poland to polski oddział największej na świecie firmy (oddziały w 60 krajach, 2 miliony klientów rocznie) zajmującej się dostarczaniem informacji gospodarczych. EUROSTART - udostępnia kilkanaście polskich baz danych przez serwis KOLIBER dostępny przez sieć pakietową POLPAK. Giga-Teleservice - biuletyny giełdowe, informacje z rynku pieniężnego, kapitałowego i towarowego oraz system transakcyjny ogłoszeń. GUS - Główny Urząd Statystyczny, dane statystyczne, rejestr REGON Internet Securities dostarcza informacje inwestycyjno-finansowe o Polsce, Czechach, Rosji i krajach nadbałtyckich. Krajowa Izba Gospodarcza, krajowe podmioty gospodarcze KLON/JAWOR, bank informacji o organizacjach pozarządowych LEX - krajowy system informacji prawnej Ośrodek Przetwarzania Informacji (OPI) - informacja naukowa i naukowo-techniczna. PESEL , Powszechny Elektroniczny System Ewidencji Ludności Reuters Polska uruchomił w 1993 roku profesjonalny serwis informacji gospodarczych Polish Financial News Service. Teleadreson, baza danych o firmach TIP, czyli Towarzystwo Informacji Profesjonalnej, grupuje firmy specjalizujące się w udostępnianiu informacji. WWW Technology - różne bazy danych Brokerzy informacji - sprzedaż i wyszukiwanie informacji to intratny interes.Tendencje rozwojoweIntegracja: OLE oraz DocObjects, bazy wiedzy. Komputery masowo równoległe (MPP), Technologia LIMD ( Large-scale In Memory Database), Digital i Oracle, wszystko w gigabajtach RAM.