ORGANIZACJA PROCESU PROGNOSTYCZNEGO

advertisement
ORGANIZACJA PROCESU
PROGNOSTYCZNEGO
dr inż. Arkadiusz Borowiec
Instytut Inżynierii Zarządzania
Politechnika Poznańska
Dane wykorzystywane w
prognozowaniu
W każdym procesie prognozowania
wykorzystuje się pewne dane związane
z otoczeniem oraz z obiektem, dla którego
sporządzana jest prognoza. Wyróżniamy
dwa rodzaje danych wchodzących w skład
prognozowania, są to dane wewnętrzne
oraz dane zewnętrzne. Dane wewnętrzne
sporządzane są na potrzeby zarządzania,
bądź tylko w celu prognozowania,
gromadzone są przez kierownictwo.
Najważniejsze dane wewnętrzne





zbiory zasad funkcjonowania obiektu, czyli,
przepisy, regulaminy wewnętrzne
przedsiębiorstwa, receptury dotyczące procesów
technologicznych;
rejestracja zdarzeń bieżących, czyli rejestry
kosztów przedsiębiorstwa, liczba urodzeń,
zgonów w USC;
różnego rodzaju sprawozdania, np. ze
sprzedaży, zatrudnienia;
spisy;
zapisy np. jakości wyrobów, opinii
społeczeństwa;
Dane zewnętrzne
Dane zewnętrzne dotyczą otoczenia bliższego i
dalszego, otoczenie bliższe to otoczenie stworzone
przez obiekty powiązane, dalsze tworzone przez ogólne
warunki funkcjonowania obiektu. Im otoczenie jest
bliższe, a informacje szczegółowe tym dane są
trudniejsze do zdobycia. Otoczeniem bliższym dla
przedsiębiorstwa są dostawcy, klienci i kontrahenci, do
otoczenia dalszego należą instytucje krajowe i
międzynarodowe, oraz gospodarka. Dane z otoczenia
dalszego czerpane są również od sejmu, rządu, banków,
giełdy, instytucji naukowych i organizacji
międzynarodowych. Informacje rozpowszechniane są
przez mass media i literaturę specjalistyczną, dzienniki i
czasopisma.
Kryteria selekcji danych w
prognozowaniu







Prognosta musi dysponować bogatym zbiorem
wiadomości i danych ważnych, wnoszących coś nowego
do oceny zjawiska. Aby dane te miały jakąś wartość dla
prognosty ustalono kryteria, jakie są używane do analizy
danych. Wyróżnione kryteria to:
rzetelność;
jednoznaczność;
identyfikowalność zjawiska przez zmienną;
kompletność;
aktualność danych dla przyszłości;
koszt zbierania i opracowania danych;
porównywalność danych;
Rzetelność danych
Rzetelność polega na zgodności danych z przedmiotem,
którego dotyczą. Niestety trzeba się liczyć z
występowaniem dwojakich błędów. Jeden wynika z
błędów losowych, czyli z pomyłek przy zbieraniu i
przetwarzaniu informacji, drugi to błędy systematyczne
wynikające z celowego fałszowania danych. Ważna jest
weryfikacja merytoryczna i formalna rzetelności danych,
wiąże się to z ich wyrywkowym sprawdzaniem,
porównywaniem zgodności powiązanych ze sobą
danych, sporządzaniu wykresów szeregów czasowych
lub przekrojowych. Weryfikacje to muszą zostać
skorygowane, bądź wyeliminowanie, oraz zapisane, aby
mogły być źródłem korekt prognoz otrzymanych z
modeli.
Jednoznaczność danych
Jednoznaczność danych opiera się na takim
samym ich odbiorze, na takim ich
sformułowaniu, aby ich interpretacja była
zawsze taka sama.
Np. zdanie „dochód narodowy w Polsce w
2009r. wyniesie 800 bln złotych” nie jest
jednoznaczne, gdyż pojęcie dochodu
narodowego może być różnie rozumiane oraz
nie wiadomo czy dochód jest wyrażony w
cenach bieżących czy stałych.
Identyfikowalność zjawiska przez
zmienną
Istnieje wiele możliwości identyfikacji zjawisk,
czyli możliwości opisania ich za pomocą więcej
niż jednej zmiennej, nawet, jeśli są to zjawiska
proste. W zależności od celu, dla którego
robione jest to badanie musimy wybrać jeden z
mierników określających. Bardziej
skomplikowane jest to w przypadku zjawisk
złożonych. Należy wtedy odwołać się do teorii i
zrozumienia przyjętego w dotychczasowych
badaniach, w przypadku zastosowania pewnych
odstępstw, należy je uzasadnić.
Kompletność danych
Kompletność danych obejmuje takie dane,
które zawierają wszystkie ważne
informacje, wiadomości umożliwiające
rozpoznanie problemu. Wiadomości
marginesowe, powtarzające się bądź
niekompletne należy pomijać.
Aktualność danych dla przyszłości
Aktualność danych dla przyszłości związana jest
z określeniem czynnika istnienia dotąd
oddziałującego podczas sporządzaniem diagnoz
prognozowanego zjawiska. Nie każdy z tych
czynników w przyszłości będzie miał taką samą
siłę oddziaływania, dlatego też prognosta
powinien określić, który z tych czynników będzie
oddziaływał z taką samą siłą, który z mniejszą
siłą, a który będzie nabierał mocy, oraz czy jest
szansa pojawienia się nowego czynnika.
Koszt zbierania i opracowywania
danych
Koszty zbierania i opracowywania danych
są bardzo wysokie, więc należy dążyć do
minimalizacji liczby danych, oraz
zwiększenia korzystania z danych już
zgromadzonych. Nowe dane należy
pozyskiwać w sytuacji, gdy są one
niezbędne do polepszenia jakości
prognozy.
Porównywalność danych




Porównywalność danych rozpatrywana jest z
różnych punktów widzenia, dlatego możemy
wyróżnić porównywalność:
czasową, charakteryzującą się jednakowym
odstępem czasu między obserwacjami zasobów
i jednakowym przedziałem czasu dla strumieni;
terytorialną wykorzystującą jednakowe
terytorium w całym okresie objętym badaniem;
pojęć i kategorii polegające na wykorzystaniu
tych samych definicji i klasyfikacji;
metody obliczeń (np. obliczania dochodu
narodowego, indeksu inflacji, itd.)
Podstawowe rodzaje szeregów
Stany zmiennych są zapisywane w postaci
szeregów.
Mamy następujące rodzaje szeregów:
 Jednowymiarowy szereg czasowy
 Wielowymiarowy szereg czasowy
 Jednowymiarowy szereg przekrojowy
 Wielowymiarowy szereg przekrojowy
 Szereg przekrojowo – czasowy
Jednowymiarowy szereg czasowy

Ciąg zaobserwowanych stanów zmiennej Y
uporządkowanych według wartości zmiennej czasowej t,
gdzie t = 1, 2, ..., n.

Szereg będziemy zapisywać jako wektor (1 x n):
y = [y1, y2, ..., yn],
gdzie yt to stan zmiennej Y w momencie lub okresie t.

np. Ceny gruntu w kolejnych dniach, czy miesiącach;
zachmurzenie w Poznaniu w 2008 r. o godz. 21.
 y11
y
y   21
 ...

 yG1
y12
y22
...
y1n 
... y2 n 
... ... 

... yGn 
...
Wielowymiarowy szereg czasowy
yG 2


Jest utworzony przez szeregi czasowe zmiennych Y1, Y2, ..., YG
opisujących określony obiekt.
Szereg wielowymiarowy jest macierzą (G x n)
 y11
y
y   21
 ...

 y G1

y12
y 22
...
yG 2
y1n 
... y 2 n 
... ... 

... y Gn 
...
gdzie ygt to stan g-tej zmiennej w momencie lub okresie t
Np. długość linii kolejowych i dróg publicznych w kolejnych latach
Jednowymiarowy szereg
przekrojowy

Ciąg zaobserwowanych stanów zmiennej Y, z których
każdy odnosi się do tego samego momentu lub okresu t i
do k-tego obiektu przestrzennego:
y = [y1, y2, ..., yK],
gdzie yk – stan zmiennej Y w obiekcie k-tym w momencie
lub okresie t.

np. Liczba samochodów osobowych na 1000
mieszkańców w 1999 r.
Wielowymiarowy szereg
przekrojowy

Jest utworzony przez szeregi przekrojowe zmiennych Y1,
Y2, ..., YG rozpatrywane w jednym momencie lub okresie t.
 y11
y
y   21
 ...

 y G1

y12
y 22
...
yG 2
y1k 

... y 2 k 
... ... 

... y Gk 
...
gdzie ygk to stan g-tej zmiennej w k-tym obiekcie w
momencie lub okresie t
np. personel służby zdrowia w niektórych woj. wg stanu na
31.12.2007 na 10 tys. ludności.
Szereg przekrojowo – czasowy
Utworzony przez szeregi czasowe G zmiennych
opisujących K obiektów. Macierz informacji można
zapisać w skrócie jako macierz blokową, przy czym
każdy blok zawiera wielowymiarowy szereg czasowy
charakteryzującej k-ty obiekt.
np. Liczba samochodów i telefonów w Polsce i Francji na
1000 mieszkańców w latach 1995-2000.

W praktyce w prognozowaniu najczęściej wykorzystuje
się jedno i wielowymiarowe szeregi czasowe i szeregi
przekrojowo-czasowe.
Download