Korekta cen nieruchomoĞci... INFRASTRUKTURA I EKOLOGIA TERENÓW WIEJSKICH INFRASTRUCTURE AND ECOLOGY OF RURAL AREAS Nr 4/2011, POLSKA AKADEMIA NAUK, Oddziaá w Krakowie, s. 213–226 Komisja Technicznej Infrastruktury Wsi Mariusz Frukacz, Mirosáaw Popieluch, Edward Preweda KOREKTA CEN NIERUCHOMOĝCI ZE WZGLĉDU NA UPàYW CZASU W PRZYPADKU DUĩYCH BAZ DANYCH ____________ REAL ESTATE PRICE ADJUSTMENT DUE TO TIME IN THE CASE OF LARGE DATABASES Streszczenie Na etapie analizy rynku poprzedzającym zastosowanie odpowiedniej procedury okreĞlania wartoĞci nieruchomoĞci waĪnym elementem jest okreĞlenie zmiennoĞci cen nieruchomoĞci w czasie, a w przypadku, gdy wpáyw przesuniĊcia transakcji w czasie jest istotny dla zmiennoĞci cen, naleĪy dokonaü korekty cen transakcyjnych w zgromadzonej bazie nieruchomoĞci. Istotne znaczenie tego etapu procedury wyceny potwierdzają wydarzenia ostatnich lat na polskim rynku nieruchomoĞci. O ile jeszcze 5-10 lat temu ceny nieruchomoĞci w sposób przewidywalny i regularny ksztaátowaáy siĊ zgodnie z niewielką tendencją rosnącą, to począwszy od 2003 roku rynek nieruchomoĞci w Polsce wszedá w okres tzw. boomu i dla cen rynkowych zaobserwowano bardzo duĪe wzrosty cen. RóĪnice pomiĊdzy jednostkowymi cenami rynkowymi za nieruchomoĞci podobne mogáy siĊ róĪniü o kilka czy kilkanaĞcie procent z miesiąca na miesiąc, a nieuwzglĊdnienie tych zmian w czasie podczas wyceny mogáo doprowadziü do znacznego niedoszacowania wartoĞci nieruchomoĞci. Celem artykuáu jest okreĞlenie przydatnoĞci modeli statystycznych do wykrycia i okreĞlania zmian cen w zgromadzonej bazie nieruchomoĞci oraz ich zastosowanie do skorygowania cen ze wzglĊdu na przesuniĊcie transakcji w czasie. Sáowa kluczowe: rynek nieruchomoĞci, wartoĞü nieruchomoĞci, modele statystyczne 213 Mariusz Frukacz, Mirosáaw Popieluch, Edward Preweda Summary At the stage of market analysis prior to application of appropriate procedures for determining a value of the property an important element is to determinate a variability of immobility prices over a time, and if the impact of the transaction at the time of transfer is important for volatility, it should be adjust transaction prices based on accumulated property. It is important to confirm for the stage of the valuation of the recent years events at the Polish real estate market. While still 5-10 years ago, in a predictable and regular way property prices shaped in accordance with a trend of small growing, then starting from 2003 the property market in Poland has entered the period known as boom and the market prices observed a very large price increases. Differences between current market prices for similar properties can vary by a few or several percent from month to month, and the disregard of these changes over time during the measurement could lead to a significant underestimation of the real estate value. Article aims determine the suitability of statistical models to detect and determine the price changes in the accumulated database real estate and their application to adjust prices due to the shift of the transaction in time. Key words: the property market, value of immobility, statistical models WSTĉP W najbardziej popularnej i powszechnie stosowanej w wycenie nieruchomoĞci metodzie porównywania parami wedáug podejĞcia porównawczego, do okreĞlenia wartoĞci nieruchomoĞci wystarczy odnieĞü siĊ do dosáownie kilku (co najmniej trzech) nieruchomoĞci podobnych. W takim przypadku okreĞlenie wpáywu czasu na zmiennoĞü cen jest zadaniem stosunkowo prostym, gdyĪ dotyczy tylko kilku obserwacji. Najprostszą metodą jest zastosowanie sposobu interwaáowego. Metoda ta opiera siĊ na technice porównywania pomiĊdzy sobą par nieruchomoĞci, które mają dokáadnie takie same atrybuty, przy pomocy których zostaáy opisane (nie dotyczy to atrybutów iloĞciowych typu: powierzchnia uĪytkowa, czy powierzchnia dziaáki) i róĪnicuje je jedynie wartoĞü jednostkowa i czas zawarcia transakcji. Dla kaĪdej z par okreĞla siĊ wspóáczynnik zmiany ceny ( Bn ) przypadającej na jednostkĊ czasu: B n = Bi − j = C j − Ci t j −ti gdzie: Bi − j – to wspóáczynnik zmiany cen, okreĞlony dla pary nieruchomoĞci j,i C j , Ci 214 róĪniących siĊ transakcyjną ceną jednostkową i czasem zawarcia transakcji, – to transakcyjne ceny jednostkowe nieruchomoĞci j,i, Korekta cen nieruchomoĞci... t j , ti – to czas zawarcia transakcji dla nieruchomoĞci j,i wyraĪony w od- powiednich jednostkach czasu (np. dzieĔ, tydzieĔ, miesiąc) okreĞlony jako wartoĞü wzglĊdna w stosunku do daty wyceny. W oparciu o n wspóáczynników, okreĞlonych dla n-par nieruchomoĞci wyliczana jest wartoĞü Ğrednia wspóáczynnika zmiany cen: BĞredni = ¦ Bn n n gdzie: BĞredni – to Ğredni wspóáczynnik zmian okreĞlony w oparciu o n-par nieruchomoĞci podobnych. W ten sposób obliczana Ğrednia wartoĞü wspóáczynnika BĞredni okreĞla przeciĊtną wartoĞü zmiany cen przypadającą na daną jednostkĊ czasu. Opierając siĊ na tej wielkoĞci i korzystając z posiadanej wiedzy i doĞwiadczenia, rzeczoznawca podejmuje decyzjĊ, czy dokonaü korekt cen transakcyjnych nieruchomoĞci w zgromadzonej bazie ze wzglĊdu na przesuniĊcie daty wyceny wzglĊdem dat transakcji. Cena skorygowana obliczana jest wedáug wzoru: C i _ skorygowana = C i + BĞredni ⋅ (t wyceny − t i ) gdzie: C i _ skorygowana – skorygowana cena transakcyjna nieruchomoĞci ze wzglĊdu na przesuniĊcie daty transakcji wzglĊdem daty wyceny, – cena transakcyjna i-tej nieruchomoĞci, Ci t wyceny – data wyceny, ti – data transakcji dla i-tej nieruchomoĞci. Takie podejĞcie do okreĞlania wpáywu czasu na ksztaátowanie siĊ cen transakcyjnych i korekty tych cen jest poprawne i powszechnie stosowane przez rzeczoznawców majątkowych. Jego zaletą jest przejrzystoĞü, áatwoĞü obliczeĔ i moĪliwoĞü stosowania przy maáej licznoĞci bazy porównawczej. ZASTOSOWANIE MODELI STATYSTYCZNYCH DO OKREĝLENIA ZALEĩNOĝCI POMIĉDZY CENĄ A PRZESUNIĉCIEM TRANSAKCJI W CZASIE Proponowanym sposobem, pozwalającym na zbadanie i okreĞlenie wpáywu czasu na zmiennoĞü cen jest budowa modelu statystycznego. O ile w przypadku niewielkich baz danych, o licznoĞciach rzĊdu kilku obserwacji, moĪna siĊ zastanawiaü, czy budowaü modele statystyczne, czy stosowaü metodĊ interwa215 Mariusz Frukacz, Mirosáaw Popieluch, Edward Preweda áową, o tyle w przypadku duĪych zbiorów danych jest to praktycznie jedyna metoda na rzetelną ocenĊ interesującego nas zjawiska. Dokáadne poznanie, a wiĊc wykrycie, analiza i interpretacja wystĊpowania zjawiska ksztaátowania siĊ cen transakcyjnych (historycznych) wraz ze zmianą czasu pozwoli na poprawną ich korektĊ. PoniewaĪ dziaáania tego typu są pierwszym krokiem we wszelkich zadaniach prognostycznych [Ditmann 2003], dlatego do analizy ksztaátowania siĊ cen moĪemy zastosowaü metody iloĞciowe stosowane przy prognozowaniu. SpoĞród metod iloĞciowych najczĊĞciej stosowane do okreĞlania zaleĪnoĞci pomiĊdzy zachodzącymi zjawiskami są modele regresyjne. Regresja jest metodą pozwalająca na zbadanie związku pomiĊdzy róĪnymi wielkoĞciami wystĊpującymi w danych i wykorzystanie tej wiedzy do przewidywania nieznanych wartoĞci jednych wielkoĞci na podstawie znanych wartoĞci innych. Z punktu widzenia naszych potrzeb modele regresyjne bĊdą wykorzystane nie do prognozowania, lecz do wyznaczenia trendu, czyli zaleĪnoĞci pomiĊdzy datą transakcji a ceną, a nastĊpnie w oparciu o tĊ zaleĪnoĞü bĊdziemy mogli dokonaü korekty cen, biorąc pod uwagĊ róĪnice w czasie. Pod nazwą prosta regresja liniowa [ZieliĔski 1999] kryje siĊ liniowa funkcja regresji zaleĪna tylko od jednego argumentu. Powiedzmy, Īe obserwujemy cechĊ Y, która jest zaleĪna od zmiennej X, a liniowoĞü zaleĪnoĞci oznacza, Īe jednakowym przyrostom zmiennej niezaleĪnej odpowiadają jednakowe co do kierunku i siáy (rosnące lub malejące) zmiany zmiennej zaleĪnej Funkcja regresji, którą naleĪy oszacowaü w oparciu o dostĊpne dane, przyjmuje nastĊpującą postaü: y i = b0 + b1 x i + e i = yˆ i + ei gdzie: i = 1, 2,..., n – kolejne numery elementów obserwacji, ei – tzw. reszty (zmienna losowa) definiowane jako ei = y i − yˆ i . Wspóáczynniki krzywej regresji b0 i b1 wyznaczamy stosując metodĊ najmniejszych kwadratów (MNK), wówczas suma kwadratów reszt osiąga minimum. Z naszego punktu widzenia najbardziej interesujący jest wspóáczynnik kierunkowy krzywej regresji b1, gdyĪ odzwierciedla on trend, jaki wykazują ceny nieruchomoĞci w czasie i pozwala na dokonanie korekty cen transakcyjnych ze wzglĊdu na przesuniĊcie czasu transakcji. DokáadnoĞü dopasowania wyznaczonej linii regresji mierzymy za pomocą wspóáczynnika determinacji R 2 , który okreĞla stosunek zmiennoĞci wyjaĞnionej do zmiennoĞci caákowitej, czyli informuje w jakim stopniu nasz model opisuje rzeczywistoĞü, a ile zaleĪy od dodatkowych, nieuwzglĊdnionych w modelu zmiennych. Praktyka pokazuje, Īe nie wszystkie zaleĪnoĞci udaje siĊ odpowiednio opisaü przy pomocy modeli regresji liniowej. Warto zastanowiü siĊ nad konstru216 Korekta cen nieruchomoĞci... owaniem modeli regresji krzywoliniowej, która pozwala na dokáadne dopasowanie dowolnej krzywej. Poszukując takiej krzywej nie moĪemy jednak rozpatrywaü wszystkich moĪliwych krzywych, dlatego teĪ wybieramy jeden z nastĊpujących modeli regresji nieliniowej: − wykáadniczą (model Y = abX), − logarytmiczną (model Y = a +blnX), − hiperboliczną (model Y = a + b 1 X lub Y = aX X+b ), − potĊgową (model Y = a⋅Xb), − wielomianową (model Y = a0 + a1X + a2X2 +a3X3 +...+ anXn), − logistyczną (model Y = a0 1 + a1e − X ). Od strony obliczeniowej sytuacja jest podobna jak w przypadku modeli liniowych i nadal, zgodnie z MNK, poszukujemy najlepiej dopasowanej do danych krzywej, z tą róĪnicą, Īe nie jest to prosta. JakoĞü otrzymanego modelu i jego dopasowania okreĞlana jest przez wspóáczynnik determinacji R2 wyznaczający czĊĞü wariancji wyjaĞnionej przez model, liczony jako stosunek wyjaĞnionej przez model sumy kwadratów odchyleĔ do caákowitej sumy kwadratów odchyleĔ. − RSK R 2 = CSKCSK gdzie: R2 – to wspóáczynnik determinacji dla modelu nieliniowego, CSK – caákowita suma kwadratów odchyleĔ, RSK – resztowa suma kwadratów. Przedmiotem odrĊbnej publikacji bĊdą rozwaĪania oparte na zastosowaniu algorytmu MARS. ANALIZA BAZY DANYCH WYBRANYMI MODELAMI STATYSTYCZNYMI OkreĞlmy, czy i jaka zaleĪnoĞü istnieje pomiĊdzy czasem, który upáynąá od momentu transakcji, a jednostkową ceną transakcyjną. Dla zebranej bazy danych (zawierającej informacje o 757 transakcjach na rynku lokali mieszkalnych w Krakowie, na przestrzeni czasu od marca 2004 do paĨdziernika 2007) zbudujemy modele regresji: − model liniowy, − model nieliniowy – wielomianowy drugiego stopnia, − model nieliniowy – wielomianowy trzeciego stopnia. 217 Mariusz Frukacz, Mirosáaw Popieluch, Edward Preweda PamiĊtajmy, Īe wybierając postaü funkcji regresji, naleĪy opieraü siĊ na wstĊpnej analizie danych, wykresach rozrzutu, a takĪe na Ĩródáach pozastatystycznych dotyczących badanej dziedziny. BAZA DANYCH TRANSAKCYJNYCH Baza danych zawiera informacje pochodzące z aktów notarialnych. Dla kaĪdej transakcji mamy nastĊpujące informacje: data zawarcia transakcji, informacje administracyjne dot. lokalizacji nieruchomoĞci (dzielnica, obrĊb, ulica i numer), liczba pokoi, powierzchnia uĪytkowa lokalu, cena transakcyjna. Dla wybranych transakcji dostĊpne są dodatkowe informacje m.in.:rok budowy, stan techniczny, powierzchnia przynaleĪna. Dane zgromadzono w arkuszu STATISTICA i kaĪdy wiersz odpowiada jednej transakcji. PoniĪej umieszczono fragment arkusza: Rysunek 1. Arkusz STATISTICA zawierający dane transakcyjne. Figure 1. STATISTICA sheet containing transaction data. W oparciu o ww. informacje utworzono zmienne, które bĊdą wykorzystywane przy budowie modeli: − liczba dni od ostatniej transakcji – okreĞla ona jaka jest róĪnica w czasie (wyraĪona w dniach) pomiĊdzy ostatnią a daną transakcją, − cena 1 metra kwadratowego powierzchni uĪytkowej. 218 Korekta cen nieruchomoĞci... BUDOWA MODELI STATYSTYCZNYCH Zmienną zaleĪną w naszych rozwaĪaniach jest cena 1 metra kwadratowego powierzchni uĪytkowej, natomiast zmienną, która ma lub moĪe mieü na nią wpáyw, czyli zmienną niezaleĪną jest liczba dni od ostatniej transakcji. Do budowy modeli regresyjnych zastosowano oprogramowanie STATISTICA 8 PL, które pozwala na zdefiniowanej wáasnej, dowolnej funkcji regresji i estymuje jej parametry metodą najmniejszych kwadratów. Przyjrzyjmy siĊ dwóm zmiennym i okreĞlmy czy wystĊpuje pomiĊdzy nimi jakakolwiek zaleĪnoĞü. Taką wstĊpną oceną, która równieĪ potwierdzi nam wybór odpowiednich modeli nieliniowych, jest analiza wykresu rozrzutu zmiennych oraz okreĞlenie wystĊpowania pomiĊdzy nimi korelacji. Wykres rozrzutu Cena 1 mkw pu wzglĊdem L-ba dni od ostatniej transakcji 12000 10000 Cena 1 mkw pu 8000 6000 4000 2000 0 0 200 400 600 800 1000 1200 1400 L-ba dni od ostatniej transakcji Rysunek 2. Wykres rozrzutu analizowanych zmiennych. Figure 2. Scatter diagram of the analyzed variables. JuĪ sama analiza graficzna rozrzutu punktów (Rysunek 2) potwierdza wystĊpowanie zaleĪnoĞci pomiĊdzy zmiennymi, a im mniejsza liczba dni od ostatniej transakcji, tym wyĪsze wartoĞci ceny 1 mkw pu. SpostrzeĪenie to potwierdza obliczony wspóáczynnik korelacji Pearsona, którego wartoĞü wynosi r=-0,54995 (i jest istotny statystyczne na poziomie ufnoĞci 95%), okreĞlając 219 Mariusz Frukacz, Mirosáaw Popieluch, Edward Preweda spadek wartoĞci ceny 1 mkw pu wraz ze wzrostem wartoĞci zmiennej l-ba dni od ostatniej transakcji. Dodatkowo moĪna teĪ zauwaĪyü, Īe siáa wykrytej zaleĪnoĞü ulega zmianie. Punkt „przeáamania” przypada w okolicach wartoĞci 600-700 zmiennej l-ba dni od ostatniej obserwacji i na lewo od niego widaü, Īe zaleĪnoĞü ta przybiera na sile w stosunku do znajdującej siĊ po prawej, sáabszej zaleĪnoĞci. Na podstawie informacji o wystĊpującej zaleĪnoĞci i mając jej ogólny pogląd, moĪemy przystąpiü do budowy wczeĞniej wybranych modeli regresyjnych. MODEL LINIOWY W pierwszej kolejnoĞci budujemy model regresji liniowej. Funkcja, której parametry (a i b) chcemy oszacowaü zostaáa zapisana jako: [cena 1 mkw pu] = a + b * [liczba dni od ostatniej transakcji]. Otrzymano nastĊpujące wartoĞci estymowanych parametrów modelu (kolor czerwony oznacza, Īe wynik jest statystycznie istotny na poziomie alfa=0,05): Tabela 1. Okno STATISTICA z wynikami budowy zdefiniowanego modelu regresyjnego – liniowego Table 1. STATISTICA window with the results of the regression model defined structure - linear. Model: v35=a+b*v52 Zmn. zal. : Cena 1 mkw pu Poziom ufnoĞci: 95.0% ( alfa=0.050) Ocena Báąd poziom p Doln. uf stand. Granica a 6513,775 -3,408 b Górn. uf Granica 131,7444 0,00 6255,147 6772,404 0,1882 0,00 -3,778 -3,039 Funkcja regresji, którą na wykresie poniĪej zobrazowana jest czerwoną linią, przyjmuje postaü: [cena 1 mkw pu] = 6513,775 –3,408 * [liczba dni od ostatniej transakcji], wspóáczynnik determinacji modelu wynosi R2=0,3024. 220 Korekta cen nieruchomoĞci... Model: [cena 1 mkw pu]=a+b*[l-ba dni ...] y=(6513,78)+(-3,408)*x 12000 10000 Cena 1 mkw pu 8000 6000 4000 2000 0 -200 0 200 400 600 800 1000 1200 1400 L-ba dni od ostatniej transakcji Rysunek 3. Dopasowana do danych linia regresji Figure 3. Fitted to the data the regression line Model nieliniowy – wielomian drugiego stopnia Funkcja, której parametry (a, b, c) bĊdziemy szacowaü, przyjmuje nastĊpującą postaü: [cena 1 mkw pu] = a * [liczba dni od ostatniej transakcji]2 + b * [liczba dni od ostatniej transakcji] + c. Przy wspóáczynniku determinacji R2=0,3477 otrzymano nastĊpujące wyniki: Tabela 2. Okno STATISTICA z wynikami budowy modelu nieliniowego, wielomianowego II stopnia. Table 2. STATISTICA window with the results of nonlinear model building, second degree polynomial Model: v35=a*v52^2+b*v52+c Zmn. zal. : Cena 1 mkw pu Poziom ufnoĞci: 95.0% ( alfa=0.050) Ocena Báąd poziom p Doln. uf stand. Granica a b c 0,005 0,0006 0,000000 0,003 Górn. uf Granica 0,006 -9,452 0,8547 0,000000 -11,130 -7,774 8179,580 263,1170 0,000000 7663,052 8696,108 221 Mariusz Frukacz, Mirosáaw Popieluch, Edward Preweda Model: v35=a*v52^2+b*v52+c y=(,004582)*x^2+(-9,4516)*x+(8179,58) 12000 10000 Cena 1 mkw pu 8000 6000 4000 2000 0 -200 0 200 400 600 800 1000 1200 1400 L-ba dni od ostatniej transakcji Rysunek 4. Dopasowana do danych krzywa regresji II stopnia Figure 4.The regression curve of second degree fitted to the data Model nieliniowy – wielomian trzeciego stopnia Funkcja, której parametry (a,b,c,d) chcemy oszacowaü, przyjmuje postaü: [cena 1 mkw pu] = a * [liczba dni od ostatniej transakcji]3 + b * [liczba dni od ostatniej transakcji]2 + c * [liczba dni od ostatniej transakcji] + d. Przy wspóáczynniku determinacji R2=0,3485 otrzymano nastĊpujące wyniki: Tabela 3. Okno STATISTICA z wynikami budowy modelu nieliniowego, wielomianowego III stopnia. Table 3. STATISTICA window with the results of nonlinear model building, third-degree polynomial Model: v35=a*v52^3+b*v52^2+c*v52+d Zmn. zal. : Cena 1 mkw pu Ocena Báąd poziom p Doln. uf stand. Granica a b c d 222 Górn. uf Granica -0,000 0,0000 0,00 -0,000 0,008 0,0038 0,00 0,001 -0,000 0,016 -11,582 2,3279 0,00 -16,152 -7,012 8525,409 439,1384 0,00 7663,330 9387,488 Korekta cen nieruchomoĞci... Model: v35=a*v52^3+b*v52^2+c*v52+d y=(-,18e-5)*x^3+(,008235)*x^2+(-11,582)*x+(8525,41) 12000 10000 Cena 1 mkw pu 8000 6000 4000 2000 0 -200 0 200 400 600 800 1000 1200 1400 L-ba dni od ostatniej transakcji Rysunek 5. Dopasowana do danych krzywą regresji III stopnia Figure 5. Fitted to the data third-degree regression curve Porównajmy zatem dobroü dopasowania naszych modeli. Tabela 4. Porównanie wyników wybranych modeli Table 4. Comparison of results of selected models Rodzaj modelu WartoĞü wspóáczynnika determinacji R2 Dopasowanie krzywej regresji do danych 12000 10000 Model liniowy 0,3024 Cena 1 mkw pu 8000 6000 4000 2000 0 -200 0 200 400 600 800 1000 1200 1400 L-ba dni od ostatniej transakcji 223 Mariusz Frukacz, Mirosáaw Popieluch, Edward Preweda Rodzaj modelu WartoĞü wspóáczynnika determinacji R2 Dopasowanie krzywej regresji do danych 12000 10000 Model nieliniowy – II stopnia 0,3477 Cena 1 mkw pu 8000 6000 4000 2000 0 -200 0 200 400 600 800 1000 1200 1400 1000 1200 1400 1000 1200 1400 L-ba dni od ostatniej transakcji 12000 10000 Model nieliniowy – III stopnia 0,3485 Cena 1 mkw pu 8000 6000 4000 2000 0 -200 0 200 400 600 800 L-ba dni od ostatniej transakcji 12000 10000 Model záoĪony z dwóch liniowych 0,3545 Cena 1 mkw pu 8000 6000 4000 2000 0 -200 0 200 400 600 800 L-ba dni od ostatniej transakcji Jak widaü, wraz z coraz wiĊkszym skomplikowaniem modelu, począwszy od liniowego, poprzez wielomian II i III stopnia, jakoĞü modelu jest coraz lepsza i okreĞla on coraz wiĊkszą czĊĞü zmiennoĞci badanej wielkoĞci. Z drugiej jednak strony, jeĞli skutecznoĞü modeli jest porównywalna powinniĞmy wybraü ten, który jest najprostszy w interpretacji, czyli model liniowy. W tym miejscu musimy zatrzymaü dalsze wnioskowanie i zwróciü uwagĊ na niezwykle waĪny element. RozwaĪając, który model jest lepiej dopasowany i który moglibyĞmy wykorzystaü do korekty cen nieruchomoĞci ze wzglĊdu na przesuniĊcie czasu transakcji, nie moĪemy przeoczyü faktu bezwzglĊdnej jakoĞci otrzymanych mo224 Korekta cen nieruchomoĞci... deli. Wspóáczynnik determinacji R2 okreĞlający jakoĞü otrzymanych modeli i ich dopasowanie waha siĊ w przedziale [0,3024 ; 0,3545], czyli zbudowane modele wyjaĞniają zaledwie 30-35% zmiennoĞci badanej cechy. Dlaczego tak maáo? OtóĪ przypomnijmy, Īe nasza baza zawiera informacje o transakcjach dotyczących znaczenie róĪniących siĊ od siebie nieruchomoĞci: jedno i 4-pokojowe, maáe i duĪe powierzchnie, lokale w centrum oraz na obrzeĪach miasta. OczywiĞcie kaĪdy z tych czynników wpáywa na cenĊ i dlatego przy tak róĪnorodnej bazie upáyw czasu nie ma dominującego znaczenia. Co zatem powinniĞmy zrobiü? Przeprowadziü dalsze badania i przedstawiü wnioski z nich wynikające, w szczególnoĞci dotyczące budowania modeli dla Ğrednich cen miesiĊcznych. PODSUMOWANIE Bazy danych zawierające informacje o transakcjach na rynku nieruchomoĞci są równie specyficzne jak sam rynek. Bardzo czĊsto, aby zawieraáy rzetelną informacjĊ, muszą uwzglĊdniaü transakcje z dáugiego okresu czasu, a parametrem, który jest najbardziej na to czuáy, jest cena jednostkowa nieruchomoĞci. Dlatego przed przystąpieniem do analizy materiaáu zgromadzonego w takiej bazie musimy oceniü, czy upáyw czasu rzeczywiĞcie miaá wpáyw na ceny jednostkowe, a jeĞli miaá, to musimy przeprowadziü korektĊ cen jednostkowych ze wzglĊdu na upáyw czasu. Metod takiej korekty jest kilka, jednak jeĞli bierzemy pod uwagĊ pracĊ z duĪymi zbiorami danych, wówczas najbardziej efektywną i rzetelną metodą jest wykorzystanie modeli statystycznych. DziĊki zastosowaniu nowoczesnego oprogramowania do statycznej analizy danych jesteĞmy w stanie zbudowaü dobry model, który bĊdzie wrĊcz idealnie dopasowany do naszych danych, jednak jego skomplikowanie spowoduje, Īe bĊdzie on kompletnie bezuĪyteczny w praktyce, gdyĪ nie bĊdziemy w stanie ani go zinterpretowaü ani zastosowaü. Dlatego podczas budowy takich modeli naleĪy rozpatrywaü najprostsze (najlepiej liniowe), gdyĪ w praktyce okazują siĊ one bardzo skuteczne do okreĞlania trendu cen nieruchomoĞci a równoczeĞnie moĪna je wykorzystaü do korygowania tych cen. BIBLIOGRAFIA Ditmann P. Prognozowanie w przedsiĊbiorstwie. Metody i ich zastosowanie, Oficyna Ekonomiczna 2003. Dokumentacja do oprogramowania STATISTICA Data Miner, StatSoft Inc. Gatnar H. Nieparametryczna metoda dyskryminacji i regresji. Wydawnictwo Naukowe PWN 2001. Francuz P., Mackiewicz R. Liczby nie wiedzą, skąd pochodzą. Przewodnik po metodologii i statystyce nie tylko dla psychologów. Wydawnictwo KUL 2005. 225 Mariusz Frukacz, Mirosáaw Popieluch, Edward Preweda Stanisz A. PrzystĊpny kurs statystyki z zastosowaniem STATISTICA PL na przykáadach z medycyny, Tom 1 Statystyki podstawowe. StatSoft Polska 2006. Stanisz A. PrzystĊpny kurs statystyki z zastosowaniem STATISTICA PL na przykáadach z medycyny, Tom 2 Modele liniowe i nieliniowe. StatSoft Polska 2007. ZieliĔski T. Jak pokochaü statystykĊ czyli STATISTICA do poduszki. Kraków 1999 Artykuá powstaá w ramach badaĔ statutowych Katedry Geomatyki. Dr inĪ. Mariusz Frukacz Dr hab. inĪ. Edward Preweda, prof. AGH Akademia Górniczo-Hutnicza im. St. Staszica w Krakowie Wydziaá Geodezji Górniczej i InĪynierii ĝrodowiska Katedra Geomatyki 30-059 Kraków, Al. A. Mickiewicza 30, paw. C-4, pokój 415 e-mail: [email protected] [email protected] Mgr inĪ. Mirosáaw Popieluch StatSoft Polska ul. Kraszewskiego 36, 30-110 Kraków e-mail: [email protected] Recenzent: Prof. dr hab. inĪ. Karol Noga