Analiza harmoniczna
Harmoniczna analiza danych ma zgodnie z założeniem prowadzić do utworzenia modelu składającego się z sumy (harmonijek) funkcji kosinusoidalnych lub też sinusoidalnych w określonym przedziale czasowym.
W przypadku występowania tendencji rozwojowej, parametr zostaje zastąpiony funkcją trendu f(t). Zastosowanie klasycznej metody najmniejszych kwadratów sprowadza się do użycia następujących wzorów:
dla ostatniej harmoniki , natomiast szacuje się ze wzoru:
Wielkość amplitud wyznacza się ze wzoru:
W celu ich zlokalizowania na osi czasu wyznacza się wartość przesunięcia czasowego
, gdzie ,
W modelu nie trzeba ujmować wszystkich harmonik, wystarczą te, które istotne. W celu stwierdzenia istotności danej harmoniki należy zastosować test Schustera. Nadzieja matematyczna kwadratu amplitudy wynosi:
gdzie: jest wariancją zmiennej Y, natomiast n jest liczba obserwacji.
Parametr zastępuje się zwykle wariancją z próby.
Schuster udowodnił, że prawdopodobieństwo tego, że będzie k razy większe od jest równe:
Przyjmując, że:
Jeśli zajdzie:
to hipotezę Ho głoszącą, że dana amplituda jest statystycznie nieistotna możemy odrzucić na poziomie istotności i przyjąć, że dana harmonika powinna wejść do modelu.
opracowane na podstawie: M. Cieślak „Prognozowanie gospodarcze – metody i zastosowania” , PWN Warszawa 1997.
Mirosław Wójciak skrypt: Zbiór zadań z ekonometrii (w przygotowaniu).
- - -
PRZYKŁAD - prognozowanie sprzedaży usługi teleinformatycznej
Celem niniejszego opracowania jest stworzenie prognozy sprzedaży pewnej usługi proponowanej przez operatora telekomunikacyjnego X na 12 kolejnych miesięcy dysponując obserwacjami miesięcznymi sprzedaży z okresu styczeń 2004 do październik 2005, co daje w sumie 22 obserwacje. Dane, na podstawie których modelowano to zagadnienie to szeregi czasowe czterech obszarów telekomunikacyjnych, które dają w sumie sprzedaż usługi w jednym z regionów kraju. Na ten region składają się obszary oznaczone jako S, T, U oraz W. Wizualna analiza szeregów czasowych czterech regionów pozwoliła na sformułowanie hipotezy, iż każdy region cechuje się różnymi wahaniami o różnej amplitudzie. W związku z tym przeprowadzono analizę cykliczności dla każdego obszaru osobno, sporządzono indywidualne prognozy a następnie zsumowano wyniki otrzymując prognozę dla całego regionu. W kolejnym kroku analizy wyeliminowano ewentualne wahania spowodowane różnicami w ilości dni w poszczególnych miesiącach. Sprowadzono wszystkie miesiące do wykładnika 31 dni. Przeliczenia wykonano wg formuły:
Gdzie: - liczba dni miesiąca t; - sprzedaż usługi w miesiącu t w sztukach; Na podstawie posiadanych danych wykonano model metoda wielomianów trygonometrycznych dla okręgu „S”. Wyznaczone wartości poszczególnych parametrów harmonik zamieszczono w tabeli 1 Tabela 1. Parametry modelu dla obszaru S oraz amplitudy harmonik
i |
Długość cyklu |
ai |
bi |
Amplitudy Ai |
% wyjaśniania |
Wartość sprawdzianu k* |
---|---|---|---|---|---|---|
1 |
22 |
520,80 |
-92,68 |
528,98 |
21,14% |
2,33 |
2 |
11 |
-902,92 |
-127,26 |
911,84 |
62,81% |
6,91 |
3 |
7,3 |
-202,56 |
109,80 |
230,40 |
4,01% |
0,44 |
4 |
5,5 |
-21,89 |
225,28 |
226,34 |
3,87% |
0,43 |
5 |
4,4 |
155,06 |
-30,72 |
158,08 |
1,89% |
2,11 |
6 |
3,7 |
-109,58 |
134,11 |
173,18 |
2,27% |
0,25 |
7 |
3,1 |
-23,11 |
-134,01 |
135,99 |
1,40% |
0,15 |
8 |
2,8 |
-29,04 |
2,10 |
29,11 |
0,06% |
0,01 |
9 |
2,4 |
60,00 |
-101,18 |
117,63 |
1,05% |
0,11 |
10 |
2,2 |
10,28 |
137,55 |
137,93 |
1,44% |
0,16 |
11 |
2 |
0 |
21,59 |
21,59 |
0,04% |
0,00 |
Kierując się kryterium najwyższego wyjaśniania wariancji do modelu wybrać należy tą harmonikę, która ma najwyższy procent wyjaśniania, czyli harmonikę i=2 oraz harmonikę i=1. Analizując wyniki testu Schustera i przyjmując poziom istotności alfa = 0,05 (czyli k=3), hipotezę głoszącą, iż dana amplituda jest przypadkowa, odrzucić należy tylko w przypadku harmoniki o długości cyklu równym 11 (k*=6,6). Model przyjmuje postać:
Wartości teoretyczne i prognozy oszacowane na podstawie powyższego modelu po wprowadzeniu korekty ze względu na liczbę dni miesiąca przedstawiono graficznie na wykresie 1.
Wykres 1. Prognozy sprzedaży usługi w okręgu „S” sporządzone na podstawie modelu uwzględniającego harmonikę i=2.
Kolejnym obszarem regionu północnego jest obszar T. oszacowany model dla tego obszaru zaprezentowano w tabeli 2. Tabela 2. Parametry modelu dla obszaru „T”
i |
Długość cyklu |
ai |
bi |
Amplitudy Ai |
% wyjaśniania |
Wartość sprawdzianu k* |
---|---|---|---|---|---|---|
1 |
22 |
411,53 |
-149,68 |
437,90 |
14,75% |
1,62 |
2 |
11 |
-769,65 |
-318,62 |
832,99 |
53,38% |
5,87 |
3 |
7,3 |
-477,84 |
128,52 |
494,82 |
18,84% |
2,07 |
4 |
5,5 |
-123,21 |
96,61 |
156,57 |
1,89% |
0,21 |
5 |
4,4 |
-58,48 |
-25,16 |
63,66 |
0,31% |
0,03 |
6 |
3,7 |
17,67 |
74,98 |
77,03 |
0,46% |
0,05 |
7 |
3,1 |
-98,56 |
-118,88 |
154,42 |
1,83% |
0,20 |
8 |
2,8 |
86,97 |
-35,24 |
93,84 |
0,68% |
0,07 |
9 |
2,4 |
79,71 |
-293,07 |
303,72 |
7,10% |
0,78 |
10 |
2,2 |
-11,86 |
37,88 |
39,69 |
0,12% |
0,01 |
11 |
2 |
0,00 |
-64,92 |
64,92 |
0,32% |
0,04 |
Kierując się kryterium najwyższego procentu wyjaśniania należy wybrać do modelu harmonikę 2, która wyjaśnia 53% zmienności. Ponadto należy uwzględnić także harmonikę 3 wyjaśniającą 18% zmienności sprzedaży. Te dwie harmoniki tłumaczą w sumie 69% wariancji. Jednakże zgodnie z przyjętym w pracy kryterium testu Schustera do modelu wprowadzono tylko harmonikę i=2. Model ma postać:
Wartości teoretyczne i prognozy oszacowane na podstawie powyższego modelu po wprowadzeniu korekty ze względu na liczbę dni miesiąca przedstawiono graficznie na wykresie 2.
Wykres 2. Prognozy sprzedaży usługi w okręgu „T” sporządzone na podstawie modelu uwzględniającego harmonikę i=2.
Wyznaczone parametry modelu dla obszaru „U” zawarto w tabeli 3. Tabela 3. Parametry modelu dla obszaru „U”
i |
Długość cyklu |
ai |
bi |
Amplitudy Ai |
% wyjaśniania |
Wartość sprawdzianu k* |
---|---|---|---|---|---|---|
1 |
22 |
223,17 |
20,16 |
224,08 |
16,79% |
1,85 |
2 |
11 |
-374,15 |
-110,33 |
390,08 |
50,87% |
5,60 |
3 |
7,3 |
-81,71 |
0,14 |
81,71 |
2,23% |
0,25 |
4 |
5,5 |
-64,03 |
79,47 |
102,06 |
3,48% |
0,38 |
5 |
4,4 |
-40,10 |
92,58 |
100,89 |
3,40% |
0,37 |
6 |
3,7 |
-14,57 |
103,68 |
104,70 |
3,66% |
0,40 |
7 |
3,1 |
-88,02 |
-81,57 |
120,00 |
4,81% |
0,53 |
8 |
2,8 |
-98,86 |
-3,31 |
98,92 |
3,27% |
0,36 |
9 |
2,4 |
67,17 |
-105,97 |
125,46 |
5,26% |
0,58 |
10 |
2,2 |
-51,40 |
-68,88 |
85,95 |
2,47% |
0,27 |
11 |
2 |
0,00 |
-74,80 |
74,80 |
1,87% |
0,21 |
Największy udział w wyjaśnianiu wariacji ma harmonika i=2 o cyklu 11 miesięcznym. Wyjaśnia ona 51% wahań. Pozostałe harmoniki z uwagi na mały poziom wyjaśniania należy uznać za nieistotne. Model wraz z uwzględnioną funkcją trendu ma postać:
Dopasowanie tego modelu do danych empirycznych (po uwzględnieniu korekty liczby dni w miesiącu) przedstawia wykres 3.
Wykres 3. Prognozy sprzedaży usługi w okręgu „U” sporządzone na podstawie modelu uwzględniającego harmonikę i=2.
Wyniki dla czwartego analizowanego obszaru przedstawiono w tabeli 4. Tabela 4. Parametry modelu dla obszaru „W”
i |
Długość cyklu |
ai |
bi |
Amplitudy Ai |
% wyjaśniania |
Wartość sprawdzianu k* |
---|---|---|---|---|---|---|
1 |
22 |
201,47 |
-74,08 |
214,66 |
9,13% |
1,00 |
2 |
11 |
-481,01 |
320,39 |
577,94 |
66,18% |
7,28 |
3 |
7,3 |
32,76 |
60,65 |
68,93 |
0,94% |
0,10 |
4 |
5,5 |
106,98 |
104,09 |
149,26 |
4,41% |
0,49 |
5 |
4,4 |
64,57 |
-72,52 |
97,10 |
1,87% |
0,21 |
6 |
3,7 |
63,76 |
-142,61 |
156,21 |
4,84% |
0,53 |
7 |
3,1 |
-42,20 |
-26,32 |
49,74 |
0,49% |
0,05 |
8 |
2,8 |
208,66 |
-25,80 |
210,25 |
8,76% |
0,96 |
9 |
2,4 |
-88,02 |
85,03 |
122,38 |
2,97% |
0,33 |
10 |
2,2 |
5,16 |
-31,79 |
32,21 |
0,21% |
0,02 |
11 |
2 |
0,00 |
-22,94 |
22,94 |
0,10% |
0,01 |
Kierując się kryterium zaproponowanym przez Schustera istotna jest tylko harmonika i=2, dla której k*=6,95. Pozostałe harmoniki na poziomie istotności 0,05 można uznać za nieistotne. Kierując się kryterium wyjaśniania wariancji należy zwrócić uwagę na harmonikę i=8 o długości cyklu 2,8 miesiąca (w przybliżeniu można uznać ten cykl za kwartalny). Wyróżnia się ona znacznie spośród pozostałych i wyjaśnia 8,4% zmienności. Model wraz z trendem ma postać:
Wartości teoretyczne tak sformułowanego modelu kształtują się następująco.
Wykres 4. Prognozy sprzedaży usługi w okręgu „W” sporządzone na podstawie modelu uwzględniającego harmonikę i=2.
Dysponując prognozami poszczególnych obszarów sformułowano prognozę sprzedaży dla całego regionu będącą sumą prognoz cząstkowych. Taką prognozę przedstawiono w poniższej tabeli.
Wykres 5. Prognozy sprzedaży usługi dla całego obszaru (prognoza na okres listopad 2005 – listopad 2006)
Zgodnie z wynikami zaprezentowanymi na wykresach należy zauważyć, iż zjawisko sprzedaży usługi telekomunikacyjnej cechuje się sezonowością. Sezonowość tą opisano za pomocą metody wielomianów trygonometrycznych, stosując do identyfikacji istotnych cykli test Schustera. Zgodnie z prognozami należy zauważyć, iż sprzedaż osiąga wartości wysokie w miesiącach letnich (lipiec, sierpień) natomiast w miesiącach zimowych sprzedaż jest na zdecydowanie niższym poziomie