Test równości wielu wskaźników struktury
Testowanie równości wielu wskaźników struktury sprowadza się do wykorzystania testu niezależności , w którym za pierwszą zmienną przyjmujemy zmienną binarną (1-element wyróżniony, 2-element niewyróżniony), a za drugą zmienną numer populacji, z której pobrano próbę. Stwierdzenie zależności pomiędzy tymi cechami jest równoważne ze stwierdzeniem występowania istotnych różnic w strukturach procentowych wyróżnionych elementów w badanych zbiorowościach (przynajmniej dwóch).
Przykład – wiek matki a umieralność noworodków
Tabela przedstawia zestawienie danych liczbowych dla Polski z 2010 roku dotyczące liczby urodzeń martwych w zależności od wieku matki. Dane pochodzą z publikacji Instytutu Matki i Dziecka: http://www.imid.med.pl/klient1/uploads/media/raport_uo_2011.pdf
Wiek matki | Urodzenia ogółem | Urodzenia martwe | ||
---|---|---|---|---|
liczba | odsetek | |||
15-19 | 18491 | 96 | 0,52% | |
20-24 | 80137 | 303 | 0,38% | |
25-29 | 153226 | 515 | 0,34% | |
30-34 | 113834 | 465 | 0,41% | |
35-39 | 41779 | 279 | 0,67% | |
40-44 | 7200 | 64 | 0,89% | |
45 i więcej | 303 | 7 | 2,31% |
Czy na podstawie zgromadzonych danych możemy zaprzeczyć hipotezie, że wiek matki nie ma wpływu na prawdopodobieństwo urodzenia martwego dziecka? Innymi słowy, czy istnieją istotne różnice w odsetkach martwych urodzeń u kobiet w różnych przedziałach wiekowych?
Aby odpowiedzieć na postawione pytania wykonamy test weryfikujący hipotezę:
wobec hipotezy alternatywnej:
.
W celu wykonania testu stwórzmy tabelę liczności obserwowanych oraz teoretycznych. Tabela powinna zawierać informacje odnośnie liczby noworodków, które urodziły się martwe oraz liczby noworodków, które urodziły się żywe.
Liczności teoretyczne obliczamy, mnożąc przez siebie odpowiednie liczności brzegowe, a następnie dzieląc wynik przez liczność skumulowaną . Przykładowo, liczność teoretyczną martwych urodzeń wśród matek mających od 15 do 19 lat obliczamy:
.
W analogiczny sposób obliczamy pozostałe liczności teoretyczne, otrzymując wyniki:
Wiek matki (i) | Urodzenia martwe (j=1) | Urodzenia żywe (j=2) | Urodzenia ogółem | ||
---|---|---|---|---|---|
obserowane | teoretyczne | obserowane | teoretyczne | ||
15-19 | 96 | 77,0 | 18395 | 18414,0 | 18491 |
20-24 | 303 | 333,9 | 79834 | 79803,1 | 80137 |
25-29 | 515 | 638,4 | 152711 | 152587,6 | 153226 |
30-34 | 465 | 474,3 | 113369 | 113359,7 | 113834 |
35-39 | 279 | 174,1 | 41500 | 41604,9 | 41779 |
40-44 | 64 | 30,0 | 7136 | 7170,0 | 7200 |
45 i więcej | 7 | 1,3 | 296 | 301,7 | 303 |
Suma | 1729 | 413241 | 414970 |
Dla zebranych danych wartość statystyki testowej obliczamy następująco:
.
Przyjmie ona wartość:
.
W teście mamy prawostronny obszar krytyczny. Korzystając z tablic tego rozkładu dla 6 stopni swobody oraz wyznaczamy zbiór krytyczny postaci . Obliczona wartość statystyki testowej mieści się w tym przedziale, a zatem możemy stwierdzić, że wskaźniki struktury martwych urodzeń względem wieku matki różnią się istotnie.
Innymi słowy, wiek matki ma istotny wpływ na prawdopodobieństwo urodzenia martwego dziecka.