Testy statystyczne w procesie podejmowania decyzji

(1)

TESTY STATYSTYCZNE

W PROCESIE

PODEJMOWANIA DECYZJI

CZESŁAW DOMAŃSKI

DOROTA PEKASIEWICZ

ALEKSANDRA BASZCZYŃSKA

ANNA WITASZCZYK

TESTY ST

ATY

STY

CZNE W PR

OCESIE PODEJMOW

ANIA DE

CYZJI

Autorzy prezentują różne klasy testów statystycznych umożliwiające aplikację

me-tod wnioskowania statystycznego w przypadkach, w których klasyczne procedury

są niemożliwe do zastosowania lub wykorzystanie ich wiąże się z ryzykiem podjęcia

błędnych decyzji.

Procedury weryfikacji hipotez statystycznych uwzględniane w procesach

podej-mowania decyzji mogą zainteresować zarówno badaczy zjawisk ekonomicznych,

socjologicznych i przyrodniczych, jak również studentów kierunków społecznych,

rolniczych, medycznych i technicznych.

9 788379 693580 ISBN 978-83-7969-358-0

(2)

TESTY STATYSTYCZNE

W PROCESIE

PODEJMOWANIA DECYZJI

(3)

(4)

TESTY STATYSTYCZNE

W PROCESIE

PODEJMOWANIA DECYZJI

CZESŁAW DOMAŃSKI

DOROTA PEKASIEWICZ

ALEKSANDRA BASZCZYŃSKA

ANNA WITASZCZYK

TestyStatystyczne_TYTULOWE.indd 3 04.11.2014 16:56

(5)

Czesław Domański, Dorota Pekasiewicz, Aleksandra Baszczyńska, Anna Witaszczyk Uniwersytet Łódzki, Wydział Ekonomiczno-Socjologiczny, Katedra Metod Statystycznych

90-214 Łódź, ul. Rewolucji 1905 r. nr 41/43 RECENZENT

Mirosław Szreder

REDAKTOR WYDAWNICTWA UŁ Iwona Gos

SKŁAD KOMPUTEROWY AGENT PR

PROJEKT OKŁADKI Stämpfli Polska Sp. z o.o. Zdjęcie na okładce: © Shutterstock.com

Praca naukowa finansowana ze środków Narodowego Centrum Nauki przyznanych na podstawie decyzji numer DEC-2011/01/B/HS4/02746

Wydanie I. W.06577.14.0.K ISBN 978-83-7969-358-0 Wydawnictwo Uniwersytetu Łódzkiego

90-131 Łódź, ul. Lindleya 8 www.wydawnictwo.uni.lodz.pl e-mail: ksiegarnia@uni.lodz.pl tel. (42) 665 58 63, faks (42) 665 58 62

(6)

SPIS TREŚCI

Przedmowa

1. Testy statystyczne i decyzje statystyczne [Czesław Domański]

1.1. Uwagi ogólne i podstawowe pojęcia 1.2. Weryfikacja hipotez statystycznych 1.3. Statystyczne problemy decyzyjne

1.4. Uwagi o testach statystycznych wykorzystujących próby z brakującą informacją

2. Wybrane klasyczne testy statystyczne [Czesław Domański]

2.1. Uwagi wstępne

2.2. Testy dla jednej zmiennej

2.3. Testy dla dwóch i więcej zmiennych 2.4. Analiza wariancji (ANOVA)

2.5. Wielowymiarowa analiza wariancji (MANOVA) 2.6. Wybrane testy zgodności dla rozkładów dochodów

3. Testy statystyczne w porównaniach wielokrotnych i modelach symulacyjnych [Czesław Domański]

3.1. Uwagi wstępne

3.2. Klasyfikacja porównań wielokrotnych 3.3. Wielokrotne procedury decyzyjne 3.4. Podejście Neymana-Pearsona 3.5. Porównania wielokrotne

3.6. Weryfikacja hipotez dla modeli symulacyjnych

4. Bayesowskie testy statystyczne [Dorota Pekasiewicz]

4.1. Uwagi wstępne

4.2. Idea konstrukcji testów bayesowskich

4.3. Rozkłady a priori parametrów zmiennych losowych i zasady ich określania 4.4. Testy bayesowskie przy niezależnym schemacie losowania próby

4.5. Bayesowska weryfikacja hipotez statystycznych przy zależnym schemacie losowa-nia próby

4.6. Analiza własności bayesowskich procedur testowych 4.7. Przykłady zastosowań testów bayesowskich

5. Bootstrapowe testy statystyczne [Dorota Pekasiewicz]

5.1. Uwagi wstępne

5.2. Istota konstrukcji bootstrapowych testów statystycznych 5.3. Nieparametryczne testy bootstrapowe

5.4. Parametryczne i semiparametryczne testy bootstrapowe 5.5. Testy bootstrapowe dla hipotez o wartościach średnich populacji 5.6. Analiza własności wybranych testów bootstrapowych

7 11 11 13 26 28 37 37 37 42 55 58 62 67 67 67 71 74 77 79 87 87 87 93 94 101 104 110 119 119 120 122 125 126 135

(7)

6

Spis treści

6. Sekwencyjne testy statystyczne [Dorota Pekasiewicz]

6.1. Uwagi wstępne

6.2. Idea konstrukcji ilorazowego testu sekwencyjnego

6.3. Ilorazowe testy sekwencyjne przy niezależnym schemacie losowania próby 6.4. Ilorazowe testy sekwencyjne dla schematów losowania próby innych niż losowanie

niezależne

6.5. Nieparametryczne testy sekwencyjne

7. Testy statystyczne oparte na metodzie jądrowej [Aleksandra Baszczyńska]

7.1. Uwagi wstępne 7.2. Metoda jądrowa

7.3. Jądrowe testy zgodności, niezależności i symetryczności 7.4. Jądrowe testy w analizie regresji

7.5. Jądrowe testy w badaniu obserwacji nietypowych

8. Testy statystyczne dotyczące rozkładów wielowymiarowych [Anna Witaszczyk]

8.1. Uwagi wstępne

8.2. Macierze losowe i przekształcenie Stieltjesa

8.3. Wybrane twierdzenia graniczne dla macierzy losowych 8.4. Testy dla wektorów wartości oczekiwanych

8.5. Weryfikacja hipotez dotyczących macierzy kowariancji 8.6. Testy wielowymiarowej normalności

9. Testy statystyczne dla danych cenzurowanych [Aleksandra Baszczyńska]

9.1. Uwagi wstępne 9.2. Podstawowe pojęcia

9.3. Testy zgodności dla dwóch lub więcej populacji dla danych cenzurowanych 9.4. Testy zgodności z rozkładem teoretycznym dla danych cenzurowanych 9.5. Testy w analizie regresji dla danych cenzurowanych

10. Weryfikacja hipotez statystycznych dla szeregów czasowych [Czesław Domański]

10.1. Uwagi wstępne i podstawowe pojęcia 10.2. Testy pierwiastka jednostkowego 10.3. Testy szczytów

10.4. Weryfikacja parametrów modeli ARMA 10.5. Weryfikacja parametrów modeli VAR

Zakończenie

Statistical Tests in the Decision Making Process (Summary) Literatura

Tablice statystyczne wybranych rozkładów prawdopodobieństwa Wybrane oznaczenia Indeks 141 141 141 148 160 165 171 171 171 176 187 198 205 205 205 212 217 224 236 245 245 245 249 255 258 263 263 265 268 277 282 289 291 293 299 313 317

(8)

PRZEDMOWA

Ukazanie się książki Johna Graunta Naturalne i polityczne obserwacje

poczy-nione na biuletynach śmiertelności w 1662 r. to moment, od którego zauważalny

jest rozwój statystyki. Jednak rodowód statystyki, podobnie jak matematyki, sięga

odległej starożytności. Już w XXXII w. p.n.e. plemię Ashipu, mieszkające między

Eufratem a Tygrysem, zajmowało się udzielaniem konsultacji w zakresie ryzyka

i niepewności oraz podejmowania trudnych decyzji.

Statystyka została wyodrębniona w oddzielną dyscyplinę jako metoda

wydo-bywania informacji z zaobserwowanych danych oraz jako logika podejmowania

decyzji w warunkach niepewności.

Wiedza statystyczna jest cenna dla przedstawicieli wszystkich zawodów.

Wiele złożonych problemów naszego życia wyglądałoby prościej, gdyby przed

podjęciem działań najpierw stawiać pytania, a następnie uzyskiwać właściwe

informacje. Formułowanie pytań uważa się często za kłopotliwe, gdyż wymaga

analizy, myślenia i precyzowania wniosków. Działania takie zabierają nam czas

i energię. Mogą też prowadzić do niepożądanej dezorientacji i zdenerwowania.

W wielu przypadkach, aby uniknąć takich sytuacji, opieramy się na mądrości

in-nych lub działamy emocjonalnie, co może prowadzić do nieporozumień, złego

wyboru momentu działania i pomyłek. Porady mogą być pomocne, ale raczej jako

punkt odniesienia, a nie samowystarczalne podejście.

W dzisiejszym świecie, jak nigdy wcześniej, istnieje potrzeba myślenia

sta-tystycznego. Jesteśmy otoczeni wyzwaniami różnorodnych banków danych

(cho-ciaż rzadko zgodnych z oczekiwaniami), które wymagają coraz lepszych metod

statystycznych, algorytmów, modeli systemów przetwarzania.

Statystyka zajmuje się kolekcjonowaniem informacji liczbowych oraz ich

analizą i interpretacją. Prezentowane w opracowaniu metody pozwalają

odpowie-dzieć na pytanie, co te informacje liczbowe, które traktujemy jako dane, mówią

nam o populacji i o zjawiskach, których dotyczą. Odpowiedź zależeć będzie nie

tylko od samych informacji, tzn. od obserwacji, ale również od wiedzy a priori.

Ta wiedza jest formalizowana za pomocą założeń przy konstrukcji metod.

Roz-różniane są najczęściej trzy podejścia oparte na różnych zasadach. Należą do nich:

– analiza danych,

– klasyczne wnioskowanie i teoria decyzji,

– analiza bayesowska.

(9)

8

Przedmowa

W pierwszym podejściu informacje statystyczne są analizowane jako dane,

w istocie rzeczy bez żadnych dodatkowych założeń. Głównym celem jest ich

obróbka i prezentacja graficzna lub tabelaryczna umożliwiająca wykrycie

najważ-niejszych własności i wyjaśnienie struktur danych.

W drugim podejściu obserwowane dane są traktowane jako wartości przyjęte

przez zmienne losowe, dla których przyjmuje się, że mają pewien łączny rozkład

P z klasy P. Często rozważane rozkłady indeksowane są parametrem θ lub Θ.

W analizie bayesowskiej zakłada się dodatkowo, że sam parametr jest

zmien-ną losową o pewnym znanym rozkładzie. Ten rozkład, zwany rozkładem a priori,

zdefiniowany przed zapoznaniem się z danymi, jest modyfikowany za pomocą

danych do rozkładu a posteriori parametru θ pod warunkiem zaobserwowanych

danych. Rozkład a posteriori w pewnym sensie syntetyzuje to, co można

powie-dzieć o parametrze θ na podstawie danych i wiedzy wstępnej a priori.

Wspomniane trzy podejścia pozwalają na formułowanie coraz mocniejszych

wniosków, a zarazem mniej pewnych założeń. Często pożądane jest korzystanie

z kombinacji tych różnych podejść, np. planując badanie, uwzględnia się wybór

li-czebności próby przy bardziej szczegółowych założeniach i przeprowadza analizę

wyników przy słabszych, ale za to bardziej przekonujących założeniach. W

nie-których zastosowaniach często pożyteczne jest formułowanie różnych modeli

do danego problemu. Wówczas zgodność wniosków daje dodatkowy argument

na rzecz poprawności analizy i odwrotnie, rozbieżności we wnioskach wskazują

na konieczność dokładniejszego przyjrzenia się założeniom różnych modeli.

Problemy statystyczne charakteryzują się tym, że mamy w nich do

czy-nienia nie z pojedynczymi rozkładami prawdopodobieństwa, ale z rodzinami

P =

{

P

_θ

: θ∈Θ

}

rozkładów określonych na pewnej wspólnej przestrzeni

mierzal-nej

(

χ, A

)

.

Zasadniczym materiałem badań statystycznych jest zbiór wyników

obserwa-cji, będących wartościami zmiennej losowej X, której rozkład P

_θ

jest przynajmniej

częściowo znany. Przyjmujemy, że o parametrze θ wiemy tylko tyle, że należy on

do pewnego zbioru Θ, zwanego przestrzenią parametrów.

Potrzeba analizy statystycznej wynika z faktu, że rozkład zmiennej losowej

X, a zatem pewne elementy sytuacji stanowiącej podstawę modelu

matematycz-nego nie są znane, co powoduje trudności w wyborze najlepszego postępowania.

Książka przedstawia w zwartej formie różne klasy testów statystycznych,

które mogą być stosowane w procesie podejmowania decyzji dotyczących

zja-wisk ekonomicznych, społecznych, demograficznych, technicznych i

medycz-nych. Klasyczne procedury testowe prezentowane w literaturze przedmiotu nie

zawsze można wykorzystać ze względu na założenia ich stosowalności. Dotyczyć

to może niespełnienia określonych założeń o rozkładzie zmiennych losowych,

z którymi utożsamiane są badane cechy statystyczne, braku dostatecznej liczby

elementów próby lub też stosowanego w badaniu schematu losowania próby,

od-miennego od losowania niezależnego.

(10)

Przedmowa

9 Rozważane grupy testów charakteryzują się odmiennymi procedurami

testo-wymi, np. przy zastosowaniu testów bayesowskich parametr rozkładu zmiennej

losowej jest traktowany jako zmienna losowa, natomiast w testach

sekwencyj-nych liczebność próby jest zmienną losową. W testach jądrowych można

wyko-rzystywać różne funkcje jądra i parametry wygładzania, co wpływa w znacznym

stopniu na rezultaty zastosowanej procedury, natomiast w testach bootstrapowych

procedura wnioskowania jest oparta na tzw. próbach bootstrapowych. Oprócz

rozważań teoretycznych zaprezentowane są również wyniki przeprowadzonych

badań, dotyczących własności analizowanych procedur weryfikacji hipotez

staty-stycznych wraz ze wskazaniem obszarów ich zastosowań.

Praca składa się z dziesięciu rozdziałów. Punktem wyjścia do rozważań

do-tyczących testów statystycznych opisywanych w dalszej części książki są trzy

pierwsze rozdziały. Obejmują one zagadnienia związane z klasycznym i

teorio-decyzyjnym podejściem do weryfikacji hipotez statystycznych. Związek między

testami statystycznymi a podejmowaniem decyzji zaprezentowany jest w

rozdzia-le pierwszym i trzecim. Rozdział drugi przedstawia wybrane klasyczne testy

sta-tystyczne z uwzględnieniem warunków, które muszą być spełnione, by dany test

mógł być stosowany w praktyce.

W kolejnym rozdziale prezentowane są testy bayesowskie

charakteryzu-jące się tym, że parametr rozkładu jest traktowany jako zmienna losowa o

zna-nym rozkładzie a priori. Stosując je, podejmujemy decyzję o akceptacji

hipote-zy o mniejshipote-zym ryhipote-zyku a posteriori, które wyznacza się na podstawie rozkładu

a priori i ustalonej funkcji straty. Rozważane testy bayesowskie dotyczą

weryfi-kacji hipotez statystycznych o parametrach rozkładu zmiennych losowych i

wska-zują na możliwość zastosowania różnych schematów losowania próby.

Testy bootstrapowe, którym poświęcony jest piąty rozdział książki, zasługują

na uwagę, ponieważ nie wymagają informacji o klasie rozkładu badanej zmiennej

losowej. Zastosowanie metod bootstrapowych do aproksymacji rozkładów

staty-styk testowych pozwala na weryfikację hipotez o parametrach rozkładu populacji

w oparciu o małe próby, co jest dużą zaletą tych metod.

Testy sekwencyjne rozważane w rozdziale szóstym to kolejna grupa testów

nieklasycznych. W testach tych liczebność próby jest zmienną losową.

Sekwen-cyjne zwiększanie liczby elementów próby losowej pozwala podjąć decyzję o

ak-ceptacji jednej z weryfikowanych hipotez z przyjętymi prawdopodobieństwami

błędów I i II rodzaju. Zaletą stosowania testów należących do tej klasy jest nawet

dwukrotnie mniejsza wartość oczekiwana liczebności próby niezbędnej do

pod-jęcia decyzji w porównaniu z testami klasycznymi dla identycznych błędów

I i II rodzaju, co wpływa na koszt przeprowadzanego badania statystycznego.

W rozdziale siódmym przedmiotem rozważań jest klasa testów jądrowych.

Metoda jądrowa, wywodząca się z estymacji funkcji gęstości, stanowi typowo

nieparametryczne podejście w procedurach wnioskowania statystycznego. W

roz-dziale tym rozważane są procedury weryfikacji hipotez dotyczących rozkładu

(11)

10

Przedmowa

zmiennej losowej, w tym: normalności, zgodności dwóch i więcej rozkładów,

hi-potez o postaci funkcji regresji i hihi-potez mówiących o niezależności zmiennych

losowych.

Rozdział ósmy poświęcony jest podejściu wielowymiarowemu w weryfikacji

hipotez statystycznych. Analizie poddane są testy służące do weryfikacji hipotez

o wektorach wartości oczekiwanych oraz hipotez dotyczących macierzy

kowa-riancji, zarówno klasyczne, jak i konstruowane w oparciu o twierdzenia graniczne

teorii macierzy losowych.

Rozdział dziewiąty dotyczy procedur wnioskowania statystycznego

stoso-wanych w sytuacji, gdy dane mają charakter przekrojowo-czasowy i brak jest

informacji dla pewnych okresów lub momentów czasu. W rozdziale tym

przed-stawione są najważniejsze klasy testów dla danych cenzurowanych, m.in. testy

dotyczące zgodności rozkładów dwóch lub więcej populacji oraz testy zgodności

rozkładu badanej populacji z rozkładem hipotetycznym.

Specjalna grupa testów stosowanych w analizach szeregach czasowych jest

przedmiotem rozważań w rozdziale dziesiątym, ze szczególnym uwzględnieniem

analizy stacjonarności i niestacjonarności procesu stochastycznego oraz

weryfika-cji parametrów modeli VAR i ARMA.

Serdecznie dziękuję wszystkim tym, których życzliwe uwagi przyczyniły się

do udoskonalenia tej książki, przede wszystkim Panu Profesorowi Mirosławowi

Szrederowi za wnikliwą recenzję.

(12)

STATISTICAL TESTS IN THE DECISION MAKING

PROCESS

Summary

Statistics emerged a separate discipline as a method of extracting information

from the observed data and as the logic of decision making under uncertainty.

Statistical knowledge is valuable for representatives of all professions. In today’s

world, as never before, there is a need for statistical thinking. We are surrounded

by challenges of various data banks which require better statistical methods,

mod-els, algorithms and processing systems. Statistics deals with collecting numerical

information and its analysis and interpretation. Methods presented in the book

at-tempt to answer the question of what these numerical information, treated as data,

tell us about the population and the phenomena to which they refer. The answer

depends not only on the very observations, but also on the prior knowledge. The

book presents in a compact form different classes of statistical tests that can be

used in the decision making process. The tests considered may be used in the

anal-ysis of economic, social, demographic, technical and medical phenomena. These

test classes are characterized by different construction methods, and thus different

test procedures. In Bayesian tests a parameter of random variable distribution is

treated as a random variable, while in sequential tests the sample size is a random

variable. In kernel tests, it is possible to use various kernel functions and various

smoothing parameters, which affects heavily the results of the procedure used. In

bootstrap tests, the inference procedure is based on the so-called bootstrap

sam-ples. Besides theoretical considerations, the results of the research concerning the

properties of the verification procedures are presented, indicating the areas of their

applications. The work consists of ten chapters. The starting point for

considera-tion of the statistical tests described later in the book are the first three chapters.

These include issues related to the classical and decision theoretical approach to

the verification of statistical hypotheses. The relationship between statistical tests

and decision-making is presented in the first chapter and the third one. The second

chapter presents selected classical statistical tests, accounting for the conditions

that must be fulfilled by the test to be used in practice. The next section presents the

Bayesian tests in which the distribution parameter is treated as a random variable

(13)

292

Statistical Tests in the Decision Making Process (Summary)

with known prior distribution. Using these tests we can make the decision of the

acceptance of the hypothesis of a lower posterior risk, which is determined on the

basis of the prior distribution and a fixed loss function. The Bayesian tests,

con-sidered, relate to the verification of statistical hypotheses about the parameters of

random variables and indicate the possibility of using different sampling schemes.

The bootstrap tests in the fifth chapter of the book, deserve attention due to the

fact that they do not require information about the class distribution of the random

variable investigated. The use of bootstrap methods to approximate distributions

of test statistics allows for testing hypotheses about the parameters of the

distribu-tion of the populadistribu-tion relying on small samples, which is a considerable advantage

of these methods. Sequential tests considered in chapter six, is another group of

non-classical tests. In these tests, the sample size is a random variable. Increasing

the number of the elements of the random sample sequentially, we decide to

ac-cept one of the hypotheses verified with the acac-cepted error probabilities of I and II.

The advantage of the use of the tests belonging to this class is even twice smaller

the expected value of the sample size needed to make a decision in comparison

with classical tests for identical mistakes of I and II. In the seventh chapter the

class of kernel tests is considered. The kernel method, derived from the

estima-tion of the probability density funcestima-tion is a typical non-parametric approach to

statistical inference procedures. In this chapter we discuss the procedures for the

verification of hypotheses about the distribution of the random variable including

its normality, the goodness-of-fit tests for two or more distributions, hypothesis

about the form of the regression function and hypotheses of the independence of

random variables. The eighth chapter is devoted to the multidimensional approach

in the verification of statistical hypotheses, as most research in the economic and

social studies is multidimensional. The tests for the hypotheses about the expected

value of vectors and hypotheses concerning the covariance matrix are analyzed,

both the classical and those constructed on the basis of random matrix theory

limit theorems. The ninth chapter concerns the procedures of statistical inference

applicable in situations where the data are time cross-sectional and there is no

information for certain periods or moments of time. This chapter presents the

most important class of tests for censored data. Tests for goodness-of-fit of two

or more populations, or the goodness-of-fit with the hypothetical distribution are

considered. A special group of tests used in time series analysis is explored in the

tenth chapter, with particular emphasis on the analysis of stationarity and

non-sta-tionarity of the stochastic process and parameters verification for the VAR models.

(14)

LITERATURA

Ahmad I., Li Q. [1997], Testing Independence by Nonparametric Kernel Method, „Statistics

& Probability Letters”, 34, 201–210.

Ahmad I., Mugdadi A. [2003], Testing Normality Using Kernel Methods, „Nonparametric

Statis-tics”, 15 (3), 273–288.

Aitchison J. [1975], Goodness of Prediction Fit, „Biometrika”, 62, 547–554.

Aitkin M., Boys R.J., Chadwick T.J. [2005], Bayesian Point Null Hypothesis Testing via the

Pos-terior Likelihood Ratio, „Statistics and Computing”, 15, 217–230.

Anderson T.W. [1958], An Introduction to Multivariate Statistical Analysis, Wiley, New York, London. Andrews D.F., Gnanadesikan R., Warner J.L. [1971], Transformations of Multivariate Data,

„Biometrics”, 27, 825–840.

Bagdonavicius V., Kruopis J., Nikulin M. [2011], Nonparametric Tests for Censored Data, Wiley,

New York, London.

Bahadur R.R. [1960], On the Asymptotic Efficiency of Tests and Estimates, „Sankhyā”, 22 (3–4),

229–252.

Bai Z.D., Silverstein J.W. [2004], CLT for Linear Spectral Statistics of Large-Dimensional Sample

Covariance Matrices, „The Annals of Probability”, 32 (1A), 553–605.

Balicki A. [2006], Analiza przeżycia i tablice wymieralności, PWE, Warszawa.

Bartlett M.S. [1937], Properties of Sufficiency and Statistical Tests, Proceedings of the Royal

Soci-ety of London, Ser. A, 160, 268–282.

Bartlett M.S. [1954], A Note on the Multiplying Factors for Chi-Square Approximations, „Journal

of the Royal Statistical Society”, Ser. B, 16, 296–298.

Bartoszewicz J. [1996], Wykłady ze statystyki matematycznej, PWN, Warszawa.

Baszczyńska A. [2011], Wybór funkcji jądra i parametru wygładzania w procedurach jądrowych

wnioskowania statystycznego, w: Zieliński Z.E. (red.),Rola informatyki w naukach ekonomicz-nych i społeczekonomicz-nych. Innowacje i implikacje interdyscyplinarne, Wydawnictwo Wyższej Szkoły Handlowej, Kielce, 139–146.

Baszczyńska A. [2012a], Estymacja funkcji gęstości z pakietem MATLAB, w: Zieliński Z.E. (red.),

Rola informatyki w naukach ekonomicznych i społecznych. Innowacje i implikacje interdyscy-plinarne, Wydawnictwo Wyższej Szkoły Handlowej, Kielcach, 7–16.

Baszczyńska A. [2012b], Test symetryczności Li, „Acta Universitatis Lodziensis. Folia

Oecono-mica”, 271, 99–105.

Baszczyńska A. [2013], Some Remarks on the Symmetry Kernel Test, „Acta Universitatis

Lodzien-sis. Folia Oeconomica”, 285, 21–29.

Baszczyńska A., Domański C. [1998], Nonparametric Inference in the Case of Random Censoring,

w: 24th Macromodels’97. Transition to Market System. Modelling and Forecasting of Eco-nomic and Social Consequences, Absolwent, Łódź, 127–140.

Bera A., John S. [1983], Tests for Multivariate Normality with Pearson Alternatives,

„Communica-tions in Statistics. Theory Methods”, 12, 103–117.

Bera A., Premarante G. [2001], Adjusting the Tests for Skewness and Kurtosis for

Distribution-al Misspecifications, http://www.business.uiuc.edu/Working_ Papers /papers/01-0116.pdf [15.04.2014].

(15)

294

Literatura

Bernardo J.M. [1980], A Bayesian Analysis of Classical Hypothesis Testing, w: Bayesian Statistics,

University Press, Valencia, 605–647.

Berndt E.R., Hall B.H., Hall R.E., Hausman J.A. [1974], Estimation and Inference in Nonlinear

Structural Models, „Annals of Economic and Social Measurement”, 3, 429–452.

Box G.E.P. [1949], A General Distribution Theory for a Class of Likelihood Criteria, „Biometrika”,

36 (3–4), 317–346.

Box G.E.P., Cox D.R. [1964], An Analysis of Transformations, „Journal of the Royal Statistical

Society”, Ser. B, 26, 211–252.

Box G., Pierce D. [1970], Distribution of Residual Autocorrelations in

Autoregressive-Integrat-ed Moving Average Time Series Models, „Journal of the American Statistical Association”, 65 (332), 1509–1526.

Breusch T. [1978], Testing for Autocorrelation in Dynamic Linear Models, „Australian Economic

Papers”, 17, 334–355.

Burke M., Gombay E. [1992], Tests of Fit for Cox’s Regression Model, „Probability and

Mathemati-cal Statistics”, 13 (1), 127–137.

Chernick M.R. [2008], Bootstrap Methods: a Guide for Practitioners and Researchers, Wiley,

Hoboken.

Chernoff H. [1972], Sequential Analysis and Optimal Design, SIAM, Philadelphia. Cover T.M., Thomas JA. [1991], Elements of Information Theory, Wiley, New York.

Cox D.R. [1961], Tests of Separate Families of Hypotheses, Proceedings of the 4th Berkeley

Sym-posium of Probability and Statistics, 1, 105–123.

Cox D. R. [1962] Further Results on Tests of Separate Families of Hypotheses, „Journal of the

Royal Statistical Society B”, 24 (2), 406–424.

Cox D.R. [1970], The Analysis of Binary Data, Chapman & Hall, New York.

Cox D. [1972], Regression Models and Life Tables, „Journal of the Royal Statistical Society”,

Ser. B (Methodological), 34 (2), 187–220.

Cramer J.S. [1986], Metody matematyczne w statystyce, PWN, Warszawa.

Davison A.C., Hinkley D.V. [1997], Bootstrap Methods and Their Application, Cambrigde

Univer-sity Press, Cambrigde.

Davidson R., MacKinnon J. [2004], Econometric Theory and Methods, Oxford University Press,

Oxford.

DeJong D.N., Nankervis J.C., Savin N.E., Whiteman C.H. [1992], The Power Problems of Unit

Root Tests in Time Series with Autoregressive Errors, „Journal of Econometrics”, 53 (1–3), 323–343.

Dempster A.P. [1997], The Direct Use of Likelihood for Significance Testing, „Statistics and

Com-puting”, 7 (4), 247–252.

Dempster A.P., Laird N.M., Rubin D.B. [1977], Maximum Likelihood from Incomplete Data via the

EM Algorithm (with Discussion), „Journal of the Royal Statistical Society”, Ser. B, 39, 1–37.

Diaconis P., Freedman D. [1986], On the Consistency on Bayes Estimates, „The Annals of

Statis-tics”, 14 (1), 1–26.

Dickey D., Fuller W. [1981], Likelihood Ratio Statistics for Autoregressive Time Series With a Unit

Root, „Econometrica”, 49, 1057–1072.

Domański C. [1979], Statystyczne testy nieparametryczne, PWN, Warszawa.

Domański C. [1986], Teoretyczne podstawy testów nieparametrycznych i ich zastosowanie w

nau-kach ekonomiczno-społecznych, Wydawnictwo Uniwersytetu Łódzkiego, Łódź.

Domański C. [1990], Testy statystyczne, PWE, Warszawa.

Domański C. [2007], Własności testów wielowymiarowej normalności opartych na miarach

ksz-tałtu, „Acta Universitatis Lodziensis. Folia Oeconomica”, 205, 89–107.

Domański C. [2010], Uwagi o testach Jarque’a-Bera, „Przegląd Statystyczny”, 57 (4), 19–26. Domański C., Parys D. [2007], Statystyczne metody wnioskowania wielokrotnego, Wydawnictwo

(16)

Literatura

295

Domański C., Pruska K. [2000], Nieklasyczne metody statystyczne, PWE, Warszawa.

Domański C., Pruska K., Wagner W. [1998], Wnioskowanie statystyczne przy nieklasycznych

założeniach, Wydawnictwo Uniwersytetu Łódzkiego, Łódź.

Domański C., Wagner W. [1984], Testy wielowymiarowej normalności, „Przegląd Statystyczny”,

31 (3/4), 259–270.

Doornik J., Hansen H. [2008], An Omnibus Test for Univariate and Multivariate Normality,

„Ox-ford Bulletin of Econometrics and Statistics”, 70 (s1), 927–939.

Efron B. [1979], Bootstrap Methods: Another Look at the Jackknife, „The Annals of Statistics”,

7 (1), 1–21.

Efron B., Tibshirani R.J. [1993], An Introduction to the Bootstrap, Chapman & Hall, New York. Engle R. [1982], Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of

United Kingdom Inflation, „Econometrica”, 50, 987–1007.

Ferguson G., Takane Y. [2003], Analiza statystyczna w psychologii i pedagogice, PWN, Warszawa. Fisz M. [1969], Rachunek prawdopodobieństwa i statystyka matematyczna, PWN, Warszawa. Gajek L., Kałuszka M. [1996], Wnioskowanie statystyczne. Modele i metody, Wydawnictwa

Nau-kowo-Techniczne, Warszawa.

Gajda J. [2001], Prognozowanie i symulacje a decyzje gospodarcze, C.H. Beck, Warszawa. George E., Liang F., Xu X. [2006], Improved Minimax Predictive Densities under Kullback-Leibler

Loss, „Annals of Statistics”, 34, 78–91.

Giorgi G.M., Fattorini L. [1976], An Empirical Study of Some Tests for Multivariate Normality,

„Quaderni dell’Instituto di Statistica”, 20, 1–8.

Girko V.L. [1995], Statistical Analysis of Observations of Increasing Dimension, Kluwer Academic

Publisher, Dordrecht, Boston.

Goldfrey L. [1978], Testing for Higher Order Serial Correlation in Regression Equations When the

Regressors Include Lagged Dependent Variables, „Econometrica”, 46, 1303–1310.

Godfrey L., Orme C. [1991], Testing for Skewness of Regression Distribuances, „Economic

Let-ters”, 37, 31–34.

Goldfeld S., Quandt R.E. [1965], Some Tests for Homoscedasticity, „Journal of the American

Sta-tistical Association, 60 (310), 539–547.

Good P. [2004], Permutation, Parametric, and Bootstrap Tests of Hypotheses, Springer, New York. Govindarajulu Z. [1985], A Survey of Sequential Statistical Analysis, „Sequential Methods in

Sta-tistics”, Badach Center Publications, 16, 133–179.

Granger C. [1969], Investigating Casual Relations by Econometric Models and Cross-Spectral

Methods, „Econometrica”, 37 (3), 424–438.

Granger C., Newbold P. [1974], Spurious Regression in Econometrics, „Journal of Econometrics”,

2, 111–120.

Greenwood M. [1946], The Statistical Study of Infectious Diseases, „Journal of the Royal Statistical

Society”, Ser. A, 109, 85–110.

Hand D., Mannila H., Smyth P. [2005], Eksploracja danych, Wydawnictwa Naukowo-Techniczne,

Warszawa.

Härdle W. [1990], Smoothing Techniques with Implementation in S, Springer, New York.

Härdle W., Mammen E. [1993], Comparing Nonparametric versus Parametric Regression Fits,

„Annals of Statistics”, 21, 1926–1947.

Härdle W., Müller M., Sperlich S., Werwatz A. [2004], Nonparametric and Semiparametric

Mod-els, Springer, Berlin.

Heyadat A., Robson D.S. [1970], Independent Stepwise Residuals for Testing Homoscedasticity,

„Journal of American Statistical Association”, 65, 1573–1581.

Hodges J.L., Lehmann E.L. [1970], Deficiency, „Annals of Mathematical Statistics”, 41 (3), 783–801. Horowitz J., Spokoiny V. [2001], An Adaptive, Rate-Optimal Test of a Parametric

(17)

296

Literatura

Jammalamadaka S.R., Gloria M.N. [2004], A Test of Goodness of Fit Based on Gini’s Index of

Spacings, „Statistics and Probability Letters”, 68, 177–178.

Jarque C., Bera A. [1987], A Test for Normality of Observations and Regression Residuals,

„Inter-national Statistical Review”, 55, 163–172.

Jędrzejczak A. [2011], Metody analizy rozkładów dochodów i ich koncentracji, Wydawnictwo

Uni-wersytetu Łódzkiego, Łódź.

Kamiński B. [2012], Podejście wieloagentowe do modelowania rynków. Metody i zastosowania,

Oficyna Wydawnicza SGH, Warszawa.

Kimball B.F. [1947], Some Basic Theorems for Developing Tests of First for the Case of the

Non-parametric Probability Distribution Functions, „Annals of Mathematical Statistics”, 18, 540–548.

Kleijnen J. [1987], Statistical Tools for Simulation Practitioners, Marcel Dekker Inc, New York. Koronacki J., Mielniczuk J. [2006], Statystyka, Wydawnictwa Naukowo-Techniczne, Warszawa. Kot S.M. [1999], Analiza ekonometryczna kształtowania się płac w Polsce w okresie transformacji,

PWN, Warszawa.

Krzyśko M. [1998], Statystyka matematyczna. II, Uniwersytet Adama Mickiewicza, Poznań. Krzyśko M. [2009], Podstawy wielowymiarowego wnioskowania statystycznego, Wydawnictwo

Naukowe Uniwersytetu Adama Mickiewicza, Poznań.

Kulczycki P. [2005], Estymatory jądrowe w analizie systemowej, Wydawnictwa

Naukowo-Tech-niczne, Warszawa.

Kullback S., Leibler R.A. [1951], On Information and Sufficiency, „Annals of Mathematical

Sta-tistics”, 22, 79–86.

Kwiatkowski D., Phillips P., Schmit P., Shin Y. [1992], Testing the Null Hypothesis of Stationarity

Against the Alternative of a Unit Root: How Sure Are We that Economic Time Series Have a Unit Root?, „Journal of Econometrics”, 54, 159–178.

Lehmann E.L. [1968], Testowanie hipotez statystycznych, PWN, Warszawa.

Landwehr J.M., Pregibon D., Shoemaker A.C. [1984], Graphical Methods for Assessing Logistic

Regression Models, „Journal of the American Statistical Association”, 79, 61–71.

Lehmann E.L. [1957a], A Theory of Some Multiple Decision Problems. I, „Annals of Mathematical

Statistics”, 28 (1), 1–25.

Lehmann E.L. [1957b], A Theory of Some Multiple Decision Problems. II, „Annals of

Mathemati-cal Statistics”, 28 (3), 547–572.

Lehmann E. L. [1952], Testing Multiparameter Hypotheses, „Annals of Mathematical Statistics”,

23 (4), 541–552.

Li Q., Racine J.S. [2007], Nonparametric Econometrics. Theory and Practice, Princeton

Universi-ty Press, Princeton, Oxford.

Li Y., You J. [2012], Bayesian Hypothesis Testing in Latent Variable Models, „Journal of

Econo-metrics”, 166, 237–246.

Ljung G.M., Box G.E.P. [1978], On a Measure of a Lack of Fit in Time Series Models,

„Biometri-ka”, 65 (2), 297–303.

Lütkepohl H. [2007], New Introduction to Multiple Time Series Analysis, Springer, New York. MacKinnon J. [1996], Numerical Distribution Functions for Unit Root and Cointegration Tests,

„Journal of Applied Econometrics”, 11 (6), 601–618.

Maddala G.S. [2008], Ekonometria, Wydawnictwo Naukowe PWN, Warszawa.

Malkovich J.F., Afifi A.A. [1973], On Tests for Multivariate Normality, „Journal of American

Sta-tistical Association”, 68 (341), 176–179.

Mardia K.V. [1970], Measures of Multivariate Skewness and Kurtosis with Applications,

„Bio-metrika”, 57 (3), 519–530.

Mardia K.V. [1974], Applications of Some Measures of Multivariate Skewness and Kurtosis for

(18)

Literatura

297

Mardia K.V. [1980], Tests of Univariate and Multivariate Normality, w: Handbook of Statistics,

vol. 1, NHPC.

Marek T., Noworol C. [1987], Analiza sekwencyjna w badaniach empirycznych, PWN, Warszawa. Markowicz I. [2012], Statystyczna analiza żywotności firm, Wydawnictwo Naukowe Uniwersytetu

Szczecińskiego, Szczecin.

Meng X. [2001], A Congenial Overview and Investigation of Multiple Imputation Inference Under

Uncongeniality, w: Survey Response, Wiley, New York, 343–356.

Meng X., Rubin D. [1991], Using EM to Obtain Asymptotic Variance-Covariance Matrices: the

SEM Algorithm, „Journal of American Statistical Association”, 86, 899–909.

Miller R.G. [1981], Simultaneous Statistical Inference, Springer, New York.

Nicolae D., Meng X., Kong A. [2008], Quantifying the Fraction of Missing Information for

Hy-pothesis Testing in Statistical and Genetic Studies, „Statistical Science”, 23, 287–312.

Pagan A., Ullah A. [1999], Nonparametric Econometrics, Cambridge University Press, Cambridge. Pandey M.D., Gelder P.H.A.J.M. van, Vrijling J.K. [2003], Bootstrap Simulations for Evaluating

the Uncertainty Associated with Peaks-over-Threshold Estimates of Extreme Wind Velocity, „Environmetrics”, 14 (1), 27–43.

Pearson E.S., Hartley H.O. [1966], Biometrica Tables for Statisticians, vol. 1–2, Cambridge

Uni-versity Press, Cambridge.

Pekasiewicz D. [2002], Ilorazowe testy sekwencyjne dla frakcji dla prób nieprostych, „Acta

Univer-sitatis Lodziensis. Folia Oeconomica”, 162, 89–98.

Pekasiewicz D. [2006], Sequential Tests for Truncated Distribution Parameters, „Acta Universitatis

Lodziensis. Folia Oeconomica”, 196, 47–56.

Pekasiewicz D. [2011], Testy statystyczne dla parametrów zmiennej losowej o rozkładzie

wykład-niczym, w: Zieliński Z.E. (red.),Rola informatyki w naukach ekonomicznych i społecznych. Innowacje i implikacje interdyscyplinarne, Wydawnictwo Wyższej Szkoły Handlowej, Kielce, 228–236.

Pekasiewicz D. [2012], Bootstrapowa weryfikacja hipotez o wartości oczekiwanej populacji o

roz-kładzie asymetrycznym, „Acta Universitatis Lodziensis. Folia Oeconomica”, Wydawnictwo Uniwersytetu Łódzkiego, Łódź, 151–159.

Pekasiewicz D. [2013a], Bayesian Statistical Tests for Proportion for Independent and Dependent

Sampling, „Acta Universitatis Lodziensis. Folia Oeconomica”, 285, 39–50.

Pekasiewicz D. [2013b], Bayesian Statistical Tests for Parameters of Model of Structural Changes

with Dependent Bernoulli Variable, w: Proceedings of the 7th Professor Aleksander Zeliaś International Conference on Modelling and Forecasting of Socio-Economic Phenomena, Fun-dacja Uniwersytetu Ekonomicznego, Kraków, 115–123.

Phillips P., Perron P. [1998], Testing for a Unit Root in Time Series Regression, „Biometrika”,

75 (2), 335–346.

Pitman E.J.G. [1949], Lecture Notes on Nonparametric Statistical Inference, Columbia University,

New York.

Pruska K. [1995], Bayesian Estimation of Structural Changes Model with Dependent Bernoulli

Variable, „Biometrical Letters”, 32, 15–21.

Rao C.R. [1982], Modele liniowe statystyki matematycznej, PWN, Warszawa.

Rao J.S., Kuo M. [1984], Asymptotic Results on the Greenwood Statistics and Some of Its

General-ization, „Journal of the Royal Statistical Society”, Ser. B, 46, 228–237.

Rossa A. [2003], Niestandardowe metody estymacji rozkładów czasu trwania zjawisk w aspekcie

ich zastosowań w ekonomii i ubezpieczeniach, Wydawnictwo Uniwersytetu Łódzkiego, Łódź.

Rossa A. [2005], Metody estymacji rozkładu czasu trwania zjawisk dla danych cenzurowanych oraz

ich zastosowania, Wydawnictwo Uniwersytetu Łódzkiego, Łódź.

Royston J.P. [1983], Some Techniques for Assessing Multivariate Normality Based on the

(19)

298

Literatura

Rubaszek M. [2012], Modelowanie polskiej gospodarki z pakietem R, Oficyna Wydawnicza SGH,

Warszawa.

Rubin D.B. [1976], Inference and Missing Data, „Biometrika”, 63, 581–592.

Sen P.K. [1981], Sequential Nonparametrics: Invariance Principles and Statistical Inference,

Wi-ley, New York.

Shapiro S.S., Wilk M.B. [1965], An Analysis of Variance Test for Normality (Complete Samples),

„Biometrika”, 52 (3/4), 591–611.

Sherman B.W. [1950], A Random Variable Related to the Spacing of Sample Values, „Annals of

Mathematical Statistics”, 21, 330–361.

Silverman B.W. [1981], Using Kernel Density Estimates to Investigate Multimodality, „Journal

Royal Statistical Society”, Ser. B, 43, 97–99.

Silverman B.W. [1996], Density Estimation for Statistics and Data Analysis, Chapman & Hall,

London.

Silvey S.D. [1978], Wnioskowanie statystyczne, PWN, Warszawa.

Sokołowski A. [2010], Jak rozumieć i wykonywać analizę przeżycia,

http://www.statsoft.pl/czytel-nia/artykuly/Jak_rozumiec_i_wykonac_analize_przezycia.pdf [28.03.2014].

Spjotvoll E. [1972], On the Optimality of Some Multiple Comparison Procedures, „Annals of

Math-ematical Statistics”, 43 (2), 398–411.

Stanisz A. [2007], Przystępny kurs statystyki z zastosowaniem STATISTICA PL na przykładach

z medycyny. Tom 3. Analizy wielowymiarowe, Statsoft Polska Sp. z o.o., Kraków.

Steczkowski J. [1995], Metoda reprezentacyjna w badaniach społeczno-ekonomicznych, PWN,

Warszawa, Kraków.

Stuart A., Ord J. [1991], Kendall’s Advanced Theory of Statistics, vol. 2, Edward Arnold, London. Szreder M. [1994], Informacje a priori w klasycznej i bayesowskiej estymacji modeli regresji,

Wy-dawnictwo Uniwersytetu Gdańskiego, Gdańsk.

Szreder M. [2004], Metody i techniki sondażowych badań opinii, PWE, Warszawa.

Szreder M. [2013], Twierdzenie Bayesa po 250 latach, „Wiadomości Statystyczne”, 12, 23–26. Tomaszewicz A. [1995], Testy ekonometryczne, Wydawnictwo Uniwersytetu Łódzkiego, Łódź. Verdinelli I., Wasserman L. [1998], Bayesian Goodness-of-Fit Testing Using Infinite-Dimensional

Exponential Families, „The Annals of Statistics”, 26, 1215–1241.

Wagner W. [1990], Test normalności wielowymiarowej Shapiro-Wilka i jego zastosowania w

doś-wiadczalnictwie rolniczym, „Roczniki Akademii Rolniczej w Poznaniu”, 197.

Wand M.P., Jones M.C. [1995], Kernel Smoothing, Chapman & Hall, London.

Watała C. [2003], Biostatystyka – wykorzystanie metod statystycznych w pracy badawczej, a

med-ica Press, Bielsko-Biała.

White H. [1982], Maximum Likelihood Estimation of Misspecified Models, „Econometrica”, 50, 1–25. White H. [1987], Specification Testing in Dynamic Models, w: Bewley T. (ed.), Advanced in

Econo-metrics – Fifth World Congress, vol. 1, Cambridge University Press, New York, 1–58.

Wigner E.P. [1967], Random Matrices in Physics, „SIAM Review”, 9, 1–23.

Wigner E.P. [1968], On the Distribution of the Roots of Certain Symmetric Matrices, „Annals of

Mathematics”, 67 (2), 325–327.

Wilks S.S. [1935], On the Independence of k Sets of Normally Distributed Statistical Variables,

„Econometrika”, 3, 309–326.

Wilks S.S. [1962], Mathematical Statistics, Wiley, New York.

Wywiał J. [1992], Statystyczna metoda reprezentacyjna w badaniach ekonomicznych, Akademia

Ekonomiczna, Katowice.

Zasłonka J., Domański C., Iwaszkiewicz A., Jaszewski R., Okoński P. [2006], Polska skala

ryzy-ka operacyjnego leczenia choroby niedokrwiennej mięśnia sercowego, Wydawnictwo Medy-cyna Plus s.c., Warszawa.

Zieliński R. [2011], Statystyka matematyczna stosowana. Elementy, Centrum Studiów

(20)

TESTY STATYSTYCZNE

W PROCESIE

PODEJMOWANIA DECYZJI

CZESŁAW DOMAŃSKI

DOROTA PEKASIEWICZ

ALEKSANDRA BASZCZYŃSKA

ANNA WITASZCZYK

TESTY ST

ATY

STY

CZNE W PR

OCESIE PODEJMOW

ANIA DE

CYZJI

Autorzy prezentują różne klasy testów statystycznych umożliwiające aplikację

me-tod wnioskowania statystycznego w przypadkach, w których klasyczne procedury

są niemożliwe do zastosowania lub wykorzystanie ich wiąże się z ryzykiem podjęcia

błędnych decyzji.

Procedury weryfikacji hipotez statystycznych uwzględniane w procesach

podej-mowania decyzji mogą zainteresować zarówno badaczy zjawisk ekonomicznych,

socjologicznych i przyrodniczych, jak również studentów kierunków społecznych,

rolniczych, medycznych i technicznych.

9 788379 693580 ISBN 978-83-7969-358-0