F O L I A O E C O N O M I C A C R A C O V I E N S I A
Vol. LIV (2013) PL ISSN 0071-674X
O PROCEDURZE KART KONTROLNYCH W PRZYPADKU,
GDY ZMIENNA DIAGNOSTYCZNA MA ROZKŁAD
ASYMETRYCZNY1
JANUSZ L. WYWIAŁ
U n iw e rs y te t E k o n o m ic z n y w K a to w ica ch
e-mail: janusz.wywial@ ue.katowice.pl
ABSTRACT
J.L. W yw iał. O n construction of control card in the case when the variable under stu d y has skewed probabi
lity distribution. Folia O e c o n o m ic a C ra co v ie n sia 2013, 54: 107-116.
T h e p ro b le m o f statistical q u a lity c o n tro l is ta k e n in to a cc o u n t. A n e w p r o p o s itio n o f c o n tro l c a rd c o n s tru c tio n is p ro p o s e d . T h e p ro b le m is c o n s id e re d as te s tin g sta tistica l h y p o th e s is o n e x p e c te d v a lu e o f th e v a ria b le u n d e r s tu d y (d iag n o s tic v a ria b le) u n d e r th e a s s u m p tio n th a t th e v a ria b le h a s s k e w e d pro b ab ility . T h e p r o p o s e d te s t statistic is c o n s tr u c te d o n th e r a th e r w e ll k n o w n fo llo w in g p r o p e r ty t h a t th e c o v a ria n c e b e tw e e n s a m p le v a ria n c e a n d s a m p le m e a n is p r o p o r tio n a l to th e th ir d c e n tra l m o m e n t o f a v ariab le. T his p r o p e r ty is a p p lie d to c o n s tru c tio n o f te s t statistic b a s e d o n th e re g re s s io n estim ato r. T h e lim it d is trib u tio n o f th e te s t statistic is n o rm al.
STRESZCZENIE
W m n ie jsz ej p ra c y ro z w a ż a n o p o w s z e c h n ie u ż y w a n ą w s ta ty s ty c z n e j k o n tro li jak o ści p r o c e d u r ę k a r t k o n tr o ln y c h lecz p r z y z a ło ż e n iu , ż e z m ie n n a d ia g n o s ty c z n a m a n ie k o n ie c z n ie r o z k ła d sy
1 N iniejsza p raca m a stanow ić p rz y cz y n ek d o m etodologii statystycznej stosow anej w kontroli jakości i jest d ed y k o w a n a jej w y b itn em u znaw cy, k tó ry m był Profesor A ndrzej Iwasiewicz. Pozwolę sobie napisać, iż m iałem w ielo k ro tn ie zaszczyt ro zm aw iać z Profesorem n a tem aty statystyki m a te m atycznej i jej zasto so w ań i to n ie tylko w k ontroli jakości. Profesor, jako p ra w d z iw y statystyk, m iał um iejętność kojarzenia p o z o rn ie n a p ierw szy rz u t oka nie zw iązanych ze sobą faktów. W szczególno ści p odkreślał, że m etodologia stosow ana w k o ntroli jakości jest p o d o b n a d o tej, k tó rą p o słu g u jem y się w m eto d zie reprezentacyjnej lu b audycie finansow ym , p o n iew aż ich głów ne p ro b lem y sp ro w ad zają się do testow ania o d p o w ie d n io sfo rm u ło w an y ch h ip o te z statystycznych. P onadto, Profesor jasno u św ia d o m ił m i jaka jest najistotniejsza różnica m ięd zy fo rm u ło w an iem p ro b lem u testow ania o d p o w ie d n ic h h i p o tez statystycznych w k o ntroli jakości i audycie statystycznych. Stw ierdził, że w statystycznej kontroli jakości g łó w n ą w ag ę kładzie się n a p ra w d o p o d o b ień s tw o p o p ełn ien ia b łę d u p ierw szeg o ro d zaju , czyli po zio m istotności, a w audycie fin an so w y m n a p ra w d o p o d o b ień s tw o p o p ełn ien ia b łę d u d ru g ieg o r o dzaju. To jest je d n a z inspiracji, k tó rą zaw d zięczam Profesorow i.
m e try c z n y . A n a liz o w a n y p ro b le m s p r o w a d z o n o d o z a g a d n ie n ia w e ry fik ac ji h ip o te z y o w a rto śc i o c z e k iw a n e j tej z m ie n n e j d ia g n o s ty c z n e j, p r z y czy m z a k ła d a się, że ta z m ie n n a m a r o z k ła d a sy m e try c z n y . Z n a n ą w ła sn o ść w y s tę p o w a n ia k o relacji m ię d z y ś r e d n ią i w a ria n c ją z tej sam ej p ró b y w y k o rz y s ta n o d o k o n s tru k c ji s p r a w d z ia n u testu . W y k az an o , ż e t e n s p r a w d z ia n m a g ra n ic z n ie ro z k ła d n o rm a ln y . P rz y s p e łn ie n iu p e w n y c h d o d a tk o w y c h w a r u n k ó w te s t w y k o rz y s tu ją c y p r o p o n o w a n y s p r a w d z ia n m o ż e m ieć w ię k s z ą m o c o d te s tu , k tó re g o s p r a w d z ia n e m je s t z w y k ła ś re d n ia a ry tm e ty c z n a z p r ó b y p ro ste j.
K EY W O R D S — S Ł O W A K L U C Z O W E
c o n tro l c a rd , te s t statistic, re g re s s io n e stim a to r, a s y m m e tric d is trib u tio n , lim it th e o re m k a rty k o n tro ln e , te s t sta ty s ty c z n y , e s ty m a to r re g resy jn y , ro z k ła d a sy m e try c z n y ,
tw ie rd z e n ie g ra n ic z n e
1. W PRO W A D ZEN IE
Tekst niniejszej pracy dotyczy pow szechnie używ anej w statystycznej kontroli jakości tzw. p rocedury kart kontrolnych. Klasyczna wersja tej p ro ced u ry jest używ ana przy założeniu, że zm ienna diagnostyczna m a rozkład symetryczny, zwykle normalny. Szerokie rozw ażania na ten tem at pro w ad zą m.in. Iwasiewicz (1999) i Kończak (2007). To założenie jest w ygodne z m etodologicznego p u n k tu widzenia, jakkolwiek w praktyce nie m ożna wykluczyć pojaw iania się asym e trycznych rozkładów zm iennej diagnostycznej. W zw iązku z tym w pracach z zakresu statystycznej kontroli jakości uk azują się prace dotyczące p rocedur konstrukcji kart kontrolnych przy nieklasycznych założeniach, czym m.in. zaj m uje się Kończak (2007).
W niniejszej pracy będziem y zakładać, iż rozkład zmiennej losowej diagno stycznej jest asymetryczny, oraz że jego m om enty do czwartego rzęd u włącznie istnieją. W celu uproszczenia p row adzonych rozw ażań, co nie um niejsza ogól ności uzyskanych wyników, analizow any problem sprow adzam y do zagadnienia testow ania hipotez statystycznych. Zakładamy, że odchylenie od wartości pożą danej nadziei m atem atycznej zm iennej diagnostycznej świadczy o rozregulow a niu się procesu produkcyjnego. Sprow adza się to, jak wiadom o, do weryfikacji hipotezy o wartości oczekiwanej tej zm iennej. Ponadto, będziem y zakładać, że zm ienna diagnostyczna ma rozkład asymetryczny. P roponow any w pracy spraw dzian testu jest w ynikiem w ykorzystania własności zależności m iędzy średnią i w ariancją z tej samej próby. O kazuje się, że kowariancja tych p aram etrów jest rów na trzeciem u m om entow i centralnem u zm iennej losowej, z której rozkładu pochodzi próba. Tą własność Wywiał (2009) wykorzystał do podniesienia d o kładności estym atora wartości średniej w dom enie populacji, który tutaj w yko rzystam y do testow ania hipotezy statystycznej o zmiennej diagnostycznej dalej oznaczanej przez zm ienną losową Y.
Zakładam y, że zm ienna losowa Y m a m om enty do czw artego włącznie, które oznaczam y przez:
- 1 <k< 1 (3)
jest uno rm o w an y m w spółczynnikiem asymetrii (skośności) zm iennej losowej. Jeśli rozkład zm iennej jest symetryczny, to k = 0. G dy rozkład zm iennej losowej jest praw ostronnie (lewostronnie) asymetryczny, to k > 0 (k < 0). Wywiał (1981, 1983) zauw aża, że w spółczynnik k jest w spółczynnikiem korelacji p ary zm ien nych losowych Y i (Y - E(Y))2. Przykładow o, m ożna pokazać, że gdy zm ienna
losowa m a rozkład wykładniczy, to k = —j= » 0,7071, por. Wywiał (2009).
V2
2. WERYFIKACJA H IPO T E Z
Proces kontroli jakości form ułujem y w następujący sposób. W kolejnych okre sach czasu są pobierane z partii (populacji) w yprodukow anych w yrobów próby, w których są obserw ow ane wartości zm iennej diagnostycznej, którą oznaczyli
śmy przez Y, a jej wartość oczekiwaną przez m = E(Y). Dla ustalenia uw agi za
łóżmy, że duże dodatnie odchylenie od wartości średniej zm iennej diagnostycz nej świadczy o w ystąpieniu w ybrakow anych produktów , co jest zwykle efektem rozregulow ania się procesu wytwórczego. Z form alnego p u n k tu w idzenia m am y więc do czynienia z weryfikacją hipotezy spraw dzanej:
H0: m = m0 (4)
w zględem alternatywnej
Hi: m > m0 , (5)
przy czym przez m0 oznaczono wartość oczekiw aną zm iennej diagnostycznej przy założeniu, że proces produkcyjny przebiega praw idłowo.
1.1. P r z y p a d e k z n a n e j w a r i a n c j i z m i e n n e j d i a g n o s t y c z n e j W pew nych sytuacjach wartości zmiennej diagnostycznej zależą tylko od stop nia dokładności przyrządu pom iarowego, którym są obserw owane. W związku z tym fabrycznie określony stopień dokładności pom iarów p rzy rząd u m ożna użyć jako wielkości proporcjonalnej do odchylenia stan d ard o w eg o zm ien nej diagnostycznej. Dalej założymy, że to odchylenie standardow e jest właśnie rów ne param etrow i dokładności pom iarów określającemu fabrycznie. Niech
s = (Y1, Y2, ..., Yn) będzie próbą prostą z rozkładu praw dopodobieństw a zmiennej
losowej Y .
k
-2 (V 4 - V -2 )
111 Wówczas do testow ania hipotezy H0 m ożna użyć następującego tzw. estym a tora regresyjnego:
Wywiał (2009) wykazał, że jeśli rozm iar próby n^-x>, to zapisana statystyka
W związku z tym spraw dzian sform ułow anej hipotezy H 0 m ożna określić w zo rem:
N a podstaw ie znanych tw ierdzeń o granicznym rozkładzie funkcji m om en tów z próby, por. np. Cram er (1945) lub Rao (1965), m ożna wykazać, że jeśli roz m iar próby n^x> oraz hipoteza H0 jest praw dziw a, to rozkładem granicznym praw dopodobieństw a zm iennej losowej Z s jest stan d ard o w y rozkład norm alny zm iennej losowej Z~N(0,1). To już pozw ala na w yznaczenie wartości krytycznej testu. Zatem, przy poziomie istotności a, wartość krytyczna za testu w ynika z w y rażenia P(Z > z a |H 0) = a. Stąd wnioskujemy, że górna linia karty kontrolnej ma postać:
(6) gdzie:
ma rozkład Y s ~ N (//, D 2 (Y, s )), gdzie
Do estymacji tej wariancji m ożna użyć statystyki
(7) gdzie:
Z _ Y1,s Mo
(8)
Jeśli zs > za, co jest rów now ażne nierówności y 1,s > ya, to odrzucam y hipotezę
H0 z praw dopo dob ieństw em popełnienia błędnej decyzji ró w n y m a. Innym i
słowy, w tym p rzypad k u z p raw dopodobieństw em pom yłki ró w n y m a tw ier dzimy, ze proces produkcyjny rozregulow ał się.
1.2. P r z y p a d e k n i e z n a n e j w a r t o ś ci w a r i a n c j i z m i e n n e j d i a g n o s t y c z n e j
Zakładamy, że w kolejnych okresach czasu t = 1, ..., D + 1 są przep ro w ad zan e pom iary zm iennej diagnostycznej na p ro du k tach w ylosow anych do kolejnych prób. Zm ienną diagnostyczną w t-tym okresie czasu oznaczam y przez Yt, jej wartość oczekiwaną przez E(Yt) = mt. Zakładamy, że wariancje D2(Yt) = v2, dla
t = 1, . .., D + 1. Pozostałe m om enty centralne oznaczam y p rzez v rj = E(Yt-mt)r, r = 3, 4, ...
Niech st = (Yt1, Yt2, ..., Yt,n) będzie próbą prostą, w której są obserw ow ane wartości zm iennej diagnostycznej Yt, czyli w t-tym okresie czasu w ylosow aną z rozkładu t-tej zm iennej diagnostycznej. Łączną próbę obserw ow aną w D-okre- sach czasu oznaczam y przez s = s1 u s2 u ... u sD . Rozmiar próby st wynosi nt,
D
a wiec rozm iar próby s wynosi n = ^ nk. Wariancja v2 m oże być szacow ana za
pom ocą statystyk: t=i
^ = - ^ r Z (Y - Y )2,
Y
= - ^ Y, t=i,...,D+i, ' - 1 -1 H ' ' - 1 is>, lub *2 ,s = D-1 1 t=1N as interesuje weryfikacja hipotezy o wartości oczekiwanej zm iennej dia gnostycznej w okresie D + 1, czyli:
H0: mD+ 1 = m0. (10)
w zględem alternatyw nej hipotezy
H 1: mD+1 > m0. (11)
Do tego celu w ykorzystam y dane o rozkładzie p raw dopodobieństw a zm ien nej diagnostycznej grom adzone w próbach z wcześniejszych okresów czasu.
W celu weryfikacji określonej w yrażeniem (7) hipotezy konstruujem y nastę pującą statystykę testową:
Podobnie jak w u p rzedn im punkcie, m ożna wykazać, że jeśli rozm iary prób
nt^ x ) dla t = 1, ..., D + 1 oraz hipoteza H0 jest praw dziw a, to rozkładem granicz
nym praw dopodobieństw a zm iennej losowej Us jest stan d ard o w y rozkład nor m alny zm iennej losowej U~N(0,1). Zatem , p rzy poziomie istotności a, wartość krytyczna ua testu jest w yznaczana z w yrażenia P(U > ua \H0) = a. Stąd wynika, że górna linia karty kontrolnej m a postać:
Jeśli us > ua, co jest rów now ażne nierówności y 1s > ya , to odrzucam y hipotezę H0 z praw dopodobieństw em popełnienia błędnej decyzji ró w nym a. O znacza to, iż z praw dopodobieństw em pom yłki rów n y m a twierdzimy, że proces p ro d u k cyjny rozregulow ał się.
Przedstaw iona p ro ced u ra w yznaczania karty z pojedynczą linią kontrolną da się natychm iastow o uogólnić na p rzy p ad ek dw óch takich linii. Wiąże się to tylko ze zm ianą sposobu specyfikacji alternatyw nej hipotezy, określonej w zo ram i (5) lub (11), które należy zastąpić odpow iednio następującym i H 1:/w ^ m0 lub H 1: mD+1 ^m0. Wówczas m am y do czynienia z d w u stro n n y m obszarem kry tycznym testu. Zatem np. wartości krytyczne u1a/2 i u2,a/2 testu rozw ażanego w punkcie 2.2 w yznaczam y odpow iednio z w y rażeń P (U < u 1a/2\H0) = a/2
Przedstaw iona procedura konstrukcji kart kontrolnych dla asymetrycznej zm iennej diagnostycznej nie w ym aga szczegółowych założeń o postaci roz kładu praw dopodobieństw a zmiennej diagnostycznej. W ymaga się jedynie aby istniały m om enty centralne rozkładu tej zmiennej co najmniej czwartego rzędu. Z drugiej jed n a k strony zap roponow ana procedura w ym agać będzie losowania prób o znacznych rozmiarach. Zwykle zakłada się, że rozkłady funkcji m om en tów centralnych z próby są zbieżne do rozkładu norm alnego dla prób o rozm ia rach rzęd u kilkuset elem entów, a w każdym razie o wielkości co najm niej stu elementów.
(15)
(16)
3. UWAGI K O Ń C O W E
115 Duże rozm iary prób powiększają koszty kontroli jakości. Po to by je obni żyć m ożna rozw ażyć użycie innych statystyk testowych, których dystrybuantę rozkładu m ożna już przybliżać p rzy m niejszym rozm iarze próby. W iadomo, że ciągi rozkładów sym etrycznych są zwykle szybciej zbieżne do rozkładu norm al nego. Zatem w szczególności logarytm ow anie wartości zmiennej diagnostycznej pow inno spow odow ać szybszą zbieżność rozkładu statystyk testow ych określo nych wzoram i (8) i (15) do rozkładu norm alnego. W tej sytuacji trzeba jeszcze pamiętać, że formalnie nie m am y już do czynienia z weryfikacją hipotezy staty stycznej o wartości oczekiwanej zmiennej diagnostycznej Y, lecz z testow aniem hipotezy o nadziei m atem atycznej jej logarytm u, czyli E(ln(Y)). Zarysow ana właśnie procedura um ożliwi w yznaczenie wartości krytycznych rozw ażanych testów już przy m niejszym rozm iarze próby. W spomnijm y jeszcze, iż w litera turze statystycznej rozw aża się także inne transform acje sym etryzujące roz kłady zm iennych losowych, por. np. Carroll i R uppert (1988) lub Yeo i Johnson (2000).
Z założenia o stabilności wariancji zm iennej diagnostycznej wynika, że w a riancja użytego do konstrukcji spraw dzianu testu estym atora regresyjnego śred niej zm iennej diagnostycznej będzie m alała w raz z biegiem czasu, czyli gdy liczba branych p o d uw agę okresów czasu D będzie rosła, co skutkuje w zrostem liczebności łącznej próby, którą oznaczono przez n . M ożna wykazać, że to au to m atycznie spow oduje w zrost m ocy proponow anego testu statystycznego, czyli zwiększa praw dopodobieństw o niepopełnienia błędu drugiego rodzaju. Innym i słowy to prow adzi do zmniejszenia ryzyka, m ierzonego praw dopodobieństw em popełnienia błędu II rodzaju, czyli akceptacji niepraw idłow o przebiegającego procesu produkcyjnego. Jednak bardziej konkretne wyniki w tym zakresie będą m ożliwe po przeprow adzeniu odpow iednio zaplanow anego i w ykonanego ba dania sym ulacyjnego m ocy proponow anego testu.
BIBLIOGRAFIA
C a rro ll R., R u p p e r t D. (1988), Transformation and W eighting in Regression, C h a p m a n a n d H all, N e w York.
C ra m ć r H. (1958), M etody matematyczne w statystyce.
Iw a sie w icz A. (1999), Z a rz ą d z a n ie jak o ścią, P W N , W arsza w a -K rak ó w .
K e n d a ll M .G. S tu a rt A. (1967), The Advanced Theory of Statistics. Vol. 2 Inference and Relationship, C h a rle s G riffin a n d C o m p a n y L im ite d , L o n d o n .
K o ń c z ak G. (2007), M etody statystyczne w sterowaniu jakością produkcji, W y d a w n ic tw o A k a d e m ii E k o n o m ic z n e j w K ato w icach .
R ao C.R. (1982), Modele liniowe statystyki matematycznej, P W N W arszaw a.
W y w iał J.L. (1981), O pewnych unorm owanych współczynnikach asymetrii i spłaszczenia, P rz e g lą d S ta t y sty c zn y , vol. 28, 263-269.
W y w iał J.L. (1983), Unormowane współczynniki odchyleń od normalności rozkładu wielowymiarowej z m i
W y w iał J.L. (2009), Estimation of mean in domain when distribution of variables is skewed w : M ultiva ri
ate Statistical A nalysis (red. Cz. D o m a ń s k i, J. Białek), A cta U n iv e rsita tis L o d z ie n sis, Folia O e c o -
n o m ic a n r 228, 93-103.
Yeo I.K., J o h n s o n R. (2000), A new fa m ily of power transformations to improve norm ality or sym m etry, B io m e trik a , 87, 954-959.