MATHEMATISCH CENTRUM
2e. BOERKAAVESTRAAT 49
AMSTERDAM
STATISTISCHE AFDELING
Leiding: Prof. Dr D. van Dantzig
Chef van de Statistische Consultatie: Prof. Dr J. Hemetrijk
Rapport S
io8
REGRESSIEANALYSE VAN NET VERMOGEN DAT EEN SCHEEPSSCHROEF O?NEEMT
door
R. Doornbo.
1. Inleidthg.
IJitgaande van de schroefkarakteristteken van model-proeven kan de vo].gende formule opgeste.ld wordn:
A.RK.
(o,i N )
= C,S+ C
i-waarin C,
C en b
. constanten ziJn enA.P.K. vermogen in pk gemeten aan de as,
= schijnbare slip in % = .100(1 Vx1852
)7'
N.H6O
N = toerenta]. van de schroef per minuut, V = scheepssnelheid i knopen, (1 knoop
1852 m/fuur),
H = spoed van de schroef in m.
Het toerental kan zeer nauwkeurig gemeten worden, het
vermogen tot ± 5% en de sohijnbare slip tot op ± 10% nauwkeurig.
We willen flu de coefficienten
C,, C en b schatten,
zowel met iriachtnemlng. van de te .verwachten waarnernings-fouten in A.P.K. en S5 ,, als onder de aanname dat S5
foutloos is. Eenzelfde berekening voeren we uit in de
onderstelling bo
, om de inviced van de wrijvingstermna te gaan.
Als orde van grootte van de verschillende componenten
is opgegeven:
C,S,15%
C82%
bN9 3%
De volgende tabel geeft gemeten waarden van A.P.K., N
We voeren volgende notatie in: l000A.P.K.= x S5N3=;
t3
z Nb=oc3
De verechiliende waarnemingen geven we aari met de index 1. De opgegeven waarden van
x
en ziJn aanwaarnemings-fouten onderhevig. We noëmen de ware waarden van x1 en z,
resp. en de waarnemingsfouten t reep. v Verder
onderstellen we dat en trL voorticomen uit onderling onafhankeljjke normale verde].ingen met gemiddelde nu]. en spreidingen o resp. c
Er bestaan due de volgende betrekkingen:
iL=
tL'.
Onderstreping geeft aan, dat de betreffende groothe.td
stochastisch is, dat wil zeggen, dat een derge.lijke groot-A.PK. N 2820
70,81
25,k
2120 63,911.2k,8
17306o,49
.21,9
2350 66,116.26,1
2k80
66,11
31,0
23306k,36
31,6
178060,57
26,2
253568,25
2k,5
283071,86
21,3
211.0068,37
20,0
2k20
68,56
i8,6
231067,78
17,2
279071,56
17,0
20806k,67
16,6
21106k93
17,5
2200 .Gk,5o
30,1
300071,88
27,0
179560,22
28,0
17606o.00
25,8
239067,12
25,8
211.0568,kg
22,k
286071,68
21,7
285072,37
20,8
2119069,17.
20,3
236067,98
20,2
2OO
68,]i3
18,8
12k055,20
i8,i
232067,95
.17,8
224O67,37
16,3
280071,98
16,5
20206k,k5
30007k,18
c
-3-held een waarschijnhiJkheidsverdeling
bezit.
tjit vergellJking (1.1) voit:
(riormale verdeling met gemi.d.delde nul en spreiding
o).
De u.s
zijri onderling
onafharikelijk, dus de
simul-taneverdelingsdjchthejd f(1,
.,) Van
a.,, . . ,is:
iT 1
=I V?
o-Vullen wij in deze formule
u.= x -
in, waarin
x
de vc3r
waargenomen waarden voorstellen, en
substitueren we verder (i .2),
dan wordt
f(.u...
,Lt)
uit-gedrukt in de waarnemingeri en de onbekende parameters
oc.,en
.De zo verkregen functie, opgevat
als
functje van de onbekende parameters, wordt
flu
gemaximali-seerd. Hiertoe nemen
we eerst de logarithme, welke
gewoon-lijk door
Lwordt aangegeven en de
aannernelijkhejdsfunctje
genoemd wordt. Dus
= -
fn(vr)_. Cra_
') Nurrimer
tussen vierkantehaken
verwijzeri naar de
littera-tuuroDgave aan het einde
van dit versiag.
(1.2)
°oc1'+
2aL + CC2. Behandeling van het geval dat S
foutloos wordt onderste].d.
In dit geval is dus i= 0 voor ledere
i ,
d.w,z.
= Z ,
de waargenomen waarde. Met behuip van de
methode der meest aannemel.ijke schattingen (Engels:
method
of maximum likelihood) icunnen
we de parameters
o,, oct,
oen o schatten. Dit komt hierop
fleer, dat desiniultane
verdelingsdichthejd van alle waarnemthgen, opgevat als
functie van de te schatten parameters
maximaa]. wordt
ge-maakt. Voor het hler beschouwde geval
van normaal verdeelde
waarnemingsfouten komt deze methode overeeri met de methode
der kleinste kwadraten. Eennadere
uiteènzetting kan men
b.v. vinden in A.M. MOOD Li]
t)
De verdelingsdichthejd van
u.stellen we
(u). Dus
L4(2.5)
(2.6)
ZZk
0.jk(j=1,2.; k=1,2.3).
(2.1), (2.2)
en (2.3)
gaan flu over in de 3 verge1ijkingen(2.8)
Door. differentiatje ñaar o
, o, oc
en o virideri we:.1) b
I
(2.2) z(ZL_O(lZiL
2323,.)
-
(2.3)
Z(2 .k)
=-
_L.Stellen we deze vergelijkingen nul en losseri we
vér-volgens.
, en
o.
hierujt op, dan vinden wede meest aannemelijke sohattingen.
&, &.,
envan resp. cc, oc , oc3 en a . (Het kapje geeft aan, dat
de schattingen ttmeest aannemefljke schàttingen8 ziJn). We definieren:
Uit (2..k) volgt:
(2.9)
.=
a1a,1+a,2a3a.,3
Y2= a, a,2.,- a2a22+ 30.23
A A A
= a1 13 + a2 a23 + 0.30.33
De
e1em-iten van de inverse van de matrix
we
0jk
Dan is de oplossing voor de
{a,
a2= 12
+a22u+
0.3= O.9I
+0.2+
0.1d3(J
1,2a)
Besehouwn wij de waarningen weer als stochastisehe
grootheden. (dus grootheden,
die
een waarschijnhijkheidsver-(2.7{
if
deling bezttten), dan worderi 00k de sohattingen
stoehas-tisch..
Volgens AM. MOOD (blz.30k) heeft flu de grootheid
= p_Q(p
-
V&'n/n3
voor pi,. en
een
ST1JDENT"-verde1ing met
a
vriJheids-graden. Met behuip hiervan kunnen we dus een
betrouwbaar-heidsinterval voor de
oc..opstelleri. (Zie memorandum
S k7(M
18))t).
Het geval oco
kan geheel analoogbehandeld worden.
3. Behandeling van het geval, dat zowel in
A.R)..
ala
Swaarnerningsfouten voorkomen.
We nemen flu aan, dat
uen
Vtnormaal en onderling
onafhankelijk verdeeld zijn met gemiddeide 0 en spreidingen
o-
resp.
a- .Om de methode der meest aannemeliJke sohat-.
tingen te kunnen toepassen, moeten
we onderstellen dat de
verhouding
ic!
bekend is. Als
oen
a-onafhankeliJk
kunnen variëren, heeft de aannemelijkheidsfurictje
name].ijk
geen absoluut maximum. Men vergelijke hiervoor by.
van
DANTZIG [2]
De verdeiingsdichthejd van
flis
flu:
-_y_
7i
e
Zi2Oa. O2dus
= = ri Cn (2rnc)n n
I4U._ LV =
2 -v ç2 . 2a-. I -2 .Z, _0(Z3,
)-zDoor te differentleren naar
, 0(1, O(.a ,.en
c-vinden we:
(3.1)
= (Z1j_)
(3.2)
=) Dit memorandum is aan het einde
van dit rapport
(3.3)
ZaL(Qci
(3.k)
=(3.5)
=_.a
a 2ç0q(3.6)
Z. 0ii. +_L. Z(z1_)2.
2q
Stellen we deze vere1ijkingen nu]. en lossen we ver-volgens OL1 oc.2, o en de ,.0 hieruit op., dan
vinden we de meest aannemelijlce sohattingen
&,
&., a1,
en van resp. oc,,oct,
oc3, o en Nasubstitu-tie van deze waarden in de rechter leden van (3.1) t/m
(3.5) vj.nden we door (3.1) met (3.2), (3.3) en (3.k) te combineren:
;_)=o of
Noemen we de minoren van Ua,U
A.q dan volgt uit (3.7) en (3.8) met (2.5) en (2.6):(3.7)
)o
of 2zZz,z
(3.8)
Z Z31(ZTL..)O
ofDus kunnen we (3.2), (3.3) en (3.) schrijven:
(3 .)
a,z,1,a)
= 0(3.10) ?:
Z(X_a1Z1L_a_8,Z3)0
(3.11)
uit (.i) volgt:
terwiji
a2
-- A11
= A13. i Y0a.. Y242
A11
We beschikjcen in dit geval niet
over een methode orn
pre-cieze betrouwbaarhejdsjntervallen voôr de parameters op te stellen. Wel kunnen we een schatting van de spreidingen
van de geschatte parameterwaarcjen berekenen.Voor grote n
ztjn.de meest ãannemelijke schattingen van de parameterci
namelijk bij benadering simultaan normaal verdee].d, Zijn
,e) de geschatte parameters,
dan
zijn devarian-ties (kwadraat van de spreiding
=variantie) hiervan, de
corresponderende diagonaalelementen ult de matrix:
Substituereri we nu
(3.9),
(3.10) en (3.11) in (3.6), en stelleri wijZx
., dan krijgen we de volgendevier-kantsvergelijlclrig voor
a1(.15)
4I(y1A,1+yA1
+& {ic2(a1A1 a1,A1.+ a13A)+
y2y33i3a_
X2A11J+ i- -- y3A3) = 0.De eerté en de derde term hebben tegerigesteld teken.
Er
is dus eeri positieve en een negatieve wortel. De positieve
wortel correspondeert met het maximum
van L
zoals door berekening is te verifiëren. tilt physisehe overwegingenkomt een negatieve eerste term vanzelfsprekend 00k
niet-in aanmerkniet-ing.
Stellen we het rechter lid
van (3.5) riul en substitueren
we hierin de gesehatte waarden
voor
cr2, oc..,,o2, oc
en
en
dan is
Voor het gevál dat o= 0 vinden we in plaats
van (3.12)
(3.1
7)o1(,.i2a1)+
&,[c2(a,1o..2,_a)
+
XZa2]
dus dan is:
(
a2L \ O( sc:;.(a2L
(. '2L
We' défirijeren aiao(a-
6Z(z1.
0 ii = ik (k=2,3) , 1lMII=_JIfI a2L.t11..1S(vérgelijic voor de theorie b v. M.G. NDALL [3]).
In bovenstaande formule stelt het symbool de mathe-mattsch verwachting vOor. In ons geva]. zijn de parameters
oc oc en
Y.
IJit de vergelijkingen (3.1) tot (3.5)voigt:
- ¶
-
I pça 2L ,-o
.voOi-.jr.20.2 3L' 4_.(c)2=
K2O " verderis volgens (3.7)iJ
,
2Z2L_
0(3z)i-L n nn'_
nen volgens
(3.8
terwij]. Tenslotte is: enL_.i z°z
1tt
3,-'L
'(
L. \-o
\
Geven we grootheden waarin staat in plaats
van
&met de bovenjndex
° dan wordtde matrixin ons geval: -:r:L
0.
0 0 0 o a. -oc - 0 .12. 18 1,1 '3o2 1,82 o - 2,1 o L_ a1 ...1 L. Z Z.K'O- 8 33 )cac3i
icc'-2 0 .z Z°1,1 )CQ2 Z.,
10a 31
z LI
--]
- - -
0 L'K2j
o LZ OC1Z 1,82 2,32 K2O j=Nu is dus cr
= -
als T22 de ininor vana1
= Itpq,) 'i
ot=
_J$
en - .We vermenigvuldlgen de 36e kolom achtereenvolgens met
..-0
-i
' 1,32.
en K202 3,32. en
trekken deze kolom dan resp. af van de 2e 3e, en ke kolom.
Van de laatstgenoemde
kolornrnen
zijn de laatste elementenflu gelijk aan nul.
Door hetzelfde procd toe te passen op de 5e tot en met
de 35e kolom, bereiken we dat van de 2e, 3e en kolom
vanaf de 5e
nj
alle elementen nul wor'den.it1
10
-De term t22. is
dan
overgegaanin
+ -cc,° cc° = C.cc
, waarin C-
-'
I 11
O2Lc2 J
Verder is
t'
= a12 = C.a12enz,
as Du s (3.18)
(3.21)
en
(3.22)
waarin
cT = 02-22)
lol
T
C G.0IIn het geval dat
oc= Ovinden we:
= O(oc+K1) 1.
IaI
a1 a1 a,2 a,1I-
Io-°l Ca23Ca
Ca33Ca., Ca, Ca,3
Ca12 Ca22 CO..a3 CC.13 Ca23 Ca
Om de varianties numeriek te schatten substitueren we de meest aannemelijlce schattingen voor o en cr
in (3.18), (3.19),...(3.22).
. Resultaten,
Voor het geval dat S niet foutloos is, mOet i
worden geschat, Nemen we hiervoor, in aansluiting op de
ver-strekte gegevens:
5
van
de gemiddelde waarde 1000 APKdan virideri we . = 0, '18. De berekeningen iJn uitgevoerd
voor K = 0,15 en j = 0,2. De spreidthgèn van de
parame-ters zijnberelcend voor.k.=.0,15. We 1crijgen dande
volgen-de uitkomsten:
I,. S foutloos
II. Met waarnemingsfout in S
a., = 0,072
a2=
a=
1800 = 28.-b3= i8.io
zonder wrijvingsterma1= 0073
2=
6)15 = 29.i0 =19k.103 o,00k r= .0,10g =ikk,io3
a, =0,072
2 6,1730.10
=152.10
a).
met wrijvingstermBetrouwbaarheidsinterval s .pr.0,05 a, = = = =
0,06k
. 5,87 2200 0,051 5;i5 -200 < < < a, aa3.
< < < 0,077 6,59 k200 b) zonder wrijvthgsterm Betrouwbaarheidsinterval. s .pr.0,05a, =
= = 0,070 6,21k6.iO3
0,0575,92
< < a, < <0,083
6,50
a) met wrijvthgsterrn = 0,15 0,2 0,005 =0,069
a2=
o,i6
2=
5,82
700
a3= 1900
g= 29.10'
Voor de grootte van de drie componenten vinden we in
geval Ia: C1S5 18%,
C=
77% enbN= 5%
ib: C1S= 20%, C= 80%
11arn(K
= 0,15) C1,S5=20% C
75%,bN2= 5%
lib: K = 0,15) C1S5 = 21%, C 79%.111111101
'I
a, I 11 k 11F.11fthIh1NhI. fl!I:aI11oL1oIfl
-1 UHI0110IIIIIO 01'1111111h11111111111I0 I11hI 1101111011 LilifilJfl'lIffillhII
TI111!Hh11 Wilil fli' 11001 -1 1110111ff U110WI111111 111012
-Deze resultaten zijn verkregen op grond van het in de
inleiding onderstelde verband, dat door (1.1) gegeven
wordt, Het is interessant even na te gaan, in hoeverre de
gevoriden resultaten me
deze onderstelling in
overeenstem-ming ztJn.
In de bijgevoegdegrafiek 1
is daartoe voor 3 groepen
waarnemingen, waarvan de waarden van N dicht blJ elkaar
liggen, het verband tussen
A.P.K. en
5aangegeven. De
ge-trokken liJnen zijn berekend voor de drie
aangegeven
waar-den van
N, waarbiJis aangenomen
a1= 0,072,
= 5,79
en
= i800, We zien dat de grafiek, de spreidingen in
enA.RK, in aanmerkingen genomen, geen aanleiding
geeft aan het onderstelde verband tussen
A.P. K., S en N
te twijfelen.
-
We merken op, dat in geval
1a
het
betrouwbaarheidsinter-val voorde wrijvingstei'm de waarde nul bevat.
In geval
11a
rnOeten we bedenken, dat de opgegeven spreidingen, dus 00k
°a3
slechts schattingen ziJn. De gebruikte formules
zijn
slechts geldig voor grote
n, zoals in
§3 ook reeds werd
ôpgemerkt.
-Er bestaat voor het algemene geval 00k
een
parameter-vrije methode, d.w.z. dat geen ondersteiling
behoeft te
worden gemaakt omtrent de. verde ling
van de
ien de
De toepassing van een dergelijke methode heeft
het voordeel,
dat eventuele afwijkingen
van de mm
of meer uit de lucht
gegrepen onderstelling van normaliteit der
waarnemingsrou-ten ons dan geen parwaarnemingsrou-ten kunnen spelen. Hierbij moewaarnemingsrou-ten
echter de waarden van
S5 naar opklimmende grootte
gerang-schlkt worden. Bij het beschikbare
waarnerningsrnateriaa1
zouden we-dan slechts
stel waarnemingen van de 32 kunnen
gebruiken, daar de intervallen te klein
zijri vergeleken met
de spreiding. Als we by. de waarden 30,1 en 27,0 hebben,
dan kunrien de ware waarden
resp. 27,1 en 29,1 zijn, zodat
de volgorde niet vaststaat-.
-Deze.methode zouden we dus wel
kunnen toepassen op voldoend uit elkaar liggende
waarne-mingen.
LITTERATUTJR.
A.M.MOOD, Introduction to the theory
of statistics.
London 1950, p.152 e.v.
D.V.DANTZIG,. Kadercursus Statistiek 19k8-k9,
Hóofd-suk
IV, §i, p.323 e..v..
- t3J
M.G.KENDALL, The advanced theory of statistics,
vol..L
MATHEMAISCH CEN'RUM
Amsterdam.
Sta-tis-tische Afdeling.
S47(M18)
Betrouwbaarhejdsin-terval]
(aJ.gemeen).
1)
:Zij
een stochas-tiache groo-theid, die een verdelingsfunctje
bez±t die, op
een onbekende parame-ter 6
na, geheel bekeid is
0 kan by. het
gemiddelde van
zijn, of de spreiding of
iets dergelijks), dan kan
men de vraag stelle,n uit een aan-taJ.
waarnemingen van
een scha-t-ting voor 0 af te leiden.
Een betrouwbaarhejdsjnteaLJvooi
is een interval,
waarvan de grenzen .fhankelijk zijn
van de waarnerningen
r14
van 2
,en dat de eigenschap bezi-t, behoudens
een zekere
gegeven onbetrouwbaarhejdx.,, de juiste
waarde van
te bevat-ten.
Di-t be-teken-t, dat bij een serie bepalingen van
betrouwbaarheids-intervallen slech-ts in
ongeveer een frac-tie O( van deze gevallen
he-t in-tervaicf
zo zal uitvallen, dat he-t 0 nie-t beva-t.
Hierbij
is dus O constant en he-t inierva1eYverander1ijk
(en wel
s10-ckastisch). Hierin iig-t bet
gro-te verschil met een zgñ.
voor-spellirigsin-tervai, d.i. een
gegeven vast interval, waar een
stochas-tjsch punt met een zekere
waarschijnhijkhejd in valt.
Met algemene principe ter bepaling van een
betrouwbaarhejds-interval is het volgende
zij q'een toets
voor de hypothese
&
b, (vgl.S47(M6)), dan is
de verzameling van die
waarden
die bij -toepassing
van
grond van de gevonden
waarne-mingen
-,..
Xnie-t voor verwer_ping in
aanmerki
kornen.
C7