• Nie Znaleziono Wyników

Repository - Scientific Journals of the Maritime University of Szczecin - Probability Distribution of the Waiting...

N/A
N/A
Protected

Academic year: 2021

Share "Repository - Scientific Journals of the Maritime University of Szczecin - Probability Distribution of the Waiting..."

Copied!
11
0
0

Pełen tekst

(1)

ISSN 0209-2069

ZESZYTY NAUKOWE NR 2 (74)

AKADEMII MORSKIEJ

W SZCZECINIE

EXPLO-SHIP 2004 Lech Kasyk

Rozkład prawdopodobieństwa czasu oczekiwania

na zgłoszenie statku na torze wodnym Szczecin – Świnoujście

Słowa kluczowe: zmienna losowa, rozkład wykładniczy, proces Poissona

Wykorzystując test „chi kwadrat” Pearsona zweryfikowano hipotezę o tym, że zmienna losowa, którą jest czas pomiędzy zgłoszeniami kolejnych jednostek płynących torem wodnym Szczecin – Świnoujście ma rozkład wykładniczy. Dane z 2002 roku anali-zowano w trzech zbiorach: dla dni świątecznych, okołoświątecznych i dla dni roboczych. Ponadto zweryfikowano hipotezę o rozkładzie wykładniczym czasu oczekiwania dla zgłoszeń w poszczególnych porach dnia wyróżnionych okresów.

Probability Distribution of the Waiting Times for a Ship

Report in the Szczecin – Świnoujście Fairway

Key words: random variable, exponential distribution, Poisson process

The author has tested a hypothesis concerning the exponential distribution of the waiting times for the reporting of the next fairway vessel in the y Szczecin – Świnoujście fairway. The “chi square” Pearson test has been used. The relevant 2002 data have been examined in three sets: for weekdays, for holidays and for days immediately preceding or following holidays (“near-holidays”).

(2)

Wstęp

Czas oczekiwania na zgłoszenie kolejnej jednostki idącej torem wodnym jest zmienną losową. W wielu opracowaniach [2, 3, 6, 7, 9] zakłada się, że pro-ces zgłoszeń statków jest propro-cesem Poissona, a co za tym idzie czas oczekiwania na zgłoszenie kolejnej jednostki torowej jest zmienną losową o rozkładzie wy-kładniczym. Założenie to jest słuszne pod warunkiem, że proces zgłoszeń jest całkowicie losowy. Na torze wodnym są pewne regulacje, które tę losowość zaburzają (np. wymóg minimalnej, bezpiecznej odległości między jednostkami postępującymi kolejno po sobie). W związku z tym rozkład prawdopodobień-stwa tej zmiennej może być różny w zależności od akwenu i warunków panują-cych na nim. Znajomość tego rozkładu jest niezbędna w wielu modelach mate-matycznych ruchu statków na akwenach ograniczonych [2, 4, 6]. Do weryfikacji hipotezy o rozkładzie wykładniczym zmiennej losowej, którą jest czas pomiędzy zgłoszeniami kolejnych jednostek na torze wodnym Szczecin – Świnoujście, na linii raportowej Police, zastosowano test 2 Pearsona [1, 3, 5]. W roku 2002 na punkcie raportowym Police zarejestrowano 7374 zgłoszenia jednostek idących do lub ze Szczecina (na podstawie danych VTS z Urzędu Morskiego w Szczeci-nie). W niniejszym artykule badano sam proces zgłoszeń jednostek torowych, nie analizując strumieni ruchu statków w poszczególnych kierunkach. Analiza szeregu czasowego liczby zgłoszeń w poszczególnych okresach, wykazała istot-ne różnice w rozkładzie liczby zgłoszeń w zależności od miesiąca, dnia tygodnia a także od pory dnia [4, 8].

1. Model całoroczny

W całym roku 2002 zarejestrowano 7374 zgłoszenia, a co za tym idzie tyle samo wartości zmiennej losowej, które ułożono w szereg rozdzielczy o 86 kla-sach. Zastosowano tu wzór na ilość klas: kn, gdzie n oznacza liczność próbki [5]. W związku z tym, że wiele klas posiadało mniej niż 5 elementów, połączono je i ostatecznie otrzymano 36 klas. Histogram częstości występowania poszczególnych wartości zmiennej przedstawia rysunek 1.

W teście 2 Pearsona otrzymano następujące wyniki:

wartość sprawdzianu: Un = 169,22;

wartość krytyczna na poziomie ufności 0,95: Wk = 49,8.

Wartość sprawdzianu jest zdecydowanie większa od wartości krytycznej, więc należy odrzucić hipotezę o rozkładzie wykładniczym czasu oczekiwania na zgłoszenie kolejnej jednostki torowej. Średni czas oczekiwania wynosi 71,1 minut.

(3)

0 200 400 600 800 1000 1200 1400 li c z b a o b se rw a c ji 1 3 ,7 6 8 ,5 123 178 233 288 342 397 452 507 562 616 671

czas oczekiwania [min]

Rys. 1. Histogram częstości zmiennej losowej dla całego roku Fig. 1. Frequency histogram of the random variable for the whole year

Wyniki testu mogą wydawać się zaskakujące, gdyż słupki histogramu ukła-dają się bardzo wyraźnie w kształcie krzywej wykładniczej. Jednak przy analizie wyników obliczeń cząstkowych w teście 2 Pearsona widać, w których klasach jest największa różnica między częstościami teoretycznymi i faktycznymi. War-tość testu różni się od wartości krytycznej o prawie 120 jednostek, z tego 116 przypada na 3 ostatnie klasy, które łącznie tworzą przedział 534,16;

. Róż-nica wynika stąd, iż teoretycznie przy średniej 71,1 w powyższym przedziale powinno znajdować się najwyżej kilka wartości zmiennej losowej, a w rzeczy-wistości jest ich aż 22. Skąd taka częstość występowania zdarzeń teoretycznie mało prawdopodobnych? 17 spośród tych zdarzeń miało miejsce w dni teczne lub okołoświąteczne (bezpośrednio przed lub bezpośrednio po dniu świą-tecznym), co wskazuje na zróżnicowanie rozkładu zmiennej losowej w dniach roboczych i świątecznych.

2. Model z podziałem na dni robocze, świąteczne i okołoświąteczne

Szczegółowa analiza statystyczna [8] wykazała istotne różnice w rozkładzie liczby zgłoszeń w poszczególnych dniach tygodnia, okazało się, że w okolicach niedzieli jest najmniej zgłoszeń, a we wtorek, środę, czwartek i piątek jest ich zdecydowanie więcej. W związku z tym, hipotezę o typie rozkładu zmiennej lo-sowej zweryfikowano oddzielnie dla dni roboczych – wtorek, środę, czwartek i piątek, oddzielnie dla dni sąsiadujących z niedzielą – sobota, poniedziałek oraz oddzielnie dla dni świątecznych.

(4)

2.1. Dni robocze

W wymienione dni robocze zanotowano 4535 danych, które ułożono osta-tecznie w szereg rozdzielczy o 24 klasach. Histogram częstości występowania poszczególnych wartości zmiennej przedstawia rysunek 2.

0 200 400 600 800 1000 1200 li c z b a o b se rw a c ji 1 7 ,4 6 9 ,5 122 174 226 278 330 382 434 487 539

czas oczekiwania [min]

Rys. 2. Histogram częstości zmiennej losowej dla dni roboczych Fig. 2. Frequency histogram of the random variable for weekdays

W teście 2 Pearsona otrzymano następujące wyniki:

wartość statystyki testowej: Un = 26,36;

wartość krytyczna na poziomie ufności 0,95: Wk = 35,17.

Wartość statystyki testowej jest zdecydowanie mniejsza od wartości kry-tycznej, więc nie ma podstaw do odrzucenia hipotezy o rozkładzie wykładni-czym czasu oczekiwania na zgłoszenie kolejnej jednostki torowej. Średni czas oczekiwania wynosi 63,78 minut. Parametr rozkładu wykładniczego , czyli średnia intensywność zgłoszeń na minutę wynosi 0,0157.

2.2. Dni okołoświąteczne

W soboty i poniedziałki zanotowano 1926 danych, które ułożono w szereg rozdzielczy o 43 klasach. W związku z tym, że wiele klas posiadało mniej niż 5 elementów, połączono je i ostatecznie otrzymano 26 klas. Histogram częstości występowania poszczególnych wartości zmiennej prezentuje rysunek 3.

(5)

0 50 100 150 200 250 300 350 400 li c z b a o b se rw a c ji 1 5 ,8 7 8 ,8 142 205 268 331 394 457 520 583 647

czas oczekiwania [min]

Rys. 3. Histogram częstości zmiennej losowej dla dni okołoświątecznych Fig. 3. Frequency histogram of the random variable for “near-holidays”

W teście 2 Pearsona otrzymano następujące wyniki:

wartość sprawdzianu: Un = 35,89;

wartość krytyczna na poziomie ufności 0,95: Wk = 37,65.

Wartość sprawdzianu jest mniejsza od wartości krytycznej, więc nie ma podstaw do odrzucenia hipotezy o rozkładzie wykładniczym czasu oczekiwania na zgłoszenie kolejnej jednostki torowej. Średni czas oczekiwania wynosi 75,55 minut. Parametr rozkładu wykładniczego , czyli średnia intensywność zgłoszeń na minutę wynosi 0,0132.

2.3. Dni świąteczne

Dni świąteczne to w niniejszym opracowaniu niedziele i dni wolne od pra-cy, takie jak 1.01, 1.05, 3.05 itd. W niedziele zanotowano 815 wartości a w wymienione dni świąteczne 124, w sumie szereg rozdzielczy zawierał 939 danych, w 30 klasach. 0 50 100 150 200 250 300 lic z b a o b se rw a c ji 2 8 ,7 114 200 286 371 457 542 628 714 799

czas oczekiwania [min]

Rys. 4. Histogram częstości zmiennej losowej dla dni świątecznych Fig. 4. Frequency histogram of the random variable for holidays

(6)

W teście 2 Pearsona otrzymano następujące wyniki:

wartość statystyki testowej: Un = 44;

wartość krytyczna na poziomie ufności 0,95: Wk = 25.

Wartość statystyki testowej jest większa od wartości krytycznej, więc nale-ży odrzucić hipotezę o rozkładzie wykładniczym czasu oczekiwania na zgłosze-nie kolejnej jednostki torowej. Średni czas oczekiwania wynosi 98,6 minut.

3. Model z wyróżnionymi porami doby w dni robocze

Analiza danych w rozbiciu na poszczególne pory dnia roboczego (okresy dwugodzinne) również wykazała istotną zmienność liczby zgłoszeń [8].

Wyróżniono dwa okresy o zwiększonej intensywności ruchu (800 – 1000 i 1600 – 1800), dwa o średniej (1000 – 1600 i 1800 – 2400) oraz okres „nocny” o zmniejszonej intensywności ruchu (od godziny 000 do 800).

3.1. Okres nocny

W okresie nocnym (000 do 800) zanotowano 1081 danych, które ułożono ostatecznie w szereg rozdzielczy o 12 klasach (brano pod uwagę czas, który upłynął pomiędzy zgłoszeniami dwóch kolejnych jednostek, z których druga zgłosiła się już w badanym okresie). Histogram częstości występowania po-szczególnych wartości zmiennej przedstawia rysunek 5.

0 50 100 150 200 250 300 350 400 li c z b a o b se rw a c ji 3 6 ,4 109 182 255 327 400 473 546

czas oczekiwania [min]

Rys. 5. Histogram częstości zmiennej losowej dla okresu nocnego Fig. 5. Frequency histogram of the random variable for the night time

W teście 2 Pearsona otrzymano następujące wyniki:

wartość statystyki testowej: Un = 14,85;

(7)

Wartość statystyki testowej jest mniejsza od wartości krytycznej, więc nie ma podstaw do odrzucenia hipotezy o rozkładzie wykładniczym czasu oczeki-wania na zgłoszenie kolejnej jednostki torowej. Średni czas oczekioczeki-wania wynosi 86,33 minut. Parametr rozkładu wykładniczego , czyli średnia intensywność zgłoszeń na minutę wynosi 0,0116.

3.2. Okres poranny

W okresie od 800 do 1000 zanotowano 589 danych, które ułożono w szereg rozdzielczy o 11 klasach. Histogram częstości występowania poszczególnych wartości zmiennej przedstawia rysunek 6.

0 50 100 150 200 250 li c z b a o b se rw a c ji 2 4 ,8 7 4 ,1 124 173 222 272 321 370 420 469 519 568

czas oczekiwania [min]

Rys. 6. Histogram częstości zmiennej losowej dla okresu 800 – 1000

Fig. 6. Frequency histogram of the random variable for the 800 – 1000 am period W teście 2 Pearsona otrzymano następujące wyniki:

wartość statystyki testowej: Un = 30,92;

wartość krytyczna na poziomie ufności 0,95: Wk = 18,31.

Wartość statystyki testowej jest zdecydowanie większa od wartości kry-tycznej, więc należy odrzucić hipotezę o rozkładzie wykładniczym czasu ocze-kiwania na zgłoszenie kolejnej jednostki torowej. Średni czas oczeocze-kiwania wy-nosi 59,21 minut.

3.3. Okres południowy

W okresie od 1000 do 1600 zanotowano 1119 dane, które ułożono w szereg rozdzielczy o 22 klasach. Histogram częstości występowania poszczególnych wartości zmiennej prezentuje rysunek 7.

(8)

0 50 100 150 200 250 li c z b a o b ser w ac ji 1 3 ,2 5 2 ,8 9 2 ,4 132 172 211 251 290 330 370

czsa oczekiwania [min]

Rys. 7. Histogram częstości zmiennej losowej dla okresu 1000 – 1600

Fig. 7. Frequency histogram of the random variable for the 1000 am – 400 pm period W teście 2 Pearsona otrzymano następujące wyniki:

wartość statystyki testowej: Un = 25,57;

wartość krytyczna na poziomie ufności 0,95: Wk = 32,67.

Wartość statystyki testowej jest mniejsza od wartości krytycznej, więc nie ma podstaw do odrzucenia hipotezy o rozkładzie wykładniczym czasu oczeki-wania na zgłoszenie kolejnej jednostki torowej. Średni czas oczekioczeki-wania wynosi 59,52 minut. Parametr rozkładu wykładniczego , czyli średnia intensywność zgłoszeń na minutę wynosi 0,0168.

3.4. Okres popołudniowy

W okresie od 1600 do 1800 zanotowano 585 danych, które ułożono w szereg rozdzielczy o 12 klasach. Histogram częstości występowania poszczególnych wartości zmiennej przedstawia rysunek 8.

0 20 40 60 80 100 120 140 160 180 200 lic z b a o b se rw a c ji 1 8 ,8 5 6 ,4 9 4 ,1 132 169 207 245 282 320

czas oczekiwania [min]

Rys. 8. Histogram częstości zmiennej losowej dla okresu 1600 – 1800

(9)

W teście 2 Pearsona otrzymano następujące wyniki:

wartość statystyki testowej: Un = 22,52;

wartość krytyczna na poziomie ufności 0,95: Wk = 19,68.

Wartość statystyki testowej jest większa od wartości krytycznej, więc nale-ży odrzucić hipotezę o rozkładzie wykładniczym czasu oczekiwania na zgłosze-nie kolejnej jednostki torowej. Średni czas oczekiwania wynosi 47,34 minut.

3.5. Okres wieczorny

W okresie wieczornym (1800 – 2400) zanotowano 1161 danych, które ułożo-no w szereg rozdzielczy o 24 klasach. Histogram częstości występowania po-szczególnych wartości zmiennej przedstawia rysunek 9.

0 20 40 60 80 100 120 140 160 180 li cz b a o b se rw ac ji 0, 07 28 ,6 57 ,2 85 ,8 114 143 171 200 229 257 286

czas oczekiwania [min]

Rys. 9. Histogram częstości zmiennej losowej dla okresu 1800 – 2400

Fig. 9. Frequency histogram of the random variable for the 600 – 1200 pm period W teście 2 Pearsona otrzymano następujące wyniki:

wartość statystyki testowej: Un = 21,78;

wartość krytyczna na poziomie ufności 0,95: Wk = 35,17.

Wartość statystyki testowej jest zdecydowanie mniejsza od wartości kry-tycznej, więc nie ma podstaw do odrzucenia hipotezy o rozkładzie wykładni-czym czasu oczekiwania na zgłoszenie kolejnej jednostki torowej. Średni czas oczekiwania wynosi 57,51 minut. Parametr rozkładu wykładniczego , czyli średnia intensywność zgłoszeń na minutę wynosi 0,0174.

(10)

Podsumowanie

Weryfikacja hipotezy o rozkładzie wykładniczym zmiennej losowej, którą jest czas pomiędzy zgłoszeniami kolejnych jednostek na torze wodnym Szczecin – Świnoujście, w okolicach Polic, potwierdziła przypuszczenia, tylko w niektó-rych badanych okresach, że proces zgłoszeń jednostek torowych jest procesem Poissona. Nie ma podstaw do odrzucenia hipotezy o rozkładzie wykładniczym, gdy rozpatrujemy zgłoszenia globalnie w dni robocze (wtorek, środę, czwartek i piątek) lub w dni okołoświąteczne (sobota i poniedziałek). Natomiast dla dni świątecznych powyższą hipotezę należy zdecydowanie odrzucić.

W okresach zwiększonej intensywności ruchu statków, proces zgłoszeń nie jest procesem Poissona i do jego opisu trzeba zastosować empiryczne rozkłady prawdopodobieństwa. Związane jest to z tym, że system transportowy znajduje się lub zmierza do stanu nadkrytycznego [10], to znaczy, że przy zwiększonej intensywności ruchu zwiększa się wpływ wszelkich regulacji obowiązujących na danym akwenie, co zaburza losowy charakter procesu zgłoszeń.

Literatura

1. Aczel A.D., Statystyka w zarządzaniu, Wydawnictwo Naukowe PWN, War-szawa 2000.

2. Badania symulacyjne ruchu promów na przeprawie centralnej w

Świnouj-ściu w aspekcie jej optymalnej modernizacji, praca zbiorowa pod

kierun-kiem S. Gucmy (sprawozdanie z badań), nie publikowana, INM WSM, Szczecin 1997.

3. Gajek L., Kałuszka M., Wnioskowanie statystyczne, WNT Warszawa 1996. 4. Gucma L., Intensywność ruchu statków w porcie Szczecin i na torze

wod-nym Szczecin – Świnoujście, Zeszyty Naukowe nr 70, WSM Szczecin 2003.

5. Jóźwiak J., Podgórski J., Statystyka od podstaw, PWE Warszawa 1995. 6. Kasyk L., Probability model of a ferry crossing, Materiały z VIII

Międzyna-rodowej Konferencji Naukowo-Technicznej Inżynieria Ruchu Morskiego, WSM Szczecin 1999.

7. Kasyk L., Prawdopodobieństwo uniknięcia sytuacji kolizyjnej na

projekto-wanej przeprawie promowej Police – Święta, w różnych modelach probabi-listycznych, Materiały z X Międzynarodowej Konferencji

Naukowo-Technicznej Inżynieria Ruchu Morskiego, WSM Szczecin 2003.

8. Kasyk L., Statystyczna analiza liczby zgłoszeń statków na torze wodnym Szczecin – Świnoujście w roku 2002, Zeszyty Naukowe nr 2(74), AM

Szczecin 2004, s. 193 – 204.

9. Montgomery D.C., Runger G.C., Applied statistics and probability for

(11)

10. Piszczek W., Modele miar systemu inżynierii ruchu morskiego, Studia nr 14, WSM Szczecin 1990.

Wpłynęło do redakcji w lutym 2004 r.

Recenzenci

dr inż. kpt.ż.w. Zbigniew Burciu, prof. AM dr hab. inż. Roman Śmierzchalski, prof. AM

Adres Autora

dr Lech Kasyk

Akademia Morska w Szczecinie Zakład Matematyki

ul. Wały Chrobrego 1-2, 70-500 Szczecin tel. 48 09 370

Cytaty

Powiązane dokumenty

the evolution from the post-war substantial strengthening of labour’s negotiating power, which facilitated the advent of the Great Inflation in the 1970s, to the subsequent

This study aims to identify business risks companies present in their integrated reporting (IR), which are available on the websites of the International Integrated Reporting

Wraz z realizacją zasad jednolitego rynku proces integracji europejskiej wywiera znaczący wpływ na samorządy lokalne i regionalne, jak również na struk- turę i charakter

Celem opracowania jest próba przeniesienia rozumowania charakterystycznego dla teorii relacji złożonych proce- sów reakcji (Complex Responsive Processes – CRP) do wyjaśniania

Mówimy, że funkcja f postaci 3 jest separowalna w zbiorze A względem zespołu zmiennych x1, …, xn, jeżeli istnieją funkcje:.. Funkcje p1, …, pn nie są wyznaczone jednoznacznie

²SRPRFSU]HGVLĕELRUFRPZUR]ZRMXLRVLćJQLĕFLXZLĕNV]HMNRQNXUHQF\MQRŋFL SU]HGHZV]\VWNLPSRSU]H]ZVSLHUDQLHILUPUR]ZLMDMćF\FKZVSyãSUDFĕSRPLĕG]\

Istnieje szereg czynników, z powodu których przedsięhiorstwa sięgaj'l po modele oparte na wartości dla akcjonariuszy': - potrzeba efektywniejszego nadzoru: w sytuacjac h

W kalkulacji kosztów wytworzenia oraz kosztów jednostkowych pomocny jest rachunek kosztów w układzie kalkulacyjnym, z wyjątkiem tych kosztów, które są pochodnymi innych