ANALIZA ZMIENNEJ LOSOWEJ SKOKOWEJ NA PRZYKŁADZIE
LICZBOWYM
ANALYSIS OF RANDOM VARIABLE DISPLACEMENT WITH
A NUMERCIAL EXAMPLE
Katarzyna Brożek
STRESZCZENIE:
Prezentowany artykuł
stanowi swoistego rodzaju powtórzenie
i ugruntowanie wiedzy z pewnego wycinka statystyki opisowej, mianowicie dotyczy
zmiennej losowej skokowej. Wyznaczono dwa generalne cele pracy, pierwszym
była analiza rozkładu zmiennej losowej skokowej (wykorzystując
przy tym wybrany przykład liczbowy). Natomiast drugim celem opracowania
było zbadanie oraz interpretacja podstawowych parametrów na
podstawie uzyskanych wyników z obliczeń własnych.
Rozważania kierowane są szczególnie do studentów ekonomii
nie zaś statystyki, gdyż analiza nie jest wyczerpująca, a przy
tym zakres tematyczny jest zawężony.
Słowa
kluczowe: parametry,
statystyka opisowa, zmienne losowe skokowe
SUMMARY: The article is a kind of repetition and
consolidating the knowledge of a certain segment of descriptive statistics,
namely it concerns the random variable displacement. Two general objectives of
the work were set, the first was to analyze the distribution of the random
variable displacement (by taking advantage of the chosen numerical example).
While the second objective of the study was to investigate and interpret the
basic parameters on the basis of the results of own calculations. The
considerations are addressed especially to students of economics rather than
statistics, since the analysis is not exhaustive, and at the same thematic
scope is narrowed.
Key words: parameters, descriptive
statistics, random variables displacement
WPROWADZENIE
Prezentowany artykuł traktuje o zmiennych
losowych, niemniej jednak główna uwaga jest skupiona na zmiennych
losowych skokowych, zaś na temat zmiennych losowych ciągłych
tylko krótko wspomniano. Tak też w pierwszej części
opracowania zaprezentowano najważniejsze informacje o tych dwóch
rodzajach zmiennych, natomiast pozostałą część
rozważań poświęcono na omówienie rozkładu
zmiennej losowej skokowej oraz podstawowych jej parametrów. Wobec tego
obliczono dystrybuantę,
wartość przeciętną, wariancję i odchylenie
standardowe. Jednakże
w ostatniej części analizy zaprezentowano oraz zinterpretowano wyniki
dotyczące współczynnika zmienności, dominanty, mediany,
asymetrii oraz kwartyli.
ZMIENNE
LOSOWE SKOKOWE A ZMIENNE LOSOWE CIĄGŁE
Zmienne losowe charakteryzują się tym,
iż z góry nie można przewidzieć ich realizacji.
Wartości jakie przyjmują zależą od przypadku. Zmienna
losowa jest funkcją, ponieważ każdej jej możliwej
wartości przypisane jest w sposób jednoznaczny określone
prawdopodobieństwo jej realizacji. Zmienna
losowa skokowa (rys. 1) określana
jest na zbiorach skończonych lub przeliczalnych (najczęściej
jest to zbiór liczba naturalnych), charakteryzuje się tym, że
w danym obszarze jej realizacji może przyjąć tylko
niektóre wartości [Krysicki, Bartos i in., 1997, s. 50,55].
Punkt skokowy
* pomiędzy punktami skokowymi zmienna nie
przyjmuje wartości; nie realizuje się
Rysunek
1 Interpretacja graficzna - zmienna losowa skokowa (dyskretna)
Źródło: opracowanie
własne
Natomiast zmienna
losowa ciągła (rys. 2) jest określona na zbiorach
nieskończonych (najczęściej jest to zbiór liczb
rzeczywistych) i charakteryzuje się tym, że na danym obszarze jej
realizacji może przyjąć wszystkie możliwe wartości
[szerzej Koronacki, Mielniczuk, 2001].
Obszar realizacji*
* każda wartość może być
przyjęta
Rysunek
2 Interpretacja graficzna - zmienna losowa ciągła
Źródło: opracowanie
własne
Zmienna losowa skokowa definiowana jest poprzez
podanie rozkładu jej
prawdopodobieństwa - (tab. 1) oraz dystrybuantę. Prawdopodobieństwo P(x)
jest miarą zdarzenia losowego, a ponadto jest liczbą rzeczywistą
z przedziału <0,1> [Jakubowski, Sztencel, 2004, 59].
Tabela 1 Rozkład
prawdopodobieństwa zmiennej losowej skokowej
xi |
x1 |
x2 |
|
xk |
∑ |
p(xi) |
p(x1) |
p(x2) |
|
p(xk) |
1,0 |
Źródło:
opracowanie własne na podstawie [Piontek, s. 6]
gdzie:
xi możliwe realizacje
zmiennej
p(xi)
prawdopodobieństwo realizacji danej wartości zmiennej
Dystrybuanta
zmiennej losowej
skokowej jest definiowana jako
prawdopodobieństwo tego, że zmienna losowa przyjmuje
wartość nie większą niż argument tej dystrybuanty
[Makowiecki, 2016].
F
(x) = P (X < x) =
Własności
dystrybuanty [zob.
Ostasiewicz, Rusnak, Siedlecka, 1998]:
·
Jest ona
funkcją;
·
Zawsze przyjmuje
wartości F(xi) ≤ 1;
·
Jest
funkcją przynajmniej lewostronnie ciągłą;
·
F (∞) = 0; F (+∞) = 1;
F (∞) = P (X < ∞) = 0 zdarzenie
niemożliwe (więc prawdopodobieństwo równe 0);
F (+∞) = P (X < +∞) = 1 zdarzenie
pewne.
Wartość oczekiwana, przeciętna - (nadzieja
matematyczna) jest sumą
iloczynów wartości zmiennej i ich prawdopodobieństw [Patan, s.
7].
Wariancja informuje o tym jak duże jest
zróżnicowanie wyników w danym zbiorze.
W uproszczeniu można przyjąć, iż odchylenie standardowe
jest pierwiastkiem z wariancji.
Dominanta jest to ta wartość zmiennej,
która realizuje się z największym prawdopodobieństwem:
Max
p(xi) D = xi
Mediana jest
wartością środkową bądź kwartylem drugim
[Tarasiuk, 2013, s.13].
Współczynnik zmienności określa
stopień zróżnicowania.
Asymetria
rozkładu zmiennej
skokowej może być:
a)
lewa A < 0,
gdy bardziej prawdopodobne są te wartości zmiennej, które
są większe od jej wartości oczekiwanej, E(x) < D;
b)
prawa A > 0,
gdy bardziej prawdopodobne są te wartości zmiennej, które
są mniejsze od wartości oczekiwanej, E(x) > D;
c) symetria / rozkład symetryczny A = 0,
E(x) = D.
Poniżej umieszczono treść
przykładowego zadania poddanego analizie.
W przedsiębiorstwie handlowym X wylosowano 1000
pracowników, zatrudnionych w dziale sprzedaży. Kierownictwo w
ciągu roku kontrolowało liczbę ich nieobecności. Wyniki
przeprowadzonej analizy zawiera tabela nr 2. Zakładając, że
liczba nieobecności jest zmienną losową, podano jej
rozkład, dystrybuantę oraz obliczono wybrane parametry.
Tabela 2 Rozkład zmiennej losowej
skokowej oraz wybranych parametrów
liczba nieobecności xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
|
liczba pracowników |
248 |
202 |
165 |
137 |
96 |
74 |
42 |
19 |
11 |
5 |
1 |
∑ 1000 |
|
P (xi) rozkład prawdopod. |
0,248 |
0,202 |
0,165 |
0,137 |
0,096 |
0,074 |
0,042 |
0,019 |
0,011 |
0,005 |
0,001 |
∑ 1 |
|
F (x) dystrybuanta |
0 |
0,248 |
0,45 |
0,615 |
0,752 |
0,848 |
0,922 |
0,964 |
0,983 |
0,994 |
0,999 |
|
|
wartość przeciętna xi*p(xi) |
0 |
0,202 |
0,33 |
0,411 |
0,384 |
0,37 |
0,252 |
0,133 |
0,088 |
0,045 |
0,01 |
m= 2,225 |
|
(xi-m)2 |
4,95 |
1,5 |
0,05 |
0,6 |
3,15 |
7,7 |
14,25 |
22,8 |
33,35 |
45,9 |
60,45 |
|
|
(xi-m)2*pi |
1,228 |
0,303 |
0,008 |
0,082 |
0,302 |
0,570 |
0,599 |
0,433 |
0,367 |
0,230 |
0,060 |
∑= 4,182 |
|
Źródło:
Obliczenia własne
ANALIZA PARAMETRÓW ZMIENNEJ LOSOWEJ
SKOKOWEJ
1. WARTOŚĆ
OCZEKIWANA, przeciętna
(nadzieja matematyczna)
2,225
4,950625
2. WARIANCJA I ODCHYLENIE STANDARDOWE
∑ = 4,182
Odchylenie standardowe
√4,182 2,045
3. WSPÓŁCZYNNIK
ZMIENNOŚCI
0,9191 92% tyle wynosi
stopień zróżnicowania
4. DOMINANTA
D = M0 = 0 największe
prawdopodobieństwo wystąpienia
5. MEDIANA
Me = M = 2 Me = P = (x ≤
1/2) Me = P = (x ≥ 1/2)
6. ASYMETRIA
1,088
A > 0 asymetria prawa: bardziej prawdopodobne są te wartości zmiennej, które
są mniejsze od
wartości oczekiwanej.
7. KWARTYLE
kwartyl pierwszy Q1 = 1 P (X ≤ Q1)
≥ 1/4 i P (X ≥ Q1) ≥3/4
kwartyl drugi mediana Q2 = 2 P (X ≤ Q2) ≥ 1/2 i
P (X ≥ Q2) ≥1/2
kwartyl trzeci Q3 = 3 P (X ≤ Q3)
≥ 3/4 i P (X ≥ Q3) ≥1/4
Na koniec analizy
postanowiono wymienić własności zmiennej losowej skokowej:
·
P (a ≤ X
< b) = F(b) F(a)
·
P (a < X ≤ b) = F(b) F(a) + P (X = b)
·
P (X < a) = F(a)
·
P (X ≤ a) = F(a) +P (X
= a)
·
P (X ≥ a) = 1 P (X <
a) = 1 F(a)
·
P (X > a) = 1 P (X ≤ a) = 1
F(a) +P (X = a)
WYNIKI PŁYNĄCE Z PRZEPROWADZONEJ
ANALIZY:
·
wartość
przeciętna wynosi 2,225;
·
wariancja stanowi 4,182;
zaś odchylenie standardowe 2,045;
·
współczynnik
zmienności to 92%;
·
dominanta wynosi 0,
natomiast mediana 2;
·
współczynnik
asymetrii 1,088.
BIBLIOGRAFIA
[1] JAKUBOWSKI J., SZTENCEL R., Wstęp do teorii prawdopodobieństwa,
SCRIPT, Warszawa 2004
[2] KORONACKI J., MIELNICZUK J., Statystyka dla studentów
kierunków technicznych
i przyrodniczych, Wydawnictwo Naukowo-Techniczne, Warszawa 2001
[3] KRYSICKI W., BARTOS J., DYCZKA W.,
KRÓLIKOWSKA K., WASILEWSKA M., Rachunek
prawdopodobieństwa i statystyka matematyczna w zadaniach, Wydawnictwo
Naukowe PWN, Warszawa 1997
[4] MAKOWIECKI M., Statystyka matematyczna. Wprowadzenie do rozkładów
zmiennych losowych, artykuł dostępny na stronie internetowej
https://pl.m.wikibooks.org, [dostęp 10.01.2016]
[5] OSTASIEWICZ S., RUSNAK Z., SIEDLECKA U., Statystyka elementy teorii
i zadania, Wydawnictwo Akademii Ekonomicznej im. Oskara Langego, Wrocław
1998
[6] PATAN M., Zmienne losowe dyskretne, Instytut Sterowania i Systemów
Informatycznych, Uniwersytet Zielonogórski, Zielona Góra
[7] PIONTEK K., Zmienne losowe. Rozkłady ciągłe. Rozkłady dyskretne.
Studium podyplomowe Analityk Finansowy, Uniwersytet Ekonomiczny we
Wrocławiu, Wrocław
[8] TARASIUK J., Statystyka Inżynierska. Dyskretne i ciągłe rozkłady
jednowymiarowe, AGH, WFiIS, Kraków 2013
Katarzyna Brożek, doktorantka
Wydziału Ekonomicznego
Uniwersytet Technologiczno-Humanistyczny im. K.
Pułaskiego w Radomiu
adres: Polska, Radom, ul. Chrobrego 42/10
tel. kom.: 504 174 290
e-mail: kania6669@wp.pl