Professional Documents
Culture Documents
STATISTIKA SKRIPTA
(INŽENJERSKA
STATISTIKA)
0
1
2
SADRŽAJ
VJEROVATNOĆA I STATISTIKA ............................................................................................................. 4
1. Analiza podataka. Teorija Vjerovatnoće........................................................................................... 3
1.1 Prikazivanje podataka. Prosječna Vrijednost. Rasipanje .......................................................... 3
1.1.1 Grafičko predstavljanje podataka .................................................................................... 4
1.1.2 Srednja vrijednost. Standardna devijacija. Varijansa. Empirijsko pravilo ........................ 5
1.2 Eksperimenti, ishodi, događaji ................................................................................................. 7
1.2.1 Unije, Presjeci, Komplementi događaja ........................................................................... 7
1.3 Vjerovatnoća ............................................................................................................................ 9
1.3.1 Osnovne teoreme vjerovatnoće ..................................................................................... 11
1.3.2 Uvjetna vjerovatnoća. Neovisni događaji....................................................................... 12
1.4 Permutacije i kombinacije ...................................................................................................... 14
1.4.1 Permutacije .................................................................................................................... 14
1.4.2 Kombinacije .................................................................................................................... 16
1.4.3 Faktorijelna funkcija ....................................................................................................... 17
1.4.4 Binomni koeficijent......................................................................................................... 17
1.5 Slučajne varijable. Raspodjele vjerovatnoće .......................................................................... 18
1.5.1 Diskretne slučajne varijable i raspodjele ........................................................................ 19
1.5.2 Kontinuirane slučajne varijable i raspodjele .................................................................. 21
1.6 Srednja vrijednost i varijansa raspodjele ............................................................................... 23
1.6.1 Transformacija srednje vrijednosti i varijanse................................................................ 24
1.6.2 Očekivanje, momenti ..................................................................................................... 25
1.7 Binomna, Poissonova, a Hipergeometrijska raspodjela ......................................................... 26
1.7.1 Binomna raspodjela........................................................................................................ 26
1.7.2 Poissonova raspodjela .................................................................................................... 28
1.7.3 Uzorkovanje sa zamjenom ............................................................................................. 29
1.7.4 Uzorkovanje bez zamjene. Hipergeometrijska raspodjela ............................................. 30
1.8 Normalna raspodjela .............................................................................................................. 31
1.8.1 Funkcija raspodjele F(x) .................................................................................................. 32
1.8.2 Numeričke vrijednosti .................................................................................................... 33
1.8.3 Upotreba tabela za normalnu raspodjelu D3 i D4 u Dodatku 1 ..................................... 34
1.8.4 Normalna aproksimacija binomne raspodjele ............................................................... 35
1.9 Raspodjela nekoliko slučajnih varijabli ................................................................................... 36
1.9.1 Diskretne dvodimenzionalne raspodjele ........................................................................ 37
1.9.2 Kontinuirane dvodimenzionalne raspodjele .................................................................. 37
1.9.3 Marginalne raspodjele diskretne raspodjele.................................................................. 38
1.9.4 Marginalne raspodjele kontinuirane raspodjele ............................................................ 40
1.9.5 Neovisnost slučajnih varijabli ......................................................................................... 40
3
1.9.6 Funkcije slučajnih varijabli .............................................................................................. 41
1.9.7 Dodavanje srednjih vrijednosti....................................................................................... 41
1.9.8 Dodavanje varijansi ........................................................................................................ 42
2. Matematska Statistika .................................................................................................................... 45
2.1 Uvod. Slučajno uzorkovanje ................................................................................................... 46
2.2 Tačka procjene parametara.................................................................................................... 47
2.2.1 Metoda maksimalne vjerovatnoće ................................................................................. 48
2.3 Interval povjerenja ................................................................................................................. 49
2.3.1 Interval povjerenja za normalne raspodjele sa poznatim 2 ...................................... 50
2.3.2 Interval povjerenja za normalne raspodjele sa nepoznatim 2.................................. 52
2.3.3 Interval povjerenja za varijansu 2 normalne raspodjele .............................................. 55
2.3.4 Interval povjerenja za parametre drugih raspodjela ...................................................... 57
2.4 Testiranje hipoteza. Odluke ................................................................................................... 57
2.4.1 Jednostrane i dvostrane alternative (Slika 2.5) .............................................................. 59
2.4.2 Greške u testovima......................................................................................................... 60
2.4.3 Test za normalne raspodjele s poznatom 2 .............................................................. 62
2.4.4 Test za kad je 2 nepoznato i za 2 ............................................................................ 64
2.4.5 Upoređivanje srednje vrijednosti i varijanse .................................................................. 65
2.5 Kontrola kvaliteta ................................................................................................................... 68
2.5.1 Kontrolni dijagram za srednju vrijednost ....................................................................... 68
2.5.2 Kontrolni dijagram za varijansu ...................................................................................... 69
2.5.3 Kontrolni dijagram za standardnu devijaciju .................................................................. 70
2.5.4 Kontrolni dijagram za raspon ......................................................................................... 70
2.6 Uzorkovanje prihvatanja ........................................................................................................ 71
2.6.1 Greške pri uzorkovanju................................................................................................... 72
2.6.2 Ispravljanje ..................................................................................................................... 73
2.7 Ocjena uklapanja 2 test......................................................................................................... 74
2.8 Neparametarski testovi .......................................................................................................... 77
2.9 Regresija. Uklapanje pravca. Korelacija.................................................................................. 79
2.9.1 Regresiona analiza .......................................................................................................... 79
2.9.2 Intervali povjerenja u regresionoj analizi ....................................................................... 83
2.9.3 Korelaciona analiza ......................................................................................................... 84
2.9.4 Testiranje koeficijenta korelacije ................................................................................ 86
DODATAK 1 ..................................................................................................................................... 89
4
VJEROVATNOĆA I STATISTIKA
Teorija vjerovatnoće (Poglavlje 1) obezbjeđuje modele raspodjela vjerovatnoće (teorijski modeli uočljivih
događaja koji uključuju slučajnost) koji se ispituju statističkim metodama kojima također daje
matematske osnove (Poglavlje 2).
Ovome se može dodati dugi popis područja primjene, na primjer, u poljoprivredi, biologiji, računarstvu,
demografiji, ekonomiji, geografiji, upravljanju prirodnim resursima, medicini, meteorologiji, politici,
psihologiji, sociologiji, kontroli saobraćaja, urbanističkom planiranju itd. Iako su te primjene vrlo
heterogene, vidjet ćemo da je većina statističkih metoda univerzalna u smislu da se svaka od njih može
primijeniti u različitim područjima primjene.
1
2
1. Analiza podataka. Teorija Vjerovatnoće
Prvo ćemo pokazati kako se raspolaže sa podacima numerički ili u smislu grafikona i kako iz njih izvući
potrebne informacije (prosječne vrijednosti, rasipanje podataka itd.). Ako na podatke utječe
"slučajnost", faktorima čiji učinak ne možemo tačno predvidjeti (npr. metereološki podaci, cijene
dionica, životni vijek guma itd.), moramo se osloniti na teoriju vjerovatnoće. Ova je teorija nastala u
igrama na sreću, kao što su bacanje kovanice, bacanje kockica ili kartanje. Danas ona daje matematske
modele slučajnim procesima nazvanim slučajni eksperimenti ili, ukratko, eksperimenti. U takvom
eksperimentu promatramo slučajnu promjenjivu X, to jest funkciju čije se vrijednosti u pojedinačnom
eksperimentu - opitu (provođenje eksperimenta) pojavljuju "slučajno" (Dio. 1.3) prema raspodjeli
vjerovatnoće koja daje pojedinačne vjerovatnoće pomoću kojih se, dugoročno, događanje moguće
vrijednosti X može predvidjeti. Na primjer, svako od šest lica kockice može se pojaviti s istom
vjerovatnoćom, 1/6. Također, moguće je istovremeno posmatrati više od jedne slučajne varijable, na
primjer, visinu i težinu osoba ili pritisnu i zateznu čvrstoću čelika. O ovome će se raspravljati u Dijelu 1.9,
u kojem će se dati osnove za matematsko dokazivanje statističkih metoda u Poglavlju 2.
Podaci se mogu prikazati numerički ili grafički na različite načine. Na primjer, dnevni list može sadržavati
tablice cijena dionica i tečaja valuta, krivulja ili bar grafikona koji ilustriraju ekonomske ili političke
događaje, ili pita-grafikone koji pokazuju kako se troši porez koji plaćaju građani. Tu su i brojni drugi
prikazi podataka za posebne namjene.
U ovom dijelu raspravljat će se o upotrebi standardnih prikaza podataka u statistici (za to su dostupni
programski paketi, kao što su Excel, Data Desk, Mathcad, Maple ili Mathematica), a objasnit će se i
odgovarajući pojmovi i metode putem tipičnih primjera.
Vrijednosti opita (uočavanja i mjerenja) trebaju se zabilježiti u redoslijedu u kojem se pojavljuju. Kao
prvi korak ispitivanja svojstava eksperimentiranja i grafičkog prikazivanja ispitanih uzoraka vrši se
njihovo sortiranje, tj. redanje vrijednosti uzorka po veličini. Sortiranje je standardni proces na računaru.
Super legure su zajedničko ime za legure koje se koriste pri izradi mlaznih i motora raketa, koje
zahtijevaju visoku otpornost na temperaturu (tipično 1000C), visoku čvrstoću i izvrsnu otpornost na
oksidaciju. Trideset ispitanih uzoraka čelične legure na bazi nikla imali su zatezne čvrstoće (mjerenu u
MPa) koje su zabilježene u dobijenom redoslijedu ispitivanja i zaokružene na cijele vrijednosti,
625 531 610 627 607 651 678 545 597 579 588 568 607 614 538
(1)
621 627 563 623 572 574 634 600 621 593 614 561 603 579 614
531 538 545 561 563 568 572 574 579 579 588 593 597 600 603
(2)
607 607 610 614 614 614 621 621 623 625 627 627 634 651 678
3
1.1.1 Grafičko predstavljanje podataka
Sada ćemo predstaviti standardno grafičko prikazivanje koje se koriste u statistici za dobijanje
informacija o svojstvima podataka.
Za velike skupove podataka, najbolji način prikazivanja raspodjele podataka je pomoću histograma.
Princip je objašnjen na Slici 1.1. (Primjena na veći skup podataka prikazana je u poglavlju 2.7). Osnove
pravougaonika na Slici 1.1 su x-intervali (poznati kao intervali klasa) 530-560, 560-590, 590-620, 620-
650, 650-680, čiji su srednje tačke (poznate kao oznake klasa) x = 545, 575, 605, 635, 665.
Visina pravougaonika s oznakom klase x je ili apsolutna frekvencija fabs(x) (broj podatka u pojedinom
intervalu klase) ili relativna frekvencija klase frel(x) definirana kao broj podataka u toj klasi, podijeljen sa
ukupnim brojem podataka n = 30 u našem slučaju. Zbog toga su površine pravougaonika proporcionalne
ili apsolutnim frekvencijama 3, 8, 10, 7, 2 ili relativnim frekvencijama, 0,10, 0,27, 0,33, 0,23, 0,07, tako
da histogrami daju dobru predstavu o raspodjeli podataka.
Visina pravougaonika histograma na desnoj strani Slike 1.1 (histogram apsolutne i relativne
kumulativne frekvencije Fabs(x) i Frel(x)) proporcionalna je zbiru apsolutnih ili relativnih frekvencija do
razmatranog intervala klase. Prema tome svi intervali klasa u Primjeru 1 imaju sljedeće apsolutne
kumulativne frekvencije 3, 3 + 8 = 11, 11 + 10 = 21, 21 + 7 = 28, 28 + 2 = 30 i relativne kumulativne
frekvencije (0,1), (0,1 + 0,27 = 0,37), (0,37 + 0,33 = 0,7), (0,7 + 0,23 = 0,93) i (0,93 + 0,07 = 1). Ovo, npr.,
znači da samo 0,37 ∙ 100 = 37% uzoraka ima vrijednost manju od 590 MPa, što daje apsolutnu
kumulativnu frekvenciju od 3 + 8 = 11 uzoraka. Sličan se zaključak može izvući i za ostale vrijednosti
uzoraka u Primjeru 1.
Prosječna vrijednost se mjeri medijanom qM ili srednjim kvartilom. Ako je broj članova n skupa neparan
onda je medijan qM vrijednost srednjeg člana sortiranog skupa. Međutim, ako je broj članova n paran
4
broj onda je qM prosječna vrijednost dva srednja člana sortiranog skupa. U Primjeru 1, skup podataka (2)
gdje je n = 30, qM = 1/2∙(x15 + x16) = 1/2∙(603 + 607) = 605.
Rasipanje podataka može se mjeriti rasponom maksimalne i minimalne vrijednosti R = xmax - xmin. U
Primjeru 1, Tabela (2) R = xmax - xmin = 678 – 531 = 147
Bolje informacije o rasipanju podataka daje raspon kvartila IQR = qU – qL. Gdje je qU vrijednost srednjeg
člana (ili srednja vrijednost dva srednja člana) članova iznad medijana, a vrijednost qL je vrijednost
srednjeg člana (ili srednja vrijednost dva srednja člana) članova ispod medijana. U Primjeru 1, Tabela (2)
qU = x23 621 i qL = x8 = 574 te je IQR = 47.
Pravougaonik na Slici 1.1b se prostire vertikalno od qL do qU vrijednosti a njegova visina je IQR = 47.
Vertikalne linije iznad i ispod pravougaonika prostiru se do xmax = 678 i xmin = 531što daje R = 147.
Linija iznad pravougaonika je preduga. Ovo upućuje na mogućnost postojanja netipične vrijednosti, tj.
vrijednost koja je viša od 1,5 puta IQR od bilo kojeg kraja pravougaonika, gdje je 1,5 čisto
konvencionalna vrijednost. Netipična vrijednost ukazuje na mogućnost greške kod prikupljanja
podataka. U (2) imamo da je 621 + 1,5∙IQR = 691,5 > 678 pa nemamo netipičnih vrijednosti.
Medijani i kvartili lako se dobijaju sortiranjem i brojanjem, praktično bez ikakvog proračuna. Međutim,
oni ne daju pune informacije o podacima: u određenoj se mjeri vrijednosti podataka mogu promijeniti
bez promjene medijana. Slično je i sa kvartilima.
1 n 1
x
n j 1
x j x1 x2 ... xn
n
(3)
5
Ovo je aritmetička sredina vrijednosti podataka, dobijena njihovim zbirom podijeljenim brojem
podataka n. Stoga je u Primjeru 1,
1 17964
x 531 538 ... 678 598,8
30 30
Slično tome, rasipanje (varijabilnost) podataka može se mjeriti standardnom devijacijom s, ili njenim
kvadratom, varijansom.
1 n
xj x
1
x1 x ... xn x
2 2 2
s2 (4)
n 1 j 1 n 1
Dakle, kako bi se dobila varijansa podataka, treba sračunati sumu kvadrata razlike svakog podatka od
srednje vrijednosti (xj – x̄ )2, i na kraju tu sumu podijeliti sa n – 1 (a ne sa n, kao što stoji u Dijelu 2.2). Da
bi se dobila standardna devijacija s, treba sračunati kvadratni korijen od varijanse s2.
Na osnovu (4) varijansa u Primjeru 1 je
1 17964
2 2
17964
1 n
j
2
s2 x x 531 ... 678 1112
n 1 j 1 29 30 30
Stoga je standardna devijacija s = √1112 = 33,3. Napominjemo da standardna devijacija ima istu jedinicu
mjere kao i vrijednosti podataka (u Primjeru 1 to je MPa). S druge strane, varijansa se više koristi od
standardne devijacije u razvoju statističkih metoda, što će biti pokazano u Poglavlju 2.
PAŽNJA! Kompjuterska aplikacija može koristiti 1/n umjesto 1/(n – 1) u (4), međutim posljednji izraz je
bolji kad je n malo (vidi Dio 2.2).
Srednja vrijednost i standardna devijacija, uvedeni radi davanja prosječne vrijednosti i rasipanja
podataka od prosječne vrijednosti, zapravo daju mnogo više informacija shodno sljedećem pravilu.
Empirijsko pravilo. Za svaku približno simetričnu raspodjelu podataka oblika humke/zvona, intervali
x̄ ± s, x̄ ± 2s i x̄ ± 3s sadrže 68%, 95% i 99,7% od ukupnog broja podataka.
Iz Primjera (1) sa x̄ = 598,8 i s = 33,3 intervali iz empirijskog pravila 565,4 x 632,1, 532,1 x 665,5 i
498,7 x 698,8 sadrže 73% (22 podatka, 5 podbačaja i 3 prebačaja), 93% (28 podataka, 1 podbačaj i 1
prebačaja) i 100% od ukupnog broja vrijednosti.
Konačno, relativni položaj vrijednosti x u skupu čija je srednja vrijednost x̄ i standardna devijacija s može
se mjeriti k-vrijednošću
xx
k x x x k xs
s
Na primjer, k(568) = – 0,92 i ovo je negativan broj jer se 586 nalazi ispod srednje vrijednosti.
6
1.2 Eksperimenti, ishodi, događaji
Cilj teorije vjerovatnoće je osigurati matematske modele za situacije koje su pogođene ili se čak
rukovode "slučajnošću", na primjer, u vremenskim prognozama, životnom osiguranju, kvaliteti tehničkih
proizvoda (računara, baterija, čeličnih limova itd.), i, naravno, igara na sreću s kartama ili kockicama. A
tačnost tih modela može se provjeriti odgovarajućim opažanjima ili eksperimentima - to je glavna svrha
statistike o kojoj će biti riječi u Poglavlju. 2.
Na ovom mjestu definirat će se neki standardni pojmovi. Eksperiment je proces mjerenja ili opažanja, u
laboratoriju, u fabrici, na ulici, u prirodi ili bilo gdje drugo. Stoga se pojam "eksperiment" koristi u
prilično općenitom smislu. Nas zanimaju eksperimenti koji uključuju slučajnost, tj. oni eksperimenti kod
kojih ne možemo tačno predvidjeti rezultat. Ispitivanje/pokušaj je provođenje pojedinačnog
eksperimenta. Rezultat je ishod ispitivanja/pokušaja, a n ispitivanja tada daje n rezultata. Prostor/skup
svih mogućih ishoda eksperimenta naziva se prostor/skup ishoda S.
(5) Brojanje dnevnih saobraćajnih nesreća u Mostaru. S je cijeli broj u nekom intervalu.
PRIMJER 7: Događaji
U (2) događaji su A = {1, 3, 5} (neparni brojevi), B = {2, 4, 6} (parni brojevi), C = {5, 6} itd. Jednostavni
događaji su {1}, {2}, {3}, , {6}.
Ako se pri ispitivanju dogodi ishod a i a A (a je element A), kažemo da se A dogodilo. Na primjer, ako
pri bacanju kockice ispadne 3, događaj A se desio (jer je 3 neparan broj). Slično tome, ako se dogodi C u
Primjeru 7 (što znači da se pojavilo ili 5 ili 6), onda se dogodilo i, recimo, D = {4, 5, 6}. Također treba
imati na umu da se S događa pri svakom ispitivanju, što znači da se neki događaj iz S uvijek događa.
Kako bi se uspostavili osnovni zakoni vjerovatnoće trebat će se definirati sljedeći pojmovi i činjenice o
događajima (podskupovima) određenog skupa S.
7
Ako A i B nemaju zajedničkih tačaka, pišemo AB =
Gdje je prazan skup (skup bez elemenata), a A i B nazivamo međusobno isključujućim događajima
pošto pri ispitivanju događanje A isključuje događanje B (i obrnuto). Ako pri bacanju kockice ispadne
neparan broj u istom pokušaju ne može ispasti paran broj. Istovjetno kovanica u istom pokušaju ne
može ispasti i pismo i glava.
Unija
A
j 1
j A1 A2 ... Am
događaja A1, , Am sastoji se od svih tačaka koje su najmanje u jednom Aj. Slično je i sa unijom A1A2
beskonačno mnogo podskupova A1, A2, u beskonačnom skupu S tj., onom koji sadrži beskonačno
mnogo tačaka (jednostavnih događaja).
Presjek
A
j 1
j A1 A2 ... Am
Rad s događajima može se ilustrirati i olakšati Vennovim dijagramima za prikazivanje unija, presjeka i
komplemenata, čiji su tipični primjeri prikazani na Slikama 1.2 i 1.3.
Slika 1.2 Vennovi dijagrami dva događaja A i B u skupu S, njihova unija (obojena) i presjek (obojeno)
Pri bacanju kockice razmotri događaje: A: broj veći od 3, B: broj manji od 6 i C: paran broj
Iz ovoga slijedi da je: AB = {4, 5}, BC = {2, 4}, CA = {4, 6}, ABC = {4}. Nacrtaj Vennove dijagrame
za ove slučajeve! Dalje, zašto je AB = S i ABC = S?
8
Slika 1.3 Vennov dijagram za eksperiment bacanja kockica koji prikazuje skup S, te događaje
A = {4, 5, 6}, C = {2, 4, 6}, AC = {2, 4, 5, 6}, AC = {4, 6}
1.3 Vjerovatnoća
Ako se S prostor eksperimenta sastoji od konačnog broja rezultata (tačaka) koji su jednako vjerovatni,
onda je vjerovatnoća P(A) događaja A
broj tačaka u A
P A (1)
broj tačaka u S
P S 1 (2)
Prilikom jednog bacanja kockice, koja je vjerovatnoća P(A) da će se dobiti brojevi 5 ili 6? I da će se desiti
događaj B = neparan broj?
Rješenje: Šest je ishoda jednako vjerovatno, a svaki ima vjerovatnoću 1/6. P(A) = 2/6 = 1/3 jer
A = 5, 6 ima dvije tačke, a P(B) = 3/6 = 1/2.
Definicija 1 vodi računa o većini igara na sreću kao i nekim praktičnim primjenama, kao što ćemo kasnije
vidjeti, ali svakako ne o svim eksperimentima, jer u mnogim problemima nemamo konačno mnogo
jednako vjerovatnih ishoda. Da bismo došli do općenitije definicije vjerovatnoće, vjerovatnoću
smatramo istovjetnom relativnoj frekvenciji. Ovdje se treba podsjetiti da je u Djelu 1.1 rečeno da je
apsolutna frekvencija f(A) događaja A broj koliko se puta događaj A dešava u n pokušaja, a da je
relativna frekvencija od A, u tim pokušajima jednaka f(A)/n, te je
9
f A broj dešavanja u A
Prel A (3)
n ukupan broj pokušaja
Ako se A nije dogodilo, onda je f(A) = 0. Ako se A događa u svim pokušajima onda je f(A) = n. Ovo su
ekstremni slučajevi. Dijeljenje sa n daje
0 frel A 1 (4*)
Konkretno, za A = S imamo da je f(S) = n jer se S uvijek javlja (što znači da se neki događaj uvijek javlja,
vidi Dio. 1.2, nakon primjera 7). Dijeljenje sa n daje
frel S 1 (5*)
Konačno, ako se A i B međusobno isključuju, oni se ne mogu dogoditi zajedno. Dakle, apsolutna
frekvencija njihove unije AB mora biti jednaka zbiru apsolutnih frekvencija A i B. Dijeljenje sa n daje isti
odnos za relativne frekvencije,
S obzirom na skup S, svaki događaj A od S (podskup od S) povezan je s brojem P(A) koji se naziva
vjerovatnoća od A, tako da su zadovoljeni sljedeći aksiomi vjerovatnoće.
1. Za svaki A u S,
0 P A 1 (4)
P S 1 (5)
P A B P A P B , AB (6)
Ako je skup S beskonačan (ima beskonačno mnogo tačaka), Aksiom 3 mora biti zamijenjen sa 3'. Za
međusobno isključujuće događaje A1, A2, ,
10
1.3.1 Osnovne teoreme vjerovatnoće
Kasnije ćemo vidjeti da aksiomi vjerovatnoće omogućavaju izgradnju teorije vjerovatnoće i njenu
primjenu u statistici. Na samom početku krenut ćemo od ove tri osnovne teoreme. Prva od njih je
korisna ako se vjerovatnoća komplementa Ac može dobiti lakše od vjerovatnoće P(A).
P Ac 1 P A (7)
DOKAZ: Definiranjem komplementa (Dio 1.2) imamo AAc = S i AAc = . Stoga Aksiomi 2 i 3,
1 P S P A P Ac
te je: P Ac 1 P A
Pet kovanica bacaju se istodobno. Pronađite vjerovatnoću događaja A: pojavljuje se barem jedna glava.
Pretpostavimo da su kovanice fer.
Rješenje: Budući da svaka kovanica može ispasti glave ili pismo, uzorak se sastoji od 25 = 32 ishoda.
Budući da su kovanice fer, možemo dodijeliti istu vjerovatnoću (1/32) svakom ishodu. Tada se događaj
Ac (pet bacanja bez pojavljivanja glave) sastoji od samo jednog ishoda. Odatle je P(Ac) = 1/32 pa odgovor
glasi P(A) = 1 – P(Ac) = 1 – 1/32 = 31/32.
Sljedeća teorema je jednostavno proširenje Aksioma 3, koje možemo lako dokazati indukcijom.
Ako su vjerovatnoće, da će u bilo kojem radnom danu radionica primiti 10-20, 21-30, 31-40, više od 40
automobila, 0,20, 0,35, 0,25, 0,12, kolika je vjerovatnoća da će zadanog radnog dan radionica primiti
najmanje 21 automobil?
Rješenje: Budući da su to međusobno isključujući događaji, Teorema 2 daje odgovor 0,35 + 0,25 + 0,12 =
0,72. Provjerite ovo pomoću pravila komplementarnosti.
U mnogim slučajevima događaji neće biti međusobno isključujući. U tom slučaju imamo
Za događaje A i B u skupu S,
P A B P A P B P A B (9)
11
DOKAZ: Događaji C, D, E na Slici 1.4 čine AB i međusobno su isključujući. Dakle, Teorema 2 daje,
P A B P C P D P E
Ovo daje (9) jer je s desne strane jednačine, prema Aksiomu 3 i prema bivanju međusobno isključujućim
događajima P(C) + P(D) = P(A); i također prema Aksioma 3 i bivanju međusobno isključujućim
događajima P(E) = P(B) – P(D) = P(B) – P(AB).
P 0 (10)
Kod bacanja kockice, koja je vjerovatnoća dobijanja neparnog broja ili broja manjeg od 4?
Rješenje: Neka događaj A bude "Neparan broj" i događaj B "Broj manje od 4." Odgovor se dobije
primjenom Teoreme 3,
3 3 2 2
P A B
6 6 6 3
Često je potrebno pronaći vjerovatnoću događaja B pod uvjetom da se desi događaj A. Ova vjerovatnoća
naziva se uvjetna vjerovatnoća B ako se desi A i označava se P(BA). U ovom slučaju A služi kao novi
(reducirani) skup uzoraka, a ta vjerovatnoća je
P A B
P B A , P A 0 (11)
P A
P A B
P A B , P B 0 (12)
P B
12
TEOREMA 4: Pravilo množenja
P A B P A P B A P B P A B (13)
U proizvodnji vijaka, neka je A: vijak premalog prečnika i B: vijak prekratak. Neka je P(A) = 0,1 i neka je
uvjetna vjerovatnoća da je vijak premalog prečnika također prekratak P(BA) = 0,2. Koja je vjerovatnoća
da će slučajno odaberani vijak iz proizvedene serije, biti ujedno premalog prečnika i prekratak?
P A B P A P B (14)
onda su oni neovisni događaji. Uz pretpostavku da P(A) 0 i P(B) 0 iz (11)-(13) se vidi da je tada
P A B P A , P B A P B
P A B P A P B
P B C P B P C
(16)
P C A P C P A
P A B C P A P B P C
Uzorkovanje. Sljedeći primjer ima veze sa slučajnim odabirom predmeta, jednog po jednog, iz
određenog skupa predmeta. Ovo se zove uzorkovanje iz populacije. Postoje dva načina uzorkovanja i to:
1. Kod uzorkovanja s zamjenom predmet koji je nasumično izvučeni vraća se u skup iz kojeg je uzet
nakon čega se skup temeljito miješa tek onda se nasumično izvlači sljedeći predmet, itd..
13
PRIMJER 6: Uzorkovanja sa i bez zamjene
Kutija sadrži 10 vijaka, od kojih su tri oštećena. Dva su vijka izvučena slučajnim redoslijedom. Pronađite
vjerovatnoću da niti jedan od dva vijka nije oštećen.
Rješenje: Razmatrajmo događaje A: Prvi izvučeni vijak neoštećen i B: Drugi izvučeni vijak neoštećen.
Pošto je P(A) = 7/10, jer 7 od 10 vijaka nisu oštećeni i pošto izvlačimo nasumice, tako da svaki vijak ima
istu vjerovatnoću (1/10) da ga se izabere.
Ako izvlačimo sa zamjenom, situacija prije drugog izvlačenja je ista kao na početku, i P(B) = 7/10.
Događaji su neovisni, a odgovor je
Ako izvlačimo bez zamjene, P(A) = 7/10 kao i prije. Ako se A desilo, u kutiji je ostalo 9 vijaka, od kojih su 3
oštećena. Tako da je P(BA) = 6/9 = 2/3. Teorem 4 daje odgovor
7 2
P A B 47%
10 3
Na primjer, ako u montaži nekog instrumenta trebate 10 različitih vijaka u određenom redosljedu i želite
ih izvući nasumično iz kutije (koja ne sadrži ništa drugo) vjerovatnoća da ih dobijete u potrebnom
redoslijedu je samo 1/3.628.800 zato što ima
10! = 1 ∙ 2 ∙ 3 ∙ 4 ∙ 5 ∙ 6 ∙ 7 ∙ 8 ∙ 9 ∙ 10 = 3.628.800
redosljeda u kojima se mogu izvući. Slično tome, u mnogim drugim situacijama brojevi redosljeda,
rasporeda itd. često su nevjerovatno veliki.
Ako niste impresionirani, uzmite 20 vijaka - koliko će veći broj redoslijeda biti?
1.4.1 Permutacije
Permutacija određenih stvari (elemenata ili objekata) je raspored ovih stvari u nizu po nekom
redosljedu. Na primjer, za tri slova a, b, c postoje 3! = 1 ∙ 2 ∙ 3 = 6 permutacije: abc, acb, bac, bca, cab,
cba. Ovo se ogleda u (a) u sljedećoj teoremi.
14
TEOREMA 1: Permutacije
(a) Različite stvari. Broj permutacija od n različitih stvari kada se sve uzimaju u isto vrijeme je,
(b) Klase jednakih stvari. Ako se n datih stvari može podijeliti u c klasa jednakih stvari koje se razlikuju
od klase do klase, onda je broj permutacija tih stvari uzetih u isto vrijeme,
n!
(n1 + n2 + n3 + + nc = n) (2)
n1 ! n2 ! n3 !...nc !
DOKAZ:
(a) Postoji n mogućnosti za popunjavanje prvog mjesta u nizu. Potom je još uvijek (n – 1) stvari dostupno
za popunjavanje drugog mjesta itd.
(b) Postoji ukupno n! = (n1 + n2 + n3 + + nc)! permutacija ovih stvari. Međutim, za svaku klasu j
predmeta postoji nj! permutacija (permutirajući iste predmete j klase) koje su iste i od kojih u obzir treba
uzeti samo jednu. Zato treba n! podijeliti sa n1! n2! n3! nc!.
Ako kutija sadrži 6 crvenih i 4 plave kuglice, vjerovatnoća izvlačenja najprije crvenih, a zatim plavih
kuglica je, P = 6! 4!/10! = 1/210 0,5% (210 permutacija).
Permutacija n stvari od kojih se k uzima istovremeno je permutacija koja sadrži samo k od navedenih n
stvari. Dvije takva permutacija koje sadrže k istih elemenata u različitom redoslijedu, različite su po
definiciji. Na primjer, postoji 6 različitih permutacija tri slova a, b, c, uzeta dva odjednom, ab, ac, bc, ba,
ca, cb.
TEOREMA 2: Permutacije
Broj različitih permutacija n različitih stvari uzetih k istovremeno bez ponavljanja je,
n!
n n 1 n 2 ... n k 1 (3a)
n k !
a sa ponavljanjem je,
nk (3b)
15
PRIMJER 2: Ilustracija Teoreme 2
U šifriranoj poruci slova su raspoređena u skupinama od pet slova, nazvanih riječi. Iz (3b) vidimo da je
broj različitih takvih riječi 305 = 24.300.000.
Iz (3a) slijedi da je broj različitih riječi koje svako slovo sadrže samo jednom 30!/(30-5)! = 30 ∙ 29 ∙ 28 ∙27 ∙
26 = 17.100.720.
1.4.2 Kombinacije
Kod permutacija neophodan je, redoslijed odabranih stvari. Nasuprot tome, kombinacija datih stvari
znači bilo koji odabir jedne ili više stvari bez obzira na redoslijed. Postoje dvije vrste kombinacija, kako
slijedi:
Broj kombinacija n različitih stvari, od kojih se k uzima istodobno, bez ponavljanja je broj skupova koji
mogu biti sastavljeni od n datih stvari, svaki skup sadrži k različitih stvari i nijedan skup ne sadrži tačno
iste k stvari.
Broj kombinacija n različitih stvari, od kojih se k uzima istodobno, s ponavljanjem je broj skupova koji
se mogu sastojati od k elemenata izabranih iz datih n stvari, od kojih se svaki koristi onoliko često koliko
se želi.
Na primjer, postoje tri kombinacije tri slova a, b, c, kada se uzimaju dva slova odjednom, bez
ponavljanja, naime, ab, ac, bc i šest takvih kombinacija s ponavljanjima, naime, ab, ac, bc, aa, bb, cc.
TEOREMA 3: Kombinacije
Broj različitih kombinacija n različitih stvari od kojih se k uzima u isto vrijeme, bez ponavljanja je
n n! n n 1 ... n k 1
(4a)
k k ! n k ! 1 2... k
n k 1
(4b)
k
DOKAZ: Tvrdnja (4a) slijedi iz prvog dijela Teoreme 2 primjećujući da postoji k! permutacija k stvari
iz datih n stvari koje se razlikuju po redoslijedu elemenata (vidi Teoremu 1), međutim postoji samo jedna
kombinacija onih k stvari čija je vrsta naznačena u prvoj tvrdnji Teoreme 3. Posljednja tvrdnja Teoreme 3
može se dokazati indukcijom.
Broj uzoraka od 5 žarulja koje se mogu odabrati između 500 žarulja je [vidi (4a)]
16
1.4.3 Faktorijelna funkcija
Po definiciji je,
0! 1 (5)
n 1! n 1 n ! (6)
Za veliko n funkcija je vrlo velika, te se tada, kao dobra aproksimacija, može koristiti Stirlingova formula
n
n
n! ~ 2 n (e = 2,718) (7)
e
gdje se čita "asimptotski jednak" i znači da se odnos dvije strane u (7) približava 1 kad se n teži
beskonačnosti.
a a a 1 a 2 ... a k 1
(k 0, cijeli broj) (8)
k k!
a 0
1, također 1 (9)
0 0
n n
(n 0 i 0 k n) (10)
k n k
a a a 1
(k 0, cijeli broj) (11)
k k 1 k 1
17
Formula (8) također daje
m k m k 1
1 (k 0, cijeli broj i m > 0) (12)
k k
n 1
k s n k
(k 0, n 1, i k i n su cijeli brojevi) (13)
s 0 k k 1
r
p q p q
k r k
k 0
(r 0, cijeli broj) (14)
r
U Dijelu 1.1 razmotrili smo raspodjelu frekvencija podataka. Te raspodjele pokazuju apsolutnu ili
relativnu frekvenciju podataka. Slično tome, raspodjela vjerovatnoće ili, ukratko, raspodjela, pokazuje
vjerovatnoću događaja u eksperimentu. Veličina koju pratimo u eksperimentu bit će označena s X i zove
se slučajna varijabla (ili stohastička varijabla) jer vrijednost koja će se desiti u sljedećem ispitivanju ovisi
o slučajnosti, npr. ako bacamo kockice, dobije se jedan od brojeva 1 do 6, ali se ne zna koji će se sljedeći
broj pojaviti. Tako su brojevi na kockici koji se pojavljuju slučajna varijabla X. Također X je i pritisna ili
zatezna čvrstoća betona isl.. ("Stohastičan" znači slučajan.)
Ako brojimo (automobile na cesti, neispravne vijke u proizvodnji, bacanja dok kockica ne pokaže prvu
šesticu), imamo diskretnu slučajnu varijablu i raspodjelu. Ako mjerimo (električni napon, padavine,
tvrdoću čelika ili betona), imamo kontinuiranu slučajnu varijablu i raspodjelu. Precizne definicije dat će
se kasnije. U oba slučaja raspodjela X određuje se funkcijom raspodjele:
F x P X x (1)
Ovo je vjerovatnoća da će u opitu varijabla X poprimiti bilo koju vrijednost koja ne prelazi x.
PAŽNJA! Terminologija nije ujednačena. F(x) se ponekad zove i funkcija kumulativne raspodjele.
Da bi (1) imalo smisla u slučaju diskretne i kontinuirane raspodjele, formuliraju se uvjeti kako slijedi.
Slučajna varijabla X je funkcija definirana na prostoru S eksperimenta. Njene su vrijednosti realni brojevi.
Za svaki broj a definišu se vjerovatnoća
P X a
P X I
18
Iako je ova definicija vrlo općenita, u praksi se javlja vrlo mali broj raspodjela.
P a X b F b F a (2)
Ovo važi jer su događaji X a ("X poprima bilo koju vrijednost koja ne prelazi a") i a < X b ("X poprima
bilo koju vrijednost u intervalu a < x b"), prema (1) i Aksiomu 3 Definicije 2 u Dijelu. 1.3, međusobno
isključujući događaji te je
F b P X b P X a P a X b F a P a X b
Po definiciji, slučajna varijabla X i njena raspodjela su diskretne ako X pretpostavlja samo konačno
mnogo ili najviše prebrojivo beskonačno mnogo vrijednosti x1, x2, x3, zvanih moguće vrijednosti od X,
s pozitivnim vjerovatnoćama p1 = P(X = x1), p2 = P(X = x2), p3 = P(X = x3), dok je vjerovatnoća P(X I)
nula za bilo koji interval I koji ne sadrži nikakvu moguću vrijednost.
p j ako je x x j
f x (j = 1, 2, 3, ) (3)
0 u ostalim slučajevima
F x f x p
x j x
j
x j x
j (j = 1, 2, 3, ) (4)
gdje za bilo koje x saberemo sve vjerovatnoće pj za koje je xj manje ili jednako od x. Ovo je stepenasta
funkcija sa skokovima prema gore veličine pj nad mogućim vrijednostima xj od X i konstantom između
ovih vrijednosti.
Slika 1.5a prikazuje funkciju vjerovatnoće f(x) i funkciju raspodjele F(X) diskretne slučajne varijable
X = broj koji se javlja jednim bacanjem kockice. Moguće vrijednosti za X su x = 1, 2, 3, 4, 5, 6 sa
vjerovatnoćom 1/6. Na tim vrijednostima x funkcija raspodjele ima skokove prema gore veličine 1/6.
Tako da se na osnovu grafikona f(x) možemo nacrtati grafikon F(X) i obrnuto.
Na slici 1.5a i 1.5b na svakom skoku tačka označava vrijednost funkcije pri skoku!
19
Slika 1.5 Funkcija vjerovatnoće ƒ(x) i funkcija raspodjele F(x) kod a) slučajna varijabla X = broj dobijen
jednim bacanjem kockice. b) Zbir dva broja dobijena bacanjem dvije kockice po jednom
Slučajna varijabla X = zbir dva broja, dobijena bacanjem dviju kockica je diskretna i ima sljedeće moguće
vrijednosti 2 (1 + 1), 3, 4, , 12 (6 + 6). Postoji 6 6 = 36 jednako vjerovatnih rezultata (1, 1), (1, 2), ,
(6, 6) gdje je prvi broj onaj prikazan na prvoj kockici, a drugi koji ispadne na drugoj kockici. Svaki takav
ishod ima vjerovatnoću 1/36. Konkretno, X = 2 dešava se kada ishod bacanja bude (1, 1), X = 3 u slučaju
ishoda (1, 2) i (2, 1) itd. Stoga funkcije f(x) = P(X = x) i F(x) = P(X = x) imaju vrijednosti
x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
F(x) 1/36 3/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 36/36
Dvije korisne formule za diskretne raspodjele lako se dobiju na sljedeći način. Za vjerovatnoću koja
odgovara intervalima iz (2) i (4) se dobije
P a X b F b F a pj (X diskretno) (5)
a x j b
Ovo je zbir svih vjerovatnoća pj za koje xj zadovoljava uvjet a < xj b (Vodi računa o < i !). Odavde i iz
P(S) = 1 (Dio 1.3) dobije se sljedeća formula
p
j
j 1 (suma svih vjerovatnoća) (6)
20
PRIMJER 4: Problem vremena čekanja. Prebrojivo beskonačni skup S
Pri bacanju kovanice varijabla je X = broj pokušaja dok se ne pojavi prva glava. Potom, iz neovisnosti
događaja (Dio 1.3),
P(X = n) = (1/2)n = qn n = 1, 2, 3,
Također, (6) se može potvrditi formulom sume prvih n članova geometrijskog niza koja je jednaka
a/(1-q), gdje je a prvi član niza (u primjeru 1/2) i q količnik niza (u primjeru 1/2), te je
1
1 1 1 a
j p j 2 4 8 ... 1 q 2 1 1
1
2
F x f v dv
x
(7)
(pišemo v jer je x potreban za gornju granicu integrala) čiji se integrand f(x) naziva gustoća raspodjele,
koja nije negativna i kontinuirana je, osim za možda konačno mnogo x-vrijednosti. Diferenciranjem se
uspostavlja odnos između f i F
Iz (2) i (7) dobija se vrlo važna formula za vjerovatnoću koja odgovara intervalu:
P a X b F b F a f v dv
b
(9)
a
21
f v dv 1
(10)
Možete li vidjeti zašto? (Odgovor: Ova vjerovatnoća je površina ispod krivulje gustoće (Slika 1.6) i ne
mijenja se dodavanjem ili oduzimanjem jedne tačke u intervalu integracije.) Ovo je razlika s obzirom na
diskretni slučaja! (Objasniti.)
Neka X ima funkciju gustoće f(x) = 0,75 (1 – x2) kada je –1 x 1 i nula u svim ostalim slučajevima. Nađi
funkciju raspodjele, nađi vjerovatnoće za intervale P(–1/2 X 1/2), P(1/4 X 2) i odredi veličinu x
tako da je P(X x) = 0,95.
F x 0,75 1 v 2 dv 0,5 0,75 x 0,25 x 3
x
kada je –1 x 1
1
1 1 1 1
1/2
2 2 2 2
P X F F 0,75 1 v 2 dv 68,75%
1/2
1 1
1
4 4
P X 2 F 2 F 0,75 1 v 2 dv 31,64%
1/4
Uproštavanjem se dobije 3x – x3 = 1,8, a rješenje je x 0,73. Skiciraj f(x) i označi x = -1/2, 1/2, 1/4 i 0,73
kako bi vidio rezultate (vjerovatnoće) kao područja ispod krivulje. Skicirajte također F(x).
22
1.6 Srednja vrijednost i varijansa raspodjele
Srednja vrijednost i varijansa 2 slučajne varijable X i njene raspodjele teoretski odgovaraju srednjoj
vrijednosti x̄ i varijansi s2 raspodjele frekvencije iz Dijela 1.1 i služe sličnoj svrsi. Srednja vrijednost
obilježava centralno mjesto a varijansa širenje/rasipanje (varijabilnost) raspodjele. Srednja vrijednost
definiše se kao
xf x dx
(kontinuirana raspodjela) (1b)
A varijansa 2
2 xj f xj
2
(diskretna raspodjela) (2a)
j
x f x dx
2 2
(kontinuirana raspodjela) (2b)
Srednja vrijednost se naziva i očekivanje E(X) jer daje prosječnu vrijednost X koja se očekuje u mnogim
opitima. Veličine kao što su i 2 koje mjere određena svojstva raspodjele nazivaju se parametri. i 2
su dva najvažnija parametra. Iz (2) vidimo da je
2 0 (3)
Slučajna varijabla X = broj glava u jednom bacanju kovanice ima moguće vrijednosti X = 0 i X = 1 i
vjerovatnoćama P(X = 0) = 1/2 i P(X = 1) = 1/2. Iz (1a) dobijamo srednju vrijednost = 0 1/2 + 1 1/2 =
1/2, dok se iz (2a) dobije varijansa 2 = (0 – 1/2)2 1/2 + (1 – 1/2) 1/2 = 1/4.
Raspodjela gustoće:
1
f x kada je a < x < b,
ba
a u suprotnom f(x) = 0 naziva se jednolika raspodjela u intervalu a < x < b. Iz (1b) (ili iz sljedeće Teoreme
1), dobit ćemo da je = (a + b)/2, a iz (2b) dobije se varijansa,
b a
2 2
ab 1
b
x
2
dx kada je a < x < b
a
2 ba 12
23
Slika 1.7 prikazuje da je rasipanje veliko ako i samo ako je 2 veliko.
Slika 1.7 Jednolike raspodjele sa istom srednjom vrijednosti (0,5), ali različitom varijansom
Simetrija. Moguće je dobiti srednju vrijednost bez proračuna ako je raspodjela simetrična. Dokaži.
Ako je raspodjela simetrična u odnosu na x = c tj. ako je f(x – c) = f(x + c), tada je = c. (Primjeri 1 i 2 ovo
demonstriraju).
Ako je data slučajna varijabla X sa srednjom vrijednosti i varijansom 2, ovdje želimo sračunati srednju
vrijednost i varijansu od X* = a1 + a2X gdje su a1 i a2 date konstante. Ovaj problem je važan i često se
javlja u statistici.
(a) Ako slučajna varijabla X ima srednju vrijednost i varijansu 2, onda slučajna promjenjiva
a1 a2 i 2 a2 2 (5)
X
Z (a2 > 0) (6)
24
DOKAZ: Izraz (5) će biti dokazan za kontinuiranu raspodjelu. Malom intervalu I dužine x na x-osi
odgovara vjerovatnoća f(x)x [približno; površina pravougaonika osnove x i visine f(x)]. Tada
vjerovatnoća f(x)x mora biti jednaka vjerovatnoći odgovarajućeg interval na x*-osi, tj. f*(x*)x* gdje je
f* gustoća od X* i x* je dužina intervala na x*-osi koja odgovara I. Stoga za diferencijale imamo
f*(x*)dx* = f(x)dx. Nadalje, shodno (4) x* = a1 + a2x, tako da se (1b) odnosi i na X* što daje
x f x dx a a2 x f x dx a1 f x dx a2 xf x dx
1
Prvi integral sa desne strane je jednak 1, shodno (10) u Dijelu 1.5. Drugi integral je što dokazuje (5) i
implicira
x a1 a2 x a1 a2 a2 x
Iz ovog i kada se (2) primijeni na X* i ponovnim korištenjem f*(x*)dx* = f(x)dx dobijamo drugu formulu u
(5),
x
f x dx a22 x f x dx a22 2
2
2 2
Odabirom a1 = –/ i a2 = 1/ pišući da je X* = Z iz (4) dobijemo (6). Za ove a1 i a2 formula (5) daje
* = 0 i *2 = 1 kako je navedeno u (b).
Podsjetimo se da (1) definiše očekivanje (srednju vrijednost) od X, tj. vrijednost X koja je očekivana
prosječnost, ukratko = E(X). Općenitije, ako je g(x) nekonstantno i kontinuirano za sve x, onda je g(X)
slučajna varijabla. Dakle, njezino matematičko očekivanje ili, ukratko, njeno očekivanje E(g(X)) je
vrijednost od g(X) koja su prosječno očekuje i koja je definirana [slično kao (1)] sa
E g X g x j f x j (7a)
j
E g X g x f x dx (7b)
U prvoj formuli, f je funkcija vjerovatnoće diskretne slučajne varijable X. U drugoj formuli, f je gustoća
kontinuirane slučajne varijable X.
E X k x kj f x j (8a)
j
25
x f x dx
E X k k
j (8b)
E X
k
x j
j f xj
k
(9a)
E X x f x dx
k k
(9b)
E X
2
2
[(9) sa k = 2)] (11)
E 1 1 (12)
Binomna raspodjela se javlja u igrama na sreću (bacanje kockice i sl.), provjeri kvaliteta (npr. brojanje
nedostataka), anketiranju javnog mnijenja (brojanju zaposlenika koji preferiraju određene promjene na
poslu itd.), medicini (npr. bilježenje broja pacijenata koji su se oporavili novim lijekovima) i tako dalje.
Uvjeti njene pojave su kako slijedi.
Zanima nas koliko se puta događaj A desio u n neovisnih pokušaja/ispitivanja. U svakom pokušaju
događaj A ima istu vjerovatnoću P(A) = p. Vjerovatnoća da se pri pokušajima A neće desiti ima vrijednost
q = 1 – p. U n pokušaja slučajna varijabla koja nas interesira je X = broj pojavljivanja događaja A u n
pokušaja.
1A 4A2 ...
4 3A B
1 4B2 ...
4 3B (1)
x puta n x puta
26
Ovdje je B = Ac komplement A, što znači da se A ne pojavljuje (Dio 1.2). Sada koristimo pretpostavku da
su pokušaji neovisni, tj. da oni ne utječu jedan na drugog. Stoga (1) ima vjerovatnoću (vidi Dio 1.3 o
nezavisnim događajima)
(1) je samo jedan način uređivanja x A-ova i (x – n) B-ova. Sada ćemo iskoristiti Teoremu 1(b) u Dijelu
1.4, koja daje broj permutacija n stvari (n ishoda od n pokušaja) koje se sastoje od 2 klase. Klasa 1 sadrži
n1 = x A-ova i Klasa 2 sadrži n – n1 = n – x B-ova. Ovaj broj je
n n!
x x ! n x !
Prema tome, (1*) pomnožen s ovim binomnim koeficijentom, daje vjerovatnoću P(X = x) od X = x tj.,
dešavanja A tačno x puta u n pokušaja. Dakle, X ima funkciju vjerovatnoće
n
f x pxq nx (x = 0, 1, , n) (2)
x
dok je f(x) = 0 u ostalim slučajevima. Raspodjela X sa funkcijom vjerovatnoće (2) naziva se Binomna ili
Bernoullijeva raspodjela. Dešavanje A naziva se uspjehom (bez obzira na to što on zapravo jest, to može
značiti da propustite avion ili izgubite sat), a nedešavanje A naziva se neuspjehom. Slika 1.8 prikazuje
neke tipične primjere. Numeričke vrijednosti mogu se dobiti iz Tabele D1 u Dodatku 1 ili iz neke
kompjuterske aplikacije.
np (3)
a varijansa je
2 npq (4)
27
Za simetričan slučaj jednakih šansi uspjeha i neuspjeha p = q = 1/2 dobije se srednja vrijednost n/2,
varijansa n/4 i funkciju vjerovatnoće
n
n 1
f x (x = 0, 1, , n) (2*)
x 2
Izračunajte vjerovatnoću dobijanja najmanje dvije šestice pri bacanju kockice 4 puta.
Rješenje: p = P(A) = P(šest) = 1/6, q = 5/6, n = 4. Događaj "Barem dvije šestice" javlja se ako dobijemo
dvije ili tri ili četiri šestice. Stoga je odgovor
2 2 3 4
4 1 5 4 1 5 4 1
P f 2 f 3 f 4
2 6 6 3 6 6 4 6
1 171
4 6 25 4 5 1 13,2%
6 1296
x
f x e (x = 0, 1, ) (5)
x!
naziva se Poissonova raspodjela. Slika 1.9 prikazuje (5) za neke vrijednosti . Može se dokazati da je ova
raspodjela dobijena kao ograničavajući slučaj Binomne raspodjele, ako pustimo da p 0 i da n
tako da se = np približi nekoj konačnoj vrijednosti. (Na primjer, = np može se održavati konstantnim.)
Poissonova raspodjela ima srednju vrijednost i varijansu
2 (6)
Slika 1.9 daje predstavu da se, porastom srednje vrijednosti, povećava širenje raspodjele, i na ovaj način
ilustrira formulu (6), te da raspodjela postaje sve više i više (približno) simetrična.
28
PRIMJER 2: Poissonova raspodjela
Ako je vjerovatnoća izrade neispravnog vijka p = 0,01. Koja je vjerovatnoća da će kutija od 100 vijaka
sadržavati više od 2 neispravna?
1
0,01 0,9999 0,01 0,99
2 98
0 2
Pošto je p vrlo malo, ovo možemo aproksimirati prikladnijom Poissonovom raspodjelom sa srednjom
vrijednosti = np = 100 0,01 = 1 što daje [vidi (5)]
1
P Ac e 1 1 1 91,97%
2
Ako u prosjeku 2 automobila uđu u određeno parkiralište u minuti, koja je vjerovatnoća da će u bilo
kojoj minuti 4 ili više automobila ući u parkiralište?
Rješenje: Da bismo shvatili da je Poissonova raspodjela odgovarajući model za ovaj slučaj, zamislimo da
se minuta podijeli na mnogo vrlo kratkih vremenskih intervala, neka p bude (konstantna) vjerovatnoća
da će automobil ući u parkiralište tokom tog kratkog intervala, i pretpostavimo neovisnost događaja koji
se dešavaju tokom tih intervala. U tom slučaju se radi o Binomnoj raspodjeli s vrlo velikim n i vrlo malim
p. Ovo se da aproksimirati Poissonovom raspodjelom sa = np = 2, jer u prosjeku dvoja kola ulaze u
parking. Komplementarni događaj događaja da "4 ili više automobila uđu tokom određene minute" je
"da uđu 3 ili manje automobila". Ovaj događaj ima vjerovatnoću
20 21 22 23
f 0 f 1 f 2 f 3 e 2
0! 1! 2! 3!
0,857
Ovo znači da iz određenog skupa izvlačimo stvari jednu po jednu, a nakon svakog pokušaja zamijenimo
ono što je izvučeno (vraćamo ga nazad u zadani skup i miješamo) prije nego izvučemo sljedeću stvar. To
garantira neovisnost događaja i vodi Binomnoj raspodjeli. Uistinu, ako kutija sadrži N stvari, na primjer,
vijaka, od kojih je M neispravno, vjerovatnoća izvlačenja neispravnog vijka u pokušaju je p = M/N. Zato je
vjerovatnoća izvlačenja ispravnog vijka q = 1 – p = 1 – M/N, a (2) daje vjerovatnoću izvlačenja x
neispravnih vijaka u n pokušaja u obliku
x nx
n M M
f x 1 N (x = 0, 1, , n) (7)
x N
29
1.7.4 Uzorkovanje bez zamjene. Hipergeometrijska raspodjela
Uzorkovanje bez zamjene znači da ne vratimo vijak u kutiju. Tada više nemamo neovisnost pokušaja
(Zašto?), a umjesto (7) vjerovatnoća izvlačenja x neispravnih vijaka u n pokušaja je
M N M
x nx
f x (x = 0, 1, , n) (8)
N
n
N
a) različitih načina uzimanja n stvari iz N,
n
M
b) različitih načina uzimanja x neispravnih vijaka iz M,
x
N M
c) različitih načina uzimanja n – x ispravnih vijaka iz N – M.
nx
Svaki način u (b) u kombinaciji sa svakim načinom u (c) daje ukupan broj međusobno isključujućih načina
dobijanja x neispravnih vijaka u n izvlačenja bez zamjene. Pošto je (a) ukupni broj ishoda i pošto
nasumično izvlačimo, svaki takav način ima vjerovatnoću
1
iz ovoga slijedi (8)
N
n
M
n (9)
N
i varijansu
nM N M N n
2 (10)
N 2 N 1
Želimo izvući slučajne uzorke dviju brtvi iz kutije sa deset brtvi, od kojih su tri neispravne. Pronađite
funkciju vjerovatnoće slučajne varijable X = broj neispravnih brtvi u uzorku.
30
x 2 x
2 3 3
f x 1 , f 0 0, 49, f 1 0, 42, f 2 0,09
x 10 10
3 7
x 2 x
f x
, f 0 f 1 21 0, 47, f 2 3 0,07
10 45 45
2
Ako su N, M, i N – M, veliki s obzirom na n, tada nije važno da li je uzorak sa ili bez zamjene. U tom
slučaju se hipergeometrijska raspodjela može aproksimirati binomnom raspodjelom (sa p = M/N) koja je
nešto jednostavnija.
U ovom dijelu, preusmjerit ćemo pažnju sa diskretnih na kontinuirane raspodjele i raspravljat ćemo o
normalnoj raspodjeli. Ovo je najvažnija kontinuirana raspodjela, jer u mnogim slučajevima mnoge
slučajne varijable su normalne slučajne varijable (tj. Imaju normalnu raspodjelu) ili su približno
normalne ili mogu biti pretvorene u normalnu slučajnu varijablu na relativno jednostavan način. Nadalje,
normalna raspodjela je korisna aproksimacija složenijih raspodjela, a također se javlja u dokazima
različitih statističkih ispitivanja.
1 1 x 2
f x exp ( > 0) (1)
2 2
gdje je exp eksponencijalna funkcija s bazom prirodnog logaritma e = 2,718. Ovo je jednostavnije nego
što na prvi pogled izgleda. f(x) ima sljedeće karakteristike (vidi također Sliku 1.10):
2. 1/(2) je konstantan faktor koji čini površinu ispod krivulje f(x) koja se rasprostire od – do
jednakom 1, kao što mora biti shodno (10), Dio 1.5.
4. Eksponencijalna funkcija u (1) vrlo brzo opada ka nuli ako je mala standardna devijacija , kao što bi i
trebalo biti, Slika 1.10.
31
Slika 1.10 Gustoća (1) normalne raspodjele za = 0 za različite vrijednosti
Iz (7) u Dijelu 1.5 i (1) vidimo da normalna raspodjela ima funkciju raspodjele
1 1 v 2
x
F x 2 dv
exp (2)
2
Ovdje smo trebali x kao gornju granicu integrala te smo u integrandu umjesto x pisali v.
z 1 2
1
z
u
2
e
2
du (3)
Ovaj integral ne može se izračunati analitički pomoću neke od metoda iz matematičke analize. Ali to nije
ozbiljan problem jer se njegove vrijednosti mogu dobiti iz Tabele D3 u Dodatku 1 ili pomoću neke
kompjuterske aplikacije. Ove vrijednosti su potrebne za rad sa normalnom raspodjelom. Krivulja (z) je
u obliku slova S i monotono se povećava od 0 do 1 (zašto?) i presijeca vertikalnu osu u 1/2 (zašto?), kako
je prikazano na Slici 1.11.
Slika 1.11 Funkcija raspodjele (z) normalne raspodjele s srednjom vrijednošću 0 i varijansom 1
32
Odnos između F(x) i (z). Iako će vaša kompjuterska aplikacija izravno dati vrijednosti F(x) iz (2) za bilo
koje i , važno je shvatiti da se i zašto se takvo F(x) može izraziti u smislu tablične standardne (z),
kako slijedi.
Funkcija raspodjele F(x) normalne raspodjele s bilo kojim i [vidi (2)] u vezi je se standardiziranom
funkcijom raspodjele (z) iz (3) preko formule
x
F x (4)
v x
u . Tada v = x daje u
kao novu gornju granicu integracije. Iz v – = u dobije se dv = du. Uvrštavajući sve ove smjene u (2) i
budući da se pokrati, dobije se
x
x
1 2
1
F x
u
2
e 2
du
Vjerovatnoće koje odgovaraju intervalima potrebno su prilično često u Poglavlju 2 o statistici. One se
dobijaju kako slijedi.
b a
P a x b F b F a (5)
DOKAZ: Formula (2) u Dijelu 1.5 daje prvu jednakost u (5) a (4) u ovom Dijelu daje drugu jednakost.
Za praktičan rad s normalnom raspodjelom dobro je znati da će se oko 2/3 svih vrijednosti X smjestiti
između , oko 95% između 2 i praktički sve između tri-sigma granica 3 ili preciznije,
prema Tabeli D3 u Dodatku 1,
a) P X 68%
b) P 2 X 2 95,5% (6)
c) P 3 X 3 99,7%
33
Formule (6a) i (6b) prikazane su na Slici 1.12. Također, formule (6) pokazuju da će se, vrijednost koja
odstupa spram više od , 2 ili 3, pojaviti jednom u približno 3, 20 i 300 pokušaja/opita.
U opitima (Poglavlje 2) pitat ćemo, obrnuto, koji su to intervali koji odgovaraju određenim
vjerovatnoćama. U praksi najvažnije su vjerovatnoće od 95%, 99% i 99,9%. Za njih, Tabela D4 u Dodatku
1 daje odgovore 2, 2,6 i 3,3. Tačnije,
Postoje dvije tabele za normalnu raspodjelu u Dodatku 1, Tabele D3 i D4. Ako želite vjerovatnoću,
upotrijebite Tabelu D3. Ako su date vjerovatnoće i traže se intervali ili x-vrijednosti, upotrijebite Tabelu
D4. Slijedeći primjeri su tipični. Uradite ih pažljivo, provjeravajući sve vrijednosti, a ne samo da ih uradite
putem vaših softvera. Napravite skice gustoće da vidite da li rezultati izgledaju razumno.
P X 2, 44 0,9927 99,27%
Neka je X normalna varijabla sa = 0,8 i 2 = 4 (tako da je = 2). Onda je prema (4) i (5)
2,44 0,80
P X 2, 44 F 2, 44 0,82 0,7939 80%
2
34
Ili ako više volite (slično i za druge slučajeve)
X 0,80 2, 44 0,80
P X 2, 44 P P Z 0,82 0,7939
2 2
1,0 0,80
P X 1 1 P X 1 1 1 0,5398 0, 4602
2
P 1,0 X 1,8 0,5 0,1 0,6915 0,5398 0,1517
Neka je X normalna varijabla sa = 5 i 2 = 0,04 (tako da je = 0,2). Odredi c ili k koji odgovaraju
navedenoj vjerovatnoći
c 5 c 5
P X c 95%, 95%, 1,645, c 5,329
0,2 0,2
P 5 k X 5 k 90%, 5 k 5,329 (kao u prethodnom slučaju, zašto?)
c 5
P X c 1%, pa je P X c 99%, 2,326, c 5, 465
0,2
PRIMJER 4: Nedostaci
U proizvodnji čeličnih šipki neka prečnik X bude normalne raspodjele sa srednjom vrijednosti 2 cm i
standardnom devijacijom od 0,008 cm. (a) Koji postotak nedostataka možemo očekivati postavljajući
granicu tolerancije na 2 0,02 cm? (b) Kako postaviti granice tolerancije kako bi se omogućili nedostaci
od 4%?
tako da je iz Tabele D4
n
f x pxq nx (x = 0, 1, , n) (8)
x
35
Ako je n veliko, binomni koeficijenti i stepeni postaju nepodobni. Od vrlo je velike praktične (i teoretske)
važnosti da u ovom slučaju normalna raspodjela daje dobru aproksimaciju binomne raspodjele, prema
sljedećoj teoremi, jednoj od najvažnijih teorema u cijeloj teoriji vjerovatnoće.
Za veliko n
1
1 2
x np
f x
z
e 2
, z (10)
2 npq npq
b
n a np 0,5 b np 0,5
P a X b p x q n x ~ sa i (11)
x a x npq npq
Dokaz ove teoreme može se naći u odgovarajućoj literaturi. Dokaz pokazuje da je broj 0,5 u i
korekcija uzrokovana prelaskom sa diskretne na kontinuiranu raspodjelu.
U ovom dijelu uzet će se u obzir dvije slučajne varijable X i Y ili, kako se također kaže, dvodimenzionalna
slučajna varijabla (X, Y). Za (X, Y) ishod pokusa je par brojeva X = x i Y = y koji se može predstaviti tačkom
u XY-ravnini.
F x, y P X x,Y y (1)
Ovo je vjerovatnoća da će u pokušaju, X poprimiti bilo koju vrijednost koja nije veća od x i u istom
pokušaju Y će poprimiti bilo koju vrijednost koja nije veća od y. To odgovara zatamnjenom području na
Slici 1.13, koje se pruža do – prema lijevo i prema dolje. F(x, y) jedinstveno određuje raspodjelu
vjerovatnoće, jer analogno formuli (2) u Dijelu 1.5, gdje je P(a < X b) = F(b) – F(a), sada za pravougaonik
imamo.
36
P a1 X b1, a2 Y b2 F b1, b2 F a1, b2 F b1, a2 F a1, a2 (2)
Kao i prije, u dvodimenzionalnom slučaju imat ćemo i diskretne i kontinuirane slučajne varijable i
raspodjele.
Analogno slučaju jedne slučajne varijable X (Poglavlje 1.5) dvodimenzionalnu varijablu (X, Y) i njenu
raspodjelu možemo smatrati diskretnim ako (X, Y) može poprimiti samo konačno mnogo, ili najviše
prebrojivo beskonačno mnogo parova vrijednosti (x1, y1), (x2, y2), sa pozitivnim vjerovatnoćama, dok
je vjerovatnoća za bilo koje područje koje ne sadrži ove (X, Y) vrijednosti jednaka nuli.
Neka je (xi, yj) bilo koji od tih parova i neka je njegova vjerovatnoća P(X = xi, Y = yj) = pij (gdje dopuštamo
mogućnost da je pij = 0 za određene parove indeksa i, j). Tada definišemo funkciju vjerovatnoće f(x, y)
od (X, Y) kao
F x, y f x ,y
xi x y j y
i j (4)
f x , y 1
i j
i j (5)
Ako istovremeno bacamo kovanicu od jedne KM i od dvije KM i razmotrimo događaje: X = broj glava koji
se pojavi na kovanici od jedne KM, Y = broj glava koji se pojavi na kovanici od dvije KM, tada X i Y mogu
imati vrijednosti 0 ili 1, a funkcija vjerovatnoće je f(0, 0) = f(1, 0) = f(0, 1) = f(1, 1) = 1/4 u suprotnom f(x,
y) = 0.
Analogno kao kod jedne slučajne varijable X (Dio 1.5) i par varijabli (X, Y) kao i njihovu raspodjelu
nazivamo kontinuiranim ako se odgovarajuća funkcija raspodjele može dati dvostrukim integralom
37
y x
F x, y f x, y dxdy (6)
čiji se integrand f naziva gustoća od (X, Y), koja je svugdje nenegativna i kontinuirana.
Iz (6) dobijamo vjerovatnoću, da (X, Y) poprimi bilo koju vrijednost u pravougaoniku (Slika 1.14), koja je
data formulom
b1 b2
Neka je R pravougaonik dat sa 1 < x 1, 2 < y 2. Gustoća (vidi sliku 1.15a),
definiše takozvanu jednoliku raspodjelu u pravougaoniku R. Ovdje je k = (1 – 1)( 2 – 2) površina od R.
Funkcija raspodjele prikazana je na Slici 1.15b.
Ovo je prilično prirodna ideja, bez pariteta kod slučaja sa jednom slučajnom varijablom. Interesantna je
samo jedna od dvije varijable (X, Y) na primjer varijabla X čija se raspodjela, nazvana marginalna
raspodjela, traži. Stoga tražimo vjerovatnoću P(X = x, Y proizvoljno). Pošto je (X, Y) diskretne raspodjele,
38
takvo je i X. Njegovu funkciju vjerovatnoće, nazvanu recimo f1(x), dobijamo iz funkcije vjerovatnoće f(x,
y) od (X, Y) sumiranjem po y:
gdje sabiremo sve vrijednosti f(x, y) koje nisu 0 za taj x. Iz (9) vidimo da je funkcija raspodjele marginalne
raspodjele od X jednaka
F1 x P X x,Y proizvoljno f x
x * x
1
(10)
f2 y P X proizvoljno,Y y f x, y (11)
x
određuje graničnu raspodjelu Y u (X, Y). Ovdje sabiramo sve vrijednosti koje nisu nula za odgovarajuće y.
Funkcija raspodjele ove marginalne raspodjele jest
F2 y P X proizvoljno,Y y f y
y * y
2
(12)
U izvlačenju 3 karte iz špila uz zamjenu razmotrimo varijablu (X, Y) gdje je X = broj kraljica, Y = broj
kraljeva ili kečeva. Špil ima 52 karte. To uključuje 4 kraljice, 4 kralja i 4 keca. Stoga u jednom pokušaju
kraljica ima vjerovatnoću px = 4/52 = 1/13, a kraljevi ili kečevi py = 8/52 = 2/13. Ovo daje
dvodimenzionalnu binomnu funkciju vjerovatnoće od (X, Y) (sa q = 1 – px – py = 1 – 1/13 – 2/13 = 10/13)
oblika
x y 3 x y
3! 1 2 10
f x, y ako je (x + y 3) i f(x, y) = 0 u suprotnom
x ! y ! 3 x y ! 13 13 13
U Tabeli 1.1 nezatamnjeni stupci prikazuju vrijednosti f(x, y), a u krajnjem desnom stupcu i donjem redu
vrijednosti funkcija vjerovatnoće ƒ1(x) i ƒ2(y) marginalne raspodjele od X i Y.
Tabela 1.1 Vrijednosti funkcija vjerovatnoće ƒ(x, y), ƒ1(x), ƒ2(y) u izvlačenju tri karte Primjer 3
y 0 1 2 3 f1(x)
x
0 1000/2197 600/2197 120/2197 8/2197 1728/2197
1 300/2197 120/2197 12/2197 0 432/2197
2 30/2197 6/2197 0 0 36/2197
3 1/2197 0 0 0 1/2197
f2(y) 1331/2197 726/2197 132/2197 8/2197 2197/2197
39
1.9.4 Marginalne raspodjele kontinuirane raspodjele
Konceptualno ovaj slučaj je isti kao i prethodni, s funkcijama vjerovatnoće i sume zamijenjene
gustoćama i integralima. Za kontinuiranu slučajnu varijablu (X, Y) s gustoćom f(x, y) imamo marginalnu
raspodjelu X u (X, Y), definiranu funkcijom raspodjele
x
F1 x P X x, Y f x dx
1 (13)
f1 x f x, y dy (14)
F2 y P X ,Y y f y dy
2 (15)
i gustoće
f2 y f x, y dx (16)
F x, y F1 x F2 y (17)
vrijedi za sve (x, y). U suprotnom, ove slučajne varijable su ovisne. Na ove definicije sugerišu
odgovarajuće definicije za događaje u Dijelu. 1.3.
f x, y f1 x f2 y (18)
Ovdje su f navedene funkcije vjerovatnoće ako je (X, Y) diskretno, ili funkcije gustoće ako je (X, Y)
kontinuirano.
U bacanju kovanica od jedne KM i dvije KM, X = broj glava na kovanici od jedne KM i Y = broj glava na
kovanici od dvije KM, kovanice mogu poprimiti vrijednosti 0 ili 1 i neovisni su. Slučajne varijable u Tabeli
1.1 su ovisne.
Proširenje neovisnosti na n-dimenzionalne slučajne varijable. Ovo će biti potrebno kroz cijelo Poglavlje
2. Raspodjela ovakve slučajne varijable X = (X1, , Xn) određuje se funkcijom raspodjele oblika
40
F x1,..., xn P X1 x1,..., X n xn
za sve (x1, , xn). Ovdje je Fj(xj) funkcija raspodjele marginalne raspodjele Xj po X, to jest
Fj x j P X j x j , X k proizvoljno, k 1,..., n, k j
U slučaju diskretne slučajne varijable (X, Y) možemo dobiti funkciju vjerovatnoće f(z) od Z = g(x, y)
sumiranjem svih f(x, y) za koje je g(x, y) jednako razmatranim vrijednostima z, tako da je
f z P Z z f x, y (20)
g x ,y z
F z P Z z f x, y (21)
g x ,y z
F z P Z z f x, y dxdy (22)
g x ,y z
gdje za svako z gustoću f(x, y) od (X, Y) integriramo preko regiona g(x, y) z u xy-ravni. Granična krivulja
ovog regiona je g(x, y) = z.
Broj
g x, y f x, y X ,Y diskretno
x y
E g X ,Y (23)
g x, y f x, y dxdy
X ,Y kontinuirano
41
zove se matematičko očekivanje ili, ukratko, očekivanje od g(X, Y). Ovdje se pretpostavlja da dvostruki
niz apsolutno konvergira i da integral g(x, y) f(x, y) nad xy-ravninom postoji (da je konačan). Pošto su
sumiranje i integracija linearni procesi, iz (23) se dobije
E ag X ,Y bh X ,Y aE g X ,Y bE h X ,Y (24)
E X Y E X E Y
Srednja vrijednost (očekivanje) zbira slučajnih varijabli jednak je zbiru srednjih vrijednosti (očekivanja),
tj.,
Nadalje, imamo
Srednja vrijednost (očekivanje) proizvoda nezavisnih slučajnih varijabli jednaka je proizvodu srednjih
vrijednosti (očekivanja), tj.,
Dokaz: Ako su X i Y nezavisne slučajne varijable (i obe su diskretne ili su boe kontinuirane), onda je
E(X, Y) = E(X)E(Y). U stvari, u diskretnom slučaju imamo
U slučaju kontinuiranih slučajnih varijabli dokaz odnosa je sličan. Proširenje na n nezavisnih slučajnih
varijabli daje (26), te je Teorema 2 dokazana.
Ovo je još jedna za praksu važna i potrebna stvar. Kao i prije, neka je Z = X + Y, a srednju vrijednost i
varijansu od Z označimo sa i 2. Tada prvo imamo
2 E Z E Z 2 E Z
2 2
E Z 2 E X 2 2 XY Y 2 E X 2 2E XY E Y 2
42
Za drugi termin na desnoj strani iz Teoreme 1 dobijamo
2 E X 2 E X E Y 2 E Y 2 E XY E X E Y
2 2
Može se pokazati da je izraz u vitičastoj zagradi zbir varijansi X i Y, koje označavamo 12 i 22. Termin u
drugom redu (bez faktora 2) je
XY E XY E X E Y (27)
2 12 22 2 XY (28)
E XY E X E Y
Te je XY = 0 i
2 12 22 (29)
Varijansa zbira neovisnih slučajnih varijabli jednaka je zbiru varijansi tih varijabli.
OPREZ! U brojnim primjenama Teoreme 1 i 3 moramo uvijek zapamtiti da Teorema 3 stoji samo za
neovisne varijable.
43
44
2. Matematska Statistika
U teoriji vjerovatnoće postavili smo matematske modele procesa na koje utječe "slučajnost". U
matematskoj statistici ili, ukratko, statistici, provjeravamo ove modele spram uočenih stvarnosti. Ovo se
naziva statističkim zaključivanjem, a provodi se uzorkovanjem, tj. izvlačenjem slučajnih uzoraka, kratko
nazvanih uzorcima. To su skupovi vrijednosti iz mnogo većeg skupa vrijednosti koji bi se mogao izučavati
nazvan populacijom. Primjer je prečnici 10 vijaka izvučenih iz velikog broja vijaka. Uzorkovanje se
provodi kako bi se utvrdilo da li je model populacije dovoljno tačan za praktične svrhe. Ako jeste, model
se može koristiti za predviđanja, odluke i radnje. Na primjer, pri planiranju proizvodnje, nabavke
opreme, ulaganju u poslovne projekte i tako dalje.
Najvažnije metode statističkog zaključivanja jesu procjene parametara (Dio 2.2), određivanje intervala
povjerenja (Dio 2.3) i testiranje hipoteza (Dio 2.4, 2.7, 2.8) uz primjenu na kontrolu kvalitete (Dio 2.5) i
uzorkovanje prihvatanja (Dio 25.6).
U zadnjem Poglavlju (2.9) dajemo uvod u regresijsku i korelacijsku analizu koje se odnose na
eksperimente koji uključuju dvije varijable.
45
2.1 Uvod. Slučajno uzorkovanje
Matematska statistika sastoji se od metoda za izradu i procjenu slučajnih eksperimenata radi dobijanja
informacija o praktičnim problemima, kao što su: istraživanje odnosa sadržaja željeza i gustoće željezne
rude, kvalitete sirovine ili gotovih proizvoda, učinkovitosti klimatizacijskih sistema, performanse
određenih automobila, učinak oglašavanja, reakcije potrošača na novi proizvod itd.
Slučajne varijable pojavljuju se u inženjerstvu (i drugdje) češće nego što se misli. Na primjer, svojstva
proizvoda iz masovne proizvodnje (vijci, žarulje i sl.) uvijek pokazuju slučajnu varijaciju zbog malih
(nekontroliranih!) razlika u sirovini ili proizvodnim procesima. Tako je prečnik vijaka slučajna varijabla X i
imamo ispravne vijke sa prečnikom između zadanih granica tolerancije i neispravne vijke sa prečnikom
izvan tih granica. Možemo tražiti raspodjelu X, kako bi se dobio procenat neispravnih vijaka, radi
neophodnog poboljšanja proizvodnog procesa.
Uzorci se odabiraju iz populacija - 20 vijaka iz skupine od 1000, 100 birača iz skupine od 5000, 8 srndaća
u projektu zaštite divljine - jer bi obuhvatanje cjelokupne populacije bilo preskupo, dugotrajno,
nemoguće ili čak besmisleno (razmisli o razornom ispitivanje svjetiljki ili dinamita). Da biste dobili
smislene zaključke, uzorci moraju biti slučajno odabrani. Svaki od 1000 vijaka, barem približno, mora
imati iste šanse izvlačenja uzorka (izvlačenja kada uzorkujemo). Samo tada će srednja vrijednost
x̄ = (x1 + + x20)/20 (Dio. 1.1) uzorka veličine n = 20 (ili bilo kojeg drugog n) biti dobra aproksimacija
srednje vrijednosti populacije (sl. 1.6). Tačnost aproksimacije, kao što ćemo vidjeti, općenito će se
poboljšati s povećanjem n. Slično za ostale parametre (standardnu devijaciju, varijansu itd.).
Nasumični brojevi pomažu u dobijanju uzoraka koji zapravo treba biti slučajno odabran. Ponekad to nije
lako postići jer postoje mnogi suptilni faktori koji mogu pristrano utjecati na uzorkovanje (putem lične
pristranosti kod intervjua, putem loših radnih mašina, putem izbora netipičnih uvjeta posmatranja itd.).
Nasumični brojevi mogu se dobiti iz generatora nasumičnih brojeva u nekoj od kompjuterskih aplikacija
(Maple, Mathematica isl.). (Brojevi nisu stvarno slučajni, kao što se dobije bacanjem kovanica ili kockica,
ali su izračunati na način koji ima praktički sve bitne karakteristike istinske slučajnosti.)
Za odabir uzorka veličine n = 10 iz 80 datih kugličnih ležajeva obilježimo ih brojevima od 1 do 80. Nakon
toga pustimo da generator nasumično proizvede 10 cijelih brojeva od 1 do 80 i potom u uzorak treba
uključiti ležajeve označene tim brojevima., npr. 44, 55, 53, 03, 52, 61, 67, 78, 39, 54, ili nekim drugim
brojevima koje izbaci generator.
46
Tek sada srednju vrijednost x̄ u (5), Dio 1.1, nazivamo srednja vrijednost uzorka
1 n 1
x
n j 1
x j x1 x2 ... xn
n
(1)
n nazivamo veličinom uzorka, varijansu s2 u (6), Dio 1.1, nazivamo varijansom uzorka,
1 n
xj x
1
x1 x ... xn x
2 2 2
s2 (2)
n 1 j 1 n 1
i njen pozitivni kvadratni korijen s standardnom devijacijom uzorka. x̄, s2 i s se zovu parametri uzorka i
oni će stalno biti potrebni u ovom Poglavlju.
Tačka procjene parametra je broj koji se izračunava iz određenog uzorka i služi kao aproksimacija
nepoznate tačne vrijednosti parametra populacije. Interval procjene je interval ("interval povjerenja")
dobijen iz uzorka. Takve procjene će se razmatrati u sljedećem dijelu. Procjena parametara ima veliku
praktičnu važnost u mnogim primjenama.
Kao aproksimacija srednje vrijednosti populacije možemo uzeti srednju vrijednost odgovarajućeg
uzorka x̄. To daje procjenu da je ̂ = x̄ za , to jest
1 n 1
ˆ x
n j 1
x j x1 x2 ... xn
n
(1)
gdje je n veličina uzorka. Slično tome, procjena varijanse ̂ 2 populacije je varijansa s2 odgovarajućeg
uzorka, tj.
1 n
xj x
1
x1 x ... xn x
2
ˆ 2 s 2
2 2
(2)
n 1 j 1 n 1
Jasno je da su (1) i (2) procjene parametara za raspodjele u kojima se ili pojavljuju eksplicitno kao
parametri npr., normalne i Poissonove raspodjele. Za binomnu raspodjelu p = /n, (vidi (3) u Dijelu 1.7).
Iz (1) stoga dobijamo procjenu za p
x
pˆ (3)
n
Spomenimo da je (1) poseban slučaj takozvane metode momenata. U ovoj metodi se parametri koji se
procjenjuju izražavaju u smislu momenata raspodjele (vidi poglavlje 1.6). U dobijenim formulama, ti
momenti raspodjele zamjenjuju se odgovarajućim momentima uzorka i tako se dobiju procjene. Ovdje je
k-ti moment uzorka x1, , xn
47
1 n k
mk xj
n j 1
l f x1 f x2 ... f xn (4)
f x1 xf x2 x ... f xn x l x
n
(5)
Budući da f(xj) ovisi o , funkcija l u (5) izražena preko (4) ovisi o x1, , xn i . Zamislimo da su date
vrijednosti x1, , xn fiksne. Onda je l funkcija od koja se zove funkcija vjerovatnoće. Osnovna ideja
metode maksimalne vjerovatnoće je vrlo jednostavna. Odaberemo da je aproksimacija nepoznate
vrijednosti , ona za koju je l najveći. Ako je l diferencijabilna funkcija po , neophodan uvjeta da l ima
maksimum u intervalu (ne na granici) je
l
0 (6)
(Pišemo parcijalni izvod, jer l ovisi i o x1, , xn). Rješenje (6) ovisno o x1, , xn zove se maksimalna
procjena vjerovatnoće. (6) možemo zamijeniti sa
ln l
0 (7)
jer je f(xj) > 0, jer je maksimum od l općenito pozitivan, i lnl je monotono rastuća funkcija od l. Ovo često
pojednostavljuje proračune.
Više parametara. Ako raspodjela X uključuje r parametara 1, , r, onda umjesto (6) imamo r uvjeta
l/1 = 0, , l/r = 0, i umjesto (7) imamo
ln l ln l
0, ..., 0 (8)
1 r
48
n n
1 1 h
x
n
1 2
l e gdje je h
2 2 2 j
j 1
ln l n ln 2 n ln h
Prva jednačina u (8) je (ln l)/ = 0, tj.,
ln l h
xj 0
n n
1
2
j 1
odavde x
j 1
j n 0
1 n
ˆ xj x
n j 1
ln l n h
x 0
n
1 1 2
3
j
j 1
1 n
xj x 0
2
ˆ 2
n j 1
Ove procjene ćemo koristiti u Dijelu 2.7. Treba primijetiti da se ovo razlikuje od (2). Ne možemo
raspravljati o kriterijima dobre procjene, ali želimo spomenuti da je za malo n, formula (2) poželjnija.
Takav poseban simbol, CONF, čini se vrijednim kako bi se izbjegao nesporazum da se mora nalaziti
između 1 i 2.
se naziva nivo povjerenja, a 1 i 2 se nazivaju donjom i gornjom granicom povjerenja. Oni ovise o .
Što je odabrana veća vrijednost za , manja je vjerovatnoća greške 1 – , ali je duži interval povjerenja.
Ako 1, onda njegova dužina ide u beskonačnost. Izbor ovisi o vrsti primjene. Npr. nije tragično ako
postoji 5% šansi da ćemo pokisnuti ako izađemo bez kišobrana. Međutim, u medicinskoj odluci gdje se
radi o životu ili smrti, 5% šansi da je odluka pogrešna može biti preveliko i šansa od 1% bivanja u krivu
( = 99%) može biti poželjnija.
49
Intervali povjerenja su vredniji od tačaka procjene (Dio 2.2), jer, možemo uzeti sredinu od (1) kao
aproksimaciju i polovicu dužine (1) kao "granicu greške" (ne u strogom smislu granice greške, nego kao
grešku čiju vjerovatnoću znamo).
1 i 2 u (1) se izračunavaju iz uzorka x1, , xn. Ovo su n opažanja/uočavanja slučajne varijable X. Sada
dolazi uobičajeni trik. x1, , xn smatramo jednim opažanjima n slučajnih varijabli X1, , Xn (sa istom
raspodjelom, naime, onom od X). Tada su 1 = 1(x1, , xn) i 2 = 2(x2, , xn) u (1) uočene vrijednosti
dviju slučajnih varijabli 1 = 1(X1, , Xn) i 2 = 2(X1, , Xn). Uvjet (1) koji uključuje sada se može
napisati kao
P 1 2 (2)
U svakom slučaju u ovom dijelu prvo ćemo navesti korake dobijanja intervala povjerenja u obliku tabela,
a zatim razmotriti tipičan primjer, te konačno teoretski opravdati te korake.
Tablica 2.1 Određivanje intervala povjerenje za srednju vrijednost normalne raspodjele sa poznatom
varijansom 2
CONF x k x k (3)
Odredite 95% interval povjerenja za srednje vrijednosti normalne raspodjele varijanse 2 = 9 pomoću
uzorka od n = 100 vrijednosti čija je srednja vrijednost x̄ = 5.
Rješenje:
Korak 3. Dato je x̄ = 5;
50
Korak 4. Sračunati k = 1,960 ∙ 3/100 = 0,588 slijedi da je x̄ – k = 4,412 i x̄ + k = 5,588, a interval povjerenja je
Ovo se ponekad zapisuje kao 0,588, ali ovaj način može biti varljiv te ga nećemo koristiti. Upotrebom
kompjuterske aplikacije izravno možete odrediti ovaj interval. Slično je i sa ostalim primjerima u ovom
Dijelu.
Neka su X1, , Xn neovisne normalne slučajne varijable od kojih svaka ima srednju vrijednost i
varijansu 2. Iz ovoga slijedi.
1
X X1 ... X n (4)
n
X
Z (5)
n
DOKAZ: Tvrdnje o srednjoj vrijednosti i varijansi u (a) slijede iz Teorema 1 i 3 u Dijelu 1.9. Odavde i
Teoreme 2 u Dijelu 2.6, X̅ ima srednju vrijednost (1/n)n = i varijansu (1/n)2n 2 = 2/n. To znači da Z
ima srednju vrijednost 0 i varijansu 1, prema Teoremi 2(b) u Dijelu 2.6 Normalnost X1, , Xn se može
dokazati (vidi odgovarajuću literaturu). Ovo podrazumijeva normalnost (4) i (5).
Izvođenje (3) u Tabeli 2.1. Uzorkovanje iz normalne raspodjele daje neovisne vrijednosti uzorka (vidi Dio
25.1), tako da važi Teorema 1. Stoga možemo izabrati i odrediti c takve da je
X
P c Z c P c c c c (6)
n
Za vrijednost = 0,95 dobijemo z(D) = 1,960 iz Tabele D4 Dodatak 1, što je korišteno u Primjeru 1. Za
= 0,9, 0,99, 0,999 dobijemo ostale vrijednosti c navedene u Tabeli 2.1. Konačno, sve što moramo učiniti
jest izraziti nejednakost u (6) preko i uvrstiti uočene vrijednosti dobijene iz uzorka. Množimo –c Z c
sa –1 a potom sa /n i uz smjenu da je k = c/n (kao u Tabli 2.1),
X
P c Z c P c Z c P c
n
c P k X k
P X k X k (7)
51
Uvrštavanjem uočene vrijednosti x̄ od X̅ dobije se (3). Ovdje x1, , xn smatramo pojedinačnim
opažanjima od X1, , Xn (standardni trik!), tako da je x1 + + xn uočena vrijednost od X1 + + Xn i x̄
uočena vrijednost od X̅ . Zapazi da je nadalje (7) oblika (2) sa 1 = X̅ – k i 2 = X̅ + k.
Koliko veliko n mora biti u Primjeru 1 ako želimo dobiti 95% interval povjerenja dužine L = 0,4?
n 2c L
2
Slika 2.1 a) Dužina intervala povjerenja u funkciji veličine uzorka n za = 95% i = 99% prema (3) iz
Tabele 2.1 kad je 2 poznato i b) odnos dužina povjerenja prema (10) i (3) za isto i za s =
U ovom slučaju odgovor je n = (2 ∙ 1, 960 ∙ 3/0,4)2 870. Slika 2.1a prikazuje kako se L smanjuje
povećanjem n i da je za = 99% interval povjerenja znatno duži nego kad je = 95% (veličina uzorka n je
ista).
U praksi je 2 često nepoznato. Zato metoda u Tabeli 2.1 ne pomaže i cijela se teorija mijenja, iako
koraci određivanja intervala povjerenja za ostaju vrlo slični. Odgovarajući koraci prikazani su u Tabeli
2.2. Vidimo da se k razlikuje od onog u Tabeli 2.1, naime standardna devijacija uzorka s zauzima mjesto
nepoznate standardne devijacije populacije . c sada ovisi o veličini uzorka n i mora se odrediti iz Tabele
D5 u Dodatku 1 ili pomoću kompjuterske aplikacije. Tabela D5 daje vrijednosti z za određene vrijednosti
funkcije raspodjele (Slika 2.2a) t-raspodjele,
m 1
x
u2 2
F z Km 1 du (8)
m
Ovdje je m = (1, 2, ) parametar, nazvan broj stepeni slobode raspodjele (skraćeno s.s.). U ovom
slučaju m = n – 1, vidi Tabelu 2.2. Konstanta Km je takva da je F() =1. Integracijom se dobije
52
1 1
m
Km
2 2
1
m m
2
gdje je gama funkcija (vidi odgovarajuću literaturu).
Tabela 2.2 Određivanje intervala povjerenje za srednju vrijednost normalne raspodjele sa nepoznatom
varijansom 2
1
F c 1 (9)
2
CONF x k x k (10)
Slika 2.2b upoređuje krivulju gustoće t-raspodjele s onom normalne raspodjele. Kasnija je strmija. Ovo
ilustrira da Tabela 2.1 (koja koristi više informacija tj., poznatu vrijednost 2) daje kraće intervale
povjerenja od Tabele 2.2, što se vidi na Slici 2.1b, koja također daje predodžbu o prednosti veće veličine
uzorka.
53
PRIMJER 3: Intervala povjerenje srednje vrijednosti normalne raspodjele nepoznate varijanse 2
Pet neovisnih ispitivanja pritisne čvrstoće betonskih cilindara 15x30 cm, izvađenih iz tijela brane
Jablanica, dala su vrijednosti čvrstoća 66, 64, 63, 61, 62 (zaokružene vrijednosti u MPa). Pretpostavimo
normalnost raspodjele, odredite 99% interval povjerenja za srednju vrijednost.
Rješenje:
Korak 1. = 0,99;
Korak 4. Sračunati k = 4,6 ∙ 2,96/5 = 3,54 slijedi da je x̄ – k = 59,66 i x̄ + k = 66,74, a interval povjerenja
je CONF0,99 59,66 66,74.
Ako je varijansa 2 poznata i jednaka varijansi uzorka s2 tj., 2 = s2 = 2,96, tada će se iz Tabele 2.1 dobiti
k = c/n = 2,5762,96/5 = 1,98 i CONF0,99 61,22 65,18. Vidimo da interval dobijen iz Tabele 2.2
gotovo dvostruko duži od onog dobijenog iz Tabele 2.1 (sa 2 = 2,96). Dakle za manji broj uzoraka razlika
je znatna! Vidi Sliku 2.1b.
Neka su X1, , Xn neovisne normalne slučajne varijable od kojih svaka ima istu srednju vrijednost i istu
varijansu 2. Onda slučajna varijabla
X
T (11)
S n
Ima t-raspodjelu (vidi (8)) sa n – 1 stepeni slobode (s.s.); ovdje je X̅ dato sa (4) i
1 n
Xj X
2
S2 (12)
n 1 j 1
Izvođenje (10) u Tabeli 2.2. Ovo je slično izvođenju (3). Odaberemo broj između 0 i 1 i odredimo broj c
iz tablice D5 u Dodatku 1 sa n – 1 s.s. tako da je
P c T c F c F c (13)
F c 1 F c
i (13) poprima formu (9). Zamjenjujući (11) u (13) i uz transformaciju rezultat kao prije, dobijamo
P X K X K (14)
54
gdje je
K cS n
Tabela 2.3 prikazuje korake koji su slični onima u Tabelama 2.1 i 2.2.
Tabela 2.3 Određivanje intervala povjerenje za varijansu 2 normalne raspodjele čiju srednju vrijednost
ne treba poznavati
1 1
F c1 1 i F c2 1 (15)
2 2
CONF k2 2 k1 (16)
Odredite 95% interval povjerenja za varijansu, koristeći Tabelu 25.3 i uzorak (zatezna čvrstoća čeličnog
lima u MPa zaokruženu na cijele vrijednosti): 89, 84, 87, 81, 89, 86, 91, 90, 78, 89, 87, 99, 83, 89.
Rješenje:
Korak 4. Sračunati k1 = 13s2/c1 = 65,25 i k2 = 13s2/c2 = 13,21, a interval povjerenja za varijansu je:
Ovo je prilično velika dužina, a za postizanje boljeg rezultata potreban je mnogo veći uzorak.
Teorija za Tabelu 2.3. U Tabeli 2.1 korištena je normalna raspodjela, u Tabeli 2.2 t-raspodjela, a sada
ćemo koristiti 2-raspodjelu (chi-kvadrat raspodjelu), čija je funkcija raspodjele F(z) = 0 ako je z < 0 i
55
z u m 2
F z Cm e 2
u 2
du ako je z 0 (Slika 2.3)
0
1
Cm
m
m
2
2
2
S2
Y n 1 (17)
2
Izvođenje (16). Ovo je slično izvođenju (3) i (10). Odaberemo broj između 0 i 1 između 0 i 1 i odredimo
c1 i c2 iz Tabele D6, Dodatak 1, tako da [vidi (15)]
1 1
P Y c1 F c1 1 , P Y c2 F c2 1
2 2
Oduzimanjem imamo
56
Transformacijom c1 Y c2 sa Y iz (17) u nejednačinu po 2 dobijemo
n 1 2 n 1 2
S 2 S
c2 c1
Znamo da ako su X1, , Xn neovisne slučajne varijable sa istom srednjom vrijednosti i jednakom
varijansom 2, njihova suma Yn = X1 + + Xn ima sljedeća svojstva:
Ako slučajne varijable nisu normalne, tada (B) nije primjenjivo. Međutim, kad je n veliko slučajna
varijabla Yn još uvijek je približno normalna. Ovo proizlazi iz centralnog graničnog teorema, koji je jedan
od najvažnijih rezultata u teoriji vjerovatnoće.
Neka su X1, , Xn neovisne normalne slučajne varijable koje imaju iste funkcije raspodjele i stoga istu
srednju vrijednost i istu varijansu 2. Neka je Yn = X1 + + Xn. Onda je slučajna varijabla
Yn n
Zn (18)
n
x u2
1
lim Fn x x e 2
du
n
2
Stoga, pri primjeni Tablica 2.1 do 2.3 na nenormalnu raspodjelu, moramo koristiti dovoljno velike
uzorke. Za brzu procjenu, ako uzorak ukazuje da je asimetričnost raspodjele mala, treba koristiti barem
n = 20 za srednju vrijednost i najmanje n = 50 za varijansu.
Ideje intervala povjerenja i testova su dvije najvažnije ideje u suvremenoj statistici. U statističkom testu
o populaciji zaključujemo iz uzorka kroz testiranje hipoteza, koje proistječu iz iskustva ili opažanja, iz
teorije ili zahtjeva kvalitete, itd.. U mnogim slučajevima rezultat testa se koristi kao osnova za odluke, na
57
primjer, kupiti (ili ne kupiti) određeni model automobila ovisno o testu učinkovitosti goriva
(litara/kilometar ili naravno neki drugih testovi), primijeniti neki lijek ovisno o testu njegovog učinka;
nastaviti s marketinškom strategijom ovisno o testu reakcija potrošača itd.
Objasnimo takav test u smislu tipičnog primjera i uvedimo odgovarajuće standardne pojmove
statističkog testiranja.
Želimo kupiti 100 armaturnih šipki 18 mm, pod uvjetom da možemo potvrditi tvrdnju proizvođača da
šipke imaju granicu kidanja = 0 = 200 kN (ili više). Ovo je hipoteza koju treba testirati (također se zove
nulta-hipoteza) = 0 = 200 kN. Nećemo kupiti šipke ako (statistički) test pokaže = 1 < 0 da su šipke
zapravo slabije čvrstoće, tj. da je tvrdnja proizvođača netačna. 1 se naziva alternativa (ili alternativna
hipoteza) testa. Prihvaćamo hipotezu ako test nagovještava da je ona istinita, osim za malu
vjerovatnoću greške koja se naziva nivo značaja testa. Inače odbacujemo hipotezu. Stoga je
vjerovatnoća odbacivanja hipoteze čak i ako je istinita. Vrijednosti se biraju, a popularne su 5% i 1%.
Za test trebamo uzorak. Nasumično odabiremo 25 šipki od svake odrežemo komad i eksperimentalno
odredimo granicu kidanja. Pretpostavimo da uzorak od n = 25 vrijednosti granice kidanja, ima srednju
vrijednost x̄ = 197 kN (nešto manje od zahtjeva!) i standardnu devijaciju s = 6 kN.
U ovom trenutku možemo samo nagađati da li je ta razlika 197 – 200 = –3 zbog slučajnosti, ili je
značajna, zapravo zbog lošijeg kvaliteta šipki. Da svoju odluku ne bismo zasnivali na špekulaciji, potrebna
nam je teorija vjerovatnoće, kako slijedi.
X 0
T
S n
varijabla u (11), Dio 2.3 sa = 0 ima t-raspodjelu sa n – 1 stepeni slobode (n – 1 = 24 za naš uzorak).
Također, x̄ = 197 i s = 6 kN su uočene vrijednosti od X̅ i S koje ćemo iskoristiti kasnije. Sada možemo
odabrati nivo značaja, recimo, = 5%. Iz Tabele D5 u Dodatku 1, ili kompjuterske aplikacije možemo
dobiti kritično c tako da je P(T c) = = 5%. Za P(T c̃) = 1 – = 95%. Tabele D5 daje c = – c̃ = –1,71
zbog simetrije raspodjele, Slika 2.4.
Sada razmišljamo na sljedeći način i ovo je ključna ideja testa. Ako je hipoteza istinita, imamo samo
(= 5%) šansi da iz opita opažanjem dobijemo vrijednost t od T (izračunato iz uzorka) koja će pasti
između – i –1,71. Stoga, ako ipak opazimo takav t, tvrdimo da hipoteza ne može biti istinita i odbijemo
je. Tada prihvaćamo alternativu. Međutim, ako je t c prihvatamo hipotezu.
Jednostavan proračun konačno daje t = (197 – 200)/(625) = –2,5 kao uočenu vrijednost od T. Pošto je
–2,5 < –1,71 odbacujemo hipotezu (tvrdnju proizvođača) i prihvatamo alternativu = 1 < 200 jer čini se
da su šipke slabijeg kvaliteta od tvrdnje.
58
Slika 2.4 t-raspodjela u Primjeru 1
4. Upotrijebite slučajnu varijablu ̂ = g(X1, , Xn) čija raspodjela ovisi o hipotezi i alternativi, a ta
raspodjela je poznata u oba slučaja. Odredite kritičnu vrijednost c iz raspodjele
̂ uz pretpostavku da je
̂ = T, a c je dobijeno iz P(T c) = ).
hipoteza istina. (U primjeru
6. Prihvatiti ili odbaciti hipotezu, ovisno o veličini ̂ spram c. (t < c u primjeru, odbacivanje hipoteze.)
Dvije važne činjenice zahtijevaju daljnju raspravu i pažnju. Prva je izbor alternative. U primjeru 1 < 0,
ali druge primjene mogu zahtijevati 1 > 0 ili 1 0. Druga činjenica ima veze s greškama. Znamo da je
(nivo značaja testa) vjerovatnoća odbacivanja istinite hipoteze. Međutim, raspravljat ćemo i o
vjerovatnoći prihvatanja neistinite hipoteze.
Neka je nepoznati parametar u raspodjeli, i pretpostavimo da želimo testirati hipotezu = 0. Tada
postoje tri glavne vrste alternativa, naime,
0 (1)
0 (2)
0 (3)
59
Slika 2.5 Test u slučaju alternative (1) (slika na vrhu), alternative (2) (srednji dio) i alternative (3)
Područje odbacivanja (ili kritično područje). Ako ovo područje sadrži uočenu vrijednost u testu,
hipotezu odbacujemo. U ① kritično c, kao i alternativa, leže s desne strane 0. Znači područje
odbacivanja proteže se desno. Ovo se naziva desnostranim testom. U ② kritično c leži lijevo od 0 (kao
u Primjeru 1), područje odbacivanja proteže se lijevo i imamo lijevostrani test (Slika 2.5, srednji dio).
Ovo su jednostrani testovi. U ③ imamo dva područja odbacivanja, te je ovo dvostrani test (Slika 2.5,
donji dio).
Sve tri vrste alternative pojavljuju se u praktičnim problemima. Na primjer, (1) se može desiti ako je 0
najveća podnošljiva netačnost voltmetra ili nekog drugog mjernog instrumenta. Alternativa (2) se može
desiti u ispitivanju čvrstoće materijala, kao u Primjeru 1. Konačno, 0 u (3) može biti prečnik rude, a
previše tanke ili previše debele rude su jednako nepoželjne, tako da moramo pazite na odstupanja u oba
smjera.
Jasno je da se ove greške ne mogu izbjeći, jer se iz uzoraka ne mogu izvesti apsolutno sigurni zaključci o
populaciji. Međutim, pokazat ćemo da postoje putevi i načini odabira odgovarajućih nivoa rizika, tj.
vrijednosti i . Izbor ovisi o prirodi problema (npr. mali rizik = 1% se koristi ako je riječ o životu ili
smrti).
60
Razmotrimo ovo sistematično za test hipoteze = 0 spram alternative koja je, radi jednostavnosti,
jedan broj 1. Neka je 1 > 0 tako da imamo desnostrani test. Za lijevostrani ili dvostrani test rasprava je
vrlo slična.
Izabrali smo kritično c > 0 (kao u gornje dijelu Slike 2.5), metodama koje su opisane u nastavku. Iz datog
uzorka x1, , xn sračunamo vrijednost
ˆ g x1,..., xn
s odgovarajućim g (čiji će izbor biti glavna tačka naše daljnje rasprave, npr. uzmimo g = (x1 + + xn)/n u
slučaju kada je srednja vrijednost). Ako je ̂ > c odbacujemo hipotezu. Ako je ̂ c prihvatamo je.
Ovdje se vrijednost ̂ može smatrati uočenom vrijednošću slučajne varijable
ˆ g X1,..., X n
(4)
jer se xj može smatrati uočenom vrijednošću od Xj, j = 1, , n. U ovom testu postoje dvije mogućnosti
greške, kako slijedi:
Greška tipa I (vidi Tabelu 2.4). Hipoteza je istina, ali je odbačena (stoga je alternativa prihvaćena) jer
̂ poprima vrijednost ̂ > c. Očito, vjerovatnoća činjenja takve greške jednaka je
ˆ c
P 0
(5)
̂ poprima vrijednost ̂ c.
Greška tipa II (vidi Tabelu 2.4). Hipoteza je pogrešna, ali je prihvaćena jer
Vjerovatnoća činjenja takve greške označena je sa te je
ˆ c
P 1
(6)
= 1 – naziva se snagom testa. Očito, snaga je vjerovatnoća izbjegavanja greške tipa II.
Nepoznata istina
= 0 = 1
ispravna odluka greška tipa II
prihvaćeno
= 0 P=1– P=
greška tipa I ispravna odluka
= 1 P= P=1–
Formule (5) i (6) pokazuju da oboje i ovise o c, a želimo odabrati c takvo da su vjerovatnoće grešaka
što je moguće manje. Međutim, važna Slika 2.6 pokazuje da su to suprotstavljeni zahtjevi jer
smanjenjem moramo c pomaknuti desno, što onda povećava . U praksi najprije odaberemo (5%
ponekad 1%), a zatim odredimo c, i konačno izračunavamo . Ako je veliko tako da je snaga = 1 –
mala, trebali bismo ponoviti test, odabirati veći uzorak, iz razloga koji će se uskoro pojaviti.
61
Ako alternativa nije jedan broj, već je u obliku (1) do (3), tad postaje funkcija od . Ova funkcija ()
naziva se operativna karakteristika (OC) testa, a njegova kriva OC kriva. Jasno, u ovom slučaju = 1 –
također ovisi o . Ova funkciji () naziva se funkcija snage testa. (Primjeri slijede.)
Naravno, iz testa koji vodi do prihvatanja određene hipoteze 0, ne slijedi da je to jedina moguća
hipoteza ili najbolja moguća hipoteza. Stoga je pojam "ne odbacuj" možda bolji od pojma "prihvatiti".
Rješenje: Odabiremo nivo značaja = 0,05. Procjenu srednje vrijednosti dobit ćemo iz
1
X X1 ... X n
n
Ako je hipoteza istina, X̅ je normalne raspodjele sa srednjom vrijednosti = 24 i varijansom 2/n = 0,9,
vidi Teoremu 1, Dio 2.3.
Slučaj (a). Desnostrani test. Određujemo c iz P(X̅ > c) = 24 = = 0,05 tj.
c 24
P X c 24
1 0,95
0,9
Tabela D4 u Dodatku 1 daje (c – 24)/0,9 = 1,645 i c = 25,56 koje je veće od 0, kao u vrhu Slike 2.5. Ako
je x̄ 25,56 hipoteza je prihvaćena. Ako je x̄ > 25,56 hipoteza se odbacuje. Funkcija snage testa je (vidi
Sliku 2.7)
62
P X 25,56 1 P X 25,56
25,56 (7)
1 1 26,94 1,05
0,9
Slika 2.7 Funkcija snage () u Primjeru 2, slučaj (a) (crtkana kriva) i slučaj (c)
c 24
P X c 24
0,05
0,9
Tabela D4 u Dodatku 1 daje c = 24 – 1,56 = 22,44 Ako je x̄ 22,44 hipoteza se prihvata. Ako je x̄ < 22,44
hipoteza se odbacuje. Ako odbijemo. Funkcija snage testa je
P X 22,44
22,44 (8)
23,65 1,05
0,9
Slučaj (c). Dvostrani test. Budući da je normalna raspodjela simetrična, izaberimo c1 i c2 jednako
udaljene od = 24, recimo, c1 = 24 – k i c2 = 24 + k potom odredimo k iz
k k
P 24 k X 24 k 24
1 0,95
0,9 0,9
Tabela D4 u Dodatku 1 daje k/0,9 = 1,960 te je k = 1,86. Ovo daje vrijednosti c1 = 24 – 1,86 = 22,14 i
c2 = 24 + 1,86 = 25,86. Ako x̄ nije manje od c1 i nije veće od c2 hipoteza je prihvaćena. Inače je
odbacujemo. Funkcija snage testa je (Slika 2.7)
22,44 25,86
1 (9)
0,9 0,9
1 23,34 1,05 27,26 1,05
63
Shodno tome, operativna karakteristika () = 1 – () (vidi prije) je (Slika 2.8)
Slika 2.8 Krivulje operativne karakteristike (OC krivulje) u Primjeru 2, slučaj (c), za dvije različite veličine
uzorka n
Ako uzmemo veći uzorak, recimo veličine n = 100 (umjesto 10), onda je 2/n = 0,09 (umjesto 0,9), a
kritične vrijednosti su c1 = 23,41 i c2 = 24,59 što se lako može potvrditi. Tada je operativna karakteristika
testa
24,59 23, 41
81,97 3,33 78,03 3,33
0,09 0,09
Slika 2.8 pokazuje da je odgovarajuća OC krivulja strmija od one za n = 10. To znači da je povećanje n
dovelo do poboljšanja testa. U svakom praktičnom slučaju odabire se što je moguće manji n, ali toliko
velik da odstupanja između i 0 dobijena testom budu od praktičnog interesa. Na primjer, ako je
odstupanje od interesa 2 jedinice, na Slici 2.8 vidimo da je n = 10 previše malo jer kad je = 24 – 2 = 22
ili = 24 + 2 = 26, je gotovo 50%. S druge strane, vidimo da je n = 100 dovoljno za tu svrhu.
Mjerena je zatezna čvrstoća uzorka n = 16 užadi (prečnika 7,6 cm). Srednja vrijednost uzorka bila je
x̄ = 44,82 kN, a standardna devijacija = 1,15 kN. Pod pretpostavkom da je zatezna čvrstoća normalna
slučajna varijabla, testirajte hipotezu 0 = 45 kN spram alternative 1 = 44 kN. Ovdje 0 može biti
vrijednost koju je dao proizvođač, dok bi 1 mogao biti rezultat prethodnog iskustva.
Rješenje: Odabiremo nivo značaja = 5%. Ako je hipoteza istinita, iz Teoreme 2 u Dijelu 2.3, slijedi da
slučajna varijabla ima
X 0 X 45
T
S n S 4
64
t-raspodjelu sa n – 1 = 15 s.s. Test je lijevostrani. Kritično c dobijemo iz P(T < c) 0 = = 0,05. Iz Tabele D5
u Dodatku 1 dobijemo vrijednost c = –1,75. Kao uočenu vrijednost od T iz uzorka dobijamo da je
t = (44,82 – 45,00)/(1,15/4) = –0,626. Vidimo da je t > c te hipotezu prihvatimo. Za dobijanje numeričkih
vrijednosti snage testa trebali bi imati tabelu za necentralnu studentsku t-raspodjelu. O ovom pitanju
ovdje nećemo raspravljati.
S2 S2
Y n 1 14 1,4S 2
02 10
i Tabele D6 u Dodatku 1 sa 14 stepeni slobode dobijamo c = 23,68. Ovo je kritična vrijednost Y. Dakle
jednačini S2 = Y02/(n – 1) = 0,714Y odgovara kritična vrijednost c* = 0,714 23,68 = 16,91. Pošto je
s2 = c* hipotezu prihvatimo.
Ako je alternativa istinita, slučajna varijabla Y = 14 S2/12 = 0,7S2 ima chi-kvadrat raspodjelu sa 14 s.s.
Stoga test ima snagu
P S 2 c
P Y1 0,7c 1 P Y1 11,84 2 20
2 20 2 20
Iz proširenih tabela za chi-kvadrat raspodjelu, ili putem kompjuterske aplikacije, može se vidjeti da je
62%. Stoga je rizik Tipa II od 38% vrlo velik. Da bi rizik bio manji treba povećati veličinu uzorka.
Pomoću uzorka x1, , xn normalne raspodjele sa nepoznatom srednjom vrijednosti x i uzorka y1, , yn
također normalne raspodjele sa nepoznatom srednjom vrijednosti y želimo testirati hipotezu da su
srednje vrijednosti jednake x = y protiv alternative, recimo, x > y. Varijanse ne moraju biti poznate,
ali se pretpostavlja da su jednake.1
1
Ova se pretpostavka jednakosti varijansi može testirati, kao što je prikazano u sljedećem primjeru. Ako test
pokazuje da se značajno razlikuju, odaberite dva uzorka iste veličine n1 = n2 = n (da nisu premaleni, n > 30, recimo),
koristite test u primjeru 2 zajedno s činjenicom da je (12) uočena vrijednost približno standardizirane normalne
slučajne varijable.
65
Slučaj A. Uzorci su iste veličine. Nadalje, svaka vrijednost prvog uzorka odgovara točno jednoj vrijednosti
drugog, jer odgovarajuće vrijednosti proizlaze iz iste osobe ili stvari – npr., dva mjerenja iste stvari
dvjema različitim metodama, ili dva mjerenja sa dva oka iste osobe. Općenitije, ona mogu biti rezultat
parova sličnih pojedinaca ili stvari, na primjer, identičnih blizanaca, para korištenih prednjih guma sa
istog automobila itd. Tada bi trebali formirati razlike odgovarajućih vrijednosti i testirati hipotezu da
populacija razlika ima srednju vrijednost 0, koristeći metodu u Primjeru 3. Ako možemo birati ova
metoda je bolja od sljedeće.
Slučaj B. Dva uzorka su neovisna i nisu nužno jednake veličine. Tada možemo nastaviti kako slijedi.
Pretpostavimo da je alternativa x > y. Izabiremo nivo značaja . Nakon toga možemo izračunati
srednje vrijednosti uzoraka x̄ i ȳ kao i (n1 – 1)sx2 i (n2 – 1)sy2 gdje su sx2 i sy2 varijanse uzoraka. Upotrebom
Tabele D5 u Dodatku 1 sa n1 + n2 – 2 stepeni slobode, treba odrediti c iz
P T c 1 (10)
Konačno izračunamo
n1n2 n1 n2 2 x y
t0 (11)
n1 n2 n1 1 sx2 n2 1 sy2
Može se pokazati da je ovo uočena vrijednost slučajne varijable koja ima t-raspodjelu sa n1 + n2 – 2
stepeni slobode, pod uvjetom da je hipoteza istinita. Ako je t0 c hipoteza se prihvaća. Ako je t0 > c
odbacuje se.
x y
t0 n (12)
sx2 sy2
Da bismo prikazali proračun, razmotrimo dva uzorka (x1, , xn) i (y1, , yn) koja su data sa
Ove vrijednosti pokazuju relativni učinak radnika na proizvodnji limenih ploča pod dva različita radna
uvjete. Pretpostavljajući da su odgovarajuće populacije normalne i da imaju istu varijansu, testirajmo
hipotezu x = y spram alternative x y. (Jednakost varijansi će se testirati u sljedećem primjeru.)
Odabiremo nivo značaja = 5%. Iz (10*) sa 0,5 = 2,5% i 1 – 0,5 = 97,5% i Tabele D5 u Dodatku 1 sa 14
stepeni dobjemo c1 = –2,14 i c2 = 2,14. Formula (12) sa n = 8 daje vrijednost
66
7,625
t0 8 1,56
190,125
Pošto je c1 t0 c2 prihvatamo hipotezu x = y da je pod oba uvjeta srednja vrijednost učinka ista.
Slučaj A je primjenjiv u ovom primjeru jer prve dvije vrijednosti uzorka odgovaraju određenoj vrsti posla,
druge dvije su dobijene za drugu vrstu posla itd. Tako da možemo koristiti razlike
16 16 2 6 0 0 13 8
odgovarajućih vrijednosti uzoraka i metod iz Primjera 3 za test hipoteze = 0 gdje je srednja vrijednost
populacije razlika. Kao logičnu alternativu uzmemo 0. Srednja vrijednost uzorak je d̄ = 7,625 a
varijansa uzorka je s2 = 45,696. Stoga je
7,625 0
t 8 3,19
45,696
Iz P(T c1) = 2,5%, P(T c2) = 97,5% i Tabele D5 u Dodatku 1 sa n – 1 = 7 stepeni slobode dobijamo
c1 = –2,36 i c2 = 2,36. Hipotezu odbacujemo, jer t = 3,18 ne leži između c1 i c2. Dakle, naš sadašnji test, u
kojem smo koristili više informacija (ali iste uzorke), pokazuje da je razlika u učinku značajna.
Koristeći dva uzorka u posljednjem primjeru, testirati hipotezu x2 = y2 pretpostavljajući da su
odgovarajuće populacije normalne a priroda eksperimenta sugeriše alternativu x2 > y2.
Rješenje: Našli smo da su sx2 = 106,125; sy2 = 84,000. Odabrali smo nivo značaja = 5%. Korištenjem
P(V c) = 1 – = 95% i Tabela D7 u Dodatku 1 sa (n1 – 1, n2 – 1) = (7, 7) stepeni slobode, odredili smo da
je c = 3,79. Konačno sračunamo v0 = sx2/sy2 = 1,26. Pošto je v0 c prihvatamo hipotezu. Da je v0 < c
odbacili bismo je.
Ovaj se test opravdava činjenicom da je v0 uočena vrijednost slučajne varijable koja ima tzv. F-raspodjelu
sa (n1 – 1, n2 – 1) stepeni slobode, pod uvjetom da je hipoteza istinita. F-raspodjela sa (m, n) stepeni ima
funkciju raspodjele F(z) = 0 ako je z < 0 i
z m 2 mn
F z K mn t mt n z 0
2 2 dt ,
0
Gdje je
m n
m
n
K mn m n2 2 2
2
m n
2 2
Ovaj dugački Dio sadrži osnovne ideje i pojmove testiranja, zajedno s tipičnim primjenama. Možda biste
ga trebali ponoviti prije nego što nastavite, budući da se sljedeći Dijelovi zasnivaju na primjeni ovih ideja
na poslove od velike praktične važnosti.
67
2.5 Kontrola kvaliteta
Ideje o testiranju mogu se prilagoditi i proširiti na različite načine kako bi služile osnovnim praktičnim
potrebama u inženjerskom i drugim područjima. U preostalim dijelovima skripte biće riječi o nekim od
najvažnijih zadataka koji se mogu riješiti statističkim metodama. Prvo takvo područje razmatranja biće
kontrola kvaliteta u industriji, kao vrlo uspješna metoda koja se koristi u raznim granama industrije.
Nijedan proizvodni proces nije tako savršen da su svi proizvodi potpuno isti. Uvijek postoji mala varijacija
uzrokovana velikim brojem malih, nekontroliranih faktora i stoga se mora smatrati slučajnom
varijacijom. Važno je osigurati da proizvodi imaju potrebne vrijednosti (npr., dužinu, čvrstoću ili bilo koja
osobina koja se zadesi u konkretnom slučaju). U tu svrhu napravimo test hipoteze da proizvodi imaju
potrebnu osobinu, recimo, = 0 gdje je 0 potrebna vrijednost. Ako je to učinjeno nakon što je
proizvedena cijela serija (npr., serija od 100.000 vijaka), test će nam reći koliko su dobri ili loši proizvodi,
ali očito je prekasno mijenjati neželjene rezultate. Mnogo je bolje testirati u toku proizvodnje. To se vrši
u pravilnim vremenskim razmacima (na primjer, svaki sat ili pola sata) i zove se kontrola kvalitete. Svaki
put uzima se uzorak iste veličine, u praksi 3 do 10 puta. Ako se hipoteza odbaci, zaustavljamo
proizvodnju i tražimo uzrok problema.
Ako zaustavimo proizvodni proces iako on ispravno napreduje, pravimo grešku Tipa I. Ako ne zaustavimo
proces, iako nešto nije u redu, činimo grešku Tipa II (vidi Dio 2.4). Rezultat svakog testa se predstavlja u
grafičkoj formi na onome što se zove kontrolni dijagram.
Ilustracija i primjer kontrolnog dijagrama prikazana je na lijevoj strani Slike 2.9 (vrijednosti iz Tabele 2.5).
Ovaj kontrolni dijagram za srednju vrijednost prikazuje donju kontrolnu granicu LCL (lower control limit),
centralnu kontrolnu liniju CL (center control line) i gornju kontrolnu granicu UCL (upper control limit).
Dvije kontrolne granice odgovaraju kritičnim vrijednostima c1 i c2 u slučaju (c) iz Primjera 2 u Dijelu 2.4.
Slika 2.9 Kontrolni dijagrami srednje vrijednosti (lijevo) i standardnu devijaciju za uzorak iz Tabele 2.5
68
Čim srednja vrijednost uzorka padne izvan raspona između kontrolnih granica, odbacujemo hipotezu i
tvrdimo da je proces proizvodnje "izvan kontrole"; tj. tvrdimo da je došlo do promjene u nivou procesa.
Kad god tačka prekorači granice treba poduzeti stanovite mjere.
Tabela 2.5 Dvanaest uzoraka od kojih svaki ima pet vrijednosti (vrijednosti za kontrolne dijagrame na
Slici 2.9 – prečnik malih cilindara u milimetrima)
Uzorak
vrijednosti uzorka x̄ s R
br.
1 4,06 4,08 4,08 4,08 4,10 4,08 0,01 0,04
2 4,10 4,10 4,12 4,12 4,12 4,11 0,01 0,02
3 4,06 4,06 4,08 4,10 4,12 4,08 0,03 0,06
4 4,06 4,08 4,08 4,10 4,12 4,09 0,02 0,06
5 4,08 4,10 4,12 4,12 4,12 4,11 0,02 0,04
6 4,08 4,10 4,10 4,10 4,12 4,10 0,01 0,04
7 4,06 4,08 4,08 4,10 4,12 4,09 0,02 0,06
8 4,08 4,08 4,10 4,10 4,12 4,10 0,02 0,04
9 4,06 4,08 4,10 4,12 4,14 4,10 0,03 0,08
10 4,06 4,08 4,10 4,12 4,16 4,10 0,04 0,10
11 4,12 4,14 4,14 4,14 4,16 4,14 0,01 0,04
12 4,14 4,14 4,16 4,16 4,16 4,15 0,01 0,02
Ako odaberemo previše razmaknute kontrolne granice, nećemo otkriti promjene u procesu. S druge
strane, ako su kontrolne granice previše zbijene, nećemo moći pokrenuti proces zbog čestih potraga za
nepostojećim problemima. Uobičajena nivo značaja je = 1%. Iz Teoreme 1 u Dijelu 2.3 i Tabele D4 u
Dodatku 1 vidimo da su u slučaju normalne raspodjele odgovarajuće kontrolne granice za srednju
vrijednost
LCL 0 2,58 i UCL 0 2,58 (1)
n n
Dodatne, suptilnije kontrole često se koriste u industriji. Npr., posmatra se kretanje srednje vrijednosti
uzorka iznad i ispod centralne linije, što bi se trebalo često događati. Međutim, dugo protezanje (obično
dužine 7 ili više) svih srednjih vrijednosti iznad (ili da su sve ispod) centralne linije može ukazivati na
problem.
Uz srednju vrijednost, često se kontrolira varijansa, standardna devijacija ili raspon. Kod izrade
kontrolnog dijagrama za varijansu u slučaju normalne raspodjele, za uspostavu kontrolnih granica
možemo koristiti metodu u Primjeru 4 Dio 2.4. Uobičajeno je uspostaviti samo jednu kontrolnu granicu,
naime, gornju kontrolnu granicu. Sada iz Primjera 4, Dio 2.4 imamo S2 = Y02/(n – 1) gdje, zbog
pretpostavke o normalnosti, slučajna varijabla Y ima chi-kvadrat raspodjelu sa n – 1 stepeni slobode.
Stoga je željena kontrolna granica
69
2c
UCL (2)
n 1
P Y c , tj., P Y c 1
i Tabele chi-kvadrat raspodjele (Tabela D6 u Dodatku 1) sa n – 1 stepeni slobode (ili putem kompjuterske
aplikacije). Ovdje je (recimo 5% ili 1%) vjerovatnoća da je u ispravnom procesu posmatrana vrijednost
s2 od S2 veća od gornje kontrolne granice.
Ako bismo željeli kontrolni dijagram za varijansu sa obe i gornjom i donjom kontrolnom granicom UCL i
LCL, ta bi ograničenja bila
2c1 2 c2
LCL i UCL (3)
n 1 n 1
P Y c1 i P Y c2 1 (4)
2 2
Za uspostavu kontrolnog dijagrama za standardnu devijaciju potrebno nam je gornja kontrolna granica
c
UCL (5)
n 1
P Y c 1 99%
što je prikazano na desnoj strani Slike 2.9. Kontrolni dijagram za standardnu devijaciju s gornjom i
donjom kontrolnom granicom dobija se iz (3).
Umjesto varijanse ili standardne devijacije, često se kontrolira raspon R (= najveća vrijednost uzorka
minus najmanja vrijednost uzorka). Može se pokazati da je u slučaju normalne raspodjele standardna
devijacija proporcionalna očekivanju slučajne varijable R* za koju je R uočena vrijednost, recimo,
= nE(R*) gdje faktor proporcionalnosti n ovisi o veličini uzorka n i ima vrijednosti
70
n 2 3 4 5 6 7 8 9 10
n = /E (R*) 0,89 0,59 0,49 0,43 0,40 0,37 0,35 0,34 0,32
n 12 14 16 18 20 30 40 50
n = /E (R*) 0,31 0,29 0,28 0,28 0,27 0,25 0,23 0,22
Uzorkovanje prihvatanja obično se obavlja kada proizvodi napuste fabriku. Standardna situacija u
uzorkovanju prihvatanja je da proizvođač isporučuje potrošaču (kupcu ili veletrgovcu) veliki broj N
predmeta (npr. sanduka vijaka). Odluka o prihvatanju ili odbijanju partije vrši se utvrđivanjem broja x
defektnih stvari u uzorku veličine n iz partije. Partija je prihvaćena ako je x c gdje se c naziva broj
prihvatanja, koji određuje dopušteni broj defektnih stvari. Ako je x > c potrošač odbija partiju. Jasno,
proizvođač i potrošač moraju se složiti oko određenog plana uzorkovanja koji određuje n i c.
Iz hipergeometrijske raspodjele vidimo da je događaj A: "Prihvati partiju" ima vjerovatnoću (vidi Dio 1.7)
c
M N M N
P A P X c (1)
x 0 x n x n
gdje M predstavlja broj defektnih stvari u partiji od N stvari. Udio defektnih stvari može se izraziti preko
odnosa = M/N tada se (1) može napisati kao
c
N N N N
P A; (2)
x 0 x n x n
P(A; ) može poprimiti n + 1 vrijednosti koje odgovaraju = 0, 1/N, 2/N, , N/N. Ovdje, su n i c fiksni.
Neprekidna monotona krivulja kroz ove točke naziva se operativna karakteristična krivulja (OC krivulja)
razmatranog plana uzorkovanja.
Pretpostavimo da su određeni dijelovi alata pakirani 20 komada u kutiju i da se koristi sljedeći plan
uzorkovanja. Izvlače se uzorak od dva predmete, a odgovarajuća kutija je prihvaćena ako i samo ako su
oba predmeta u uzorku ispravna. U ovom slučaju, N = 20, n = 2 i c = 0 a (2) ima oblik
Vrijednosti P(A; ) za = 0, 1/20, 2/20, , 20/20 i rezultirajuća OC kriva su prikazane na Slici 2.10a.
71
Slika 2.10 a) OC kriva Primjer 1; OC kriva Primjer 2
U većini praktičnih slučajeva će biti malo (manje od 10%) i ako još uzmemo male uzorke u odnosu na
N, (2) možemo aproksimirati Poissonovom raspodjelom (Dio 2.7).
c
x
P A; ~ e ( = n) (3)
x 0 x!
Pretpostavimo da se za velike partije koristi sljedeći plan uzorkovanja. Uzet je uzorak veličine n = 20.
Ukoliko uzorak sadrži ne više od jednog defektne stvari, partija je prihvaćena. Ako uzorak sadrži dvije ili
više defektne stvari, partija je odbijena. U ovom planu se iz (3) dobije
Pokazali smo kako se uzorkovanje prihvatanja uklapa u opću teoriju testiranja (Dio 2.4) i što to znači s
praktičnog aspekta. Proizvođač želi da je vjerovatnoća odbacivanja prihvatljive partije stvari (partije
za koju ne prelazi određeni broj 0 sa kojim se slažu obe strane) mala. 0 se naziva prihvatljivi nivo
kvaliteta (acceptable quality level AQL). Slično tome, potrošač (kupac) želi da je vjerovatnoća
prihvatanja neprihvatljive partije (partija za koju je veće ili jednako od nekog 1) također mala. 1 se
zove tolerantni procenat defektnih stvari u partiji (lot tolerance percent defective LTPD) ili odbačeni
nivo kvaliteta (rejectable quality level RQL). se naziva rizik proizvođača, a odgovara grešci tipa I u
Dijelu 2.4. se naziva rizikom potrošača i odgovara grešci tipa II. Na Slici 2.11 prikazan je primjer.
Vidimo da tačke (0, 1 – ) i (1, ) leže na OC krivoj. Može se pokazati da za velike partije možemo
odabrati 0, 1 (> 0), i , te zatim odrediti n i c takve da OC krivulja prolazi vrlo blizu propisanih tačaka.
72
Slika 2.11 OC kriva proizvođačev i potrošačev rizik
Tabela 2.6 prikazuje analogiju između uzorkovanja prihvatanja i testiranja hipoteze u Dijelu 2.4.
2.6.2 Ispravljanje
Ispravljanje odbačene partije znači da se partija pregledava predmet po predmet, a sve defektne stvari
se uklanjaju i zamjenjuju ispravnim. (To bi moglo biti preskupo ako je partija jeftina, u ovom slučaju se
partija može prodati po niskoj cijeni ili otpisati). Ako proizvodnja izbaci 100 % defektnih stvari, onda je
u K partija od kojih je svaka veličine N, KN od KN stvari neispravno/defektno. Sada, KP(A; ) od ovih
partija je prihvaćeno. One sadrže KPN nedostataka, dok odbijene pa ispravljene partije ne sadrže
nedostatke zbog ispravljanja. Dakle nakon ispravke udio defektnih stvari u svim K partijama je KPN/KN.
Ovo se zove prosječni izlazni kvalitet (average outgoing quality AOQ), tj.,
Na Slici 2.12 prikazan je primjer. Budući da je AOQ(0) = 0 i P(A; 1) = 0, AOQ kriva ima maksimum u = *
koji jeste granica prosječnog izlaznog kvaliteta (average outgoing quality limit AOQL). To je najgori
prosječni kvalitet za koji se može očekivati da bude prihvaćen nakon ispravke.
73
Slika 2.12 OC kriva i AOQ kriva za plan uzorkovanja na Slici 2.10a
Testiranje uklapanja znači da želimo testirati da li je određena funkcija F(x) funkcija raspodjele raspodjeli
koju smo dobili iz uzorka x1, , xn. Potom testiramo da li se funkcija raspodjele uzorka 𝐹̃ (x) (𝐹̃ (x) = suma
relativnih frekvencija svih vrijednosti uzoraka xj koje ne prelaze x), "dovoljno dobro" uklapa u F(x). Ako
jeste, prihvatit ćemo hipotezu da je F(x) funkcija raspodjele populacije; ako nije, odbacit ćemo hipotezu.
Ovaj test ima značajnu praktičnu važnost i razlikuje se od testova za parametre (, 2
i sl.) koji su
razmatrani do sada.
Da bismo testirali na ovaj način, moramo znati koliko se 𝐹̃ (x) može razlikovati od F(x) ako je hipoteza
istina. Stoga moramo najprije uvesti kvantitat koji mjeri odstupanje 𝐹̃ (x) od F(x) i moramo znati
raspodjelu vjerovatnoće ovog kvantiteta uz pretpostavku da je hipoteza istina. Zatim nastavljamo kako
slijedi. Odredimo broj c tako da ako je hipoteza istina, odstupanje veće od c ima malu unaprijed
dodijeljenu vjerovatnoću. Ako je ipak odstupanja veće od c, imamo razloga sumnjati da je hipoteza
istinita i odbijamo je. S druge strane, ako odstupanje ne prelazi c, tako da je 𝐹̃ (x) dovoljno dobra
aproksimacija F(x), prihvaćamo hipotezu. Naravno, ako prihvatimo hipotezu, to znači da nemamo
dovoljno dokaza da je odbijemo, ali to ne isključuje mogućnost da postoje druge funkcije koje se ne bi
odbacile u testu. U tom pogledu situacija je vrlo slična onoj u Dijelu 2.4.
Tabela 2.7 prikazuje test takve vrste. Taj je test opravdan činjenicom da ako je hipoteza istina, onda je
02 uočena vrijednost slučajne varijable čija funkcija raspodjele prilazi chi-kvadrat raspodjeli sa K – 1
stepeni slobode (ili K – r – 1 stepeni slobode ako se procjenjuje r parametara) kako n teži beskonačnosti.
Zahtjev da se u svakom od intervala u Tabeli 2.7 nalazi najmanje pet vrijednosti uzoraka, proistječe iz
činjenice da za konačno n ta slučajna varijabla ima samo približno cki-kvadrat raspodjelu. Dokaz za ovo
može se naći u odgovarajućoj literaturi. Ako je uzorak toliko mali da se zahtjev ne može zadovoljiti, test
se može nastaviti, ali treba biti oprezan pri upotrebi rezultata.
74
Tabela 2.7 Chi-kvadrat test hipoteze: F(x) je funkcija raspodjele populacije iz koje je uzet uzorak x1, , xn
Korak 1. Podijelite x-osu u K intervala I1, , IK tako da svaki interval sadrži najmanje 5 vrijednosti
zadanog uzorka x1, , xn. Odredite broj bj vrijednosti uzorka u intervalu Ij gdje je j = 1, 2, , K.
Ako vrijednost uzorka leži na zajedničkoj graničnoj tački dva intervala, dodajte 0,5 svakom od dva
odgovarajuća bj.
Korak 2. Koristeći F(x), izračunajte vjerovatnoću pj da razmatrana slučajna varijabla X poprimi bilo
koju vrijednost u intervalu Ij, gdje je j = 1, 2, , K. Izračunaj
ej = npj
(Ovo je broj vrijednosti uzoraka teoretski očekivanih u Ij ako je hipoteza istina.)
b ej
2
k
2 j
0 (1)
j 1 ej
P 2 c 1
Rješenje: Tabela 2.8 prikazuje vrijednosti u redoslijedu koji je dobijen u eksperimentu. Tabela 2.9
prikazuje raspodjele frekvencija i Slika 2.13 prikazuje histogram. Teško je pretpostaviti ishod testa - da li
histogram dovoljno liči ili ne liči normalnoj gustoći?
75
Tabela 2.8 Uzorak od 100 vrijednosti pritisne čvrstoće (MPa) betonskih cilindara iz ZPIMK
36,6 42,9 38,2 30,1 36,8 31,1 34,1 22,5 30,9 28,7
28,2 25,7 30,7 27,4 40,9 33,8 36,3 35,0 31,2 27,0
34,2 35,7 41,6 34,1 36,6 36,4 33,4 29,7 40,8 29,2
34,6 45,0 39,0 30,2 46,0 36,4 36,3 36,4 33,4 29,7
35,2 33,5 31,6 39,9 32,8 31,7 35,6 32,8 31,7 42,3
35,6 31,6 36,8 42,2 33,3 32,8 35,9 49,2 42,9 40,3
38,5 41,4 43,8 35,8 41,0 36,4 34,3 41,7 33,0 34,5
43,1 39,8 45,6 31,8 35,1 45,6 35,1 32,4 40,3 41,1
39,5 41,7 36,2 33,6 39,0 42,9 36,9 37,7 33,6 34,4
36,3 37,5 38,3 32,9 45,7 43,7 27,5 28,7 22,9 33,2
76
Odabiremo = 5%. Pošto je K = 10 i procijenili smo da je r = 2. Parametri koje treba da koristimo nalaze
se u Tabeli D6 Dodatak 1 sa K – r – 1 = 7 stepeni slobode. Pronašli smo da je c = 14,07 kao rješenje
P(02 c) = 95%. Pošto je 02 < c prihvatamo hipotezu da je populacija normalna.
Neparametrijski testovi, koji se nazivaju i testovi bez raspodjele, vrijede za svaku raspodjelu. Stoga se
upotrebljavaju u slučajevima kada je vrsta raspodjele nepoznata ili je poznata, ali takva da nisu dostupni
nikakvi testovi za nju posebno projektovani. U ovom dijelu objasnit ćemo osnovnu ideju tih testova. Ako
ipak postoji izbor, testovi projektovani za određenu raspodjelu obično daju bolje rezultate od
neparametrijskih testova. Na primjer, ovo se odnosi na testove u Dijelu 2.4 za normalnu raspodjelu.
Razmotrit ćemo dva testa u smislu tipičnih primjera. U izvođenju raspodjela korištenih u testu, bitno je
da se raspodjele, iz kojih uzorkujemo, kontinuirane. (Neparametrijski testovi također se mogu izvesti za
diskretne raspodjele, ali je to nešto složenije.)
Medijan populacije je rješenje x = ̃ jednačine F(x) = 0,5 gdje je F funkcija raspodjele populacije.
Pretpostavimo da je testirano osam radio operatora, prvo u sobama bez klimatizacije, a zatim u
klimatiziranim prostorijama u istom vremenskom razdoblju, a razlika grešaka (neuvjetno minus uvjetno)
bila je:
9 4 0 6 4 0 7 11
Testirajte hipotezu ̃ = 0 (tj., klimatizacija nema nikakvog učinka) protiv alternativne ̄ = 0 (tj. lošiji
učinak u neaklimatiziranim prostorijama).
Rješenje: Odaberemo nivo značaja = 5%. Ako je hipoteza istina, vjerovatnoća p pozitivne razlike je ista
kao negativne razlike. Stoga u ovom slučaju p = 0,5 i slučajna je varijabla X = broj pozitivnih vrijednosti
77
među n vrijednostima, ima binomnu raspodjelu sa p = 0,5. Uzorak ima osam vrijednosti. Izostavljamo
vrijednosti 0 koje ne doprinose odluci. Tada ostaje šest vrijednosti, od kojih su sve pozitivne. Pošto je
6
P X 6 0,56 0,50 0,0156 1,56%
6
primjećujemo događaj čija je vjerovatnoća vrlo mala za istinitost hipoteze, 1,56% < 5%. Dakle
tvrdimo da je alternativa ̄ = 0 istinita. To znači da je broj grešaka u neaklimatiziranim prostorijama
znatno veći, pa je potrebno uzeti u obzir instalaciju klimatizacije.
Za rezanje žice koristi se određena mašina. Pet uzastopnih komada imalo je dužinu
29 31 28 30 32
Koristeći ovaj uzorak, ispitajte hipotezu da ne postoji trend, tj. da mašina ne proizvodi duže i duže
komade niti kraće i kraće komade. Pretpostavimo da tip mašine sugeriše alternativu da postoji pozitivan
trend, tj. da postoji tendencija da uzastopni komadi postaju sve duži.
Rješenje: Prvo izbrojimo broj transpozicija u uzorku, tj. koliko puta veća vrijednost prethodi manjoj
vrijednosti:
Preostale tri vrijednosti uzorka imaju rastući redoslijed. Stoga u uzorku postoje 1 + 2 = 3 transpozicije.
Sada razmotrimo slučajnu varijablu, T = broj transpozicija
Ako je hipoteza istina (bez trenda), tada svaka od 5! = 120 permutacija od pet elemenata 1 2 3 4 5 ima
istu vjerovatnoću (1/120). Organiziramo ove permutacije prema broju transpozicija:
78
Odakle se dobije
Prihvaćamo hipotezu jer smo posmatrali događaj koji ima relativno veliku vjerovatnoću (svakako mnogo
veću od 5%) ako je hipoteza istinita.
Naša metoda i ove vrijednosti odnose se na kontinuirane raspodjele. Teoretski, možemo očekivati da su
sve vrijednosti uzorka različite. Praktično, neke vrijednosti uzorka mogu i dalje biti jednake, zbog
zaokruživanja: Ako je m jednakih vrijednosti, dodaj m(m – 1)/4 (= srednja vrijednost transpozicija u
slučaju permutacija m elemenata), tj. 1/2 za svaki par jednakih vrijednosti, 3/2 za trostruko jednake
vrijednosti, itd.
Do sada smo se bavili slučajnim eksperimentima u kojima smo posmatrali jednu veličinu (slučajnu
varijablu) i dobili uzorke čije su vrijednosti bili pojedinačni brojevi. U ovom Dijelu raspravljamo o
eksperimentima u kojima istodobno posmatramo ili mjerimo dvije vrijednosti kako bismo dobili uzorke
parova vrijednosti (x1, y1), (x2, y2), , (xn, yn). Većina praktičnih primjena uključuje jednu od sljedeće
dvije vrste eksperimenata:
1. U regresionoj analizi jedna od dvije varijable, nazvana x, može se smatrati običnom varijablom jer je
možemo mjeriti bez značajne greške ili joj čak možemo dodijeliti vrijednosti koje želimo. x se zove
neovisna varijabla, ili ponekad kontrolirana varijabla jer je možemo kontrolirati (postaviti je na
odabrane vrijednosti). Druga varijabla, Y, je slučajna varijabla, a zanima nas ovisnost Y spram x. Tipični
primjeri su ovisnost krvnog tlaka Y od godišta x osobe ili, kao kako ćemo to sada nazvati, regresija Y
spram x, regresija dobitka težine Y određenih životinja spram dnevnog obroka x, regresija provodljivosti
toplote Y mineralne vune spram specifične težine x mineralne vune itd.
2. U korelacionoj analizi obe su veličine slučajne varijable i zainteresirani smo za njihov međusobni
odnos. Primjeri su odnos/relacija (ili "korelacija") između habanja X i habanja Y prednjih guma
automobila, između razreda X i Y učenika matematike i fizike, odnosno između tvrdoće X čeličnih ploča u
sredini i njihove tvrdoće Y blizu rubova ploča itd.
x 0 1x (1)
79
Potom mogli bismo htjeti grafički prikazati vrijednosti uzorka kao n-tačaka u xy-ravni, uklopiti se linearno
kroz njih i upotrijebiti ih kod procjene (x) za vrijednosti x koje nas zanimaju, kako bismo znali koje
vrijednosti Y možemo očekivati za vrijednosti x. Uklapanje te linije od oka ne bi bilo dobro jer bi bilo
subjektivno; tačnije, rezultati bi bili različiti kod različitih osoba, pogotovo ako su tačke razbacane.
Dakle, trebamo matematičku metodu koja daje jedinstveni rezultat koji ovisi samo od n-tačaka. Najviše
korišten postupak je metoda najmanjih kvadrata Gaussa i Legendrea koja se formuliše na sljedeći način.
Pravac treba biti postavljena kroz zadane tačke tako da je zbir kvadrata udaljenosti tih tačaka od pravca
minimalan, pri čemu se udaljenost mjeri u vertikalnom smjeru (y smjeru).
Da bismo dobili jedinstvenost pravca, trebamo dodatni uvjet. Da biste to vidjeli, uzmimo uzorak (0, 1),
(0, –1). Svi pravci y = k1x sa bilo kojim k1 zadovoljavat će prije navedeni princip. (Možete li to vidjeti?)
X-vrijednosti x1, , xn u našem uzorku (x1, y1), (x2, y2), , (xn, yn) nisu sve jednake.
Iz datog uzorka (x1, y1), (x2, y2), , (xn, yn) sada ćemo odrediti pravac putem najmanjih kvadrata. Pravac
zapišemo kao
y k0 k1x (2)
i nazovimo ga regresionim pravcem uzorka, jer će on biti paritet regresionom pravcu populacije (1).
Sada je vertikalna udaljenost tačke (xj, yj) uzorka (udaljenost mjerenu u y smjeru) od pravca (2) data sa
q y j k0 k1x j
n
2
(3)
j 1
80
q q
0 i 0 (4)
k0 k1
y y k1 x x (5)
1
x x1 ... xn (6a)
n
1
y y1 ... y n (6b)
n
s xy
k1 (7)
s x2
1 n 1 n n
sxy
1 n
n 1 j 1
x j x y j y j j
n 1 j 1
x y j x j
x
n i j j 1
(8)
1 n 2 1 n
2
x j x n 1
1 n
xj xj
2
s
2
(9a)
n 1 j 1
x
n ij
j 1
Iz (5) vidimo da regresioni pravac uzorka prolazi kroz tačku (x̄, ȳ) kojom je zajedno s regresionim
koeficijentom (7) određen. sx2 možemo nazvati varijansom x-vrijednosti, ali treba imati na umu da je x
obična varijabla, a ne slučajna varijabla.
1 n 2 1 n
2
j n 1
1 n
j
2
sy2 y y y y (9b)
n 1 j 1
j
n ij
j 1
q q
2 y j k0 k1x j 0 2 x j y j k0 k1x j 0
n n
i
k0 j 1 k1 j 1
gdje sumiramo preko j od 1 do n. Sada podijelimo sa 2, svaku od dviju suma napišimo kao tri sume, a
zatim prebacimo sume koje sadrže yj i xjyj na desnu stranu. Tako se dobiju "normalne jednačine"
81
k0 n k1 x j y j
(10)
k0 x j k1 x x j y j
2
j
Ovo je linearni sistem dviju jednačina sa dvije nepoznate k0 i k1. Determinanta njenih koeficijenta [vidi
(9)] je
n x
n x 2j x j n n 1 sx2 n x j x
j 2 2
x j x 2
j
i nije nula zbog pretpostavke (A1). Stoga sistem ima jedinstveno rješenje. Dijeleći prvu jednačinu (10) sa
n i pomoću (6), dobije se k0 = ȳ – k1x̄. Zajedno sa y = k0 + k1x iz (2) dobije se (5). Da bismo dobili (7),
rješavamo sistem (10) Cramerovim pravilom (Sek.7.6) ili eliminacijom, kada dobijemo
n x j y j x j y j
k1 (11)
n n 1 s x2
Izmjeren je pad volumena y [%] kože za određene fiksne vrijednosti visokog pritiska x [u atmosferama].
Rezultati su prikazani u prve dvije kolone Tabele 2.11. Pronađite regresioni pravac y od x.
Tabela 2.11 Regresija smanjenja volumena y [%] kože pod pritiskom x [Atmosfere]
Rješenje: Vidimo da je n = 4 te odredimo vrijednosti x̄ = 28.000/4 = 7.000, ȳ = 19,0/4 = 4,75 i iz (8) i (9)
1 28.000 19 15.400
sxy 148.400 3
3 4
1 28.000 2 20.000.000
sx2 216.000.000
3 4 3
Primijetite da je y(0) = –0,64, što fizički nema smisla, ali ovo tipično pokazuje da je linearna veza samo
aproksimacija koja vrijedi na nekom ograničenom intervalu.
82
2.9.2 Intervali povjerenja u regresionoj analizi
Ako želimo dobiti intervale povjerenja, moramo pretpostaviti raspodjelu Y (koje nismo dosad donijeli, a
najmanje kvadrati su "geometrijski princip" i nigdje ne uključuju vjerovatnoću!). Pretpostavljamo
normalnost i neovisnost u uzorkovanju:
Pretpostavka (A2)
x 0 1x (12)
i varijansom 2 neovisnom od x.
Pretpostavka (A3)
n provođenja eksperimenta kojim dobijamo uzorak (x1, y1), (x2, y2), , (xn, yn) su neovisni.
1 u (12) naziva se koeficijent regresije populacije, jer se može pokazati da je, pod pretpostavkama (A1)
do (A3), procjena maksimalne vjerovatnoće za 1 upravo koeficijent regresije uzorka k1 dat u (11).
Pod pretpostavkama (A1) - (A3), sada možemo dobiti interval povjerenja, koracima iz Tabele 2.12.
Tabela 2.12 Određivanje intervala povjerenje za 1 u (1) pod pretpostavkama (A1) do (A3)
1
F c 1 (13)
2
iz tabele t-raspodjele sa n – 2 stepeni slobode (Tabela D5 u Dodatku 1, ili koristiti compjutersku
aplikaciju; n = veličina uzorka).
Korak 3. Korištenjem uzorka (x1, y1), , (xn, yn) izračunaj (n – 1)sx2 iz (9a), (n – 1)sxy iz (8), k1 iz (7),
2
n
1 n
n 1 s
2
y
j 1
y yj
2
j
n j 1
(14)
kao u (9b) i
q0 n 1 sy2 k12sx2 (15)
Korak 4. Izračunaj
q0
K c , a interval povjerenja je
n 1 n 2 sx2
83
PRIMJER 2: Interval povjerenja za koeficijent regresije
Koristeći uzorak u Tabeli 2.11, odredite interval povjerenja metodom u Tabeli 2.12.
Rješenje:
Korak 2. Jednačina (13) poprima oblik F(c) = 0,975 i Tabela D5 u Dodatku 1 sa (n – 2) = 2 stepeni slobode
daju c = 4,30.
192
3sy2 102,0 11,85 i q0 11,95 20.000.000 0,00077 2 0,092
4
0,092
K 4,30 0,000206
2 20.000.000
a interval povjerenja je
Sad ćemo navesti osnovne činjenice korelacione analize, a dokaze treba potražiti u odgovarajućoj
literaturi.
Korelaciona analiza odnosi se na vezu X i Y u dvodimenzionalnoj slučajnoj varijabli (X, Y) (Dio 1.9). Uzorak
se sastoji od n parova vrijednosti (x1, y1), , (xn, yn) kao i prije. Međusobna povezanost vrijednosti x i y u
uzorku mjeri se kovarijansom uzorka sxy iz (8) ili koeficijentom korelacije uzorka
sxy
r (17)
s x sy
sa sx i sy iz (9). r ima prednost da se ne mijenja usljed množenja vrijednosti x i y nekim faktorom (npr.
promjenom centimetara u milimetre, itd.).
XY
(18)
XY
84
gdje su X = E(X), Y = E(Y), X2 = E([X – X]2) i y2 = E([Y – Y]2) (srednje vrijednosti i varijanse marginalnih
raspodjela od X i Y, vidi Dio 1.9), i xy kovarijansa od X i Y data sa (vidi Dio 1.9)
XY E X X Y Y E XY E X E Y (19)
Ovdje se može uvesti dvodimenzionalna normalna raspodjela putem dvije nezavisne standardizirane
normalne slučajne varijable X* i Y* čija zajednička raspodjela ima gustoću
x* 2
y *2
f
x ,y
1
2
e 2 (20)
(koja predstavlja rotacionu površinu iznad x*y* ravni sa zvonastom krivuljom u poprečnom presjeku) i
postavkama
X X X X
Y Y Y X 1 2 Y Y
85
Ovo daje opću dvodimenzionalnu normalnu raspodjelu gustoće
h x ,y
1
f x, y e 2
(21a)
2 X Y 1 2
gdje je
1 x 2 x X y Y y Y
2
h x, y X
2 (21b)
1 2 X X Y Y
XY E XY E X 3 1
3 1 1 1
03 13 0
3 3 3
pa pošto je = 0 iz (18) X i Y nisu u korelaciji. Međutim, ove varijable sigurno nisu neovisne jer su
funkcionalno povezane.
Tabela 2.13 prikazuje test za u slučaju dvodimenzionalne normalne raspodjele. t je uočena vrijednost
slučajne varijable koja ima t-raspodjelu sa n – 2 stepeni slobode. Dokaz za ovo se može naći u
odgovarajućoj literaturi.
Tabela 2.13 Test hipoteze = 0 spram alternative > 0 u slučaju dvodimenzionalne normalne raspodjele
P T c 1
Korak 4. Izračunaj
n2
t r
1 r 2
86
PRIMJER 4: Test za koefocijent korelacije
Testiraj hipotezu = 0 (X i Y su neovisni shodno Teoremi 3) spram alternative > 0, koristeći podatke u
donjem lijevom uglu Slike 2.15, gdje je r = 0,6 (greške pri ručnom lemljenju na 10 dvostranih strujnih
pločica urađenih od strane 10 radnika, x = prednja strana pločice, y = stražnja strana pločice).
Rješenje: Odaberimo = 5%, onda je 1 – = 95%. Pošto je n = 10, n – 2= 8 Tabela D5 daje c = 1,86.
Također t = 0,6(8/0,64) = 2,12 > c. Odbacujemo hipotezu i tvrdimo da postoji pozitivna korelacija.
Radnici koji čine dosta grešaka na prednjoj strani pločice imaju tendenciju činjenja dosta grešaka na
stražnjoj strani pločice.
87
88
DODATAK 1
0, 0, 0, 0, 0,
1 0 9000 0,9000 8000 0,8000 7000 0,7000 6000 0,6000 5000 0,5000
1 1000 1,0000 2000 1,0000 3000 1,0000 4000 1,0000 5000 1,0000
0 8100 0,8100 6400 0,6400 4900 0,4900 3600 0,3600 2500 0,2500
2 1 1800 0,9900 3200 0,9600 4200 0,9100 4800 0,8400 5000 0,7500
2 0100 1,0000 0400 1,0000 0900 1,0000 1600 1,0000 2500 1,0000
0 7290 0,7290 5120 0,5120 3430 0,3430 2160 0,2160 1250 0,1250
1 2430 0,9720 3840 0,8960 4410 0,7840 4320 0,6480 3750 0,5000
3
2 0270 0,9990 0960 0,9920 1890 0,9730 2880 0,9360 3750 0,8750
3 0010 1,0000 0080 1,0000 0270 1,0000 0640 1,0000 1250 1,0000
0 6561 0,6561 4096 0,4096 2401 0,2401 1296 0,1296 0625 0,0625
1 2916 0,9477 4096 0,8192 4116 0,6517 3456 0,4752 2500 0,3125
4 2 0486 0,9963 1536 0,9728 2646 0,9163 3456 0,8208 3750 0,6875
3 0036 0,9999 0256 0,9984 0756 0,9919 1536 0,9744 2500 0,9375
4 0001 1,0000 0016 1,0000 0081 1,0000 0256 1,0000 0625 1,0000
0 5905 0,5905 3277 0,3277 1681 0,1681 0778 0,0778 0313 0,0313
1 3281 0,9185 4096 0,7373 3602 0,5282 2592 0,3370 1563 0,1875
2 0729 0,9914 2048 0,9421 3087 0,8369 3456 0,6826 3125 0,5000
5
3 0081 0,9995 0512 0,9933 1323 0,9692 2304 0,9130 3125 0,8125
4 0005 1,0000 0064 0,9997 0284 0,9976 0768 0,9898 1563 0,9688
5 0000 1,0000 0003 1,0000 0024 1,0000 0102 1,0000 0313 1,0000
0 5314 0,5314 2621 0,2621 1176 0,1176 0467 0,0467 0156 0,0156
1 3543 0,8857 3932 0,6554 3025 0,4202 1866 0,2333 0938 0,1094
2 0984 0,9841 2458 0,9011 3241 0,7443 3110 0,5443 2344 0,3438
6 3 0146 0,9987 0819 0,9830 1852 0,9295 2765 0,8208 3125 0,6563
4 0012 0,9999 0154 0,9984 0595 0,9891 1382 0,9590 2344 0,8906
5 0001 1,0000 0015 0,9999 0102 0,9993 0369 0,9959 0938 0,9844
6 0000 1,0000 0001 1,0000 0007 1,0000 0041 1,0000 0156 1,0000
0 4783 0,4783 2097 0,2097 0824 0,0824 0280 0,0280 0078 0,0078
1 3720 0,8503 3670 0,5767 2471 0,3294 1306 0,1586 0547 0,0625
2 1240 0,9743 2753 0,8520 3177 0,6471 2613 0,4199 1641 0,2266
3 0230 0,9973 1147 0,9667 2269 0,8740 2903 0,7102 2734 0,5000
7
4 0026 0,9998 0287 0,9953 0972 0,9712 1935 0,9037 2734 0,7734
5 0002 1,0000 0043 0,9996 0250 0,9962 0774 0,9812 1641 0,9375
6 0000 1,0000 0004 1,0000 0036 0,9998 0172 0,9984 0547 0,9922
7 0000 1,0000 0000 1,0000 0002 1,0000 0016 1,0000 0078 1,0000
0 4305 0,4305 1678 0,1678 0576 0,0576 0168 0,0168 0039 0,0039
1 3826 0,8131 3355 0,5033 1977 0,2553 0896 0,1064 0313 0,0352
2 1488 0,9619 2936 0,7969 2965 0,5518 2090 0,3154 1094 0,1445
3 0331 0,9950 1468 0,9437 2541 0,8059 2787 0,5941 2188 0,3633
8 4 0046 0,9996 0459 0,9896 1361 0,9420 2322 0,8263 2734 0,6367
5 0004 1,0000 0092 0,9988 0467 0,9887 1239 0,9502 2188 0,8555
6 0000 1,0000 0011 0,9999 0100 0,9987 0413 0,9915 1094 0,9648
7 0000 1,0000 0001 1,0000 0012 0,9999 0079 0,9993 0313 0,9961
8 0000 1,0000 0000 1,0000 0001 1,0000 0007 1,0000 0039 1,0000
89
Tabela D2 Poissonova raspodjela
Funkcija vjerovatnoće ƒ(x) [vidi (5) Dio 1.7] i funkcija raspodjele F(x)
0, 0, 0, 0, 0,
0 9048 0,9048 8187 0,8187 7408 0,7408 6703 0,6703 6065 0,6065
1 0905 0,9953 1637 0,9825 2222 0,9631 2681 0,9384 3033 0,9098
2 0045 0,9998 0164 0,9989 0333 0,9964 0536 0,9921 0758 0,9856
3 0002 1,0000 0011 0,9999 0033 0,9997 0072 0,9992 0126 0,9982
4 0000 1,0000 0001 1,0000 0003 1,0000 0007 0,9999 0016 0,9998
5 0001 1,0000 0002 1,0000
0, 0, 0, 0, 0,
0 5488 0,5488 4966 0,4966 4493 0,4493 4066 0,4066 3679 0,3679
1 3293 0,8781 3476 0,8442 3595 0,8088 3659 0,7725 3679 0,7358
2 0988 0,9769 1217 0,9659 1438 0,9526 1647 0,9371 1839 0,9197
3 0198 0,9966 0284 0,9942 0383 0,9909 0494 0,9865 0613 0,9810
4 0030 0,9996 0050 0,9992 0077 0,9986 0111 0,9977 0153 0,9963
5 0004 1,0000 0007 0,9999 0012 0,9998 0020 0,9997 0031 0,9994
0, 0, 0, 0, 0,
0 2231 0,2231 1353 0,1353 0498 0,0498 0183 0,0183 0067 0,0067
1 3347 0,5578 2707 0,4060 1494 0,1991 0733 0,0916 0337 0,0404
2 2510 0,8088 2707 0,6767 2240 0,4232 1465 0,2381 0842 0,1247
3 1255 0,9344 1804 0,8571 2240 0,6472 1954 0,4335 1404 0,2650
4 0471 0,9814 0902 0,9473 1680 0,8153 1954 0,6288 1755 0,4405
5 0141 0,9955 0361 0,9834 1008 0,9161 1563 0,7851 1755 0,6160
6 0035 0,9991 0120 0,9955 0504 0,9665 1042 0,8893 1462 0,7622
7 0008 0,9998 0034 0,9989 0216 0,9881 0595 0,9489 1044 0,8666
8 0001 1,0000 0009 0,9998 0081 0,9962 0298 0,9786 0653 0,9319
9 0002 1,0000 0027 0,9989 0132 0,9919 0363 0,9682
10 0008 0,9997 0053 0,9972 0181 0,9863
16 0000 1,0000
90
Tabela D3 Normalna raspodjela
Vrijednosti funkcije raspodjele (z) [vidi (3), Dio 1.8], (–z) = 1 – (z)
0, 0, 0, 0, 0, 0,
0,01 5040 0,51 6950 1,01 8438 1,51 9345 2,01 9778 2,51 9940
0,02 5080 0,52 6985 1,02 8461 1,52 9357 2,02 9783 2,52 9941
0,03 5120 0,53 7019 1,03 8485 1,53 9370 2,03 9788 2,53 9943
0,04 5160 0,54 7054 1,04 8508 1,54 9382 2,04 9793 2,54 9945
0,05 5199 0,55 7088 1,05 8531 1,55 9394 2,05 9798 2,55 9946
0,06 5239 0,56 7123 1,06 8554 1,56 9406 2,06 9803 2,56 9948
0,07 5279 0,57 7157 1,07 8577 1,57 9418 2,07 9808 2,57 9949
0,08 5319 0,58 7190 1,08 8599 1,58 9429 2,08 9812 2,58 9951
0,09 5359 0,59 7224 1,09 8621 1,59 9441 2,09 9817 2,59 9952
0,10 5398 0,60 7257 1,10 8643 1,60 9452 2,10 9821 2,60 9953
0,11 5438 0,61 7291 1,11 8665 1,61 9463 2,11 9826 2,61 9955
0,12 5478 0,62 7324 1,12 8686 1,62 9474 2,12 9830 2,62 9956
0,13 5517 0,63 7357 1,13 8708 1,63 9484 2,13 9834 2,63 9957
0,14 5557 0,64 7389 1,14 8729 1,64 9495 2,14 9838 2,64 9959
0,15 5596 0,65 7422 1,15 8749 1,65 9505 2,15 9842 2,65 9960
0,16 5636 0,66 7454 1,16 8770 1,66 9515 2,16 9846 2,66 9961
0,17 5675 0,67 7486 1,17 8790 1,67 9525 2,17 9850 2,67 9962
0,18 5714 0,68 7517 1,18 8810 1,68 9535 2,18 9854 2,68 9963
0,19 5753 0,69 7549 1,19 8830 1,69 9545 2,19 9857 2,69 9964
0,20 5793 0,70 7580 1,20 8849 1,70 9554 2,20 9861 2,70 9965
0,21 5832 0,71 7611 1,21 8869 1,71 9564 2,21 9864 2,71 9966
0,22 5871 0,72 7642 1,22 8888 1,72 9573 2,22 9868 2,72 9967
0,23 5910 0,73 7673 1,23 8907 1,73 9582 2,23 9871 2,73 9968
0,24 5948 0,74 7704 1,24 8925 1,74 9591 2,24 9875 2,74 9969
0,25 5987 0,75 7734 1,25 8944 1,75 9599 2,25 9878 2,75 9970
0,26 6026 0,76 7764 1,26 8962 1,76 9608 2,26 9881 2,76 9971
0,27 6064 0,77 7794 1,27 8980 1,77 9616 2,27 9884 2,77 9972
0,28 6103 0,78 7823 1,28 8997 1,78 9625 2,28 9887 2,78 9973
0,29 6141 0,79 7852 1,29 9015 1,79 9633 2,29 9890 2,79 9974
0,30 6179 0,80 7881 1,30 9032 1,80 9641 2,30 9893 2,80 9974
0,31 6217 0,81 7910 1,31 9049 1,81 9649 2,31 9896 2,81 9975
0,32 6255 0,82 7939 1,32 9066 1,82 9656 2,32 9898 2,82 9976
0,33 6293 0,83 7967 1,33 9082 1,83 9664 2,33 9901 2,83 9977
0,34 6331 0,84 7995 1,34 9099 1,84 9671 2,34 9904 2,84 9977
0,35 6368 0,85 8023 1,35 9115 1,85 9678 2,35 9906 2,85 9978
0,36 6406 0,86 8051 1,36 9131 1,86 9686 2,36 9909 2,86 9979
0,37 6443 0,87 8078 1,37 9147 1,87 9693 2,37 9911 2,87 9979
0,38 6480 0,88 8106 1,38 9162 1,88 9699 2,38 9913 2,88 9980
0,39 6517 0,89 8133 1,39 9177 1,89 9706 2,39 9916 2,89 9981
0,40 6554 0,90 8159 1,40 9192 1,90 9713 2,40 9918 2,90 9981
0,41 6591 0,91 8186 1,41 9207 1,91 9719 2,41 9920 2,91 9982
0,42 6628 0,92 8212 1,42 9222 1,92 9726 2,42 9922 2,92 9982
0,43 6664 0,93 8238 1,43 9236 1,93 9732 2,43 9925 2,93 9983
0,44 6700 0,94 8264 1,44 9251 1,94 9738 2,44 9927 2,94 9984
0,45 6736 0,95 8289 1,45 9265 1,95 9744 2,45 9929 2,95 9984
0,46 6772 0,96 8315 1,46 9279 1,96 9750 2,46 9931 2,96 9985
0,47 6808 0,97 8340 1,47 9292 1,97 9756 2,47 9932 2,97 9985
0,48 6844 0,98 8365 1,48 9306 1,98 9761 2,48 9934 2,98 9986
0,49 6879 0,99 8389 1,49 9319 1,99 9767 2,49 9936 2,99 9986
0,50 6915 1,00 8413 1,50 9332 2,00 9772 2,50 9938 3,00 9987
91
Tabela D4 Normalna raspodjela
Vrijednosti z za date vrijednosti (z) [vidi (3), Dio 1,8] i D(z) = (z) – (–z)
Primjer: z = 0,279 ako je (z) = 61%; z = 0,860 ako je D(z) = 61%
92
Tabela D5 t-raspodjela
Vrijednosti z za date vrijednosti funkcije raspodjele F(z) (vidi (8) u Dijelu 2.3)
Primjer: Za 9 stepeni slobode, z = 1,83 kad je F(z) = 0,95
0,5 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
0,6 0,32 0,29 0,28 0,27 0,27 0,26 0,26 0,26 0,26 0,26
0,7 0,73 0,62 0,58 0,57 0,56 0,55 0,55 0,55 0,54 0,54
0,8 1,38 1,06 0,98 0,94 0,92 0,91 0,90 0,89 0,88 0,88
0,9 3,08 1,89 1,64 1,53 1,48 1,44 1,41 1,40 1,38 1,37
0,95 6,31 2,92 2,35 2,13 2,02 1,94 1,89 1,86 1,83 1,81
0,975 12,7 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23
0,99 31,8 6,96 4,54 3,75 3,36 3,14 3,00 2,90 2,82 2,76
0,995 63,7 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17
0,999 318,3 22,3 10,2 7,17 5,89 5,21 4,79 4,50 4,30 4,14
0,5 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
0,6 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26
0,7 0,54 0,54 0,54 0,54 0,54 0,54 0,53 0,53 0,53 0,53
0,8 0,88 0,87 0,87 0,87 0,87 0,86 0,86 0,86 0,86 0,86
0,9 1,36 1,36 1,35 1,35 1,34 1,34 1,33 1,33 1,33 1,33
0,95 1,80 1,78 1,77 1,76 1,75 1,75 1,74 1,73 1,73 1,72
0,975 2,20 2,18 2,16 2,14 2,13 2,12 2,11 2,10 2,09 2,09
0,99 2,72 2,68 2,65 2,62 2,60 2,58 2,57 2,55 2,54 2,53
0,995 3,11 3,05 3,01 2,98 2,95 2,92 2,90 2,88 2,86 2,85
0,999 4,02 3,93 3,85 3,79 3,73 3,69 3,65 3,61 3,58 3,55
0,95 1,72 1,71 1,71 1,70 1,70 1,68 1,68 1,66 1,65 1,65
0,975 2,07 2,06 2,06 2,05 2,04 2,02 2,01 1,98 1,97 1,96
0,99 2,51 2,49 2,48 2,47 2,46 2,42 2,40 2,36 2,35 2,33
0,995 2,82 2,80 2,78 2,76 2,75 2,70 2,68 2,63 2,60 2,58
0,999 3,50 3,47 3,43 3,41 3,39 3,31 3,26 3,17 3,13 3,09
93
Tabela D6 Chi-kvadrat raspodjela
Vrijednosti x za date vrijednosti funkcije raspodjele F(z) (vidi Dio 2.3)
Primjer: Za 3 stepena slobode, z = 11,34 kad je F(z) = 0,99
0,005 0,00 0,01 0,07 0,21 0,41 0,68 0,99 1,34 1,73 2,16
0,01 0,00 0,02 0,11 0,30 0,55 0,87 1,24 1,65 2,09 2,56
0,025 0,00 0,05 0,22 0,48 0,83 1,24 1,69 2,18 2,70 3,25
0,05 0,00 0,10 0,35 0,71 1,15 1,64 2,17 2,73 3,33 3,94
0,95 3,84 5,99 7,81 9,49 11,07 12,59 14,07 15,51 16,92 18,31
0,975 5,02 7,38 9,35 11,14 12,83 14,45 16,01 17,53 19,02 20,48
0,99 6,63 9,21 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21
0,995 7,88 10,60 12,84 14,86 16,75 18,55 20,28 21,95 23,59 25,19
0,005 2,60 3,07 3,57 4,07 4,60 5,14 5,70 6,26 6,84 7,43
0,01 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,63 8,26
0,025 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59
0,05 4,57 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,12 10,85
0,95 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41
0,975 21,92 23,34 24,74 26,12 27,49 28,85 30,19 31,53 32,85 34,17
0,99 24,72 26,22 27,69 29,14 30,58 32,00 33,41 34,81 36,19 37,57
0,995 26,76 28,30 29,82 31,32 32,80 34,27 35,72 37,16 38,58 40,00
0,005 8,0 8,6 9,3 9,9 10,5 11,2 11,8 12,5 13,1 13,8
0,01 8,9 9,5 10,2 10,9 11,5 12,2 12,9 13,6 14,3 15,0
0,025 10,3 11,0 11,7 12,4 13,1 13,8 14,6 15,3 16,0 16,8
0,05 11,6 12,3 13,1 13,8 14,6 15,4 16,2 16,9 17,7 18,5
0,95 32,7 33,9 35,2 36,4 37,7 38,9 40,1 41,3 42,6 43,8
0,975 35,5 36,8 38,1 39,4 40,6 41,9 43,2 44,5 45,7 47,0
0,99 38,9 40,3 41,6 43,0 44,3 45,6 47,0 48,3 49,6 50,9
0,995 41,4 42,8 44,2 45,6 46,9 48,3 49,6 51,0 52,3 53,7
0,005 20,7 28,0 35,5 43,3 51,2 59,2 67,3 (h - 2,58)2/2
0,01 22,2 29,7 37,5 45,4 53,5 61,8 70,1 (h - 2,33)2/2
0,025 24,4 32,4 40,5 48,8 57,2 65,6 74,2 (h - 1,96)2/2
0,05 26,5 34,8 43,2 51,7 60,4 69,1 77,9 (h - 1,64)2/2
0,95 55,8 67,5 79,1 90,5 101,9 113,1 124,3 (h + 1,64)2/2
0,975 59,3 71,4 83,3 95,0 106,6 118,1 129,6 (h + 1,96)2/2
0,99 63,7 76,2 88,4 100,4 112,3 124,1 135,8 (h + 2,33)2/2
0,995 66,8 79,5 92,0 104,2 116,3 128,3 140,2 (h + 2,58)2/2
U zadnjoj koloni, h = (2m – 1)1/2, gdje je m broj stepeni slobode,
94
Tabela D7 F-raspodjela sa (m, n) stepeni slobode
Vrijednosti z za koje funkcija raspodjele F(z) [vidi (13), Dio 2.4] ima vrijednost 0,95
Primjer: Za (7, 4) s.s., z = 6,09 ako je F(z) = 0,95
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97
150 3,90 3,06 2,66 2,43 2,27 2,16 2,07 2,00 1,94
200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93
1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89
3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88
95
Tabela D7 F-raspodjela sa (m, n) stepeni slobode
Vrijednosti z za koje funkcija raspodjele F(z) [vidi (13), Dio 2.4] ima vrijednost 0,95
n m = 10 m = 15 m = 20 m = 30 m = 40 m = 50 m = 100
96
Tabela D7 F-raspodjela sa (m, n) stepeni slobode
Vrijednosti z za koje funkcija raspodjele F(z) [vidi (13), Dio 2.4] ima vrijednost 0,99
n m=1 m=2 m=3 m=4 m=5 m=6 m=7 m=8 m=9
100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59
150 6,81 4,75 3,91 3,45 3,14 2,92 2,76 2,63 2,53
200 6,76 4,71 3,88 3,41 3,11 2,89 2,73 2,60 2,50
1000 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43
6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41
97
Tabela D7 F-raspodjela sa (m, n) stepeni slobode
Vrijednosti z za koje funkcija raspodjele F(z) [vidi (13), Dio 2.4] ima vrijednost 0,99
n m = 10 m = 15 m = 20 m = 30 m = 40 m = 50 m = 100
98
Tabela D8 Funkcija raspodjele F(x) = P(T x) slučajne varijable T u Dijelu 2.8
n n n n n n n n n
x =3 x x x x x x x x
0, 0. 0. 0. 0. 0. 0. 0. 0.
0 167 0 042 0 008 0 001 1 001 2 001 4 001 6 001 8 001
1 500 1 167 1 042 1 008 2 005 3 003 5 003 7 002 9 002
2 375 2 117 2 028 3 015 4 007 6 006 8 005 10 003
3 242 3 068 4 035 5 016 7 012 9 008 11 005
n 4 408 4 136 5 068 6 031 8 022 10 014 12 008
x =20 5 235 6 119 7 054 9 038 11 023 13 013
6 360 7 191 8 089 10 060 12 036 14 020
n
0, 7 500 8 281 9 138 11 090 13 054 15 030
x
50 001 9 386 10 199 12 130 14 078 16 043
51 002 0. 10 500 11 274 13 179 15 108 17 060
52 002 43 001 12 360 14 238 16 146 18 082
n
53 003 44 002 13 452 15 306 17 190 19 109
x
54 004 45 002 16 381 18 242 20 141
55 005 46 003 0. 17 460 19 300 21 179
n 20 364 22 223
56 006 47 003 38 001 x 21 431 23 271
57 007 48 004 39 002
58 008 49 005 40 003 0. 22 500 24 324
n 25 381
59 010 50 006 41 003 32 001 x 26 440
60 012 51 008 42 004 33 002
61 014 52 010 43 005 34 002 0. 27 500
n
62 017 53 012 44 007 35 003 27 001 x
63 020 54 014 45 009 36 004 28 002 n
64 023 55 017 46 011 37 005 29 002 0. x
65 027 56 021 47 013 38 007 30 003 23 001
66 032 57 025 48 016 39 009 31 004 24 002 0. n
67 037 58 029 49 020 40 011 32 006 25 003 18 001 x
68 043 59 034 50 024 41 014 33 008 26 004 19 002
69 049 60 040 51 029 42 017 34 010 27 006 20 002 0. n
70 056 61 047 52 034 43 021 35 013 28 008 21 003 14 001 x
71 064 62 054 53 041 44 026 36 016 29 010 22 005 15 001
72 073 63 062 54 048 45 032 37 021 30 014 23 007 16 002 0.
73 082 64 072 55 056 46 038 38 026 31 018 24 010 17 003 11 001
74 093 65 082 56 066 47 046 39 032 32 023 25 013 18 005 12 002
75 104 66 093 57 076 48 054 40 039 33 029 26 018 19 007 13 003
76 117 67 105 58 088 49 064 41 048 34 037 27 024 20 011 14 004
77 130 68 119 59 100 50 076 42 058 35 046 28 031 21 015 15 007
78 144 69 133 60 115 51 088 43 070 36 057 29 040 22 021 16 010
79 159 70 149 61 130 52 102 44 083 37 070 30 051 23 029 17 016
80 176 71 166 62 147 53 118 45 097 38 084 31 063 24 038 18 022
81 193 72 184 63 165 54 135 46 114 39 101 32 079 25 050 19 031
82 211 73 203 64 184 55 154 47 133 40 120 33 096 26 064 20 043
83 230 74 223 65 205 56 174 48 153 41 141 34 117 27 082 21 058
84 250 75 245 66 227 57 196 49 175 42 164 35 140 28 102 22 076
85 271 76 267 67 250 58 220 50 199 43 190 36 165 29 126 23 098
86 293 77 290 68 275 59 245 51 225 44 218 37 194 30 153 24 125
87 315 78 314 69 300 60 271 52 253 45 248 38 225 31 184 25 155
88 339 79 339 70 327 61 299 53 282 46 279 39 259 32 218 26 190
89 362 80 365 71 354 62 328 54 313 47 313 40 295 33 255 27 230
90 387 81 391 72 383 63 358 55 345 48 349 41 334 34 295 28 273
91 411 82 418 73 411 64 388 56 378 49 385 42 374 35 338 29 319
92 436 83 445 74 441 65 420 57 412 50 423 43 415 36 383 30 369
93 462 84 473 75 470 66 452 58 447 51 461 44 457 37 429 31 420
94 487 85 500 76 500 67 484 59 482 52 500 45 500 38 476 32 473
99