Professional Documents
Culture Documents
Thông thường đối với tham số θ chưa biết của tập hợp chính ta có thể đưa ra nhiều giả
thuyết về θ.
Vấn đề đặt ra là làm thế nào kiểm định được giả thuyết nào thích hợp với các số liệu của
mẫu quan sát được (x1, x2, …, xn ).
8.1.2 Giả thuyết không (giả thuyết đơn) và giả thuyết ngược lại (đối thuyết)
(Null Hypothesis & Alternative Hypothesis)
Giả thuyết không: là sự giả sử mà ta muốn kiếm định thường được ký hiệu là Ho.
Giả thuyết ngược lại: Việc bác bỏ giả thuyết không sẽ dẫn đến việc chấp nhận giả
thuyết ngược lại. Giả thuyết ngược lại thường được ký hiệu là H1.
Ví dụ
Kiếm định giả thuyết Ho: θ ≥ θo có thể θ = θo
Với H1: θ < θo
Kiếm định giả thuyết Ho: θ ≤ θo có thể θ = θo
Với H1: θ > θo
Kiếm định giả thuyết Ho: θ = θo
Với H1: θ ≠ θo
8.1.3 Các loại sai lầm trong việc kiểm định giả thuyết thống kê
Việc kiểm định giả thuyết thống kê có thể phạm phải 2 loại sai lầm
a) Sai lầm loại I (type I error)
Là loại sai lầm mà chúng ta phạm phải trong việc bác bỏ giả thuyết Ho khi Ho đúng.
Xác suất của việc bác bỏ Ho khi Ho đúng là xác suất của sai lầm loại I và được ký hiệu
là α
α = P ( bác bỏ Ho / Ho đúng) = P(type I error)
α : còn được gọi là mức ý nghĩa ( level of significance)
α = 0,05; 0,01 ; 0,001 …
Tất cả các giá trị có thể có của các đại lượng thống kê trong kiểm định có thể chia làm 2
miền: miền bác bỏ và miền chấp nhận.
Miền bác bỏ là miền chứa các giá trị làm cho giả thuyết Ho bị bác bỏ.
Miền chấp nhận là miền chứa các giá trị giúp cho giả thuyết Ho không bị bác bỏ.
Trong thực tế khi Ho không bị bác bỏ cùng nghĩa là nó được chấp nhận.
Giá trị chia đôi hai miền được gọi là giá trị giới hạn (Critical value)
Khi giả thuyết ngược lại H1 có tính chất 1 phía (one – sided) thì việc kiểm định được gọi
là kiểm định 1 đầu.
Ho: θ ≤ θo hay Ho: θ ≥ θo
H1: θ > θo H1: θ < θo
Khi giả thuyết ngược lại H1 có tính chất 2 phía (two – sided) thì việc kiểm định được gọi
là kiểm định 2 đầu.
Ho: θ = θo
H1: θ ≠ θo
Gồm 6 bước:
Bước 1: Thành lập giả thuyết Ho
Ví dụ:
Ho: θ = θo
Ho: θ ≤ θo
Ho: θ ≥ θo
Bước 2: Thành lập giả thuyết H1
Ví dụ:
H1: θ < θo
H1: θ > θo
H1: θ ≠ θo
Bước 3: Xác định mức ý nghĩa α
Bước 4: Chọn các tham số thống kê thích hợp cho việc kiếm định và xác định các miền
bác bỏ, miền chấp nhận và giá trị giới hạn.
Bước 5: Tính toán các giá trị của các tham số thống kê trong việc kiểm định dựa trên số
hiệu của mẫu ngẫu nhiên.
Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ Ho thì ra quyết định
bác bỏ Ho. Ngược lại sẽ chấp nhận Ho.
8.3 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH µ CỦA PHÂN PHỐI CHUẨN N(µ,σ2)
KHI ĐÃ BIẾT σ2
Cho ( x1, x2 , …, xn) là mẫu ngẫu nhiên cỡ n được lấy từ tập họp chính tuân theo phân
phối chuẩn N (µ,σ2 ) trong đó σ2 đã biết.
Ho : µ = µo hay µ ≥ µo
H1 : µ < µo
Zα 0
Bác bỏ H0 Không bác bỏ H0
Ho : µ = µo hay µ ≤ µo
H1 : µ > µo
α
0 Zα
X − µ0
Miền bác bỏ R: Bác bỏ Ho nếu Ztt = > Zα
σ/ n
Ho : µ = µ 0
H1 : µ ≠ µ 0
α/2 α/2
-Zα/2 0 Zα/2
Bác bỏ H0 Không bác bỏ H0 Bác bỏ H0
X − µ0
Với : Ztt =
σ/ n
Thí dụ
Trong một nhà máy bánh kẹo, một máy tự động sản xuất ra các thanh sô cô la với trọng
lượng qui định 250g. Biết rằng trọng lượng các thanh sô cô la được sản xuất ra có phân
bố chuẩn N(µ,52). Trong một ngày bộ phân kiểm tra kỹ thuật chọn một mẫu ngẫu nhiên
gồm 16 thanh sô cô la và tính trọng lượng trung bình của chúng được 244g. Có thể khẳng
Ra quyết định: Bác bỏ giả thuyết Ho ở mức ý nghĩa 5%. Nghĩa là: máy tự động sản xuất
sô cô la có trọng lượng nhỏ hơn qui định ⇒ Phải điều chỉnh lại máy
Thí dụ
Một máy khoan trong dây chuyền sản xuất dùng để khoan lỗ trên các bản thép. Khi máy
khoan hoạt động đúng chức năng thiết kế đường kính các lỗ khoan sẽ tuân theo phân phối
chuẩn với số trung bình là 2 inches và độ lệch chuẩn là 0,06 inches. Trong quá trình kiểm
tra định kỳ xem máy khoan có hoạt động đúng hay không, người ta lấy đo ngẫu nhiên các
lỗ đã khoan. Giả sử độ lệch chuẩn không thay đổi. Mẫu ngẫu nhiên gồm 9 lỗ khoan cho ta
đường kính trung bình của mẫu là 1,95 inches.
Kiểm định giả thuyết Ho : số trung bình của tập hợp chính là 2 inches.
Với H1 : số trung bình của tập hợp chính khác 2 inches.
Trong quá trình kiểm định dùn α = 5%
Giải:
1/ Ho : µ = µ0 = 2
2/ H1 : µ ≠ 2
3/ α = 0,05
4/ Z α / 2 = Z 0,025 = 1,96 ⇒ - Z α / 2 = −1,96
Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy từ tập hợp chính tuân theo phân phối
chuẩn có số trung bình là µ. Gọi X và Sx là số trung bình và độ lệch chuẩn của mẫu, ta sẽ
có 3 trường hợp kiểm định µ với mức ý nghĩa α.
8.4.1 Trường hợp 1:
Ho : µ = µo hay µ ≥ µo
H1 : µ < µo
Miền bác bỏ R : Bác bỏ Ho nếu tn-1 < tn-1,α
X − µ0
Với tn-1= , tn-1 tuân theo phân phối Student t với độ tự do n-1
σx / n
8.4.2 Trường hợp 2:
Ho : µ = µo hay µ ≤ µo
H1 : µ > µo
Miền bác bỏ R: Bác bỏ Ho nếu tn-1 > tn-1,α
8.4.3 Trường hợp 3:
Ho : µ = µ 0
H1 : µ ≠ µ 0
Miền bác bỏ R: Bác bỏ Ho nếu tn-1 > tn-1,α/2
Hay tn-1 < - tn-1,α/2
α α
t*n-1,α t*n-1,α
α/2 α/2
-t*n-1,α/2 t*n-1,α/2
Bác bỏ H0 Không bác bỏ H0 Bác bỏ H0
x − µ0 19,5 − 20
tn-1 = = = −1,597
Sx / n 0,767 / 6
Ra quyết định: tn-1, α/2 < tn-1 < tn-1, α/2
-2,015 < -1,597 < 2,015
⇒ Chấp nhận giả thuyết Ho (Những dữ kiện từ mẫu không đủ mạnh để bác bỏ Ho)
8.5 KIỂM ĐỊNH PHƯƠNG SAI CỦA PHÂN PHỐI CHUẨN N(µ,σ2)
Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy ra từ tập hợp chính tuân theo phân phối
chuẩn có phương sai là σ2 . Gọi S2x là phương sai của mẫu, ta sẽ có 3 trường hợp kiểm
định σ2 với mức ý nhĩa là α
Ho : σ2 = σ02
H 1 : σ2 ≠ σ0 2
R : Bác bỏ Ho nếu χ2n-1 > χ2n-1,α/2 hay χ2n-1 < χ2n-1,1-α/2
Thí dụ
Để thỏa mãn tiêu chuẩn đã được ấn định trong hợp đồng là phương sai của hàm lượng
chất bẩn trong các lò hàng hoá chất không được vượt quá 4%. Lấy ngẫu nhiên 20 lô hàng
ta có phương sai của hàm lượng chất bẩn trong các lô hàng mẫu là 5,62%.
Kiểm định giả thuyết phương sai của hàm lượng chất bẩn trong tất cả các lô hàng không
quá 4% với α =10%. Giả sử rằng tập hợp chính tuân theo phân phối chuẩn.
Giải:
Giả thuyết: Ho : σ2 ≤ σ02 = 4
H 1 : σ2 > 4
R : Bác bỏ Ho nếu χ2n-1 >
Ta có: α = 0,1, n = 20 → χ2n-1,α = χ219,0,1 = 27,20
S2x = 5,62, n = 20, σ20 =4
2 (n − 1)σ x2 19 * 5,62
χ n-1 = = = 26,695
σ 2
0 4
Ra quyết định: Vì χ2n-1 =26,695 < χ2n-1,α =27,20
⇒ Không bác bỏ Ho tại mức α =10%
8.6 KIỂM ĐỊNH GIÁ TRỊ TỶ SỐ P CỦA TẬP HỢP CHÍNH TRONG ĐIỀU KIỆN
CỠ MẪU LỚN:
Ho : P = P0 hay Ho : P ≥ P0
H1 : P < P0
R : Bác bỏ Ho nếu Ztt < - Zα
f −p
Với Z = , Z ∼ N (0,1)
p (1 − p) / n
Ho : P = P0 hay Ho : P ≤ P0
H1 : P > P0
R : Bác bỏ Ho nếu Z > Zα
Ho : P = P0
H1 : P ≠ P0
R : Bác bỏ Ho nếu Z > Zα/2 Hay Z < -Zα/2
Thí dụ
Lấy ý kiến 199 giảng viên về việc day học theo lối tín chỉ thì có 104 giảng viên đồng ý.
Kiếm định với mức về giả thuyết cho rằng có một nửa số giảng viên trong trường Bách
khoa đồng ý dạy theo lối tín chỉ.
Giải
Gọi P là tỉ lệ số giảng viên trường Đại học Bách Khoa đồng ý dạy theo lối tín chỉ
Giả thuyết: Ho : P = Po =0,5
H1 : P ≠ 0,5
Zα/2 = Z0,05 = 1,645 vì α = 10%
-Zα/2 = -Z0,05 = -1,645
104
n =199, Po = 0,5 ⇒ f= = 0,523
199
f − p0 0,523 − 0,50
Z= = = 0,65
p 0 (1 − p 0 ) / n 0,50 * 0,50 / 199
8.7 KIỂM ĐỊNH GIẢ THUYẾT VỀ QUY LUẬT PHÂN PHỐI LÝ THUYẾT
Giả sử ta có mẫu ngẫu nhiên với cỡ mẫu là n. Mỗi giá trị quan sát của mẫu ngẫu nhiên có
thể xếp vào 1 trong K lớp. Gọi số phần tư của lớp thứ i là Oi với i = 1,2, …,K.
Trong việc kiểm định tính phù hợp ta có:
Ho : Xác suất để cho các giá trị quan sát rơi vào lớp thứ i = Pi (i =1,2, … k)
H1 : Xác suất để cho các giá trị quan sát rơi vào lớp thứ i ≠ Pi
R : Bác bỏ Ho nếu χ2k-1 > χ2k-1,α
k
(Oi − Ei ) 2
Với : χ k2−1 = ∑
i =1 Ei
Ei : Kỳ vọng của số phần tử trong lớp thứ i. Với giả thuyết Ho ta có:
Ei = n*Pi
2 2
χ k-1 tuân theo phân phối χ với độ tự do là k-1.
Ví dụ
Một công ty chất đốt dựa vào kinh nghiệm trong quá khứ cho rằng đến cuối mùa đông sẽ
có 80% lượng khách hàng trả đầy đủ tiền ngay 10% trả chậm 1 tháng, 6% trả chậm 2
tháng và 4% trả châm hơn 2 tháng. Đến cuối mùa đông để kiểm định lại điều này, Cty lấy
ngẫu nhiên mẫu gồm 400 khách hàng và nhận thấy có 287 khách hàng trả ngay, 49 trả
chậm 1 tháng, 30 trả chậm 2 tháng và 34 trả chậm hơn 2 tháng. Hỏi những kinh nhiệm
trong quá khứ có thể áp dựng cho mùa đông năm nay không? Kiểm định với mức ý nghĩa
5%.
Giải
Ho : Xác suất lượng khách hàng trả tiền ở mùa đông hiện tại phù hợp với các số liệu
trong quá khứ. Nghĩa là xác suất tương ứng với 4 loại khách hàng là:
P1 = 0,8, P2 = 0,1, P3 = 0,06, P4 = 0,04
H1 : P1 ≠ 0,8, P2 ≠ 0,1, P3 ≠ 0,06, P4 ≠ 0,04
α = 0,05 , k = 4 ⇒ χ2k-1,α = χ23,0,05 = 7,81
8.7.2 Kiểm định giả thuyết về qui luật phân phối lý thuyết
Trong việc kiểm định giả thuyết tính phù hợp của số liệu quan sát với qui luật phân phối
lý thuyết ta có:
Ho : Số liệu quan sát tuân theo qui luật phân phối lý thuyết
H1 : Số liệu quan sát không tuân theo qui luật phân phối lý thuyết
n = 20 n = 200 X2 = 0,265
Tính χ2γ,α :
γ = K – r –1 = 8 –2 – 1
Số lớp K = 8; r = 2 (phân phối chuẩn)
α = 0,05
Tra bảng χ25,0,05 = 11,0706
6/ Ra quyết định : Vì χ2 = 0,265 < χ25,0,05 = 11,0706
⇒ Không bác bỏ Ho
⇒ Số liệu quan sát tuân theo phân phối chuẩn .
8.8.1 Bảng dữ kiện ngẫu nhiên 2 chiều (Two Way Contingency Tables)
Nếu các dữ kiện của biến ngẫu nhiên được xếp loại theo 2 tiêu chuẩn thì các dữ kiên sẽ
được trình bày trong bảng gồm hàng và cột gọi là bảng dữ kiện ngẫu nhiên 2 chiều. Tổng
quát, bảng ngẫu nhiên 2 chiều gồm r hàng và c cột được trình bày như sau:
Cột Tổng theo
Hàng
1 2 3 … c hàng
1 O11 O11 O11 … O1c R1
2 O21 O21 O21 … O2c R2
3 O31 O31 O31 … O3c R3
… … … … … … …
r Or1 Or2 Or3 … Orc RC
Tổng
C1 C2 C3 … C5
theo cột
Ký hiệu:
Oij : Số dữ kiện quan sát ở hàng i, cột j
R : Tổng các dữ kiện quan sát ở hàng i
Cj : Tổng các dữ kiện quan sát ở cột j
n : Cỡ mẫu n = ∑ Ri = ∑ Cj
8.8.2 Kiểm định giả thuyết về tính độc lập giữa 2 thuộc tính của tập hợp chính
Trong việc kiểm định giả thuyết về tính độc lập giữa 2 thuộc tính của tập họp chính ta có:
Ho : Các tiêu chuẩn được phân loại theo hàng và theo cột độc lập với nhau.
H1 : Các tiêu chuẩn đựợc phân loại theo hàng và theo cột phụ thuộc nhau
R : Bác bỏ giả thuyết Ho nếu X2 ≥ X2α,γ
(Oi , j − Eij ) 2
χ =∑
2
i, j Eij
Chất lượng
Phế phẩm (cái) Chính phẩm (cái) Tổng số (cái)
Công nghệ
Sau khi thay đổi công nghệ 8 192 200
Trước khi thay đổi công nghệ 92 708 800
Tổng số 100 900 1000
Vấn đề đặt ra là việc áp dụng công nghệ mới và chất lượng có liên quan hay không ? (Với
α =0,05)
Giải:
1/ Ho : Công nghệ mới độc lập với chất lượng
2/ H1 : Chất lượng phụ thuộc công nghệ mới
3/ Tính Eij:
100
• Tỉ lệ phế phẩm = 10 %
1000
900
• Tỉ lệ chính phẩm = 90 %
100
Chất lượng
Phế phẩm (cái) Chính phẩm (cái) Tổng số (cái)
Công nghệ
Sau khi thay đổi công nghệ 10 90 200
200 * = 20 200 * = 180
100 100
Trước khi thay đổi công nghệ 10 90 800
800 * = 80 800 * = 720
100 100
Tổng số 100 900 1000
2
Tính X :
(O i , j − E ij ) 2 (8 − 20)
2
(92 − 80)
2
(192 − 180)
2
(708 − 720 )
2
X = 2
∑i, j E ij
=
20
+
80
+
180
+
720
χ 2 = 10
Tính χ υ2 ,α
α = 0,05 ν = (r-1)(c-1) = 1
Tra bảng χ21;0,05 = 3,84