Professional Documents
Culture Documents
1. Tổng thể
Tổng thể là tập hợp tất cả các đối tương mà ta quan tâm nghiên cứu trong thực tiễn khi xử lý số liệu
thống kê. Số phần tử của tổng thể được ký hiệu là N.
- Nếu N là số hữu hạn ta có tổng thể hữu hạn
- Nếu N là số vô hạn ta có tổng thể vô hạn
Ví dụ 1: Chẳng hạn, khi muốn xác định chiều cao trung bình của người Việt Nam thì tổng thể là
toàn bộ thanh niên Việt Nam, còn khi muốn xác định thu nhập bình của một hộ dân ở Tp. Hồ Chí
Minh thì tổng thể là toàn bộ các hộ dân ở Tp. Hồ Chí Minh,...
2. Mẫu
Mẫu là tập hợp con của tổng thể và được trích ra từ một tổng thể theo 1 quy tắc xác định nào đó thì
được gọi là mẫu. Số phần tử của mẫu ký hiệu là n (kích thước mẫu hay cỡ mẫu).
n − 1 i =1
( ) =
n − 1
(
x1 − x ) + (x 2 −x ) ( )
M ẫu Tổng thể
(Biết) (Chưa biết)
Lấy mẫu
ƯỚC LƯỢNG
1. Ước lượng khoảng (1 mẫu)
Ước lượng khoảng đối với tham số thống kê θ = ( µ, ρ, σ 2 ) của tổng thể là một quy tắc dựa trên
thông tin của mẫu để xác định miền hay khoảng mà tham số θ = ( µ, ρ, σ2 ) hầu như nằm trong đó.
Ví dụ 1: Ước lượng giá trị trung bình µ của tổng thể dựa trên giá trị trung bình mẫu x
Bước 1: x gọi là ước lượng điểm của µ . Vậy thì ta có thể hình dung rằng
(
µ − x < ε ⇔ x − ε < µ < x + ε hoặc ký hiệu là µ ∈ x ± ε )
( )
Bước 2: x − ε; x + ε gọi là khỏang ước lượng
Bước 3: ε gọi là độ chính xác, ε càng nhỏ càng chính xác Ví dụ: µ = X ∓ (10−6 = ε)
( )
Bước 4: P x − ε < µ < x + ε = γ = 1 − α gọi là khoảng tin cậy của ước lượng ( ≥ 95% )
Thuật giải
Bước 2
Tra bảng Laplace tìm z α sao cho
γ
ϕ(z α ) = , γ gọi là độ tin cậy; γ = 1 − α
2
f (1 − f ) s
ε = zα Bước 3 ε = zα
n Tính độ chính xác ε n
Vậy với độ tin cậy γ = 1 − α thì tỷ Bước 4 Vậy với độ tin cậy γ = 1 − α thì giá trị
Đưa ra khỏang ước lượng
lệ của tổng thể p ∈ (f − ε, f + ε)
và kết luận (
trung bình của tổng thể µ ∈ X − ε; X + ε )
5
s 1,96* 2,5
Bước 3: Tính độ chính xác ε = z α = = 0.5
n 100
Bước 4: Vậy với khoảng tin cậy 95% khoảng ước lượng điểm trung bình môn toán của toàn
thể thí sinh dự thi vào ĐHKT là (4,5; 5,5) điểm.
2) Với độ chính xác 0,25 điểm. Hãy xác định khoảng tin cậy.
ε n 0.25*10
ε = 0, 25 ⇒ z α = = =1
s 2.5
ϕ(z α ) = ϕ(1, 00) = 0.3413
γ
ϕ(1, 00) = ⇒ γ = 2*0.3413 = 0.6826 = 68.26%
2
Vậy γ = 68, 26%
Ví dụ 3: Tuổi thọ của một loại bóng đèn được biết theo phân phối chuẩn với độ lệch chuẩn
100 giờ.
1) Chọn ngẫu nhiên 100 bóng để thử nghiệm, thấy mỗi bóng tuổi thọ trung bình là 1000 giờ.
Hãy ước lượng tuổi thọ trung bình của bóng đèn xí nghiệp A sản xuất với khoảng tin cậy
95%.
2) Với độ chính xác là 15 giờ. Hãy xác định khoảng tin cậy.
3) Với độ chính xác là 25 giờ và khoảng tin cậy là 95% thì cần thử nghiệm bao nhiêu bóng.
Ví dụ 4: Trọng lượng các bao bột mì tại một cửa hàng lương thực theo quy luật chuẩn. Kiểm
tra 20 bao, thấy trọng lượng trung bình của mỗi bao bột mì là 48kg, và phương sai mẫu hiệu
chỉnh là s2 = (0,5kg)2.
Bước 2: Vì n=20 <30 và σ chưa biết nên ta tra bảng Student tìm t αn −1 . Trong trường hợp này
là t19
0.05 = 2.0930
s
Bước 3: Tính độ chính xác ε = t αn −1 = 0.234
n
Bước 4: Vậy với khoảng tin cậy 95%, trọng lượng trung bình của một bao bột mì thuộc cửa
hàng vào khoảng (47,766; 48,234) kg
2) Với độ chính xác 0,26 kg, xác định khoảng tin cậy.
s ε. n 0.26* 20
Ta có ε = t αn −1 = 0.26 ⇒ t αn −1 = = = 2.325
n s 0.5
Nhận xét: t αn −1 = 2, 325 ≈ 2, 5395 ( 2,5395 là giá trị gần nhất 2,325 nhất trong bảng tra ở bậc tự
do n -1 =19)
Từ đây ta tìm được γ = 0, 98 = 98%
3) Với độ chính xác 160 g ; khoảng tin cậy 95%, tính cỡ mẫu n.
ε = 0.16kg, γ = 95% ⇒ z α = 1.96
z α *s 1.96*0.5
n= = = 6.125 ⇒ n = (6.125) 2 = 37.51 ≈ 38
ε 0.16
Ví dụ 5: Lô trái cây của một chủ hàng được đóng thành sọt mỗi sọt 100 trái. Kiểm tra 50 sọt
thấy có 450 trái không đạt tiêu chuẩn.
1) Ước lượng tỷ lệ trái cây không đạt tiêu chuẩn của lô hàng với khoảng tin cậy 95%.
2) Muốn ước lượng tỷ lệ trái cây không đạt tiêu chuẩn với độ chính xác 0,5% thì khoảng tin
cậy đạt được là bao nhiêu?
Giải:
1) Ước lượng tỷ lệ trái cây không đạt tiêu chuẩn của lô hàng với khoảng tin cậy 95%.
8
f (1 − f ) 0, 09*(1 − 0, 09)
Bước 3: Tính độ chính xác ε = z α = 1,96 = 0, 008
n 5000
Bước 4: Với khỏang tin cậy 95% thì tỷ lệ trái cây không đạt tiêu chuẩn của lô hàng là p thuộc
vào khỏan p ∈ ( 0.082; 0.098 ) .
2) Muốn ước lượng tỷ lệ trái cây không đạt tiêu chuẩn với độ chính xác 0,5% thì khoảng tin
cậy đạt được là bao nhiêu?
Từ công thức
f (1 − f )
ε = zα
n
Suy ra
ε n 5000
zα = = 0, 005* = 1, 24
f (1 − f ) 0, 09(1 − 0, 09)
ϕ(z α ) = ϕ(1.24) = 0.3925
γ
ϕ(1.24) = ⇒ γ = 2* ϕ(1.24) = 2*0.3925 = 0.785 = 78.5%
2
Vậy khoảng tin cậy đạt được là 78,5%
Ví dụ 6: Một lô hàng có 5000 sản phẩm. Chọn ngẫu nhiên 400 sản phẩm từ lô hàng để kiểm
tra thì thấy có 360 sản phẩm loại A.
1) Hãy ước lượng số sản phẩm loại A có trong lô hàng với khoảng tin cậy96%?
2) Nếu muốn ước lượng số sản phẩm loại A của lô hàng đạt được độ chính xác 150 sản phẩm
và khoảng tin cậy 99% thì phải kiểm tra bao nhiêu sản phẩm ?.
Ví dụ 7: Điều tra năng suất lúa trên diện tích 100 hecta trồng lúa của một vùng, ta thu được
bảng số liệu sau:
Năng suất (tạ/ha) 41 44 45 46 48 52 54
Số ha có năng suất tương ứng 10 20 30 15 10 10 5
1) Hãy ước lượng năng suất lúa trung bình của vùng đó với khoảng tin cậy 95%?
2) Những thửa ruộng có năng suất từ 48tạ/ha trở lên là những thửa có năng suất cao. Hãy ước
lượng tỷ lệ diện tích có năng suất cao trong vùng với khoảng tin cậy 97%.
10
1. Khái niệm
Ví dụ 1: Một tổ chức cho rằng chiều cao trung bình hiện nay của thanh niên VN là 1.65m.
Hãy lập giả thiết để kiểm chứng kết quả này?
H 0 : µ =1.65
H1: µ ≠ 1.65
µ : chiều cao TB thực tế của thanh niên hiện nay
µ 0 = 1.65: chiều cao TB của thanh niên hiện nay theo lời tổ chức này
H0 gọi là giả thuyết không ( giả thuyết đơn)
H1 gọi là giả thuyết ngược lại ( giả thuyết đối)
Ta tiến hành kiểm định (kiểm tra) như sau:
Thu thập số liệu thực tế (lấy mẫu): đo chiều cao của khoảng 1 triệu người
Dùng 1 quy tắc kiểm định tương ứng và quy luật phân phối của thống kê đó phải được biết(
thường là quy luật phân phối chuẩn) cộng với giả thiết đang xét (kiểm định giá trị trung bình)
để quyết định: chấp nhận hay bác bỏ H0.
Chấp nhận H0: tổ chức này báo cáo đúng. Con số 1.65m là đáng tin cậy.
Bác bỏ H0: tổ chức này báo cáo sai.
2. Kiểm định hai phía và kiểm định 1 phía
a) Kiểm định 1 phía
Khi giả thuyết H1 có tính chất 1 phía thì việc kiểm định được gọi là kiểm định 1 phía
Ho: θ = θo hay θ ≤ θo hay θ ≥ θo
11
Trong đó θ = ( µ, ρ, σ 2 ) và θ0 = ( µ 0 , ρ0 , σ0 2 )
12
Bước 3
Tra bảng Laplace tìm z α sao cho
1− α
ϕ(z α ) = . Với α là mức ý nghĩa
2
Z=
( f − p0 ) n Bước 4 Z=
(X − µ )
0
n
p 0 (1 − p 0 ) Tìm mốc so sánh Z s
Bước 5
So sánh và kết luận
* Nếu Z ≤ z α chấp nhận H0 với mức ý nghĩa α
* Nếu Z > z α bác bỏ H0
13
• Nếu kích cỡ mẫu n là tùy ý ( n < 30 or n ≥ 30 ) và X ~ N(µ, σ2 ) mà σ đã biết. Lúc này thì ta không cần tính s và lấy Z =
(X − µ )
0
n
σ
• Nếu n<30 và X ~ N(µ, σ2 ) ; σ chưa biết. Thì ở bước 2 thay cho bảng Laplace ta cần tra bảng phân phối Student ở dòng n -1 và cột α . Ta tìm
14
µ 0 = 600 : là tiền lương trung bình của công nhân theo lời giám đốc
H0 : µ = µ0 ⇔ µ = 600
H1 : µ ≠ 600
Bước 2: Các tham số đặc trưng trên mẫu là x = 520 ngàn đồng/tháng ; σ = 40 ngàn
đồng/tháng
Bước 3: Với n=36 >30 ta chọn tiêu chuẩn kiểm định là phân phối Laplace với
1− α
ϕ[ zα ] = = 0.475 ⇒ z α = 1,96 .
2
Bước 4: Z =
(X − µ )0
n với X = 520, n = 36 > 30, σ = 40 Ta có Z =
( 520 − 600 ) 36
= 12
σ 40
Bước 5: Kiểm định bằng cách so sánh |Z| với z α . Ta có Z = 12 > 1,96 = zα : bác bỏ H0
Kết luận: Với mức ý nghĩa là 5%, không tin vào lời của giám đốc. Lương trung bình thực sự
của công nhân bé hơn 600 ngàn đồng / tháng (do X = 520 < 600 = µ0 ).
Ví dụ 2: Quan sát mức hao phí xăng của 25 xe máy thuộc cùng một loại và cùng chạy trên
một quãng đường, người ta thu được kết quả sau:
Mức hao phí xăng 1.9 – 2.1 2.1 – 2.3 2.3 – 2.5 2.5 – 2.7
Số xe 5 9 8 3
Với mức ý nghĩa 0.05, hãy so sánh mức hao phí xăng thực tế so với mức hao phí nhà sản xuất
đưa ra là 2.2
Giải:
Bước 1:
µ : là mức hao phí xăng trung bình thực tế của loại xe đó
µ 0 = 2.2 : là mức hao phí xăng trung bình của loại xe do nhà sản xuất đưa ra
H0 : µ = µ0 ⇔ µ = 2.2
H1 : µ ≠ 2.2
Bước 4: Z =
(X − µ ) 0
n=
( 2.72 − 2.2 ) 25
= 1.895
s 0.19
Bước 5: Kiểm định bằng cách so sánh |Z| với t αn −1 . Ta có Z = 1.895 < 2.0639 = t αn −1 : chấp nhận
H0
Kết luận: Với mức ý nghĩa là 5%, mức hao phí xăng trung bình của nhà máy là phù hợp với
mức hao phí xăng thực tế.
Ví dụ 3: Một cửa hàng thực phẩm nhận thấy thời gian vừa qua trung bình một khách hàng
mua 25 ngàn đồng thực phẩm trong ngày. Nay cửa hàng chọn ngẫu nhiên 15 khách hàng thấy
trung bình một khách hàng mua 24 ngàn đồng trong ngà y và phương sai mẫu hiệu chỉnh là s2
= (2 ngàn đồng)2. Với mức ý nghĩa là 5% , thử xem có phải sức mua của khách hàng hiện nay
có thay đổi so với trước đây.
Ví dụ 4: Lấy ý kiến 199 giảng viên trong trường Bách Khoa về việc day học theo lối tín chỉ
thì có 104 giảng viên đồng ý. Kiếm định với mức ý nghĩa 5% về giả thuyết cho rằng có một
nửa số giảng viên trong trường Bách khoa đồng ý dạy theo lối tín chỉ.
Giải:
Bước 1:
ρ : tỉ lệ giảng viên thực tế đồng ý giảng dạy theo lối tín chỉ
ρ0 : tỉ lệ giảng viên đồng ý giảng dạy theo lối tín chỉ theo giả thuyết
1
H0 : ρ =
H 0 : ρ = ρ0 2
⇔
H1 : ρ ≠ ρ0 H : ρ ≠ 1
1 2
m 104
Bước 2: Các tham số đặc trưng trên mẫu f = =
n 199
1− α
Bước 3: Với mức ý nghĩa là 5%, tra bảng Laplace với ϕ [ z α ] = = 0.475 ⇒ z α = 1,96
2
Bước 4: Z =
( f − p0 ) n
=
( 0.5226 − 0.5) 199 = 0.6376
p 0 (1 − p 0 ) 0.5 (1 − 0.5 )
Bước 5: Kiểm định bằng cách so sánh |Z| với z α . Ta có Z = 0.6376 < 1.96 = zα : chấp nhận H0
Kết luận: Với mức ý nghĩa là 5%, giả thuyết cho rằng có một nửa số giảng viên đồng ý giảng
dạy theo lối tín chỉ là phù hợp với thực tế.
16