You are on page 1of 29

ĐH Công nghiệp Tp.

HCM Saturday, October 23, 2010


dvntailieu.wordpress.com

PHẦN II. LÝ THUYẾT THỐNG KÊ


XÁC SUẤT & THỐNG KÊ (Statistical theory)
CAO ĐẲNG Chương 4. Lý thuyết mẫu
Chương 5. Ước lượng khoảng
PHỐI CHƯƠNG TRÌNH
PHÂN PHỐ Chương 6. Kiểm định Giả thuyết Thống kê
Chương 7. Bài toán Tương quan và Hồi quy
Số tiế
tiết: 30
--------------------- Tài liệu tham khảo
PHẦN I. LÝ THUYẾT XÁC SUẤT 1. Nguyễn Phú Vinh – Giáo trình Xác suất – Thống kê
(Probability theory) và Ứng dụng – NXB Thống kê.
2. Nguyễn Thanh Sơn – Lê Khánh Luận
Chương 1. Các khái niệm cơ bản của xác suất – Lý thuyết Xác suất và Thống kê toán – NXBTKê.
Chương 2. Biến ngẫu nhiên 3. Đậu Thế Cấp – Xác suất – Thống kê –
Chương 3. Định lý giới hạn trong xác suất Lý thuyết và các bài tập – NXB Giáo dục.

4. Lê Sĩ Đồng – Xác suất – Thống kê và Ứng dụng  Bổ túc về


về Đạ
Đại số
số Tổ hợp
– NXB Giáo dục. 1. Tính chất của các phép toán ∩, ∪
5. Đặng Hấn – Xác suất và Thống kê
– NXB Giáo dục. a) Tính giao hoán:
6. Phạm Xuân Kiều – Giáo trình Xác suất và Thống kê A ∩ B = B ∩ A, A ∪ B = B ∪ A.
– NXB Giáo dục. b) Tính kết hợp:
7. Nguyễn Cao Văn – Giáo trình Lý thuyết Xác suất (A ∩ B ) ∩ C = A ∩ (B ∩ C ),
& Thống kê – NXB Ktế Quốc dân. (A ∪ B ) ∪ C = A ∪ (B ∪ C ).
8. Đào Hữu Hồ – Xác suất Thống kê
– NXB Khoa học & Kỹ thuật. c) Tính phân phối:
A ∩ (B ∪ C ) = (A ∩ B ) ∪ (A ∩ C ),
soạn: ThS. Đoà
Biên soạ Đoàn Vương Nguyên A ∪ (B ∩ C ) = (A ∪ B ) ∩ (A ∪ C ).
Download Slide bà giảng XSTK_CĐ
bài giả XSTK_CĐ tại
d) Tính đối ngẫu (De–Morgan):
dvntailieu.wordpress.com
A ∩ B = A ∪ B, A ∪ B = A ∩ B.

 Bổ túc về
về Đạ
Đại số
số Tổ hợp  Bổ túc về
về Đạ
Đại số
số Tổ hợp
2. Quy tắc nhân 4. Phân biệt cách chọn k phần tử từ tập có n phần tử
• Giả sử một công việc nào đó được chia thành k giai Có 4 cách chọn ra k phần tử từ tập có n phần tử, n phần
đoạn. Có n1 cách thực hiện giai đoạn thứ 1,..., có nk tử này luôn được coi là khác nhau mặc dù bản chất của
cách thực hiện giai đoạn thứ k. Khi đó ta có: chúng có thể giống nhau. Đó là:
n = n1…nk cách thực hiện toàn bộ công việc.  Chọn 1 lần ra k phần tử và không để ý đến thứ tự của
• Giả sử có k công việc A1,..., Ak khác nhau. Có n1 cách chúng (Tổ hợp).
thực hiện A1 ,..., có nk cách thực hiện Ak . Khi đó ta có:  Chọn 1 lần ra k phần tử và để ý đến thứ tự của chúng
n = n1…nk cách thực hiện toàn bộ k công việc đó. (Chỉnh hợp).
3. Quy tắc cộng  Chọn k lần, mỗi lần 1 phần tử và không hoàn lại (số
• Giả sử một công việc có thể thực hiện được k cách cách chọn như Chỉnh hợp).
(trường hợp) loại trừ lẫn nhau: cách thứ nhất cho n1 kết  Chọn k lần, mỗi lần 1 phần tử và có hoàn lại (Chỉnh
quả,…, cách thứ k cho nk kết quả. Khi đó việc thực hợp lặp).
hiện công việc trên cho n = n1 +… + nk kết quả.

Xác suất - Thống kê Cao đẳng 1


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Bổ túc về
về Đạ
Đại số
số Tổ hợp  Bổ túc về
về Đạ
Đại số
số Tổ hợp
a) Tổ hợp Số chỉnh hợp chập k của n phần tử được ký hiệu và
• Tổ hợp chập k của n phần tử (0 ≤ k ≤ n ) là một nhóm tính theo công thức:
(bộ) không phân biệt thứ tự gồm k phần tử khác nhau n!
được chọn từ n phần tử đã cho. Ank = n(n − 1)...(n − k + 1) = .
(n − k )!
Số tổ hợp chập k của n phần tử được ký hiệu và tính
n! c) Chỉnh hợp lặp
theo công thức: C n =
k
. Quy ước: 0! = 1. • Chỉnh hợp lặp k của n phần tử là một nhóm (bộ) có thứ
k ! (n − k ) ! tự gồm phần k tử không nhất thiết khác nhau được
Tính chất: C nk = C nn −k ; −1
C nk = C nk − + C nk −1 . chọn từ n phần tử đã cho.
1
Số các chỉnh hợp lặp k của n phần tử là nk.
b) Chỉnh hợp Nhận xét:
• Chỉnh hợp chập k của n phần tử (0 ≤ k ≤ n ) là một
nhóm (bộ) có thứ tự gồm k phần tử khác nhau được Tổ hợp Chỉnh hợp Chỉnh hợp lặp
chọn từ n phần tử đã cho. C nk < Ank = n(n − 1)...(n − k + 1) < n k

PHẦN I. LÝ THUYẾT XÁC SUẤT  Chương 1. Cá


Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
Chương 1. Các khái niệm cơ bản của xác suất • Biến cố ngẫu nhiên thường được ký hiệu A, B, C…
VD 1
§1. Biến cố ngẫu nhiên • Tung đồng tiền lên là một phép thử, biến cố là “mặt
§2. Xác suất của biến cố
§3. Công thức tính xác suất
sấp xuất hiện” hay “mặt ngửa xuất hiện”.
……………………. • Chọn ngẫu nhiên một số sản phẩm từ một lô hàng để
kiểm tra là phép thử, biến cố là “chọn được sản phẩm
§1. BIẾN CỐ NGẪU NHIÊN
tốt” hay “chọn được phế phẩm”.
1.1. Phép thử và biến cố • Gieo một số hạt lúa là phép thử, biến cố là “hạt lúa nảy
• Phép thử là việc thực hiện 1 thí nghiệm hay quan sát mầm” hay “hạt lúa không nảy mầm”.
một hiện tượng nào đó để xem có xảy ra hay không.
Phép thử mà ta không khẳng định được một cách chắc 1.2. Phân loại biến cố
chắn kết quả trước khi thực hiện phép thử được gọi là a) Biến cố sơ cấp và không gian các biến cố sơ cấp
phép thử ngẫu nhiên. • Trong một phép thử, các biến cố không thể phân nhỏ
• Hiện tượng có xảy ra hay không trong phép thử được thành nhiều biến cố được gọi là biến cố sơ cấp (VD 6).
gọi là biến cố ngẫu nhiên. Ký hiệu các biến cố sơ cấp bởi các chữ ωi .

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ

• Trong một phép thử, tập hợp tất cả các biến cố sơ cấp 1.3. Quan hệ giữa các biến cố
được gọi là không gian các biến cố sơ cấp. Ký hiệu a) Quan hệ kéo theo
không gian biến cố sơ cấp là Ω = {ωi , i = 1, 2, ...}. • Biến cố A được gọi là kéo theo biến cố B, ký hiệu
A ⊂ B , khi và chỉ khi A xảy ra thì suy ra B xảy ra.
b) Biến cố chắc chắn và biến cố không thể
VD 3. Theo dõi 4 con gà mái đẻ trứng trong 1 ngày. Gọi:
• Trong một phép thử, biến cố nhất định xảy ra (chắc
chắn xảy ra) là biến cố chắc chắn, ký hiệu là Ω . Ai : “có i con gà mái đẻ trứng trong 1 ngày”, i = 0, 4 .
• Biến cố không thể (rỗng) là biến cố không thể xảy ra B : “có nhiều hơn 2 con gà mái đẻ trứng trong 1 ngày”.
khi thực hiện phép thử, ký hiệu ∅. Ta có: A3 ⊂ B , A4 ⊂ B , A0 ⊄ B , A1 ⊄ B , A2 ⊄ B .

VD 2. Từ một nhóm có 6 nam và 4 nữ chọn ra 5 người. b) Quan hệ tương đương


Khi đó, biến cố “chọn được 5 người nữ” là không thể, • Hai biến cố A và B được gọi là tương đương với nhau,
biến cố “chọn được ít nhất 1 nam” là chắc chắn. ký hiệu A = B , khi và chỉ khi A ⊂ B và B ⊂ A .

Xác suất - Thống kê Cao đẳng 2


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
c) Tổng của hai biến cố VD 5. Một người dự thi lấy bằng lái xe máy.
• Tổng của hai biến cố A và B là một biến cố được ký Gọi A : “người đó thi đạt vòng thi lý thuyết”
hiệu A ∪ B hay A + B , biến cố tổng xảy ra khi ít nhất B : “người đó thi đạt vòng thi thực hành” và
một trong hai biến cố A và B xảy ra. C : “người đó lấy được bằng lái xe máy” thì C = A ∩ B .
VD 4. Người thợ săn bắn hai viên đạn vào một con thú. VD 6. Xét phép thử gieo 2 hạt lúa.
Gọi A1: “viên đạn thứ nhất trúng con thú” • Gọi Ai là biến cố “hạt thứ i nảy mầm” (i = 1, 2),
A2: “viên đạn thứ hai trúng con thú” Ki là biến cố “hạt thứ i không nảy mầm” (i = 1, 2).
A: “con thú bị bị trúng đạn” thì A = A1 ∪ A2 . Khi đó, các biến cố tích sau đây là các biến cố sơ cấp:
d) Tích của hai biến cố K1 ∩ K 2 , A1 ∩ K 2 , K1 ∩ A2 , A1 ∩ A2
• Tích của hai biến cố A và B là một biến cố được ký và Ω = {K1K 2 ; A1K 2 ; K1A2 ; A1A2 } .
hiệu A ∩ B hay AB , biến cố tích xảy ra khi và chỉ khi • Gọi B là biến cố “có 1 hạt nảy mầm” thì biến cố B
biến cố A xảy ra và biến cố B xảy ra.
không phải là biến cố sơ cấp vì B = A1K 2 ∪ K1A2 .

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
e) Biến cố đối lập 1.4. Hệ đầy đủ các biến cố
• Hiệu của hai biến cố A và B là một biến cố được ký a) Hai biến cố xung khắc
hiệu A \ B , biến cố hiệu xảy ra khi và chỉ khi biến cố • Hai biến cố A và B được gọi là xung khắc nếu trong
A xảy ra nhưng biến cố B không xảy ra. một phép thử, khi A xảy ra thì B không xảy ra và
• Đối lập của biến cố A là một biến cố được ký hiệu A , ngược lại khi B xảy ra thì A không xảy ra.
khi A xảy ra thì A không xảy ra. Ta có A = Ω \ A . VD 8. Một hộp 10 viên phấn có 3 màu đỏ, vàng và xanh.
Chọn ngẫu nhiên 1 viên phấn từ hộp đó.
VD 7. Một người bắn lần lượt 2 viên đạn vào 1 tấm bia. Gọi A: “chọn được viên phấn màu đỏ”
Gọi Ai : “có i viên đạn trúng bia” (i = 0, 1, 2) và B: “chọn được viên phấn màu xanh”
B: “có không quá 1 viên đạn trúng bia”. thì A và B là xung khắc.
Khi đó: B = A2 , A0 = A1 ∪ A2 và A1 = A0 ∪ A2 . Nhận xét
Hai biến cố đối lập là xung khắc, ngược lại không đúng.

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
b) Hệ đầy đủ các biến cố §2. XÁC SUẤT CỦA BIẾN CỐ
• Họ các biến cố {Ai} (i = 1,…, n) được gọi là hệ đầy đủ 2.1. Định nghĩa xác suất dạng cổ điển
các biến cố nếu thỏa mãn cả 2 điều sau: a) Số trường hợp đồng khả năng
1) Họ xung khắc, nghĩa là Ai ∩ Aj = ∅, ∀ i ≠ j . • Hai hay nhiều biến cố trong một phép thử có khả năng
xảy ra như nhau được gọi là đồng khả năng.
2) Có ít nhất 1 biến cố của họ xảy ra trong phép thử, VD 1. Trong dữ liệu máy tính của trường, ngân hàng đề
nghĩa là A1 ∪ A2 ∪ ... ∪ An = Ω . có 100 đề thi. Cho máy chọn ngẫu nhiên 1 đề thì
khả năng được chọn của mỗi đề thi là như nhau.
VD 9. Trộn lẫn 4 bao lúa vào nhau rồi bốc ra 1 hạt.
b) Định nghĩa
Gọi Ai : “hạt lúa bốc được là của bao thứ i ”, i = 1, 4 . • Trong một phép thử có tất cả n biến cố sơ cấp đồng khả
{ }
Khi đó, hệ A1 ; A2 ; A3 ; A4 là đầy đủ. năng, trong đó có m khả năng thuận lợi cho biến cố A
xuất hiện thì xác suất (probability) của A là:
Chú ý m Soá bieán coá sô caáp thuaän lôïi cho A
{ }
Trong 1 phép thử, A; A là đầy đủ với biến cố A tùy ý.
P(A) =
n
=
Soá bieán coá sô caáp ñoàng khaû naêng
.

Xác suất - Thống kê Cao đẳng 3


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
Nhận xét VD 5. Tại bệnh viện A có 50 người đang chờ kết quả
0 ≤ P(A) ≤ 1, ∀A ; P(∅) = 0 ; P(Ω) = 1 . khám bệnh. Trong đó có 12 người chờ kết quả nội soi,
VD 2. Một hộp chứa 9 thẻ được đánh số từ 1 đến 9. Một 15 người chờ kết quả siêu âm, 7 người chờ kết quả cả
người chọn ngẫu nhiên (1 lần) từ hộp đó ra 3 thẻ. nội soi và siêu âm. Gọi tên ngẫu nhiên một người trong
Tính xác suất người đó chọn được 3 thẻ đều có số chẵn? 50 người này, hãy tính xác suất gọi được người đang chờ
kết quả nội soi hoặc siêu âm?
VD 3. Một hộp có 10 sản phẩm trong đó có 4 phế phẩm.
Chọn ngẫu nhiên (1 lần) từ hộp đó ra 5 sản phẩm.
Tính xác suất để có:
1) Cả 5 sản phẩm đều tốt; 2) Đúng 2 phế phẩm.
VD 4. Một bàn tròn trong một đám cưới có 10 chỗ ngồi.
Giả sử mọi người ngồi vào chỗ một cách ngẫu nhiên
(lấy sân khấu làm chuẩn). Tính xác suất để 1 cặp vợ
chồng xác định trước ngồi cạnh nhau.

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
Ưu điểm và hạn chế của định nghĩa dạng cổ điển • Số p cố định này được gọi là xác suất của biến cố A
• Ưu điểm: Tính được chính xác giá trị của xác suất mà theo nghĩa thống kê.
không cần thực hiện phép thử. m
• Hạn chế: Trong thực tế có nhiều phép thử vô hạn các Trong thực tế, khi n đủ lớn thì P( A) ≈ .
biến cố và biến cố không đồng khả năng.
n

2.2. Định nghĩa xác suất dạng thống kê VD 6


• Thực hiện một phép thử nào đó n lần thấy có m lần • Pearson đã gieo một đồng tiền cân đối, đồng chất
m 12000 lần thấy có 6019 lần xuất hiện mặt sấp (tần suất
biến cố A xuất hiện thì tỉ số được gọi là tần suất của 0,5016); gieo 24000 lần thấy có 12012 lần sấp (tần
n
biến cố A. suất 0,5005).
• Khi n thay đổi, tần suất cũng thay đổi nhưng luôn dao
• Cramer đã nghiên cứu tỉ lệ sinh trai – gái ở Thụy Điển
m
động quanh 1 số cố định p = lim . trong năm 1935 và kết quả có 42591 bé gái được sinh
n →+∞ n
ra trong tổng số 88273 trẻ sơ sinh, tần suất là 0,4825.

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
Nhận xét §3. CÔNG THỨC TÍNH XÁC SUẤT
Định nghĩa xác suất theo dạng thống kê chỉ cho giá trị
3.1. Công thức cộng xác suất
xấp xỉ và mức độ chính xác tùy thuộc vào số lần thực
• Nếu A và B là hai biến cố tùy ý thì:
hiện phép thử.
P (A ∪ B ) = P (A) + P (B ) − P (AB ).
2.3. Ý nghĩa của xác suất
• Xác suất là số đo mức độ tin chắc, thường xuyên xảy ra • Nếu A và B xung khắc thì:
của 1 biến cố trong phép thử. P(A ∪ B ) = P(A) + P (B ).
2.4. Tính chất của xác suất • Nếu họ {Ai} (i = 1, 2,…, n) xung khắc từng đôi thì:
1) Nếu A là biến cố tùy ý thì 0 ≤ P(A) ≤ 1 . P (A1 ∪ A2 ∪ ... ∪ An ) =P(A1 )+P(A2 )+...+P(An ).
2) P(∅) = 0 .
Đặc biệt
3) P(Ω) = 1 .
4) Nếu A ⊂ B thì P(A) ≤ P(B ). ()
P A = 1 − P (A); P (A) = P (AB ) + P A B . ( )

Xác suất - Thống kê Cao đẳng 4


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
3.2. Xác suất có điều kiện
VD 1. Một hộp phấn có 10 viên trong đó có 3 viên màu
3.2.1. Định nghĩa
đỏ. Lấy ngẫu nhiên từ hộp ra 3 viên phấn.
• Trong một phép thử, xét 2 biến cố bất kỳ A và B với
Tính xác suất để lấy được ít nhất 1 viên phấn màu đỏ.
P(B ) > 0 . Xác suất có điều kiện của A với điều kiện B
đã xảy ra được ký hiệu và định nghĩa:

(
P AB = ) P (A ∩ B )
P (B )
.

VD 2. Một nhóm có 30 nhà đầu tư các loại, trong đó có: VD 3. Một nhóm 10 sinh viên gồm 3 nam và 7 nữ trong
13 nhà đầu tư vàng; 17 nhà đầu tư chứng khoán và 10 đó có 2 nam 18 tuổi và 3 nữ 18 tuổi. Chọn ngẫu nhiên
nhà đầu tư cả vàng lẫn chứng khoán. Một đối tác gặp 1 sinh viên từ nhóm đó.
ngẫu nhiên một nhà đầu tư trong nhóm. Tìm xác suất để Gọi A : “sinh viên được chọn là nữ”,
người đó gặp được nhà đầu tư vàng hoặc chứng khoán? B : “sinh viên được chọn là 18 tuổi”.
( ) (
Hãy tính P (A), P (B ), P (A ∩ B ), P A B , P B A ? )

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
Nhận xét
3.2.2. Công thức nhân xác suất
(
1) P (AB ) = P (A).P B A = P (B ).P A B . ) ( ) a) Sự độc lập của hai biến cố
( )
2) Khi tính P A B với điều kiện B đã xảy ra, nghĩa là A và B được gọi là hai biến cố độc lập nếu B có xảy ra
ta đã hạn chế không gian mẫu Ω xuống còn B và hay không cũng không ảnh hưởng đến khả năng xảy ra
hạn chế A xuống còn A ∩ B . A và ngược lại.
Ví dụ, xét hai máy hoạt động trong hai dây chuyền
Tính chất
khác nhau thì nếu có một máy hỏng cũng không ảnh
( ) (
1) 0 ≤ P A B ≤ 1 ; P A B = 0 nếu A, B xung khắc ) hưởng đến hoạt động của máy còn lại.
( ) ( )
2) P B B = 1 ; P Ω B = 1 ; P A B = 1 nếu B ⊂ A ( )
Chú ý
( )
3) P A B = 1 − P A B ( ) Nếu A, B độc lập với nhau thì
4) Nếu A1 và A2 xung khắc thì:
A, B độc lập; A, B độc lập và A, B độc lập.
P (A1 ∪ A2 ) B  = P A1 B + P A2 B .
  ( ) ( )

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
b) Công thức nhân
• Nếu A và B là hai biến cố không độc lập thì: VD 5. Một rổ mận chứa 30 trái trong đó có 2 trái bị hư.
Một người chịu mua rổ mận ấy với điều kiện được thử
(
P (A ∩ B ) = P (B )P A B = P (A)P B A . ) ( ) liên tiếp 3 trái, nếu có ít nhất 1 trái hư thì không mua.
Tính xác suất để rổ mận được người đó mua?
Nếu A và B là hai biến cố độc lập thì:
P (A ∩ B ) = P (A).P (B ).
• Nếu n biến cố Ai , i = 1,..., n không độc lập thì:
(
P (A1A2 ...An ) = P (A1 ) P A2 A1 ...P An A1 ...An −1 . ) ( ) VD 6. Một sinh viên học hệ niên chế được thi lại 1 lần
nếu lần thi thứ nhất bị rớt (2 lần thi độc lập). Biết rằng
VD 4. Một người có 4 bóng đèn trong đó có 2 bóng bị xác suất để sinh viên này thi đỗ lần 1 và lần 2 tương ứng
hỏng. Người đó thử lần lượt từng bóng đèn (không là 60% và 80%. Tính xác suất sinh viên này thi đỗ?
hoàn lại) cho đến khi chọn được 1 bóng tốt.
Tính xác suất để người đó thử đến lần thứ 2.

Xác suất - Thống kê Cao đẳng 5


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ

VD 7. Một người nông dân tiến hành phun thuốc trừ sâu 3.2.3. Công thức xác suất đầy đủ và Bayes.
hại lúa 2 lần liên tiếp trong 1 tuần. Xác suất sâu chết sau a) Công thức xác suất đầy đủ
lần phun thứ nhất là 0,6. Nếu sâu sống sót thì khả năng • Cho họ các biến cố {Ai } (i = 1,2,..., n ) đầy đủ và B là
sâu chết sau lần phun thứ hai là 0,9. Tính xác suất sâu bị biến cố bất kỳ trong phép thử, ta có:
chết sau 2 lần phun thuốc? n
P(B ) = ∑ P(Ai ) B Ai ( )
i =1
VD 8. Có hai người A và B cùng đặt lệnh mua cổ phiếu
của công ty X với xác suất mua được tương ứng là 0,8
( )
= P(A1 )P B A1 + ... + P(An )P B An . ( )
và 0,7. Biết rằng chỉ có 1 người mua được, xác suất để VD 9. Một cửa hàng bán hai loại bóng đèn cùng kích cỡ
người A mua được cổ phiếu của công ty X là: gồm: 70 bóng màu trắng với tỉ lệ bóng hỏng là 1% và
7 12 8 6 30 bóng màu vàng với tỉ lệ hỏng 2%. Một khách hàng
A. ; B. ; C. ; D. .
19 19 15 25 chọn mua ngẫu nhiên 1 bóng đèn từ cửa hàng này.
Tính xác suất để người này mua được bóng đèn tốt ?

 Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ  Chương 1. Cá
Các khá niệm cơ bả
khái niệ bản củ
của xá suất
xác suấ
b) Công thức Bayes VD 11. Tỉ số ôtô tải và ôtô con đi qua đường X có trạm
• Cho họ các biến cố {Ai }, i = 1; n đầy đủ và B là bơm dầu là 5/2. Xác suất để ôtô tải và ôtô con đi qua
biến cố bất kỳ trong phép thử. đường này vào bơm dầu lần lượt là 0,1 và 0,2. Biết
Xác suất để Ai xuất hiện sau khi đã xuất hiện B là: rằng có 1 ôtô đi qua đường X vào bơm dầu, tính xác
suất để đó là ôtô tải ?
(
P (Ai )P B Ai ) (
P (Ai )P B Ai ).
(
P Ai B =) n
=
P (B )
∑ P(Ai )P (B Ai ) VD 12. Có 3 bao lúa cùng loại. Bao 1 nặng 20kg chứa
i =1 1% hạt lép, bao 2 nặng 30kg chứa 1,2% hạt lép và bao
3 nặng 50kg chứa 1,5% hạt lép. Trộn cả 3 bao lại rồi
VD 10. (Xét tiếp VD 9) Giả sử khách hàng chọn mua bốc ngẫu nhiên 1 hạt thì được hạt lép.
được bóng đèn tốt. Tính xác suất để người này mua Tính xác suất để hạt lép này là của bao thứ ba ?
được bóng đèn màu vàng ?

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
§1. Biến ngẫu nhiên và hàm phân phối VD 1. Khi tiến hành gieo n hạt đậu ta chưa thể biết có
§2. Các đặc trưng số của biến ngẫu nhiên bao nhiêu hạt sẽ nảy mầm, số hạt nảy mầm có thể có là
§3. Một số luật phân phối xác suất thông dụng 0, 1, …, n.
……………………… Kết thúc phép thử gieo hạt thì ta sẽ biết chắc chắn có
§1. BIẾN NGẪU NHIÊN VÀ HÀM PHÂN PHỐI bao nhiêu hạt nảy mầm. Gọi X là số hạt nảy mầm thì là
1.1. Biến ngẫu nhiên X biến ngẫu nhiên và X = {0, 1, 2, …, n}.
1.1.1. Khái niệm và phân loại biến ngẫu nhiên b) Phân loại biến ngẫu nhiên
a) Khái niệm • Biến ngẫu nhiên (BNN) được gọi là rời rạc nếu các giá
• Một biến cố được gọi là ngẫu nhiên nếu trong kết quả trị có thể có của nó lập nên 1 tập hợp hữu hạn hoặc
của phép thử nó sẽ nhận một và chỉ một trong các giá đếm được.
trị có thể có của nó tùy thuộc vào sự tác động của các • Biến ngẫu nhiên được gọi là liên tục nếu các giá trị có
nhân tố ngẫu nhiên. thể có của nó lấp đầy 1 khoảng trên trục số.
• Các biến ngẫu nhiên được ký hiệu: X, Y, Z, … VD 2
các giá trị tương ứng của chúng là x, y, z,… • Biến X trong VD 1 là BNN rời rạc (tập hữu hạn).

Xác suất - Thống kê Cao đẳng 6


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
• Gọi Y là số người đi qua 1 ngã tư trên đường phố thì Y Chú ý
là BNN rời rạc (tập đếm được).
• Bắn 1 viên đạn vào bia, gọi X (cm) là “khoảng cách từ
1) pi ≥ 0 ; ∑ pi = 1, i = 1, 2,...
điểm chạm của viên đạn đến tâm của bia” thì X là 2) Trong trường hợp các giá trị xi , pi có tính quy luật,
BNN liên tục. thay cho việc lập bảng ta có thể mô tả bởi đẳng thức:
• Gọi Y là “sai số khi đo 1 đại lượng vật lý” thì Y là BNN P(X = xi ) = pi , i = 1, 2,...
liên tục.
1.1.2. BNN rời rạc, bảng phân phối xác suất
• Cho biến ngẫu nhiên rời rạc X, X = {x1 , x 2 ,..., x n ,...} VD 3. Xác suất để 1 người thi đạt mỗi khi thi lấy bằng
với xác suất tương ứng là P(X = x i ) = pi , i = 1, 2,... lái xe là 0,3. Người đó thi cho đến khi đạt mới thôi.
Ta có phân phối xác suất của X ở dạng bảng: Gọi X là số lần người đó dự thi (mỗi lần thi là độc lập).
x1 x 2 … xn … 1) Lập bảng phân phối xác suất của X.
X
2) Tính xác suất để người đó phải thi không ít hơn 3 lần.
P(X = xi ) p1 p2 … pn …

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
Giải
VD 4. Một hộp có 3 viên phấn trắng và 2 viên phấn đỏ. 2
Một người lấy phấn ngẫu nhiên lần lượt (mỗi lần 1 viên • Ta có P(X = x i2 )
= P (X = xi ), suy ra:
và không trả lại) từ hộp đó ra cho đến khi lấy được 2 X 2 0 1 4
viên phấn đỏ. Gọi X là số lần người đó lấy phấn. 2 2
P(X = x i ) 0,3 0,4 0,3
Hãy lập bảng phân phối xác suất của X ?
• Ta có (X + Y = −1) = (X = 0) ∩ (Y = −1)
⇒ P (X + Y = −1) = P(X = 0).P(Y = −1) = 0,12 ;
VD 5. Cho hai BNN X, Y độc lập với bảng ppxs như sau: Tương tự:
X 0 1 2 Y −1 1 P(X + Y = 0) = P(X = 1).P(Y = −1) = 0,16 ;
P ( X = xi ) 0,3 0,4 0,3 P(Y = y j ) 0,4 0,6
P (X + Y = 1) = P (X = 0).P (Y = 1)
Hãy lập bảng phân phối xác suất của X 2 , X + Y .
+ P(X = 2).P (Y = −1) = 0, 30;

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
P (X + Y = 2) = P (X = 1).P (Y = 1) = 0, 24 ;
Giải. (X ;Y ) = (1; −1) ⇒ Z = 8, p = 0,1;
P (X + Y = 3) = P(X = 2).P (Y = 1) = 0,18 .
(X ;Y ) = (1; 0) ⇒ Z = 7, p = 0,15 ;
Vậy X +Y −1 0 1 2 3 (X ;Y ) = (1; 1) ⇒ Z = 6, p = 0, 05 ;
P(X + Y = k ) 0,12 0,16 0,30 0,24 0,18
(X ;Y ) = (2; −1) ⇒ Z = 10, p = 0, 3 ;
VD 6. Cho bảng ppxs đồng thời của hai BNN X và Y: (X ;Y ) = (2; 0) ⇒ Z = 9, p = 0, 2 ;
Y
X
–1 0 1 (X ;Y ) = (2; 1) ⇒ Z = 8, p = 0, 2 .
1 0,10 0,15 0,05
Sắp xếp các giá trị của Z và xác suất tương ứng, ta có:
2 0,30 0,20 0,20
Z 6 7 8 9 10
Hãy lập bảng phân phối xác suất của biến ngẫu nhiên: P(Z = k ) 0,05 0,15 0,30 0,20 0,30
Z = 2X −Y + 5 .

Xác suất - Thống kê Cao đẳng 7


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
1.1.3. Biến ngẫu nhiên liên tục, hàm mật độ
4x 3 , x ∈ (0; 1)
• Cho BNN liên tục X. Hàm f (x ), x ∈ ℝ được gọi là
VD 7. Chứng tỏ f (x ) =  là hàm mật độ
hàm mật độ xác suất của X nếu thỏa hai điều kiện:  0, x ∉ (0; 1)
+∞
của biến ngẫu nhiên X.
1) f (x ) ≥ 0, ∀x ∈ ℝ ; 2) ∫ f (x )dx = 1 .
−∞
b
VD 8. Cho biến ngẫu nhiên X có hàm mật độ:
• Khi đó, xác suất P(a < X < b ) = ∫ f (x )dx .  0, x < 1

f (x ) =  k
a
Chú ý
P(a ≤ X < b ) = P(a < X ≤ b ) = P (a ≤ X ≤ b )  , x ≥ 1.
 x 2
b
Tìm k và tính P (−3 < X ≤ 2).
= P(a < X < b ) = ∫ f (x )dx .
a

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
1.2. Hàm phân phối Nhận xét
1.2.1. Định nghĩa 1) Giả sử BNN X chỉ nhận các giá trị trong x1 ; xn  và
 
( )
• Hàm phân phối xác suất (gọi tắt là hàm phân phối) của
biến ngẫu nhiên X, ký hiệu F(x) hoặc FX(x), là xác suất x1 < x 2 < x 3 < ... < x n , P (X = x i ) = pi i = 1, n .
để X nhận giá trị nhỏ hơn x (với x là số thực bất kỳ). Ta có hàm phân phối của X :
Nghĩa là: F (x ) = P (X < x ), ∀x ∈ ℝ .
0 neáu x ≤ x1

• Nếu BNN X rời rạc với xác suất P( X = xi ) = pi thì: p neáu x1 < x ≤ x 2
F ( x ) = ∑ pi .  1
 p + p neáu x 2 < x ≤ x 3
xi < x
F (x ) =  1 2
• Nếu BNN X liên tục với hàm mật độ f ( x ) thì: ...........................................................

p1 + p2 + ... + pn −1 neáu xn −1 < x ≤ xn
x

F ( x) = ∫
−∞
f (t )dt .
1 neáu x > xn .


 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
2) Mối liên hệ của F (x ) với xác suất và hàm mật độ VD 9. Cho biến ngẫu nhiên X có bảng phân phối xs:
xác suất: X 2 4 5
 pi = F (x i +1 ) − F (x i ). P 0,3 0,5 0,2
Lập hàm phân phối xác suất của X .
 Nếu X là biến ngẫu nhiên liên tục thì hàm F (x )
liên tục tại mọi x ∈ ℝ và F ′(x ) = f (x ).
1.2.2. Tính chất cơ bản của hàm phân phối VD 10. Cho biến ngẫu nhiên X có hàm mật độ là:
0, x ∉ (−1; 2)
1) Hàm F (x ) xác định với mọi x ∈ ℝ . 
2) 0 ≤ F (x ) ≤ 1, ∀x ∈ ℝ ; F (−∞) = 0; F (+∞) = 1. f (x ) =  x 2
 , x ∈ (−1; 2).
3) F (x ) không giảm: F (x1 ) ≤ F (x 2 ) nếu x1 < x 2 .  3
4) P(a ≤ X < b ) = F (b ) − F (a ). Tìm hàm phân phối xs của X và tính P (−2 < X ≤ 1) .

Xác suất - Thống kê Cao đẳng 8


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
VD 11. Thời gian chờ phục vụ của khách hàng là BNN §2. CÁC ĐẶC TRƯNG SỐ CỦA BIẾN NGẪU NHIÊN
X (phút) liên tục có hàm phân phối xác suất: • Những thông tin cô đọng phản ánh từng phần về biến
ngẫu nhiên giúp ta so sánh giữa các đại lượng với nhau
0, x ≤ −2
 được gọi là các đặc trưng số.
 3
F (x ) = ax + 8a, x ∈ (−2; 3]. • Có ba loại đặc trưng số:
  Các đặc trưng số cho xu hướng trung tâm của BNN:
1, x > 3. Kỳ vọng toán, Trung vị, Mode,…
  Các đặc trưng số cho độ phân tán của BNN:
1) Tìm hàm mật độ xác suất f (x ) của X . Phương sai, Độ lệch chuẩn,…
2) Tính P ( )
2 < Y ≤ 5 với Y = X 2 + 1 .
 Các đặc trưng số cho dạng phân phối xác suất.
2.1. KỲ VỌNG TOÁN (giá trị trung bình)
2.1.1. Định nghĩa
• Kỳ vọng toán (gọi tắt là kỳ vọng – Expectation) của
biến ngẫu nhiên X , ký hiệu EX hay M (X ), là một
con số được xác định như sau:

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
 Nếu X rời rạc với xác suất P (X = x i ) = pi thì: VD 1. Một lô hàng gồm 10 sản phẩm tốt và 2 phế phẩm.
EX = ∑ x i pi . Lấy ngẫu nhiên 4 sản phẩm từ lô hàng đó, gọi X là số
i sản phẩm tốt trong 4 sản phẩm lấy ra.
 Nếu X liên tục có hàm mật độ f (x ) thì: Tìm phân phối xác suất và tính kỳ vọng của X .
+∞ VD 2. Tìm kỳ vọng của biến ngẫu nhiên X có hàm mật
EX = ∫ x .f (x )dx .  3 2
 (x + 2x ), x ∈ (0; 1)
−∞ độ xác suất f (x ) =  4
 0, x ∉ (0; 1).
Đặc biệt 
{
• Nếu biến ngẫu nhiên rời rạc X = x 1; x 2 ;...; x n } với Chú ý
1) Nếu X là BNN liên tục trên [a; b ] thì EX ∈ [a ; b ].
xác suất tương ứng là p1, p2,..., pn thì:
2) Nếu X = {x 1,..., x n } thì:
EX = x1p1 + x 2 p2 + ... + x n pn .
EX ∈ [min{x1,..., x n }; max{x1,..., x n }].

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
VD 3. Cho BNN X có bảng phân phối xác suất:
VD 4. Theo thống kê, một người Mỹ 25 tuổi sẽ sống
X 0 0,1 0,3 0,4 0,7
thêm trên 1 năm có xác suất là 0,992 và người đó chết
P a 0,2 b 0,2 0,1
trong vòng 1 năm tới là 0,008. Một công ty bảo hiểm A
Giá trị của tham số a và b để EX = 0,2 là: đề nghị người đó bảo hiểm sinh mạng cho 1 năm với
A. a = 0,1 và b = 0,1; B. a = 0,4 và b = 0,1; số tiền chi trả là 10000 USD, phí bảo hiểm là 100
C. a = 0,2 và b = 0,3; D. a = 0,3 và b = 0,2. USD. Hỏi trung bình công ty A lãi bao nhiêu khi bán
2.1.2. Ý nghĩa của Kỳ vọng bảo hiểm cho người đó?
• Kỳ vọng của biến ngẫu nhiên X là giá trị trung bình
(theo xác suất) mà X nhận được, nó phản ánh giá trị
trung tâm của phân phối xác suất của X.
• Trong thực tế sản xuất hay kinh doanh nếu cần chọn
phương án cho năng suất hay lợi nhuận cao, người ta
chọn phương án sao cho năng suất kỳ vọng hay lợi
nhuận kỳ vọng cao.

Xác suất - Thống kê Cao đẳng 9


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên

VD 5. Người thợ chép tranh mỗi tuần chép hai bức tranh 2.1.3. Tính chất của Kỳ vọng
độc lập A và B với xác suất hỏng tương ứng là 0,03 và 1) EC = C , C ∈ ℝ .
0,05. Biết rằng nếu thành công thì người thợ sẽ kiếm lời
2) E (CX ) = C .EX , C ∈ ℝ .
từ bức tranh A là 1,3 triệu đồng và B là 0,9 triệu đồng,
nhưng nếu hỏng thì bị lỗ do bức tranh A là 0,8 triệu đồng 3) E (X ± Y ) = EX ± EY .
và do B là 0,6 triệu đồng. Hỏi trung bình người thợ kiếm 4) E (X .Y ) = EX .EY nếu X ,Y độc lập.
được bao nhiêu tiền chép tranh mỗi tuần?
A. 2,185 triệu đồng; B. 2,148 triệu đồng. 5) Khi Y = ϕ(X ) thì:
C. 2,116 triệu đồng; D. 2,062 triệu đồng.  ∑ ϕ(x )p , neáu X rôøi raïc
 i i
+∞ i
EY = 

 ∫
ϕ(x )f (x )dx , neáu X lieân tuïc .
−∞

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
2 2.3. MODE
VD 6. Tính EY với Y = ϕ(X ) = X − 3 , biết X có bảng
Định nghĩa
phân phối xác suất: Mode của biến ngẫu nhiên X , ký hiệu mod X , là giá trị
X –1 0 1 2
của X thỏa:
P 0,1 0,3 0,35 0,25
 Nếu BNN X rời rạc thì:
 2 {
mod X = x 0 P (X = x 0 ) max . }
 , x ∈ [1; 2]
VD 7. BNN X có hàm mật độ f (x ) =  x 2 .  Nếu BNN X liên tục có hàm mật độ f (x ) thì:

0, x ∉ [1; 2]
Chú ý
{
mod X = x 0 f (x 0 ) max . }
2 • Mode còn được gọi là số có khả năng nhất (xác suất
1) Tính EX; 2) Tính EY với Y = X 5 − . cao nhất).
X • Nếu phân phối xác suất của BNN X đối xứng (nghĩa là
p i = p n − i hoặc đồ thị hàm mật độ f ( x ) đối xứng) và có
1 mode thì Kỳ vọng và Mode trùng nhau.

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
VD 8. Cho BNN X có bảng phân phối xác suất: 2.4. Phương sai
X 0 1 2 4 5 8
2.4.1. Định nghĩa
P 0,10 0,20 0,30 0,05 0,25 0,10
• Phương sai (Variance hoặc Dispersion) của biến ngẫu
Khi đó ta có mod X = 2.
nhiên X, ký hiệu VarX hoặc D(X), là một số thực
VD 9. Cho BNN X có bảng phân phối xác suất:
không âm được xác định bởi:
X 1 2 4 5 8
P 1 − 3 p 0,18 0,07 0,25 p
VarX = E (X − EX ) = E (X 2 ) − (EX ) .
2 2

A. mod X = 5; B. Mod X = 5; 8;
C. modX = 1; 8; D. mod X = 1; 5; 8.
VD 10. Tuổi thọ (X: tháng) của một loài côn trùng là  Nếu P(X = x i ) = pi thì:
biến ngẫu nhiên có hàm mật độ:
 3 2  2
 x (4 − x ), x ∈ [0; 4] VarX = ∑ xi 2 .pi − ∑ xi .pi  .
f (x ) =  64 . Tìm modX.  i 
 0, x ∉ [0; 4].
i


Xác suất - Thống kê Cao đẳng 10


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
 Nếu X có hàm mật độ f (x ) thì: VD 13. Cho biến ngẫu nhiên X có hàm mật độ xác suất:
+∞ +∞ 2  3
   (1 − x 2 ), x ≤ 1
VarX = ∫ x .f (x )dx −  ∫ x .f (x )dx  . f (x ) =  4
2
Tìm VarY , Y = 2X 2 .
  0,
−∞ −∞ x > 1.

VD 11. Tính Var X, biết: X 1 2 3
P 0,2 0,7 0,1
Giải. VarX = (12.0, 2 + 22.0, 7 + 32.0,1)
−(1.0, 2 + 2.0, 7 + 3.0,1)2 = 0, 29 .
 3 2
 (x + 2x ), x ∈ (0; 1)
VD 12. Tính Var X, biết: f (x ) =  4
0, x ∉ (0; 1).


 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
2.4.2. Ý nghĩa của Phương sai Chú ý
• Do X–EX là độ lệch giữa giá trị của X so với trung bình • Trong thực tế người ta dùng tỉ số tương đối:
của nó nên phương sai là trung bình của bình phương VarXi
độ lệch đó. Phương sai dùng để đo mức độ phân tán .100% (i = 1, n )
của X quanh kỳ vọng. Nghĩa là: phương sai nhỏ thì độ EXi
phân tán nhỏ nên độ tập trung lớn và ngược lại. để so sánh sự ổn định của các BNN X i .
• Trong kỹ thuật, phương sai đặc trưng cho độ sai số của Tỉ số tương đối càng nhỏ thì độ ổn định càng cao.
thiết bị. Trong kinh doanh, phương sai đặc trưng cho
độ rủi ro đầu tư. 2.4.3. Tính chất của Phương sai
• Do đơn vị đo của VarX bằng bình phương đơn vị đo 1) VarC = 0, C ∈ ℝ
của X nên để so sánh được với các đặc trưng khác 2) Var (CX ) = C 2 .VarX
người ta đưa vào khái niệm độ lệch tiêu chuẩn
3) Nếu X và Y độc lập thì:
(standard deviation) là σ = VarX . Var (X ± Y ) = VarX + VarY .

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
§3. MỘT SỐ LUẬT PHÂN PHỐI XÁC SUẤT VD 1. Trong một cửa hàng bán 10 bóng đèn có 3 bóng
THÔNG DỤNG hỏng. Một người chọn mua ngẫu nhiên 5 bóng đèn từ
cửa hàng này. Gọi X là số bóng đèn tốt người đó mua
3.1. Phân phối xác suất của biến ngẫu nhiên rời rạc
được. Lập bảng phân phối xác suất của X.
3.1.1. Phân phối Siêu bội (Hypergeometric distribution)
a) Định nghĩa Giải. N = 10, N A = 7, n = 5 ⇒ X ∈ H (10, 7, 5).
• Xét tập có N phần tử, trong đó có NA phần tử có tính
C 7kC 35−k
chất A. Từ tập đó lấy ra 1 lần n phần tử. X = {2; 3; 4; 5} và pk = , k = 2; 5 .
5
• Gọi X là số phần tử có tính chất A lẫn trong n phần tử C 10
được lấy ra thì X có phân phối siêu bội với xác suất: Vậy ta có bảng phân phối xác suất của X:
C Nk C Nn −−kN X 2 3 4 5
pk = P (X = k ) = A A
.
C Nn C 72C 33 C 73C 32 C 74C 31 C 75C 30
P 5 5 5 5
Ký hiệu: X ∈ H (N , N A , n ) hay X ∼ H (N , N A , n ). C 10 C 10 C 10 C 10

Xác suất - Thống kê Cao đẳng 11


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
4−k
b) Các số đặc trưng C 6kC 14
pk = , k = 0; 4 . Suy ra bảng phân phối:
N −n 4
C 20
EX = np; VarX = npq .
N −1 X 0 1 2 3 4
N C 60C 14
4
C 61C 14
3
C 62C 14
2
C 63C 14
1
C 64C 14
0
Trong đó p = A , q = 1 − p.
N P 4 4 4 4 4
C 20 C 20 C 20 C 20 C 20
VD 2. Một rổ mận có 20 trái trong đó có 6 trái bị hư. 4 −k
4 4 C 6kC 14 6
Chọn ngẫu nhiên từ rổ đó ra 4 trái. Gọi X là số trái mận
hư chọn phải.
2) Cách 1. EX = ∑ x k .pk = ∑ k. 4
C 20
=
5
.
k =0 k =0
1) Lập bảng phân phối xác suất của X. 2
4
204  6  336
2) Tính EX, VarX bằng cách dùng bảng phân phối và
công thức.
VarX = ∑ x k2 pk − (EX )2 = 95
−   =

5  475
.
k =0

Giải. 1) Ta có X = {0; 1; 2; 3; 4} , X ∈ H (20, 6, 4).

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
3.1.2. Phân phối Nhị thức (Binomial distribution) b) Định nghĩa phân phối Nhị thức
a) Công thức Bernoulli • Phân phối Nhị thức là phân phối của biến ngẫu nhiên
• Dãy phép thử Bernoulli là dãy có n phép thử thỏa 3 rời rạc X = {0; 1; 2; …; n} với xác suất tương ứng là:
điều kiện: pk = P(X = k ) = C nk pkq n −k .
1) Các phép thử của dãy độc lập với nhau.
Ký hiệu: X ∈ B(n, p) hay X ~ B(n, p).
2) Trong mỗi phép thử ta chỉ quan tâm đến 1 biến cố
A, nghĩa là chỉ có A và A xuất hiện. Chú ý
3) Xác suất xuất hiện A trong mọi phép thử của dãy • Khi n = 1 thì X ∈ B(1, p) ≡ B(p), khi đó X còn được
luôn là hằng số p: gọi là có phân phối không – một hay Bernoulli.
()
P(A) = p, P A = 1 − p = q, (0 < p < 1). c) Các số đặc trưng
• Cho dãy n phép thử Bernoulli, xác suất xuất hiện k lần EX = np; VarX = npq;
biến cố A là: pk = C nk pk q n −k , p = P (A). ModX = x 0 : np − q ≤ x 0 ≤ np − q + 1.

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
VD 3. Một bà mẹ sinh 2 con (mỗi lần sinh 1 con) với VD 6. Một nhà vườn trồng 26 cây lan quý, với xác suất
xác suất sinh con trai là 0,51. Gọi X là số con trai trong 2 nở hoa của mỗi cây trong 1 năm là 0,67.
lần sinh. Lập bảng phân phối xác suất của X. 1) Giá 1 cây lan quý nở hoa là 1,2 triệu đồng. Giả sử
VD 4. Một máy sản xuất lần lượt từng sản phẩm với xác nhà vườn bán hết những cây lan nở hoa thì mỗi năm
suất có 1 phế phẩm là 0,01. nhà vườn thu được chắc chắn nhất là bao nhiêu tiền?
1) Cho máy sản xuất ra 10 sản phẩm, tính xác suất có 2) Nếu muốn trung bình mỗi năm có nhiều hơn 37 cây
2 phế phẩm. lan quý nở hoa thì nhà vườn phải trồng tối thiểu mấy
2) Máy cần sản xuất ít nhất bao nhiêu sản phẩm để cây lan quý ?
xác suất có ít nhất 1 phế phẩm lớn hơn 3%. VD 7. Một nhà tuyển dụng kiểm tra kiến thức lần lượt n
4x 3 , x ∈ (0; 1) ứng viên, với xác suất được chọn của mỗi ứng viên 0,56.
VD 5. Cho X có hàm mật độ f (x ) =  . Biết xác suất để nhà tuyển dụng chọn đúng 8 ứng viên là
 0, x ∉ (0; 1)
 0,0843 thì số người phải kiểm tra là bao nhiêu?
Tính xác suất để trong 3 phép thử độc lập có 2 lần X A. 9 người; B. 10 người;
nhận giá trị trong khoảng (0, 25; 0,5). C. 12 người; D. 13 người.

Xác suất - Thống kê Cao đẳng 12


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
3.1.3. Phân phối Poisson VD 8. Trung bình cứ 3 phút có 1 khách đến quầy mua
a) Định nghĩa hàng. Tính xác suất để trong 30 giây có 2 khách đến
• Biến ngẫu nhiên X có phân phối Poisson với tham số quầy mua hàng.
λ > 0 (trung bình số lần xuất hiện biến cố A) nếu X VD 9. Quan sát tại siêu thị A trung bình 7 phút có 18
nhận các giá trị 0, 1, 2,…, n,… với xác suất tương ứng: khách đến mua hàng. Số khách hàng chắc chắn nhất sẽ
e −λ .λk đến siêu thị A mua hàng trong 1 giờ là:
pk = P(X = k ) = . A. 152; B. 153; C. 154; D. 155.
k!
• Chẳng hạn, số xe qua 1 trạm hoặc số cuộc điện thoại VD 10. Quan sát thấy trung bình 1 phút có 3 ôtô đi qua
tại 1 trạm công cộng… có phân phối Poisson. trạm thu phí. Biết xác suất có ít nhất 1 ôtô đi qua trạm
b) Các số đặc trưng thu phí trong t phút bằng 0,9. Giá trị của t là:
A. 0,9082 phút; B. 0,8591 phút;
EX = VarX = λ; ModX = x 0 , λ − 1 ≤ x 0 ≤ λ. C. 0,8514 phút; D. 0,7675 phút.

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
3.2. Phân phối xác suất của biến ngẫu nhiên liên tục b) Phân phối chuẩn đơn giản
X −µ
3.2.1. Phân phối Chuẩn (Normal distribution)
a) Định nghĩa
( )
• Cho X ∈ N µ; σ2 , đặt BNN T =
σ
thì T có
• BNN X được gọi là có phân phối chuẩn với tham số µ phân phối chuẩn đơn giản T ∈ N (0; 1) .
và σ2 (σ > 0), ký hiệu X ∈ N µ; σ2 , nếu hàm mật ( ) • Hàm mật độ xác suất của T: f (t ) =
1
e

.
t2
2
độ xác suất của X có dạng: 2π
(x −µ )2 (giá trị của f(t) được cho trong bảng phụ lục A).
1 −
f (x ) = e 2σ 2 , x ∈ ℝ.
σ 2π ( )
• Công thức tính xác suất của phân phối N 0; 1 :
Các số đặc trưng b

ModX = MedX = EX = µ; VarX = σ2 .


P(a < T < b) = ∫ f (t )dt = ϕ(b) − ϕ(a ).
a

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
x
VD 11. Thời gian (X: phút) của một khách chờ được
Trong đó, hàm ϕ ( x ) = ∫ f ( t )d t ( x ≥ 0 ) được gọi là
0 phục vụ tại một cửa hàng là BNN, X ∈ N (4, 5; 1,21).
hàm Laplace (giá trị được cho trong bảng phụ lục B).
1) Tính xác suất khách phải chờ để được phục vụ từ 3,5
Tính chất của hàm Laplace (dùng để tra bảng) phút đến 5 phút; không quá 6 phút.
1) ϕ(x ) không giảm và ϕ(−x ) = −ϕ(x ) (hàm số lẻ). 2) Tính thời gian tối thiểu t nếu xác suất khách phải chờ
2) Nếu x > 5 thì ϕ(x ) ≈ 0, 5 . vượt quá t là không quá 5%.
3) P (T < x ) = 0, 5 + ϕ(x ).
c) Xác suất của phân phối Chuẩn tổng quát VD 12. Tốc độ chuyển dữ liệu từ máy chủ của ký túc xá
đến máy tính của sinh viên vào buổi sáng chủ nhật có
(
• Cho X ∈ N µ, σ2 . ) a −µ b−µ
phân phối chuẩn với trung bình 60Kbits/s và độ lệch
Để tính P(a < X < b ) ta đặt: α = ,β= chuẩn 4Kbits/s. Xác suất để tốc độ chuyển dữ liệu lớn
σ σ hơn 63Kbits/s là:
⇒ P (a < X < b ) = P (α < T < β) = ϕ(β) − ϕ(α ). A. 0,2266; B. 0,2143; C. 0,1312; D. 0,1056.
Sau đó, tra bảng phụ lục B ta được kết quả.

Xác suất - Thống kê Cao đẳng 13


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
VD 13. Trong một kỳ thi đầu vào ở trường chuyên A quy Giải. Gọi Y (ngàn đồng) là tiền lãi có được khi bán 1
định điểm đỗ là tổng số điểm các môn thi không được bóng đèn A và t (năm) là thời gian bảo hành.
thấp hơn 15 điểm. Giả sử tổng điểm các môn thi của học Xác suất bóng đèn phải bảo hành là p = P(X ≤ t ).
sinh là biến ngẫu nhiên có phân phối chuẩn với trung Bảng phân phối xác suất của Y: Y −300 100
bình 12 điểm. Biết rằng tỉ lệ học sinh thi đỗ là 25,14%. P p 1− p
Độ lệch chuẩn là:
A. 4 điểm; B. 4,5 điểm; C. 5 điểm; D. 5,5 điểm. ⇒ EY = −300p + 100(1 − p ) = 100 − 400 p .
VD 14. Tuổi thọ (X: năm) của 1 loại bóng đèn A là biến EY = 30 ⇒ p = 0,175 ⇒ P(0 ≤ X ≤ t ) = 0,175
ngẫu nhiên, X ∈ N (4, 2; 2, 25). Khi bán 1 bóng đèn A thì ……………………………………………
……………………………………………
lãi được 100 ngàn đồng nhưng nếu bóng đèn phải bảo
hành thì lỗ 300 ngàn đồng. Vậy để có tiền lãi trung bình
khi bán mỗi bóng đèn loại này là 30 ngàn đồng thì cần VD 15. Cho BNN X có phân phối chuẩn với EX = 10 và
phải quy định thời gian bảo hành là bao nhiêu? P (10 < X < 20) = 0, 3 . Tính P (0 < X ≤ 15).

 Chương 2. Biế
Biến ngẫ
ngẫu nhiên  Chương 2. Biế
Biến ngẫ
ngẫu nhiên
3.2.2. Phân phối χ2(n) (tham khảo) 3.2.3. Phân phối Student T(n) (với n bậc tự do)
• Cho X i ∈ N (0; 1), i = 1, n và các X i độc lập thì • Cho T ∈ N (0; 1) và Y ∈ χ2 (n ) độc lập thì
n
T
X = ∑ X i2 ∈ χ 2 (n ) với hàm mật độ xác suất: X= ∈ T (n ) với hàm mật độ xác suất:
i =1
Y
 0, x ≤ 0
 n
 x n
f (x ) = 
1 − −1
 n + 1
 n  n 
.e 2 x 2 , x > 0.
Γ   −
n +1
 2 2 .Γ    2   2 2
x 
  2  f (x ) = 1 +  , x ∈ ℝ.
 n   n 
+∞ 
n π.Γ   
Trong đó: Γ (n ) = ∫ e − x x n − 1d x , Γ (n + 1) = n Γ (n ) ,  2 
0 Giá trị của t(n) được cho trong bảng C.
1
Γ   = π , Γ (1) = 1 . • Phân phối T (n ) do Willam.S.Gosset đưa ra năm 1908.
 2 

 Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá suất
xác suấ  Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá suất
xác suấ
§1. Một số loại hội tụ trong xác suất và các định lý • Họ các biến ngẫu nhiên {Xi} (i = 1, 2,…, n) được gọi là
§2. Các loại xấp xỉ phân phối xác suất tuân theo luật số lớn (dạng Tchébyshev) nếu:
 n 1 n 
………………………… 1 
∀ε > 0 : lim P  ∑ Xi − ∑ EXi < ε = 1
n →∞  n 
§1. MỘT SỐ LOẠI HỘI TỤ TRONG XÁC SUẤT  i =1 n i =1 
VÀ CÁC ĐỊNH LÝ 1 n
1.1. Hội tụ theo xác suất – Luật số lớn ⇔ ∑ (X − EXi )  
n i =1 i
P

→ 0.
a) Định nghĩa b) Bất đẳng thức Tchébyshev
• Dãy các biến ngẫu nhiên {Xi} (i = 1, 2,…, n) được gọi • Nếu biến ngẫu nhiên X có EX và VarX hữu hạn thì:
là hội tụ theo xác suất đến biến ngẫu nhiên X nếu:
(
∀ε > 0 : P X − E X ≥ ε ≤ )
V arX
(
∀ω ∈ Ω, ∀ε > 0 : lim P Xn (ω) − X (ω) ≥ ε = 0.
n →∞
) hay
ε2
P
Ký hiệu: Xn   
→ X (n → ∞). (
P X − EX < ε ≥ 1 − ) V arX
ε2
.

Xác suất - Thống kê Cao đẳng 14


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá suất
xác suấ  Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá suất
xác suấ
c) Định lý luật số lớn Tchébyshev 1.2. Định lý Liapounop (giới hạn trung tâm)
Định lý • Cho họ các BNN {Xi} (i = 1, 2,…, n) độc lập từng đôi.
n n n
• Nếu họ các BNN {Xi} (i = 1, 2,…, n) độc lập từng đôi
có EXi hữu hạn và VarXi bị chặn trên bởi hằng số C thì:
Đặt Y = ∑ Xi , µ= ∑ EX i , σ2 = ∑ VarX i .
i =1 i =1 i =1
1 n 1 n  3
  E X i − EX i
∀ε > 0 : lim P  ∑ Xi − ∑ EXi ≥ ε = 0 .
n
n →∞  n
 i =1 n i =1 

Nếu EXi, VarXi hữu hạn và lim
n →∞
∑ σ3
=0
i =1

Hệ quả
(
thì Y ∈ N µ, σ 2 . )
• Nếu họ các BNN {Xi} (i = 1, 2,…, n) độc lập từng đôi Ý nghĩa của định lý
có EXi = µ và VarXi = σ2 thì: • Sử dụng định lý giới hạn trung tâm Liapounop để tính
1 n xấp xỉ (gần đúng) xác suất.
∑X 
n i =1 i
P

→ µ. • Xác định các phân phối xấp xỉ để giải quyết các vấn đề
của lý thuyết ước lượng, kiểm định,…

 Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá suất
xác suấ  Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá suất
xác suấ
§2. CÁC LOẠI XẤP XỈ PHÂN PHỐI XÁC SUẤT VD 1. Một vườn lan có 10.000 cây sắp nở hoa, trong đó
2.1. Liên hệ giữa phân phối Siêu bội và Nhị thức có 1.000 cây hoa màu đỏ.
N 1) Tính xác suất để khi chọn ngẫu nhiên 20 cây lan thì
• Nếu n cố định, N tăng vô hạn và A → p (0 ≠ p ≠ 1) được 5 cây có hoa màu đỏ.
N
2) Tính xác suất để khi chọn ngẫu nhiên 50 cây lan thì
C Nk C Nn −−kN
thì A A d
 → C nk pkq n −k . được 10 cây có hoa màu đỏ.
C Nn 3) Có thể tính xác suất để khi chọn ngẫu nhiên 200 cây
Ứng dụng xấp xỉ phân phối Siêu bội bằng Nhị thức lan thì có 50 cây hoa màu đỏ được không ?

• Cho X ∈ H (N ; N A ; n ), nếu N khá lớn và n rất nhỏ so 2.2. Liên hệ giữa phân phối Nhị thức và Poisson
với N (n < 0,05N) thì: • Nếu n → +∞, p → 0, np → λ thì:
NA e −λ .λk
X ∼ B(n; p), p = . C nk pkq n −k  →
d
.
N k!

 Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá suất
xác suấ  Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá
xác suấ
suất
Ứng dụng xấp xỉ phân phối Nhị thức bằng Poisson Tóm tắt các loại xấp xỉ rời rạc
• Cho X có phân phối nhị thức B(n, p), λ = np . Khi đó: NA
1) Nếu n lớn và p khá bé (gần bằng 0) thì X ∼ P(λ). p=
2) Nếu n lớn và p cũng khá lớn ( p ≈ 1) thì X ∼ P(λ). N
X ∈ H (N , N A, n ) X ∈ B(n, p)
VD 2. Một lô hàng thịt đông lạnh đóng gói nhập khẩu có
(n < 5%N ) p ≈ 0
chứa 0,6% bị nhiểm khuẩn. Tìm xác suất để khi chọn 
NA p ≈ 1
ngẫu nhiên 1.000 gói thịt từ lô hàng này có: λ = n. 
1) Không quá 2 gói bị nhiểm khuẩn. N λ = np
2) Đúng 40 gói bị nhiểm khuẩn. Sai số rất lớn X ∈ P (λ)

VD 3. Giải câu 3) trong VD 1.

Xác suất - Thống kê Cao đẳng 15


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá suất
xác suấ  Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá
xác suấ
suất
2.3. Định lý giới hạn Moivre – Laplace
Ứng dụng xấp xỉ Nhị thức bằng phân phối Chuẩn
Định lý 1 (giới hạn địa phương)
• Gọi pk là xác suất xuất hiện k lần biến cố A trong n • Cho X ∈ B(n, p ), nếu n khá lớn, p không quá gần 0
phép thử Bernoulli với P(A) = p (p không quá gần 0 và và không quá gần 1 thì X ∼ N (µ; σ2 ).
npq .Pn (k )
không quá gần 1) thì lim = 1. Trong đó: µ = np, σ2 = npq .
n→∞ f (x k )
Khi đó, ta có:
x2
1 − k − np 1  k − µ 
Trong đó, f (x ) = e 2 , xk = hữu hạn. 1) P(X = k ) = .f  
2π npq σ  σ 
Định lý 2 (giới hạn Moivre – Laplace) (tra bảng A để có giá trị hàm f (x ), f (−x ) = f (x )).
X − np
• Cho X ∈ B (n , p ) và S n = k − µ   
 − ϕ k1 − µ  .
thì:
npq 2) P(k1 ≤ X ≤ k2 ) = ϕ  2  
 
F
S n  → N (0, 1) .
 σ   σ 

 Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá
xác suấ
suất  Chương 3. Đị
Định lý giớ
giới hạ
hạn trong xá
xác suấ
suất

VD 4. Trong một đợt thi tuyển công chức ở thành phố A Tóm tắt xấp xỉ Chuẩn cho Nhị thức
có 1000 người dự thi với tỉ lệ thi đạt là 80%.
Tính xác suất để: (0 ≈/ p ≈/ 1)
1) có 172 người không đạt; X ∈ B(n, p) X ∈ N (µ, σ 2 )
2) có khoảng 170 đến 180 người không đạt.
EX = np µ = np
EX = µ
VarX = npq σ 2 = npq
VD 5. Một khách sạn nhận đặt chỗ của 325 khách hàng VarX = σ 2
cho 300 phòng vào ngày 1/1 vì theo kinh nghiệm của 1k − µ 
những năm trước cho thấy có 10% khách đặt chỗ nhưng ⇒ P (X = k ) = f  ,
không đến. Biết mỗi khách đặt 1 phòng, tính xác suất: σ σ 
b − µ   
1) Có 300 khách đến vào ngày 1/1 và nhận phòng.
P (a < X < b ) = ϕ   − ϕ a − µ  .
2) Tất cả khách đến vào ngày 1/1 đều nhận được phòng.  σ   
 σ  
…………………………………….

 Chương 4. Lý thuyế
thuyết mẫ
mẫu
PHẦN II. LÝ THUYẾT THỐNG KÊ
(Statistical theory) • Từ tổng thể ta chọn ra n phần tử thì n phần tử đó được
Chương 4. LÝ THUYẾT MẪU gọi là một mẫu có kích thước (cỡ mẫu) n.
§1. Khái niệm về phương pháp xác định mẫu • Mẫu được chọn ngẫu nhiên một cách khách quan được
§2. Các đặc trưng của mẫu gọi là mẫu ngẫu nhiên.
§3. Phân phối xác suất của các đặc trưng mẫu
§4. Thực hành tính các đặc trưng mẫu cụ thể • Khi mẫu có kích thước lớn thì ta không phân biệt mẫu
………………………… có hoàn lại hay không hoàn lại.
§1. KHÁI NIỆM VỀ VD 1. Khi nghiên cứu về số cá trong một hồ thì số cá
PHƯƠNG PHÁP XÁC ĐỊNH MẪU trong hồ là kích thước của tổng thể. Từ hồ đó bắt lên 10
1.1. Mẫu và tổng thể con cá thì được 1 mẫu không hoàn lại kích thước là 10.
• Tập hợp có các phần tử là các đối tượng mà ta nghiên Nếu từ hồ đó bắt lên 1 con cá rồi thả xuống, sau đó tiếp
cứu được gọi là tổng thể. Số phần tử của tổng thể được tục bắt con khác, tiến hành 10 lần như thế ta được mẫu
gọi là kích thước của tổng thể. có hoàn lại kích thước 10.

Xác suất - Thống kê Cao đẳng 16


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 4. Lý thuyế
thuyết mẫ
mẫu  Chương 4. Lý thuyế
thuyết mẫ
mẫu
1.2. Phương pháp xác định mẫu • Mẫu có kích thước n là tập hợp của n biến ngẫu nhiên
độc lập X1, X2,…, Xn được lập từ biến ngẫu nhiên X và
• Mẫu định tính là mẫu mà ta chỉ quan tâm đến các phần
có cùng luật phân phối với X được gọi là mẫu tổng quát.
tử của nó có tính chất A nào đó hay không.
VD 2. Điều tra 100 hộ dân của một thành phố về thu • Tiến hành quan sát (cân, đo,…) từng biến Xi và nhận
nhập trong 1 năm. Nếu hộ có thu nhập dưới 10 triệu được các giá trị cụ thể Xi = xi, khi đó ta được mẫu cụ thể
đồng/năm là hộ nghèo thì trong 100 hộ được điều tra ta x1, x2,…, xn.
quan tâm đến hộ nghèo (tính chất A). Mẫu điều tra này là VD 4. Chiều cao của cây bạch đàn là biến ngẫu nhiên có
mẫu định tính. phân phối chuẩn. Đo ngẫu nhiên 5 cây X1, X2,…, X5 ta
được X1=3,5m; X2=3,2m; X3=2,5m; X4=4,1m; X5=3m.
• Mẫu định lượng là mẫu mà ta quan tâm đến các yếu tố
Khi đó, {X1, X2,…, X5} là mẫu tổng quát có phân phối
về lượng (như chiều dài, cân nặng,…) của các phần tử chuẩn và {3,5m; 3,2m; 2,5m; 4,1m; 3m} là mẫu cụ thể.
có trong mẫu.
Nhận xét
VD 3. Cân 100 trái dưa gang được chọn ngẫu nhiên từ 1 • Xác suất nghiên cứu về tổng thể để hiểu về mẫu còn
cánh đồng ta được một mẫu định lượng. thống kê thì ngược lại.

 Chương 4. Lý thuyế
thuyết mẫ
mẫu  Chương 4. Lý thuyế
thuyết mẫ
mẫu
 Xét về lượng 1.3. Sắp xếp số liệu thực nghiệm
• Trung bình tổng thể là µ = EX . 1.3.1. Sắp xếp theo các giá trị khác nhau
• Giả sử mẫu (X1, X2,…, Xn) có k quan sát khác nhau là
• Phương sai tổng thể σ2 = VarX là biểu thị cho mức độ X1, X2,…, Xk (k ≤ n ) và Xi có tần số ni (số lần lặp lại)
biến động của biến X. với n 1 + n 2 + ... + n k = n . Khi đó, số liệu được sắp
 Xét về chất xếp theo thứ tự tăng dần của Xi.
• Tổng thể được chia thành 2 loại phần tử: loại có tính VD 5. Kiểm tra ngẫu nhiên 50 sinh viên, ta có kết quả:
chất A nào đó mà ta quan tâm và loại không có tính X (điểm) 2 4 5 6 7 8 9 10
chất A. n (số SV) 4 6 20 10 5 2 2 1
• Gọi X = 0 nếu phần tử không có tính chất A và X = 1 1.3.2. Sắp xếp dưới dạng khoảng
nếu phần tử có tính chất A, p là tỉ lệ các phần tử có tính • Giả sử mẫu (X1, X2,…, Xn) có nhiều quan sát khác
chất A thì: nhau, khoảng cách giữa các quan sát không đồng đều
Soá phaàn töû coù tính chaát A hoặc các Xi khác nhau rất ít thì ta sắp xếp chúng dưới
X ∈ B(p ), p = .
Soá phaàn töû cuûa toång theå dạng khoảng.

 Chương 4. Lý thuyế
thuyết mẫ
mẫu  Chương 4. Lý thuyế
thuyết mẫ
mẫu
• Xét khoảng (x m in , x m ax ) chứa toàn bộ quan sát Xi. X (cm) 150 154 158 162 166
Ta chia (x m in , x m ax ) thành các khoảng bằng nhau (còn n 5 20 35 25 15
gọi là lớp ) theo nguyên tắc: Chú ý
số khoảng tối ưu là 1 + 3, 322 lg n và độ dài khoảng là • Đối với trường hợp số liệu được cho bởi cách liệt kê
x − x min thì ta sắp xếp lại ở dạng bảng.
h = max .
1 + 3, 322 lg n VD 7. Theo dõi mức nguyên liệu hao phí để sản xuất ra
VD 6. Đo chiều cao (X: cm) của n = 100 thanh niên, ta một đơn vị sản phẩm ở một nhà máy, ta thu được các số
có bảng số liệu ở dạng khoảng: liệu sau (đơn vị: gam):
X (cm) 148-152 152-156 156-160 160-164 164-168 20; 22; 21; 20; 22; 22; 20; 19; 20; 22; 21;
n 5 20 35 25 15
19; 19; 20; 18; 19; 20; 20; 18; 19; 20; 20;
ai −1 + ai
Khi cần tính toán, ta sử dụng công thức x i = 21; 20; 18; 19; 19; 21; 22; 21; 21; 20; 19.
2
Hãy sắp xếp số liệu trên dưới dạng bảng ?
để đưa số liệu trên về dạng bảng:

Xác suất - Thống kê Cao đẳng 17


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 4. Lý thuyế
thuyết mẫ
mẫu  Chương 4. Lý thuyế
thuyết mẫ
mẫu
§2. CÁC ĐẶC TRƯNG MẪU (tham khảo) Tính chất
2.1. Các đặc trưng mẫu 1) Kỳ vọng của tỉ lệ mẫu bằng tỉ lệ tổng thể:
 X + ... + X 
Giả sử tổng thể có trung bình EX = µ , phương sai n 
M (Fn ) = M  1  = p .
VarX = σ2 và tỉ lệ các phần tử có tính chất A là p.
 n 
2.1.1. Tỉ lệ mẫu Fn 2) Phương sai của tỉ lệ mẫu:
 X + ... + X 
n  pq
• Cho mẫu định tính kích thước n, ta gọi: V arFn = Var  1  =
1 n 0  n  n
Fn = ∑ Xi , Xi =  là tỉ lệ mẫu tổng quát. (các Xi có phân phối Bernoulli).
n i =1 1
 2.1.2. Trung bình mẫu
• Cho mẫu định tính kích thước n, trong đó có m phần tử 1 n
có tính chất A. Khi đó ta gọi: • Trung bình mẫu: X = X n =
n
∑ Xi .
m i =1
f = fn = là tỉ lệ mẫu cụ thể. 1 n
n • Trung bình mẫu cụ thể: x = x n =
n
∑ xi .
i =1

 Chương 4. Lý thuyế
thuyết mẫ
mẫu  Chương 4. Lý thuyế
thuyết mẫ
mẫu
Tính chất 2.1.3. Phương sai mẫu
n
∑ (X i − X n )
2
σ2 VarX ɵ 2 = Sɵ 2 = 1
( )
E X n = µ = EX , Var X n = ( ) n
=
n
. • Phương sai mẫu: S n
n i =1
.

Chú ý 1 n
( xi − xn ) .
2

X1 + ... + Xn
Mẫu cụ thể: sˆ2 = sˆn2 = ∑
n i =1
• Tỉ lệ mẫu Fn = và trung bình mẫu
n • Phương sai mẫu hiệu chỉnh:
X1 + ... + Xn n
( ).
1 2
Xn = khác nhau ở chỗ là trong Fn, các S 2 = S n2 = ∑
n − 1 i =1 i
X − Xn
n
biến Xn chỉ có phân phối Bernoulli B(p) : n
1
(x − x n ) .
2

0, neáu phaàn töû khoâng coù tính chaát A


Mẫu cụ thể: s 2 = s n2 = ∑
n − 1 i =1 i
Xi =  . ɵ2  n − 1 2
1, neáu phaàn töû coù tính chaát A
 Tính chất. E S  =
  n
σ , E S 2 = σ2 . ( )

 Chương 4. Lý thuyế
thuyết mẫ
mẫu  Chương 4. Lý thuyế
thuyết mẫ
mẫu
• Trong tính toán ta sử dụng công thức: §3. PHÂN PHỐI XÁC SUẤT CỦA
n  2 2 n
( ) 1 CÁC ĐẶC TRƯNG MẪU (tham khảo)
2
sn2 =
n − 1 
x n − xn  , x n =
 n
∑ xi2 . 3.1. Phân phối xác suất của tỉ lệ mẫu F
 i =1
• X ∈ B ( p ) và n khá lớn (n ≥ 100) thì:
2.2. Liên hệ giữa đặc trưng của mẫu và tổng thể m  pq  f −p
f = ∈ N  p , ⇒T = n ∈ N (0, 1) .
• Các đặc trưng mẫu Fn , X n , Sn2 là các thống kê dùng n 
 n  f (1 − f )
để nghiên cứu các đặc trưng p, µ, σ2 tương ứng của • X 1 ∈ B ( p 1 ), X 2 ∈ B ( p 2 ) và n 1 , n 2 khá lớn thì:
tổng thể. Từ luật số lớn ta có: f1 − f2 − ( p 1 − p 2 )
T = ∈ N (0, 1) .
Fn → p, X n → µ, Sn2 → σ2 (theo xác suất). 1
 1 
p 0 (1 − p 0 )  + 
• Trong thực hành, khi cỡ mẫu n khá lớn thì các đặc  n 1 n 2 
trưng mẫu xấp xỉ các đặc trưng tương ứng của tổng thể: m m m + m2
Trong đó: f1 = 1 , f2 = 2 , p 0 = 1 .
x ≈ µ, f ≈ p, sˆ2 ≈ σ2 , s 2 ≈ σ2 . n1 n2 n1 + n 2

Xác suất - Thống kê Cao đẳng 18


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 4. Lý thuyế
thuyết mẫ
mẫu  Chương 4. Lý thuyế
thuyết mẫ
mẫu
3.2. Phân phối xác suất của trung bình mẫu 3.2.2. Trường hợp X không có phân phối chuẩn
3.2.1. Trường hợp tổng thể X có phân phối chuẩn • Từ định lý giới hạn trung tâm, ta suy ra:
σ2 X −µ X −µ
• Do E X = µ, Var X = nên: → T ∈ N (0, 1), → T ∈ N (0, 1).
n σ S
 σ 2  X −µ
X ∈ N µ,  hay n ∈ N (0, 1). n n
 n  σ • Với n ≥ 30 , ta có các phân phối xấp xỉ chuẩn như sau:
1) Nếu σ 2 đã biết thì:
• Với mẫu cụ thể kích thước n đủ lớn, thì σ2 ≈ S 2 và:
X −µ  σ 2 
 S 2  X −µ n ∼ N (0, 1), X ∼ N µ
X ∈ N µ,
, .
 hay n ∈ N (0, 1). σ 
 n 
 n  S
2) Nếu σ 2 chưa biết thì:
X −µ 
• Khi n < 30 và σ 2 chưa biết thì n ∈ T (n − 1) X −µ S 2 
S n ∼ N (0, 1), X ∼ N µ
 , n .
có phân phối Student với n − 1 bậc tự do. S  

 Chương 4. Lý thuyế
thuyết mẫ
mẫu  Chương 4. Lý thuyế
thuyết mẫ
mẫu
3.3. Phân phối xác suất của phương sai mẫu 4.2. Tính trung bình mẫu x
( )
• Giả sử tổng thể X ∈ N µ, σ2 , khi đó: • Nếu mẫu có n giá trị xi thì trung bình mẫu là:
x + x 2 + ... + xn 1 n
n ɵ2 n − 1 2 = ∑ xi .
n
∑ (X i − X n )
2
S = S =
1 x= 1
2 2 n n i =1
σ σ σ2 i =1
2 • Nếu xi lặp lại ni (i = 1,…, k ≤ n ) lần thì trung bình
sẽ có phân phối χ (n − 1).
1 k
mẫu là: x = ∑ x i ni .
§4. THỰC HÀNH TÍNH n i =1
CÁC ĐẶC TRƯNG CỦA MẪU CỤ THỂ
4.1. Tính tỉ lệ mẫu f VD. Xét 10 kết quả quan sát:
• Nếu trong mẫu có m phần tử có tính chất A mà ta quan 102; 102; 202; 202; 202; 302; 302; 302; 302; 402.
m 1
tâm thì tỉ lệ mẫu là f = . Ta có: x = (102.2 + 202.3 + 302.4 + 402.1).
n 10

 Chương 4. Lý thuyế
thuyết mẫ
mẫu  Tính đặ
đặc trưng mẫ
mẫu bằ
bằng má
máy tí bỏ túi
tính bỏ
2
4.3. Tính phương sai mẫu ɵ s SỬ DỤNG MÁY TÍNH BỎ TÚI ĐỂ TÍNH
n CÁC ĐẶC TRƯNG CỦA MẪU
1 1
• Tính x = (x1 + x 2 + ... + xn ) =
n n
∑ xi .
i =1 1. Số liệu đơn (không có tần số)
n VD 1. Cho mẫu có cỡ mẫu là 5:
1
( 1
)
2
và x = x12 + x 22 + ... + xn2 =
n n
∑ xi2 . w = (12; 13; 11; 14; 11).
i =1
• Phương sai mẫu là: a) Máy fx 500 – 570 MS

()
ɵ 2 2 2 • Xóa bộ nhớ: SHIFT → MODE → 3 → = → =
s =x − x . • Vào chế độ thống kê nhập dữ liệu:
• Phương sai mẫu có hiệu chỉnh là: – MODE → 2 (chọn SD đối với fx500MS);
n ɵ2 MODE → MODE → 1 (chọn SD đối với fx570MS).
s2 = s . – Nhập các số:
n −1
12 M+ 13 M+…. 11 M+

Xác suất - Thống kê Cao đẳng 19


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Tính đặ
đặc trưng mẫ
mẫu bằ
bằng má
máy tí bỏ túi
tính bỏ  Tính đặ
đặc trưng mẫ
mẫu bằ
bằng má
máy tí bỏ túi
tính bỏ
• Xuất kết quả: • Xuất kết quả:
– SHIFT → 2 → 1 → = – SHIFT → 1 → 5 (var) → 1 → = (n: cỡ mẫu)
(xuất kết quả x : trung bình mẫu). – SHIFT → 1 → 5 (var) → 2 → = (x :trung bình mẫu)
– SHIFT → 2 → 2 → = – SHIFT → 1 → 5 (var) → 3 → = (x σn : độ lệch
(xuất kết quả ŝ = x σn : độ lệch chuẩn của mẫu). chuẩn của mẫu).
– SHIFT → 2 → 3 → = (xuất kết quả s = x σn − 1 : – SHIFT → 1 → 5 (var) → 4 → = (x σn − 1 : độ lệch
độ lệch chuẩn của mẫu có hiệu chỉnh). chuẩn của mẫu có hiệu chỉnh).
b) Máy fx 500 – 570 ES 2. Số liệu có tần số
• Xóa bộ nhớ: SHIFT → 9 → 3 → = → = VD 2. Cho mẫu như sau:
• Vào chế độ thống kê nhập dữ liệu: xi 12 11 15
– SHIFT → MODE → dịch chuyển mũi tên tìm chọn ni 3 2 4
mục Stat → 2 (chế độ không tần số). a) Máy fx 500 – 570 MS
– MODE → 3 (stat) → 1 (1-var) → (nhập các số): • Xóa bộ nhớ: SHIFT → MODE → 3 → = → =
12 = 13 =…. 11 = → AC

 Tính đặ
đặc trưng mẫ
mẫu bằ
bằng má
máy tí bỏ túi
tính bỏ  Tính đặ
đặc trưng mẫ
mẫu bằ
bằng má
máy tí bỏ túi
tính bỏ
• Vào chế độ thống kê nhập dữ liệu: – Nhập các giá trị và tần số vào 2 cột trên màn hình:
– MODE → 2 (chọn SD đối với fx500MS); X FREQ
MODE → MODE → 1 (chọn SD đối với fx570MS). 12 3
– Nhập các số: 11 2
12 → SHIFT → , → 3 → M+ 15 4
11 → SHIFT → , → 2 → M+ → AC
15 → SHIFT → , → 4 → M+ • Xuất kết quả, làm như 1b).
• Xuất kết quả, làm như 1a).
VD 3. Điều tra năng suất của 100 ha lúa trong vùng, ta
b) Máy fx 500 – 570 ES có bảng số liệu sau:
• Xóa nhớ vào chế độ thống kê nhập dữ liệu có tần số: Năng suất 3 - 3,5 4 - 4,5 5 - 5,5 6 - 6,5
– SHIFT → MODE (SETUP) dịch chuyển mũi tên (tấn/ha) 3,5 - 4 4,5 - 5 5,5 - 6 6,5 - 7
→4→1
Diện tích(ha) 7 12 18 27 20 8 5 3
– MODE → 3 (stat) → 1 (1-var)

 Tính đặ
đặc trưng mẫ
mẫu bằ
bằng má
máy tí bỏ túi
tính bỏ  Chương 5. Ướ
Ước lượ
lượng khoả
khoảng
Những thửa ruộng có năng suất ít hơn 4,4 tấn/ha là có §1. Ước lượng điểm
năng suất thấp. Dùng máy tính bỏ túi để tính: §2. Ước lượng khoảng
………………………..
1) Tỉ lệ diện tích lúa có năng suất thấp.
§1. ƯỚC LƯỢNG ĐIỂM (tham khảo)
2) Năng suất lúa trung bình, phương sai mẫu chưa 1.1. Thống kê
hiệu chỉnh và độ lệch chuẩn của mẫu có hiệu chỉnh. • Một hàm của mẫu tổng quát T = T(X1, X2,…, Xn) được
Giải. Bảng số liệu được viết lại: gọi là 1 thống kê.
Năng • Các vấn đề của thống kê toán được giải quyết chủ yếu
suất 3,25 3,75 4,25 4,75 5,25 5,75 6,25 6,75 nhờ vào việc xây dựng các hàm thống kê chỉ phụ thuộc
(tấn/ha) vào mẫu tổng quát, không phụ thuộc các tham số.
Diện
tích(ha)
7 12 18 27 20 8 5 3 1.2. Ước lượng điểm
m 7 + 12 + 18 • Ước lượng điểm của tham số θ (tỉ lệ, trung bình,
1) f = = = 37% . phương sai,…) là thống kê ɵ θ =ɵθ (X1,..., Xn ) chỉ phụ
n 100
2) x = 4, 75; sˆ2 = 0, 685; s = 0, 8318 . thuộc vào n quan sát X1, …, Xn, không phụ thuộc vào θ .

Xác suất - Thống kê Cao đẳng 20


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 5. Ướ
Ước lượ
lượng khoả
khoảng  Chương 5. Ướ
Ước lượ
lượng khoả
khoảng
VD 1. • EF = p (tỉ lệ mẫu là ước lượng không chệch của tỉ lệ
X 1 + X 2 + ... + X n tổng thể).
• Trung bình mẫu X = là ước
n
lượng điểm của trung bình tổng thể µ . ( )
• E S 2 = σ2 (phương sai mẫu là ước lượng không
X + X 2 + ... + X n
• Tỉ lệ mẫu F = 1 là ước lượng điểm chệch của phương sai tổng thể σ2 ).
n
của tỉ lệ tổng thể p. VD 3. Người ta cân 100 sản phẩm của 1 xí nghiệp A và
1.3. Ước lượng không chệch có bảng số liệu:
• Thống kê ɵθ (X1,..., Xn ) là ước lượng không chệch của
X (gr) 498 502 506 510
n 40 20 20 20
θ nếu E θ (X1,..., Xn ) = θ .
ɵ Khi đó:
  498.40+502.20+506.20+510.20
VD 2. x = = 502, 8(gr ).
( )
100
• E X = µ (trung bình mẫu là ước lượng không chệch Dự đoán (ước lượng): Trọng lượng trung bình của các
của trung bình tổng thể µ ). sản phẩm trong xí nghiệp là µ ≈ 502, 8(gr ) .

 Chương 5. Ướ
Ước lượ
lượng khoả
khoảng  Chương 5. Ướ
Ước lượ
lượng khoả
khoảng
§2. ƯỚC LƯỢNG KHOẢNG 2.2. Ước lượng khoảng cho trung bình tổng thể µ
2.1. Định nghĩa • Giả sử tổng thể có trung bình µ chưa biết. Với độ tin
• Khoảng ɵ(θ; ɵ
1 2 )
θ của thống kê ɵ
θ được gọi là khoảng tin cậy 1 − α cho trước, khoảng tin cậy cho µ là (µ1 ; µ 2 )

cậy của tham số θ nếu với xác suất 1 − α cho trước thì thỏa: P (µ1 < µ < µ 2 ) = 1 − α .
P ɵ (
θ < θ <ɵ )
θ = 1 − α.
1 2 a) Trường hợp 1. Kích thước mẫu n ≥ 30 và
• Xác suất 1 − α là độ tin cậy của ước lượng, phương sai tổng thể σ2 đã biết.
• Tính x (trung bình mẫu).
2ε = ɵθ2 − ɵ
θ1 là độ dài của khoảng ước lượng và
1−α
( )
tra baûng B
ε là độ chính xác của ước lượng. Khi đó: θ ∈ ɵθ1 ; ɵ
θ2 . Từ 1 − α ⇒ = ϕ(tα )     → tα .
2
σ
• Bài toán tìm khoảng tin cậy của θ là bài toán
ước lượng khoảng.
( )
• Suy ra µ ∈ x − ε; x + ε với ε = tα
n
.

 Chương 5. Ướ
Ước lượ
lượng khoả
khoảng  Chương 5. Ướ
Ước lượ
lượng khoả
khoảng
VD 1. Điểm trung bình môn XSTK của sinh viên trường Chú ý. Mối liên hệ giữa độ lệch chuẩn mẫu đã hiệu
Đại học A là biến ngẫu nhiên có độ lệch chuẩn 0,26 chỉnh s và chưa hiệu chỉnh sˆ là:
điểm. Khảo sát ngẫu nhiên 100 sinh viên trường này n 2 n 2
thấy điểm trung bình môn XSTK là 5,12 điểm. Hãy ước s2 = sˆ ⇒ s = sˆ .
lượng khoảng điểm trung bình môn XSTK của sinh viên n −1 n −1
trường A với độ tin cậy 98%? VD 2. Đo đường kính của 100 trục máy do 1 nhà máy
b) Trường hợp 2. Kích thước mẫu n ≥ 30 và sản xuất thì được bảng số liệu:
Đường kính (cm) 9,75 9,80 9,85 9,90
phương sai tổng thể σ2 chưa biết.
• Tính x và s (độ lệch chuẩn mẫu đã hiệu chỉnh). Số trục máy 5 37 42 16
1−α 1) Hãy ước lượng khoảng trung bình đường kính của
tra baûng B
• Từ 1 − α ⇒ = ϕ(tα )     → tα trục máy với độ tin cậy 97%?
2 2) Dựa vào mẫu trên để ước lượng khoảng trung bình
s
⇒ µ ∈ (x − ε; x + ε) với ε = tα . đường kính của trục máy có độ chính xác 0,006cm thì
n đảm bảo độ tin cậy là bao nhiêu?

Xác suất - Thống kê Cao đẳng 21


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 5. Ướ
Ước lượ
lượng khoả
khoảng  Chương 5. Ướ
Ước lượ
lượng khoả
khoảng
3) Dựa vào mẫu trên, nếu ước lượng khoảng trung bình VD 3. Giả sử chiều dài của 1 loại sản phẩm là biến ngẫu
đường kính của trục máy có độ chính xác lớn hơn nhiên có phân phối chuẩn. Đo ngẫu nhiên 10 sản phẩm
0,003cm với độ tin cậy 95% thì cần phải đo tối đa bao này thì được chiều dài trung bình 10,02m và độ lệch
nhiêu trục máy?
chuẩn của mẫu chưa hiệu chỉnh là 0,04m.
c) Trường hợp 3. Kích thước mẫu n < 30 , σ2 đã biết và Tìm khoảng ước lượng trung bình chiều dài của loại sản
X có phân phối chuẩn thì ta làm như trường hợp 1. phẩm này với độ tin cậy 95%?
d) Trường hợp 4. Kích thước mẫu n < 30 , σ2 chưa biết
và X có phân phối chuẩn. VD 4. Năng suất lúa trong vùng A là biến ngẫu nhiên.
• Tính x , s . Gặt ngẫu nhiên 115 ha lúa của vùng này ta có số liệu:
Năng suất (tạ/ha) 40 – 42 42 – 44 44 – 46
• Từ 1 − α ⇒ α    → tαn −1
tra baûng C
Diện tích (ha) 7 13 25
(nhớ giảm bậc thành n − 1 rồi mới tra bảng!)
Năng suất (tạ/ha) 46 – 48 48 – 50 50 – 52
( )
⇒ µ ∈ x − ε; x + ε với ε = tαn −1.
s
n
. Diện tích (ha) 35 30 5

 Chương 5. Ướ
Ước lượ
lượng khoả
khoảng  Chương 5. Ướ
Ước lượ
lượng khoả
khoảng
1) Hãy tìm khoảng ước lượng trung bình cho năng suất 0–1 1–2 2–3 3–4
Nhu cầu (kg/tháng)
lúa ở vùng A với độ tin cậy 95%? (0,5) (1,5) (2,5) (3,5)
2) Những thửa ruộng có năng suất lúa không vượt quá Số gia đình 10 35 86 132
44 tạ/ha ở vùng A là năng suất thấp (giả sử có phân
4–5 5–6 6–7 7–8
phối chuẩn). Hãy ước lượng khoảng trung bình cho Nhu cầu (kg/tháng)
(4,5) (5,5) (6,5) (7,5)
năng suất lúa của những thửa ruộng có năng suất thấp
Số gia đình 78 31 18 10
với độ tin cậy 99%?
1) Hãy ước lượng khoảng cho trung bình nhu cầu về loại
Giải. 1) Số liệu được viết lại dưới dạng bảng:
hàng X của toàn bộ gia đình ở phường A trong 1 năm
Năng suất (tạ/ha) 41 43 45 47 49 51 với độ tin cậy 95%?
Diện tích (ha) 7 13 25 35 30 5 2) Với mẫu khảo sát trên, nếu muốn có ước lượng
khoảng trung bình nhu cầu về loại hàng X của phường
VD 5. Để nghiên cứu nhu cầu về loại hàng X ở phường A với độ chính xác nhỏ hơn 4,8 tấn/năm và độ tin cậy
A người ta tiến hành khảo sát 400 trong toàn bộ 4000 99% thì cần khảo sát tối thiểu bao nhiêu gia đình
gia đình. Kết quả khảo sát là: trong phường A?

 Chương 5. Ướ
Ước lượ
lượng khoả
khoảng  Chương 5. Ướ
Ước lượ
lượng khoả
khoảng
VD 6. Tiến hành khảo sát 500 trong tổng số 600.000 gia 2.3. Ước lượng khoảng cho tỉ lệ tổng thể p
đình ở một thành phố thì thấy có 400 gia đình dùng loại • Giả sử tỉ lệ p các phần tử có tính chất A của tổng thể
sản phẩm X do công ty A sản xuất với bảng số liệu: chưa biết. Với độ tin cậy 1 − α cho trước, khoảng tin
Số lượng (kg/tháng) 0,75 1,25 1,75 2,25 2,75 3,25 cậy cho p là (p1 ; p2 ) thỏa: P ( p1 < p < p2 ) = 1 − α .
Số gia đình 40 70 110 90 60 30
m
Hãy ước lượng khoảng cho trung bình tổng khối lượng • Nếu biết tỉ lệ mẫu f = fn = với n là cỡ mẫu, m là
n
sản phẩm X do công ty A sản xuất được tiêu thụ ở thành số phần tử ta quan tâm thì khoảng tin cậy cho p là:
phố này trong một tháng với độ tin cậy 95%?
A. (877,68 tấn; 982,32 tấn). f (1 − f )
B. (1121,58 tấn; 1203,42 tấn). ( f − ε; f + ε), ε = tα
n
.
C. (898,24 tấn; 993,21 tấn). 1−α
D. (1125,9 tấn; 1199,1 tấn). Trong đó tα tìm được từ ϕ(tα ) = (tra bảng B).
2

Xác suất - Thống kê Cao đẳng 22


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 5. Ướ
Ước lượ
lượng khoả
khoảng  Chương 5. Ướ
Ước lượ
lượng khoả
khoảng
VD 7. Một trường Đại học có 50.000 sinh viên. Điểm 2) Dựa vào mẫu trên, nếu muốn có độ chính xác của ước
danh ngẫu nhiên 7000 sinh viên thấy có 765 sinh viên lượng tỉ lệ phế phẩm nhỏ hơn 0,01 với độ tin cậy 93%
nghỉ học. Hãy ước lượng khoảng cho tỉ lệ sinh viên nghỉ thì cần kiểm tra thêm ít nhất bao nhiêu sản phẩm nữa?
học của trường với độ tin cậy 95%? Số sinh viên nghỉ
học của trường trong khoảng nào? VD 10. Khảo sát năng suất (X: tấn/ha) của 100 ha lúa ở
VD 8. Để ước lượng số cá có trong một hồ người ta bắt huyện A, ta có bảng số liệu:
lên 3000 con, đánh dấu rồi thả lại xuống hồ. Sau một X 3,25 3,75 4,25 4,75 5,25 5,75 6,25 6,75
thời gian, lại bắt lên 400 con cá thấy 60 con có đánh dấu. S (ha) 7 12 18 27 20 8 5 3
Với độ tin cậy 97%, hãy ước lượng khoảng cho tỉ lệ cá
có đánh dấu và số cá có trong hồ? Những thửa ruộng có năng suất lúa trên 5,5 tấn/ha là
VD 9. Lấy ngẫu nhiên 200 sản phẩm trong kho hàng A những thửa ruộng có năng suất cao. Sử dụng bảng khảo
thấy có 21 phế phẩm. sát trên, để ước lượng tỉ lệ diện tích lúa có năng suất cao
1) Dựa vào mẫu trên, để ước lượng tỉ lệ phế phẩm trong ở huyện A có độ chính xác là ε = 8,54% thì đảm bảo độ
kho A có độ chính xác là ε = 0, 035 thì đảm bảo độ tin cậy là bao nhiêu?
tin cậy của ước lượng là bao nhiêu? A. 95%; B. 96%; C. 97%; D. 98%.

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
§1. Khái niệm về kiểm định giả thuyết thống kê 1.2. Giả thuyết không (giả thuyết đơn)
§2. Kiểm định giả thuyết về đặc trưng của tổng thể và giả thuyết ngược lại (đối thuyết)
§3. Kiểm định so sánh hai đặc trưng
………………………….. • Giả thuyết không (Null Hypothesis) là sự giả sử mà ta
§1. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THUYẾT muốn kiểm định, thường được ký hiệu là H 0 .
THỐNG KÊ • Giả thuyết ngược lại (Alternative Hypothesis) là việc
• Thông thường đối với tham số θ chưa biết của tổng thể bác bỏ giả thuyết không sẽ dẫn đến việc chấp nhận giả
ta có thể đưa ra nhiều giả thuyết về θ. thuyết ngược lại. Giả thuyết ngược lại thường được ký
Vấn đề đặt ra là làm thế nào kiểm định được giả thuyết hiệu là H1 .
nào thích hợp với các số liệu của mẫu quan sát được. Ta có các trường hợp sau:
1.1. Giả thuyết thống kê Kiểm định giả thuyết H 0 : θ = θ 0 với H 1 : θ < θ 0 .
• Giả thuyết thống kê (Statistical Hypothesis) là một giả Kiểm định giả thuyết H 0 : θ = θ 0 với H1 : θ > θ 0 .
sử hay một phát biểu có thể đúng, có thể sai liên quan
đến tham số của một hay nhiều tổng thể. Kiểm định giả thuyết H 0 : θ = θ 0 với H 1 : θ ≠ θ 0 .

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
1.3. Các loại sai lầm trong kiểm định 1.4. Miền bác bỏ và miền chấp nhận
Khi kiểm định giả thuyết thống kê, ta có thể phạm phải • Tất cả các giá trị có thể có của các đại lượng thống kê
2 loại sai lầm sau trong kiểm định có thể chia làm 2 miền: miền bác bỏ
a) Sai lầm loại I (type I error) và miền chấp nhận.
• Là loại sai lầm mà ta phạm phải trong việc bác bỏ giả  Miền bác bỏ là miền chứa các giá trị làm cho giả
thuyết H 0 khi H 0 đúng. Xác suất của việc bác bỏ H 0 thuyết H 0 bị bác bỏ.
khi H 0 đúng là xác suất của sai lầm loại I và được ký  Miền chấp nhận là miền chứa các giá trị giúp cho giả
hiệu là α . Số α còn được gọi là mức ý nghĩa (level of thuyết H 0 không bị bác bỏ (được chấp nhận).
significance). Thông thường α = 0,05; 0,01; 0,001 … • Giá trị chia đôi hai miền được gọi là giá trị giới hạn
b) Sai lầm loại II (type II error) (critical value).
• Là loại sai lầm mà ta phạm phải trong việc chấp nhận 1.5. Kiểm định một đầu và kiểm định 2 đầu
giả thuyết H 0 khi H 0 sai. Xác suất của việc chấp nhận a) Kiểm định một đầu
giả thuyết H 0 khi H 0 sai là xác suất của sai lầm loại II • Khi đối thuyết H 1 có tính chất 1 phía thì việc kiểm
và được ký hiệu là β . định được gọi là kiểm định 1 đầu.

Xác suất - Thống kê Cao đẳng 23


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
Có hai loại kiểm định 1 đầu: §2. KIỂM ĐỊNH GIẢ THUYẾT VỀ ĐẶC TRƯNG
Kiểm định giả thuyết H 0 : θ = θ 0 với H 1 : θ < θ 0 . CỦA TỔNG THỂ
2.1. Kiểm định giả thuyết trung bình tổng thể µ
Kiểm định giả thuyết H 0 : θ = θ 0 với H 1 : θ > θ 0 . Với trung bình µ0 cho trước, tương tự bài toán ước
b) Kiểm định hai đầu lượng khoảng cho trung bình tổng thể, ta có 4 trường
• Khi đối thuyết H 1 có tính chất 2 phía thì việc kiểm hợp sau (4 trường hợp đều đặt giả thuyết H: µ = µ 0).
định được gọi là kiểm định 2 đầu: a) Trường hợp 1. Với n ≥ 30, σ2 đã biết.
Kiểm định giả thuyết H 0 : θ = θ 0 với H 1 : θ ≠ θ 0 . 1−α B
• Từ mức ý nghĩa α ⇒ = ϕ(tα )  → tα .
• Từ đây về sau ta chỉ xét Miền bác bỏ 2
loại kiểm định hai đầu x − µ0
• Tính giá trị thống kê t = .
và để cho gọn ta chỉ đặt σ
1 giả thuyết là H.
n
t < −tα tα < t • Nếu t ≤ tα ta chấp nhận H; nếu t > tα ta bác bỏ H.

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
2 Chú ý
b) Trường hợp 2. Với n ≥ 30, σ chưa biết.
Ta làm như trường hợp 1 nhưng thay σ bằng s . • Trong tất cả các trường hợp bác bỏ, ta so sánh x và µ 0 :
c) Trường hợp 3. Với n < 30, σ2 đã biết và  Nếu x > µ 0 thì kết luận µ > µ 0 .
X có phân phối chuẩn (ta làm như trường hợp 1).  Nếu x < µ 0 thì kết luận µ < µ 0 .
d) Trường hợp 4. Với n < 30, σ2 chưa biết và VD 1. Trong nhà máy bánh kẹo A, một máy tự động sản
X có phân phối chuẩn. xuất ra các thanh chocolate với trọng lượng quy định là
• Từ cỡ mẫu n và mức ý nghĩa α    → tαn −1.
tra baûng C 250gram và độ lệch chuẩn là 5gram. Trong một ngày, bộ
phận kiểm tra kỹ thuật chọn một mẫu ngẫu nhiên gồm
x − µ0 32 thanh chocolate và tính được trọng lượng trung bình
• Tính giá trị thống kê t = . của chúng là 248gram. Trong kiểm định giả thuyết H:
s
“trọng lượng các thanh chocolate do máy tự động sản
n xuất ra đúng quy định” với mức ý nghĩa α = 0, 05 . Hãy
• Nếu t ≤ tαn −1 ta chấp nhận H; t > tαn −1 ta bác bỏ H. cho biết giá trị thống kê t và kết luận?

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
VD 2. Trọng lượng của loại sản phẩm A theo quy định là B. t = 1, 7205 ; bác bỏ H, trọng lượng thực tế của bao
6 kg. Kiểm tra ngẫu nhiên 121 sản phẩm A tính được gạo nhỏ hơn 50 kg với mức ý nghĩa 6%.
trọng lượng trung bình là 5,795 kg và phương sai mẫu C. t = 1, 9732; chấp nhận H với mức ý nghĩa 4%.
chưa hiệu chỉnh là 5,712 (kg)2. D. t = 1, 9732; bác bỏ H, trọng lượng thực tế của
Với mức ý nghĩa 5%, hãy kiểm định giả thuyết H: bao gạo nhỏ hơn 50 kg với mức ý nghĩa 4%.
“trọng lượng của sản phẩm A là 6 kg”?
VD 4. Trọng lượng một loại gà ở trại chăn nuôi A khi
VD 3. Trong một nhà máy gạo, trọng lượng đóng bao
xuất chuồng là 3,62 kg/con. Biết trọng lượng gà là biến
theo quy định của một bao gạo là 50 kg và độ lệch chuẩn
là 0,3 kg. Cân thử 296 bao gạo của nhà máy này thì thấy ngẫu nhiên có phân phối chuẩn N (µ; 0, 01). Sau một
trọng lượng trung bình là 49,97 kg. Kiểm định giả thuyết thời gian người ta cho gà ăn thức ăn mới và cân thử 15
H: “trọng lượng mỗi bao gạo của nhà máy này là 50 kg” con khi xuất chuồng thấy trọng lượng trung bình của gà
có giá trị thống kê t và kết luận là: là 3,69 kg/con. Với mức ý nghĩa 2%, hãy cho kết luận
A. t = 1, 7205 ; chấp nhận H với mức ý nghĩa 6%. về loại thức ăn này?

Xác suất - Thống kê Cao đẳng 24


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê

VD 5. Điểm trung bình môn Toán của sinh viên năm VD 6. Chiều cao cây giống (X: m) trong một vườm ươm
trước là 5,72. Năm nay theo dõi 100 SV được số liệu: là biến ngẫu nhiên có phân phối chuẩn. Người ta đo
Điểm 3 4 5 6 7 8 9 ngẫu nhiên 25 cây giống này và có bảng số liệu:

Số sinh viên 3 5 27 43 12 6 4 X (m) 0,8 0,9 1,0 1,1 1,2 1,3


Số cây 1 2 9 7 4 2
Trong kiểm định giả thuyết H: “điểm trung bình môn
Toán của sinh viên năm nay bằng năm trước”, mức ý Theo quy định của vườn ươm, khi nào cây cao hơn 1 m
nghĩa tối đa là bao nhiêu để H được chấp nhận? thì đem ra trồng. Với mức ý nghĩa 5%, kiểm định giả
thuyết H: “cây giống của vườn ươm cao 1 m” có giá trị
A. α = 13, 98%.
thống kê và kết luận là:
B. α = 13, 62% . A. t = 2, 7984 , không nên đem cây ra trồng.
C. α = 12, 46% . B. t = 2, 7984 , nên đem cây ra trồng.
D. α = 11, 84% . C. t = 1, 9984 , không nên đem cây ra trồng.
D. t = 1, 9984 , nên đem cây ra trồng.

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
2.2. Kiểm định giả thuyết tỉ lệ tổng thể p VD 7. Kiểm tra ngẫu nhiên 800 sinh viên của trường A
thấy có 128 sinh viên giỏi. Với mức ý nghĩa 5%, hãy
• Với tỉ lệ p 0 cho trước, ta đặt giả thuyết H : p = p 0 .
kiểm định giả thuyết H: “tỉ lệ sinh viên giỏi của trường A
1−α B là 20%”?
• Từ mức ý nghĩa α ⇒ = ϕ(tα )  → tα .
2 VD 8. Để kiểm tra một loại súng thể thao, người ta cho
m bắn 1000 viên đạn vào 1 tấm bia thấy có 670 viên trúng
• Từ mẫu cụ thể, ta tính tỉ lệ mẫu f = và
n mục tiêu. Sau đó, bằng cải tiến kỹ thuật người ta nâng
f − p0 được tỉ lệ trúng của súng này lên 70%. Hãy cho kết luận
giá trị thống kê t = . về việc cải tiến trên với mức ý nghĩa 1%?
p 0q 0 VD 9. Công ty A tuyên bố rằng có 40% người tiêu dùng
n ưa thích sản phẩm của mình. Một cuộc điều tra 400
 Nếu t ≤ tα thì chấp nhận H, nghĩa là p = p 0 . người tiêu dùng thấy có 179 người ưa thích sản phẩm
của công ty A. Trong kiểm định giả thuyết H: “có 40%
 Nếu t > tα thì bác bỏ H, nghĩa là p ≠ p 0 .
người tiêu dùng thích sản phẩm của công ty A”, mức ý
Khi đó: f > p 0 ⇒ p > p 0 ; f < p 0 ⇒ p < p 0 . nghĩa tối đa là bao nhiêu để H được chấp nhận?

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
§3. KIỂM ĐỊNH SO SÁNH HAI ĐẶC TRƯNG
CỦA HAI TỔNG THỂ b) Trường hợp 2. nx , ny ≥ 30 và σ2x , σy2 chưa biết.
3.1. So sánh hai trung bình µx và µy của X và Y Ta thay σ2x , σy2 bằng sx2 , sy2 trong trường hợp 1.
 Tóm tắt 4 trường hợp c) Trường hợp 3. nx , ny < 30 và σ2x , σy2 đã biết
• Tất cả 4 trường hợp đều đặt giả thuyết H : µ x = µ y .
đồng thời X, Y có phân phối chuẩn.
• Việc chấp nhận hay bác bỏ giả thuyết H đều làm như Ta làm như trường hợp 1.
bài toán kiểm định trung bình.
d) Trường hợp 4. nx , ny < 30 và σ2x , σy2 chưa biết
a) Trường hợp 1. nx , ny ≥ 30 và σ2x , σy2 đã biết.
đồng thời X, Y có phân phối chuẩn.
x −y • Tính phương sai mẫu chung của 2 mẫu:
Ta tính thống kê t = và so sánh với tα .
σ2x σ2 (nx − 1)sx2 + (ny − 1)sy2
+ y s2 = .
nx ny n x + ny − 2

Xác suất - Thống kê Cao đẳng 25


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
x −y VD 2. Người ta đo ngẫu nhiên đường kính của 15 trục
• Tính giá trị thống kê t = . máy do máy X sản xuất và 17 trục máy do máy Y sản
1 1 xuất (giả sử có phân phối chuẩn) tính được kết quả là:
s. +
n x ny x = 251, 7 mm; sx2 = 25 và y = 249, 8 mm; sy2 = 23 .
tra baûng C n +ny −2
• Từ α    → tα x và so sánh với t . Với mức ý nghĩa 1%, kiểm định giả thuyết H: “đường
kính các trục máy do 2 máy sản xuất là như nhau” có
VD 1. Người ta cân 100 trái cây A ở nông trường X và giá trị thống kê và kết luận là:
tính được x = 102gram, sx2 = 30 ; cân 150 trái cây A ở A. t = 2, 0963 , chấp nhận H.
B. t = 2, 0963 , đường kính trục máy X lớn hơn.
nông trường Y và tính được y = 100 gram, sy2 = 31 . C. t = 1, 0963, chấp nhận H.
Trong kiểm định giả thuyết H: “trọng lượng của trái cây D. t = 1, 0963 , đường kính trục máy X lớn hơn.
ở 2 nông trường là như nhau”, mức ý nghĩa tối đa là bao
nhiêu để giả thuyết H được chấp nhận?

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
VD 3. Trọng lượng trung bình của 23 trái dưa hấu do xã fx − fy
X trồng là 6,72kg/trái và sx = 0, 32 kg. Trọng lượng • Tính giá trị thống kê t = .
1 
trung bình của 19 trái dưa hấu do xã Y trồng là  1 
p0q 0  + 
6,46kg/trái và sy = 0, 41kg (giả sử trọng lượng dưa hấu • Kết luận  nx ny 
có phân phối chuẩn). Với mức ý nghĩa 5%, có kết luận  Nếu t ≤ tα thì chấp nhận H ⇒ px = py .
trọng lượng trái dưa hấu do xã X trồng nặng hơn dưa
hấu do xã Y trồng được không?  Nếu t > tα và fx < fy thì bác bỏ H ⇒ px < py ;
 Nếu t > tα và fx > fy thì bác bỏ H ⇒ px > py .
p
,
p

3.2. So sánh hai tỉ lệ của hai tổng thể X, Y


x

Các bước thực hành VD 4. Từ hai tổng thể X và Y người ta tiến hành kiểm tra
• Đặt giả thuyết H : px = py . 2 mẫu có kích thước nx = 1000 , ny = 1200 về 1 tính
m my mx + my chất A thì được fx = 0, 27 và fy = 0, 3 . Với mức ý nghĩa
• Từ 2 mẫu ta tính fx = x , fy = , p0 = .
nx ny nx + ny 9%, hãy so sánh hai tỉ lệ px , py của hai tổng thể X và Y?

 Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê  Chương 6. Kiể
Kiểm đị
định Giả
Giả thuyế
thuyết Thố
Thống kê
VD 5. Kiểm tra 120 sản phẩm ở kho I thấy có 6 phế VD 7. Trước bầu cử, người ta thăm dò 1000 cử tri thì
phẩm; 200 sản phẩm ở kho II thấy có 24 phế phẩm. Hỏi thấy có 400 người nói rằng sẽ bỏ phiếu cho ông A. Một
chất lượng hàng ở hai kho có khác nhau không với: tuần sau (vẫn chưa bầu cử), người ta tổ chức 1 cuộc
1) Mức ý nghĩa 5%? 2) Mức ý nghĩa 1%? thăm dò khác và thấy có 680 trong số 1500 cử tri được
hỏi sẽ bỏ phiếu cho ông A. Kiểm định giả thuyết H: “tỉ lệ
VD 6. Một công ty điện tử tiến hành điều tra thị trường cử tri ủng hộ ông A ở hai lần là như nhau”, với mức ý
về sở thích xem tivi của cư dân trong 1 thành phố. Điều nghĩa 1% có giá trị thống kê t và kết luận là:
tra ngẫu nhiên 400 người ở quận X thì thấy có 270 người A. t = 2,6356; cử tri ngày càng ủng hộ ông A.
xem tivi ít nhất 1 giờ trong 1 ngày; 600 người ở quận Y B. t = 2,6356; cử tri ủng hộ ông A không thay đổi.
có 450 người xem tivi ít nhất 1 giờ trong 1 ngày. Trong C. t = 2,1349; cử tri ngày càng ủng hộ ông A.
kiểm định giả thuyết H: “tỉ lệ cư dân xem tivi ít nhất 1 D. t = 2,1349; cử tri ủng hộ ông A không thay đổi.
giờ trong 1 ngày ở quận X và Y như nhau”, mức ý nghĩa
tối đa là bao nhiêu để giả thuyết H được chấp nhận là:
A. 0,96%; B. 2,84%; C. 4,06%; D. 6,14%.

Xác suất - Thống kê Cao đẳng 26


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ  Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ
1. HỆ SỐ TƯƠNG QUAN MẪU 1.2. Tính chất
1.1. Định nghĩa 1) −1 ≤ r ≤ 1.
• Hệ số tương quan mẫu r là số đo mức độ phụ thuộc 2) Nếu r = 0 thì X , Y không có quan hệ tuyến tính;
tuyến tính giữa hai mẫu ngẫu nhiên cùng cỡ X và Y . Nếu r = ±1 thì X , Y có quan hệ tuyến tính tuyệt đối.
• Giả sử ta có mẫu ngẫu nhiên cỡ n về vector ngẫu nhiên 3) Nếu r < 0 thì quan hệ giữa X , Y là giảm biến.
(X , Y ) là (xi , yi ); i = 1; 2;...; n . Khi đó, hệ số tương 4) Nếu r > 0 thì quan hệ giữa X , Y là đồng biến.
quan mẫu r được tính theo công thức: VD 1. Kết quả đo lường độ cholesterol (Y) có trong máu
của 10 đối tượng nam ở độ tuổi (X) như sau:
xy − x .y 1 n
r= ; xy = ∑ x i yi . X 20 52 30 57 28 43 57 63 40 49
sˆx .sˆy n i =1 Y 1,9 4,0 2,6 4,5 2,9 3,8 4,1 4,6 3,2 4,0
Tính hệ số tương quan mẫu giữa X và Y .

 Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ  Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ

Giải. Từ số liệu ở bảng trên, ta tính được: 2. Đường hồi quy trung bình tuyến tính thực nghiệm
20 × 1, 9 + ... + 49 × 4, 0 • Từ mẫu thực nghiệm về vector ngẫu nhiên (X , Y ), ta
xy = = 167, 26 ;
10 biễu diễn các cặp điểm (xi , yi ) lên mpOxy . Khi đó,
1 n đường cong nối các điểm là đường cong phụ thuộc của
x = ∑ xi = 43, 9 ; sˆx = 13, 5385 ;
n i =1 Y theo X mà ta cần tìm (xem hình a), b)).
1 n
y= ∑ y = 3, 56; sˆy = 0, 8333 .
n i =1 i
xy − x .y
Vậy r = = 0, 9729.
sˆx .sˆy

Hình a Hình b

 Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ  Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ

• Đường thẳng là đường hồi quy thực nghiệm xấp xỉ tốt 2.2. Phương trình đường hồi quy tuyến tính
nhất các điểm mẫu đã cho, cũng là xấp xỉ đường cong  Đường hồi quy tuyến tính của Y theo X là:
cần tìm. Trong hình a) ta thấy xấp xỉ tốt (phụ thuộc
y = a + bx .
tuyến tính chặt), hình b) xấp xỉ không tốt.
xy − x .y
Trong đó: b = , a = y − b.x .
2.1. Phương pháp bình phương bé nhất sˆx2
• Khi có sự phụ thuộc tuyến tính tương đối chặt giữa hai
biến ngẫu nhiên X và Y ta cần tìm biểu thức a + bX  Đường hồi quy tuyến tính của X theo Y là:
xấp xỉ Y tốt nhất theo nghĩa cực tiểu sai số bình
x = a + by.
phương trung bình E (Y − a − bX )2 , phương pháp này
được gọi là bình phương bé nhất. xy − x .y
Trong đó: b = , a = x − b.y .
sˆy2

Xác suất - Thống kê Cao đẳng 27


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ  Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ
VD 2. Đo chiều cao (X: m) và khối lượng (Y: kg) của 5
xy − x .y 82, 45 − 1, 55 × 53
học sinh nam, ta có kết quả: 2) b = = = 60, 0181 ;
X 1,45 1,60 1,50 1,65 1,55 sˆx2 (0, 0707)2
Y 50 55 45 60 55 a = y − bx = 53 − 60, 0181 × 1, 55 = −40, 0281.
1) Tìm hệ số tương quan r. Vậy y = −40, 0281 + 60, 0181x .
2) Lập phương trình hồi quy tuyến tính của Y theo X.
3) Dự đoán nếu một học sinh cao 1,62m thì nặng khoảng 3) Học sinh cao 1,62m thì nặng khoảng:
bao nhiêu kg? y = −40, 0281 + 60, 0181 × 1, 62 = 57, 2012 kg.

Giải. 1) x = 1, 55; sˆx = 0, 0707; y = 53; sˆy = 5, 099 ;


82, 45 − 1, 55 × 53
xy = 82, 45 ⇒ r = = 0, 8322 .
0, 0707 × 5, 099

 Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ  Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ
VD 3. Số vốn đầu tư Y Giải. 1) Ta có x = 2; sˆx = 0, 7746; y = 0, 71;
(X: triệu đồng) và lợi X 0,3 0,7 1,0
nhuận thu được (Y: sˆy = 0, 2427 ; xy = 1, 56 .
1 20 10
triệu đồng) trong một xy − x .y 1, 56 − 0, 71 × 2
2 30 10 ⇒b = = = 2, 3768 ;
đơn vị thời gian của
100 quan sát là: 3 10 20 sˆy2 (0, 2427)2
1) Lập phương trình hồi tuyến tính của X theo Y. a = x − by = 2 − 2, 3768 × 0, 71 = 0, 3125 .
2) Dự đoán nếu muốn lợi nhuận thu được là 0,5 triệu Vậy x = 0, 3125 + 2, 3768y .
đồng thì cần đầu tư bao nhiêu?
2) Nếu muốn lợi nhuận thu được là 0,5 triệu thì cần đầu
tư khoảng:
x = 0, 3125 + 2, 3768 × 0, 5 = 1, 5009 triệu đồng.

 Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ  Chương 7. Bà
Bài toá Hồi quy
toán tương quan & Hồ
VD 4. Số thùng bia (Y: thùng) được bán ra phụ thuộc Giải. 1) x = 0,1558; sˆx = 0, 006; y = 110; sˆy = 7, 746 ;
vào giá bán (X: triệu đồng/ thùng). Điều tra 100 đại lý về
17,1 − 0,1558 × 110
1 loại bia trong một đơn vị thời gian có bảng số liệu: xy = 17,1 ⇒ r = = −0, 8176 .
0, 006 × 7, 746
Y
X 100 110 120
xy − x .y 17,1 − 0,1558 × 110
0,150 5 15 30 2) b = = = −0, 0006 ;
0,160 10 25 sˆy2 (7, 746)2
0,165 15 a = x − by = 0,1558 + 0, 0006 × 110 = 0, 2218 .
1) Tính hệ số tương quan r. Vậy x = 0, 2218 − 0, 0006y .
2) Lập phương trình hồi tuyến tính của X theo Y. 3) Nếu muốn bán được 115 thùng bia thì giá bán mỗi
3) Dự đoán nếu muốn bán được 115 thùng bia thì giá thùng khoảng:
bán mỗi thùng cỡ bao nhiêu? x = 0, 2218 − 0, 0006 × 115 = 0,1528 triệu đồng.

Xác suất - Thống kê Cao đẳng 28


ĐH Công nghiệp Tp.HCM Saturday, October 23, 2010
dvntailieu.wordpress.com

 Sử dụng má
máy tí bỏ túi tì
tính bỏ tìm đườ
đường hồ
hồi quy  Sử dụng má
máy tí bỏ túi tì
tính bỏ tìm đườ
đường hồ
hồi quy
3. Sử dụng máy tính bỏ túi tìm đường hồi qui Xuất kết quả:
3.1. Số liệu không có tần số SHIFT → 2 → (dịch chuyển mũi tên phải 2 lần)
a) Máy tính fx500MS, fx570MS → 1 (A chính là a trong phương trình)
VD 5. Bài toán cho dạng cặp (xi , yi )như sau: → 2 (B chính là b trong phương trình)
X 20 52 30 57 28 43 57 63 40 49 → 3 (r chính là r ).
Y 1,9 4,02,6 4,5 2,9 3,84,1 4,63,2 4,0 Đáp số: r = 0, 9729 ; y = 0, 9311 + 0, 0599x .
Tìm hệ số r , đường hồi quy Y theo X: y = a + bx . b) Máy tính fx500ES, fx570ES
Nhập số liệu: Xét lại VD 5 ở trên.
MODE → 3 (REG) → 1 (LIN) Nhập số liệu:
X, Y → M+ SHIFT → MODE → dịch chuyển mũi tên tìm chọn
20, 1.9 → M+ mục Stat → 2 (chế độ không tần số)
… … MODE → 3 (stat) → 2 (A+Bx) → (nhập các giá trị
49 , 4.0 → M+ của X, Y vào 2 cột)

 Sử dụng má
máy tí bỏ túi tì
tính bỏ tìm đườ
đường hồ
hồi quy  Sử dụng má
máy tí bỏ túi tì
tính bỏ tìm đườ
đường hồ
hồi quy
X Y Nhập số liệu:
20 1.9 MODE → 3 (REG) → 1 (LIN)
… … X, Y; n → M+
49 4.0 21, 3; 2 → M+
Xuất kết quả: … …
SHIFT → 1 → 7 → 1(A chính là a trong phương trình) 25 , 5; 8 → M+
→ 2 (B chính là b trong phương trình) Xuất kết quả:
→ 3 (r chính là r ). SHIFT → 2 → (dịch chuyển mũi tên phải 2 lần)
3.2. Số liệu có tần số → 1 (A chính là a trong phương trình)
a) Máy tính fx500MS, fx570MS X → 2 (B chính là b trong phương trình)
Y 21 23 25
VD 6. Xét bài toán cho ở dạng → 3 (r chính là r ).
bảng (hình bên). Tìm hệ số r , 3 2 Đáp số: r = 0, 7326 ; y = −2, 6694 + 0, 3145x .
đường hồi quy thực nghiệm Y 4 5 3
theo X: y = a + bx . 5 11 8

 Sử dụng má
máy tí bỏ túi tì
tính bỏ tìm đườ
đường hồ
hồi quy  Sử dụng má
máy tí bỏ túi tì
tính bỏ tìm đườ
đường hồ
hồi quy

b) Máy tính fx500ES, fx570ES Xuất kết quả:


Xét lại VD 6 ở trên SHIFT → 1 → 7 → 1 (kết quả là A).
Nhập số liệu: SHIFT → 1 → 7 → 2 (kết quả là B).
SHIFT → MODE → dịch chuyển mũi tên tìm chọn SHIFT → 1 → 7 → 3 (kết quả là r).
Mục Stat → 1 (chế độ có tần số)
Chú ý
MODE → 3 (stat) → 2 (A+Bx) → (nhập các giá trị
của X, Y, tần số vào 3 cột) Sai số khi dùng máy tính bỏ túi là không tránh khỏi.
Do đó, sinh viên nên chọn đáp án gần với kết quả của
X Y FREQ mình nhất khi làm bài trắc nghiệm.
21 3 2
………………..Hết………………..
... … …
25 5 8

Xác suất - Thống kê Cao đẳng 29

You might also like