Professional Documents
Culture Documents
16/06/2009 08:49
Cỡ mẫu sẽ có ảnh hưởng lớn đến độ chính xác của ước lượng thống kê. Từ định lí giới
hạn trung tâm chúng ta hi vọng rằng con số trung bình được ước lượng từ một mẫu sẽ
tập trung tại trung bình của dân số đó. Tuy vậy chúng ta cũng biết rằng con số ước
lượng sẽ không chính xác bằng trung bình của dân số đó mà mức độ phân tán phụ thuộc
vào cỡ mẫu: Nếu cỡ mẫu nhỏ độ phân tán lớn, nếu cỡ mấu lớn thì độ phân tán nhỏ và
ta hi vọng số trung bình của mẫu sẽ bằng trung bình của dân số.
Người ta có thể trình bày mức độ phân tán theo khoảng tin cậy 95%. Nếu độ phân tán
lớn thì khoảng tin cậy 95% sẽ rộng và chúng ta khó lòng thực sự biết được trung bình
của dân số sẽ nằm ở đâu trong khoảng này. Nói rộng ra, nếu cỡ mẫu nhỏ chúng ta
không thể ước lượng một cách chính xác, chúng ta không thể chứng minh sự khác biệt
giữa hai nhóm là không có ý nghĩa.
Vấn đề xác định cỡ mẫu trong nghiên cứu khoa học là một vấn đề quan trọng. Nếu
chúng ta lấy mẫu quá nhỏ, đến giai đoạn phân tích ta có thể thấy được điều đó qua sự
không chính xác của uớc lượng, sự thất bại trong chứng minh giả thuyết. Tuy vậy khi
chúng ta đã đi vào giai đoạn phân tích số liệu thì lúc đó là quá chậm trễ để có thể thay
đổi được cỡ mẫu. Ngược lại nếu chúng ta lấy một cỡ mẫu quá lớn thì chúng ta rõ ràng
lãng phì tiền bạc và thời gian.
(b) Dựa trên kiểm định giả thuyết. Thí dụ,so sánh thời gian bú sữa mẹ hoàn toàn ở 2
nhóm có giáo dục sức khỏe và nhóm chứng.Câu hỏi chìa khóa trong cách tiếp cận này là
xác suất kết luận sai lầm trong kiểm định giả thuyết là bao nhiêu?
Ước lượng một hậu quả với một độ chính xác nhất định
Ðộ chính xác của một ước lượng (với khoảng tin cậy 95%) = d có nghĩa là sai số tối đa
của ước lượng là d (với độ tin cậy 95% hay xác suất điều trên không bị sai là
95%)
Một thắc mắc hay nẩy sinh trong khi nghiên cứu công thức này là trong khi chúng ta
muốn nghiên cứu ước lượng p nhưng trong khi tính toán để tính cỡ mẫu chúng ta phải
có giá trị của tỉ lệ p! Toàn bộ logic của vấn đề là ở chỗ chúng ta có thể ước lượng p
trước lúc nghiên cứu một cách không chính xác, sau nghiên cứu chúng ta có thể ước
lượng p một cách chính xác hơn nhiều. Ta có thể ước lượng p sử dụng phán đoán của
1
chúng ta, sử dụng những nghiên cứu trước đó, có thể tiến hành nghiên cứu dẫn đường.
Trong trường hợp chúng ta không thể ước đoán p, ta có thể ước đoán p =0,5, một ước
đoán an toàn nhất và sẽ cho một cỡ mẫu an toàn nhất (lớn nhất).
Không có quy tắc cứng nhắc độ chính xác d, điều này phụ thuộc vào mục đích của
nghiên cứu và vào tài nguyên hiện có.
Lưu ý:
- Công thức được trình bày là dành cho phép lấy mẫu ngẫu nhiên đơn. Nếu nghiên cứu
sử dụng phương pháp lấy mẫu cụm cần phải hiệu chỉnh tác động làm giảm độ chính xác
của việc chọn cụm bằng cách tăng cỡ mẫu. Cỡ mẫu trong nghiên cứu lấy mẫu cụm
thường được nhân lên với một hệ số (được gọi là hệ số thiết kế) có giá trị từ 2 đến 4. Hệ
số thiết kế có thể tính được từ việc nghiên cứu thử. Nếu không có điều kiện tính hệ số
thiết kế có thể chọn hệ số thiết kế là 3.
- Công thức tính cỡ mẫu trên là dành lấy mẫu từ một dân số vô hạn hay khá lớn. Nếu cỡ
mẫu vào khoảng từ 10% dân số trở lên, ta có thể điều chỉnh để có cỡ mẫu nhỏ hơn.
Nhc=(N´P)/(N)
Với N là cỡ mẫu chưa hiệu chỉnh, P là kích thước của dân số đích và Nhc là cỡ
mẫu sau khi đã hiệu chỉnh.
- Chúng ta cũng nên phải trù liệu cho những số liệu bị mất, những trường hợp từ chối
nghiên cứu bằng cách tăng cỡ mẫu.
2
Khi kiểm định H0: p1=p2