Professional Documents
Culture Documents
1. MẪU
Về lý luận, khi muốn tìm hiểu một hiện tượng sức khỏe hoặc một mối quan hệ
nhân quả nào đó trong một quần thể nhất định, thì lý tưởng nhất là phải tiến hành
nghiên cứu trên tất cả các cá thể có trong quần thể đó, tức là phải làm một nghiên cứu
toàn bộ (ví dụ điều tra dân số). Tuy nhiên, trong thực tiễn thường không thể hoặc
không cần thiết phải tiến hành các nghiên cứu toàn bộ, nhất là các quần thể lớn, vì :
- Không đủ nhân lực, vật lực, kinh phí và thời gian để triển khai một nghiên
cứu trên toàn bộ quần thể.
- Chất lượng nghiên cứu trên toàn bộ quần thể sẽ không tốt bằng nghiên cứu
trên mẫu (do sai số đo lường: chênh lệch về trình độ, kỹ năng của các điều tra viên,
giám sát viên; dụng cụ, phương tiện đo lường không hoàn toàn như nhau...).
- Nếu nghiên cứu được thực hiện trên một mẫu đại diện cho quần thể thì có thể
dùng kết quả của mẫu để suy luận cho toàn bộ quần thể.
Nhóm các cá thể được rút ra từ quần thể nhằm phục vụ trực tiếp cho nghiên
cứu được gọi là mẫu.
2. KHUNG MẪU
Để thuận tiện cho việc chọn một mẫu từ quần thể, cần thiết phải có một danh
sách các đơn vị mẫu hoặc bản đồ phân bố các đơn vị mẫu. Danh sách hoặc bản đồ như
vậy được gọi là khung mẫu; đây là một điều kiện quan trọng trong việc lựa chọn loại
mẫu thích hợp cho nghiên cứu.
3. MỘT SỐ KỸ THUẬT CHỌN MẪU
3.1. Mẫu ngẫu nhiên đơn
Khi tất cả các cá thể có trong quần thể đều có cơ hội như nhau, hay có xác suất
bằng nhau được chọn vào mẫu.Ví dụ: chọn 500 hồ sơ trong số 5000 sản phụ đã đẻ tại
bệnh viện A trong năm 2005 để nghiên cứu. Nếu theo cách chọn ngẫu nhiên đơn thì
mỗi sản phụ đều có xác suất như nhau là: 500/5000 = 0,10 được chọn vào mẫu.
Các bước tiến hành:
- Xây dưng 1 khung mẫu chứa đựng tất cả các đơn vị mẫu;
- Sử dụng Bảng số ngẫu nhiên để chọn các cá thể vào mẫu;
QUẦN THỂ
MẪU
72
3.2. Mẫu hệ thống
Việc chọn ngẫu nhiên các cá thể từ quần thể vào mẫu tuân theo một trình tự
nhất định thông qua khoảng cách mẫu.
Các bước tiến hành:
- Xây dựng khung mẫu: đánh số thứ tự từ 1 đến N vào danh sách toàn bộ các
đơn vị mẫu;
- Xác định khoảng cách mẫu: k = N/n (N là kích thước quần thể, n là kích thước
mẫu );
- Chọn một số ngẫu nhiên R nằm trong khoảng (1, k);
- Chọn các đơn vị vào mẫu: các đơn vị có số thứ tự R + ik (i đi từ zéro đến n -
1) là các đơn vị được chọn vào mẫu
QUẦN THỂ
k = N/n
MẪU
Sơ đồ mẫu hệ thống
73
QUẦN THỂ
MẪU
Sơ đồ mẫu tầng
74
- Xác định các chùm thích hợp: quần thể được hình thành một cách tự nhiên
bởi các chùm (cụm), mỗi chùm là tập hợp các cá thể gần nhau (làng, xã, trường học,
khoa, phòng, bệnh viện...), tùy theo mỗi nghiên cứu mà xác định các chùm cụ thể;
- Xây dựng khung mẫu: bằng cách lập danh sách toàn thể các chùm trong quần
thể và đánh số thứ tự vào các chùm đó;
Từ đây sẽ có hai cách chọn:
Mẫu chùm một giai đoạn: dùng phương pháp ngẫu nhiên đơn chọn một số
chùm từ khung mẫu, tất cả các cá thể trong các chùm được chọn đó sẽ hình thành mẫu
nghiên cứu;
Mẫu chùm hai giai đoạn: giai đoạn một, dùng phương pháp ngẫu nhiên đơn
chọn một số chùm như cách chọn mẫu chùm một giai đoạn; giai đoạn hai, dùng
phương pháp ngẫu nhiên đơn hoặc phương pháp khác (phương pháp quay bút chì ...)
chọn một số cá thể nhất định từ mỗi chùm được chọn trong giai đoạn 1 , tập hợp tất cả
các cá thể này tạo thành mẫu nghiên cứu.
QUẦN THỂ
MẪU
75
Trong đó: - n : là cỡ mẫu nhỏ nhất hợp lý;
- Z : là trị số tùy thuộc vào mức tin cậy mong muốn của ước lượng; mức
tin cậy mong muốn là 95% ( 90% ) thì z = 1,96 (1,65) ;
- p : là ước đoán tham số p chưa biết của quần thể;
- c : là mức chính xác của nghiên cứu, là sự khác biệt giữa tỷ lệ p̂ thu được
trên mẫu và tỷ lệ p thật trong quần thể; sự khác biệt này do người nghiên cứu lựa
chọn;
Ví dụ: Cần nghiên cứu trên mẫu về tỷ lệ suy dinh dưỡng thể thiếu cân của trẻ
em dưới 5 tuổi năm 2007 tại tỉnh A; theo báo cáo của sở y tế, tỷ lệ đó năm 2006 là
30%; chấp nhận mức chính xác của nghiên cứu là 3%; mức tin cậy mong muốn là
95%; cỡ mẫu tối thiểu hợp lý sẽ là:
n= (1,96)2 × (500)2 ≈ 97
(100)2
Trên đây là cỡ mẫu cho các nghiên cứu quan sát mô tả;
Dưới đây sẽ trình bày một số công thức cho các nghiên cứu quan sát phân tích
và nghiên cứu thực nghiệm.
4.3. Cỡ mẫu cho nghiên cứu thuần tập
Câu hỏi luôn đặt ra cho mọi nghiên cứu là “cần phải nghiên cứu bao nhiêu đối
tượng để có thể đạt được kết quả mong đợi ”. Khi thiết kế nghiên cứu thuần tập cũng
phải trả lời câu hỏi đó. Với nghiên cứu thuần tập, n luôn tuỳ thuộc vào:
- α : sai số loại I: xác suất bác bỏ Ho (RR=1) trong khi Ho đúng;
- β : sai số loại II: xác suất chấp nhận Ho trong khi Ho sai;
- Tỷ lệ mới mắc ở nhóm không phơi nhiễm;
76
- Nguy cơ tương đối RR dự đoán.
Cho nên mọi công thức tính cỡ mẫu cho một nghiên cứu thuần tập đều luôn chứa
đựng các thông số nêu trên; và muốn tính được cỡ mẫu thì phải định trước các thông số
đó. Có thể dùng công thức của Schlesselman:
(Z [ ( )] )
2
α 2 pq + Z β p1 1 + RR − p1 1 + RR 2
n=
p1 (1 − RR )
2 2
Trong đó :
- n: số đối tượng cần thiết trong mỗi nhóm;
- Z α và Z β : tra từ bảng phân phối Z ;
Zα = 1,96 nếu α = 0,05 ;
Z β = 1,65 nếu β = 0,10 ;
- p1 : tỷ lệ mới mắc ở nhóm không phơi nhiễm;
1
- p = p1 (1 + RR ) ; và q =1 − p .
2
Ví dụ: Nếu chấp nhận α = 0,05 , β = 0,10 , và giả sử p1 = 0,008, và sau đó
p1 = 0,002 , có thể tính được cỡ mẫu n tuỳ thuộc vào RR như sau:
n=
(Z α 2u (1 − u ) + Z β f (1 − f ) + p3 q3 ) 2
(f − p3 )
2
Trong đó:
- n : số đối tượng cần thiết trong mỗi nhóm;
- Z α và Z β : tra từ bảng phân phối Z:
- f : tỷ lệ phơi nhiễm;
1 RR
-u= f 1 + ;
2 1 + f ( RR − 1)
77
fRR
- p3 =
[1 + f ( RR − 1) ] ;
- q3 = 1 − p 3 ;
Ví dụ: Chấp nhận : α = 0,05 ; β = 0,10 ; f = 0,30; có thể tính n tuỳ thuộc RR:
RR dự đoán f = 0,3
2 188
3 73
4 45
5 34
7 24
10 18
RR có thể bộc lộ càng nhỏ thì n phải càng lớn.
Giá trị D
Tỷ lệ thành công
của can thiệp A
5% 10% 15% 25% 50%
5% 701 220 115 52 19
10% 1128 324 160 67 21
25% 2075 542 251 95 24
50% 2589 641 280 95 -
75% 1806 410 160 - -
90% 701 - - - -
Ví dụ :
Nếu tỷ lệ thành công của can thiệp A là 75% và d = 5% thì cần phải nghiên cứu
1806 đối tượng trong mỗi nhóm nếu α = β = 0,05 .
78
4.5.2. Giá trị D dưới dạng độ lệch chuẩn:
Bảng : Cỡ mẫu cho mỗi nhóm trong nghiên cứu can thiệp với α = β = 0,05
( giá trị D dưới dạng độ lệch chuẩn)
D n D n
Ví dụ (của Kastelbaum) :
Giả sử thời gian sống trung bình của một loài chuột là 125 tuần với độ lệch
chuẩn 20 tuần; một can thiệp bằng tia X có thể làm giảm thơi gian sống của chuột; nếu
5
muốn phát hiện được sự giảm 5 tuần thì D = = 0,25 độ lệch chuẩn;
20
với D = 0,25 thì phải nghiên cứu 500 đối tượng trong mỗi nhóm.
79
BẢNG SỐ NGẪU NHIÊN
80