You are on page 1of 9

NGHIÊN CỨU TRÊN MẪU

1. MẪU
Về lý luận, khi muốn tìm hiểu một hiện tượng sức khỏe hoặc một mối quan hệ
nhân quả nào đó trong một quần thể nhất định, thì lý tưởng nhất là phải tiến hành
nghiên cứu trên tất cả các cá thể có trong quần thể đó, tức là phải làm một nghiên cứu
toàn bộ (ví dụ điều tra dân số). Tuy nhiên, trong thực tiễn thường không thể hoặc
không cần thiết phải tiến hành các nghiên cứu toàn bộ, nhất là các quần thể lớn, vì :
- Không đủ nhân lực, vật lực, kinh phí và thời gian để triển khai một nghiên
cứu trên toàn bộ quần thể.
- Chất lượng nghiên cứu trên toàn bộ quần thể sẽ không tốt bằng nghiên cứu
trên mẫu (do sai số đo lường: chênh lệch về trình độ, kỹ năng của các điều tra viên,
giám sát viên; dụng cụ, phương tiện đo lường không hoàn toàn như nhau...).
- Nếu nghiên cứu được thực hiện trên một mẫu đại diện cho quần thể thì có thể
dùng kết quả của mẫu để suy luận cho toàn bộ quần thể.
Nhóm các cá thể được rút ra từ quần thể nhằm phục vụ trực tiếp cho nghiên
cứu được gọi là mẫu.
2. KHUNG MẪU
Để thuận tiện cho việc chọn một mẫu từ quần thể, cần thiết phải có một danh
sách các đơn vị mẫu hoặc bản đồ phân bố các đơn vị mẫu. Danh sách hoặc bản đồ như
vậy được gọi là khung mẫu; đây là một điều kiện quan trọng trong việc lựa chọn loại
mẫu thích hợp cho nghiên cứu.
3. MỘT SỐ KỸ THUẬT CHỌN MẪU
3.1. Mẫu ngẫu nhiên đơn
Khi tất cả các cá thể có trong quần thể đều có cơ hội như nhau, hay có xác suất
bằng nhau được chọn vào mẫu.Ví dụ: chọn 500 hồ sơ trong số 5000 sản phụ đã đẻ tại
bệnh viện A trong năm 2005 để nghiên cứu. Nếu theo cách chọn ngẫu nhiên đơn thì
mỗi sản phụ đều có xác suất như nhau là: 500/5000 = 0,10 được chọn vào mẫu.
Các bước tiến hành:
- Xây dưng 1 khung mẫu chứa đựng tất cả các đơn vị mẫu;
- Sử dụng Bảng số ngẫu nhiên để chọn các cá thể vào mẫu;

QUẦN THỂ

- Bảng số ngẫu nhiên


N - Máy tính
n

MẪU

Sơ đồ mẫu ngẫu nhiên đơn

72
3.2. Mẫu hệ thống
Việc chọn ngẫu nhiên các cá thể từ quần thể vào mẫu tuân theo một trình tự
nhất định thông qua khoảng cách mẫu.
Các bước tiến hành:
- Xây dựng khung mẫu: đánh số thứ tự từ 1 đến N vào danh sách toàn bộ các
đơn vị mẫu;
- Xác định khoảng cách mẫu: k = N/n (N là kích thước quần thể, n là kích thước
mẫu );
- Chọn một số ngẫu nhiên R nằm trong khoảng (1, k);
- Chọn các đơn vị vào mẫu: các đơn vị có số thứ tự R + ik (i đi từ zéro đến n -
1) là các đơn vị được chọn vào mẫu
QUẦN THỂ
k = N/n

R R+k R + 2k ........................... R + (n -1)k

MẪU
Sơ đồ mẫu hệ thống

3.3. Mẫu tầng:


Quần thể được phân chia thành các tầng khác nhau theo một số tính chất nào
đó, trong mỗi tầng chọn một số đơn vị nhất định bằng phương pháp ngẫu nhiên đơn,
tập hợp các đơn vị đó tạo thành mẫu nghiên cứu.
Có 2 loại mẫu tầng, mẫu tầng tỷ lệ và mẫu tầng không tỷ lệ. Khi số đơn vị của
mỗi tầng được chọn vào mẫu tỷ lệ với kích thước của tầng tạo ra mẫu tầng tỷ lệ; khi số
đơn vị của mỗi tầng được chọn vào mẫu là bằng nhau tạo ra mẫu tầng không tỷ lệ.
Mẫu tầng tỷ lệ đại diện tốt cho quần thể hơn so với các loại mẫu khác.
Các bước tiến hành:
- Phân chia quần thể nghiên cứu thành các tầng khác nhau dựa vào một hoặc vài
đặc điểm nào đó như vùng sinh thái, nhóm tuổi, giới, tầng lớp xã hội, dân tộc...
- Thực hiện việc chọn mẫu ngẫu nhiên đơn trong mỗi tầng.

73
QUẦN THỂ

MẪU
Sơ đồ mẫu tầng

QUẦN THỂ MẪU


Sơ đồ mẫu tầng tỷ lệ

QUẦN THỂ MẪU

Sơ đồ mẫu tầng không tỷ lệ


3.4. Mẫu chùm:
Là mẫu đạt được từ sự chọn ngẫu nhiên các nhóm cá thể được gọi là chùm từ
nhiều chùm trong một quần thể nghiên cứu; trong trường hợp này đơn vị mẫu là các
chùm chứ không phải là các cá thể.
Các bước tiến hành:

74
- Xác định các chùm thích hợp: quần thể được hình thành một cách tự nhiên
bởi các chùm (cụm), mỗi chùm là tập hợp các cá thể gần nhau (làng, xã, trường học,
khoa, phòng, bệnh viện...), tùy theo mỗi nghiên cứu mà xác định các chùm cụ thể;
- Xây dựng khung mẫu: bằng cách lập danh sách toàn thể các chùm trong quần
thể và đánh số thứ tự vào các chùm đó;
Từ đây sẽ có hai cách chọn:
Mẫu chùm một giai đoạn: dùng phương pháp ngẫu nhiên đơn chọn một số
chùm từ khung mẫu, tất cả các cá thể trong các chùm được chọn đó sẽ hình thành mẫu
nghiên cứu;
 Mẫu chùm hai giai đoạn: giai đoạn một, dùng phương pháp ngẫu nhiên đơn
chọn một số chùm như cách chọn mẫu chùm một giai đoạn; giai đoạn hai, dùng
phương pháp ngẫu nhiên đơn hoặc phương pháp khác (phương pháp quay bút chì ...)
chọn một số cá thể nhất định từ mỗi chùm được chọn trong giai đoạn 1 , tập hợp tất cả
các cá thể này tạo thành mẫu nghiên cứu.
QUẦN THỂ

MẪU

Sơ đồ mẫu chùm (1 giai đoạn)

QUẦN THỂ CHÙM MẪU

Chọn ngẫu nhiên chùm Chọn ngẫu nhiên cá thể

Sơ đồ mẫu cùm 2 giai đoạn

4. KÍCH THƯỚC MẪU


4.1. Để ước lượng một tỷ lệ p,
Z 2 p (1 − p )
Nên sử dụng công thức: n=
c2

75
Trong đó: - n : là cỡ mẫu nhỏ nhất hợp lý;
- Z : là trị số tùy thuộc vào mức tin cậy mong muốn của ước lượng; mức
tin cậy mong muốn là 95% ( 90% ) thì z = 1,96 (1,65) ;
- p : là ước đoán tham số p chưa biết của quần thể;
- c : là mức chính xác của nghiên cứu, là sự khác biệt giữa tỷ lệ p̂ thu được
trên mẫu và tỷ lệ p thật trong quần thể; sự khác biệt này do người nghiên cứu lựa
chọn;
Ví dụ: Cần nghiên cứu trên mẫu về tỷ lệ suy dinh dưỡng thể thiếu cân của trẻ
em dưới 5 tuổi năm 2007 tại tỉnh A; theo báo cáo của sở y tế, tỷ lệ đó năm 2006 là
30%; chấp nhận mức chính xác của nghiên cứu là 3%; mức tin cậy mong muốn là
95%; cỡ mẫu tối thiểu hợp lý sẽ là:

n= (1,96)2 × 0,30 × 0,70 ≈ 897


(0,03)2

4.2. Để ước lượng một số trung bình µ


Z 2δ 2
Nên sử dụng công thức: n=
c2
Trong đó: - n : là cỡ mẫu nhỏ nhất hợp lý;
- Z : là trị số tùy thuộc vào mức tin cậy mong muốn của ước lượng; mức
tin cậy mong muốn là 95% ( 90% ) thì z = 1,96 (1,65) ;
- δ : là ước đoán độ lệch chuẩn của quần thể, nhưng thường là không biết;
cho nên phải sử dụng độ lệch chuẩn S của mẫu thăm dò hay từ một nghiên cứu tương
tự có trước để tính cỡ mẫu;
- c : là mức chính xác của nghiên cứu, chính là sự khác biệt giữa trung bình
X thu được trên mẫu và trung bình µ thật trong quần thể; sự khác biệt này do người
nghiên cứu lựa chọn;
Ví dụ: Cần nghiên cứu trên mẫu về cân nặng sơ sinh của các bé trai trong năm
2007 tại tỉnh A; một nghiên cứu trên mẫu (n = 100 trẻ trai) về vấn đề này năm 2005
cho thấy: X = 3200g, s = 500g; chấp nhận mức chính xác của nghiên cứu là 100g; mức
tin cậy mong muốn là 95%; cỡ mẫu tối thiểu hợp lý sẽ là:

n= (1,96)2 × (500)2 ≈ 97
(100)2

Trên đây là cỡ mẫu cho các nghiên cứu quan sát mô tả;
Dưới đây sẽ trình bày một số công thức cho các nghiên cứu quan sát phân tích
và nghiên cứu thực nghiệm.
4.3. Cỡ mẫu cho nghiên cứu thuần tập
Câu hỏi luôn đặt ra cho mọi nghiên cứu là “cần phải nghiên cứu bao nhiêu đối
tượng để có thể đạt được kết quả mong đợi ”. Khi thiết kế nghiên cứu thuần tập cũng
phải trả lời câu hỏi đó. Với nghiên cứu thuần tập, n luôn tuỳ thuộc vào:
- α : sai số loại I: xác suất bác bỏ Ho (RR=1) trong khi Ho đúng;
- β : sai số loại II: xác suất chấp nhận Ho trong khi Ho sai;
- Tỷ lệ mới mắc ở nhóm không phơi nhiễm;

76
- Nguy cơ tương đối RR dự đoán.
Cho nên mọi công thức tính cỡ mẫu cho một nghiên cứu thuần tập đều luôn chứa
đựng các thông số nêu trên; và muốn tính được cỡ mẫu thì phải định trước các thông số
đó. Có thể dùng công thức của Schlesselman:

(Z [ ( )] )
2
α 2 pq + Z β p1 1 + RR − p1 1 + RR 2
n=
p1 (1 − RR )
2 2

Trong đó :
- n: số đối tượng cần thiết trong mỗi nhóm;
- Z α và Z β : tra từ bảng phân phối Z ;
Zα = 1,96 nếu α = 0,05 ;
Z β = 1,65 nếu β = 0,10 ;
- p1 : tỷ lệ mới mắc ở nhóm không phơi nhiễm;
1
- p = p1 (1 + RR ) ; và q =1 − p .
2
Ví dụ: Nếu chấp nhận α = 0,05 , β = 0,10 , và giả sử p1 = 0,008, và sau đó
p1 = 0,002 , có thể tính được cỡ mẫu n tuỳ thuộc vào RR như sau:

RR dự đoán p1 = 0,008, p1 = 0,002 ,


2 3887 15697
3 1289 5226
4 712 2899
5 487 1954
7 280 1155
10 168 703

Như vậy : - p1 càng nhỏ thì n phải càng lớn;


- RR có thể bộc lộ càng nhỏ thì n phải càng lớn.
4.4. Cỡ mẫu cho nghiên cứu bệnh chứng
Công thức của Schlesselman:

n=
(Z α 2u (1 − u ) + Z β f (1 − f ) + p3 q3 ) 2

(f − p3 )
2

Trong đó:
- n : số đối tượng cần thiết trong mỗi nhóm;
- Z α và Z β : tra từ bảng phân phối Z:
- f : tỷ lệ phơi nhiễm;
1  RR 
-u= f 1 + ;
2  1 + f ( RR − 1) 

77
fRR
- p3 =
[1 + f ( RR − 1) ] ;
- q3 = 1 − p 3 ;

Ví dụ: Chấp nhận : α = 0,05 ; β = 0,10 ; f = 0,30; có thể tính n tuỳ thuộc RR:

RR dự đoán f = 0,3
2 188
3 73
4 45
5 34
7 24
10 18
RR có thể bộc lộ càng nhỏ thì n phải càng lớn.

4.5. Cỡ mẫu cho nghiên cứu can thiệp


Macrae trình bày bảng tính sẵn cỡ mẫu n cho mỗi nhóm trong nghiên cứu can
thiệp; n tuỳ thuộc vào sai số loại I, loại II và sự khác nhau về kết quả của 2 can thiệp:
- Can thiệp A : can thiệp đã biết kết quả;
- Can thiệp B : can thiệp mới, dự đoán kết quả tốt hơn can thiệp A;
- α : sai lầm loại I : xác suất bác bỏ Ho trong khi Ho đúng;
- β : sai lầm loại II : xác suất chấp nhận Ho trong khi Ho sai;
( Ho : không có sự khác nhau về kết quả của 2 can thiệp A và B); thường chọn
α = β = 0,05 .
- D: sự khác nhau về kết quả của 2 can thiệp: có thể là tỷ lệ phần trăm,
có thể là phân số của độ lệch chuẩn, tuỳ vào biến nghiên cứu.
4.5.1. Giá trị D dưới dạng phần trăm :
Bảng : cỡ mẫu cho mỗi nhóm trong nghiên cứu can thiệp với α = β = 0,05
( giá trị D dưới dạng phần trăm)

Giá trị D
Tỷ lệ thành công
của can thiệp A
5% 10% 15% 25% 50%
5% 701 220 115 52 19
10% 1128 324 160 67 21
25% 2075 542 251 95 24
50% 2589 641 280 95 -
75% 1806 410 160 - -
90% 701 - - - -
Ví dụ :
Nếu tỷ lệ thành công của can thiệp A là 75% và d = 5% thì cần phải nghiên cứu
1806 đối tượng trong mỗi nhóm nếu α = β = 0,05 .

78
4.5.2. Giá trị D dưới dạng độ lệch chuẩn:
Bảng : Cỡ mẫu cho mỗi nhóm trong nghiên cứu can thiệp với α = β = 0,05
( giá trị D dưới dạng độ lệch chuẩn)

D n D n

0,16 1000 0,95 30


0,23 500 1,02 26
0,36 200 1,11 22
0,52 100 1,32 16
0,60 60 1,71 10
0,82 40 2,10 7

Ví dụ (của Kastelbaum) :
Giả sử thời gian sống trung bình của một loài chuột là 125 tuần với độ lệch
chuẩn 20 tuần; một can thiệp bằng tia X có thể làm giảm thơi gian sống của chuột; nếu
5
muốn phát hiện được sự giảm 5 tuần thì D = = 0,25 độ lệch chuẩn;
20
với D = 0,25 thì phải nghiên cứu 500 đối tượng trong mỗi nhóm.

79
BẢNG SỐ NGẪU NHIÊN

10347 81242 54237 47830 14309 03811 02339 15824


62345 80164 13387 63042 04736 81875 09086 84918
57668 07422 79716 92342 39648 54201 12307 20120
67015 68827 98912 83977 29847 93797 34722 28708
36283 79784 33025 81697 33254 33383 50361 75978
55866 32817 36969 38994 42853 32317 92865 33540
69534 38515 74323 62723 42768 45728 25454 24516
97409 87760 27354 52549 61977 17976 87474 77875
00905 91777 94373 48733 79688 05266 30331 96540
10731 38217 00252 84837 86644 60575 08220 30842
83219 96115 87128 88134 56039 04789 77119 45069
85563 08858 91872 82309 44923 53422 54141 46367
04928 68671 70215 16585 87309 60063 24182 56908
43105 80571 31869 56940 34376 31135 83453 19234
52262 35954 60560 84199 05865 81436 62723 73125
44163 39334 24705 34712 70991 83012 31553 22885
01762 36247 15408 20976 44133 76487 67438 36070
10622 72571 92283 51674 58183 82486 27401 50038
21687 48047 68835 61150 68582 86993 71551 64538
72005 96260 96382 98559 34991 42317 96840 46302
48977 51839 25511 19005 28907 68216 48859 87504
06636 42542 01208 26486 34318 22036 17945 07995
48393 80704 25749 32934 30569 18154 71595 01489
11011 07502 63076 70490 63323 85238 03724 70326
00441 29608 10669 83143 12853 33939 43893 34830
22539 33440 05274 58865 04486 05836 10857 42014
69428 79218 69384 08697 50724 27186 66327 54830
76833 41926 41642 30052 22811 48325 63545 56267
93092 96685 15674 28554 75784 93604 40430 71889
15306 29811 21251 31591 94832 25038 32750 65690
20173 91869 31636 58724 07206 20173 91869 14309
98383 08409 89765 41036 09538 98383 08409 04736
89346 90068 83147 40757 58153 89346 90068 39648
56017 37731 32275 93574 32589 56017 37731 29847
91202 58841 44396 68511 07135 91202 58841 33254
10347 81242 54237 47830 14309 03811 02339 15824
62345 80164 13387 63042 04736 81875 09086 84918
57668 07422 79716 92342 39648 54201 12307 20120
67015 68827 98912 83977 29847 93797 34722 28708
36283 79784 33025 81697 33254 33383 50361 75978

– 

80

You might also like