Professional Documents
Culture Documents
Bài giảng
Huế 1998
Chương 1. Những khái niệm cơ bản của Thống kê sinh học 2
Chương 1
Những khái niệm cơ bản của
Thống kê sinh học
Từ những tính chất trên có thể thấy rằng kn(A) ≤ n và kn(Ω) = n. Nếu A và B
xung khắc thì kn(A ∪ B) = kn(A) + kn(B).
Từ khái niệm tần suất ta có định nghĩa xác suất theo quan điểm thống kê.
- Định nghĩa
Nếu với n đủ lớn, tần suất của biến cố A rất gần một giá trị cố định p thì ta
nói rằng biến cố A là ổn định ngẫu nhiên và số p được gọi là xác suất của biến cố A,
kí hiệu p = P(A).
- Tính chất
Xác suất P(A) có những tích chất sau:
(1). 0 ≤ P(A) ≤ 1
(2). P(Ω) = 1
(3). Nếu A và B là 2 biến cố xung khắc, A ∩ B = ∅, A ⊂ Ω, B ⊂ Ω, thì:
P ( A ∪ B ) = P ( A) + P ( B )
Tần suất cũng biến thiên giữa 0 và 1 như xác suất. Nếu tăng số lần thí
nghiệm thì tần suất tiến dần tới xác suất. Như vậy, có một mối quan hệ giữa tần suất
và xác suất, biết tần suất có thể dự đoán xác suất và ngược lại.
- Ví dụ: Theo quy luật Mendel thì ở thế hệ lai thứ hai (F2) xác suất những cá
thể có tính trội là 0,75. Vậy trong 1000 con lai ở F2 có hy vọng tìm thấy khoảng 750
cá thể có tính trội.
Muốn tiến hành phân tích một tập hợp bằng phương pháp thống kê, trước hết
phải sắp xếp các biến số theo một trật tự nào đó. Ví dụ:
+ Trường hợp đặc điểm chất lượng
Bảng 1.1. Số thỏ sắp xếp theo đặc điểm màu lông
N Số lượng n %
Thỏ trắng 140 70
Thỏ vá 60 30
Tổng số 200 100
Bảng 1.2. Số thỏ sắp xếp theo độ phát triển bộ lông
N Số lượng n %
Lông thưa 20 10
Lông trung bình 80 40
Lông dày 60 30
Lông rất dày 40 20
Tổng số 200 100
biến thiên của đặc điểm, xác định được đặc điểm có tần số lớn nhất (thường gặp
nhất).
Bảng 1.4. Số lợn con sinh ra của 70 lợn nái
9 11 12 16 14 10 15 12 11 13
13 16 13 11 14 12 9 13 12 14
12 15 12 14 15 12 11 10 7 11
12 14 11 8 13 10 12 14 13 12
10 12 12 13 10 16 17 9 15 11
13 14 15 12 13 11 12 8 12 13
14 11 9 13 12 14 12 11 12 10
Bảng 1.5. Phân bố số lượng của 70 đàn lợn con (ứng với 70 lợn mẹ)
N f
7 1
8 2
9 4
10 6
11 10
12 18
13 11
14 9
15 5
16 3
17 1
n = 70
2.2.2. Chuỗi biến thiên của biến số liên tục
Lập chuỗi biến thiên trong trường hợp này phức tạp hơn.
- Ví dụ: Cần nghiên cứu chiều cao của 25 cây ươm trong phòng thí nghiệm.
Kết quả trình bày ở bảng 1.6.
Bảng 1.6. Chiều cao của 25 cây ươm (cm)
5,2 6,6 7,0 7,4 8,1
5,8 6,8 7,3 7,6 8,3
6,2 6,8 7,3 7,7 8,4
6,2 6,9 7,3 7,8 8,7
Chương 1. Những khái niệm cơ bản của Thống kê sinh học 6
- Cần xác định số lượng hàng là bao nhiêu và nên chọn giới hạn của hàng
đầu như thế nào.
- Theo bảng 1.6: biến số cực tiểu là 5,2 cm; biến số cực đại là 9,4 cm. Biên
độ biến thiên bằng: 9,4 - 5,2 = 4,2 cm.
- Giả sử muốn lập 9 hàng thì khoảng cách giữa mỗi hàng sẽ là:
max − min 4,2
K = = ≈ 0,5 cm
RN − 1 8
Trong đó: RN là số hàng.
Bảng 1.7. Phân bố của 25 cây ươm theo chiều cao
N W f N W f
5,0-5,4 5,25 1 5,0-5,9 5,5 2
5,5-5,9 5,75 1 6,0-6,9 6,5 7
6,0-6,4 6,25 3 7,0-7,9 7,5 11
6,5-6,9 6,75 4 8,0-8,9 8,5 4
7,0-7,4 7,25 7 9,0-9,9 9,5 1
7,5-7,9 7,75 4
8,0-8,4 8,25 3
8,5-8,9 8,75 1
9,0-9,4 9,25 1
K = 0,5 cm n = 25 K = 1,0 cm n = 25
K
- Cách tính trung số của mỗi hàng W = M + , trong đó M là giá trị đầu của
2
hàng (Bảng 1.7, nữa trái). Muốn rút bớt số hàng thì tăng trị số khoảng cách giữa
chúng. Bớt số hàng thì có lợi là làm cho phép tính đơn giản hơn, nhưng bất lợi là
làm cho kết quả kém chính xác (Bảng 1.7, nữa phải).
- Có thể lấy số lượng bao nhiêu hàng thì vừa, điều này phụ thuộc chủ yếu
vào số đơn vị của tập hợp n. Trong thực hành có thể theo quy ước sau:
100-200 8-12
200-500 hoặc hơn 10-15
20
16
12
0
7 8 9 10 11 12 13 14 15 16 17
f 1 2 4 6 10 18 11 9 5 3 1
20
16
12
0
7 8 9 10 11 12 13 14 15 16 17
f 1 2 4 6 10 18 11 9 5 3 1
Chương 1. Những khái niệm cơ bản của Thống kê sinh học 8
80
60
40
20
0
7 8 9 10 11 12 13 14 15 16 17
f 1 2 4 6 10 18 11 9 5 3 1
∑f 1 3 7 13 23 41 52 61 66 69 70
Σf f x
68 2 17
66 2 16
64 2 15
62 9 14
53 16 13
37 17 12
20 10 11
10 5 10
5 2 9
3 2 8
1 1 7
Bài giảng Thống kê sinh học 9
10 20 30 40 50 60 70 Σf