You are on page 1of 9

PGS. TS.

Nguyễn Hoàng Lộc

Bài giảng

Thống kê sinh học

Huế 1998
Chương 1. Những khái niệm cơ bản của Thống kê sinh học 2

Chương 1
Những khái niệm cơ bản của
Thống kê sinh học

1. Tần suất và xác suất


Đối tượng nghiên cứu của thống kê sinh học là các đại lượng biến thiên. Các
đại lượng này có thể là những đặc điểm hoặc các quá trình sinh học, như: trọng
lượng, kích thước, màu sắc, thành phần hóa học, tốc độ, cường độ... Quy luật biến
thiên và sự phân bố của các đại lượng trong phạm vi một nhóm đồng nhất được
phát hiện dựa trên lý thuyết về xác suất.

1.1. Tần suất


Giả sử xét 1 phép thử ngẫu nhiên và biến cố A quan sát được trong phép thử
đó. Phép thử được lặp lại n lần (n ≥ 1).
Giả sử kn(A) là số các phép thử có xảy ra biến cố A.
- Định nghĩa
k n ( A)
Tỷ số Vn ( A) = được gọi là tần suất của biến cố A trong dãy n phép
n
thử.
- Tính chất
Tần suất Vn(A) có các tính chất sau:
(1). 0 ≤Vn ( A) ≤1
(2). Vn (Ω) =1, Ωlà biến cố chắc chắn.
(3). Nếu A và B là các biến cố xung khắc tức A ∩ B = ∅ , thì:
Vn ( A ∪ B ) = Vn ( A) +Vn ( B )

Từ những tính chất trên có thể thấy rằng kn(A) ≤ n và kn(Ω) = n. Nếu A và B
xung khắc thì kn(A ∪ B) = kn(A) + kn(B).

1.2. Xác suất


Bài giảng Thống kê sinh học 3

Từ khái niệm tần suất ta có định nghĩa xác suất theo quan điểm thống kê.
- Định nghĩa
Nếu với n đủ lớn, tần suất của biến cố A rất gần một giá trị cố định p thì ta
nói rằng biến cố A là ổn định ngẫu nhiên và số p được gọi là xác suất của biến cố A,
kí hiệu p = P(A).
- Tính chất
Xác suất P(A) có những tích chất sau:
(1). 0 ≤ P(A) ≤ 1
(2). P(Ω) = 1
(3). Nếu A và B là 2 biến cố xung khắc, A ∩ B = ∅, A ⊂ Ω, B ⊂ Ω, thì:

P ( A ∪ B ) = P ( A) + P ( B )

Tần suất cũng biến thiên giữa 0 và 1 như xác suất. Nếu tăng số lần thí
nghiệm thì tần suất tiến dần tới xác suất. Như vậy, có một mối quan hệ giữa tần suất
và xác suất, biết tần suất có thể dự đoán xác suất và ngược lại.
- Ví dụ: Theo quy luật Mendel thì ở thế hệ lai thứ hai (F2) xác suất những cá
thể có tính trội là 0,75. Vậy trong 1000 con lai ở F2 có hy vọng tìm thấy khoảng 750
cá thể có tính trội.

2. Tập hợp và chuỗi biến thiên


2.1. Tập hợp
Khái niệm tập hợp được coi là khái niệm nguyên thủy không định nghĩa
(tương tự các khái niệm về điểm, đường thẳng trong hình học sơ cấp). Các danh từ
đồng nghĩa là họ, hệ, lớp, đám, quần thể...
Nói chung, nhiều hiện tượng hoặc đặc điểm nghiên cứu gộp chung lại được
gọi là một tập hợp (hay tập số liệu kết quả thực nghiệm). Những hiện tượng hoặc
đặc điểm nghiên cứu được biểu diễn bằng một đại lượng gọi là biến số, ký hiệu N
(x1, x2,... xn). Biến số có thể thuộc loại số lượng như kích thước, trọng lượng, hàm
lượng... hoặc thuộc loại chất lượng như màu sắc, hình dạng, giới tính, trạng thái
sinh lý... Lại có thể thuộc loại liên tục như độ dài, thể tích... hoặc thuộc loại gián
đoạn như số trứng, số người, số gia súc...
Chương 1. Những khái niệm cơ bản của Thống kê sinh học 4

Muốn tiến hành phân tích một tập hợp bằng phương pháp thống kê, trước hết
phải sắp xếp các biến số theo một trật tự nào đó. Ví dụ:
+ Trường hợp đặc điểm chất lượng
Bảng 1.1. Số thỏ sắp xếp theo đặc điểm màu lông
N Số lượng n %
Thỏ trắng 140 70
Thỏ vá 60 30
Tổng số 200 100

Bảng 1.2. Số thỏ sắp xếp theo độ phát triển bộ lông
N Số lượng n %
Lông thưa 20 10
Lông trung bình 80 40
Lông dày 60 30
Lông rất dày 40 20
Tổng số 200 100

+ Trường hợp đặc điểm số lượng


Bảng 1.3. Kết quả phân tích hàm lượng glucose (mM/L) trong 100 mẫu máu (N=100)
4,35 3,71 4,31 3,93 4,60 4,38 4,10 4,11 3,87 3,82
4,12 4,05 4,08 4,14 3,94 4,36 3,84 4,31 4,05 4,03
4,46 3,70 3,65 3,67 4,32 3,69 4,03 4,27 3,94 3,56
4,45 4,21 4,23 3,82 4,55 4,04 4,58 4,31 4,23 3,81
4,73 4,35 4,00 4,16 4,60 4,40 4,20 4,62 3,95 3,93
4,10 3,89 4,58 4,17 4,55 3,98 4,37 3,80 4,32 4,28
3,64 3,67 4,30 4,30 4,82 4,38 4,58 4,08 4,03 4,03
4,15 4,80 4,42 4,18 4,58 4,00 4,14 4,05 3,91 3,40
3,96 4,16 3,90 4,56 4,19 4,08 4,88 3,85 4,18 4,27
3,65 4,07 4,36 3,93 4,52 4,16 4,21 4,21 4,23 4,72
2.2. Chuỗi biến thiên
2.2.1. Chuỗi biến thiên của biến số gián đoạn
Một chuỗi biến thiên trình bày thành 2 dãy có nhiều hàng trị số, mỗi hàng
ứng với một biến số và tần số của nó, bắt đầu từ biến số cực tiểu ở hàng thứ nhất
(trong ví dụ ở bảng 1.5 là 7) theo thứ tự lớn dần cho tới biến số cực đại ở hàng cuối
cùng (trong ví dụ ở bảng 1.5 là 17). Xem chuỗi biến thiên có thể biết được giới hạn
Bài giảng Thống kê sinh học 5

biến thiên của đặc điểm, xác định được đặc điểm có tần số lớn nhất (thường gặp
nhất).
Bảng 1.4. Số lợn con sinh ra của 70 lợn nái
9 11 12 16 14 10 15 12 11 13
13 16 13 11 14 12 9 13 12 14
12 15 12 14 15 12 11 10 7 11
12 14 11 8 13 10 12 14 13 12
10 12 12 13 10 16 17 9 15 11
13 14 15 12 13 11 12 8 12 13
14 11 9 13 12 14 12 11 12 10

Bảng 1.5. Phân bố số lượng của 70 đàn lợn con (ứng với 70 lợn mẹ)
N f
7 1
8 2
9 4
10 6
11 10
12 18
13 11
14 9
15 5
16 3
17 1
n = 70
2.2.2. Chuỗi biến thiên của biến số liên tục
Lập chuỗi biến thiên trong trường hợp này phức tạp hơn.
- Ví dụ: Cần nghiên cứu chiều cao của 25 cây ươm trong phòng thí nghiệm.
Kết quả trình bày ở bảng 1.6.
Bảng 1.6. Chiều cao của 25 cây ươm (cm)
5,2 6,6 7,0 7,4 8,1
5,8 6,8 7,3 7,6 8,3
6,2 6,8 7,3 7,7 8,4
6,2 6,9 7,3 7,8 8,7
Chương 1. Những khái niệm cơ bản của Thống kê sinh học 6

6,4 7,0 7,4 7,8 9,4

- Cần xác định số lượng hàng là bao nhiêu và nên chọn giới hạn của hàng
đầu như thế nào.
- Theo bảng 1.6: biến số cực tiểu là 5,2 cm; biến số cực đại là 9,4 cm. Biên
độ biến thiên bằng: 9,4 - 5,2 = 4,2 cm.
- Giả sử muốn lập 9 hàng thì khoảng cách giữa mỗi hàng sẽ là:
max − min 4,2
K = = ≈ 0,5 cm
RN − 1 8
Trong đó: RN là số hàng.
Bảng 1.7. Phân bố của 25 cây ươm theo chiều cao
N W f N W f
5,0-5,4 5,25 1 5,0-5,9 5,5 2
5,5-5,9 5,75 1 6,0-6,9 6,5 7
6,0-6,4 6,25 3 7,0-7,9 7,5 11
6,5-6,9 6,75 4 8,0-8,9 8,5 4
7,0-7,4 7,25 7 9,0-9,9 9,5 1
7,5-7,9 7,75 4
8,0-8,4 8,25 3
8,5-8,9 8,75 1
9,0-9,4 9,25 1
K = 0,5 cm n = 25 K = 1,0 cm n = 25
K
- Cách tính trung số của mỗi hàng W = M + , trong đó M là giá trị đầu của
2
hàng (Bảng 1.7, nữa trái). Muốn rút bớt số hàng thì tăng trị số khoảng cách giữa
chúng. Bớt số hàng thì có lợi là làm cho phép tính đơn giản hơn, nhưng bất lợi là
làm cho kết quả kém chính xác (Bảng 1.7, nữa phải).
- Có thể lấy số lượng bao nhiêu hàng thì vừa, điều này phụ thuộc chủ yếu
vào số đơn vị của tập hợp n. Trong thực hành có thể theo quy ước sau:

Số n Số hàng


Từ 25 đến 40 5-6
40-60 6-8
60-100 7-10
Bài giảng Thống kê sinh học 7

100-200 8-12
200-500 hoặc hơn 10-15

3. Cách biểu diễn các chuỗi biến thiên bằng sơ đồ


3.1. Biểu đồ

20

16

12

0
7 8 9 10 11 12 13 14 15 16 17

f 1 2 4 6 10 18 11 9 5 3 1

3.2. Đường biến thiên

20

16

12

0
7 8 9 10 11 12 13 14 15 16 17

f 1 2 4 6 10 18 11 9 5 3 1
Chương 1. Những khái niệm cơ bản của Thống kê sinh học 8

3.3. Đường tích lũy

80

60

40

20

0
7 8 9 10 11 12 13 14 15 16 17

f 1 2 4 6 10 18 11 9 5 3 1

∑f 1 3 7 13 23 41 52 61 66 69 70

3.4. Đường bao

Σf f x

68 2 17

66 2 16

64 2 15
62 9 14

53 16 13

37 17 12

20 10 11

10 5 10
5 2 9
3 2 8
1 1 7
Bài giảng Thống kê sinh học 9

10 20 30 40 50 60 70 Σf

You might also like