You are on page 1of 23

BÀI GIẢNG THỐNG KÊ SINH HỌC

BÀI GIẢNG THỐNG KÊ SINH HỌC


nguyên bản tiếng Anh: Nguyễn Văn Tuấn
người dịch: Phan Văn Song

THAY LỜI NÓI ĐẦU


Hơn một thế kỉ trước, nhà toán học Pháp Pierre Louis đã xây dựng và cổ vũ "phương pháp số" dùng để
thẩm định việc điều trị. Tuy nhiên, ông đã bị hầu hết các thầy thuốc hàng đầu lúc bấy giờ phản đối. Đáng
tranh cãi là Claude Bernard, cha đẻ của y học thưc nghiệm hiện đại đã phê phán việc áp dụng toán học
vào y học; ông tuyên bố: các nhà toán học cào bằng quá nhiều và suy luận về các hiện tượng như họ vẽ
ra trong đầu chứ không như chúng tồn tại trong tự nhiên. Ông không ngừng kêu gọi các thầy thuốc "từ
khước việc dùng thống kê làm cơ sở cho khoa học thực nghiệm về điều trị và bệnh lí.” Trớ trêu thay, gần
100 năm sau, các học trò của ông đã vứt bỏ hoàn toàn lời khuyên của ông. Thống kê đã trở nên một
phần thiết yếu trong nghiên cứu y học. Ngày nay hầu như mọi công bố y học đều có phần "phương pháp
thống kê" để chứng tỏ tính đáng tin cậy của công trình.

Tuy nhiên, trong những năm gần đây, việc sử dụng phổ biến thống kê đã trở thành việc lạm dụng phổ
biến thống kê. Y văn bị nhét đầy với thông tin thống kê bề bộn và với những phát hiện mâu thuẫn không
dứt. Có nhiều bằng chứng hùng hồn cho thấy rằng việc sử dụng không phù hợp và thao tác chưa thuần
thục về các số liệu thống kê đã góp phần đáng kể vào bi kịch về sự nhầm lẫn này của tri thức. Nhiều
người viết sách và các bài báo dựa trên ứng dụng không phù hợp của thống kê. Một số tác giả rất được
nhiều người biết đến vì họ chẳng ngại ngùng tung ra các lời giải cho các vấn đề chưa được giải quyết.
Tuy nhiên, một số nhà điều tra không nhận ra rằng họ đã phạm các lỗi lầm trong thống kê hoặc do dốt nát
hoặc do thiếu kiến thức thống kê. Dù với lí do gì, dựa vào phân tích thống kê khi không hiểu bản chất của
nó là bước đầu tiên trong việc đánh mất tính trung thực trí tuệ. Vì vậy, hiểu biết nguyên tắc đứng phía sau
một phân tích thống kê là rất quan yếu trong việc giải thích dữ liệu.

Mười một chủ đề thống kê sinh học sau đây tiêu biểu cho một tập hợp các nguyên lí thống kê, định lí, tiên
đề và định nghĩa sơ đẳng được trình bày dưới dạng gần như phi kĩ thuật. Các chủ đề được chia thành
hai phần: phần một bàn về xác suất và các khái niệm thống kê; phần hai bàn về thống kê ứng dụng, trong
đó sẽ thảo luận về phân tích thống kê dữ liệu và các kết luận. Do đối tượng dự kiến của khóa học này là
những người nghiên cứu với ít hoặc không có kiến thức thống kê, do đó, tất cả các phát biểu thống kê
trong các bài học này được trình bày không có chứng minh toán học kèm theo.

Bất kì việc học tập nào cũng sẽ không đầy đủ nếu không có một sự tiêu hóa nào đó các nguyên lí bộ
môn. Để minh họa cho ý tưởng và nguyên lí đằng sau mỗi chủ đề, tôi cũng có trình bày một bộ sưu tập
các bài tập và các bài toán để giải hay thảo luận. Một số câu hỏi có thể được xếp loại như là "bài tập"
nhằm mục đích minh họa nguyên tắc cơ bản; các câu hỏi khác có thể được xếp loại như là "bài toán" mà
thông thường sẽ đòi hỏi nhiều kĩ năng hơn để giải quyết chúng. Hầu hết những câu hỏi này đã được trích
ra từ các tạp chí y học và kinh nghiệm của cuộc sống thực. Nếu bạn không thể giải được một câu hỏi,
đừng tuyệt vọng. Phương pháp giảng dạy của Socrate không nhằm vào việc luyện tập để người ta đưa ra
nhanh chóng những câu trả lời, nhưng để giáo dục qua các câu hỏi. Nếu đã nỗ lực nhiều lần nhưng
không thành công, bạn có thể liên hệ với tôi và chúng ta hi vọng sẽ có cách xử lí nó. Hãy nhớ rằng các lời
giải cho bất kì bài toán có giá trị nào hiếm khi đến với chúng ta một cách dễ dàng mà không cần sự làm
việc chăm chỉ, đó phải là kết quả của nỗ lực trí tuệ trong nhiều ngày, nhiều tuần, hoặc nhiều tháng, thậm

1
BÀI GIẢNG THỐNG KÊ SINH HỌC

chí nhiều năm. Vâng, không có câu hỏi nào trong khóa học này đòi hỏi bạn mất nhiều năm hay nhiều
tháng để giải, nhưng có thể phải mất nhiều giờ để giải ra.

Sự xuất hiện của máy tính điện tử chắc chắn đã cách mạng hóa việc thực hành thống kê . Máy tính đã
thay thế bút chì để giải các phương trình phức tạp khi phân tích dữ liệu. Tuy nhiên, thống kê không chỉ là
một tập hợp các định lí hoặc công thức, nó là một phong cách tư duy. Máy tính cũng là một phong cách
tư duy. Vì vậy, tôi không tin rằng số liệu thống kê có thể được rút gọn thành một cái nhấn nút trên máy
tính mà vẫn giữ được phong cách suy nghĩ, mặc dù có những người tuyên bố đã làm như vậy. Với niềm
tin này trong đầu, hầu hết các bài tập trong khóa học này có dụng ý để giải bằng tay với sự trợ giúp của
một máy tính hoặc một phần mềm bảng tính (spreadsheet) nói chung - không phải bởi một phần mềm
thống kê. Tôi luôn luôn tin rằng trong làm bài tập, một lời giải bằng tay sẽ thú vị hơn và trọn vẹn hơn một
lời giải "tự động".

Các bài giảng này là kết quả từ nỗ lực của một người thiếu kinh nghiệm. Nó khó có thể hoàn hảo và còn
rất nhiều vấn đề bỏ ngõ. Hơn nữa, tài liệu này đã được viết trong một thời gian rất ngắn và do đó sai sót
là không thể tránh khỏi. Nếu bạn tìm thấy xin vui lòng cho tôi biết để chỉnh lại cho đúng.

Chúc may mắn.

2
BÀI GIẢNG THỐNG KÊ SINH HỌC

Chủ đề 1: MỘT SỐ KIẾN THỨC TOÁN HỌC CƠ BẢN


Ngay cả một người chậm trí mà được đào tạo và luyện tập trong số
học, nếu anh ta không thu được cái gì khác từ nó, ít ra cũng hoàn
thiện và trở nên sắc nét hơn trước.
Plato

Nhà thông thái Bertrand Russell gần đây đã viết trong một cuốn sách của ông: "có một lối đi dẫn qua các
cánh đồng ở New Southgate, và tôi thường đi đến đó một mình đề ngắm hoàng hôn và dự định tự tử. Tuy
nhiên tôi không tự tử bởi vì tôi muốn tìm hiểu thêm về toán học”. Tôi chắc chắn hầu hết chúng ta sẽ
không phủ nhận sức mạnh của toán học, nhưng có thể có nhiều hơn một người trong chúng ta đã không
ưa môn học này. Nếu chúng ta suy nghĩ nghiêm túc về toán học, chúng ta thấy rằng nó là cơ sở cho tất
cả mọi thứ mà chúng ta làm hiện nay. Không ngạc nhiên rằng toán học được coi là hoàng tử của khoa
học. Một trong những đồng nghiệp của tôi ở viện Garvan mô tả ý tưởng toán học như là “chân lí vĩnh cửu
". Tôi thích cách mô tả đó. Trong hầu hết các khoa học, đặc biệt là khoa sinh học, tốc độ các "khám phá"
làm ta chóng mặt; rủi thay, những cái gọi là khám phá thường phá đổ những ý tưởng mà người khác đã
cố xây dựng nên. Thậm chí tệ hơn, cái người này thiết lập lại bị người khác dỡ bỏ đi. Riêng trong toán
học mỗi thế hệ lại thêm một câu chuyện mới vào cấu trúc cũ (thường trực), bởi vì đơn giản ý tưởng là vô
tận.

Thống kê thường được định nghĩa như là một ngành của toán học ứng dụng, tới lượt mình nó lại là một
ngành hiện đại của của toán học hiện đại. Trong thực hành, toán học hiện đại là một trong những công cụ
chủ yếu của thống kê. Vì vậy, để hiểu thống kê, có được một số kiến thức về toán học sơ đẳng là một
điều bắt buộc. Trong chủ đề này, chúng ta sẽ khảo sát một số ý tưởng cơ bản của toán học hiện đại như
các khái niệm về hàm số, phương trình, các phép toán lấy tổng, v.v… trước khi đi vào các cuộc thảo luận
thống kê.

3
BÀI GIẢNG THỐNG KÊ SINH HỌC

0. BẢNG CHỮ HI LẠP THÔNG DỤNG VÀ CÁC KÍ HIỆU TOÁN


A. CÁC CHỮ CÁI HI LẠP THÔNG DỤNG
Trong thống kê, gần như quy ước người ta kí hiệu các tham số của một quần thể (dân số) bằng chữ cái
Hi Lạp và các tham số tương ứng bằng chữ cái Latin, Chữ cái Latin mọi người đều quen thuộc trong khi
chữ cái Hi Lạp có lẽ cần phải ôn lại. Bảng sau đây liệt kê các chữ cái Hi Lạp thông dụng nhất mà ta sẽ
dùng hoặc gặp trong các bài học sau này.

CHỮ IN CHỮ THƯỜNG CÁCH ĐỌC


Α α alpha
Β β beta
Χ χ chi
Γ δ delta
Δ ε epsilon
Φ φ phi
Γ γ gamma
Μ μ mu(y)
Ν ν nu(y)
Π π pi
Θ θ theta
Ρ ρ rho
΢ ζ sigma
Λ λ lambda
Κ κ kappa

B. CÁC KÍ HIỆU TOÁN THÔNG DỤNG


Và tất nhiên, việc học toán không thể hoàn thành nếu không thể giao tiếp bằng ngôn ngữ toán học. Đây
là một số trong những kí hiệu thường được sử dụng trong toán học đòi hỏi bạn phải thông thạo:

KÍ HIỆU Ý NGHĨA
─────────────────────────────────────────────────
∈ thuộc về
∉ không thuộc về
⇒ bao hàm / suy ra rằng
⇐ được suy ra từ
⇔ tương đương với / nếu và chỉ nếu
N số tự nhiên
Z số nguyên
Q số hữu tỉ
R số thực
[a, b] khoảng đóng a, b (tập hợp các số x ∈ R: a ≤ x ≤ b)
(a, b) khoảng mở a, b (tập hợp các số x ∈ R: a < x < b)
[a,b) khoảng nửa mở (đóng) a, b (tập hợp các số x ∈ R: a ≤ x < b)
(a,b] khoảng nửa đóng(mở) a, b (tập hợp các số x ∈ R: a < x ≤ b)
∀ với mọi
∃ tồn tại

4
BÀI GIẢNG THỐNG KÊ SINH HỌC

I. KÍ HIỆU TỔNG Σ
Nhiều tính toán thống kê dính dáng tới kí hiệu này. Trước khi đi vào thống kê chúng ta cần quen thuộc
với kí hiệu sigma Σ, đây là một cách viết tắt của tổng.
Ví dụ, thay vì viết x1 + x2 + x3 + x4 + x5 ta viết
5

𝑥𝑖
𝑖=1
(đọc là tổng của x chỉ số i, với i chạy từ 1 đến 5).

Hay
5
𝑥0 + 𝑥2 + 𝑥4 + ⋯ + 𝑥10 = 𝑥2𝑖
𝑖=0
Tương tự, chúng ta cũng có thể viết
𝑛

𝑥1 + 𝑥 2 + 𝑥 3 + ⋯ + 𝑥 𝑛 = 𝑥𝑘
𝑘 =1

Lưu ý rằng 𝑛𝑖=1 𝑥𝑖 = 𝑛𝑘 =1 𝑥𝑘 vì chúng đều là cách viết tắt của tổng 𝑥1 + 𝑥2 + 𝑥3 + … + 𝑥𝑛 tức là tên gọi
của chỉ số là không quan trọng.

Ngoài ra trong trường hợp không có nhầm lẫn về các giá trị đầu và cuối của chỉ số, thay vì viết đầy đủ
𝑏
𝑖=𝑎 𝑥𝑖 ta có thể viết ngắn gọn là 𝑖 𝑥𝑖 hay đơn giản hơn là 𝑥𝑖 .

Dễ dàng suy ra các đẳng thức sau đây:


𝑛

𝑎 = 𝑛𝑎
𝑖=1
𝑛 𝑛

𝑘𝑥𝑖 = 𝑘 𝑥𝑖
𝑖=1 𝑖=1

𝑛 𝑛 𝑛

(𝑥𝑖 + 𝑦𝑖 ) = 𝑥𝑖 + 𝑥𝑖
𝑖=1 𝑖=1 𝑖=1

Ví dụ: cho cấp số nhân xi = aq i , i = 0, 1, 2, 3, ..... Ta đã biết: tổng của n số hạng đầu tiên của cấp số này
có công thức là:
𝑛 𝑛 𝑛
𝑖
𝑎(1 − 𝑞 𝑛+1 )
𝑆𝑛 = 𝑥𝑖 = 𝑎𝑞 = 𝑎 𝑞𝑖 =
1−𝑞
𝑖=0 𝑖=0 𝑖=0

5
BÀI GIẢNG THỐNG KÊ SINH HỌC

𝑎
Giả sử |q| < 1, khi n → ∞ thì qn+1 → 0, do đó 𝑆𝑛 → , từ đó khá hợp lí khi nói rằng tổng vô hạn các số
1−𝑞
𝑎
hạng của cấp số nhân này là 𝑆 = và ta viết:
1−𝑞

𝑎
𝑆= 𝑎𝑞 𝑖 =
1−𝑞
𝑖=0

Tổng quát, người ta cũng đã mở rộng kí hiệu cho tổng vô hạn các số hạng khi tổng này “tính được” như
trong ví dụ trên:

𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥2 + … + 𝑥𝑛−1 + 𝑥𝑛 + …
𝑖=1

Ví dụ: Ta có:
∞ ∞
1 𝑥𝑘
= 1, = 𝑒𝑥
2𝑘 𝑘!
𝑘=1 𝑘=0

Hiển nhiên nhiều biểu thức cũng có thể viết đơn giản hơn bằng kí hiệu này. Một số đẳng thức thú vị khác
sẽ được đưa vào phần bài tập để các bạn tự làm.

II. KÍ HIỆU TÍCH Π


1.1. KÍ HIỆU GIAI THỪA
Giả sử chúng ta có n vật, người ta có thể chứng mình rằng số các cách sắp xếp (hoán vị) n vật này trên
một đường thẳng là n! (đọc là n giai thừa), kí hiệu này được định nghĩa như sau:

n! = n(n – 1)(n – 2)(n – 3). ... .3.2.1

Để tiện trình bày các kết quả tổng quát người ta cũng quy ước thêm: 0! = 1! =1.

Ví dụ: 3! = 3 × 2 × 1 = 6
5! = 1× 2 ×3 ×4 × 5 = 120

Như chúng ta có thể thấy, với n lớn thì n! sẽ hết sức lớn và có thể không tính nổi bằng các máy tính cầm
tay, lúc đó ta có thể dùng công thức tính xấp xỉ sau đây:

𝑛! ≈ 2𝜋𝑛𝑛𝑛 𝑒 −𝑛
Trong đó e ≈ 2.71828…là cơ số của logarit tự nhiên và π≈ 3.14158… Công thức này được gọi là công
thức xấp xỉ Stirling.

2.2. KÍ HIỆU TÍCH Π


Kí hiệu này được định nghĩa như sau:
𝑛

𝑥𝑖 = 𝑥1 𝑥2 𝑥3 … 𝑥𝑛
𝑖=1

6
BÀI GIẢNG THỐNG KÊ SINH HỌC

Theo đó:
𝑛

𝑘 = 𝑘𝑛
𝑖=1

𝑛 𝑛
𝑛
𝑘𝑥𝑖 = 𝑘 𝑥𝑖
𝑖=1 𝑖 =1
Cũng có thể chứng minh được:
𝑛 𝑛 𝑛

𝑥𝑖 𝑦𝑖 = 𝑥𝑖 𝑦𝑗
𝑖=1 𝑖=1 𝑗 =1
Với kí hiệu tích ta có thể viết lại định nghĩa giai thừa trên đây như sau:
𝑛

𝑛! = (𝑛 + 1 − 𝑘)
𝑘=1
hay cũng có thể viết cách khác là
𝑛 −1

𝑛! = 𝑛−𝑘
𝑘=0
hoặc đơn giản hơn là
𝑛

𝑛! = 𝑘.
𝑘=1
Việc kiểm chứng các đẳng thức này hoặc viết lại dưới dạng khác hơn nữa xem như bài tập nhỏ dành cho
các bạn.

Người ta cũng mở rộng kí hiệu này cho tích vô hạn các thừa số như ở kí hiệu tổng miễn là tích đó “tính
được”:

𝑥𝑛 = 𝑥1 𝑥2 𝑥3 … 𝑥𝑛 −1 𝑥𝑛 𝑥𝑛+1 …
𝑛=1

III. HỆ THỐNG SỐ THỰC


Trong phần này, chúng ta sẽ ôn lại ngắn gọn cấu trúc của hệ thống số thực.

3.1. Số tự nhiên:
Các số 1, 2, 3, và cứ thế tiếp tục được gọi là số tự nhiên.1]

Tập hợp các số tự nhiên được kí hiệu là N.

N = {1, 2, 3, … n, ... }

1
Để thuận tiện, nhiều tác giả coi tập số tự nhiên N có chứa cả số 0.
7
BÀI GIẢNG THỐNG KÊ SINH HỌC

Nếu chúng ta cộng hoặc nhân hai số tự nhiên bất kì, kết quả luôn luôn là một số tự nhiên. Tuy nhiên, nếu
chúng ta trừ hoặc chia hai số tự nhiên, kết quả không luôn luôn là một số tự nhiên. Chẳng hạn, 8 - 5 = 3
và 8 ÷ 2 = 4 là số tự nhiên, nhưng 5 - 8 = -3 và 2 ÷ 7 không cho kết quả trong số tự nhiên.
Như vậy, trong hệ thống số tự nhiên, chúng ta có thể cộng và nhân, nhưng không phải luôn luôn có thể
trừ hoặc chia.

3.2. Số nguyên:
Để khắc phục những hạn chế trong phép trừ, chúng ta mở rộng hệ thống số tự nhiên ra thành hệ thống
các số nguyên bằng cách lấy hết tất cả các số tự nhiên rồi thêm vào các số đối của chúng (số âm) và số
không (0).
Tập hợp các số nguyên được kí hiệu là Z .

Z = { ... -3, -2, -1, 0, 1, 2, 3,… }

3.3. Số hữu tỉ:


Nhưng chúng ta vẫn không thể luôn luôn chia được hai số nguyên bất kì.
Chẳng hạn, 8 ÷ (-2) = -4 là một số nguyên, nhưng 8 ÷ 3 không phải là một số nguyên.
Để khắc phục vấn đề này, chúng ta mở rộng hệ thống số nguyên thành hệ thống số hữu tỉ. Chúng ta
định nghĩa một số là hữu tỉ nếu nó có thể biểu diễn được như là một tỉ số của hai số nguyên.

Tập hợp các số hữu tỉ được kí hiệu là Q.

Q = { m/n | ∀ m, n ∊ Z & n ≠ 0}

(Kí hiệu ∀ đọc là với mọi và kí hiệu ∊ đọc là thuộc về)


Theo đó, tất cả bốn phép tính số học cơ bản (cộng, trừ, nhân và chia) đều có thể thực hiện được trong Q.

3.4. Số vô tỉ:
Trong sử dụng hàng ngày cũng tồn tại nhiều số không phải là số hữu tỉ; nghĩa là chúng không thể biểu
diễn được dưới dạng một tỉ số của hai số nguyên.

Ví dụ 2, 3, π, v.v... không là số hữu tỉ; những số như thế gọi là số vô tỉ.

3.5. Số thực
Từ số thực được dùng để chỉ chung cho số hữu tỉ hoặc vô tỉ.
Tập hợp các số thực được kí hiệu là R.

Để có một định nghĩa đầy đủ của số thực sẽ phải liên quan đến việc giới thiệu một số ý tưởng mới, và
chúng ta không đi vào nhiệm vụ này ở đây. Tuy nhiên, có thể có được một ý niệm đúng đắn về số thực
bằng cách hiểu nó dưới dạng số thập phân. Bất kì số hữu tỉ nào cũng có thể được biểu diễn dưới dạng
thập phân, đơn giản bằng cách chia tử cho mẫu trong phép chia dài (chia bằng tay). Có hai trường hợp
xảy ra:
 phần thập phân dừng lại hẳn ở một vị trí nào đó;
 kể từ một vị trí nào đó phần thập phân phát triển theo hướng lập lại vô hạn một nhóm chữ số theo
một khuôn mẫu nào đó (được gọi là vô hạn tuần hoàn).

8
BÀI GIẢNG THỐNG KÊ SINH HỌC

Ví dụ ¼ = 0.252 (dừng sau 2 chữ số thập phân) còn 1/6 = 0.161616... (lặp lại vô hạn cặp số 16 ngay từ
chữ số thập phân đầu tiên).

Đối với trường hợp hai, trong thực hành tính toán, ta không thể làm việc với vô hạn chữ số của phần thập
phân mà phải chấp nhận tính toán với một số nhất định các chữ số sau dấu phẩy tuỳ độ chính xác cho
phép, tức là ta chỉ tính toán gần đúng mà thôi3.

Số vô tỉ cũng có thể biểu diễn với dạng thập phân4 nhưng phần thập phân không bao giờ dừng lại và
cũng không lập lại tuần hoàn như số hữu tỉ.5

3.6. Số phức:
Trong hệ thống số thực, phép lấy căn bậc hai chỉ có thể thực hiện cho các số không âm (dương hay
bằng 0). Mỗi số a > 0 có 2 căn bậc hai đối nhau và ta dùng kí hiệu 𝑎 để chỉ căn bậc hai dương của a.
Nếu chúng ta chỉ xem xét số thực thì căn bậc hai của một số âm không có nghĩa, chẳng hạn −2 hoặc
3
− 5 không tồn tại và chẳng có ý nghĩa gì trong hệ thống số thực. Tuy nhiên, những con số này lại tồn tại
trong hệ thống số phức (một hệ mở rộng của hệ thống số thực, kí hiệu là C) mà chúng ta không xét tới
ở đây.

IV. LUỸ THỪA NGUYÊN VÀ PHÉP TOÁN MŨ.


Nếu x, y là 2 số thực bất kì và m, n là 2 số nguyên bất kì thì các quan hệ sau đây là đúng:
1
(a) 𝑥 𝑚 𝑥 𝑛 = 𝑥 𝑚 +𝑛 (b) 𝑥 −𝑛 = 𝑥 𝑛 (𝑥 ≠ 0)
𝑥𝑛
(c) 𝑥 𝑛 = 𝑥 𝑚 −𝑛 (𝑥 ≠ 0) (d) 𝑥 𝑚 𝑛
= 𝑥 𝑚𝑛
𝑛 𝑥 𝑛 𝑥𝑛
(e) 𝑥𝑦 = 𝑥 𝑛 𝑦𝑛 (f) 𝑦
= 𝑦 𝑛 (𝑦 ≠ 0)
𝑛
(g) 𝑥 𝑚 /𝑛 = 𝑥 𝑚 (𝑥 ≥ 0 𝑘𝑕𝑖 𝑛 𝑐𝑕ẵ𝑛)
Từ (g) ta suy ra: (h) 𝑥 = 𝑥 1/2 𝑥 ≥ 0
và: (i) 𝑥 2 = |𝑥|

Biểu thức (g) là một mở rộng của khái niệm luỹ thừa với số mũ nguyên sang số mũ hữu tỉ và từ (g),
người ta có thể tiếp tục mở rộng định nghĩa luỹ thừa sang số mũ thực để có phép toán mũ: 𝑥 𝑟 với x > 0
và r là một số thực bất kì.

Phép toán mũ có đủ tất cả các tính chất (a) – (g) ở trên với m, n bây giờ là số thực.

2
Thật ra có thể viết ¼ = 0.250000…. (phần thập phân lập lại vô hạn theo khuôn mẫu là 0,0,0… từ chữ số thập phân thứ 3).
3
Trong tính toán ta chỉ làm việc với tập các số hữu tỉ thập phân
𝑄10 = 𝑟 ∈ 𝑸 |𝑟 = 𝑛𝑖=−𝑚 𝑑𝑖 10𝑖 ; 𝑑𝑖 ∈ 0,1,2, … ,9 ; 𝑚, 𝑛 ∈ 𝑵 mà thôi.
4
Việc biểu diễn số thập phân thường đòi hỏi phải có kiến thức toán học cao cấp nên ta sẽ không bàn ở đây. Một ví dụ mịnh hoạ
là ta có thể biểu diễn e dưới dạng thập phân bằng cách tính toán dựa vào công thức:
e =1/1! + 1/2! + 1/3! + ..... + 1/n! + …
5
Trong thực hành tính toán, ta chỉ sử dụng dạng thập phân gần đúng của số vô tỉ, ví dụ π ≈ 3.141592 tức vẫn chỉ dùng số hữu tỉ,
thật ra chỉ dùng số thập phân trong Q10 như đã nêu ở cước chú 4.
9
BÀI GIẢNG THỐNG KÊ SINH HỌC

Khi chúng ta ở trong chủ đề này, có thể sẽ hữu ích khi lưu ý rằng có nhiều hơn một sự khác biệt cơ bản
giữa x² + y² và (x + y)² (hãy tự kiểm chứng lại điều này). Sự khác biệt đó sẽ được khai thác về sau trong
loạt bài này, tuy nhiên, một số đẳng thức về nhị thức có thể hữu ích ở đây:

(x ± y)² = x² ± 2xy + y²
(x ± y)³ = x³ ± 3x²y + 3xy² ± y³ …

Loại khai triển này sẽ được bàn tới trong chủ đề xác suất.

V. LOGARIT (LOGARITHM)
ĐỊNH NGHĨA:
Cho 0 < a ≠ 1, x > 0 và y là số thực, nếu x = ay , thì y được gọi là logarit cơ số a của x và ta viết
y = logax .
Như vậy: y= loga x ⇔ x= a y nên phép lấy mũ cơ số a là phép toán ngược của phép toán lấy loga
nên còn được gọi là phép toán anti loga

* Dễ thấy từ định nghĩa logaa =1 và loga1 = 0.

Người ta thường kí hiệu logex là lnx (e = 2.71828… là cơ số của logarit tự nhiên hay logarit Napier) và
log10x là logx.

Một vài tính chất quan trọng của logarit như sau:
(a) logaxy = logax + logay
(b) loga(x/y) = logax - logay
(c) loga xn = nlogax
(d) loga x = logbx / logba (quy tắc đổi cơ số)

VI. HÀM SỐ
6.1. HÀM SỐ TỔNG QUÁT:
Khái niệm hàm số là một trong những khái niệm cơ bản của toán học hiện đại.
Một hàm số diễn đạt giả thuyết về một đại lượng này phụ thuộc vào (xác định bởi) một đại lượng khác.
I. Khối lượng xương phụ thuộc vào tuổi của chủ thể.
II. Chiều cao phụ thuộc vào chủng tộc …

Nếu một hàm f gán một giá tri y (duy nhất) cho một đối tượng x nào đó, ta viết:
y = f(x)

Trong toán học hình thức, ta gọi tập các giá trị có thể có được của x là miền xác định (domain) và tập
các giá trị có thể có được của y (thuộc về một tập nào đó) là miền giá trị (range). Trong thống kê hiện
đại, x được gọi là biến số “độc lập” và y là biến số “phụ thuộc”.

Một hàm f có miền xác định A và (tập chứa) miền giá trị B cũng có thể diễn tả dưới dạng kí hiệu như sau:
f:A→B
x→y
10
BÀI GIẢNG THỐNG KÊ SINH HỌC

Ví dụ: f(x) = 3x² + 7x +2


với x = -3 ta có f(-3) = 3(-3)² + 7(-3) +2 = 50

Theo thói quen trong toán học, nhiều khi người ta chỉ cho một hàm số dưới dạng công thức. Trong
trường hợp này, chúng ta phải tự xác định miền xác định của hàm số, đó là tập hợp các phần tử làm cho
công thức có nghĩa.

Ví dụ, với hàm số y = 𝑥, miền xác định không phải là toàn bộ tập số thực R mà chỉ là tập các số x≥ 0 vì
chúng ta không thể lấy căn của một số âm; với y = logax, giá trị của x phải lớn hơn 0 vì với x ≤ 0, y không
xác định. Tương tự, đối với hàm số có dạng y = 1/x thì miền xác định phải là tập các số thực x ≠ 0.

Trường hợp miền xác định của một hàm f là tập con của tích 2, 3, … , n tập hợp, ta có hàm với 2, 3, … ,
n biến số. Tương tự như trường hợp một biến, hàm nhiều biến y = f(x1, x2, … , xn) từ tập tích
A1×A2×…×An đến tập B có thể diễn tả bằng kí hiệu như sau:
f: A1×A2×…×An → B
(x1, x2, … , xn) ↦ y

Ví dụ, * y = f(u, v, t) = 1+ 2uvt – u + t2 là một hàm 3 biến


Ta có f(1, 2,-1) = 1 +2×1×2×(-1) – 1 + (-1)2 = -3
* mật độ khoáng trong xương(BMD) là một hàm 2 biến (tuổi và trọng lượng):
BMD = a + b.Age + c.Weight

6.2. HÀM TUYẾN TÍNH


Một hàm tuyến tính có dạng:
y = a + bx [1]
trong đó a được gọi là tung độ gốc hay hệ số chắn (intercept) (khi x = 0 thì y = a) và b được gọi là độ
dốc hay hệ số góc (slope/gradient) (biểu thị mức độ thay đổi của y ứng với thay đổi 1 đơn vị của x).

Khi biểu diễn trong không gian 2 chiều x-y (mặt phẳng toạ độ) thì đồ thị của hàm tuyến tính là một đường
thẳng.
Nếu 2 biến x và y thoả mãn [1] ta nói x và y có quan hệ tuyến tính.

Cho 2 điểm bất kì (x1, y1) và (x2, y2) trên đồ thị của hàm tuyến tính (Hình 1A) thì độ dốc có thể xác định
bằng hệ thức sau đây:

𝑦2 − 𝑦1 độ 𝑡𝑕𝑎𝑦 đổ𝑖 𝑐ủ𝑎 𝑦


𝑏= =
𝑥2 − 𝑥1 độ 𝑡𝑕𝑎𝑦 đổ𝑖 𝑐ủ𝑎 𝑥

Tuy nhiên trong thực nghiệm, việc đo đạc thường không cho ta các giá trị chính xác của x và y, nhưng ta
có thể đo được một loạt các giá trị gần đúng của x và y. Nếu các cặp số (x, y) thoả một số điều kiện nhất
định, chẳng hạn khi biểu diễn các cặp giá trị (x, y) đó trên một mặt phẳng toạ độ, thấy chúng gần như
thẳng hàng. Khi đó quan hệ của x và y có thể là một quan hệ tuyến tính với các hệ số a và b chưa biết và
với các giá trị (x, y) đo được ta có thể lập ra một hệ nhiều phương trình, từ đó có thể dùng phương pháp
bình phương nhỏ nhất (có trong nhiều phần mềm thống kê) để ước tính a và b. Nếu không dùng các
phần mềm thống kê, ta có thể tính b theo công thức (xem như một mở rộng của công thức trên).

b = ΢ [ (xi - 𝑥)(yi - 𝑦) ] / ΢ [ (xi - 𝑥)2]

11
BÀI GIẢNG THỐNG KÊ SINH HỌC

Nếu có 2 đường thẳng y = a1 + b1x và y = a2 + b2y, ta có một vài nhận xét sau:

a. Hai đường thẳng là song song khi và chỉ khi độ dốc của chúng bằng nhau, tức là b1 =b2.
b. Mặt khác, nếu b1 ≠ b2 thì hai đường thẳng không song song. Trong thống kê ta gọi hiện tượng này
là “sự tương tác” (interaction) (Hình 1C).

Hính 1 (A) hàm tuyến tính dạng y = a + bx (B) 2 đthẳng song song (C) “tương tác”

Hệ thức [1] có thể mở rộng hơn nữa bao gồm nhiều hơn một biến số như sau:
y= b0 + b1x1 +b2x2 + … + bnxn [1’]

Phương trình tuyến tính [1’] xác định một siêu phẳng (n chiều) trong không gian n+1 chiều.

Ví dụ mật độ khoáng trong xương(BMD) phụ thuộc rất nặng vào tuổi và trọng lượng cơ thể, chúng ta có
thể viết mệnh đề về mối quan hệ này như sau:

BMD = a + b.Age + c.Weight


trong đó a, b, c là 3 hằng số đã được ước tính. Từ đó, với mỗi giá trị của Age và Weight, ta có thể ước
lượng BMD từ công thức trên.
Chúng ta sẽ khảo sát hàm số này trong bối cảnh phân tích hồi quy sau này trong loạt bài giảng này.

6.3. HÀM BẬC HAI


Chúng ta thường gặp những trường hợp mà mối quan hệ hàm số giữa biến phụ thuộc (y) và các biến độc
lập (x) không tuyến tính mà có tính cong.

Một trong những hàm phổ biến là hàm bậc hai, có dạng:
y = f (x) = ax² + bx + c [2]
trong đó a, b và c là hằng số và a ≠ 0.

−𝑏± 𝑏 2 −4𝑎𝑐
Khi y = 0 và 𝑏2 − 4𝑎𝑐 ≥ 0 ta được: 𝑥 =
2𝑎
𝑏
Khi 𝑥 =− thì hàm bậc hai đạt giá trị cực đại / cực tiểu
2𝑎
𝑏 4𝑎𝑐 − 𝑏2
𝑚𝑎𝑥/𝑚𝑖𝑛 = f − =
2𝑎 2𝑎
Ví dụ: quan hệ giữa BMD và tuổi (của các đối tượng già) là theo quan hệ bậc hai:
BMD = a (Age)² + b (Age) + c

12
BÀI GIẢNG THỐNG KÊ SINH HỌC

6.4. BẤT ĐẲNG THỨC


Ta đã quen thuộc với các kí hiệu bất đẳng thức sau đây:

> và < "lớn hơn" và "bé hơn", tương ứng.


≥ và ≤ "lớn hơn hoặc bằng" và "bé hơn hoặc bằng", tương ứng.

Mốt số tính chất của bất đẳng thức cần lưu ý:

Cho x, y là các số thực:


(i) Nếu y > x thì y ± a > x ± a ∀ a ∈ R
(ii) Nếu y > x thì -y < -x
(iii) Nếu y > x thì y/a > x/a và ay > ax ∀a > 0
và y/a < x/a và ay < ax ∀a < 0
(iv) Nếu y > x > 0 thì x > y ∀ n. ∈ N
n n

Các tính chất (i) – (iv) vẫn còn đúng nếu thay > và < tương ứng bằng ≥ và ≤.

6.5. TUYẾN TÍNH HOÁ


Có lẽ là không cần thiết để nói rằng một hàm tuyến tính rất dễ giải thích hơn là một hàm không tuyến tính
(phi tuyến). Do đó, nhiều nỗ lực đã được thực hiện để biến đổi các hàm không tuyến tính thành một hàm
tuyến tính.

Ví dụ: nếu 𝑦 = 𝑎 𝑏 𝑥 , chúng ta có thể sử dụng logarit để tuyến tính hoá nó như sau:
𝑙𝑜𝑔𝑦 = log⁡(𝑎 𝑏 𝑥 = 𝑙𝑜𝑔𝑎 + 𝑥 𝑙𝑜𝑔𝑏. Biểu thức cuối cùng cho thấy logy rõ ràng là một hàm tuyến tính đối
với x.

Ở đây cần lưu ý rằng, chính thức có sự khác biệt giữa hàm tuyến tính và mô hình tuyến tính.
Ví dụ y = a + bx, y = a + bx + cx² v.v... đều là các mô hình tuyến tính nhưng hàm sau là hàm không tuyến
tính trong khi hàm đầu là một hàm tuyến tính. Chúng ta nói "tuyến tính" do các tham số a, b, và c là tuyến
tính. Tuy nhiên, y = a²x + b hoặc y = a bx đều là mô hình "phi tuyến" và hàm phi tuyến bởi vì cả các tham
số lẫn các đường cong đều không tuyến tính.

VII. HỆ PHƯƠNG TRÌNH TUYẾN TÍNH VÀ MA TRẬN


7.1. Ma trận:
7.1.1. Định nghĩa:

Ma trận m hàng n cột (thường được gọi là ma trận m×n) là bảng số có dạng:
𝑎11 𝑎12 ⋯ 𝑎1𝑛
⋮ ⋱ ⋮
𝑎𝑚 1 𝑎𝑚 2 ⋯ 𝑎𝑚 𝑛

trong đó aij ∈ R, i =1,2, … , m và j = 1, 2, … , n được gọi là các số hạng của ma trận.

Ma trận không là ma trận mà tất cả cácsố hạng đều bằng 0.


Khi m = n ta có ma trận vuông.

13
BÀI GIẢNG THỐNG KÊ SINH HỌC

Một ma trận vuông có các số hạng không nằm trên đường chéo chính (đi từ a11, a22… đến ann) đều bằng
0 gọi là ma trận chéo:

Một ma trận chéo có các số hạng trên đường chéo chính đều bằng 1 gọi là ma trận đơn vị và kí hiệu là I,
ví dụ ma trận đơn vị 3×3:
1 0 0
𝐼3 = 0 1 0
0 0 1
7.1.2. Phép toán trên ma trận:
- Phép cộng: cho 2 ma trận A = (aij) và B = (bij) có cùng kích thước (cùng số hàng và số cột) ta định
nghĩa: A + B = (aij+bji).
- Phép nhân với một số : tích của số thực α và ma trận A = (aij) đưọc định nghĩa là:
α A = ( α×aij)
- Phép nhân: Cho ma trận A=(aij) có kích thước m×n và ma trận B=(bjk) có kích thước n×p thí tích
của A và B là ma trận C=(crq) có kích thước m×p trong đó
𝑛

𝑐𝑟𝑞 = 𝑎𝑟𝑘 𝑏𝑘𝑞


𝑘=1
Tức là số hạng ở hàng r cột q của C là tổng của tích các số hạng ở hàng r của A tương ứng với
số hạng ở cột q của B
Ta chỉ nhân được A cho B khi số cột của A bằng số hàng của B, vì vậy nói chung B×A có thể
không tồn tại.
- Phép chuyển vị: ma trận chuyển vị của ma trận A=(aij) có kích thước m×n là ma trận A’=(a’ji) có
kích thước n×m với a’ji = aij.

7.1.3. Định thức của ma trận vuông:

Định thức của ma trận vuông A, kí hiệu là det(A) hay ||jA||, được định nghĩa như sau:

𝑎 𝑏
- Ma trận 2×2: = 𝑎𝑑 − 𝑏𝑐
𝑐 𝑑
𝑎 𝑏 𝑐
𝑑 𝑓 𝑑 𝑒
- Ma trận 3×3: 𝑑 𝑒 𝑓 =𝑎 𝑒 𝑓
−𝑏 +𝑐
𝑕 𝑖 𝑔 𝑖 𝑔 𝑕
𝑔 𝑕 𝑖

= aei + bfg + cdh – afh – bdi – ceg


𝑎11 𝑎12 ⋯ 𝑎1𝑛
- Ma trận n×n: ⋮ ⋱ ⋮ = 𝑛
𝑖=1 −1 𝑖+𝑘
𝑎𝑘𝑖 𝐴𝑘𝑖
𝑎𝑚 1 𝑎𝑚 2 ⋯ 𝑎𝑚𝑛
với Aki là ma trận (n-1)×(n-1) có được bằng cách bỏ đi hàng k và cột i trong ma trận gốc.

Ví dụ: Tìm định thức của ma trận:


−2 2 −3
𝐴 = −1 1 3
2 0 −1

Ta có thể dùng công thức cuối cùng, chẳng hạn với i = 2:

14
BÀI GIẢNG THỐNG KÊ SINH HỌC

2+1 2 −3 −2 −3 −2 2
det 𝐴 = −1 × −1 × + (−1)2+2 × 1 × + (−1)2+3 × 3 ×
0 −1 2 −1 2 0
= (-1)×(-1)×(-2) + 1×1×8 + (-1)×3×(-4) =-2 + 8 +12 = 18.

(Bạn đọc có thể kiểm tra lại kết quả bằng cách khai triển với giá trị i khác hoặc dùng công thức cho ma
trận 3×3).

7.2. Hệ phương trình tuyến tính:


7.2.1. Hệ phương trình tuyến tính theo 2 ẩn x và y là cặp phương trình có dạng:
𝑎𝑥 + 𝑏𝑦 = 𝑒
𝑐𝑥 + 𝑑𝑦 = 𝑓
trong đó a, b, c, d, e, f là những số đã biết và x, y là hai số chưa biết thoả cà 2 phương trình trên mà ta
cần tìm.

Khi ad – bc ≠ 0 thì hệ có nghiệm duy nhất cho bởi công thức Cramer như sau:6
x= (de – bf)/(ad – bc) và y=(af – ce)/(ad – bc)

Hệ trên cũng có thể viết lại dưới dạng ma trận là:


𝑎 𝑏 𝑥 𝑒 𝑥
𝑐 𝑑 𝑦 = 𝑓 𝑕𝑎𝑦 𝐴 𝑦 =𝐵
𝑎 𝑏 𝑒
với 𝐴 = và 𝐵 = 𝑓
𝑐 𝑑

Khi det(A) ≠ 0,(hay ad – bc ≠ 0), nghiệm của hệ cho bởi công thức Cramer như sau:
𝑑𝑒𝑡(𝐴1 )
𝑥= với A1 là ma trận có đưọc bằng cách thay cột 1 trong A bằng B
det⁡(𝐴)
𝑑𝑒𝑡(𝐴2 )
𝑦= với A2 là ma trận có đưọc bằng cách thay cột 2 trong A bằng B
det⁡(𝐴)

(Bạn đọc tự kiểm tra lại công thức Cramer dạng định thức và dạng thông thường là như nhau.)

7.2.2. Hệ phương trình tuyến tính n ẩn là n phương trình đồng thời:

a11x1 + a12x2 + … + a1nxn = b1


a21x1 + a22x2 + … + a2nxn = b2
.....................
.....................
.....................
an1x1 + an2x2 + … + annxn = bn
với aij (i, j = 1 , 2, … , n) là những số đã biết và xi (I = 1, 2, …, n) là các số chưa biết thoả cả n phương
trình trên mà ta cần tìm.

Tương tự như trường hợp 2 ẩn cũng có thể viết phương trình này dưới dạng ma trận như sau:

6
Dĩ nhiên cũng có thể giải bằng các phương pháp thông thường như thế, khử, so sánh như đã biết.
15
BÀI GIẢNG THỐNG KÊ SINH HỌC

𝑥1 𝑏1
𝑎11 ⋯ 𝑎1𝑛
𝑥2 𝑏2
𝐴 𝑋 = 𝐵 𝑣ớ𝑖 𝐴 = ⋮ ⋱ ⋮ ,𝑋 = ⋮ 𝑣à 𝐵 =
𝑎𝑛1 ⋯ 𝑎𝑛𝑛 ⋮
𝑥𝑛 𝑏𝑛

Khi det(A) ≠ 0, hệ có nghiệm duy nhất cho bởi công thức Cramer như sau:
𝑑𝑒𝑡(𝐴𝑖 )
𝑥𝑖 = 𝑖 = 1,2 … , 𝑛, với Ai là ma trận có được bằng cách thay cột i trong A bằng B 7
det⁡(𝐴)

Ví dụ: Giải hệ phương trình sau:


−2𝑥 + 2𝑦 − 3𝑧 = 1
−𝑥 + 𝑦 + 3𝑧 = −2
2𝑥 − 𝑧 = 1

Hệ này có thể viết dưới dạng ma trận như sau:


−2 2 −3 𝑥 1
−1 1 3 𝑦 = −2
2 0 −1 𝑧 1

Ta có det(A) = 18, det(A1) = 4, det(A2) =-2 và det(A3) = -10 nên


x = 4/18 = 2/9, y = -2/18 = -1/9 và z = 10/18 = -5/9.8

VIII. ĐẠO HÀM VÀ TÍCH PHÂN


8.1. Đạo hàm:
8.1.1. Định nghĩa:
𝑓(𝑥 +𝑕)− 𝑓(𝑥 0 )
Cho hàm số y = f(x) liên tục trên một khoảng (a, b), x0 ∊ (a, b), nếu tỉ 0 𝑕 có giới hạn là l khi h→
𝑑𝑓 (𝑥 0 )
0 thì l được gọi là đạo hàm của hàm số y = f(x) tại x0 và được kí hiệu là f’(x0) hay 𝑑𝑥

𝑑𝑓(𝑥0 ) 𝑓 𝑥0 + 𝑕 − 𝑓(𝑥0 )
𝑓 ′ 𝑥0 = = 𝑙 = lim
𝑑𝑥 𝑕→0 𝑕

* Ý nghĩa hình học: Gọi M0 và M lần lượt là 2 điểm có hoành độ là x0 và x0+h trên đồ thị của hàm y = f(x).
𝑓(𝑥 +𝑕 )− 𝑓(𝑥 0 )
Lưu ý rằng tỉ 0 𝑕 là hệ số góc của cát tuyến M0M (xem hình 2). Khi h→ 0 thì
𝑓(𝑥 0 +𝑕 )− 𝑓(𝑥 0 )
M → M0 và cát tuyến M0M trở thành tiếp tuyến M0t của đồ thị. Do đó, tỉ 𝑕
tiến đến hệ số góc
của cát tuyến M0t., tức là:
f’(x0) = hệ số số góc của tiếp tuyến M0t

7
Cũng có thể giải trực tiếp bằng cách nhân cả 2 vế với ma trận nghịch đảo A-1 của A như cách giải phương trình
bậc nhất thông thường và được X= 𝐴−1 𝐵, tuy nhiên việc tìm ma trận nghịch đảo hơi phức tạp nên không trình bày ở đây.
8
Hiện nay có nhiều phần mềm có thể giúp ta tính toán định thức tự động sau khi nhập các số hạng của ma trận.
16
BÀI GIẢNG THỐNG KÊ SINH HỌC

Hình 2 : Đạo hàm bằng hệ số góc của tiếp tuyến

* y’ = f’(x) cũng là một hàm số và nếu f’(x)có đạo hàm thì đạo hàm này đuợc gọi là đạo hàm bậc hai của
𝑑 2 𝑓(𝑥)
y= f(x) và được kí hiệu là y” = f”(x) hay 𝑦" = 𝑑𝑥 2 ..
Tương tự ta cũng có thể định nghĩa đạo hàm bậc n của y = f(x) và kí hiệu đạo hàm bậc n là
(𝑛) 𝑛 (𝑛)
𝑑𝑛 𝑓(𝑥)
𝑦 = 𝑓 𝑥 𝑕𝑎𝑦 𝑦 =
𝑑𝑥 𝑛

8.1.2. Tính chất:

 Cho f, g, h là các hàm số có đạo hàm, khi đó:


(i) (f ± g)’ = f’ ± g’
(ii) (fg)’ = f’g + fg’
(iii) 1/f = - f’/f2
(iv) (fn)’ = n f’ fn-1

 Nếu hàm số y = f(x) có đạo hàm trên khoảng (a, b) và x0 ∊ (a, b), khi đó:
- f(x) đạt giá trị cực đại tại x0 khi và chỉ khi f’(x0) = 0 và f’(x) > 0 với x < x0 , f’(x) < 0 với x > x0.
- (x) đạt giá trị cực tiểu tại x0 khi và chỉ khi f’(x0) = 0 và f’(x) < 0 với x < x0 , f’(x) > 0 với x > x0.

8.1.3. Đạo hàm một số hàm thông dụng:


(C)’ = 0 (C là hằng số) (xn)’ = nxn-1 ∀n ∊ Z
(ex)’ =ex (lnx )’= 1/x
(sinx)’ = cosx (cosx)’ = -sinx
(tgx)’ = 1/(1+tg2x) (cotgx)’ = -1/(1+cotg2x)
1 −1
𝑎𝑟𝑐𝑠𝑖𝑛𝑥 ’ = 𝑎𝑟𝑐𝑐𝑜𝑠𝑥 ′ =
1 − 𝑥2 1 − 𝑥2
1 −1
𝑎𝑟𝑐𝑡𝑔𝑥 ’ = 𝑎𝑟𝑐𝑐𝑜𝑡𝑔𝑥 ’ =
1 + 𝑡𝑔2 𝑥 1 + 𝑐𝑜𝑡𝑔2 𝑥

8.1. 4. Đạo hàm hàm nhiều biến:

Định nghĩa:
17
BÀI GIẢNG THỐNG KÊ SINH HỌC

Cho hàm y = f(x1, x2, … , xn) liên tục trên 𝑛𝑖=1(𝑎𝑖 , 𝑏𝑖 ), và k là số nguyên sao cho
1 ≤ k ≤ n. Khi giữ các biến xi cố định với i ≠ k, lúc đó có thể xem y = f(x1, x2, … , xn) như một hàm chỉ theo
biến xk và nếu hàm này có đạo hàm theo xk thì đạo hàm này được gọi là đạo hàm riêng của f theo xk và
được kí hiệu là
𝜕𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑘 , … , 𝑥𝑛 )
𝑦𝑥′ 𝑘 =
𝜕𝑥𝑘

Hàm y = f(x1, x2, … , xn) được gọi là vi phân được (khả vi) khi nó có đạo hàm riêng theo tất cả các biến xi.

Ví dụ: Cho y = f(u, v) = 2u – 3uv2 +5, ta có:


𝜕𝑓(𝑢, 𝑣) 𝜕𝑓(𝑢, 𝑣)
𝑦𝑢′ = = 2 − 3𝑣 2 𝑣à 𝑦𝑣′ = = −6𝑢𝑣
𝜕𝑢 𝜕𝑣

Tính chất:

Cho y = f(x1, x2, … , xn) khả vi, khi đó:


y = f(x1, x2, … , xn) đạt cực tiểu (cực đại) tại (x10, x20, … , xn0) nếu và chỉ nếu các đạo hàm riêng đều bằng
0 và đổi dấu từ âm sang dương (từ dương sang âm) khi đi qua xko với k =1, 2, … , n.

8.2. Nguyên hàm và Tích phân:


8.2.1. Nguyên hàm:

Định nghĩa: Cho hàm y = F(x) và y = f(x) cùng xác định trên khoảng (a,b), nếu F có đạo hàm và F’(x) =
f(x) thì hàm được gọi là nguyên hàm của hàm f

Tính chất:
Hàm F và hàm G là đều là nguyên hàm của hàm f khi và chỉ khi tồn tại hằng số C sao cho
G(x) = F(x) + C.

 Một nguyên hàm tổng quát (còn gọi là tích phân bất định) của hàm y = f(x) được kí hiệu là 𝑓 𝑥 𝑑𝑥.

Nguyên hàm của một số hàm thông dụng:

𝑥 𝑛 +1 𝑑𝑥
𝑥 𝑛 𝑑𝑥 = + 𝐶 𝑛 ≠ −1 = 𝑙𝑛𝑥 + 𝐶
𝑛+1 𝑥
𝑒 𝑥 𝑑𝑥 = 𝑒 𝑥 + 𝐶 𝑙𝑛𝑥 = 𝑥 𝑙𝑛𝑥 − 1 + 𝐶

𝑠𝑖𝑛𝑥 𝑑𝑥 = −𝑐𝑜𝑠𝑥 + 𝐶 𝑐𝑜𝑠𝑥 𝑑𝑥 = 𝑠𝑖𝑛𝑥 + 𝐶

𝑡𝑔𝑥 𝑑𝑥 = −ln 𝑐𝑜𝑠𝑥 + 𝐶 𝑐𝑜𝑡𝑔𝑥 𝑑𝑥 = ln 𝑠𝑖𝑛𝑥 + 𝐶

𝑎𝑟𝑐𝑠𝑖𝑛𝑥 𝑑𝑥 = 𝑥𝑎𝑟𝑐 𝑠𝑖𝑛𝑥 + 1 − 𝑥 2 + 𝐶 𝑎𝑟𝑐𝑐𝑜𝑠𝑥 𝑑𝑥 = 𝑥𝑎𝑟𝑐𝑐𝑜𝑠𝑥 − 1 − 𝑥 2 + 𝐶


1
𝑎𝑟𝑐𝑡𝑔𝑥 𝑑𝑥 = 𝑥𝑎𝑟𝑐𝑡𝑔𝑥 − ln 1 + 𝑥 2 + 𝐶
2
18
BÀI GIẢNG THỐNG KÊ SINH HỌC

8.2.2. Tích phân xác định:

Định nghĩa: Cho y=f(x) xác định trên khoảng [a, b] và các số thực thoả điều kiện a = x0 ≤ t1 ≤ x1 ≤ … < xi-1
≤ ti ≤ xi ≤ …≤ xn-1 ≤tn ≤xn=b. Đặt Sn là tổng sau đây (gọi là tổng tích phân)
𝑛

𝑆𝑛 = 𝑓 𝑡𝑘 ∆𝑘 𝑣ớ𝑖 ∆𝑘 = 𝑥𝑘 − 𝑥𝑘−1
𝑘=1
Nếu Sn có giới hạn hữu hạn bằng L khi d = max1≤𝑖≤𝑛 ∆𝑖 → 0 và giới hạn này không phụ thuộc vào cách
lựa chọn các điểm xi, ti (I = 1, 2,…, n) thì L đuợc gọi là tích phân xác định của hàm f trên khoảng [a, b] và
được kí hiệu là:
𝑏 𝑛

𝑓 𝑥 𝑑𝑥 = 𝐿 = lim 𝑆𝑛 = lim 𝑓 𝑡𝑘 ∆𝑘
𝑎 𝑑 →0 𝑑→0
𝑘=1

Khi đó ta nói f là tích phân đuợc (khả tích) trên [a, b].

Hình 3: Diện tích hình chữ nhật có tô màu bằng số hạng f(tk)Γk trong Sn
𝑎 𝑏 𝑐
 Quy ước: 𝑏
𝑓(𝑥)𝑑𝑥 = − 𝑎
𝑓 𝑥 𝑑𝑥 𝑐
𝑓 𝑥 𝑑𝑥 = 0

 Ý nghĩa hình học: Khi f(x) ≥ 0 với mọi x trên [a, b] thì Sn chính là tổng diện tích các hình chữ nhật có
kích thước là Δk× f(tk) (k=1, 2, ,n). Để ý rằng các hình chữ nhật này có diện tích xấp xỉ diện tích hình
thang cong bên dưới đồ thị giới hạn bởi trục Ox và 2 đường thẳng
x =xk-1, x = xk nên Sn xấp xỉ diện tích thang cong bên dưới đồ thị giới hạn bởi Ox và 2 đường thẳng
x=a, x = b. Vì thế khi d = max0<𝑖<𝑛 (𝑥𝑖 − 𝑥𝑖−1 ) → 0 thì Sn tiến về diện tích của hình thang cong vừa
nêu, tức là
𝑏
𝑓 𝑥 𝑑𝑥 = 𝑑𝑖ệ𝑛 𝑡í𝑐𝑕 𝑕 ì𝑛𝑕 𝑡𝑕 𝑎𝑛𝑔 𝑐𝑜𝑛𝑔 𝑑ướ𝑖 đồ 𝑡𝑕 ị
𝑎

Tính chất:
 Cho f là hàm khả tích trên [a, b], và c là điểm bất kì trên [a, b] thì
19
BÀI GIẢNG THỐNG KÊ SINH HỌC

𝑏 𝑐 𝑏
𝑓(𝑥) 𝑑𝑥 = 𝑓(𝑥) 𝑑𝑥 + 𝑓(𝑥) 𝑑𝑥.
𝑎 𝑎 𝑐
 Cho f, g là hai hàm khả tích trên [a,b] và α, β là 2 số thực thì
𝑏 𝑏 𝑏
𝛼𝑓 𝑥 + 𝛽𝑔(𝑥) 𝑑𝑥 = 𝛼 𝑓 𝑥 𝑑𝑥 + 𝛽 𝑔 𝑥 𝑑𝑥 .
𝑎 𝑎 𝑎

Định lí:
Nếu f là hàm số liên tục trên khoảng [a, b] thì f khả tích trên [a, b].

Nhờ định lí trên, khi hàm f liên tục trên [a, b], ta có thể làm việc tính toán tổng tích phân Sn đơn giản hơn
bằng cách chọn xk là các điểm chia [a,b] thành n khoảng bằng nhau và tk là một trong 2 đầu mút hoặc
𝑏−𝑎
trung điểm của các khoảng nhỏ đó, tức là chọn 𝑥𝑘 = 𝑎 + 𝑘 (𝑘 = 0, 1, 2, … , 𝑛) và
𝑛
𝑥 𝑘−1 +𝑥 𝑘
𝑡𝑘 = 𝑥𝑘−1 𝑕 𝑎𝑦 𝑥𝑘 𝑕 𝑜ặ𝑐 (𝑘 = 1,2, … , 𝑛).
2

Định lí cơ bản của toán vi tích phân:

Cho y = F(x) là một nguyên hàm của hàm y = f(x) liên tục trên khoảng [a, b], khi đó
𝑏
𝑓(𝑥) 𝑑𝑥 = 𝐹 𝑏 − 𝐹 𝑎 .
𝑎

8.2.3. Mở rộng tích phân xác định:

𝑏 𝑐
- Nếu y = f(x) chỉ xác định và liên tục trên [a,b) ta định nghĩa 𝑎
𝑓 𝑥 𝑑𝑥 = lim𝑐 →𝑏 −𝑎
𝑓 𝑥 𝑑𝑥 khi giới hạn
này tồn tại và hữu hạn.

Có thể mở rộng một cách tương tự tích phân xác định cho hàm chỉ xác định và liên tục trên (a, b], (a, b),
[a, ∞), (a, ∞), ( -∞, b], hay ( -∞, b), đặc biệt cũng có thể mở rộng lên toàn tập số thực R như sau:
+∞ +𝑎
- Cho hàm y = f(x) liên tục trên R, ta định nghĩa −∞
𝑓 𝑥 𝑑𝑥 = lim𝑎 →∞ −𝑎
𝑓 𝑥 𝑑𝑥 nếu giới hạn này tồn tại
và hữu hạn.

* Lưu ý rằng với các mở rộng trên, nếu hàm y = f(x) xác định và liên tục trên [a, b] thì tích phân xác định
của f trên [a, b], [a, b). (a, b] và (a, b) là như nhau, tức là:
𝑏

[𝑎,𝑏] 𝑓 𝑥 𝑑𝑥 = 𝑎,𝑏 𝑓 𝑥 𝑑𝑥 = (𝑎,𝑏] 𝑓 𝑥 𝑑𝑥 = (𝑎,𝑏) 𝑓 𝑥 𝑑𝑥 = 𝑓 𝑥 𝑑𝑥 .


𝑎

𝑏
Điều này biện minh cho việc dùng cùng một kí hiệu 𝑎 cho tất cả các tích phân trên.

__________________

BÀI TẬP
1. Bộ gen VDR (Vitamin D receptors) có hai alen (gen đẳng vị), gọi là T và t, chúng tạo ra ba kiểu
gen TT, Tt và tt. Chú ý rằng số alen T trong kiểu gen TT, Tt và tt lần lượt là 2, 1 và 0. Trong một
nghiên cứu trên 130 phụ nữ ở Mĩ, các phân bố tần số của kiểu gen VDR như sau:
TT: 53
20
BÀI GIẢNG THỐNG KÊ SINH HỌC

Tt: 57
tt: 20
Sử dụng phân bố này để tìm các tần số tương đối của alen T. Tần số tương đối của alen t là bao
nhiêu?

2. Theo luật cân bằng Hardy-Weinberg, nếu tần số tương đối của alen T và t tương ứng là p và q (p
+ q = 1), thì các tần số của TT, Tt và tt được cho bởi p², 2pq và q², tương ứng. Sử dụng các kết
quả của Câu hỏi 1 (p và q) để tìm phân bố tần số mong đợi của các kiểu gen VDR cho 130 phụ
nữ.
Những dữ liệu quan sát trong Câu hỏi 1 có phù hợp với luật cân bằng Hardy-Weinberg (không
cần phải sử dụng công cụ thống kê)?

3. Theo lý thuyết về di truyền học, giá trị các trung bình kiểu hình theo lí thuyết của TT, Tt và tt lần
lượt là (μ + a), (μ + d) và (μ - a), trong đó μ dùng để chỉ trung bình tổng thể của dân số, a dùng để
chỉ ảnh hưởng di truyền phụ gia và d dùng để chỉ ảnh hưởng gen trội. Trong một mẫu phụ nữ,
trung bình BMD cho ba kiểu gen tương ứng là1,23; 1,15 và 0,98. Tìm các giá trị của a và d.

4. Xét báo cáo sau đây: "DNA được chiết xuất từ 80 phụ nữ bệnh loãng xương và 85 phụ nữ cùng
tuổi đối chứng. PCR được dùng để khuếch đại chuỗi ADN và enzyme hạn chế BSM-I được dùng
để phát hiện alen VDR. Kết quả cho thấy không có khác biệt đáng kể giữa nhóm loãng xương và
nhóm đối chứng về tần số của alen B (0,44 và 0,39) cũng như về tần số của kiểu gen BB (0,20 và
0,21). ” (Gallagher JBMR et al 1994).
Giả sử rằng sự phân bố của kiểu gen ở các đối tượng loãng xương và đối chứng theo luật cân
bằng Hardy-Weinberg, hãy ước lượng (tìm lại) số đối tượng trong mỗi kiểu gen cho từng nhóm.

5. Với mỗi hàm số sau đây tìm những giá trị của x không thuộc miền xác định của nó:
𝑥+2 𝑥
(a) f(x) = (b) f(x) = 2 (c) f(x) = logx
𝑥−1 𝑥 −4
(d) g(x) = 𝑥2 −4 (e) h(x) = 𝑥 2 − 𝑥.

6. Tốc độ thay đổi về BMD đôi khi được mô hình hóa dưới dạng một hàm bậc hai sau:
δy = at² + bt + c
Trong đó δy là tốc độ thay đổi về BMD, t là thời gian (tính theo năm), a, b và c là hằng số. Sử
dụng kiến thức về bất đẳng thức để tìm ra khi nào (t =?) thì δy dương và khi nào δy âm.

7. Cho f(x) = ln[(x+1)/x], chứng tỏ rằng f(1) + f(2) + f(3) = ln4.

𝑛!
8. Cho 𝐶 𝑛, 𝑘 = , tìm (không phải tính) một biểu thức cho:
𝑘! 𝑛−𝑘 !
(i) C(5,3)
(ii) C(n+1,k).

9. Hàm phân bố Bình thường (Gauss) được xác định bởi 2 tham số: trung bình (µ) và độ lệch chuẩn
(ζ) và được cho bởi:
2
1 1 𝑥−𝜇 2
𝑓 𝑥; 𝜇, 𝜎 = 𝑒𝑥𝑝 −
𝜎 2𝜋 2 𝜎
Tìm biểu thức cho f(10;15,5).

10. Nếu x = ln2 và y = ln3, biểu diễn các biểu thức sau theo x và y.
(a) ln9 (b) ln 2 (c) ln(3/2) (d) ln3 3 (e) ln0.25
21
BÀI GIẢNG THỐNG KÊ SINH HỌC

(f) ln(8/9) (g) ln 6 (h) ln12 (i) ln4.5 (j) ln72.

11. Nếu 𝑒 𝑥 − 𝑒 −𝑥 + 1 = 0, chứng tỏ rằng x = ln ( 5 −1) − ln 2.


𝑒 −𝑥 +𝑒 𝑥
(ii) Nếu = 2chứng tỏ rằng x = −½ ln3
𝑒 −𝑥 −𝑒 𝑥
𝑒 𝑥 −𝑒 −𝑥
(iii) Nếu 𝑦= (𝑦 + 𝑦 2 + 1)
chứng tỏ rằng 𝑥 = ln⁡
2

12. Chứng tỏ rằng các kết quả sau đây là đúng:


(a) logae= 1 / logea (b) logpq + logqr + logrp = 1 (c) lognax = logax /(1+logan).

13. Con cái của một loài côn trùng nào đó sinh ra 20 con cái còn sống sót thuộc thế hệ sau. Có 4 thế
hệ / năm. Trong một năm sẽ có bao nhiêu con cái thuộc các thế hệ sau?

14. Giả sử rằng chỉ có sẵn đậu lăng khô và đậu nành khô để đáp ứng nhu cầu protein hàng ngày của
một người vào khoảng 75 g. Một gam đậu lăng có chứa 0,26 g protein và 1 g đậu nành có chứa
0,35 g protein. Gọi mức tiêu thụ của người đó là x g đậu lăng và y g đậu nành. Hãy biểu thị mối
quan hệ giữa x và y dưới dạng của một hàm tuyến tính tức là y= a + bx.

15. Phương trình liên kết xác suất gãy xương (P) và mật độ khoáng của xương (BMD) thường có
dạng một phương trình logistic như sau:
𝑃
= 𝑒 𝑏 (𝐵𝑀𝐷)
1−𝑃
trong đó b là một hằng số. Ước lượng b trong phương trình này hơi khó một chút, tuy nhiên, việc
ước lượng sẽ dễ dàng hơn nếu chúng ta biểu diễn mối quan hệ này duới dạng một hàm tuyến
tính bằng cách sử dụng logarit. Hãy tìm phương trình tuyến tính này.

16. Trong một thí nghiệm, trọng lượng W của gạc nai được đo với một số nai ở các độ tuổi khác
nhau. Các kết quả được cho trong bảng sau:
A: 20 22 30 34 42 43 46 54 56 68 70
W: 0,08 0,10 0,15 0,20 0.27 026
0,31 0,36 0,40 0,49 0,49
(W tính theo kg và A tính theo tháng)

Chứng tỏ bằng phương trình và bằng đồ thị rằng các dữ liệu trên phù hợp khít khao quan hệ
tuyến tính:
W = mA + b, trong đó m và b tương ứng là độ dốc và tung độ gốc. Tìm phương trình này.

17. Ngay sau khi tiêu thụ rượu, độ cồn trong máu của một người tăng lên đến một giá trị đỉnh là 0,22
mg / ml, và sau đó từ từ giảm. Nếu t là thời gian tính bằng giờ sau khi giá trị tối đa đạt được và y
là mức độ rượu trong máu, bảng sau đây cho các giá trị đo thực nghiệm cho chủ thể này:
t: 0 0,5 0,75 1,0 1,5 2,0 2,5 3,0
________________________________________________________
y: 0,22 0,18 0,15 0,13 0,10 0,08 0,06 0,05
Các dữ liệu được cho là theo quan hệ 𝑦 = 𝑏𝑎𝑡 trong đó b và a là hằng số. Bằng cách sử dụng
lôgarit và phần mềm thống kê phổ biến, ước tính a và b.

18. Cho:
22
BÀI GIẢNG THỐNG KÊ SINH HỌC

w1 = 8, w2 = 11, w3 = 3, w4 = 2, w5 = 17, w6 = 9, w7 = 6, w8 = 11
x1 = 4.7, x2 = 3,9, x3 = 7.2, x4 = 0,5, x5 = 2.8, x6 = 5.1, x7 = 7,9, x8 = 4,6
y1 = 6, y2 = 1, y3 = 5, y4 = 4, y5 = 4, y6 = 8, y7 = 1, y8 = 7.
z1 = 31, z2 = 62, z3 = 7, z4 = 15, z5 = 53, z6 = 16, z7 = 94, z8 = 59.
Hãy tính
6 8 4
(a) 𝑖=1 𝑤𝑖 (b) 𝑖=1 𝑧𝑖 (c) 𝑘=1 𝑦2𝑘
7 7
(d) 𝑖=3 𝑥2𝑖−7 (e) 𝑗 =3(𝑦𝑗 − 𝑦𝑗 −2 )

Các câu hỏi 19 -24 có cùng giả thiết với câu hỏi 18.

19. Gọi vij = wi yj (ví dụ v23 = w2.y3 = 11 × 5 = 55). Tính:


(i) 3𝑖=1 7𝑗 =1 𝑣𝑖𝑗 (ìi) 5𝑖=2 4𝑗 =3 𝑣𝑖𝑗 .
20. Chứng minh rằng 5𝑖=1 3𝑥𝑖 = 3 5𝑖=1 𝑥𝑖 .
21. Chứng minh rằng 4𝑖=1 (3𝑥𝑖 − 2𝑦𝑖 ) = 3 5𝑖=1 𝑥𝑖 − 2 4𝑖=1 𝑦𝑖 .
22. Chứng minh rằng 4𝑗 =1(𝑧𝑗 − 6) = 4𝑖=1 𝑧𝑖 − 24.
23. Chứng minh rằng 5𝑖=1 (𝑤𝑖 − 3)2 = 5𝑖=1 𝑤𝑖2 − 6 5𝑖=1 𝑤𝑖 + 5 × 9.
24. Chứng minh rằng 6𝑖=1 𝑤𝑖 6𝑖=1 𝑦𝑖 ≠ 6𝑖=1 𝑤𝑖 𝑦𝑖
25. Chứng minh rằng (i) 𝑛𝑘 =0 𝑥𝑘 = 𝑛𝑘 =0 𝑥𝑛−𝑘 (ii) 𝑛𝑖=1 𝑥𝑖 = 𝑛𝑖=1 𝑥𝑛+1−𝑖
26. Tìm phần trăm sai số trong công thức của Stirling khi n = 10 và n = 20.

23

You might also like