You are on page 1of 22

Phương pháp xác suất

trong giải tích tổ hợp


Trần Nam Dũng
Khoa Toán - Trường Đại học Khoa học Tự nhiên Tp Hồ Chí Minh
3/21/2011
Khi trích dẫn xin đề rõ nguồn

Giải tích tổ hợp đóng vai trò quan trọng trong việc xây dựng lý thuyết xác suất cổ điển.
Ngược lại, phương pháp xác suất tỏ ra rất hiệu quả trong việc giải quyết các vấn đề của
giải tích tổ hợp. Bài viết này tóm tắt những khái niệm và tính chất cơ bản của phân bố
xác suất, biến ngẫu nhiên, moment của biến ngẫu nhiên và giới thiệu một số ứng dụng
ban đầu của phương pháp xác suất trong giải tích tổ hợp.
Trần Nam Dũng

1. Phân bố xác suất và biến ngẫu nhiên

1.1. Không gian xác suất. Ta xét một phép thử nào đó mà cho phép thực hiện lặp
lại vô hạn lần với một số điều kiện cho trước và kết quả là ngẫu nhiên, tức là
không thể nói trước trước khi thực hiện nó. Một phép thử như vậy được gọi là một
phép thử ngẫu nhiên và kết quả của nó là kết quả của phép thử ngẫu nhiên.

Tập hợp  gồm tất cả các kết quả có thể của phép thử ngẫu nhiên được gọi là
không gian các biến cố sơ cấp và phần tử của nó được gọi là biến cố sơ cấp. Họ
các tập con F của không gian các biến cố sơ cấp  được gọi là -đại số, nếu thoả
mãn các điều kiện sau
1)   F ;
2) Từ điều kiện A  F suy ra A  F ;
3) Nếu {An} là dãy các tập hợp thuộc F thì
 

 Ai  F ,  Ai  F .
i 1 i 1

Ta nhận xét rằng chỉ cần có một bao hàm thức là đủ, vì bao hàm thức còn lại sẽ là
 
hệ quả do có đẳng thức:  Ai   Ai . Nếu như trên tập hợp  cho một -đại số
i 1 i 1

các tập con F nào đó của nó thì cặp <, F> được gọi là không gian đo được. Mọi
tập con A  F được gọi là biến cố. Ta nói biến cố A là trường hợp riêng của biến
cố B, nếu như A  B. Biến cố, bao gồm những biến cố sơ cấp hoặc thuộc biến cố
A  F, hoặc thuộc biến cố B  F được gọi là tổng (hợp) các biến cố này và ký
hiệu là AB. Tích (giao) các biến cố A  B bao gồm các biến cố sơ cấp vừa thuộc
A  F, vừa thuộc B  F. Hiệu của các biến cố A \ B là tập hợp các biến cố thuộc
A  F nhưng không thuộc B  F. Biến cố A   \ A được gọi là biến cố đối hay
phủ định của biến cố A. Toàn bộ tập hợp  gọi là biến cố tin cậy, còn tập hợp
rỗng    được gọi là biến cố không thể xảy ra. Hai biến cố A  F và B  F
được gọi là xung khắc (không tương thích), nếu
A  B = .

Ví dụ với phép thử tung một con xúc xắc có các mặt được đánh số từ 1 đến 6. Việc
ra một mặt nào đó sau một lần tung là biến cố sơ cấp. Có thể nêu ra một số biến
cố: A – số xuất hiện trên mặt là số lẻ; B – số xuất hiện trên mặt là số nguyên tố; C
Trần Nam Dũng

- số xuất hiện trên mặt là số chẵn. Rõ ràng A  B (ở đây ta coi 1 cũng là số


nguyên tố!) C  A , A  C = .
Xác suất P là hàm số xác định trên -đại số F của không gian đo được <, F> và
thoả mãn các điều kiện sau đây:
1) P(A)  0 với mọi A  F;
2) Với mọi dãy {Ai} các biến cố đôi một xung khắc nhau ta có đẳng thức
 
P( Ai )   P( Ai );
i 1 i 1

3) P() = 1.
Bộ ba <, F, P> được gọi là không gian xác suất.
Từ định nghĩa của xác suất ta suy ra các tính chất sau đây của nó.
1. P() = 0 vì    = .
2. P( A)  P( A)  1 vì A  A  , A  A  .
3. Nếu A  B thì P(A)  P(B), vì P( A)  P( A  B)  P( B). Từ đây cũng suy ra
rằng P(A)  1.
4. Với mọi biến cố A1, A2, …, An
n n
P( Ak )   (1) k 1 S k ,
i 1 k 1

trong đó
Sk   P( A
1i1 ...ik  n
i1  ...  Aik ).

Công thức này chính là một trường hợp của nguyên lý bao hàm và loại trừ, khi
trọng lượng của các phần tử bằng xác suất.
5. Với mọi biến cố A1, A2, …, An ta có bất đẳng thức
n n
P( Ak )   P( Ak ),
i 1 k 1

được suy ra từ bất đẳng thức Bonferroni.

Nếu không gian các biến cố sơ cấp  rời rạc, tức là nếu  = (1, 2, …) trong đó
1, 2, … là các biến cố sơ cấp, thì đối với xác suất của biến cố A ta có đẳng thức
P( A)   P( ) , trong đó tổng lấy theo tất cả các biến cố sơ cấp thuộc vào A.
A

Tổng của chuỗi bên tay phải của đẳng thức luôn luôn xác định vì nó hội tụ tuyệt
đối do các điều kiện P( )  0,  P( )  1.


Như trong ví dụ tung con xúc xắc nói trên, ta đặt  = {1, 2, 3, 4, 5, 6}, F = 2,
P(1) = P(2) = … = P(6) = 1/6. Khi đó P(A) = P(C) = 1/2, P(B) = 2/3.
Trần Nam Dũng

Với các biến cố A, B  F với P(B) > 0 thì xác suất có điều kiện của biến cố A với
điều kiện B được xác định bởi công thức
P( A  B)
P( A | B)  .
P( B)
Với dãy các biến cố (B1, B2, …) sao cho BiBj = , i  j, P(Bi) > 0, i = 1, 2, …,

và biến cố A   Bi ta có công thức xác suất toàn phần
i 1

P( A)   P( B j ) P( A | B j ).
j 1

Như trong ví dụ trên, xác suất có điều kiện số xuất hiện trên mặt là số chẵn với
1/ 6 1
điều kiện số đó là số nguyên tố bằng P(C | B)   . Tương tự xác suất có điều
2/3 4
kiện số xuất hiện trên mặt là số lẻ với điều kiện nó là số nguyên tố bằng
1/ 2 3
P( A | B)   .
2/3 4

Nếu như bây giờ D là biến cố để số xuất hiện trên mặt chia hết cho 3 thì theo công
thức xác suất toàn phần
1 1 1 1 1
P( D)  P( A) P( D | A)  P(C ) P( D | C )  .  .  .
2 3 2 3 3
Biến cố A1, A2, …, An được gọi là độc lập trong toàn thể nếu
P( Ai  ...  Ai )  P( Ai )...P( Ai ) với mọi 1  i1 < …< ik  n. Rõ ràng nếu các biến
1 k 1 k

cố A và B là độc lập thì P(A | B) = P(A).

Trong ví dụ xét ở trên các biến cố A và D (tương ứng C và D) độc lập vì P(D|A) =
P(D|C) = P(D) = 1/3.

1.2. Biến ngẫu nhiên. Biến ngẫu nhiên  trên không gian xác suất <, F, P> là
hàm số  = (),    từ  vào tập hợp các số thực R sao cho với mọi x thuộc
R, tập hợp ( < x) = {: () < x} thuộc -đại số F. Hàm số F(x) = P( < x) được
gọi là hàm phân phối của biến ngẫu nhiên . Hàm số F(x) xác định trên toàn trục
số, không giảm và liên tục trái. Ngoài ra
lim F ( x)  0, lim F ( x)  1.
x  x 

Nếu biến ngẫu nhiên  rời rạc, tức là chỉ nhận với xác suất dương các giá trị x1, x2,
… x1 < x2 < … thì các xác suất
Trần Nam Dũng

P( = xk) = F(xk+0) - F(xk),  P(  x k )  1 , k = 1, 2, …


Xk

xác định phân phối của .

Biến ngẫu nhiên  có phân phối Poisson với tham số  > 0, nếu
k  
P(  k )  e , k  0,1,...
k!
Hàm phân phối trong trường hợp này có dạng
 k  
F ( x)  
 e ,x0
k  x k!
0, x  0.

Biến ngẫu nhiên  được gọi là liên tục, nếu đối với hàm phân phối F(x) tồn tại
hàm f(x)  0, sao cho
x 
F ( x)  

f  ( y)dy,  f  ( y)dy  1.


Hàm số f(x) được gọi là mật độ của phân phối .

Ví dụ về biến ngẫu nhiên liên tục có thể lấy biến ngẫu nhiên có phân phối chuẩn
với các tham số (m, ) xác định bởi hàm phân phối dạng
x
1
e
( u  m ) /( 2 2 )
Fm, ( x) 
2
du,
 2 

trong đó  > 0.

Với các biến ngẫu nhiên 1, 2, …, n, xác định trên không gian xác suất <, F,
P>, véc-tơ (1, 2, …, n) được gọi là biến ngẫu nhiên n-chiều, còn hàm số F(x1,
x2, …, xn) = P(1<x1, 2 < x2, …, n < xn) là hàm phân phối của nó. Biến ngẫu
nhiên (1, 2, …, n) được gọi là liên tục nếu tồn tại hàm số f(y1, …, yn)  0, gọi là
mật độ của phân phối, sao cho
x1 xn  
F ( x1 ,..., xn )   ...  f ( y1 ,..., y n )dy1 ...dy n ,  ...  f ( y ,..., y
1 n )dy1 ...dy n  1.
   

Biến ngẫu nhiên (1, 2, …, n) có phân phối chuẩn n-chiều không suy biến nếu
mật độ phân phối của nó có dạng
1
| A |  2 Q ( x1 ,...,xn )
f ( x1 ,..., xn )  e
(2 ) n
Trần Nam Dũng

n
trong đó Q( x1 ,..., xn )  a
i , j 1
ij xi x j là dạng toàn phương xác định dương và |A| là

định thức của ma trận A = (aij).

Các biến ngẫu nhiên (1,…, n) được gọi là độc lập, nếu F(x1, …, xn) = F1(x1)
…Fn(xn). Các biến ngẫu nhiên của dãy vô hạn (1, 2, …) độc lập nếu đẳng thức
trên đúng với mọi n. Nếu biến ngẫu nhiên (1,…, n) liên tục và 1,…, n độc lập,
thì đối với mật độ phân phối ta có đẳng thức f(x1, …, xn) = f1(x1) …fn(xn). Đối
với các biến ngẫu nhiên rời rạc độc lập 1,…, n ta có công thức
P(1 = x1, …, n = xn) = P(1 = x1)…P(n = xn).

2. Moment của các biến ngẫu nhiên

2.1. Tích phân Stieltjes. Ta định nghĩa tích phân Stieltjes cho hàm phân phối F(x)
và hàm số g(x), liên tục trên đoạn [a, b] của đường thẳng thực. Ta chia đoạn [a, b]
thành n đoạn [xi-1, xi], 1  i  n, sao cho a = x0 < x1 < …< xn-1 < xn = b và thiết lập
các tổng
n n
s n   mi [ F ( xi )  F ( xi 1 )], S n   M i [ F ( xi )  F ( xi 1 )],
i 1 i 1

trong đó mi và Mi tương ứng là giá trị nhỏ nhất và giá trị lớn nhất của hàm số g(x)
trên đoạn [xi-1, xi]. Từ tính liên tục đều của hàm số g(x) trên đoạn [a, b] suy ra rằng
với mọi  > 0, tồn tại  > 0 sao cho Mi – mi <  với xi – xi-1 <  với mọi 1  i  n.
Như vậy Sn – sn < [F(b) – F(a)] và từ đó
b
lim S n  lim s n   g ( x)dF ( x). (2.1)
n  n 
a

Giới hạn này được gọi là tích phân Stieltjes của hàm số g(x) theo hàm số F(x).

Nếu F(x) có đạo hàm liên tục trên đoạn [a, b] thì tồn tại điểm xi , xi 1  xi  xi sao
cho F ( xi )  F ( xi 1 )  ( xi  xi 1 ) F ' ( xi ). Trong trường hợp này tích phân Stieltjes
được đưa về tích phân Rieman thông thường và
b b

 g ( x)dF ( x)  g ( x) F ' ( x)dx.


a a

Tích phân Stieltjes suy rộng được xác định bởi đẳng thức
 b

 g ( x)dF ( x)  lim  g ( x)dF ( x).



a 
b  a
Trần Nam Dũng

Trong phần tiếp theo, ta sẽ cho rằng tích phân Stieltjes của hàm số g(x) theo hàm
số F(x) tồn tại nếu như tích phân tương ứng của hàm số |g(x)| tồn tại.

2.2. Moment. Cho biến ngẫu nhiên  trên không gian xác suất <, F, P>. Kỳ vọng
toán học hay giá trị trung bình của biến ngẫu nhiên  là số

M   xdF (x)

(2.2)

trong đó F(x) là hàm phân phối của . Nếu như  là biến ngẫu nhiên rời rạc sao
cho P( = xk) > 0, k = 0, 1, 2, … thì tích phân Stieltjes tương ứng đưa về tổng
và kỳ vọng toán học có dạng

M  x
k  
k P(  xk ) (2.3)

Với biến ngẫu nhiên liên tục  với mật độ phân phối f(x) kỳ vọng toán học được
tính qua tích phân Rieman:

M   xf ( x)dx.

(2.4)

Từ tính chất của tích phân Stieltjes suy ra các tính chất của kỳ vọng toán học :
1) M(a + b) = aM + b, trong đó a và b là các hằng số
2) M(1 + 2) = M1 + M2, nếu M1, M2 tồn tại;
3) nếu 1 và 2 là các biến ngẫu nhiên độc lập thì
M(1.2) = M1. M2; (2.5)
4) nếu h() là hàm không âm của biến ngẫu nhiên , thì với mọi  > 0
Mh( )
P(h( )   )  . (2.6)

Bất đẳng thức này suy ra từ đánh giá sau
Mh( )   h( x)dF ( x)  P(h( )   ).
x:h ( x )

Phương sai của biến ngẫu nhiên  được định nghĩa bởi đẳng thức
D = M(-M)2 (2.7)
Từ định nghĩa suy ra các tính chất sau đây của phương sai :
1) D(C) = C2D, trong đó C là hằng số ;
2) nếu 1 và 2 là các biến ngẫu nhiên độc lập thì
D(1 + 2) = D1 + D2. (2.8)

Từ tính chất 4 của kỳ vọng toán học ta suy ra bất đẳng thức Chebysev
P(| - M|)  D/2. (2.9)
Trần Nam Dũng

Nếu như với biến ngẫu nhiên  tồn tại giá trị Mk = Mk, thì ta gọi nó là moment
bậc k của . Tương tự M||k và k = M(-M)k nếu chúng tồn tại sẽ được gọi
tương ứng là moment tuyệt đối và moment trung tâm bậc k. Từ các tính chất của
kỳ vọng toán học ta suy ra các hệ thức
k
M k   C kj  j M 1k  j , (2.10)
j 0
k
 k   (1) k  j C kj M j M 1k  j , (2.11)
j 0

trong đó 0 = M0 = 1 và k = 0, 1, 2, …

Moment giai thừa và moment nhị thức được định nghĩa bởi các đẳng thức
[M]k = M()k, (2.12)
 
Bk  M  , k  0,1,... (2.13)
k 
 
trong đó ()k = (-1)…(-k+1) và    ( ) k / k!, k=1, 2, …()0 = 1.
k  
Sử dụng s(k, j) và (k, j) – các số Stirling loại 1 và loại 2 ta dễ dàng xác lập được
các công thức
[M]k = Bk.k!, (2.14)
k
[ M ]k   s(k , j ) M j , (2.15)
j 0
k
M k    (k , j )[M ] j . (2.16)
j 0

Để làm ví dụ, chúng ta tính một số moment cho phân phối chuẩn và phân phối
Poisson. Moment trung tâm bậc k của phân phối chuẩn với tham số (m, ) có dạng

1
 k   ( x  m) k e ( x  m ) /( 2 2 )
2
dx.
  2
Phép đổi biến z = (x-m)/ trong tích phân ở vế phải của đẳng thức này đưa công
thức về dạng

k
k  z e z
2
k /2
dz.
2 

Từ đây suy ra rằng k = 0 với k = 2r+1, r = 0, 1, … Việc tính 2r với r = 1, 2, …


sẽ được thực hiện dựa vào hằng đẳng thức
Trần Nam Dũng


2
e
tx 2 / 2
dx  , t  0.

t
Vì tích phân hội tụ đều với t > 0 nên, lấy đạo hàm r lần theo t, ta được

1 (2r )! r 1 / 2
x e tx dx 
2
2r /2
.t .
2  2 r .r!
Cho t = 1 vào hai vế của đẳng thức này, cuối cùng ta thu được
(2r )! 2 r
 2r   , r  1,2,... (2.17)
2 r .r!
Đối với phân phối Poisson với tham số  > 0 ta có biểu thức sau cho moment nhị
thức bậc k:
  j 
Bk   C j
k
e .
j k j!
Từ đó suy ra
k
Bk  , k  0,1,... (2.18)
k!

2.3. Indicator. Xét các biến cố ngẫu nhiên A1, A2, …, An. Biến ngẫu nhiên i
được gọi là indicator của biến cố Ai, nếu
i = 1 nếu Ai xảy ra và i = 0 nếu Ai không xảy ra trong phép thử
Nếu  là biến ngẫu nhiên, bằng với số trường hợp xảy ra trong phép thử của tập
hợp A1, A2, …, An thì  = 1 + 2 + … + n.

Xét hằng đẳng thức


     
     1 ... n ,
 k  k1 ... kn k  k1   k n 
trong đó tổng lấy theo tất cả các nghiệm nguyên không âm của phương trình k 1 +
… + kn = k. Ta tính kỳ vọng toán học ở hai vế của đẳng thức này. Ta tìm được
biểu thức cho moment nhị thức bậc k của biến ngẫu nhiên :
Bkn   P( j1  1,...,  jk  1). (2.19)
1 j1 ... jk  n

Từ công thức
n
 j
Bkn     P(  j ), k  0,1,... (2.20)
j k  k 

ta suy ra công thức tính phân phối của  qua các moment nhị thức
n
k 
P(  r )   (1) k r   Bkn , r  0,1,..., n. (2.21)
k r r 
Trần Nam Dũng

Có thể kiểm tra tính đúng đắn của công thức này bằng cách thế trực tiếp biểu thức
của Bkn. Bây giờ, nếu P(Aj1, …, Ajk) là xác suất xảy ra các biến cố Aj1, …, Ajk và
S kn   P( A
1 j1 ... jk  n
j1 ... A jk ),

thì do
P(Aj1…Ajk) = P(j1 = 1, …, jk = 1), (2.22)
ta được
Bkn = Skn, k = 0, 1, 2, … (2.23)

Nếu Pn(r) là xác suất xảy ra đúng r biến cố trong tập hợp A1, A2, …, An, thì từ
đẳng thức Pn(r) = P( = r) suy ra
n
k 
Pn (r )   (1) k r  S kn , r  0,1,..., n, (2.24)
k r r 
tức là ta đi đến công thức của nguyên lý bao hàm và loại trừ, khi trọng lượng của
các phần tử là phân phối xác suất. Để đơn giản các tính toán khi đánh giá phân
phối của biến ngẫu nhiên  ta có thể sử dụng bất đẳng thức Bonferroni:
r  2
k   r  2 
0  Pn (r )   (1) k r  Bkn    Rr  2 ,n (2.25)
k r r  r 
nr
0   , r  0,1,..., n.
2
Sử dụng các bất đẳng thức này, với một số điều kiện ta tìm biểu thức giới hạn cho
phân phối (2.21) khi n  .

2.4. Định lý giới hạn. Ta sẽ thiết lập các điều kiện để phân phối của biến ngẫu
nhiên  khi n   dần đến phân phối Poisson.

Định lý 1. Nếu với mọi k = 0, 1, … đối với moment nhị thức Bkn của biến ngẫu
nhiên  ta có đẳng thức
k
lim Bkn  , (2.26)
n  k!
thì
r
lim Pn (r )  e  , r  0,1,... (2.27)
n  r!

Nói cách khác, định lý khẳng định rằng từ sự hội tụ khi n   của các moment
nhị thức về moment nhị thức của phân phối Poisson với tham số  suy ra sự hội tụ
của chính phân phối của  về phân phối Poisson với cùng tham số.
Trần Nam Dũng

Để chứng minh định lý ta xét  > 0 bất kỳ và chọn  sao cho với r cố định
r  2 
 . (2.28)
r!(2 )! 6e
Xét bất đẳng thức
r
| Pn (r )  e  | R1  R2  R3 , (2.29)
r!
trong đó
k 
r  2 1
R1 | Pn (r )  
(1) k  r   Bkn ,
k r r 
r  2 1
 k  k 
R2 |  (1) k  r    Bkn   |,
k r  r  k! 
r  2 1
 k  k r
R3 |  (1) k  r    e  |.
k r  r  k! r!
r  2 
Từ bất đẳng thức R3  e và điều kiện (2.28) trong cách chọn , ta có
r!(2 )!
R3 < /3 (2.30)
Từ đẳng thức (2.26) suy ra tồn tại n1 sao cho với mọi n > n1
r  2 
| Br  2 ,n  | .
(r  2 )!  r  2 
6 
r 
Từ bất đẳng thức (2.28) suy ra rằng với n > n1 và với  đã chọn
 r  2  
  Br  2 ,n  , suy ra, theo bất đẳng thức (2.25)
r  3
R1 < /3 (2.31)
Cuối cùng, từ đẳng thức (2.26) suy ra tồn tại n2 sao cho với n > n2
k  k 

r k r  2
  Bkn 
1  r 

k! 6
.

Điều này có nghĩa là với mọi n > n2


R2 < /3 (2.32)
Chọn n3 = max(n1, n2). Khi đó với mọi n > n3 từ các bất đẳng thức (2.29)-(2.32)
suy ra rằng
r
Pn (r )  e    .
r!
Định lý được chứng minh.
Trần Nam Dũng

2.5. Công thức nghịch đảo. Công thức nghịch đảo dạng (2.21), cho phép tính
biểu thức của phân phối xác suất qua các moment nhị thức có thể thu được cả
trong trường hợp biến ngẫu nhiên rời rạc không nhất thiết bị chặn. Ta có định lý
sau.

Định lý 2. Nếu các moment nhị thức Bk của biến ngẫu nhiên rời rạc  tồn tại với
mọi k = 0, 1, 2, … và
  lim sup Bk1 / k   (2.33)
k 

thì
k 
 

 k  r  k j
P(  r )     k 1  (1) j r 
r k
d B j , (2.34)
k  r (1  d ) j r  j r
trong đó d là một số không âm, lớn hơn 2 – 1.

Nếu như  < 1 thì có thể chọn d = 0 và công thức (2.34) có dạng

k 
P(  r )   (1) k r   Bk , r  0,1,... (2.35)
k r r 
Ví dụ, đối với biến ngẫu nhiên  có phân phối Poisson với tham số , theo công
thức (2.18) ta có   lim Bk1 / k  0. Vì vậy từ các công thức (2.35) và (2.18) ta có
k 

 k  k r  
P(  r )   (1) k r    e , r  0,1,...
k r  r  k! r!
Thực chất trong định lý 2 đã phát biểu các điều kiện để một phân phối rời rạc được
xác định bởi các moment nhị thức của mình và cho biểu thức tính phân phối qua
các moment này. Câu hỏi về sự xác định duy nhất phân phối xác suất qua các
moment của nó có nhiều ý nghĩa quan trọng trong khi nghiên cứu sự hội tụ của
phân phối trong trường hợp các moment tương ứng hội tụ.

Định lý 3. Cho {Fn(x)} là dãy hàm phân phối, mà tất cả các moment

M kn  x dFn ( x), k  1,2,...
k



hữu hạn và giả sử lim M kn  M k với mọi k  1. Khi đó tồn tại dãy con {Fnj(x)} của
n

dãy {Fn(x)}, hội tụ tại các điểm liên tục của hàm phân phối F(x), có moment M 1,
M2, … Nếu như các moment này xác định F(x), thì dãy {Fn(x)} hội tụ tại các điểm
liên tục tới F(x).
Trần Nam Dũng

Ta biết rằng phân phối chuẩn và phân phối Poisson được xác định bởi các moment
của chúng. Tiêu chuẩn chung để phân phối xác định bởi các moment i là
1 /( 2 j )
  1 
 

j 0   2 j


 .

n
Ví dụ với phân phối nhị thức Pj    p j q n j , p  q  1, j  0,1,..., n, moment giai
 j
thừa có dạng
[M]kn = (n)kpk, k = 0, 1, …
Nếu như khi n   ta có điều kiện np   thì
lim[M ]kn  k , k  0,1,..
k 

Vì  là moment giai thừa thứ k của phân phối Poisson với tham số  nên từ đây
k

suy ra phân phối nhị thức khi n  , np   dần đến phân phối Poisson với tham
số .

3. Hàm sinh và các định lý giới hạn


3.1. Hàm sinh của các moment. Giả sử  là biến ngẫu nhiên với hàm phân phối
F(x) và đối với biến ngẫu nhiên này tồn tại tất cả các moment

M k  M  x dF ( x), k  0,1,...
k k
(3.1)


trong đó các tích phân trong đẳng thức (3.1) hội tụ tuyệt đối. Hàm sinh của các
moment của biến ngẫu nhiên  được định nghĩa bởi đẳng thức

tk
g (t )   M k , (3.2)
k 0 k!
nếu như chuỗi ở vế phải của (3.2) hội tụ tuyệt đối với mọi |t|  ,  > 0. Trong
trường hợp này ta có thể viết

g (t )   e xt dF ( x), (3.3)


trong đó tích phân hội tụ với mọi |t| < ,  > 0.

Nếu biến ngẫu nhiên  biểu diễn qua biến ngẫu nhiên  bởi hệ thức  = (-a)/b
trong đó a, b là các hằng số nào đó thì các hàm sinh moment tương ứng g (t) và
g(t) sẽ liên hệ với nhau bởi đẳng thức
g (t )  e  at / b g  (t / b) (3.4)
Ví dụ, nếu  có phân phối chuẩn với tham số (0, 1) thì
Trần Nam Dũng

F(x) = P(<x) =
x
1
F ( x)  P(  x)  e
u 2 / 2
du
2 

suy ra
g (t )  e t
2
/2
(3.5)
Từ đây suy ra rằng đối với biến ngẫu nhiên phân phối chuẩn với tham số (m, ),
trong đó

1
e
/( 2 2 )
F ( x)  P(  x)  ( u  m ) 2
du,
 2 

ta có
1
g  (t )  exp{mt   2 t 2 }. (3.6)
2
Hàm sinh của các moment g(t) liên quan chặt chẽ đến hàm số đặc trưng (t) của
biến ngẫu nhiên , trong đó

 (t )   e ixt dF ( x), i   1,


và, suy ra (t) = g(it).

Ta nhận xét rằng sự tồn tại hàm sinh của các moment tại một lân cận của điểm t =
0 tương đương với tính giải tích của hàm số đặc trưng của biến ngẫu nhiên tương
ứng. Đối với phân phối chuẩn với tham số (m, )
1
 m, (t )  exp{imt   2 t 2 }. (3.7)
2
Hàm sinh của các phân phối g(t), nếu nó tồn tại với |t|  ,  > 0, sẽ xác định một
cách duy nhất hàm phân phối F(x) tương ứng.

Nếu như  là biến ngẫu nhiên nhận giá trị nguyên không âm với hàm sinh

P( x)   p j x j , (3.8)
j 0

trong đó pj = P( = j), ngoài ra chuỗi ở vế phải hội tụ với x = x0 > 1 nào đó, thì tất
cả các moment Mk, k=0, 1, … của biến ngẫu nhiên này tồn tại và đối với hàm sinh
của các moment ta có đẳng thức

tk
g (t )   M k  P(e t ), (3.9)
k 0 k!
trong đó chuỗi hội tụ khi |t| < lnx0. Đối với biến ngẫu nhiên giá trị nguyên như vậy
tồn tại cả hàm sinh của moment giai thừa và moment nhị thức:
Trần Nam Dũng


tk
h(t )   [ M ]k , (3.10)
k 0 k!

B(t )   Bk t k , (3.11)
k 0

trong đó các chuỗi hội tụ khi |t| < x0 – 1 và


h(t) = B(t) = P(t+1) (3.12)
Ví dụ với phân phối Poisson với tham số  > 0 ta có pj = e  /j!, j = 0, 1, … và
- j

như vậy
P(x) = e(x-1). (3.13)
Từ đây suy ra rằng
g (t )  e  (e 1) , h(t )  B(t )  e t .
t
(3.14)
Từ các đẳng thức (3.14) suy ra biểu thức của các moment giai thừa và moment nhị
thức của luật phân phối Poisson với tham số :
[M]k = k, Bk = k/k!, k = 0, 1, … (3.15)

3.2. Định lý liên tục. Xét dãy (n) các biến ngẫu nhiên nhận giá trị nguyên không
âm và tương ứng là dãy các hàm sinh Pn(x), n = 1, 2, … Phân phối xác suất pk,
k=0, 1, … được gọi là giới hạn khi n   của phân phối P(n = k), k=0, 1, … của
biến ngẫu nhiên n nếu
lim P( n  k )  pk , k  0,1,...
n

Ta có định lý sau, được gọi là định lý liên tục cho hàm sinh.

Định lý 1. Để có các đẳng thức lim P( n  k )  pk , k  0,1,... điều kiện cần và đủ
n

là với mọi x, 0  x < 1,


lim Pn ( x)  P( x),
n

trong đó P(x) là hàm sinh của phân phối pk, k = 0, 1, …

Ví dụ, với biến ngẫu nhiên n có phân phối nhị thức


 n
P( n  j )    p j q n j , p  q  1, j  0,1,..., n, (3.16)
 j
hàm sinh được xác định bởi công thức sau :
Pn(x) = (px + q)n. (3.17)
Nếu như với n   ta có np   thì lim Pn ( x)  e  ( x 1)
, nghĩa là phân phối nhị
n

thức có giới hạn là phân phối Poisson với tham số .


Trần Nam Dũng

3.3. Các định lý giới hạn. Giả sử F(x) = P( < x) và Fn(x) = P(n<x) là các hàm
phân phối của các biến ngẫu nhiên  và n, n=1, 2,… Ta nói rằng Fn(x) hội tụ yếu
về F(x) khi n  , nếu lim Fn ( x)  F ( x) tại mỗi điểm liên tục của F(x). Trong các
n

phần sau ta sẽ thường xuyên sử dụng định lý sau của Curtiss.

Định lý 2. Cho Fn(x), gn(t) tương ứng là hàm phân phối và hàm sinh các moment
của biến ngẫu nhiên n, n=1, 2, … Nếu như gn(t) tồn tại với |t| < t1 với mọi
n>n0 và nếu như tồn tại hàm số g(t), xác định và bị chặn với mọi |t|t2<t1, t2>0
sao cho lim g n (t )  g (t ) với |t|<t2 thì tồn tại biến ngẫu nhiên  với hàm phân phối
n

F(x), sao cho Fn(x) hội tụ yếu về F(x), hơn nữa sự hội tụ là đều trong từng đoạn
liên tục của F(x). Hàm sinh các moment của  tồn tại với |t| t2 và bằng g(t) trên
đoạn này.

Ví dụ, nếu biến ngẫu nhiên n có phân phối nhị thức (3.16) thì theo đẳng thức
(3.17), hàm sinh các moment có dạng
gn(t) = (pet+q)n (3.18)
Xét biến ngẫu nhiên
  np
n  n . (3.19)
npq
Theo công thức (3.4) hàm sinh các moment của nó có dạng
g n (t )  e t np / q
( pe t / npq
 q) n .
Ta có đẳng thức
lim g n (t )  e t
2
/2
. (3.20)
n

Trong vế phải, theo công thức (3.5), là hàm sinh các moment của phân phối chuẩn
với tham số (0, 1). Theo định lý Curtiss từ đây suy ra rằng biến ngẫu nhiên n
trong giới hạn có phân phối chuẩn với tham số (0, 1).

Trong việc giải quyết các bài toán xác suất trong giải tích tổ hợp, từ đánh giá tiệm
cận các hàm sinh của các biến ngẫu nhiên giá trị nguyên nhiều khi đã có thể nhận
được các thông tin về tính chất của phân phối tại giới hạn.

3.4. Định lý giới hạn trung tâm. Đối với các hàm đặc trưng ta có định lý tương tự
với định lý Curtiss
Trần Nam Dũng

Định lý 3. Giả sử (n) là dãy các biến ngẫu nhiên và (n(t), (Fn(t)) tương ứng là
dãy các hàm đặc trưng và hàm phân phối. Nếu tồn tại một hàm số (t) liên tục tại
điểm t = 0 sao cho lim  n (t )   (t ) với mọi t thì tồn tại biến ngẫu nhiên  với hàm
n

phân phối F(x) sao cho Fn(x) hội tụ yếu về F(x) khi n  trên một đoạn liên tục
của F(x). Hàm đặc trưng của  bằng g(t), lim  n (t )   (t ) và sự hội tụ là đều trên
n

từng đoạn hữu hạn.

Như hệ quả của định lý này là định lý giới hạn trung tâm mà chúng ta trình bày ở
dưới đây theo cách phát biểu của A.M.Liapunov.

Định lý 4. Cho dãy các bộ (kn), k=1,2,…, n ; n =1,2,… các biến ngẫu nhiên độc
lập từng đôi, có kỳ vọng toán học mkn = Mkn, phương sai 2kn = Dkn và các
moment tuyệt đối Ckn = M(|kn-mkn|2+),  > 0, hơn nữa
n n
 n2   kn2 , C n2   C kn .
k 1 k 1

Khi đó, nếu điều kiện sau đây được thoả mãn
Cn
lim  0, (3.21)
n  n
n
1
thì khi n  biến ngẫu nhiên
n
 (
k 1
kn  mkn ) một cách tiệm cận là chuẩn với

tham số (0, 1), tức là


 1 n
 1
x
lim P  ( kn  mkn )  x   e
u 2 / 2
du. (3.22)
n 
n k 1  2 

Để ứng dụng định lý 4, sẽ tiện lợi nếu sử dụng các hệ quả dưới đây của nó.

Hệ quả 1. Nếu P(kn=1) = pk = pk(n), P(kn=0) = qk = qk(n), pk + qk = 1, 1n, 2n,


…, nn đôi một độc lập và
n
 n2   p k q k  , (3.23)
k 1
n
1
thì khi n   biến ngẫu nhiên
n
 (
k 1
kn  p k ) một cách tiệm cận là chuẩn với

tham số (0, 1).


Trần Nam Dũng

Hệ quả 2. Nếu tồn tại dãy các số dương (sin), i = 1, 2, …, n sao cho với các biến
ngẫu nhiên 1n, 2n, …, nn đôi một độc lập ta có |in| sin, 1in, ngoài ra khi n 

n
 n2   D in  , (3.24)
k 1

1
max sin  0, (3.25)
n 1i  n

n
1
Thì biến ngẫu nhiên
n
 (
i 1
in  M in ) một cách tiệm cận là chuẩn với tham số (0,

1).

Hệ quả 3. Nếu các biến ngẫu nhiên đôi một độc lập 1n, 2n, …, nn bị chặn đều bởi
n
1
hằng số C, |in|  C, 1 i  n, thì biến ngẫu nhiên
n
 (
i 1
in  M in ) ,

n
 n2   D in  , khi n  , một cách tiệm cận là chuẩn với tham số (0, 1).
k 1

3.5. Nghịch thế của hoán vị. Trên tập hợp n! hoán vị của tập hợp X = {1, 2, …,
n} ta cho phân phối xác suất bằng cách gán cho mỗi một hoán vị xác suất 1/n!. Ta
nói phần tử ik  X, 1  k  n tạo ra r nghịch thế trong hoán vị (i1, i2, …, in), nếu
như nó đứng trước r phần tử có giá trị nhỏ hơn. Ví dụ trong hoán vị (2 1 4 3 5) 2
tạo ra 1 nghịch thế, 1 – không nghịch thế nào, 4 – 1 nghịch thế … Đặt kn, 1  k 
n là số nghịch thế tạo ra bởi phần tử thứ k, 1  k  n, trong một hoán vị ngẫu nhiên
bậc n. Số các hoán vị mà trong đó phần tử k tạo ra j nghịch thế, 0  j  k-1, bằng
n
 (k  1)!(n  k )!. Từ đây suy ra rằng
k 
1
P( kn  j )  , j  0,1,..., k  1.
k
Ta nhận xét rằng số nghịch thế tạo ra bởi phần tử k trong một hoán vị ngẫu nhiên
không phụ thuộc vào vị trí tương đối của các phần tử 1, 2, …, k-1 tức là vào số
nghịch thế tạo ra bởi các phần tử này. Từ đây suy ra kn không phụ thuộc vào 1n,
…, k-1,n. Sự độc lập của kn đối với k+1,n, …, nn suy ra từ định nghĩa của nghịch
thế. Như vậy, các biến ngẫu nhiên 1n, 2n, …, nn đôi một độc lập. Đối với giá trị
trung bình và phương sai của kn, 1  k  n, ta có công thức
k 1 k 2 1  k  1  1 k 3
3

 k
mkn  ,  kn 
2 
, C kn  M  kn   j .
2 2  2
  j 1
Trần Nam Dũng

n n
Như vậy, nếu  n2    kn2 , C n3   C kn , thì Cn/n = O(1/n1/6)  0 khi n  . Từ
k 1 k 1

1 n
 k 1
đó, theo định lý 4 biến ngẫu nhiên
n
  
k 1
kn   khi n   một cách tiệm
2 
cận là chuẩn.

Biến ngẫu nhiên  n  1n   2n  ...   nn biểu diễn cho số nghịch thế trong một hoán
vị ngẫu nhiên bậc n. Ngoài ra, khi n  
n
k 1 n2 n
k 2  1 n3

k 1 2

4
(1  o (1)),  2
n  
k 1 12

36
(1  o(1)).

Vì vậy cuối cùng ta có thể phát biểu định lý sau.

Định lý 5. Nếu n là số nghịch thế trong một hoán vị ngẫu nhiên bậc n thì biến
n  n2 / 4
ngẫu nhiên  ' n  3 / 2 một cách tiệm cận là chuẩn với tham số (0, 1).
n /6

Định lý trên đây cho phép chúng ta có những đánh giá tiệm cận rất chặt về số
nghịch thế của một hoán vị ngẫu nhiên. Các đánh giá này được sử dụng trong các
bài toán về phân tích thuật toán, ví dụ trong các thuật toán sắp xếp.

3.6. Chu trình của hoán vị. Xét quá trình ngẫu nhiên bao gồm n bước. Ở bước
thứ k ta chọn với xác suất bằng nhau phần tử s(k) - ảnh của phần tử k, 1  k  n
của hoán vị ngẫu nhiên s từ tập hợp các phần tử, khác với các phần tử đã được
chọn s(1), …, s(k-1). Vì ảnh s(k) có thể chọn với xác suất bằng nhau từ bất kỳ một
phần tử của tập hợp {1, 2, …, n} \ {s(1), …, s(k-1)}, kết quả là mọi hoán vị bậc n
đều có thể thu được với xác suất 1/n!.

Bước thứ k của quá trình trên ta cho tương ứng với biến ngẫu nhiên kn, 1  k  n,
bằng 1 nếu ở bước này ta chọn được một phần tử đóng một chu trình của hoán vị
và 0 trong trường hợp ngược lại. Vì giữa n-k+1 ảnh s(k) có duy nhất một phần tử
đóng chu trình nên P(kn=1) = 1/(n-k+1), P(kn=0) = (n-k)/(n-k+1). Các biến ngẫu
nhiên 1n, 2n, …, nn độc lập từng đôi và thoả mãn điều kiện của hệ quả 1 của định
lý 4, ngoài ra điều kiện (3.23) thoả mãn, vì khi n  
n
nk
 (n  k  1)
k 1
2
 ln n  O(1)  .

Suy ra, khi n   biến ngẫu nhiên


Trần Nam Dũng

1 n
1 n
nk
n
 ( kn 
k 1 n  k 1
),  n2  
k 1 ( n  k  1)
2
,

một cách tiệm cận là chuẩn với tham số (0, 1).

n
Rõ ràng là biến ngẫu nhiên  n    kn bằng tổng số các chu trình trong một hoán
k 1

vị ngẫu nhiên. Ngoài ra, khi n  


n
1
 n  k  1  ln n  C  o(1),
k 1
(3.26)
n
nk 2

k 1 ( n  k  1)
2
 ln n  C 
6
 o(1), (3.27)

trong đó C = 0,5772… là hằng số Euler. Vì vậy cuối cùng ta thu được định lý sau.

Định lý 6. Nếu n là số chu trình của một hoán vị ngẫu nhiên bậc n thì biến ngẫu
nhiên  ' n  ( n  ln n) / ln n ở giới hạn có phân phối chuẩn với tham số (0, 1).

3. 7. Đồng biến trong hoán vị. Các phần tử ai và ai+1 của hoán vị (a1, a2, …, an)
của các số 1, 2, …, n tạo thành một đồng biến nếu ai < ai+1, , 1  i  n. Ta quy ước
rằng a1 tạo thành một đồng biến.

Gọi Ank là số các hoán vị bậc n với k đồng biến. Dễ thấy An1 = Ann = 1 và Ank =
An,n-k+1. Để thuận tiện, ta đặt A0,0 = 1. Nếu như từ hoán vị (a1, a2, ..., an) có k đồng
biến ta bỏ đi phần tử n, thì trong k trường hợp mà phần tử này nằm giữa các phần
tử đồng biến, ta thu được một hoán vị bậc n-1 với k đồng biến, trong n-k+1 trường
hợp còn lại hoán vị thu được có k-1 đồng biến. Từ đây suy ra hệ thức truy hồi
Ank = (n-k+1)An-1,k-1 + kAn-1,k. (3.28)
Bằng quy nạp theo n, sử dụng hệ thức trên đây, ta thu được công thức
k
 n  1
Ank   (1) j  (k  j ) n , k  1,2,..., n (3.29)
j 0 j 
Giả sử n – biến ngẫu nhiên, bằng với số đồng biến trong một hoán vị bậc n được
chọn ngẫu nhiên. Khi đó
1 k  n  1
P( n  k )   (1) j  (k  j ) n , k  1,2,..., n. (3.30)
n! j 0 j 
Xét các biến ngẫu nhiên liên tục độc lập 1, 2, ..., n, mà mỗi một trong chúng
phân phối đều trên đoạn (0, 1). Ta tìm hàm phân phối của tổng của các biến ngẫu
nhiên Fn(x) = P(1 + 2 + ...+ n < x). Hiển nhiên rằng
Trần Nam Dũng

P(1 + 2 + ...+ n < x) = V(0), (3.31)


trong đó V(0) – thể tích của simplex n chiều 0 = {(x1, …, xn): x1+ ... + xn < x, 0
 xi  1, 1  i  n}. Ta nói rằng điểm (x1, ..., xn) của simplex n chiều  = {(x1, …,
xn): x1+ ... + xn < x, 0  xi, 1  i  n} thoả mãn điều kiện Ai, nếu như xi > 1. Thể
tích của phần của  mà các điểm của nó thoả mãn đồng thời các điều kiện Aj1, ...,
Ajk, được tính theo công thức
( x  k ) n / n!, k  x,
V ( A j1 ... A jk )   (3.32)
0, k  x
Áp dụng phương pháp bao hàm và loại trừ, ta tìm được
[ x]
V ( 0 )   (1) k S k , (3.33)
k 0

trong đó,
S 0  V (), S k  V ( A
1 j1 ... jk  n
j1 ... A jk ), k  1,2,...; (3.34)

[x] – phần nguyên của x.

Từ các công thức (3.32) và (3.33) ta thu được các biểu thức cho hàm phân phối
1 [ x] n
Fn ( x)   (1) j  ( x  j ) n , (3.35)
n! j 0  j
Từ các công thức (3.30) và (3.35) suy ra trực tiếp rằng P(n= k) = Fn(k) – Fn(k-1),
k=1,2, ..., n, tức là Fn(x) với n=1,2, ..., n trùng với hàm phân phối của biến ngẫu
nhiên n.

Các biến ngẫu nhiên 1n, 2n, ..., nn bị chặn đều và Mkn = 1/2, Dkn = 1/12. Do đó
 n

theo hệ quả 3 của định lý 4 biến ngẫu nhiên    kn  n / 2  / n / 12 khi n   một
 k 1 
cách tiệm cận là chuẩn với tham số (0, 1). Từ đây suy ra định lý sau.

Định lý 7. Nếu n là số đồng biến trong một hoán vị ngẫu nhiên bậc n thì khi n 
 biến ngẫu nhiên  ' n   n  n / 2 / n / 12 ở giới hạn sẽ có phân phối chuẩn với
tham số (0, 1).

Tài liệu tham khảo.

[1]. Nguyễn Duy Tiến, Vũ Viết Yên, Lý thuyết xác suất, Nhà xuất bản Giáo dục
2003.
Trần Nam Dũng

[2]. Trần Mạnh Tuấn, Xác suất và thống kê – Lý thuyết và thực hành tính toán,
Nhà xuất bản Đại học quốc gia Hà Nội, 2004.

[3]. V.N. Sachkov, Nhập môn các phương pháp tổ hợp của toán rời rạc, Nhà xuất
bản MCCME, 2004 (tiếng Nga)

[4]. N. Alon and J. H. Spencer, The Probabilistic Method, Wiley, Third Edition
2008.

[5]. Po-Shen Loh, Probabilistic Methods in Combinatorics, Internet.

You might also like