You are on page 1of 110

MUÏC LUÏC GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

MUÏC LUÏC
Lôøi caûm ôn ......................................................................................................................... i
Toùm taét ........................................................................................................................ ii
Muïc luïc ....................................................................................................................... iii
Chöông 0: MÔÛ ÑAÀU ................................................................................................................. 1
Chöông 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI ..................... 3
I. Nhöõng vaán ñeà cô baûn cuûa tieáng noùi .............................................................................. 3
1. Boä maùy phaùt aâm cuûa con ngöôøi ........................................................................ 3
2. Cô quan thính giaùc cuûa con ngöôøi .................................................................... 7
3. Ngöõ aâm tieáng Vieät ............................................................................................. 9
II. Toång quan veà nhaän daïng tieáng noùi ............................................................................. 10
1. Sô löôïc veà nhaän daïng tieáng noùi....................................................................... 10
2. Phaân loaïi .......................................................................................................... 10
3. Caùc höôùng nghieân cöùu nhaän daïng tieáng noùi ................................................... 11
III. Toùm taét ...................................................................................................................... 13
Chöông 2: CÔ SÔÛ XÖÛ LÍ SOÁ TÍN HIEÄU.............................................................................. 15
I. Chuoãi soá ...................................................................................................................... 15
1. Haøm laáy maãu.................................................................................................... 15
2. Söû duïng haøm laáy maãu ...................................................................................... 16
3. Phoå cuûa tín hieäu laáy maãu ................................................................................. 17
4. Lieân heä giöõa phoå cuûa tín hieäu lieân tuïc vaø tín hieäu rôøi raïc ............................. 17
5. Chuoãi xung ñôn vò ............................................................................................ 18
II. Caùc pheùp toaùn tuyeán tính baát bieán .............................................................................. 19
1. Tính nhaân quaû .................................................................................................. 20
2. Phöông trình sai phaân....................................................................................... 21
3. Bieán ñoåi Z cuûa pheùp toaùn LTI ......................................................................... 21
4. Haøm truyeàn trong mieàn taàn soá cuûa pheùp toaùn LTI ......................................... 23
5. Lieân heä giöõa bieán ñoåi Z vaø bieán ñoåi Fourier .................................................. 23
III. Loïc soá ...................................................................................................................... 24
1. Ñònh nghóa ........................................................................................................ 24
2. Caùc boä loïc lyù töôûng .......................................................................................... 26
3. Boä loïc thöïc teá ................................................................................................... 28
4. Boä loïc FIR vaø IIR............................................................................................. 29
IV. Bieán ñoåi Fourier rôøi raïc ............................................................................................... 30
1. Daïng DFT......................................................................................................... 30
2. Tính chaát cuûa DFT ........................................................................................... 31
3. Phoå coâng suaát ................................................................................................... 31
4. Phoå trung bình .................................................................................................. 32
5. Bieán ñoåi Fourier nhanh .................................................................................... 33
V. Bieán ñoåi Fourier thôøi gian ngaén – STFT ..................................................................... 34
1. Coâng thöùc bieán ñoåi........................................................................................... 35

LUAÄN VAÊN TOÁT NGHIEÄP - iii - SVTH: HAØ THUÙC PHUØNG


MUÏC LUÏC GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

2. Moät soá haøm cöûa soå duøng trong STFT.............................................................. 36


VI. Xaùc suaát vaø quaù trình ngaãu nhieân ............................................................................... 38
1. Cô sôû xaùc suaát .................................................................................................. 39
2. Bieán ngaãu nhieân ............................................................................................... 40
3. Kyø voïng, phöông sai ........................................................................................ 40
VII. Toùm taét ...................................................................................................................... 41
Chöông 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI .................................................................. 42
I. Haøm naêng löôïng thôøi gian ngaén .................................................................................. 42
II. Phaùt hieän ñieåm ñaàu, ñieåm cuoái cuûa moät töø ................................................................ 42
III. Tieàn nhaán (Pre-emphasis) ........................................................................................... 45
IV. Trích ñaëc tröng(Mel-scale Frequency Cepstral Coefficient) .................................... 46
1. Cöûa soå hoùa ....................................................................................................... 48
2. Bieán ñoåi Fourier rôøi raïc ................................................................................... 49
3. Loïc qua boä loïc Mel-scale ................................................................................ 49
4. Tính log naêng löôïng phoå .................................................................................. 51
5. Bieán ñoåi Fourier ngöôïc .................................................................................... 51
V. Toùm taét ...................................................................................................................... 52
Chöông 4: LÖÔÏNG TÖÛ VECTOR ........................................................................................ 53
I.Caùc yeáu toá khi toå chöùc VQ .......................................................................................... 53
II.Taäp huaán luyeän VQ ..................................................................................................... 54
III.Ño ñoä meùo.................................................................................................................... 54
IV. Phaân nhoùm caùc vector huaán luyeän .............................................................................. 54
1. Giaûi thuaät cuïm thoâng tin (Cluster Algorithm) ................................................. 55
2. Giaûi thuaät Binary Split ..................................................................................... 57
V. Phaân lôùp vector ............................................................................................................ 58
VI. Nhaän daïng baèng VQ .................................................................................................... 59
VII. Toùm taét ...................................................................................................................... 60
Chöông 5: MOÂ HÌNH MARKOV AÅN (HIDDEN MARKOV MODEL)........................... 61
I. Khaùi nieäm..................................................................................................................... 61
1. Chuoãi Markov .................................................................................................. 61
2. Caùc ví duï .......................................................................................................... 62
3. Moâ hình Markov aån ......................................................................................... 64
II. Caùc thaønh phaàn cuûa HMM .......................................................................................... 64
III. Ba baøi toaùn cô baûn cuûa HMM ..................................................................................... 66
1. Baøi toaùn 1 ......................................................................................................... 67
2. Baøi toaùn 2 ......................................................................................................... 71
3. Baøi toaùn 3 ......................................................................................................... 75
IV. Phaân loaïi moâ hình Markov aån ..................................................................................... 77
V. Vaán ñeà tæ leä khi toå chöùc moâ hình Markov aån .............................................................. 78
VI. Ña quan saùt................................................................................................................... 82
VII. Caùc maãu maät ñoä HMM ................................................................................................ 83
1. Maãu maät ñoä rôøi raïc .......................................................................................... 83

LUAÄN VAÊN TOÁT NGHIEÄP - iv - SVTH: HAØ THUÙC PHUØNG


MUÏC LUÏC GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

2. Maãu maät ñoä lieân tuïc ........................................................................................ 83


3. Maãu maät ñoä baùn lieân tuïc ................................................................................. 85
VIII. Khôûi taïo caùc tham soá cho HMM ................................................................................. 86
IX. AÛnh höôûng cuûa taäp döõ lieäu khoâng ñaày ñuû .................................................................. 87
X. Toå chöùc nhaän daïng tieáng noùi baèng HMM ................................................................... 87
XI. Öu ñieåm nhöôïc ñieåm cuûa HMM ................................................................................. 88
XII. Toùm taét ...................................................................................................................... 89
Chöông 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG ........................................................ 90
I. Trích ñaëc tröng tieáng noùi ............................................................................................. 90
II. Löôïng töû hoùa vector ..................................................................................................... 93
III. Giaûi thuaät huaán luyeän HMM ....................................................................................... 94
IV. Giaûi thuaät nhaän daïng ................................................................................................... 96
V. Giao dieän chöông trình ................................................................................................ 97
VI. Maïch chaáp haønh ......................................................................................................... 101
Chöông 7: KEÁT QUAÛ KEÁT LUAÄN VAØ HÖÔÙNG PHAÙT TRIEÅN ...................................102
I. Keát quaû ....................................................................................................................... 102
II. Keát luaän ...................................................................................................................... 103
III. Höôùng phaùt trieån ........................................................................................................ 104
TAØI LIEÄU THAM KHAÛO ...................................................................................................106

LUAÄN VAÊN TOÁT NGHIEÄP -v- SVTH: HAØ THUÙC PHUØNG


Chöông 0: MÔÛ ÑAÀU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Chöông 0:

MÔÛ ÑAÀU
Ñaõ töø laâu, con ngöôøi luoân mô öôùc ñeán moât heä thoáng ñieàu khieån töï ñoäng “thoâng minh” coù
theå giao tieáp ñöôïc con ngöôøi thaân thieän vaø gaàn guõi. Phöông tieän giao tieáp giöõa ngöôøi vaø
maùy ñöôïc nghó ñeán ñaàu tieân laø tieáng noùi. Con ngöôøi muoán duøng tieáng noùi cuûa mình ñeå
ñieàu khieån thieát bò maø khoâng caàn duøng nhieàu ñeán 2 baøn tay. Ñieàu naøy baây giôø khoâng
coøn quaù xa vôøi nöõa. ÔÛ caùc nöôùc phaùt trieån, caùc heä nhaän daïng tieáng noùi coù maët ôû khaép
moïi nôi hay baát cöù luùc naøo nhö: giao dòch ngaân haøng, mua saém qua ñieän thoaïi, truy caäp
cô sôû döõ lieäu töø xa, goùp phaàn vaøo phaàn vaøo caùc heä baûo maät cho caùc khu vöïc rieâng, caùc
heä ñieàu khieån giao tieáp ngöôøi maùy, vaø raát coù yù nghóa khi laø coâng cuï giuùp ñôõ nhöõng ngöôøi
khieám thò, khuyeát taät trong sinh hoaït hoïc taäp haøng ngaøy... Ñeå thöïc hieän ñöôïc ñieàu naøy,
con ngöôøi phaûi xaây döïng 1 heä thoáng hieåu ñöôïc tieáng noùi cuûa con ngöôøi, ñoù laø heä thoáng
nhaän daïng tieáng noùi.
Hieän nay treân theá giôùi ñaõ coù raát nhieàu nghieân cöùu vaø thöû nghieäm veà heä thoáng nhaän daïng
tieáng noùi vaø ñaõ ñaït ñöôïc nhöõng thaønh töïu nhö: Via Voice Mellennium (IBM), Via Voice
Standard( IBM), CSLU(Center of Spoken Language Understanding),HTK
Toolkit…nhöõng heä thoáng naøy ñöôïc xaây döïng ñeå nhaän daïng tieáng Anh, ngoaøi ra coøn coù
moät soá heä thoáng nhaän daïng tieáng noùi cuûa caùc ngoân ngöõ khaùc nhö: Trung Quoác, YÙ, Ñöùc…
ÔÛ Vieät Nam, coù 2 trung taâm lôùn nghieân cöùu lónh vöïc xöû lyù tieáng noùi vaø tieáng Vieät laø:
Vieän Coâng ngheä thoâng tin vaø Trung taâm nghieân cöùu quoác teá Thoâng tin ña phöông tieän,
truyeàn thoâng vaø öùng duïng(MICA)-Ñaïi hoïc Baùch khoa Haø Noäi. Ngoaøi ra, coøn coù caùc luaän
aùn tieán só, thaïc só lieân quan ñeán vaán ñeà xöû lyù tieáng noùi ôû caùc tröôøng Ñaïi hoïc trong nöôùc.

Luaän vaên naøy nghieân cöùu nhöõng yù töôûng cô baûn cuûa heä thoáng nhaän daïng tieáng noùi -
tieáng Vieät, tìm hieåu giaûi thuaät nhaän daïng tieáng noùi ñaõ vaø ñang ñöôïc thöïc hieän treân theá
giôùi; xaây döïng moät boä ñieàu khieån baèng tieáng noùi – tieáng Vieät döïa treân nhöõng boä töø vöïng
nhoû(15 töø) vaø thieát laäp heä thoáng ñieàu khieån baèng tieáng noùi vôùi moät taäp leänh coá ñònh. Moâ
hình ñieàu khieån ñeøn vaø quaït laø nhöõng öùng duïng thöïc teá mang tính thöû nghieäm cuûa ñeà taøi.

Nhieäm vuï chính cuûa luaän vaên bao goàm:

Nghieân cöùu phöông phaùp vaø thöïc hieän caùc giaûi thuaät taùch töø, trích ñaëc tröng tieáng
noùi, thöïc hieän vieäc huaán luyeän vaø nhaän daïng tieáng noùi Tieáng Vieät duøng phöông
phaùp moâ hình Markov aån keát hôïp vôùi phöông phaùp löôïng töû Vector.
Xaây döïng moâ hình ñieàu khieån thöïc teá mang tính thöïc nghieäm cho ñeà taøi
Trong thôøi gian haïn cheá vôùi möùc ñoä phöùc taïp cuûa vaán ñeà, luaän vaên naøy chæ laø nhöõng
nghieân cöùu ban ñaàu cho ñeà taøi nhaän daïng tieáng noùi - tieáng Vieät. Heä thoáng nhaän daïng

LUAÄN VAÊN TOÁT NGHIEÄP -1- SVTH: HAØ THUÙC PHUØNG


Chöông 0: MÔÛ ÑAÀU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

tieáng noùi – tieáng Vieät khoâng theå döøng laïi ôû moät boä töø vöïng coøn quaù nhoû. Tuy vaäy, ñeà
taøi naøy môû ñaàu cho vieäc nghieân cöùu vaø thöïc hieän heä thoáng ñieàu khieån thieát bò baèng
tieáng noùi moät caùch hoaøn chænh theo thôøi gian thöïc vôùi boä töø vöïng lôùn hôn. Vaø khoâng
nhöõng ñöôïc öùng duïng trong ñieàu khieån, ñeà taøi coøn coù theå tieáp tuïc nghieän cöùu aùp duïng
cho caùc moâ hình roäng raõi khaùc giaûi quyeát cho toaøn boä töø ñieån tieáng Vieät trong töông
lai.

LUAÄN VAÊN TOÁT NGHIEÄP -2- SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

Chöông 1:

GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
I. NHÖÕNG VAÁN ÑEÀ CÔ BAÛN CUÛA TIEÁNG NOÙI:

1. Boä maùy phaùt aâm cuûa con ngöôøi:

a. Cô cheá phaùt aâm:

Sô ñoà heä thoáng phaùt aâm cuûa ngöôøi ñöôïc minh hoïa nhö hình veõ:

Hình 1.1: Boä maùy phaùt aâm

(1) Khoang muõi, (2) Voøm mieäng cöùng, (3) OÅ raêng, (4) Voøm mieäng meàm, (5)-(6)-(8)
Löôõi, (7) Löôõi gaø, (9) Hoïng, (10) Naép thanh quaûn, (11)-(12) Daây thanh aâm, (13)
Thanh quaûn, (14) Thöïc quaûn, (15) Khí quaûn.

Heä thoáng phaùt aâm ôû ngöôøi bao goàm: phoåi (lung), khí quaûn (trachea), thanh quaûn
(thanh quaûn), khoang mieäng (oral cavity) vaø khoang muõi (nasal cavity). Thanh quaûn
chöùa hai neáp gaáp goïi laø daây thanh aâm (vocal cords), seõ keùo caêng khi phaùt ra tieáng
noùi. Khoang mieäng goàm moät oáng aâm thanh (acoustic tube) daøi khoaûng 17 cm ôû ngöôøi
nam, phaàn tröôùc keát thuùc ôû moâi vaø phaàn sau keát thuùc ôû daây thanh aâm hoaëc thanh
quaûn. Khoang mieäng ñoùng vai troø laø moät hoäp coäng höôûng ñoäng, theå tích cuûa noù coù
theå ñöôïc ñieàu khieån bôûi boä maùy phaùt aâm ( moâi, löôõi, quai haøm, vaø voøm mieäng
meàm). Khoang muõi laø moät oáng daøi khoaûng 12 cm ôû ngöôøi nam, keát thuùc ôû loã muõi vaø
voøm mieäng meàm. Voøm mieäng meàm (velum) seõ ñieàu khieån hôi phaùt ra theo ñöôøng

LUAÄN VAÊN TOÁT NGHIEÄP -3- SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

mieäng hoaëc ñöôøng muõi. Ñoái vôùi nhöõng aâm khoâng theo gioïng muõi (non-nasalised),
voøm mieäng meàm seõ ñoùng khoang muõi vaø hôi chæ phaùt ra theo ñöôøng mieäng. Ñoái vôùi
nhöõng aâm coù gioïng muõi, voøm mieäng meàm seõ dòch chuyeån xuoáng phía döôùi, ñoùng
ñöôøng mieäng vaø hôi chæ phaùt ra theo ñöôøng muõi. Tröôøng hôïp thöù ba laø hôi ñöôïc phaùt
ra theo caû hai ñöôøng.

Quaù trình phaùt aâm: khi noùi, phoåi chöùa ñaày khoâng khí. Löôïng khoâng khí naøy seõ
ñöôïc ñaåy qua khí quaûn vaø thanh moân (glottis). Luoàng khoâng khí qua thanh moân seõ
kích thích daây thanh aâm dao ñoäng taïo ra söï phaùt aâm. AÂm thanh naøy ñöôïc truyeàn ra
ngoaøi qua khoang mieäng vaø khoang muõi. Caùc khoang naøy coù taùc duïng nhö boä loïc
laøm suy hao moät vaøi taàn soá trong khi cho caùc taàn soá khaùc ñi qua.

b. Ñaëc tröng vaät lyù:

- Ñoä cao:

Laø möùc ñoä cao thaáp cuûa aâm, phuï thuoäc vaøo söï chaán ñoäng nhanh hay chaäm cuûa
khoâng khí trong moät khoaûng thôøi gian nhaát ñònh, ñöôïc goïi laø taàn soá dao ñoäng. Taàn
soá dao ñoäng caøng lôùn thì aâm thanh caøng cao.

- Ñoä maïnh:
Thöôøng ñöôïc goïi laø cöôøng ñoä, do bieân ñoä dao ñoäng quyeát ñònh. Trong ngoân ngöõ,
phuï aâm thöôøng maïnh hôn nguyeân aâm, ñaây chính laø moät trong nhöõng ñaëc ñieåm goùp
phaàn nhaän dieän söï khaùc bieät giöõa phuï aâm vaø nguyeân aâm trong aâm thanh tieáng noùi.

- Ñoä daøi:

Laø tröôøng ñoä cuûa aâm, phuï thuoäc vaøo söï chaán ñoäng laâu hay mau cuûa caùc phaàn töû
khoâng khí. Ñoä daøi ñöôïc söû duïng ñeå phaân bieät caùc nguyeân aâm daøi vaø ngaén, nhö
phaân bieät ‚a‛ vôùi ‚aê‛, ‚ô‛ vôùi ‚aâ‛ trong tieáng Vieät.

- AÂm saéc:
Laø saéc thaùi rieâng cuûa moät aâm do caùc caù theå khaùc nhau taïo ra. AÂm saéc laø nguyeân
nhaân gaây ra söï khaùc bieät giöõa gioïng noùi cuûa ngöôøi naøy vôùi ngöôøi khaùc. AÂm saéc coù
ñöôïc laø do hieän töôïng coäng höôûng.

- Tieáng oàn vaø tieáng thanh:


Tieáng oàn laø do söï chuyeån ñoäng khoâng nhòp nhaøng (khoâng coù chu kyø oån ñònh) cuûa
caùc phaàn töû khoâng khí gaây ra. Tieáng thanh laø do söï chuyeån ñoäng nhòp nhaøng (coù
chu kyø oån ñònh) cuûa caùc phaàn töû khoâng khí gaây ra.

LUAÄN VAÊN TOÁT NGHIEÄP -4- SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

 Phaân loaïi tieáng noùi:

- AÂm höõu thanh:

Ñöôïc taïo ra khi daây thanh aâm caêng leân vaø rung khi aùp suaát khoâng khí taêng leân, laøm
cho thanh moân môû ra roài ñoùng laïi khi luoàng khoâng khí ñi qua. Boä phaän phaùt aâm hoaït
ñoäng gioáng nhö hoäp coäng höôûng, khuyeách ñaïi nhöõng thaønh phaàn haøi naøy vaø laøm suy
giaûm nhöõng thaønh phaàn haøi khaùc ñeå taïo ra aâm höõu thanh. Möùc ñoä rung cuûa daây
thanh aâm tuøy thuoäc vaøo aùp suaát khoâng khí ôû phoåi vaø söùc caêng cuûa daây thanh aâm.
Ngöôøi noùi coù theå ñieàu khieån 2 yeáu toá treân ñeå thaøy ñoåi chu kì cô baûn (ñöôïc goïi laø
pitch) cuûa aâm thanh. ÔÛ ngöôøi ñaøn oâng, taàn soá cô baûn khoaûng töø 50÷250 Hz, trong khi
ôû phuï nöõ laø thöôøng rôi vaøo khoaûng 120÷500 Hz.
Trong ngoân ngöõ, caùc nguyeân aâm veà baûn chaát aâm hoïc laø nhöõng aâm höõu thanh.

- AÂm voâ thanh:


Ñöôïc taïo ra khi daây thanh aâm khoâng rung. Coù hai loaïi aâm voâ thanh cô baûn: aâm xaùt
vaø aâm baät hôi.

Ñoái vôùi aâm xaùt, ví duï khi noùi ‚s‛, ‚x‛, moät soá ñieåm treân boä phaän phaùt aâm bò
co laïi khi luoàng khoâng khí ñi ngang qua noù, hoãn loaïn xaûy ra taïo neân nhieãu
ngaãu nhieân. Bôûi vì nhöõng ñieåm co thöôøng ôû phía tröôùc mieäng, coäng höôûng
cuûa boä phaän phaùt aâm coù aûnh höôûng nhoû ñeán ñaëc tính cuûa aâm xaùt.
Ñoái vôùi aâm baät hôi, nhö khi ta noùi ‘h’ trong ‚huøng‛, hoãn loaïn xaûy ra ôû gaàn
thanh moân khi daây thanh aâm bò giöõ nheï moät phaàn. Tröôøng hôïp naøy, coäng
höôûng cuûa boä phaän phaùt aâm seõ bieán ñieäu phoå cuûa nhieãu ngaãu nhieân. Hieäu
öùng naøy coù theå nghe roõ khi noùi thì thaàm.
Caáu taïo cô baûn cuûa phuï aâm trong moïi ngoân ngöõ laø aâm voâ thanh.

Ngoaøi hai loaïi aâm cô baûn ôû treân, coøn coù moät loaïi aâm trung gian vöøa mang tính chaát
nguyeân aâm, vöøa mang tính chaát phuï aâm, ñöôïc goïi laø baùn nguyeân aâm hay baùn phuï
aâm. Ví duï nhö aâm ‘i’ vaø ‘u’ trong nhöõng töø ‘ai’, ‘aâu’.

- AÂm baät hôi:

Khi phaùt caùc aâm naøy, boä maùy phaùt aâm seõ ñöôïc ñoùng laïi hoaøn toaøn taïi moät ñieåm
naøo ñoù trong boä maùy phaùt aâm. Aùp suaát khoâng khí trong boä maùy phaùt aâm seõ taêng
leân töùc thôøi vaø ñöôïc giaûi phoùng moät caùch ñoät ngoät. Söï giaûi thoaùt nhanh choùng cuûa
aùp suaát naøy seõ taïo neân moät söï kích thích taïm thôøi cuûa boä maùy phaùt aâm.

LUAÄN VAÊN TOÁT NGHIEÄP -5- SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

c. Moâ hình loïc nguoàn taïo tieáng noùi:

Hình 1.2 minh hoïa moâ hình raát ñôn giaûn cuûa boä phaän phaùt ra nguyeân aâm ‚e‛ laø moät
oáng ñeàu coù chieàu daøi L, moät ñaàu nguoàn aâm thanh(daây thanh aâm) vaø ñaàu kia ñöôïc
môû ra(moâi). OÁng naøy coäng höôûng ôû caùc taàn soá leû f0, 3f0, 5f0… vôùi f0=c/4L vôùi c laø
vaän toác aâm thanh trong khoâng khí. Ví duï, L=17cm, c=300m/s, thì seõ coäng höôûng ôû
caùc taàn soá: 500Hz, 1500Hz, 2500Hz,… nhöõng ñænh coäng höôûng naøy ñöôïc goïi laø caùc
Formant. Boä phaän phaùt aâm coù theå nhieàu daïng khaùc nhau vaø taïo ra nhöõng ñænh coäng
höôûng khaùc nhau hay caùc giaù trò Formant khaùc nhau neân aâm thanh phaùt ra khaùc
nhau. Trong tieáng noùi, caùc taàn soá Formant luoân thay ñoåi töø aâm naøy sang aâm khaùc.

Hình 1.2 Moâ hình oáng ñeàu cuûa boä phaän phaùt aâm

Quaù trình hình thaønh tieáng noùi ñöôïc bieåu dieãn baèng moâ hình Source-filter:

Hình 1.3 Taïo tieáng noùi theo moâ hình loïc nguoàn

Tín hieäu vaøo laø tín hieäu töø nguoàn aâm thanh(cuõng coù theå laø coù chu kì hay nhieãu) ñöôïc
loïc baèng boä loïc coù tính chaát coäng höôûng töông töï vôùi boä phaän phaùt aâm. Phoå cuûa tín
hieäu tieáng noùi thu ñöôïc baèng caùch nhaân phoå cuûa boä loïc vôùi phoå cuûa tín hieäu. AV, AN
laø caùc ñoä lôïi bieåu thò cöôøng ñoä cuûa aâm thanh vaø cöôøng ñoä nhieãu.

LUAÄN VAÊN TOÁT NGHIEÄP -6- SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

Moät boä phaän phaùt aâm co moät soá höõu haïn Formant, nhöng chæ caàn quan taâm ñeán 3
hay 4 Formant ñaàu tieân treân baêng taàn töø 100Hz ñeán 3.5kHz do bieân ñoä cuûa caùc
Formant cao hôn bò suy giaûm gaàn nhö hoaøn toaøn vôùi ñoä suy giaûm -12dB/octave.
Tröôøng hôïp tieáng noùi voâ thanh, phoå töông ñoái baèng phaúng, soá löôïng caùc Formant nhö
vaäy vaãn ñuû maëc duø tieáng noùi voâ thanh coù baêng taàn môû roäng leân ñeán 7-8kHz. Ngoaøi
ra, do aûnh höôûng böùc xaï cuûa mieäng neân bieân ñoä ñöôïc taêng leân chöøng 6dB/octave
trong baêng taàn 0-3kHz. Chình vì vaäy maø ñeán phaàn tieàn xöû lyù tín hieäu ta phaûi duøng boä
loïc tieàn nhaán ñeå buø theâm +6dB/octave.

2. Cô quan thính giaùc cuûa con ngöôøi:

a. Caáu taïo:

Hình 1.4 Caáu taïo cô quan thính giaùc

Tai ngoaøi:

Bao goàm coù vaønh tai vaø loã tai, chính loã tai seõ daãn tín hieäu aâm thanh ñeán maøng
nhó vaø laøm cho maøng nhó rung leân. Ñoä leäch cuûa maøng nhó khoaûng chöøng vaøi
nanomet vaø moät tieáng noùi thaàm coù theå taïo ra moät ñoä leäch chæ baèng moät phaàn
möôøi baùn kính nguyeân töû hydro.

Tai giöõa:

Coù moät xöông nhoû goïi laø xöông buùa aùp saùt vaøo maøng nhó. Trong luùc maøng nhó
rung leân, vì xöông buùa lieân keát vôùi caùc xöông khaùc, goïi laø xöông ñe, laøm xöông
naøy coù theå quay. Trong luùc quay, xöông ñe laïi lieân keát vôùi moät xöông khaùc, goïi

LUAÄN VAÊN TOÁT NGHIEÄP -7- SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

laø xöông baøn ñaïp, noù aùp saùt vaøo cöûa soå hình ovan cuûa vuøng trong tai. Ba xöông
naøy (buùa, ñe, baøn ñaïp) laø nhöõng xöông nhoû nhaát trong cô theå con ngöôøi vaø ñöôïc
goïi chung laø xöông nhoû. Chöùc naêng cuûa noù laø truyeàn taûi söï rung ñoäng cuûa maøng
nhó ñeán cöûa soå hình oval ôû trong tai.

Tai trong:

Cöûa soå hình oval laø moät maøng phuû nhaày, môû roäng trong böùc töôøng xöông coù caáu
truùc xoaén oác, ñöôïc goïi laø oác tai. Chaát loûng trong oác tai ñöôïc chia theo chieàu daøi
cuûa noù thaønh hai maøng nhaày, goïi laø maøng nhaày Reissner vaø maøng nhaày cô
baûn(maøng ñaùy). Söï rung ñoäng cuûa cöûa soå oval gaây neân soùng aùp suaát truyeàn ñeán
chaát loûng ôû trong xöông nhoû vaø aùp suaát cuûa soùng gaây treân maøng nhaày cô baûn
moät ñoä leäch taïi nhöõng ñieåm khaùc nhau doïc theo chieàu daøi cuûa noù. Aùp chaët vaøo
maøng nhaày cô baûn laø cô quan voû naõo. Cô quan naøy chöùa khoaûng 30000 teá baøo
hình sôïi. Moãi teá baøo naøy coù nhieàu sôïi nhoû li ti nhoâ ra. Caùc sôïi daây naøy uoán cong
nhôø söï vaän ñoäng cuûa maøng nhaày cô baûn vaø nhôø ñoù caùc teá baøo hình sôïi hoaït
ñoäng. Caùc teá baøo hình sôïi naøy lieân keát vôùi caùc ñaàu cuoái cuûa nôron cuûa heä thaàn
kinh ñeå truyeàn tín hieäu veà naõo.
b. Cô cheá nghe:

Khi ta nghe moät soùng aâm thuaàn tuyù töùc aâm ñôn (soùng sine), nhöõng ñieåm khaùc nhau
treân maøng ñaùy seõ rung ñoäng thao taàn soá cuûa aâm ñôn ñi vaøo tai. Ñieåm leäch lôùn nhaát
treân maøng ñaùy phuï thuoäc taàn soá aâm ñôn. Taàn soá caøng cao taïo ra ñieåm leäch lôùn nhaát
ôû phía ñaùy vaø taàn soá thaáp taïo ra ñieåm leäch lôùn nhaát phía ñænh. Nhö vaäy maøng ñaùy
ñoùng vai troø phaân tích taàn soá tín hieäu vaøo phöùc taïp, baèng caùch taùch nhöõng taàn soá
khaùc nhau ôû nhöõng ñieåm khaùc nhau doïc theo chieàu daøi cuûa noù. Moãi ñieåm nhö vaäy coù
theå xem laø moät boä loïc thoâng daûi coù taàn soá trung taâm vaø baêng thoâng xaùc ñònh. Nhöõng
ñaùp öùng naøy khoâng ñoái xöùng quanh taàn soá trung taâm, vuøng taàn soá cao coù toác ñoä suy
giaûm doác hôn nhieàu so vôùi vuøng taàn soá thaáp. Vò trí cuûa ñoä leäch cöïc ñaïi doïc theo
maøng nhaøy bieán thieân phi tuyeán theo taàn soá (theo haøm logarit).
Nhöõng nghieân cöùu chæ ra raèng ngöôõng nghe cuûa moät aâm ñôn taêng leân khi coù söï hieän
dieän cuûa nhöõng aâm ñôn laân caän khaùc (aâm maët naï) vaø chæ coù baêng taàn heïp xung
quanh aâm ñôn môùi tham gia vaøo hieäu öùng maë naï, baêng taàn naøy thöôøng goïi laø baêng
taàn tôùi haïn. Giaù trò cuûa baêng taàn tôùi haïn phuï thuoäc vaøo tanà soá cuûa aâm ñôn caàn thöû.
Vôùi aâm ñôn 100Hz, baêng taàn tôùi haïn xaáp xæ 90Hz, vôùi aâm ñôn 5kHz laø xaáp xæ 1kHz.

LUAÄN VAÊN TOÁT NGHIEÄP -8- SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

Coù theå xem quaù trình nghe cuûa heä thính giaùc laø moät daõy cacù boä loïc baêng thoâng, coù
ñaùp öùng phuû laáp leân nhau vaø baêng thoâng hieäu quaû cuûa chuùng xaáp xæ baêng thoâng tôùi
haïn. Ñaây laø cô sôû cho vieäc thieát keá daõy baêng loïc sau naøy.

3. Ngöõ aâm tieáng Vieät:

a. AÂm vò

Veà maët ngoân ngöõ hoïc, coù theå xem tieáng noùi laø moät chuoãi caùc aâm cô baûn ñöôïc goïi laø
aâm vò. AÂm vò laø ñôn vò ngoân ngöõ tröøu töôïng vaø khoâng theå quan saùt tröïc tieáp trong tín
hieäu tieáng noùi. Nhieàu aâm vò khaùc nhau keát hôïp vôùi nhau moät caùch naøo ñoù ñeå taïo ra
nhöõng aâm thanh khaùc nhau.

b. Nguyeân aâm

Nguyeân aâm ñöôïc xaùc ñònh bôûi hoác coäng höôûng khoang mieäng vaø hoác yeát haàu-nguoàn
goác cuûa caùc Formant.

Khoang mieäng vaø khoang yeát haàu ñöôïc taùch bieät ra bôûi löôõi. Do ñoù, söï thay ñoåi cuûa
khoang naøy ñoàng nghóa vôùi söï thay ñoåi cuûa khoang kia. Vieäc xaùc ñònh theå tích, hình
daùng, loái thoaùt khoâng khí cuûa nhöõng hoác coäng höôûng naøy, töùc xaùc ñònh khaû naêng
coäng höôûng cuûa chuùng, chính laø moâ taû ñoä môû cuûa mieäng, vò trí cuûa löôõi vaø hình daùng
cuûa moâi.

c. Phuï aâm

Ñaëc ñieåm cô baûn cuûa phuï aâm laø söï caáu taïo baèng luoàng khoâng khí bò caûn trôû, söï caûn
trôû naøy dieãn ra vôùi nhöõng möùc ñoä khaùc nhau, caùch thöùc khaùc nhau vaø ôû nhöõng boä
phaän khaùc nhau cuûa cô quan phaùt aâm. Phuï aâm ñuôïc chia ra phuï aâm taéc (nhö ‘p’, ‘t’,
‘ñ’, ‘b’) vaø phuï aâm xaùt(nhö ‘v’, ‘s’, ‘x’)

Phuï aâm taéc: Ñaëc tröng laø moät tieáng noå, do luoàng khoâng khí bò caûn trôû hoaøn
toaøn, phaûi phaù vôõ söï caûn trôû ñeå thoaùt ra ngoaøi. Phuï aâm taéc ñöôïc chia laøm phuï
aâm baät hôi (nhö ‘th’)vaø phuï aâm muõi (nhö ‘m’, ‘n’, ‘ng’, ‘nh’).

Phuï aâm xaùt: Ñaëc tröng laø tieáng coï xaùt, phaùt sinh do luoàng khoâng khi ñi ra bò
caûn trôû khoâng hoaøn toaøn(chæ bò khoù khaên) phaûi laùch qua moät khe hôû nhoû vaø
trong khi thoaùt ra ngoaøi coï xaùt vaøo thaønh cuûa boä phaän phaùt aâm

d. Thanh ñieäu:

LUAÄN VAÊN TOÁT NGHIEÄP -9- SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

Thanh ñieäu laø söï naâng cao hay haï thaáp ‚gioïng noùi‛ trong moät aâm tieát. AÂm tieát laø ñôn
vò phaùt aâm nhoû nhaát, trong tieáng Vieät aâm tieát laø moät töø. Thanh ñieäu laø söï thay ñoåi
cao ñoä cuûa gioïng noùi, ñieàu ñoù coù nghóa thay ñoåi bieân ñoä taàn soá cô baûn trong aâm höõu
thanh. Thanh ñieäu ñöôïc xaùc ñònh baèng taàn soá cô baûn.

Qua phaàn phaân tích ngöõ aâm, ta thaáy raèng, khi phaùt aâm moät töø (toång quaùt goàm phuï aâm,
nguyeân aâm, thanh ñieäu), daây thanh aâm rung taïo ra daïng soùng cuûa luoàng khoâng khí, ñeán
löôït boä phaän caáu aâm vaø muõi bieán ñoåi chaäm laøm thay ñoåi daïng soùng phaùt ra beân ngoaøi
ñeå taïo ra nhöõng töø khaùc nhau. Nhö vaäy tín hieäu tieáng noùi laø do xung böôùc soùng chaäp vôùi
tín hieäu bieân thieân chaäm cuûa boä phaän caáu aâm. Ñieàu naøy daãn tôùi vieäc trích tham soá tieáng
noùi raát hieäu quaû laø phaân tích cepstral, trong phöông phaùp naøy ngöôøi ta muoán laáy phaàn
tín hieäu coù taàn soá thaáp do boä phaän caáu aâm taïo ra. Chi tieát veà cepstral ñöôïc trình baøy chi
tieát trong chöông 3.

II. TOÅNG QUAN VEÀ NHAÄN DAÏNG TIEÁNG NOÙI:

1. Sô löôïc veà nhaän daïng tieáng noùi:

Vaán ñeà nhaän daïng tieáng noùi laø moät vaán ñeà lôùn, nhieàu nghieân cöùu ñaõ thöïc hieän trong vaøi
thaäp nieân gaàn ñaây. Caùc heä thoáng vôùi boä töø vöïng nhoû, nhaäp töø rôøi raïc coù theå aùp duïng
trong nhöõng öùng duïng töông ñoái ñôn giaûn ñeå caûi thieän hieäu quaû nhaäp thoâng tin vaøo
maùy, trong moâi tröôøng saûn xuaát, hoaëc trong nhöõng öùng duïng töø xa vôùi thieát bò.

Nhaän daïng tieáng ñaõ ñöôïc nghieân cöùu hôn 40 naêm qua. Nhöõng noã löïc ñaàu tieân ñöôïc thöïc
hieän töø nhöõng naêm 1950. Ñaàu nhöõng naêm 1970, heä thoáng nhaän daïng tieáng noùi ñöôïc
thieát keá ñeå nhaän daïng phaùt aâm rôøi raïc trong moâi tröôøng khoâng nhieãu (noise free). Caùc
heä thoáng duøng boä töø vöïng nhoû(10-100 töø) vaø trong tröôøng hôïp nguôøi noùi cuõng laø ngöôøi
huaán luyeän. Töø ñoù ñeán nay, cuøng vôùi söï phaùt trieån cuûa maùy tính, kó thuaät nhaän daïng
tieáng noùi ñaõ coù nhöõng söï tieán boä vöôït baäc, ñöôïc thöïc hieän baèng nhöõng phöông phaùp
giaûi thuaät môùi hieän ñaïi vaø hieäu quaû ngaøy caøng cao.

2. Phaân loaïi

Trong vieäc ñaùnh giaù, phaân loaïi moät heä thoáng nhaän daïng, ngöôøi ta döïa vaøo caùc tieâu chí
sau:
Theo caùch thöùc ngöôøi noùi: noùi chung chia thaønh 2 loaïi
o Nhaän daïng töø rôøi raïc: moãi töø caàn nhaän daïng ñöôïc phaùt aâm moät caùch rôøi
raïc, coù caùc khoaûng nghæ tröôùc vaø sau khi phaùt aâm moät töø. Ñeà taøi naøy thöïc
hieän theo heä thoáng naøy.

LUAÄN VAÊN TOÁT NGHIEÄP - 10 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

o Nhaän daïng töø lieân tuïc: Tieáng noùi ñöôïc phaùt lieân tuïc trong moät chuoãi tín
hieäu nhö moät caâu noùi, ñoïc moät ñoaïn vaên…
Döïa treân boä töø vöïng:
o Heä thoáng vôùi töø vöïng nhoû ( ~10:100 töø ).
o Heä thoáng maø caùc töø ñöôïc ñoïc rôøi raïc (boä töø vöïng coù theå vöôït 1000 töø ).
o Heä thoáng chaáp nhaän tieáng noùi lieân tuïc nhöng chæ lieân quan ñeán phaïm vi
öùng duïng töông ñoái bò giôùi haïn (boä töø vöïng ~1000:5000 töø).
Döïa treân thoâng tin veà caùc maãu tieáng noùi cuûa ngöôøi söû duïng bao goàm:
o Heä thoáng phuï thuoäc ngöôøi noùi (speaker-dependent): ñöôïc laøm cho töông
thích vôùi töøng ngöôøi rieâng bieät.
o Heä thoáng ñoäc laäp ngöôøi noùi (speaker-dependent):coù theå laøm vieäc vôùi
moät soá löôïng lôùn ngöôøi söû duïng.
o Heä thoáng thích öùng ngöôøi noùi:töï caäp nhaät thoâng tin veà töøng ngöôøi söû
duïng rieâng bieät trong thôøi gian heä thoáng söû duïng.

3. Nhöõng yeáu toá aûnh höôûng ñeán hieäu quaû cuûa heä nhaän daïng tieáng noùi:

Xem xeùt caùc yeáu toá aûnh höôûng ñeán vieäc thaønh coâng hay thaát baïi cuûa heä thoáng
nhaän daïng tieáng noùi vaø chæ ra möùc ñoä phöùc taïp cuûa vieäc thieát keá nhaän daïng.
Nhöõng yeáu toá quyeát ñònh ñeán chaát löôïng vaø hieäu quaû cuûa heä thoáng nhaän daïng
tieáng noùi ñöôïc thieát keá döôùi daïng nhöõng caâu hoûi sau:
1. Heä thoáng ñöôïc thieát keá ñeå nhaän daïng moät caù nhaân hay nhieàu ngöôøi.
2. Kích thöôùc boä töø vöïng nhö theá naøo.
3. Tieáng noùi ñöôïc nhaäp vaøo baèng caùc töø rôøi raïc vôùi khoaûng döøng ñuû lôùn
hoaëc phaùt aâm lieân tuïc.
4. Söï khoâng roõ raøng vaø nhaàm laãn ngöõ aâm trong moät boä töø vöïng laø gì.
5. Heä thoáng nhaän daïng trong moâi tröôøng yeân tónh hay nhieãu.
6. Kieán thöùc ngöõ aâm hoïc naøo ñöôïc vaän duïng vaøo boä nhaän daïng.
4. Caùc höôùng nghieân cöùu nhaän daïng tieáng noùi:

Noùi chung thì ta coù theå xeáp caùc phöông phaùp nhaän daïng tieáng noùi theo moät trong ba
nhoùm sau:
a. Höôùng ngöõ aâm hoïc:

LUAÄN VAÊN TOÁT NGHIEÄP - 11 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

Caùc nghieân cöùu ban ñaàu döïa vaøo vieäc tìm aâm tieáng noùi vaø gaùn nhaõn (label) cho
caùc aâm naøy. Ñaây laø cô sôû cuûa aâm hoïc ngöõ aâm vôùi giaû thuyeát toàn taïi moät soá höõu
haïn caùc ñôn vò ngöõ aâm khaùc nhau coù theå phaân bieät ñöôïc trong ngoân ngöõ noùi vôùi
caùc ñaëc ñieåm ñöôïc moâ taû baèng caùc ñaëc tính aâm hoïc hieän dieän roõ raøng trong tín
hieäu tieáng noùi. Maëc duø caùc ñaëc tính aâm hoïc cuûa caùc ñôn vò ngöõ aâm coù theå thay ñoåi
theo ngöôøi noùi hoaëc theo caùc aâm laân caän, höôùng nghieân cöùu aâm hoïc ngöõ aâm giaû söû
raèng caùc qui luaät chi phoái söï thay ñoåi laø khoâng phöùc taïp (straightforward) vaø coù theå
cho maùy hoïc deã daøng.
Böôùc ñaàu tieân trong höôùng aâm hoïc ngöõ aâm laø phaân ñoaïn vaø gaùn nhaõn, trong ñoù tín
hieäu tieáng noùi ñöôïc phaân ra thaønh caùc vuøng aâm hoïc oån ñònh, moãi vuøng ñöôïc gaùn
bôûi moät hoaëc nhieàu kyù hieäu ngöõ aâm taïo thaønh moät chuoãi aâm vò moâ taû tieáng noùi.
Böôùc thöù hai laø coá gaéng xaùc ñònh moät töø coù nghóa ( hoaëc moät chuoãi caùc töø ) töø
chuoãi kyù hieäu aâm vò ñöôïc taïo ra trong böôùc ñaàu tieân. Trong quaù trình naøy, caùc giôùi
haïn ngoân ngöõ hoïc, ( ví duï töø vöïng , ngöõ caûnh vaø caùc qui luaät ngöõ nghóa) ñöôïc aùp
duïng ñeå truy xuaát boä töø vöïng vaøo teân chuoãi aâm vò. Höôùng naøy khoâng ñöôïc söû duïng
roäng raõi trong caùc öùng duïng thöông.
b. Höôùng keát hôïp maãu:
Höôùng keát hôïp maãu ( coøn laø ñoái so saùnh maãu ) goàm hai böôùc chính laø huaán luyeän
maãu ( pattern training) vaø so saùnh maãu ( pattern comparision) nhö hình 2.1.4. Ñaëc
tính chuû yeáu cuûa höôùng naøy laø söû duïng caùc cô caáu toaùn hoïc roõ raøng vaø thieát laäp söï
bieãu dieãn thích hôïp caùc maãu tieáng noùi cho vieäc so saùnh chính xaùc caùc maãu huaán
luyeän nghieâm chænh. Tieáng noùi coù theå ñöôïc bieãu dieãn ôû daïng maãu tieáng noùi hoaëc
moät moâ hình thoáng keâ, coù theå ñöôïc aùp duïng cho moät aâm, moät töø hoaëc moät nhoùm töø.
Trong giai ñoaïn so saùnh maãu, coù moät söï so saùnh tröïc tieáp giöõa tieáng noùi chöa bieát
(caàn nhaän daïng vôùi moãi maãu ñöôïc hoïc trong giai ñoaïn huaán luyeän ñeå xaùc ñònh ñaëc
tính cuûa maãu chöa bieát döïa theo chaát löôïng cuûa vieäc phoái hôïp maãu). Höôùng keát
hôïp maãu trôû thaønh phöông phaùp nhaän daïng raát phoå bieán trong nhöõng naêm 90.

LUAÄN VAÊN TOÁT NGHIEÄP - 12 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

Hình 1.5 : Sô ñoà khoái heä nhaän daïng theo höôùng keát hôïp maãu
Coù ba lyù do ñeå nhaän daïng tieáng noùi ñöôïc thieát keá theo höôùng naøy, ñoù laø:
 Raát deã söû duïng , ñôn giaûn vaø deã hieãu.
 OÅn ñònh vaø hieäu quaû vôùi nhieàu boä töø vöïng, nhieàu ngöôøi söû duïng, nhieàu ñaëc
tröng vaø phöông phaùp ñoái saùnh cuõng nhö caùc cô sôû ra quyeát ñònh khaùc nhau.
 Ñaûm baûo chaát löôïng cao
Moâ hình nhaän daïng maãu coù nhöõng ñieåm maïnh vaø yeáu sau :
 Chaát löôïng cuûa heä thoáng khaù nhaïy vôùi löôïng döõ lieäu huaán luyeän taïo ra maãu
tham chieáu ; nghóa laø caøng huaán luyeän nhieàu thì chaát löôïng caøng cao.
 Caùc maãu tham chieáu thöôøng raát nhaïy vôùi moâi tröôøng phaùt aâm vaø caùc ñaëc
tính truyeàn daãn cuûa caùc phöông tieän chuyeån tieáp (micro ) bôûi vì caùc ñaëc
tröng phoå chòu söï taùc ñoäng cuûa nhieàu neàn vaø nhieãu lan truyeàn.
 Phöông phaùp naøy haàu nhö khoâng phuï thuoäc vaøo caùch choïn boä töø vöïng, muïc
ñích nhaän daïng cuõng nhö ngöõ caûnh.
 Khoái löôïng tính toaùn cho huaán luyeän vaø phaân loaïi maãu thöôøng tæ leä tuyeán
tính vôùi soá maãu ñöôïc duøng ñeå huaán luyeän vaø nhaän daïng neân khoù maø thích
hôïp vôùi öùng duïng coù boä töø vöïng lôùn ñoøi hoûi ñaùp öùng thôøi gian thöïc.
 Coù theå aùp duïng roäng raõi cho töøng ñôn vò tieáng noùi nhö töø,aâm vò…Coù theå
phoái hôïp kieán thöùc ngöõ caûnh ñeå naâng cao chaát löôïng nhaän daïng vaø giaûm
khoái löôïng tính toaùn.
c. Höôùng thoâng minh nhaân taïo:

Höôùng thoâng minh nhaân taïo coá gaéng maùy moùc hoaù hoaït ñoäng nhaän daïng theo caùch
con ngöôøi aùp duïng trí khoân trongvieäc hình dung, phaân tích vaø ñaùnh giaù tieáng noùi
döaï treân moät taäp hôïp caùc tính chaát aâm hoïc ño ñöôïc. Trong soá caùc kyõ thuaät ñöôïc söû
duïng trong höôùng naøy coù vieäc söû duïng moät heä thoáng chuyeân gia trong ñoù tích hôïp
aâm vò, töø vöïng, cuù phaùp, ngöõ nghóa vaø ngay caû kieán thöùc thöïc teá cho vieäc phaân
ñoaïn, gaùn nhaõn vaø söû duïng caùc coâng cuï nhö maïng trí tueä nhaân taïo cho vieäc hoïc caùc
quan heä giöõa caùc söï kieän aâm vò. Troïng taâm höôùng naøy chuû yeáu laø söï hieåu bieát kieán
thöùc vaø tích hôïp caùc nguoàn kieán thöùc. Phöông phaùp naøy chöa ñöôïc söû duïng roäng raõi
trong caùc heä thoáng thöông maïi.

III. TOÙM TAÉT:

LUAÄN VAÊN TOÁT NGHIEÄP - 13 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ NHAÄN DAÏNG TIEÁNG NOÙI

Phaàn naøy trình baøy nhöõng cô sôû sinh lyù hoïc vôùi caáu taïo cuûa boä maùy phaùt aâm vaø cô quan
thính giaùc cuûa con ngöôøi. Ngoaøi ra, chöông naøy cuõng ñaõ nghieân cöùu ngöõ aâm tieáng Vieät
vôùi vieäc trình baøy nguyeân aâm, phuï aâm, aâm höõu thanh, voâ thanh, vaø ñaëc bieät laø thanh
ñieäu-moät ñaëc tröng cuûa tieáng Vieät. Vieäc phaân tích boä phaän phaùt aâm vaø quaù trình nhaän
thöùc tieáng noùi cuûa con ngöôøi trong chöông naøy laø cô sôû ñeå phaân tích ñaëc tröng tieáng noùi
baèng caùc heä soá cepstral ñöôïc thöïc hieän ôû Chöông 3-Trích ñaëc tröng tieáng noùi, ñaây laø
böôùc quan troïng phuïc vuï cho coâng vieäc nhaän daïng sau naøy.

LUAÄN VAÊN TOÁT NGHIEÄP - 14 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Chöông 2:
CÔ SÔÛ XÖÛ LÍ SOÁ TÍN HIEÄU
I. CHUOÃI SOÁ:
Muoán cho maùy tính xöû lyù ñöôïc tín hieäu, phaûi laáy maãu tín hieäu taïi nhieàu thôøi ñieåm. Hình
2.1 laø laáy maãu haøm lieân tuïc theo thôøi gian t, moãi maãu caùch nhau T giaây. Keát quaû chuùng
ta ñöôïc taäp caùc soá goïi laø chuoãi soá. Neáu haøm lieân tuïc theo thôøi gian laø x(t) thì haøm laáy
maãu laø x(nT) theo n. Thoâng thöôøng chuùng ta chuaån hoùa thôøi gian giöõa hai laàn laáy maãu
laø 1 neân x(nT) laø x(n).

Hình 2.1: Laáy maãu tín hieäu

1. Haøm laáy maãu


Haøm laáy maãu laø caàu noái giöõa haøm thôøi gian lieân tuïc vaø haøm thôøi gian rôøi raïc. Haøm
laáy maãu coøn coù teân khaùc laø haøm delta Dirac. Haøm laáy maãu coù nhöõng tính chaát sau
ñaây:

Tính chaát 1:  f (t ) (t   )dt 

f ( ) (2.1)


Tính chaát 2:   (t   )dt  1

(2.2)

 ôû hai phöông trình treân coù theå laø giaù trò thöïc.
Ñeå hieåu taïi sao haøm naøy laø haøm laáy maãu lyù töôûng, ñaàu tieân chuùng ta khaûo saùt haøm
laáy maãu thöïc teá (t) nhö minh hoïa hình 2.2. Haøm naøy coù ñoä roäng xung laø moät ñôn vò
theo thôøi gian vaø bieân ñoä laø moät ñôn vò theo bieân ñoä. Roõ raøng tính chaát 2 thoûa maõn.
Tuy nhieân khi nhaân (t) vôùi f(t) thì haøm laáy maãu (t) khoâng laáy taïi moät thôøi ñieåm maø
1 1
laáy trong phaïm vi töø  ñeán . Keát quaû laø tính chaát 1 khoâng thoûa maõn. Chuùng ta coù
2 2

LUAÄN VAÊN TOÁT NGHIEÄP - 15 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

1

 2

 f (t ) (t   )dt   f ( )dt
 1
(2.3)

2

Ñieàu naøy coù theå hieåu laø quaù trình laáy maãu bò nhoøe trong phaïm vi moät daõy lieân quan
ñeán ñoä roäng xung cuûa (t). Muoán xaáp xæ haøm laáy maãu toát hôn thì haøm (t) coù ñoä roäng
xung heïp hôn. Tuy nhieân, khi ñoä roäng xung heïp thì bieân ñoä phaûi taêng leân. Veà maët giôùi
haïn, chuùng ta thaáy raèng haøm laáy maãu lyù töôûng coù ñoä roäng xung heïp voâ haïn sao cho
maãu ñöôïc laáy taïi moät thôøi ñieåm, coøn bieân ñoä lôùn voâ haïn sao cho tín hieäu tín hieäu laáy
maãu coù cuøng naêng löôïng höõu haïn nhö nhau.
(t )

1 1
  
2 2

Hình 2.2 : Haøm laáy maãu thöïc teá

2. Söû duïng haøm laáy maãu


Hình 2.3 minh hoïa quaù trình laáy maãu duøng caùc haøm laáy maãu lyù töôûng taïi caùc thôøi ñieåm
caùch nhau T giaây. Keát quaû chuùng ta ñöôïc daïng soùng theo thôøi gian

x s (t )   x(t ) (t  nT )
n  
(2.4)

Do   t  nT  taïo ra heä soá nhaân khaùc zero taïi nhöõng giaù trò t=nT, neân coù theå vieát laïi
xs(t) nhö sau:

x s (t )   x(nT ) (t  nT )
n  
(2.5)

Trong phöông trình sau cuøng naøy chuùng ta thaáy xuaát hieän chuoãi soá x(nT).

Hình 2.3 :Haøm laáy maãu lyù töôûng

LUAÄN VAÊN TOÁT NGHIEÄP - 16 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

3. Phoå cuûa tín hieäu laáy maãu


Duøng bieán ñoåi Fourier, phoå taàn soá cuûa daïng soùng lieân tuïc theo thôøi gian x(t) ñöôïc vieát
nhö sau :

 x(t)e (2.6)
 j2 ft
X(f )  dt


vaø daïng soùng theo thôøi gian bieåu dieãn theo phoå taàn soá laø :

 X(f )e (2.7)
j2 ft
x(t)  df


Ñieàu naøy ñuùng cho moïi haøm lieân tuïc theo thôøi gian x(t), neân cuõng ñuùng cho xs(t)

 x (t )e (2.8)
 j 2ft
Xs( f )  s dt


Bieåu dieãn xs(t) theo daïng laáy maãu:



  
Xs (f )   n

x(t)(t  nT)  e  j2 ft dt

(2.9)

Thöù töï cuûa pheùp toång vaø tích phaân coù theå thay ñoåi, vaø aùp duïng tính chaát 1 cuûa haøm
laáy maãu

Xs( f )   x(nT )e
n  
 j 2fnT
(2.10)

Phöông trình naøy bieåu dieãn chính xaùc chuoãi Fourier cuûa Xs(f) laø haøm coù chu kyø T.
Caùc heä soá cuûa chuoãi Fourier laø x(nT) ñöôïc tính töø tích phaân sau:
1
2T
x(nT )  T X
1
s ( f )e j 2fnT dt (2.11)

2T

Hai phöông trình sau laø caëp chuoãi Fourier cho pheùp tính tín hieäu theo thôøi gian hay
phoå taàn soá tuøy theo ñoái soá cuûa caëp chuoãi Fourier. Chuù yù raèng tín hieäu xs(t) ñaõ bò loaïi
boû vaø thay vaøo ñoù laø x(nT).
4. Lieân heä giöõa phoå lieân tuïc vaø phoå rôøi raïc
Xeùt phöông trình (2.6) taïi thôøi ñieåm t=nT vaø cho keát quaû naøy baèng veá phaûi cuûa phöông
trình (2.10) chuùng ta thu ñöôïc moái lieân heä giöõa hai phoå nhö sau:
1
 2T

 X ( f )e df  T  X s ( f )e j 2fnT df
j 2fnT
x(nT )  (2.12)
 1
2T

LUAÄN VAÊN TOÁT NGHIEÄP - 17 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Veá phaûi cuûa phöông trình (2.6) coù theå bieåu dieãn laø toång voâ haïn cuûa moät taäp caùc tích
phaân coù giôùi haïn höõu haïn
2 m 1
 2T
x(nT )    X ( f )e
m   2 m 1
j 2fnT
df (2.13)
2T

m m
Ñoåi bieán   f  (thay f    vaø df  d )
T T
1
 2T m
m j 2nT j 2 T nT
x(nT )   
m  
X ( 
T
)e e d (2.14)
1

2T

Di chuyeån pheùp toång vaøo trong tích phaân, chuù yù e j 2mn  1 vôùi moïi m,n nguyeân, vaø
thaønh phaàn beân trong tích phaân töông töï vôùi thaønh phaàn beân trong tích phaân cuûa
phöông trình (2.11) , neân chuùng ta coù moái lieân heä sau:
1  m
Xs( f )  
T m
X(f  )
T
(2.15)

Phöông trình (2.15) noùi leân raèng phoå taàn soá cuûa tín hieäu laáy maãu laø toång voâ haïn phoå taàn
soá cuûa tín hieäu lieân tuïc, ôû ñoù khoaûng caùch giöõa hai phoå taàn soá cuûa tín hieäu lieân tuïc laø
1
.
T
5. Chuoãi xung ñôn vò:
Coù moät chuoãi soá quan troïng laø chuoãi xung ñôn vò vaø kyù hieäu laø u0(n). Chuoãi xung ñôn
vò goàm voâ haïn maãu coù giaù trò zero vôùi moïi n  0 vaø baèng 1 taïi n=0. Hình 2.4 minh hoïa
chuoãi u0(n) vaø u0(n-m).
Tính chaát cuûa chuoãi xung ñôn vò cuõng gioáng nhö tính chaát cuûa haøm laáy maãu

 Tính chaát 1:  x(n)u
n  
0 ( n  m)  x ( m)


 Tính chaát 2: u
n  
0 ( n  m)  1

LUAÄN VAÊN TOÁT NGHIEÄP - 18 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Hình 2.4 Dôøi chuoãi xung ñôn vò

II. CAÙC PHEÙP TOAÙN TUYEÁN TÍNH BAÁT BIEÁN:

Caùc pheùp toaùn ñöôïc söû duïng roäng raõi nhaát trong DSP laø tuyeán tính vaø baát bieán theo thôøi
gian-linear time invariant(LTI)
Tính chaát tuyeán tính ñöôïc phaùt bieåu nhö sau:
Cho x(n) laø chuoãi höõu haïn vaø O{} laø pheùp toaùn trong khoâng gian n-chieàu, ñaët
y(n)= O{x(n)}
Neáu
x(n)=ax1(n)+bx2(n)
ôû ñoù a vaø b laø haèng soá töông öùng vôùi n, neáu O{} laø pheùp toaùn tuyeán tính thì:
y(n)=aO{x1(n)}+bO{x2(n)}
Tính baát bieán theo thôøi gian nghóa laø neáu:
y(n)= O{x(n)}
thì khi dôøi ñi seõ cho ñaùp öùng gioáng nhau:
y(n-m)= O{x(n-m)}
Caùch khaùc ñeå phaùt bieåu tính chaát naøy laø neáu x(n) coù chu kyø laø N
x(n+N)=x(n)
thì pheùp toaùn O{} baát bieán trong khoâng gian n-chieàu laø
O{x(n)}= O{x(n+N)}

LUAÄN VAÊN TOÁT NGHIEÄP - 19 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Ta coù: u 0 (n  m)  1, n  m vaø u0 ( n  m) =0, n coøn laïi neân chuùng ta coù theå vieát x(n) nhö
sau:

x ( n)   x(m)u
m  
0 ( n  m)


Suy ra: y (n)  O{  x(m)u 0 (n  m)}
m  

O{} laø haøm theo n, laø pheùp toaùn tuyeán tính neân:

y ( n)   x(m)O{u
m  
0 (n  m)}

Chuùng ta goïi
h(n)  O{u 0 (n)}

laø ñaùp öùng cuûa chuoãi xung ñôn vò. Do tính baát bieán theo thôøi gian neân:
h(n  m)  O{u 0 (n  m)}

Do ñoù:

y ( n)   x(m)h(n  m)
m  

Phöông trình treân phaùt bieåu raèng y(n) laø toång chaäp x(n) vôùi ñaùp öùng xung h(n). Thay
m  n  p vaøo phöông trình treân ta ñöôïc:

y ( n)   h( p)x(n  p)
p  

1. Tính nhaân quaû:


Cho ñeán baây giôø caùc moâ taû toaùn hoïc cuûa chuoãi soá vaø pheùp toaùn ñeàu giaû thieát laø ñaùp
öùng xung cuûa pheùp toaùn vaãn coù giaù trò ngay caû tröôùc thôøi ñieåm taùc ñoäng cuûa chuoãi soá
vaøo. Ñaây laø daïng toång quaùt cuûa phöông trình vaø phuø hôïp cho phaùt trieån lyù thuyeát. Tuy
nhieân, khoâng coù moät heä vaät lyù naøo coù theå taïo ra chuoãi soá ra khi chöa coù chuoãi soá vaøo
taùc ñoäng. Bôûi vì caùc pheùp toaùn vaø chuoãi soá DSP coù tính vaät lyù neân chuùng ta chæ thaûo
luaän caùc pheùp toaùn vaø chuoãi soá coù theå toàn taïi trong thöïc teá.
Böôùc ñaàu tieân khi bieåu dieãn chuoãi soá thöïc teá laø chuoãi soá phaûi baét ñaàu taïi moät thôøi ñieåm
cuï theå naøo ñoù. Nhö vaäy coù theå giaû thieát raèng caùc thaønh phaàn cuûa chuoãi soá seõ coù giaù trò
zero taïi nhöõng chæ soá thôøi gian nhoû hôn zero, ñoàng thôøi sau thôøi ñieåm zero giaù trò cuûa

LUAÄN VAÊN TOÁT NGHIEÄP - 20 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

chuoãi laø zero hay khaùc zero. Thuoäc tính naøy cuûa chuoãi soá ñöôïc goïi laø nhaân quaû haynois
caùc khaùc chuoãi soá ra cuûa heä DSP taïi thôøi ñieåm n (töùc laø y(n)) chæ phuï thuoäc vaøo chuoãi
soá vaïo taïi thôøi ñieåm hieän taïi vaø quaù khöù (töùc laø x(n), x(n-1), x(n-2),…) chöù khoâng phuï
thuoäc vaøo chuoãi soá töông lai( töùc laø x(n+1), x(n+2),…).
Baây giôø toång chaäp cuûa pheùp toaùn nhaân quaû coù theå vieát:

y (n)   h(m)x(n  m)
m 0

Nghóa laø ñaùp öùng khoâng coù giaù trò vôùi moïi m nhoû hôn zero.

2. Phöông trình sai phaân:


Veà maët lyù thuyeát, caùc pheùp toaùn baát bieán theo ghôøi gian, nhaân quaû, tuyeán tính, rôøi raïc
theo thôøi gian coù theå moâ taû baèng phöông trình sai phaân baäc N:
N 1 N 1

a
m 0
m y ( n  m)   b p x ( n  p )
p 0

Moät caùch toång quaùt, phöông trình khoâng thay ñoåi neáu taát caû caùc heä soá chuaån hoùa theo
a0 :
N 1 N 1
y ( n)   a m y ( n  m)   b p x ( n  p )
m 1 p 0

Hay
N 1 N 1
y ( n)   b p x ( n  p )   a m y ( n  m)
p 0 m 1

3. Bieán ñoåi Z cuûa pheùp toaùn LTI:


Coù pheùp bieán ñoåi tuyeán tính raát hieäu quaû ñeå phaântichs tínhieeuj rôøi raïc theo thôøi gian,
gioáng nhö pheùp bieán ñoåi Laplace ñeå phaân tích tín hieäu lieân tuïc theo thôøi gian. Pheùp
bieán ñoåi naøy laø bieán ñoåi Z vaø ñöôïc ñònh nghóa nhö sau:

Z{x(n)}  X ( z )   x(n) z n
n 0

ÔÛ ñoù, kyù hieäu L{x(n)} goïi laø “bieán ñoåi Z cuûa x(n)” vaø z trong phöông trình treân laø soá
phöùc. . Caùc giaù trò cuûa z treân maët phaúng phöùc sao cho X(z) xaùc ñònh goïi laø vuøng hoäi tuï
(ROC) cuûa X(z).
Caùc tính chaát cuûa pheùp bieán ñoåi Z:

LUAÄN VAÊN TOÁT NGHIEÄP - 21 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

1. Tuyeán tính:
neáu: Z{x1(n)} = X1(z)
vaø: Z{x2(n)} = X2(z)
thì: Z{ax1(n) + bx2(n)} = a X1(z) + bX2(z)
vôùi a, b laø caùc haèng soá baát kyø.
2. Dôøi thôøi gian:
neáu: Z{x(n)} = X(z)

thì: Z{x(n - k)} = z  k X(z)


3. Co trong mieàn z:
neáu: Z{x(n)} = X(z)
thì: Z{anx(n)} = X(a-1z)
vôùi a laø haèng soá baát kyø.
4. Ñaûo thôøi gian:
neáu: Z{x(n)} = X(z)
thì: Z{x(-n)} = X(z-1)
5. Vi phaân trong mieàn z:
neáu: Z{x(n)} = X(z)
dX(z)
thì: Z{nx(n)} = -z
z
6. Thay ñoåi thang tæ leä:
neáu: Z{x(n)} = X(z)
z
thì: Z{anx(n)} = X( )
a
vôùi a laø haèng soá baát kyø.
7. Tính toång chaäp:
neáu: Z{x1(n)} = X1(z)
vaø: Z{x2(n)} = X2(z)
thì: Z{x1(n) * x2(n)} = X1(z).X2(z)

LUAÄN VAÊN TOÁT NGHIEÄP - 22 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

4. Haøm truyeàn trong mieàn taàn soá cuûa pheùp toaùn LTI:
Vieát laïi phöông trình:

y (n)   h(m)x(n  m)
m 0

Laáy bieán ñoåi Fourier hai veá phöông trình treân:



F{ y (n)}   h(m).F{x(n  m)}
n 0


Y ( f )   h(m).e  j 2fm . X ( f )
n 0

Chia hai veá cho X ( f ) , chuùng ta coù:



Y( f )
  h(m).e  j 2fm
X ( f ) n 0

Veá phaûi laø bieán ñoåi Fourier cuûa chuoãi h(m) neân:

Y( f )
 H ( f )  T {h(m)}
X( f )

Hình 2.5 Mieàn thôøi gian vaø mieàn taàn soá cuûa pheùp toaùn LTI

5. Lieân heä giöõa bieán ñoåi Z vaø bieán ñoåi Fourier:


Bieán ñoåi Z cuûa chuoãi x(n) ñöôïc ñònh nghóa:

X(z) =  x (n )z  n
n  

ñaët z = r.ej , ta coù:

LUAÄN VAÊN TOÁT NGHIEÄP - 23 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC


X(z) zr.e j =  x ( n ) r  n e  jn
n  

Bieán ñoåi Fourier cuûa chuoãi x(n) ñöôïc ñònh nghóa:



X() =  x ( n ) e  jn
n  

Töø caùc bieåu thöùc treân thaáy bieán ñoåi Fourier coù theå ñöôïc xem nhö bieán ñoåi Z cuûa
moät chuoãi tính treân voøng troøn ñôn vò r = 1 hay |z| = 1:

X() = X(z) |z|1 =  x ( n ) e  jn
n  

III. LOÏC SOÁ:

1. Ñònh nghóa:

Boä loïc soá laømoät heä thoáng soá duøng ñeå laøm bieán daïng söï phaân boá taàn soá cuûa caùc thaønh
phaàn cuûa moät tín hieäu theo caùc chæ tieâu ñaõ cho.

Loïc soá laø caùc thao taùc cuûa xöû lyù duøng ñeå laøm bieán daïng söï phaân boá taàn soá cuûa caùc thaønh
phaàn cuûa moät tín hieäu theo caùc chæ tieâu ñaõ cho nhôø moät heä thoáng soá.
Moät boä loïc soá laø moät heä thoáng tuyeán tính baát bieán trong mieàn taàn soá, coù sô ñoà khoái:

 
Vôùi: yn   h n  * x n    h m x n  m   x n  * h n    xmhn  m
m   m  

h(n): ñaùp öùng xung cuûa heä thoáng


Ngoaøi ra heä thoáng coøn ñöôïc bieåu dieån bôûi phöông trình sai phaân tuyeán tính sau ñaây:
N M
 a k yn  k    b k xn  k 
k 0 k 0

Toång hôïp taác caû caùc heä soá ak vaø bk seõ bieåu dieãn moät heä thoáng tuyeán tính baát bieán. Töùc laø
caùc heä soá ak vaø bk laø ñaëc tröng hoaøn toaøn cho heä thoáng.
Trong mieàn Z heä thoáng ñöôïc ñaëc tröng bôûi haøm truyeàn ñaït H(z)

LUAÄN VAÊN TOÁT NGHIEÄP - 24 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Yz 
 b k z k
Hz   Zh n    k 0
Xz  N
 a k z k
k 0

(z  z1 )(z  z 2 )...( z  z M )
Hay H(z) = G.zk .
(z  p1 )(z  p 2 )...( z  p N )

 
Ñaùp öùng taàn soá H e j
M

Y e  k 0
b k e  jk
H e j  
j

 
X e j N
 a k e  jk
k 0

(e j  z1 )(e j  z 2 )...(e j  z M )
hay H(ej) = G. ejk .
(e j  p1 )(e j  p 2 )...(e j  p N )

     
Y e j  H e j .X e j

Quan heä giöõa ñaàu vaøo, ñaàu ra vaø ñaùp öùng xung cuûa heä thoáng naøy phaûi thoûa maõn ñieàu
kieän sau:

yn   h n  * x n    hm xn  m 
m0

Lhn   0, 

 hn  <
n 0

Caùc quan heä naøy cho thaáy chieàu daøi cuûa ñaùp öùng xung h(n) laø raát quan troïng, vì caùc heä soá
h(n) laø ñaëc tröng cuûa heä thoáng.
Vì theá chuùng ta coù theå phaân loaïi caùc heä thoáng thaønh hai loaïi lôùn tuyø theo chieàu daøi cuûa
ñaùp öùng xung h(n). Hai loaïi naøy nhö sau:
Loaïi thöù nhaát: Heä thoáng ñöôïc ñaëc tröng bôûi ñaùp öùng xung coùa chieàu daøi höõu haïn
(Finite Impulse Response- FIR), töùc laø h(n) # 0 trong moät khoaûng coù chieàu daøi höõu
haïn N (töø 0 ñeán N-1).

LUAÄN VAÊN TOÁT NGHIEÄP - 25 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Loaïi thöù hai: Heä thoáng coù ñöôïc ñaëc tröng bôûi ñaùp öùng xung coù chieàu daøi voâ haïn
(Infinite Impulse Response-IIR), töùc laø h(n) # 0 trong moät khoaûng voâ haïn töø 0 ñeán ∞.

Vieäc thieát keá boä loïc soá thöïc teá ñeàu ñi töø lyù thuyeát caùc boä loïc lyù töôûng. Coù 4 boä loïc tieâu
bieåu sau:
_ Boä loïc thoâng thaáp.
_ Boä loïc thoâng cao.
_ Boä loïc thoâng daûi.
_ Boä loïc thoâng chaén daûi.
Loïc ôû ñaây chuùng ta hieåu taàn soá laø chính, vì vaäy taát caû caùc ñaëc tröng cuûa boä loïc ñeàu
khoâng laøm thay ñoåi bieân ñoä.

2. Caùc boä loïc lyù töôûng:

i. Boä loïc thoâng thaáp:

Ñaùp öùng bieân ñoä cuûa boä loïc thoâng thaáp:


Ñaùp öùng bieân ñoä cuûa boä loïc thoâng thaáp:

Ñaùp öùng xung :


 c sin( c n )
h (n ) 
 cn

ii. Boä loïc thoâng cao

Ñaùp öùng bieân ñoä cuûa boä loïc thoâng cao:

LUAÄN VAÊN TOÁT NGHIEÄP - 26 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Ñaùp öùng xung:


sin n  c sin( c n )
h (n )  
n  cn

iii. Boä loïc thoâng daûi

Ñaùp öùng bieân ñoä cuûa boä loïc thoâng daûi:

Ñaùp öùng xung:


 c 2 sin( c 2 n )  c1 sin( c1n )
h (n )  
  c2 n   c1n

iv. Boä loïc chaén daûi

Ñaùp öùng bieân ñoä cuûa boä loïc thoâng daûi chaén:

LUAÄN VAÊN TOÁT NGHIEÄP - 27 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Ñaùp öùng xung:

sin n  c2 sin( c 2 n )  c1 sin( c1n ) 


h (n )    
n    c2 n   c1n 

Nhaän xeùt: Ñaùp öùng xung h(n) laø ñoái xöùng, taâm ñoái xöùng taïi maãu n=0. L[H(n)]= 
laø khoâng nhaân quaû, khoâng thöïc hieän ñöôïc veà maët vaät lí.

3. Boä loïc thöïc teá:


Boä loïc thöïc teá phaûi laø moät boä loïc coù tính nhaân quaû, khaùc vôùi boä loïc lyù töôûng, xeùt boä loïc
thoâng thaáp lyù töôûng vôùi ñaëc tính taàn soá:

coù ñaùp öùng xung cuûa boä loïc laø:

roõ raøng boä loïc thoâng thaáp lyù töôûng laø boä loïc khoâng nhaân quaû neân khoâng toàn taïi trong
thöïc teá.
Boä loïc soá thöïc teá coøn coù caùc ñaëc tröng bôûi caùc thoâng soá sau:
S1 : ñoä gôïn soùng ôû daûi thoâng.
S2 : ñoä gôïn soùng ôû daûi chaén.
ωp : taàn soá giôùi haïn(bieân taàn) daûi thoâng.
ωS: taàn soá giôùi haïn(bieân taàn) daûi chaén.

LUAÄN VAÊN TOÁT NGHIEÄP - 28 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

ω: ωS – ωp:Beà roäng daûi quaù ñoä

4. Boä loïc FIR vaø IIR

i. Loïc FIR:
Caùc heä thoáng coù ñaëc tính xung coù chieàu daøi höõu haïn ñöôïc goïi laø FIR:

Giaû söû heä thoáng FIR:

Khi ñoù ñaëc tính xung cuûa heä thoáng:


M
 b k x (n  k )
1
y(n) =
a0 k 0

ii. Loïc IIR:


Caùc heä thoáng coù ñaëc tính xung coù chieàu daøi voâ haïn ñöôïc goïi laø IIR:
N M
 a k y( n  k ) =  b k x ( n  k )
k 0 k 0

Phöông trình treân laø moät phöông trình ñeä qui:


N M
y(n) = –  a k y( n  k ) +  b k x (n  k )
k 1 k 0

vì vaäy IIR coøn goïi laø loïc ñeä qui vaø FIR laø loïc khoâng ñeä qui.
Khi ñoù heä thoáng coù haøm truyeàn trong maët phaúng Z:
M M

Y (z)
 bk z k
 b k z k
k 0 k 0
H(z) = = N
= N
X (z)
1  a k z k  a k z k
k 1 k 0

iii. So saùnh boä loïc FIR vaø IIR:

LUAÄN VAÊN TOÁT NGHIEÄP - 29 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Ñeå thieát keá caùc boä loïc coù ñaëc tính löïa choïn taàn soá, ta caàn phaûi ñaûm baûo ñöôïc nhöõng
ñaëc tính mong muoán veà bieân ñoä vaø pha, ñoù chính laø tìm caùc heä soá thích hôïp cuûa boä
loïc FIR hay IIR phuï thuoäc vaøo caùc yeâu caàu cuï theå. Trong thöïc teá, caùc boä loïc FIR
ñöôïc söû duïng trong caùc tröôøng hôïp ñaëc bieät caàn ñaëc tính pha tuyeán tính trong daûi
thoâng cuûa boä loïc. Neáu khoâng quan taâm ñeán yeâu caàu naøy thì ta coù theå söû duïng caû boä
loïc FIR laãn IIR.
Tuy nhieân neáu khoâng quan taâm ñeán söï meùo daïng veà bieân ñoä vaø pha thì boä loïc IIR
ñöôïc söû duïng phoå bieán hôn vì vieäc thöïc thi ít toán keùm boä nhôù vaø thôøi gian thöïc thi
nhanh hôn so vôùi boä loïc FIR. Hôn nöõa, vieäc thieát keá boä loïc IIR coù theå söû duïng laïi keát
quaû thieát keá caùc boä loïc töông töï (analog). Trong khi ñoù, thieát keá loïc FIR ñoøi hoûi kó
thuaät tính toaùn khaù lôùn vaø taêng tuyeán tính theo baäc cuûa boä loïc. Xaáp xó loïc FIR coù ñoä
choïn loïc cao khaù khoù. Trong boä loïc FIR ñoøi hoûi boä nhôù RAM vaø boä ghi dòch tæ leä vôùi
baäc cuûa boä loïc vaø khaù cao so vôùi boä loïc IIR.

IV. BIEÁN ÑOÅI FOURIER RÔØI RAÏC: (Discrete Fourier Transform)


Cho tôùi baây giôø chuùng ta ñaõ vaøi laàn söû duïng Fourier khi ñeà caäp ñeán ñaëc tính cuûa chuoãi
soá vaø pheùp toaùn tuyeán tính. Bieán ñoåi Fourier cuûa chuoãi nhaân quaû nhö sau:

T x(n)  X ( f )   x(n)e  j 2fn (2.16)
n 0

ôû ñoù chu kyø laáy maãu ñaõ chuaån hoùa laø moät (T=1). Neáu chuoãi soá coù ñoä daøi giôùi haïn (ñeå
coù theå toå chöùc cho maùy tính) thì:
N 1
X ( f )   x(n)e  j 2fn (2.17)
n 0

vôùi ñoä daøi cuûa mieàn laáy maãu laø N.


Bieán ñoåi ngöôïc Fourier laø
1
2
T 1 X ( f )  x(n)   X ( f )e
j 2 fn
df (2.18)
1

2

Bôûi vì X(f) laø haøm tuaàn hoaøn vôùi chu kyø T=1, neân tích phaân treân laáy trong chu kyø naøo
cuõng ñöôïc
1
x(n)   X ( f )e j 2fn df (2.19)
0

1. Daïng DFT

LUAÄN VAÊN TOÁT NGHIEÄP - 30 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Bieåu dieãn cuûa bieán ñoåi Fourier treân laø chính xaùc nhöng coù trôû ngaïi chính trong xöû lyù
soá vì bieán taàn soá laø lieân tuïc chöù khoâng phaûi rôøi raïc. Ñeå khaéc phuïc ñieàu naøy, chuùng ta
laïi bieãu dieãn laïi tín hieäu theo thôøi gian vaø taàn soá.
Bieán ñoåi Fourier rôøi raïc thuaän DFT
N 1 j 2 kn

X ( k )   x ( n )e N
(2.20)
n 0

vaø bieán ñoåi Fourier rôøi raïc IDFT

j 2 kn
1 N 1
x ( n )   X ( k )e N
(2.21)
N k 0
2. Tính chaát cuûa DFT
Phaàn naøy seõ giôùi thieäu caùc tính chaát quan troïng cuûa DFT. Söû duïng caùc tính chaát naøy
chuùng ta seõ toå chöùc hieäu quaû khi tính toaùn DFT.
Tính tuaàn hoaøn: Neáu x(n) vaø X(k) laø caëp DFT N-ñieåm, thì
x(n+N)=x(n) n
X(k+N)=X(k) n (2.22)
Tính tuyeán tính:
Neáu x(n)  a(n)  b(n) (2.23)
vôùi  vaø  laø haèng thöïc hay haèng phöùc thì:
X(k)=  A(k)+  B(k)
A(k) vaø B(k) laø DFT cuûa chuoãi a(n)vaø b(n) trong mieàn thôøi gian
Tính chaát dôøi theo thôøi gian: Neáu x(n) vaø X(k) laø caëp DFT N-ñieåm thì
j 2 kn

DFT x(n  p)  X (k )e N
(2.24)

3. Phoå coâng suaát


DFT thöôøng ñöôïc duøng laøm coâng cuï ñeå phaân tích phoå cuûa chuoãi vaøo. Bieân ñoä cuûa
moät thaønh phaàn thaønh soá cuï theå thöôøng ñöôïc quan taâm. Coù theå chia DFT thaønh bieân
ñoä vaø pha nhö sau:
X(f)=Xreal(f)+jXimag(f) (2.25)
X ( f )  X ( f ) e j ( f ) (2.26)

vôùi X ( f )  X real
2
 X imag
2

LUAÄN VAÊN TOÁT NGHIEÄP - 31 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

 X imag 
vaø  ( f )  tan 1  
 X real 
Neáu chuùng ta quan taâm ñeán phoå coâng suaát cuûa tín hieäu thì chuùng ta phaûi laáy tín hieäu
nhaân vôùi lieân hôïp phöùc cuûa noù.
X (k ) X * (k )  X (k )  X real  X imag (2.27)
2 2 2

Tuy nhieân, naûy sinh moät vaán ñeà khi duøng DFT laø coâng cuï phaân tích phoå. Vaán ñeà naûy
sinh lieân quan ñeán giaû thieát laø chuùng ta ñaõ taïo ra DFT cuûa chuoãi soá trong moät chu kyø
cuûa daïng soùng coù chu kyø laëp laïi. Hình 2.4 minh hoïa ñieàu naøy. Treân hình veõ theå hieän,
moïi chuoãi soá ñeàu bò giaùn ñoaïn theo thôøi gian taïi caùc taïi caùc bieân cuûa chu kyø giaû. Giaùn
ñoaïn naøy seõ sinh ra thaønh phaàn taàn soá raát cao ôû chuoãi soá ra. Nhöõng thaønh phaàn coù theå
seõ lôùn hôn raát nhieàu so vôùi taàn soá laáy maãu, vaø bò dôøi vaøo giöõa phoå.

Hình 2.4: Taïo chu kyø töø moät ñoaïn


Kyõ thuaät duøng ñeå khaéc phuïc khoù khaên naøy laø cöûa soå hoùa. Vaán ñeà khaéc phuïc laø phaàn
giaùn ñoaïn ôû caïnh cuûa moãi chu kyø cuûa daïng soùng. Bôûi vì thuaät toaùn DFT toång quaùt
khoâng bieát ñöôïc ñoä giaùn ñoaïn ôû hai bieân, neân kyõ thuaät cöûa soå chæ ñôn thuaàn giaûm bôùt
bieân ñoä cuûa chuoãi soá ôû hai bieân. Ñieàu naøy ñöôïc laøm töøng böôùc vaø laøm trôn sao cho
khoâng taïo ra thaønh phaàn giaùn ñoaïn môùi vaø keát quaû laø laøm giaûm bôùt thaønh phaàn taàn soá
bò dôøi ñi. Khoâng coù caûi tieán naøo maø khoâng bò traû giaù. Bôûi vì aùp duïng cöûa soå vaøo chuoãi
soá tröôùc khi DFT, neân ñoä trung thöïc cuûa phoå bò giaûm. Keát quaû laø ñoä phaân giaûi cuûa caùc
thaønh phaàn taàn soá baèng nhau hôi bò suy giaûm. Cöûa soå toát nhaát ñoøi hoûi phaûi laøm cho tín
hieäu giaû (bò dôøi ñi) suy giaûm nhieàu nhaát ñoàng thôøi suy hao cuûa ñoä phaân giaûi phoå laø
nhoû nhaát.
Coù nhieàu loaïi cöûa soå khaùc nhau nhöng ñeàu coù ñaëc tröng chung laø: giaûm caùc phaàn töû gaàn
bieân (gaàn n=0 vaø n=N-1) vaø buø baèng caùch taêng giaù trò caùc thaønh phaàn ôû xa bieân.
4. Phoå trung bình
Bôûi vì tín hieäu luoân luoân coù nhieãu, nhieãu gaây ra do tính chaát cuûa thieát bò taïo tín hieäu
hay nhieãu beân ngoaøi taùc ñoäng ñeán nguoàn tín hieäu. Neáu chæ laáy DFT moät laàn thì ñöôøng
bieåu dieãn khoâng trung thöïc phoå tín hieäu. Ñeå khaéc phuïc ñieàu naøy, chuùng ta laáy DFT
nhieàu laàn töø nhieàu nguoàn tín hieäu gioáng nhau vaø laáy trung bình theo thôøi gian cuûa phoå
coâng suaát. Neáu moãi DFT ñöôïc laáy maãu trong moãi nT giaây thì

LUAÄN VAÊN TOÁT NGHIEÄP - 32 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

 X  X  
Max
Phoå coâng suaát = (2.28)
2 2
i
real  i
imag
i 0

Roõ raøng, phoå tín hieäu khoâng thay ñoåi nhieàu trong khoaûng töø t=0 tôùi t=Max(NT).
5. Bieán ñoåi Fourier nhanh
Bieán ñoåi Fourier nhanh - Fast Fourier Transform (FFT) laø thuaät toaùn raát hieäu quaû ñeå
tính DFT cuûa moät chuoãi soá. Öu ñieåm laø ôû choã nhieàu tính toaùn ñöôïc laëp laïi do tính
j 2 kn 

tuaàn hoaøn cuûa soá haïng Fourier e N
. Daïng cuûa DFT laø:
N 1 j 2 kn

X ( k )   x ( n )e N
(2.29)
n 0

j 2 kn

Ñaët W nk
e N
Chuùng ta vieát laïi phöông trình (4.29)
N 1
X(k)   x(n)W nk (2.30)
n 0

( N  qN )( k  rN )
Chuù yù raèng W  W nk Vôùi moïi q, r nguyeân do tính tuaàn hoaøn cuûa soá
haïng Fourier.
Chuùng ta taùch DFT thaønh hai phaàn:
N N
1 1
2 2
X (k )   x(2n)WN2 nk   x(2n  1)WN( 2 n 1) k (2.31)
n 0 n 0

ôû ñoù chæ soá döôùi N cuûa soá haïng Fourier bieãu dieãn kích thöôùc cuûa chuoãi.
Neáu chuùng ta bieåu dieãn thaønh phaàn chaün cuûa chuoãi soá x(n) baèng xev vaø thaønh phaàn leû
laø xod thì phöông trình coù theå vieát laïi
N N
1 1
2 2
X (k )  x
n 0
ev (n)W Nnk  W Nk x od (n)W Nnk (2.32)
2 2 n 0 2

Baây giôø chuùng ta coù hai bieåu thöùc DFT, do ñoù chuùng ta coù theå vieát :
X (k )  X ev (k )  W Nk X od (k ) (2.33)
2

Chæ soá k chaïy ñeán N-1 nhöng do söû duïng tính chu kyø cuûa haøm chaün vaø haøm leû neân chæ
N
caàn tính DFT ñieåm ñeå coù ñöôïc giaù trò cuûa X(k).
2
 N N
Xev  k   X ev  k    k  N 1 (2.34)
 2 2

LUAÄN VAÊN TOÁT NGHIEÄP - 33 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Tieáp tuïc chia DFT keát quaû thaønh hai nöûa chaún vaø leû cho ñeán khi chæ coøn phaûi tính hai
ñieåm DFT
 
j2 k

  (0)   (1)e 2
k

A(k)  (0)  (1) k even (2.35)
(0)  (1) k odd


Ñoái vôùi 2 ñieåm DFT naøy chæ caàn pheùp coäng vaø tröø maø khoâng caàn pheùp nhaân. Ñeå tính
toaøn boä DFT, chuùng ta nhaân 2 ñieåm DFT vôùi caùc thöøa soá W thích hôïp töø W 0 tôùi WN/2 .
Hình 2.51aø ñoà thò 8 ñieåm FFT. Chuùng ta coù theå so saùnh tröïc tieáp DFT vaø FFT nhö sau:

Hình 2.5 : FFT 8 ñieåm, cô soá 2, phaân chia theo taàn soá
Khi tính tröïc tieáp DFT, moãi giaù trò cuûa k caàn N pheùp nhaân phöùc vaø N-1 pheùp coäng
phöùc. Ñoái vôùi FFT, moãi haøm ñeàu coù daïng  (0)  W p  (1) (goïi laø soá böôùm do ñoà thò
coù hình caùnh böôùm) yeâu caàu moät pheùp nhaân vaø hai pheùp coäng. Töø ñoà thò treân hình 2.5
chuùng ta coù theå toång quaùt hoùa soá böôùm laø
N
Soá böôùm= log 2 N
2
N
Ñieàu naøy laø do coù haøng böôùm (bôûi vì moãi böôùm coù hai ngoõ vaøo) vaø log2N coät böôùm
2
V. BIEÁN ÑOÅI FOURIER THÔØI GIAN NGAÉN-STFT:
Pheùp bieán ñoåi Fourier khoâng theå aùp duïng ñoái vôùi tín hieäu khoâng döøng, vì caùc thaønh phaàn
taàn soá khoâng oån ñònh. Tuy nhieân neáu chuùng ta chia tín hieäu khoâng döøng thaønh nhöõng ñoaïn

LUAÄN VAÊN TOÁT NGHIEÄP - 34 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

ñuû nhoû theo thôøi gian thì tín hieäu trong moãi ñoaïn coù theå xem laø tín hieäu döøng vaø do ñoù coù
theå laáy bieán ñoåi Fourier treân töøng ñoaïn tín hieäu naøy. Nhö vaäy, pheùp bieán ñoåi STFT vöøa
coù tính ñònh vò theo taàn soá do tính chaát cuûa bieán ñoåi Fourier, vöøa coù tính ñònh vò theo thôøi
gian do ñöôïc tính trong töøng khoaûng thôøi gian ngaén. Ñaây laø nguyeân lyù cuûa STFT hay coøn
goïi laø bieán ñoåi Fourier cöûa soå hoùa.
1. Coâng thöùc bieán ñoåi
Trong STFT, tín hieäu f(t) ñaàu tieân ñöôïc nhaân vôùi moät haøm cöûa soå w(t-) ñeå laáy ñöôïc
tín hieäu trong khoaûng thôøi gian ngaén xung quanh thôøi ñieåm . Sau ñoù pheùp bieán ñoåi
Fourier bình thöôøng ñöôïc tính treân ñoaïn tín hieäu naøy. Keát quaû chuùng ta ñöôïc moät haøm
hai bieán STFTf(w,t) xaùc ñònh bôûi :

 f (t ).w * (t   )e (2.36)
 jwt
STFT f ( w, t )  dt


STFT taïi thôøi ñieåm  laø bieán ñoåi Fourier cuûa tín hieäu f(t) nhaân vôùi phieân baûn dòch moät
khoaûng  theo thôøi gian w(t-) cuûa cöûa soå cô baûn taäp trung xung quanh . Nhö vaäy
STFT coù tính ñònh vò theo thôøi gian. Cöûa soå caøng heïp thì tính ñònh vò caøng toát.
Ñeå thaáy roõ hôn veà tính ñònh vò theo taàn soá, ta aùp duïng ñònh lyù Parserval ñeå vieát laïi
(2.36) nhö sau:
 

 w(t   )e   F (w(t   )e 
) .F  f (t )dw
1
STFT f ( w, )  jwt *
f (t )dt  jwt *


2 

 W  

1
 ( w ,  w).e j ( w  w) .F w , dw, (2.37)
,
*

2 

e  jw
 W (w  w) F (w )e dw
jw 

,
* , , ,

2 

vôùi W*(w,-w) vaø F(w,) laàn löôït laø phoå cuûa cöûa soå w(t-) vaø tín hieäu f(t).
W*(w,-w) coù taùc duïng nhö moät boä loïc daûi thoâng taäp trung quanh taàn soá w coù baêng
thoâng baèng baêng thoâng w(t) laøm giôùi haïn phoå cuûa tín hieäu F(w,) xung quanh taàn soá
ñang phaân tích w. Nhö vaäy STFT coù tính ñònh vò theo taàn soá. Tính ñònh vò naøy caøng toát
khi baêng thoâng cuûa cöûa soå phaân tích caøng heïp.
Ta thaáy raèng, STFT chính laø soá ño ñoä gioáng nhau giöõa tín hieäu phieân baûn dòch vaø bieán
ñieäu cuûa cöûa soå cô baûn vì (8.1) coù theå vieát laïi nhö sau:

STFT f ( w, )   w(t   )e  (2.38)
jwt *
f (t )dt  g w, (t ), f (t )


vôùi g w, (t )  w(t   )e jwt laø phieân baûn dòch vaø bieán thieân cuûa w(t)

LUAÄN VAÊN TOÁT NGHIEÄP - 35 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Do vieäc dòch thôøi gian moät khoaûng  laøm cho cöûa soå tònh tieán moät khoaûng  theo truïc
thôøi gian vaø bieán ñieäu cöûa soå vôùi e jwt laø cöûa soå tònh tieán moät khoaûng w theo truïc taàn
soá, neân kích thöôùc cuûa cöûa soå khoâng thay ñoåi maø chæ dôøi ñeán vò trí môùi xung quanh
(  ,w). Nhö vaäy, moãi haøm cöûa soå cô sôû söû duïng trong pheùp bieán ñoåi naøy ñeàu coù moät ñoä
phaân giaûi thôøi gian-taàn soá, chæ khaùc vò trí treân maët phaúng thôøi gian taàn soá. Do ñoù, coù
theå rôøi raïc hoùa deã daøng STFT treân moät löôùi chöõ nhaät (mw0 , n 0 ) .

Neáu haøm cöûa soå laø moät boä loïc haï thoâng coù taàn soá caét wb, hoaëc baêng thoâng 2wb thì w0

ñöôïc choïn nhoû hôn wb vaø  0 nhoû hôn ñeå vieäc laáy maãu khoâng maát thoâng tin. Caùc
w0
haøm cöûa soå taïi taát caû caùc ñieåm laáy maãu seõ phuû kín maët phaúng thôøi gian-taàn soá cuûa
pheùp bieán ñoåi.
Ñoä phaân giaûi thôøi gian-taàn soá cuûa STFT phuï thuoäc vaøo haøm cöûa soå. Ñeå coù ñoä phaân giaûi
toát thì cöûa soå phaân tích phaûi heïp (veà maët thôøi gian). Trong khi ñoù, ñeå ñaït ñöôïc ñoä phaân
giaûi taàn soá toát thì baêng thoâng cuûa cöûa soå phaûi heïp. Tuy nhieân, theo nguyeân lyù baát ñònh
thì khoâng theå toàn taïi moät cöûa soå vôùi khoaûng thôøi gian vaø baêng thoâng heïp tuøy yù maø coù
moät söï hoaùn ñoåi giöõa hai thoâng soá naøy (do tích cuûa chuùng bò chaën döôùi). Neáu ta choïn
cöûa soå coù baêng thoâng heïp ñeå ñoä phaân giaûi toát thì khoaûng thôøi gian laïi roäng laøm cho ñoä
phaân giaûi thôøi gian laïi keùm ñi vaø ngöôïc laïi, ñaây chính laø nhöôïc ñieåm cuûa STFT.
2. Moät soá haøm cöûa soå duøng trong STFT
Trong xöû lyù tín hieäu, ñeå giôùi haïn thôøi gian hoaëc taàn soá (loïc) moät tín hieäu, ngöôøi ta
thöôøng duøng caùc haøm cöûa soå. Trong STFT, haøm cöûa soå ñöôïc duøng ñeå giôùi haïn tín hieäu
ôû caû mieàn thôøi gian vaø mieàn taàn soá. Moät soá cöûa soå thöôøng hay ñöôïc söû duïng ñöôïc
ñònh nghóa nhö sau:
Cöûa soå Boxcar (Rectangular)
1 0nM
w[n]  
0 n  [0, M ]

Ñoä roäng cuûa cöûa soå laø M+1 maãu


Cöûa soå Bartlett (Triangular)
 2n M
M 0n
2
 2n M
w[n]  2  nM
 M 2
 0 n  [0, M ]


Cöûa soå Hanning

LUAÄN VAÊN TOÁT NGHIEÄP - 36 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

 2n
0,5  0,5 cos( ) 0nM
w[n]   M

0 n  [0, M ]

Cöûa soå Hamming


 2n
0,54  0,46 cos( ) 0nM
w[n]   M

0 n  [0, M ]

Cöûa soå Blackman


 2n 4n
0,42  0,5 cos( )  0,8 cos( ) 0nM
w[n]   M M

0 n  [0, M ]

Cöûa soå Kaiser (Ñöôïc ñònh nghóa töø haøm Bessel baäc 0)
 n  2
 I 0 [  1  [ ]
w[n]    0nM
 I 0 ( )
 0 n  [0, M ]
M
vôùi   laø I 0 (  ) laø haøm caûi bieân cuûa Bessel baäc 0, ñöôïc ñònh nghóa laø
2
1
I 0 ( ) 
2  e  cos  d

Khaùc vôùi caùc cöûa soå khaùc coù hình daïng khoâng thay ñoåi, hình daïng cuûa haøm Kaiser
coù theå thay ñoåi moät caùch linh hoaït nhôø vaøo thoâng soá hình daïng  . Vôùi caùc giaù trò 
khaùc nhau thì cöûa soå Kaiser seõ coù hình daïng khaùc nhau.

Boxcar window Triang window


1.2 1

0.9
1
0.8

0.7
0.8
0.6
Amp.

Amp.

0.6 0.5

0.4
0.4
0.3

0.2
0.2
0.1

0 0
0 50 100 150 200 250 300 0 16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256
Samples Samples

LUAÄN VAÊN TOÁT NGHIEÄP - 37 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Hamming window Hanning window


1 1

0.9 0.9

0.8 0.8

0.7 0.7

0.6 0.6
Amp.

Amp.
0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
0 16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 0 16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256
Samples Samples

Blackman window Kaiser window, beta=5


1 1

0.9 0.9

0.8 0.8

0.7 0.7

0.6 0.6
Amp.

Amp.
0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
0 16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 0 16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256
Samples Samples

Kaiser windows

0.8

0.6
Amp.

beta=0
0.4 beta=1.33
beta=3.68
beta=4.86
0.2 beta=7.04
beta=10

0
0 50 100 150 200 250
VI. Sample

Hình 2.6 : Caùc haøm cöûa soå thöôøng ñöôïc söû duïng trong xöû lyù tín hieäu, coù theå duøng ñeå tính
STFT.
VII. XAÙC SUAÁT VAØ QUAÙ TRÌNH NGAÃU NHIEÂN:
Tín hieäu tieáng noùi laø moät quaù trình thoáng keâ ôû ñoù söï töông quan cuûa chuoãi soá ñoùng vai troø
quan troïng ñeå phaân tích, döï baùo ñaëc tính cuûa tieáng noùi. Ngoaøi ra, trong nhaän daïng tieáng
noùi, moâ hình xaùc suaát laø moät trong nhöõng moâ hình ñaït keát quaû toát nhaát. Phaàn naøy trình
baøy khaùi nieäm xaùc suaát vaø quaù trình ngaãu nhieân laøm cô sôû cho trích huaán luyeän vaø nhaän
daïng tieáng noùi ôû chöông sau.

LUAÄN VAÊN TOÁT NGHIEÄP - 38 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

1. Cô sôû xaùc suaát


Xaùc suaát cuûa söï kieän A ñöôïc kyù hieäu laø P(A). Coù 3 tính chaát cuûa P(A):
 P(A)≥ 0
 P(taát caû khaû naêng coù theå xaûy ra)=1
 Cho {Ai}, vôùi (Ai . Aj=0) thì P(Ai.Aj)=P(Ai)+P(Aj)
Chuùng ta ñònh nghóa theâm xaùc suaát ñoàng thôøi vaø xaùc suaát coù ñieàu kieän
Xaùc suaát ñoàng thôøi laø xaùc suaát ñeå hai hay nhieàu söï kieän ñoàng thôøi xaûy ra trong moät
pheùp thöû. Kí hieäu xaùc suaát 2 söï kieän A vaø B xaûy ra ñoàng thôøi: P(AB)
Xaùc suaát coù ñieàu kieän laø xaùc suaát ñeå xaûy ra söï kieän A trong khi söï kieän B ñaõ xaûy ra. Kí
hieäu: P(A/B)
Coâng thöùc tính:
P( AB)
P( A | B)  (2.39)
P( B)
Coâng thöùc Bayes: 2 bieán coá A, B ñoäc laäp
P( B | A).P( A)
P( A | B)  (2.40)
P( B)
Coâng thöùc (2.40) thöôøng ñöôïc söû duïng ñeå tính xaùc suaát coù ñieàu kieän moät khi ñaõ bieát
xaùc suaát cuûa töøng söï kieän vaø xaùc suaát ñieàu kieän cuûa söï kieän kia.
2. Bieán ngaãu nhieân
Trong xöû lyù tín hieäu, ñieàu mong muoán laø tín hieäu coù giaù trò cuï theå hay naèm trong moät
phaïm vi cuï theå. Tín hieäu trong tröôøng hôïp naøy ñöôïc coi laø bieán ngaãu nhieân. Ví duï, vôùi
bieán ngaãu nhieân X, chuùng ta coù caùc söï kieän nhö:
Söï kieän A: X coù giaù trò baèng 5 (X = 5)
Söï kieän B: X=16

Ñaây laø taäp söï kieän cuûa bieán rôøi raïc coù giaù trò cuï theå, ngoaøi ra coøn coù taäp söï kieän cuûa
bieán lieân tuïc coù giaù trò naèêm trong moät phaïm vi naøo ñoù. Chuùng ta coù theå ñònh nghóa haøm
phaân phoái xaùc suaát cuûa moät bieán ngaãu nhieân nhö sau:
F ( x)  P( X  x) (2.41)
Haøm phaân phoái xaùc suaát laø haøm taêng cuûa bieán ñoäc laäp x vaø chæ ñuùng cho bieán ngaãu
nhieân cuï theå X.
Neáu laáy vi phaân F(x) theo bieán x, ta nhaän ñöôïc haøm maät ñoä xaùc suaát (probablity destiny
function-PDF) cuûa X:

LUAÄN VAÊN TOÁT NGHIEÄP - 39 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

dF ( x)
p( x)  (2.42)
dx
Laáy tích phaân p(x), ta coù ñöôïc haøm phaân phoái xaùc suaát nhö sau:
x
F ( x)   p( )d

(2.43)

Nhö vaäy ta coù theå xaùc ñònh ñöôïc xaùc suaát cuûa bieán ngaãu nhieân X naèm giöõa a vaø b:
P( X  b)  P(a  X  b)  P( X  a) (2.45)
Vieát laïi phöông trình treân theo haøm phaân phoái:
b
P(a  X  b)  F (b)  F (a)   p( x)dx (2.46)
a

Nghóa laø neáu bieát haøm phaân phoái hay haøm maät ñoä, chuùng ta coù theå tính ñöôïc xaùc suaát
cuûa bieân ngaãu nhieân X naèm trong phaïm vi cho tröôùc.
3. Kyø voïng, phöông sai
Giaù trò kyø voïng cuûa x kyù hieäu E(x) laø giaù trò coù khaû naêng xaûy ra nhieàu nhaát. E(x) coøn
ñöôïc goïi laø giaù trò trung bình, vaø ñöôïc tính töø haøm maät ñoä nhö sau:

E ( x)   xp( x)dx

(2.47)

Ví duï1: (rôøi raïc)

E(X) = 2·0.05+3·0.10+ … +9·0.05 = 5.35


Ví duï 2: (lieân tuïc)
3
Cho f ( x)  (1  x 2 ) 0  x  1 otherwise f ( x)  0
2

LUAÄN VAÊN TOÁT NGHIEÄP - 40 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

1 1 x 1
3 3 3 x2 x4 3
Thì E ( X )   x  (1  x 2 )dx   ( x  x 3 )dx  (  ) 
0
2 20 2 2 4 x 0 8

Phöông sai cuûa bieán ngaãu nhieân x ñöôïc ñònh nghóa:


 2  Var ( x)  E[( x  E[ x]) 2 ] (2.48)
 laø caên baäc hai giaù trò bình phöông trung bình cuûa ñoä leäch giöõa moät bieán vaø giaù trò
trung bình cuûa bieán ñoù
VIII. TOÙM TAÉT:
Chöông naøy giôùi thieäu cô sôû lyù thuyeát cuûa xöû lyù soá tín hieäu laøm cô sôû ñeå thöïc hieän cho
caùc chöông sau, ñaëc bieät laø Chöông 3-trích ñaëc tröng tieáng noùi. Ngoaøi ra, chöông naøy coøn
trình baøy khaùi nieäm xaùc suaát, caùc tính chaát cuûa noù ñeå phuïc vuï cho phaàn quan troïng nhaát
cuûa ñeà taøi-Chöông 5: Moâ hình Markov aån.

LUAÄN VAÊN TOÁT NGHIEÄP - 41 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

Chöông 3:

TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI

Trong caùc lónh vöïc xöû lyù tieáng noùi nhö nhaän daïng, toång hôïp, maõ hoùa ñeàu caàn phaûi phaân tích
tham soá tieáng noùi. Chöông naøy trình baøy kyõ thuaät ñeå trích tham soá cuûa tín hieäu tieáng noùi laø
phaân tích cepstral theo phöông phaùp Mel-Frequency Coefficient - MFCC.
Khaùi nieäm cô baûn khi phaân tích tieáng noùi laø phaân tích theo thôøi gian ngaén. Trong khoaûng thôøi
gian daøi, tín hieäu tieáng noùi laø tín hieäu khoâng döøng, nhöng trong khoaûng thôøi gian ñuû ngaén (10-
30ms) tieáng noùi ñöôïc xem nhö laø tín hieäu döøng. Ñieàu naøy laø do toác ñoä thay ñoåi phoå tieáng noùi
chæ lieân quan tröïc tieáp ñeán toác ñoä di chuyeån cuûa boä phaän caáu aâm (moâi, löôõi, haøm, voøm mieäng
meàm) vaø giôùi haïn cuûa caùc raøng buoäc sinh lyù. Haàu heát hoaït ñoäng cuûa caùc heä phaân tích tieáng noùi
ñeàu döïa vaøo khaùi nieäm thôøi gian bieán thieân. Thoâng thöôøng ngöôøi ta chia tieáng noùi thaønh nhieàu
ñoaïn coù thôøi gian baèng nhau hay caùc frame, moãi frame coù ñoä daøi töø 10-30ms.

I. HAØM NAÊNG LÖÔÏNG THÔØI GIAN NGAÉN

Haøm naêng löôïng thôøi gian ngaén (Short Time Energy Function) cuûa tieáng noùi ñöôïc tính baèng
caùch chia tín hieäu tieáng noùi thaønh nhieàu frame, moãi frame daøi N maãu, roài laáy toån g bình
phöông cuûa caùc maãu trong töøng frame. Cöûa soå chöõ nhaät daøi 10-30ms laø phuø hôïp cho muïc
ñích naøy. Vôùi cöûa soå baét ñaàu ôû maãu thöù m, haøm naêng löôïng thôøi gian ngaén Em ñöôïc ñònh
nghóa nhö sau:
m N 1 2

Em [ x(n) * w(n m)] (3.1)


n m

II. PHAÙT HIEÄN ÑIEÅM ÑAÀU ÑIEÅM CUOÁI CUÛA MOÄT TÖØ

Moät trong nhöõng vaán ñeà cô baûn cuûa xöû lyù tieáng noùi laø xaùc ñònh ñieåm baét ñaàu vaø keát thuùc cuûa
moät töø. Ñieàu naøy khoù thöïc hieän chính xaùc neáu tín hieäu ñöôïc noùi trong moâi tröôøng coù nhieãu.
Chuùng ta söû duïng thuaät toaùn phaùt hieän ñieåm ñaàu ñieåm cuoái cuûa moät töø caên cöù vaøo haøm naêng
löôïng thôøi gian ngaén nhö sau:

LUAÄN VAÊN TOÁT NGHIEÄP - 42 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

Vôùi moãi frame, tính naêng löôïng thôøi gian ngaén E[k] theo phöông trình
m N 1 2

Em [ x(n) * w(n m)] , neáu E[k] lôùn hôn giaù trò ngöôõng k*Ethreshold thì ñaùnh soá frame ñoù
n m

laø baét ñaàu moät töø, kyù hieäu laø frame B, ngöôïc laïi thì xeùt frame keá tieáp cho ñeán khi xaùc ñònh
ñöôïc frame B, trong ñoù k laø heä soá nhaân cho phaùt hieän ñieåm ñaàu, Ethreshold laø naêng löôïng trung
bình 10 frame ñaàu tieân khi chöa noùi, ñaëc tröng cho nhieãu neàn. Neáu khoâng xaùc ñònh ñöôïc
frame B thì tín hieäu ñoù khoâng phaûi laø tieáng noùi.
Tính naêng löôïng thôøi gian ngaén E[k] cuûa frame keá tieáp cho ñeán khi nhoû hôn giaù trò ngöôõng
g*Ethresold thì ñaùnh daáu ñoù laø frame keát thuùc moät töø kyù hieäu laø frame E, vôùi g laø heä soá nhaân cho
phaùt hieän ñieåm cuoái moät töø. Cuoái cuøng keát hôïp vôùi ñieàu kieän chieàu daøi cuûa moät töø tieáng Vieät
thöôøng khoaûng 300-450ms ñeå quyeát ñònh xem ñoù coù phaûi laø moät töø ñöôïc phaùt aâm hay khoâng.

Sô ñoà khoái phaùt hieän ñieåm ñaàu ñieåm cuoái cuûa moät töø nhö hình 3.1.

Giaûi thuaät taùch töø naøy coù nhieàu nhöôïc ñieåm. Phöông phaùp naøy tuy ñôn giaûn nhöng coù nhöôïc
ñieåm laø khoâng xaùc ñònh ñöôïc chính xaùc ñöôïc maãu naøo trong FRAME laø maãu thöïc söï baét ñaàu
cho tín hieäu tieáng noùi vaø töông töï cho ñieåm cuoái.

Phöông phaùp naøy khoâng coøn chính xaùc neâu moâi tröôøng coù nhieãu quaù lôùn. Tuy nhieân trong moâi
tröôøng khoâng quaù oàn, giaûi thuaät naøy coù theå chaáp nhaän ñöôïc.

Hình 3.2 minh hoïa ñoaïn tín hieäu vaø naêng löôïng thôøi gian ngaén cuûa noù

LUAÄN VAÊN TOÁT NGHIEÄP - 43 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

Hình 3.1 Sô ñoà khoái taùch töø

LUAÄN VAÊN TOÁT NGHIEÄP - 44 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

Hình 3.2: Tín hieäu vaø naêng löôïng thôøi gian ngaén cuûa noù

III. TIEÀN NHAÁN (Pre-emphasis)

Chuùng ta bieát raèng phoå tieáng noùi höõu thanh coù khuynh höôùng suy giaûm toaøn boä -6dB/octave
khi taàn soá taêng leân. Ñieàu naøy laø do khuynh höôùng suy giaûm -12dB/octave cuûa nguoàn kích aâm
höõu thanh vaø taêng leân +6dB/octave do phaùt aâm mieäng. Do ñoù caàn phaûi buø +6dB/octave treân
toaøn boä baêng taàn. Ñieàu naøy ñöôïc goïi laø pre-emphasis tín hieäu. Trong xöû lyù tín hieäu soá, chuùng
ta duøng boä loïc thoâng cao coù taàn soá caét 3dB ôû taàn soá trong phaïm vi töø 100Hz ñeán 1kHz. Boä
loïc thoâng cao naøy coù phöông trình sai phaân :
y(n) = x(n) - a*x(n) (3.2)
trong ñoù y(n) laø maãu ra hieän taïi cuûa boä loïc pre-emphasis, x(n) laø maãu vaøo hieän taïi, x(n-1) laø
maãu vaøo tröôùc ñoù vaø a laø haèng soá thöôøng ñöôïc choïn giöõa 0.9 vaø 1ø. Laáy bieán z cuûa phöông
trình (3.2) :
Y(z)=X(z)-az-1X(z)=(1-az-1)X(z) (3.3)
trong ñoù z-1 laø toaùn töû treã maãu ñôn vò. Suy ra haøm truyeàn H(z) cuûa boä loïc laø:

LUAÄN VAÊN TOÁT NGHIEÄP - 45 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

Y z
H ( z) =1-a z 1
(3.4)
X (z
vaø sô ñoà khoái ñöôïc cho treân hình 3.3. Bieãu dieãn haøm truyeàn treân mieàn taàn soá baèng caùch ñaët
z e jwT vôùi T laø chu kyø maãu cuûa tín hieäu tieáng noùi:
H (e jwT ) 1 ae jwT

Bieân ñoä cuûa haøm truyeàn laø:


1
H (e jwT ) 1 ae jwT [1 a 2 2a cos wT ] 2 (3.5)

Hình 3.3: Boä loïc soá pre-emphasis.

IV. TRÍCH ÑAËC TRÖNG MFCC (Mel-scale Frequency Cepstral Coefficient)

Quaù trình nhaän daïng maãu (caû ôû pha huaán luyeän hay pha nhaän daïng) ñeàu traûi qua giai ñoaïn
trích choïn ñaëc tröng (feature extraction). Böôùc naøy thöïc hieän caùc phaâøn tích phoå (spectral
analysis) nhaèm xaùc ñònh caùc thoâng tin quan troïng, ñaëc tröng, oån ñònh cuûa tín hieäu tieáng noùi, toái
thieåu hoùa aûnh höôûng cuûa nhieãu; xuùc caûm, traïng thaùi, caùch phaùt aâm cuûa ngöôøi noùi; giaûm khoái
löôïng döõ lieäu caàn xöû lyù...
Maëc duø khoâng mang tính quyeát ñònh nhöng giai ñoaïn trích choïn ñaëc tröng aûnh höôûng raát lôùn
ñeán hieäu naêng nhaän daïng. Vì vaäy vieäc löïa choïn ñaëc tröng cho tín hieäu tieáng noùi raát quan troïng.
Coù nhieàu phöông phaùp trích choïn ñaëc tröng ñaõ vaø ñang ñöôïc söû duïng (FBA, MFCC, LPC,
PLP...). Moãi phöông phaùp coù nhöõng öu ñieåm vaø nhöôïc ñieåm rieâng. Hieän nay MFCC (Mel-scale
Frequency Cepstral Coefficient) ñöôïc söû duïng phoå bieán vaø hieäu quaû nhaát. Vì vaäy söû duïng
MFCC laøm ñaëc tröng cuûa heä nhaän daïng ñöôïc trình baøy trong ñeà taøi naøy.
Caùc heä nhaän daïng tieáng noùi thöôøng trích ñaëc tröng töø tín hieäu baèng caùch: chia tín hieäu thaønh
nhöõng ñoaïn ñoä daøi 5-15 ms, moãi ñoaïn goïi laø moät khung (frame). Trong khoaûng thôøi gian ngaén
nhö vaäy, phoå cuûa tín hieäu ñuû oån ñònh ñeå tieán haønh trích ñaëc tröng. Moãi frame seõ cho ñaëc tröng
laø moät vector vaø ñaëc tröng cuûa toaøn boä tín hieäu seõ laø moät daõy vector.

LUAÄN VAÊN TOÁT NGHIEÄP - 46 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

MFCC laø phöông phaùp trích ñaëc tröng döïa treâøn ñaëc ñieåm caûm thuï taàn soá aâm cuûa tai ngöôøi:
tuyeán tính ñoái vôùi taàn soá nhoû hôn 1kHz vaø phi tuyeán ñoái vôùi taàn soá treân 1kHz (theo thang taàn soá
mel, khoâng phaûi theo Hz), ñaëc ñieåm naøy ñaõ ñöôïc ñeà caäp trong Chöông 1.
Ñoái vôùi phöông phaùp MFCC, vieäc tính ñaëc tröng coù sô ñoà nhö sau:

Hình 3.4: Sô ñoà trích ñaëc tröng MFCC

Sô ñoà khoái trích ñaëc tröng treân laø phöông phaùp trích ñaëc tröng baèng cepstral. Nhö ñaõ ñeà caäp
trong phaàn moâ hình loïc nguoàn ôû Chöông 1, tín hieäu tieáng noùi laø do tín hieäu xung böôùc soùng
chaäp vôùi tín hieäu taàn soá thaáp do boä phaän phaùt aâm taïo ra vaø vaø chuùng ta muoán laáy ñöôïc tín
hieäu do boä phaùt aâm naøy taïo ra. Trong mieàn thôøi gian, goïi s(n) laø tín hieäu nguoàn, p(n) laø tín
hieäu kích thích vaø θ(n) bieåu dieãn ñaùp öùng xung cuûa boä phaän phaùt aâm. Ta coù:
s(n) = e(n) * θ(n). ( * : Tích chaäp) (3.7)
Goïi S(ejw) laø phoå cuûa tín hieäu tieáng noùi, E(ejw) laø phoå xung kích thích vaø Θ(ejw) laø phoå cuûa boä
phaän phaùt aâm. Nhö vaäy moái lieân heä bieân ñoä cuûa ba thaønh phaàn naøy laø:
S(ejw) = E(ejw) . Θ(ejw) (3.8)
Laáy logarithm cuûa phöông trình treân:
Log S(ejw) = log E(ejw) + log Θ(ejw) (3.9)
Nhö vaäy logarithm cuûa S(ejw) laø do E(ejw) vaø H Θ (ejw) coäng laïi. Trong ñoù tham gia cuûa
Θ(ejw) theå hieän ôû vuøng taàn soá thaáp do söï bieán ñoåi chaäm cuûa boä phaän phaùt aâm, coøn tham gia
cuûa xung böôùc soùng E(ejw) theå hieän chuû yeáu ôû vuøng taàn soá cao, neân coù theå taùch rôøi hai vuøng
naøy baèng boä loïc tuyeán tính.

Boä loïc tuyeán tính thöôøng söû duïng laø bieán ñoåi Fourier ngöôïc cuûa Log S(ejw) ñeå taïo ra cepstral
cuûa tín hieäu (thuaät ngöõ cepstral laø vieát ngöôïc cuûa spectral-phoå):

cs(n) = IDFT{Log S(ejw) }

= IDFT{ log E(ejw) }+ IDFT{ log Θ(ejw) }

= ce(n) + cθ(n) (3.10)

LUAÄN VAÊN TOÁT NGHIEÄP - 47 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

Trong ñoù cs(n), ce(n), cθ(n) laàn löôït laø cepstrum cuûa s(n), e(n) vaø θ(n).

Thöïc teá ngöôøi ta thöôøng laáy töø 10-36 heä soá cepstral ban ñaàu laø cuûa boä phaän phaùt aâm, coøn caùc
heä soá cepstral cao hôn laø cuûa xung böôùc soùng. Trong ñeà taøi naøy, ta choïn 12 heä soá cepstral.

Hình 3.5: Minh hoïa phaân tích cepstral

Treân Hình 3.5 ta thaáy, baèng caùch chuyeån tín hieäu tieáng noùi sang mieàn taàn soá, pheùp tích chaäp
tín hieäu ñöôïc chuyeån thaønh pheùp nhaân, hôn nöõa, baèng vieäc laáy logarithm, pheùp nhaân ñöôïc
chuyeån tieáp thaønh pheùp coäng. Bôûi vì pheùp phaân tích Fourier ngöôïc laø tuyeán tính neân ta coù ñaúng
thöùc 3.10.

1. Windowing (cöûa soå hoùa)

Ñaàu tieân tín hieäu tieáng noùi x(n) seõ ñöôïc chia thaønh töøng frame (coù thöïc hieän choàng phuû
moät phaàn leân nhau: overlap) ñeå ñöôïc T frame x’t(n). Coâng vieäc cöûa soå hoaù naøy seõ ñöôïc
thöïc hieän baèng caùch nhaân tín hieäu tieáng noùi vôùi moät haøm cöûa soå. Goïi phöông trình cöûa soå

LUAÄN VAÊN TOÁT NGHIEÄP - 48 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

hoùa laø w(n) (0≤ n ≤ N-1; N: soá maãu trong 1 frame tín hieäu), khi ñoù tín hieäu sau khi ñöôïc
cöûa soå hoùa laø Xt(n):

Xt(n) =x’t(n).w(n) (3.11)

Haøm cöûa soå thöôøng ñöôïc döïng laø haøm cöûa soå Hamming:
2 n
w (n ) 0.54 0.46 cos( ) ;n 0..N - 1 (3.12)
N
2. Bieán ñoåi Fourier rôøi raïc-DFT

Tín hieäu (cuûa moät frame) sau khi nhaân vôùi haøm cöûa soå, ñöôïc chuyeån sang mieàn taàn soá
baèng bieán ñoåi Fourier rôøi raïc:
N 1 i 2 kn

X t (k ) x(n).e N
;k 0..N 1 (3.13)
n 0

Xt(k) laø soá phöùc, tuy nhieân thaønh phaàn pha khoâng quan troïng neân ta chæ quan taâm ñeán thaønh
phaàn thöïc |Xt(k) |

3. Loïc qua boä loïc Mel-scale

Caùc nghieân cöùu veà heä thoáng thính giaùc cuûa con ngöôøi cho thaáy, tai ngöôøi coù caûm nhaän ñoái
vôùi ñoä lôùn caùc taàn soá khoâng theo thang tuyeán tính. Caùc ñaëc tröng phoå taàn soá cuûa tieáng noùi
ñöôïc tai ngöôøi tieáp nhaän nhö ngoõ ra cuûa moät daõy caùc boä loïc. Taàn soá trung taâm cuûa caùc boä
loïc naøy khoâng phaân boá tuyeán tính doïc theo truïc taàn soá. Thaønh phaàn phoå döôùi 1 kHz thöôøng
ñöôïc taäp trung nhieàu boä loïc hôn vì noù chöùa nhieàu thoâng tin veà aâm thanh hôn. Ôû taàn soá thaáp
caùc boä loïc baêng heïp ñöôïc söû duïng ñeå taêng ñoä phaân giaûi taàn soá ñeå coù ñöôïc taàn soá cô baûn vaø
hoaï taàn voán oån ñònh, coøn ôû taàn soá cao caùc boä loïc thoâng baêng roäng ñöôïc söû duïng ñeå thu
ñöôïc caùc thaønh phaàn taàn soá cao voán bieán ñoäng raát nhanh.
Vôùi noå löïc nhaèm moâ taû chính xaùc söï tieáp nhaän taàn soá cuûa tai ngöôøi, moät thang taàn soá ñöôïc
xaây döïng – thang taàn soá Mel döïa treân cô sôû thöïc nghieäm caûm nhaän nghe cuûa ngöôøi. Taàn soá
1kHz ñöôïc choïn laø 1000 Mel. Moái quan heä giöõa thang taàn soá thöïc (vaät lyù) vaø thang taàn soá
Mel (sinh lyù) ñöôïc cho bôûi coâng thöùc:

FHz
FMel 2595log10 (1 ) (3.14)
700
vôùi FMel laø taàn soá sinh lyù, ñôn vò Mel.

FHz laø taàn soá thöïc, ñôn vò Hz.

LUAÄN VAÊN TOÁT NGHIEÄP - 49 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

2500

2000

Frequency (Mel)
1500

1000

500

0
0 500 1000 1500 2000 2500 3000 3500 4000
Frequency (Hz)

Hình 3.6 Quan heä giöõa taàn soá thang Mel vaø taàn soá thang Hz

Treân hình 3.5 cho ta thaáy, vôùi nhöõng taàn soá nhoû hôn 1 kHz, thì quan heä giöõa thang mel vaø
taàn soá thöïc laø gaàn tuyeán tính. Coøn caùc taàn soá treân 1 kHz thì quan heä naøy laø logarithm. Nhö
vaäy thay vì xaây döïng caùc boä loïc treân thang taàn soá thöïc ta coù theå xaây döïng caùc boä loïc naøy
vôùi taàn soá trung taâm caùch ñeàu tuyeán tính treân thang mel. Daõy caùc boä loïc naøy ñöôïc cho treân
hình 3.6.
Taàn soá trung taâm cuûa boä loïc thöù m ñöôïc xaùc ñònh bôûi:

fm fm 1 fm (3.15)

Trong ñoù : fm laø taàn soá trung taâm cuûa boä loïc thöù m

fm-1 laø taàn soá trung taâm cuûa boä loïc thöù m –1.

2 fm laø baêng thoâng cuûa boä loïc thöù m.

fm ñöôïc xaùc ñònh: Vôùi khoaûng taàn soá döôùi 1 kHz, thì fm ñöôïc choïn sao cho coù
khoaûng 10 boä loïc phaân boá caùch ñeàu trong khoaûng naøy. Vôùi khoaûng taàn soá treân 1
kHz, fm thöôøng ñöôïc tính bôûi : fm = 1.2* fm –1.

LUAÄN VAÊN TOÁT NGHIEÄP - 50 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

2
1.8

Gain 1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0 1 2 3 4
Frequency (kHz)

Hình 3.7 Daõy boä loïc Mel

Keát quaû sau khi cho phoå tín hieäu Xt(k) qua boä loïc ta thu ñöôïc Yt(m).

4. Tính log naêng löôïng phoå

Sau khi qua boä loïc mel, phoå tín hieäu Yt(m) seõ ñöôïc tính Log10 theo coâng thöùc:
2
log { Yt (m) } (3.16)

5. Bieán ñoåi Fourier ngöôïc-IDFT

Böôùc cuoái cuøng ñeå thu ñöôïc caùc heä soá MFCC laø laáy bieán ñoåi Fourier ngöôïc cuûa keát quaû
cho bôûi (3.12). Vaø do keát quaû trong (3.8) laø soá thöïc neân bieán ñoåi Fourier ngöôïc ñôn giaûn
ñöôïc söû duïng laø DCT (Dicrete Cosine Transform).
M
1
yt( m) (k ) log{| Yt (m) |2 } cos k m (3.17)
m 1 2 M

Thoâng thöôøng soá ñieåm rôøi raïc k cuûa bieán ñoåi ngöôïc naøy ñöôïc choïn 1 k 12. Caùc heä soá
MFCC chính laø soá ñieåm rôøi raïc naøy, vaäy ta coù theå coù töø 1 – 12 heä soá MFCC. Hình 3.7 laø
keát quaû trích heä soá MFCC cho moät segment cuûa tín hieäu chieàu daøi 256 maãu.

Caùc heä soá MFCC naøy raát oån ñònh theo caùc segment neân neáu ñöôïc choïn laøm ñaëc tröng ñeå
nhaän daïng thì seõ cho keát quaû toát. Ngoaøi ra trong caùc heä nhaän daïng, caùc heä soá MFCC naøy
coøn ñöôïc boå sung theâm caùc heä soá ñaïo haøm baäc moät vaø thaønh phaàn naêng löôïng.

LUAÄN VAÊN TOÁT NGHIEÄP - 51 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 3: TRÍCH ÑAËC TRÖNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TIEÁNG NOÙI

Hình 3.8 Keát quaû trích MFCC

V. TOÙM TAÉT:

Chöông naøy trình baøy phaàn taùch töø vaø trích ñaëc tröng tieáng noùi. Ñaây laø 2 böôùc raát quan
troïng trong nhaän daïng tieáng noùi, aûnh höôûng nhieàu ñeán keát quaû nhaän daïng sau naøy. Trích
ñaëc tröng MFCC, thöïc hieän thoâng qua phöông phaùp daõy boä loïc heä soá cepstral, ñöôïc lyù giaûi
ôû Chöông 1. MFCC laø phöông phaùp coù toác ñoä tính toaùn nhanh, tin caäy cao vaø ñaõ ñöôïc söû
duïng raát hieäu quaû trong caùc chöông trình nhaän daïng treân theá giôùi.

LUAÄN VAÊN TOÁT NGHIEÄP - 52 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Chöông 4:

LÖÔÏNG TÖÛ VECTOR


Khi phaân tích ñaëc tröng tieáng noùi, chuùng ta nhaän ñöôïc caùc vector ñaëc tröng laø ñaëc tính phoå
bieán thieân theo thôøi gian cuûa tín hieäu tieáng noùi. Kyù hieäu caùc vector phoå laø vl, l=1,2,…,L. Moãi
vector coù P chieàu ( vôùi 24 heä soá MFCC ta coù P=24). Do moâ hình HMM rôøi raïc ñöôïc söû duïng
ñeå nhaän daïng neân caùc vector phoå naøy phaûi ñöôïc öôùc löôïng vector(Vector Quantization-VQ)
thaønh caùc chæ soá codebook rôøi raïc(ñaùnh nhaõn cho vector phoå). VQ laøphöông phaùp hieäu quaû
ñeå bieåu dieãn thoâng tin phoå.
Caùc ñaëc tính cuûa VQ:
Giaûm thieåu khoâng gian löu tröõ cuûa vector phoå
Giaûm thôøi gian tính toaùn ñoä gioáng nhau giöõa caùc vector phoå. Trong nhaän daïng tieáng
noùi, moät löôïng lôùn pheùp tính duøng ñeå tính söï gioáng nhau giöõa hai caëp phoå. Döïa vaøo
VQ, vieäc tính toaùn ñoù ñöôïc giaûm xuoáng qua vieäc tìm söï gioáng nhau cuûa 2 caëp vector
codebook trong baûng tìm kieám.
Bieåu dieãn rôøi raïc veà maët aâm hoïc cuûa tieáng noùi. Nhôø gaùn nhaõn cho töøng frame cuûa töøng
töø, quaù trình choïn codebook toát nhaát cho töø ñoù trong caùc heä nhaän daïng tieáng noùi chæ ñôn
thuaàn döïa treân caùc nhaõn naøy. Ñieàu naøy seõ thaáy roõ hôn trong Chöông 5: Moâ hình
Markov aån.
Khuyeát ñieåm cuûa VQ:
Vieäc löôïng töû vector chaéc chaén daãn ñeán sai soá löôïng töû hoùa. Ñieàu naøy daãn ñeán thoâng
tin phoå bò sai leäch.
Vieäc choïn kích thöôùc codebook cho VQ khoâng ñôn giaûn. Taêng kích thöôùc seõ giaûm sai
soá löôïng töû nhöng laïi daãn ñeán vaán ñeà khoâng gian löu tröõ caùc vector trong codebook. Vì
vaäy khi caøi ñaët VQ, chuùng ta phaûi caân nhaéc 3 yeáu toá: sai soá löôïng töû, thôøi gian tìm kieám
vector trong codebook vaø khoâng gian löu tröõ caùc vector trong codebook.

I. CAÙC YEÁU TOÁ KHI TOÅ CHÖÙC VQ


Ñeå xaây döïng codebook VQ vaø toå chöùc thuaät toaùn phaân tích VQ, chuùng ta caàn caùc yeáu toá sau:

Moät taäp lôùn vector phoå v1,v2,v3,…,vL laø taäp huaán luyeän cho VQ. Neáu kích thöôùc
codebook VQ laø M=2B (codebook B bit) thì chuùng ta caàn L>>M ñeå tìm ñöôïc M vector
toái öu nhaát. Thöôøng choïn L=10M.

LUAÄN VAÊN TOÁT NGHIEÄP - 53 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Ñoä ño d giöõa caùc caëp phoå ñeå phaân nhoùm vector trong khaâu huaán luyeän, hay phaân lôùp
vector trong khaâu ñaùnh nhaõn.
Phöông phaùp xaùc ñònh nhaân ñeå phaân hoaïch L vector phoå thaønh M nhoùm.
Phöông phaùp phaân lôùp caùc vector ngoõ vaøo. Moät vector sau khi qua khaâu phaân lôùp thì seõ
ñöôïc ñaïi dieän baèng moät nhaõn (maõ)

Hình 4.1 Sô ñoà khoái caáu truùc VQ huaán luyeän vaø phaân lôùp

II. TAÄP HUAÁN LUYEÄN VQ

Trong ñeà taøi naøy, taäp huaán luyeän cho VQ laø taát caû caùc vector phoå sau khi ñaõ qua khaâu trích
ñaëc tröng MFCC cuûa taát caû caùc töø caàn nhaän daïng. Moãi vector laø phoå laø 24 heä soá MFCC cuûa 1
frame tieáng noùi.
Caùc töø ñöôïc ghi aâm bôûi 1 ngöôøi noùi trong ñieàu kieän phoøng yeân tónh.

III. ÑO ÑOÄ MEÙO


Thaønh phaàn quan troïng nhaát cuûa caùc thuaät toaùn ñoái saùnh maãu laø ñoä ño giöõa 2 vector ñaëc
tính.
Trong nhaän daïng tieáng noùi, ngöôøi ta thöôøng söû duïng ñoä ño Euclidean:
P
d ( x, y) | xk yk |2 (4.1)
k 1

Ñoä ño naøy duøng trong khaâu phaân lôùp, gaén nhaõn vector phoå.

IV. PHAÂN NHOÙM CAÙC VECTOR HUAÁN LUYEÄN


Coù 2 giaûi thuaät phaân nhoùm:

LUAÄN VAÊN TOÁT NGHIEÄP - 54 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

1. Giaûi thuaät cuïm thoâng tin (Cluster Algorithm):


Giải thuật naøy coøn goïi laø thuaät toaùn Lloyd hay K-means hay Linde-Buzo-Gray (LBG).

(1) Khôûi taïo: Choïn ngaãu nhieân M vector trong taäp huaán luyeän L laøm taäp töø
maõ(codeword) ban ñaàu cuûa codebook.
(2) Tìm laân caän gaàn nhaát: Vôùi moãi vector huaán luyeän v, tìm codeword trong codebook
hieän taïi coù khoaûng caùch gaàn nhaát vôùi vector naøy (döïa vaøo ñoä ño meùo) vaø gaùn noù
thuoäc veà cell cuûa codeword ñoù.
(3) Caäp nhaät nhaân: Vôùi moãi cell, caäp nhaät codeword söû duïng troïng taâm cuûa taát caû caùc
vector huaán luyeän trong cell naøy.
(4) Ñeä qui: Laëp laïi böôùc 2 vaø 3 cho ñeán khi sai soá löôïng töû nhoû hôn giaù trò ngöôõng cho
pheùp.
Löu ñoà giaûi thuaät:

Hình 4.2 Löu ñoà giaûi thuaät LBG


Ñieàu baát lôïi cuûa thuaät toaùn naøy laø chuùng ta phaûi öôùc löôïng thaät toát ñieåm khôûi ñaàu
cuûa caùc vector codeword. Ñaây laø vaán ñeà khoù khaên.
Minh hoïa giaûi thuaät treân bôûi ví duï sau:
Cho taäp döõ lieäu, taïo moät codebook goàm 4 phaân vuøng, vôùi codeword khôûi ñoäng laø
caùc ñieåm: (2,2), (4,6), (6,5), vaø(8,8)

LUAÄN VAÊN TOÁT NGHIEÄP - 55 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Tìm laân caän gaàn nhaát, tính toaùn troïng taâm cuûa moãi vuøng, roài tính toaùn laïi nhöõng laân
caän gaàn nhaát, tính toaùn laïi troïng taâm cuûa moãi vuøng…

LUAÄN VAÊN TOÁT NGHIEÄP - 56 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

2. Giaûi thuaät Binary Split

Moät bieán theå cuûa thuaät toaùn treân laø giaûi thuaät Binary Split
(1) Thieát keá codebook 1 vector. Ñaây laø nhaân toaøn boä cuûa taäp vector huaán luyeän

(2) Nhaân ñoâi kích thöôùc codebook baèng caùch chia moãi vector trong codebook hieän taïi
yn thaønh 2 vector:
y+n = yn(1 + e)
y-n = yn(1 - e) (4.2)
ÔÛ ñaây, n thay ñoåi töø 1 ñeán kích thöôùc hieän taïi cuûa codebook. e laø tham soá phaân chia,
thöôøng ñöôïc choïn trong taàm 0.01 <= e <= 0.05

(3) Duøng thuaät toaùn K-means ôû treân ñeå xaùc ñònh taäp nhaân toá nhaát cuûa codebook ñaõ chia
( töùc codebook coù kích thöôùc gaáp ñoâi)

LUAÄN VAÊN TOÁT NGHIEÄP - 57 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

(4) Laëp laïi böôùc 2 vaø 3 cho ñeán khi codebook ñaït ñöôïc kích thöôùc M cho tröôùc

Löu ñoà giaûi thuaät:

Hình 4.3: Lưu đồ giải thuật Binary Split

V. PHAÂN LÔÙP VECTOR


Phương phaùp phaân lớp vector phổ về cơ bản laø phải tìm trong toaøn bộ codebook để xaùc định
vector tốt nhất.
Kí hiệu: ym laø vector trong codebook cỡ M , 1≤m≤M
v laø vector phổ cần phaân lớp
m* laø chỉ số của vector tốt nhất (v giống với ym* nhất) trong codebook

thì: m* arg min d (v, ym )


1 m M

LUAÄN VAÊN TOÁT NGHIEÄP - 58 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

VI. NHAÄN DAÏNG BAÈNG VQ:


Löôïng töû hoùa vector coù theå ñöôïc duøng ñeå nhaän daïng tieáng noùi. Ñaây laø phöông phaùp ñöôïc theá
giôùi söû duïng vaøo nhöõng naêm 80, cho keát quaû khaù toát vôùi boä töø vöïng nhoû (nhoû hôn 10 töø).
Phöông phaùp naøy ñöôïc thöïc hieän nhö sau:
Trong pha huaán luyeän, moãi töø trong boä töø vöïng ñöôïc noùi nhieàu laàn, sau ñoù phaân tích ñaëc
tröng. 1 codebook rieâng reõ seõ ñöôïc thöïc hieän cho 1 töø trong boä töø vöïng. Giaû söû ta caàn nhaän
daïng v töø thì seõ coù töông öùng v codebook: C1,C2,…,CV.
Trong pha nhaän daïng, töø caàn nhaän daïng ñöôïc ghi aâm, roài trích ñaëc tröng, sau ñoù tính ñieåm
VQ trung bình nhö sau: Giaû söû töø caàn nhaän daïng sau khi ruùt trích ñaëc tröng coù T vector :
x1,x2,x3,…,xT. Vaø codebook cho töø thöù i laø {y1i,y2i,y3i,…,yMi}, vôùi M laø kích thöôùc cuûa
codebook. Ñoä meùo trung bình cuûa töø caàn nhaän daïng sau khi löôïng töû öùng vôùi codebook thöù i
laø:

Töø caàn nhaän daïng laø töø coù ñoä meùo nhoû nhaát:

Löu ñoà giaûi thuaät:

LUAÄN VAÊN TOÁT NGHIEÄP - 59 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

VII. TOÙM TẮT


Chöông naøy trình baøy veà khaùi nieäm löôïng töû vector, caùc phöông phaùp maõ hoùa vaø phaân lôùp
vector laøm neàn taûng cho vieäc nhaän daïng baèng moâ hình Markov aån rôøi raïc. Vieäc nhaän daïng
baèng phöông phaùp VQ cuõng ñaõ ñöôïc giôùi thieäu. Trong project naøy, 1 codebook côõ 128 ñöôïc
söû duïng. 1 codebook rieâng reõ ñöôïc thöïc hieän cho 1 töø trong boä töø vöïng.

LUAÄN VAÊN TOÁT NGHIEÄP - 60 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Chöông 5:

MOÂ HÌNH MARKOV AÅN


Chöông naøy trình baøy moät phöông phaùp hieäu quaû duøng ñeå moâ hình hoùa caáu truùc ñoäng cuûa tieáng
noùi laø moâ hình Markov aån (Hidden Markov Models-HMM). Ñaây laø höôùng tieáp caän ñoái saùnh
maãu xaùc suaát, vôùi giaû ñònh raèng ôû ñoù caùc maãu tieáng noùi tuaàn töï theo thôøi gian laø keát quaû cuûa
quaù trình thoáng keâ hay ngaãu nhieân coù tham soá, vaø caùc tham soá naøy coù theå öôùc löôïng.
Moãi töø sau khi qua khaâu trích ñaëc tröng ta thu ñöôïc moät daõy vector P chieàu (P=soá heä soá
MFCC), vaø ñöôïc kí hieäu laø t1, t2, …, ti , …, tl . Qua khaâu löôïng töû vector, daõy vector ñaëc tröng
naøy ñöôïc bieán ñoåi thaønh caùc quan saùt (laø caùc symbols sau khi phaân lôùp VQ) vaø ñöôïc kí hieäu laø
o1, o2, …, ot, …, oT

I. KHAÙI NIEÄM

1. Chuoãi Markov:

Xeùt heä thoáng coù tính chaát nhö sau: ôû moät thôøi ñieåm baát kyø, heä thoáng seõ ôû moät trong N traïng
thaùi nhö hình veõ. Cöù sau moät khoaûng thôøi gian ñeàu ñaën, heä thoáng seõ chuyeån sang traïng thaùi
môùi hoaëc giöõ nguyeân traïng thaùi tröôùc ñoù. Ta kyù hieäu caùc khoaûng thôøi gian chuyeån traïng
thaùi laø t=1, 2, … vaø traïng thaùi taïi thôøi ñieåm t cuûa heä thoáng laø qt , qt seõ coù caùc giaù trò 1, 2, …,
N. 1 traïng thaùi töông öùng vôùi 1 söï kieän. Quaù trình treân ñöôïc goïi laø quaù trình Markov

Hình 5.1 : Minh hoïa moâ hình Markov


Trong hình veõ, aij laø xaùc suaát chuyeån töø traïng thaùi i sang traïng thaùi j, ta coù caùc quan heä:
aij 0, i,j
N
aij 1 i (5.1)
j 1

LUAÄN VAÊN TOÁT NGHIEÄP - 61 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Ta chæ xeùt chuoãi Markov baäc nhaát laø nhöõng heä thoáng maø traïng thaùi hieän taïi chæ phuï thuoäc
vaøo traïng thaùi ngay tröôùc ñoù, nghóa laø:

a ij = P[qt=j | qt-1=i]; 1 i, j N. (5.2)

Caùc thaønh phaàn trong moâ hình Markov:


N traïng thaùi cuûa moâ hình. Kyù hieäu traïng thaùi ôû thôøi ñieåm t laø qt
N söï kieän: E = {e1, e2, e3, …, eN}. Moãi söï kieän töông öùng vôùi 1 traïng thaùi. Taïi moãi
thôøi ñieåm t, traïng thaùi phaùt sinh ra söï kieän töông öùng vôùi noù.
A={aij} - laø ma traän phaân phoái xaùc suaát chuyeån traïng thaùi, trong ñoù aij laø xaùc suaát
chuyeån töø traïng thaùi i ôû thôøi ñieåm t sang traïng thaùi j ôû thôøi ñieåm t+1
aij = P[qt = j |qt-1 = i] 1 i,j N
= { i} - ma traän phaân phoái traïng thaùi ban ñaàu trong ñoù i laø xaùc suaát cuûa moâ
hình ôû traïng thaùi i taïi thôøi ñieåm ban ñaàu t=1.

i = P[q1=i] 1 i N (5.3)

2. Caùc ví duï:

1) Ví duï 1: Tung 1 ñoàng xu:

ÔÛ ñaây coù 2 traïng thaùi: S1 töông öùng vôùi söï kieän e1=Xaáp; vaø S2 töông öùng vôùi söï
kieäân e2=Ngöõa.
Ta coù caùc phaàn töû cuûa ma traän A:
a11 = 0.5 a12 = 0.5
a21 = 0.5 a22 = 0.5
Caùc söï kieän:
Xaáp Xaáp Ngöõa Ngöõa Xaáp Ngöõa Xaáp
töông öùng vôùi caùc traïng thaùi:
S1 S1 S2 S2 S1 S2 S1

LUAÄN VAÊN TOÁT NGHIEÄP - 62 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

2) Ví duï 2: Thôøi tieát cuûa moät vuøng vôùi moâ hình xaùc suaát nhö sau:

-Xaùc suaát cuûa chuoãi quan saùt {rain, rain, rain, clouds, sun, clouds, rain} öùng
vôùi moâ hình Markov treân laø:
Quan saùt = { r, r, r, c, s, c, r}

S = {S1, S1, S1, S2, S3, S2, S1}


Time = {1, 2, 3, 4, 5, 6, 7} (days)
= P[S1] P[S1|S1] P[S1|S1] P[S2|S1] P[S3|S2] P[S2|S3] P[S1|S2]
= 0.5 · 0.7 · 0.7 · 0.25 · 0.1 · 0.7 · 0.4
= 0.001715
-Xaùc suaát cuûa chuoãi {sun, sun, sun, rain, clouds, sun, sun) öùng vôùi moâ hình
Markov treân laø:
Quan saùt = { s, s, s, r, c, s, s}

S = {S3, S3, S3, S1, S2, S3, S3}


Time = {1, 2, 3, 4 , 5 , 6 , 7} (days)
= P[S3] P[S3|S3] P[S3|S3] P[S1|S3] P[S2|S1] P[S3|S2] P[S3|S3]
= 0.1 · 0.1 · 0.1 · 0.2 · 0.25 · 0.1 · 0.1

LUAÄN VAÊN TOÁT NGHIEÄP - 63 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

= 5.0x10-7

3. Moâ hình Markov aån:

Khaùc vôùi chuoãi Markov nhö trình baøy ôû treân, moâ hình Markov aån coù nhöõng ñaëc ñieåm
sau:
Töø 1 traïng thaùi coù theå phaùt sinh hôn 1 söï kieän( hay coøn ñöôïc goïi laø 1 quan saùt).
Chuoãi quan saùt laø haøm xaùc suaát cuûa traïng thaùi.
Chuùng ta coù theå tính toaùn xaùc suaát cuûa caùc chuoãi traïng thaùi khaùc nhau töø moät chuoãi
quan saùt.
Nhö vaäy HMM vaãn phaùt sinh ra caùc quan saùt. Soá löôïng traïng thaùi thoâng thöôøng khaùc soá
löôïng quan saùt. Khi ôû traïng thaùi Si, coù xaùc suaát p(o1) ñeå phaùt sinh söï kieän 1, xaùc suaát
p(o2) ñeå phaùt sinh söï kieän 2…

II. CAÙC THAØNH PHAÀN CÔ BAÛN CUÛA MOÂ HÌNH MARKOV AÅN
N laø soá löôïng traïng thaùi cuûa moâ hình. {1,2,…,N} laø caùc traïng thaùi. Kyù hieäu traïng
thaùi ôû thôøi ñieåm t laø qt
M: laø soá löôïng quan saùt phaân bieät. Caùc kyù hieäu quan saùt töông öùng vôùi tín hieäu vaät
lyù maø heä thoáng ñang moâ taû. Ta kyù hieäu taäp quan saùt laø V={v1, v2, …, vM}. Ñoái vôùi tín
hieäu tieáng noùi, M laø kích thöôùc codebook. vi laø maõ cuûa töøng vector.
A={aij} - laø ma traän phaân phoái xaùc suaát chuyeån traïng thaùi, trong ñoù aij laø xaùc suaát
chuyeån töø traïng thaùi i ôû thôøi ñieåm t sang traïng thaùi j ôû thôøi ñieåm t+1
aij = P[qt = j |qt-1 = i] 1 i,j N
B={bj(k)} - ma traän phaân phoái xaùc suaát caùc kyù hieäu quan saùt, trong ñoù bj(k) laø xaùc
suaát nhaän ñöôïc kyù hieäu quan saùt vk ôû traïng thaùi j:
bj(k) = P[ot = vk|qt = j] 1 k M, j=1,2,…N (5.4)
= { i} - ma traän phaân phoái traïng thaùi ban ñaàu trong ñoù i laø xaùc suaát cuûa moâ
hình ôû traïng thaùi i taïi thôøi ñieåm ban ñaàu t=1:

i = P[q1=i] 1 i N

Nhö vaäy ñeå ñaëc taû ñaày ñuû moät HMM caàn phaûi coù soá traïng thaùi N cuûa moâ hình, taäp V goàm
M kyù hieäu quan saùt, ma traän xaùc suaát chuyeån traïng thaùi A, ma traän xaùc suaát caùc kyù hieäu
quan saùt ñöôïc B vaø ma traän xaùc suaát traïng thaùi ban ñaàu .

LUAÄN VAÊN TOÁT NGHIEÄP - 64 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Ñeå thuaän tieän, ta söû duïng kyù hieäu = (A,B, ) ñeå chæ taäp tham soá moâ hình. Taäp tham soá
naøy seõ xaùch ñònh moät giaù trò xaùc suaát cho daõy quan saùt O laø P(O| ).
Ta cuõng ñeå yù laø HMM cuõng phaûi tuaân theo nhöõng raøng buoäc veà maëc thoáng keâ:
N
aij = 1 i=1,2,...,N
j 1

M
b j (k ) =1 j=1,2,...,N (5.5)
k 1

N
=1 (5.6)
i 1

Ñeå roõ hôn veà moâ hình Markov aån ta xeùt caùc ví duï sau:

Ví duï: Thôøi tieát vaø ñoä aåm khoâng khí

Cho moät moâ hình Markov aån nhö hình veõ sau:

Moâ hình naøy coù: Soá traïng thaùi N=3 (goàm High, Medium, Low)
Soá kyù hieäu quan saùt M=3 (goàm Rain, Cloud, Sun)
Caùc giaù trò caùc phaàn töû cuûa ma traän A, B, nhö treân hình veõ treân.

Ví duï 1: Neáu cho chuoãi quan saùt O={sun, sun, cloud, rain, cloud, sun} vaø moâ hình
Markov aån nhö hình veõ treân, thì xaùc suaát ñeå coù chuoãi traïng thaùi {H, M, M, L, L, M} laø
bao nhieâu?
- Xaùc suaát caàn tìm = bH(sun). bM(sun) .bM(cloud). bL(rain) .bL(cloud). bM(sun)
= 0.8 ·0.3 · 0.4 · 0.6 · 0.3 · 0.3 = 5.2x10-3

LUAÄN VAÊN TOÁT NGHIEÄP - 65 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Ví duï 2a: Cho moâ hình Markov nhö hình veõ treân. Tính xaùc suaát ñeå coù ñöôïc chuoãi quan
saùt O={sun, sun, cloud, rain, cloud, sun} vaø chuoãi traïng thaùi laø {H, M, M, L, L, M}.
- Xaùc suaát caàn tìm = H·bH(s) ·aHM·bM(s) ·aMM·bM(c) ·aML·bL(r) ·aLL·bL(c) ·aLM·bM(s)
= 0.4 · 0.8 · 0.3 · 0.3 · 0.2 · 0.4 · 0.5 · 0.6 · 0.4 · 0.3 · 0.7 · 0.3
= 1.74x10-5
Ví duï 2b: Cho moâ hình Markov nhö hình veõ treân. Tính xaùc suaát ñeå coù ñöôïc chuoãi quan
saùt O={sun, sun, cloud, rain, cloud, sun}vaø chuoãi traïng thaùi laø { H, H, M, L, M, H }.

- Xaùc suaát caàn tìm = H·bH(s) ·aHH·bH(s) ·aHM·bM(c) ·aML·bL(r) ·aLM·bM(c) ·aMH·bH(s)
= 0.4 · 0.8 · 0.6 · 0.8 · 0.3 · 0.4 · 0.5 · 0.6 · 0.7 · 0.4 · 0.4 · 0.6
= 3.71x10-4

III. BA BAØI TOAÙN CÔ BAÛN CUÛA HMM

Vôùi HMM ñaõ ñöôïc khaûo saùt ôû phaàn tröôùc, chuùng ta caàn phaûi giaûi quyeát ba baøi toaùn cô baûn
ñeå moâ hình coù theå aùp duïng hieäu quaû trong thöïc teá. Nhöõng baøi toaùn naøy laø:

Baøi toaùn 1: Cho chuoãi quan saùt O=(o1o2...oT) vaø moâ hình = (A,B, ), ta seõ tính P(O| ) laø
xaùc suaát cuûa chuoãi quan saùt cho bôûi moâ hình nhö theá naøo?

Baøi toaùn 2: Cho chuoãi quan saùt O=(o1o2...oT) vaø moâ hình = (A,B, ), laøm sao ta choïn
ñöôïc moät chuoãi traïng thaùi q=(q1q2...qT) töông öùng phuø hôïp nhaát (coù theå giaûi thích toát nhaát
chuoãi quan saùt).

Baøi toaùn 3: Laøm theá naøo ñeå ñieàu chænh tham soá moâ hình = (A,B, ) ñeå cöïc ñaïi hoùa
P(O| )?

Baøi toaùn 1 laø baøi toaùn ñaùnh giaù, töø moät moâ hình cho saún vaø moät chuoãi quan saùt , baèng caùch
naøo tính ñöôïc xaùc suaát ñeå chuoãi quan saùt naøy ñöôïc taïo ra töø moâ hình. Ta coù theå hieåu baøi
toaùn töông ñöông vôùi vieäc cho ñieåm phuø hôïp giöõa moâ hình vaø chuoãi quan saùt. Neáu trong
tröôøng hôïp phaûi löïa choïn moâ hình phuø hôïp nhaát vôùi chuoãi quan saùt thì caùch giaûi baøi toaùn 1
laø raát thích hôïp ñeå traû lôøi caâu hoûi naøy.

Baøi toaùn 2 laø baøi toaùn maø chuùng ta phaûi coá gaéng laøm saùng toû phaàn aån cuûa moâ hình, ñoù laø
tìm ra chuoãi traïng thaùi ñuùng . Roõ raøng laø trong moïi tröôøng hôïp thì ñaây laø ñieàu khoâng theå
neân trong thöïc teá ta seõ söï duïng moät tieâu chuaån toái öu ñeå giaûi baøi toaùn naøy moät caùch toát
nhaát.

Baøi toaùn 3 ñoøi hoûi chuùng ta phaûi tìm caùch cöïc ñaïi hoaù nhöõng tham soá moâ hình ñeå moâ taû toát
nhaát söï xuaát hieän cuûa moät chuoãi quan saùt. Chuoãi duøng hieäu chænh moâ hình ñöôïc goïi laø

LUAÄN VAÊN TOÁT NGHIEÄP - 66 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

chuoãi huaán luyeän. Baøi toaùn huaán luyeän laø voâ cuøng caàn thieát cho haàu heát caùc öùng duïng cuûa
HMM vì noù cho pheùp ta ñieàu chænh caùc tham soá cuûa moâ hình toái öu vôùi döõ lieäu huaán luyeän
nghóa laø taïo ra nhöõng moâ hình cho nhöõng hieän töôïng thöïc teá.
Ñeå laøm saùng toû vieäc aùp duïng ba baøi toaùn cô baûn treân cuûa HMM vaøo vieäc nhaän daïng tieáng
noùi, ta xeùt ví duï moät boä nhaän daïng töø goàm w töø. Ta bieåu dieãn tín hieäu tieáng cuûa moät töø döôùi
daïng moät chuoãi thôøi gian cuûa caùc vector phoå ñöôïc maõ hoaù. Vieäc maõ hoaù ñöôïc tieán haønh
vôùi codebook côõ M; vì vaäy moãi chuoãi quan saùt laø chæ soá caùc vector phoå gaàn tín hieäu tieáng
nguyeân goác nhaát. Vôùi moãi töø trong boä töø vöïng w töø ta seõ coù moät chuoãi huaán luyeän bao goàm
laø moät chuoãi chæ soá codebook cuûa töø. Vieäc ñaàu tieân laø phaûi xaây döïng moâ hình cho töøng töø
rieâng bieät. Vieäc naøy ñöôïc thöïc hieän nhôø giaûi baøi toaùn thöù 3 ñeå öôùc löôïng caùc tham soá cuûa
moâ hình moät caùch toái öu cho töøng töø trong boä töø vöïng. Cuoái cuøng, khi moät taäp goàm w HMM
ñaõ ñöôïc thieát keá vaø toái öu hoaù thì vieäc nhaän daïng moät töø chöa bieát seõ nhôø caùch giaûi baøi
toaùn 1 ñeå tính ñieåm moãi moâ hình töø caên cöù theo chuoãi quan saùt thöû nghieäm vaø choïn ra moâ
hình coù soá ñieåm cao nhaát ( nghóa laø söï gioáng nhau nhieàu nhaát ).

1. Baøi toaùn 1

Chuùng ta caàn tính xaùc suaát nhaän ñöôïc chuoãi quan saùt O=(o1, o2, …, oT) vôùi moâ hình
cho tröôùc, nghóa laø tính P(O | ). Caùch ñôn giaûn nhaát laø khaûo saùt taát caû caùc chuoãi traïng
thaùi coù theå coù vaø tính xaùc suaát nhaän ñöôïc O ñoái vôùi töøng chuoãi. Xeùt moät chuoãi traïng
thaùi q baát kyø: q=(q1, q2, …, qT). Xaùc suaát nhaän ñöôïc chuoãi O öùng vôùi q laø:
T
P O q, P o qt , (5.7)
t 1

Giaû söû caùc kyù hieäu quan saùt xuaát hieän ñoäc laäp vôùi nhau, ta coù:

P O q, bq1 o1 bq2 o2 .....bqT oT (5.8)

Xaùc suaát nhaän ñöôïc chuoãi q laø:

P q q1 a q1q2 a q2q3 .......a qT 1qT (5.9)

Xaùc suaát O vaø q xuaát hieän ñoàng thôøi:


P(O, q | )=P(O | q, ).P(q | ). (5.10)
Ta coù keát quaû:

P O P O q, .P q (5.11)
all q

Theo coâng thöùc treân, ta caàn coù 2T.NT pheùp tính. Neáu N=5, T=100, caàn khoaûng 1072
pheùp tính. Ñaây laø con soá khoâng theå thöïc hieän ñöôïc.
LUAÄN VAÊN TOÁT NGHIEÄP - 67 - SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Moät caùch khaùc ñeå giaûi baøi toaùn 1 laø duøng thuû tuïc tieán hoaëc thuû tuïc luøi.
i. Thuû tuïc tieán ( Forward hay Baum-Welch)

Ta ñònh nghóa:

t(i)=P(o1, o2, …, ot, qt=i | ) (5.12)


nghóa laø xaùc suaát nhaän ñöôïc chuoãi quan saùt o1o2…ot ñeán thôøi ñieåm t vaø traïng thaùi ôû t
laø i, vôùi moâ hình cho tröôùc.
Ta tính P(O | ) nhö sau:
- Baét ñaàu:

1(i)= ibi(o1) 1 i N (5.13)


- Quy naïp:
N

t 1 j t i a ij b j o t 1
1
1
t
j
T-1
N (5.14)
i 1

- Keát thuùc:
N
P O T i (5.15)
i 1

Theo thuû tuïc treân, soá pheùp tính caàn thieát khoaûng N2T, nhoû hôn raát nhieàu so vôùi
2T.NT.

Hình 5.2 Minh hoïa böôùc quy naïp trong thuû tuïc Forward

Ví duï thuaät toaùn Forward:

LUAÄN VAÊN TOÁT NGHIEÄP - 68 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Cho moâ hình HMM nhö hình veõ treân, ôû ñaây coù 3 traïng thaùi: H, M, L. Vaø coù 2 quan
saùt: rain vaø sun.
Ta tính xaùc suaát cuûa chuoãi quan saùt: s r r s r (s=sun,r=rain) baèng caùch tính giaù
trò cuûa taïi thôøi ñieåm 5:
-Baét ñaàu: 1(M)=0.5·0.5=0.25

1(H)=0.2·0.75=0.15

1(L)=0.3·0.25=0.075

-Quy naïp:

2(M) = [0.25·0.3 + 0.15·0.4 + 0.075·0.4] · 0.5 = 0.0825

2(H) = [0.25·0.4 + 0.15·0.5 + 0.075·0.1] · 0.25 = 0.0456

2(L) = [0.25·0.3 + 0.15·0.1 + 0.075·0.5] · 0.75 = 0.0956

3(M) = [0.0825·0.3 + 0.0456·0.4 + 0.0956·0.4] · 0.5 = 0.0406

3(H) = [0.0825·0.4 + 0.0456·0.5 + 0.0956·0.1] · 0.25 = 0.0163

3(L) = [0.0825·0.3 + 0.0456·0.1 + 0.0956·0.5] · 0.75 = 0.0578

4(M) = [0.0406·0.3 + 0.0163·0.4 + 0.0578·0.4] · 0.5 = 0.0209

4(H) = [0.0406·0.4 + 0.0163·0.5 + 0.0578·0.1] · 0.75 = 0.0226

4(L) = [0.0406·0.3 + 0.0163·0.1 + 0.0578·0.5] · 0.25 = 0.0107

LUAÄN VAÊN TOÁT NGHIEÄP - 69 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

5(M) = [0.0209·0.3 + 0.0226·0.4 + 0.0107·0.4] · 0.5 = 0.0098

5(H) = [0.0209·0.4 + 0.0226·0.5 + 0.0107·0.1] · 0.25 = 0.0052

5(L) = [0.0209·0.3 + 0.0226·0.1 + 0.0107·0.5] · 0.75 = 0.0104

-Keát thuùc:

P(O| )= 5(M) + 5(H) + 5(L) = 0.0254

ii. Thuû tuïc luøi (Backward)

Töông töï ta ñònh nghóa:

t i P o t 1o t 2 .....oT q t i, (5.14)

Thuû tuïc luøi thöïc hieän nhö sau:


- Baét ñaàu:

t i 1 1 i N. (5.15)

- Quy naïp:
N

t i a ijb j o t 1 t 1 j t = T-1, T-2, ....., 1


1 i N (5.16)
j 1

Hình 5.3 Minh hoïa thuû tuïc Backward

Ví duï thuû tuïc Backward:

Cho moâ hình HMM nhö trong ví duï phaàn Forward, tính xaùc suaát cuûa chuoãi quan saùt
srrsr (s=sun,r=rain)?
Ta ñi tính giaù trò cuûa töø thôøi ñieåm 5 ñeán thôøi ñieåm 0:

LUAÄN VAÊN TOÁT NGHIEÄP - 70 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

5(M)=1.0 5(H)=1.0 5(L)=1.0

4(M) = [0.3·0.50·1.0 + 0.4·0.25·1.0 + 0.3·0.75·1.0] = 0.4750

4(H) = [0.4·0.50·1.0 + 0.5·0.25·1.0 + 0.1·0.75·1.0] = 0.4000

4(L) = [0.4·0.50·1.0 + 0.1·0.25·1.0 + 0.5·0.75·1.0] = 0.6000

3(M) = [0.3·0.50·0.475 + 0.4·0.75·0.400 + 0.3·0.25·0.600] = 0.2363

3(H) = [0.4·0.50·0.475 + 0.5·0.75·0.400 + 0.1·0.25·0.600] = 0.2600

3(L) = [0.4·0.50·0.475 + 0.1·0.75·0.400 + 0.5·0.25·0.600] = 0.2000

2(M) = [0.3·0.50·0.236 + 0.4·0.25·0.260 + 0.3·0.75·0.200] = 0.1064

2(H) = [0.4·0.50·0.236 + 0.5·0.25·0.260 + 0.1·0.75·0.200] = 0.0947

2(L) = [0.4·0.50·0.236 + 0.1·0.25·0.260 + 0.5·0.75·0.200] = 0.1287

1(M) = [0.3·0.50·0.106 + 0.4·0.25·0.095 + 0.3·0.75·0.129] = 0.0544

1(H) = [0.4·0.50·0.106 + 0.5·0.25·0.095 + 0.1·0.75·0.129] = 0.0428

1(L) = [0.4·0.50·0.106 + 0.1·0.25·0.095 + 0.5·0.75·0.129] = 0.0720

0(·) = [0.5·0.50·0.054 + 0.2·0.75·0.043 + 0.3·0.25·0.072] = 0.0254

2. Baøi toaùn 2

Ñeå giaûi quyeát baøi toaùn 2, chuùng ta söû duïng thuaät toaùn Viterbi ñeå tìm chuoãi traïng thaùi
ñôn toát nhaát q=(q1, q2, …, qT) öùng vôùi chuoãi quan saùt O=(o1o2...oT) ñaõ cho.
Chuùng ta ñònh nghóa ñaïi löôïng:

t i max P q1q 2 ....q t 1 , q t i, o1o 2 ...o t (5.17)


q1 ,q 2 ,...,q t 1

laø t i coù ñieåm toát nhaát (xaùc suaát lôùn nhaát) treân con ñöôøng ñôn taïi thôøi ñieåm t öùng
vôùi quan saùt ñaõ cho vaø keát thuùc ôû traïng thaùi i. Qui naïp, ta coù:

t 1 j max t i a ij .b j o t 1 (5.18)
t

LUAÄN VAÊN TOÁT NGHIEÄP - 71 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Muoán xaùc ñònh chuoãi traïng thaùi, chuùng ta söû duïng maûng t(j) ñeå löu laïi ñoái soá laøm
cho phöông trình (5.17) cöïc ñaïi ôû töøng thôøi ñieåm t vaø traïng thaùi i. Thuaät toaùn tìm chuoãi
traïng thaùi toát nhaát moâ taû nhö sau:

(1). Khôûi taïo

1(i) = ibi(o1) , 1 i N (5.19a)

1(i) =0 (5.19b)

(2). Ñeä quy

t(j) = max t-1(i)aijbj(ot) , 2 t T, 1 j N (5.20a)


1 i N

t(j) = arg max t-1(i)aij , 2 t T, 1 j N (5.20b)


1 i N

(3). Keát thuùc

P*= max T(i) (5.21a)


1 i N

qT* =arg max T (i) (5.21b)


1 i N

(4). Laàn ngöôïc laïi ñöôøng ñi (chuoãi traïng thaùi)

qt* = *
t+1(qt+1 ) t=T-1,T-2,…,1 (5.22)

Thuaät toaùn Viterbi cuõng töông töï thuaät toaùn Baul-Welch (ngoaïi tröø böôùc laàn ngöôïc).
Pheùp toaùn cöïc ñaïi hoùa ôû phöông trình (5.20a) thay cho pheùp toång ôû (5.14).

Ví duï veà thuaät toaùn Viterbi:

Cho moâ hình HMM nhö trong ví duï phaàn thuû tuïc Forward
Tính xaùc suaát chuoãi quan saùt: s r r s r (s=sun,r=rain) baèng thuaät toaùn Viterbi?
Ta tính ñöôøng ñi Viterbi ñeán t=5:

(1).Khôûi taïo:

1(M)=0.5·0.5=0.25 1(H)=0.2·0.75=0.15 1(L)=0.3·0.25=0.075

1(1)= 0 1(2)= 0 1(3)= 0

(2).Ñeä quy:

2(M) = max[0.25*0.3; 0.15*0.4; 0.075*0.4] · 0.5 = 0.0375

2(H) = max[0.25*0.4; 0.15*0.5; 0.075*0.1] · 0.25 = 0.0250

LUAÄN VAÊN TOÁT NGHIEÄP - 72 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

2(L) = max[0.25*0.3; 0.15*0.1; 0.075*0.5] · 0.75 = 0.0563

2(1)= 1 2(2)= 1 2(3)= 1

3(M) = max[0.0375*0.3; 0.0250*0.4; 0.0563*0.4] · 0.5 = 0.0113

3(H) = max[0.0375*0.4; 0.0250*0.5; 0.0563*0.1] · 0.25 = 0.0038

3(L) = max[0.0375*0.3; 0.0250*0.1; 0.0563*0.5] · 0.75 = 0.0211

3(1)= 3 3(2)= 1 3(3)= 3

4(M) = max[0.0113*0.3 ; 0.0038*0.4 ; 0.0211*0.4] · 0.5 = 0.0042

4(H) = max[0.0113*0.4 ; 0.0038*0.5 ; 0.0211*0.1] · 0.75 = 0.0034

4(L) = max[0.0113*0.3 ; 0.0038*0.1 ; 0.0211*0.5] · 0.25 = 0.0026

4(1)= 3 4(2)= 1 4(3)= 3

5(M) = max[0.0042*0.3 ; 0.0034*0.4 ; 0.0026*0.4] · 0.5 = 0.0007

5(H) = max[0.0042*0.4 ; 0.003*0.5 ; 0.0026*0.1] · 0.25 = 0.0004

5(L) = max[0.0042*0.3 + 0.0034*0.1 + 0.0026*0.5] · 0.75 = 0.0010

5(1)= 2 5(2)= 2 5(3)= 3

(3).Keát thuùc:
P*=0.0010
qT* =arg max T (i)
1 i N

q*5= 3

(4).Laàn ngöôïc con ñöôøng:


q*t = *
t+1(q t+1)

q5=3,

LUAÄN VAÊN TOÁT NGHIEÄP - 73 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

q4= 5(3)=3

q3= 4(3)=3

q2= 3(3)=3

q1= 2(3)=1

Caùc traïng thaùi laàn löôït laø: 13333

Thuaät toaùn Viterbi daïng logarit


Neáu laáy logarit tham soá caùc moâ hình thì ta coù theå aùp duïng thuaät toaùn Viterbi ñaõ ñeà nghò
maø khoâng caàn duøng baát cöù caùc pheùp nhaân naøo, cuï theå nhö sau :

(1). Tieàn xöû lyù

i log( i ) (5.23a)

bi (ot)=log[bi(ot)] (5.23b)

a ij =log(aij) (5.23c)

vôùi 1 t T, 1 i,j N

(2). Khôûi ñoäng

1(i) = log( 1(i)) = i + b i (ot) (5.24a)

1(i) =0 (5.24b)

Vôùi 1 i N

(3). Keát thuùc


*
P = max [ T(i)] (5.25a)
1 i N

q*T=arg max [ T(i)] (5.25b)


1 i N

LUAÄN VAÊN TOÁT NGHIEÄP - 74 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

(4). Laàn ngöôïc laïi ñöôøng ñi


qt * = *
t+1(q t+1) t=T-1,T-2,…,1 (5.26)

3. Baøi toaùn 3

Baøi toaùn 3 laø baøi toaùn tìm ra phöông phaùp ñieàu chænh tham soá cuûa moâ hình (A,B, ), ñeå
thoaû maõn moät tieâu chuaån toái öu naøo ñoù. Ñaây laø baøi toaùn khoù khaên nhaát. Khoâng coù caùch
phaân tích naøo coù theå ñieàu chænh ñöôïc tham soá cuûa moâ hình sao cho ñaït ñöôïc xaùc suaát
lôùn nhaát öùng vôùi quan saùt ñaõ cho. Tuy nhieân, chuùng ta coù theå choïn A, B, sao cho
xaùc suaát P O laø cöïc ñaïi ñòa phöông theo phöông phaùp cuûa Baum-Welch. Phöông
phaùp naøy coøn goïi laø kyø voïng cöïc ñaïi-Expectation Maximization (EM).
Ñeå moâ taû phöông phaùp öôùc löôïng caùc tham soá moâ hình, ta caàn ñònh nghóa caùc ñaïi löôïng
sau ñaây:
Ñònh nghóa bieán xaùc suaát haäu nghieäm:

t(i)=P(qt=i | O, ) (5.27)
laø xaùc suaát ôû traïng thaùi i thôøi ñieåm t öùng vôùi chuoãi O vaø moâ hình .
Ta bieåu dieãn t(i) theo t(i) vaø t(i):

Vì P(O,qt=i | )= t(i) t(i) neân ta coù theå vieát laïi:

P 0, q t i P 0, q t i
t i P qt i 0, N
(5.28)
P 0
P 0, q t i
i 1

i i
t i N
t t
(5.29)
t i t i
i 1

Ta thaáy raèng t(i) öùng vôùi mieàn quan saùt o1o2…ot vaø traïng thaùi i ôû thôøi ñieåm t. Coøn t(i):

öùng vôùi mieàn quan saùt ot+1 ,ot+2,…,oT vaø traïng thaùi ñaõ cho qt = i taïi thôøi ñieåm t
Ñònh nghóa t(i,j) laø xaùc suaát ôû traïng thaùi i taïi thôøi ñieåm t vaø traïng thaùi j ôû thôøi ñieåm
t+1 cho bôûi chuoãi O vaø moâ hình , nghóa laø :

t(i,j) = P(qt = i, qt+1 = j | O, ) (5.30)

Töø ñònh nghóa bieán tieán vaø bieán luøi ta coù theå vieát laïi phöông trình treân :
P( qt i, q t 1 j , O | )
t(i,j) =
P(O | )

LUAÄN VAÊN TOÁT NGHIEÄP - 75 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

(i )aij b j (Ot 1 ) ( j)
=
t t 1

P(O | )

(i)aij b j (Ot 1 ) ( j)
= (5.31)
t t 1
N N

t (i)aij b j (Ot 1 ) t 1 ( j)
i 1 j 1

Töø ñònh nghóa (i ) vaø t(i,j) suy ra


t

t (i ) = t (i, j ) (5.32)
i 1

Neáu laáy toång t (i ) theo thôøi gian t, ta nhaän ñöôïc ñaïi löôïng mang yù nghóa laø soá laàn ñöôïc
kyø voïng heä ôû traïng thaùi i, hay töông ñöông vôùi soá laàn chuyeån traïng thaùi ñöôïc kyø voïng
töø traïng thaùi i (neáu ta boû qua t=T trong pheùp laáy toång). Töông töõ toång t(i,j) theo thôøi
gian laø soá laàn chuyeån ñöôïc kyø voïng töø traïng thaùi i sang traïng thaùi j. Töùc laø:
T 1

t (i) : kyø voïng soá laàn chuyeån traïng thaùi töø traïng thaùi i öùng vôùi O
t 1

T 1

t (i, j ) : kyø voïng soá laàn chuyeån ñöôïc töø traïng thaùi i tôùi traïng thaùi j öùng vôùi O
t 1

Duøng caùc coâng thöùc ôû treân (vaø khaùi nieäm ñeán nhöõng bieán coá xaûy ra ) chuùng ta coù theå
ñöa ra moät phöông phaùp ñeå taùi öôùc löôïng laïi nhöõng tham soá HMM. Caùc coâng thöùc coù
theå taùi öôùc löôïng laïi caùc tham soá ,A,B ñöôïc cho nhö sau:

j = taàn suaát ñöôïc mong ñôïi ôû traïng thaùi ôû thôiø ñieåm t=1.

P(O, qt i | ) (i ) (i)
= 1 (i ) = = 1
N
1
(5.33)
P(O | )
T (i)
i 1

a ij = (kyø voïng soá laàn chuyeån töø traïng thaùi i sang traïng thaùi j )

/ (kyø voïng soá laàn chuyeån ñöôïc töø traïng thaùi i)


T 1

t (i, j )
= t 1
T 1
(5.34)
t (i )
t 1

LUAÄN VAÊN TOÁT NGHIEÄP - 76 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

b j (k ) = (kyø voïng soá laàn ñöôïc ôû traïng thaùi j vaø quan saùt thaáy vk)

/ (kyø voïng soá laàn ñöôïc ôû traïng thaùi j)


T

t ( j) T
t 1 P(O, qt i ) (Ot , v k )
= oTt
vk
= t 1
T

t ( j) P(O, qt 1 i )
t 1 t 1

t ( j ). t ( j ). (Ot , v k )
= t 1
T
(5.35)
t ( j) t ( j)
t 1

ÔÛ ñaây:

1 neáu Ot v
(Ot , vk ) k (5.36)
0 nôi khaùc

Neáu ta ñònh nghóa moâ hình hieän taïi laø = (A,B, ) vaø duøng noù ñeå tính toaùn veá phaûi cuûa
caùc phöông trình (5.33), (5.34), (5.35), vaø ta ñònh nghóa moâ hình ñöôïc öôùc löôïng laïi laø
=( A , B , ) nhö ñaõ xaùc ñònh cho veá phaûi cuûa 3 phöông trình naøy thì nhöõng tính chaát
sau seõ xuaát hieän (Baum ñaõ chöùng minh) :

Hoaëc ñaït traïng thaùi tôùi haïn nghóa laø =

Hoaëc toát hôn theo nghóa P(O| )> P(O| ) nghóa laø chuùng ta tìm ra moät moâ
hình môùi maø töø ñoù chuoãi quan saùt coù nhieàu khaû naêng ñöôïc taïo ra hôn.
Döïa vaøo thuû tuïc neâu treân, neáu muoán caûi thieän xaùc suaát cuûa O coù theå ñöôïc quan saùt töø
moâ hình thì ta coù theå laëp laïi vieäc taùi öôùc löôïng nhieàu laàn. Keát quaû thu ñöôïc cuoái cuøng
laø moät öôùc löôïng gioáng nhaát ML (Maximum Likelihood) cuûa HMM. Caàn phaûi thaáy raèng
giaûi thuaät tieán luøi chæ seõ daãn ñeán cöïc ñaïi ñòa phöông, vaø trong nhieàu tröôøng hôïp thì haøm
likelihood seõ voâ cuøng phöùc taïp vaø coù nhieàu cöïc ñaïi ñòa phöông.

IV. PHAÂN LOAÏI HMM:

Ta phaân loaïi moâ hình Markov döïa vaøo caáu truùc cuûa ma traän xaùc suaát chuyeån traïng thaùi A.
Xeùt moâ hình goàm boán traïng thaùi coù ma traän A nhö beân döôùi:

LUAÄN VAÊN TOÁT NGHIEÄP - 77 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Neáu taát caû caùc heä soá cuûa ma traän ñeàu döông, nghóa laø moâ hình coù theå chuyeån töø moät traïng
thaùi sang moät traïng thaùi baát kyø. Tuy nhieân, trong nhaän daïng tieáng noùi thöôøng söû duïng moâ
hình traùi-phaûi hay moâ hình Bakis. Moâ hình naøy coù tính chaát: khi thôøi gian taêng leân, traïng
thaùi seõ taêng leân hoaëc vaãn giöõ nguyeân traïng thaùi cuõ. Ñieàu naøy phuø hôïp vôùi caáu truùc töï
nhieân cuûa tieáng noùi laø bieán thieân theo thôøi gian töø traùi sang phaûi. Caùc heä soá cuûa moâ hình
traùi phaûi coù tính chaát: a ij 0 vôùi j<i. Ngoaøi ra xaùc suaát ban ñaàu coøn coù tính chaát:

Thoâng thöôøng, moâ hình Bakis coøn raøng buoäc khoâng ñöôïc chuyeån töø moät traïng thaùi ñeán
traïng thaùi quaù xa noù, nghóa laø: a ij 0 neáu j>i+ i.

Trong ví duï beân döôùi, ta thaáy moâ hình Bakis vôùi i=2 vaø ma traän A laø:

Chuù yù raèng trong moâ hình Bakis, ôû traïng thaùi cuoái cuøng: aNN=1 vaø aNi=0.

Hình 5.2 : Moâ hình Bakis 6 traïng thaùi

V. VAÁN ÑEÀ TÆ LEÄ KHI TOÅ CHÖÙC HMM

LUAÄN VAÊN TOÁT NGHIEÄP - 78 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Ñeå hieåu roõ vì sao caàn phaûi laáy tæ leä khi caøi ñaët thuû tuïc öôùc löôïng tham soá HMM, ta haõy
xem laïi ñònh nghóa bieán tieán t (i) . Coù theå thaáy raèng t (i ) laø toång cuûa moät soá löôïng lôùn
caùc soá haïng coù daïng :
t 1 t
a qsqs 1 bqs (Os )
s 1 s 1

Vì caùc ñaïi löôïng a vaø b nhoû hôn 1 neân khi t lôùn moãi soá haïng t (i ) seõ tieán veà 0 theo toác ñoä
haøm muõ. Vôùi t ñuû lôùn, mieàn giaù trò cuûa t (i ) seõ vöôït qua giôùi haïn döõ lieäu cho pheùp cuûa baát
kyø maùy tính naøo (vöôït caû ñoä chính xaùc keùp ). Chính vì vaäy ta caàn laáy tæ leä trong quaù trình
tính toaùn thuû tuïc öôùc löôïng .
Ñeå hieåu roõ quùa trình laáy tæ leä, ta xem laïi quaù trình taùi ñaùnh giaù caùc heä soá chuyeån traïng thaùi
aij . Bieåu dieãn ñaïi löôïng naøy tröïc tieáp theo caùc bieán tieán vaø luøi ta ñöôïc :
T 1

t (i )aij b j (ot ) t 1 ( j)
aij t 1
T 1
(5.37)
t (i ) t 1 ( j)
t 1

Ta duøng caùc kyù hieäu :

t (i ) ñeå chæ giaù trò chöa ñöôïc laáy tæ leä

t (i ) ñeå chæ giaù trò ñaõ ñöôïc laáy tæ leä

t (i) ñeå chæ giaù trò trung gian khi laáy tæ leä

Vôùi t=1 Ta tính t (i ) nhö sau :

(i )
t (i ) = N
1
(5.38)
1 ( j)
j 1

Ta ñònh nghóa c(1) laø heä soá chuaån hoaù vôùi :


1
c(1)= N
(5.39)
1 ( j)
j 1

Töø ñoù ta coù :

LUAÄN VAÊN TOÁT NGHIEÄP - 79 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

1 (i) =c(1) 1 (i) (5.40)

Vôùi t=2 ta söû duïng coâng thöùc tính t (i ) aùp duïng cho t (i) khi ñoù thay t (i ) baèng t (i )
nghóa laø :

2 (i) 2 ( j ) a ji bi (o2 ) (5.41)


j 1

Töø (5.37), (5.40) vaø (5.41) ta coù :

2 (i ) =c(1) 2 (i )

Caùc giaù trò naøy ñöôïc tính cho taát caû caùc traïng thaùi i, sau ñoù ta laáy tæ leä chuùng treän toång caùc
traïng thaùi :

(i )
2 (i ) 2
=c(2)c(1) 2 (i ) (5.42)
N

2 ( j)
j 1

Vôùi t = 3,4,…T thöïc hieän töông töï ta coù :


N

t (i ) t 1 ( j )aij b j (ot ) (5.43)


j 1

t
t (i) c(t ) t (i ) c(l ) t (i) (5.44)
l 1

1
Vôùi c(l ) (5.45)
N

l (i )
i 1

Töø (5.43) ñeán (5.45) ta coù theå thaáy raèng :


N
t 1 ( j )a ji bi (ot )
(5.46)
j 1
t (i ) N N
t 1 ( j )a jk bk (ot )
k 1 j 1

Cuoái cuøng ta coù :

LUAÄN VAÊN TOÁT NGHIEÄP - 80 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

(i )
t (i ) N
t
(5.47)
t (k )
k 1

Coâng vieäc ñöôïc aùp duïng töông töï cho t (i) vôùi ñieåm khaùc bieät duy nhaát laø ta laáy cuøng moät

heä soá tæ leä nhö ñaõ aùp duïng ñeå tính cho t (i ) . Do vaäy ta coù :

t 1 ( j) c(t ) t 1 ( j) (5.48)
T

t 1 ( j) c(l ) t 1 ( j) (5.49)
l t

_
Vôùi t (i ) vaø t (i ) vöøa laáy tæ leä ta coù theå öôùc löôïng ñöôïc
a ij nhö sau:
T 1

t (i )aij b j (ot ) t 1 ( j)
a ij t 1
T 1
(5.50)
t (i ) t 1 ( j)
t 1

Do vaäy ta thaáy caùc gía trò laáy tæ leä coù theå ñöôïc söû duïng ñeå taùi öôùc löôïng xaùc suaát chuyeån
traïng thaùi maø khoâng caàn phaûi hieäu chænh.

Cuoái cuøng ta haõy xaùch ñònh xaùc suaát P (O ) .

Ta coù :
N
P (O ) = T (i ) (5.51)
i 1

Roõ raøng laø khoâng thích hôïp giaù trò ñaõ laáy tæ leä trong coâng thöùc naøy. Tuy nhieân, töø (5.47) ta
thaáy :
N

t (i ) = 1 t (5.52)
i 1

Do vaäy, chuùng ta coù theå vieát


N N T

T (i) c(l ) T (i) 1 (5.53)


i 1 i 1 l 1

Vaø cuoái cuøng ta ruùt ra ñöôïc :

LUAÄN VAÊN TOÁT NGHIEÄP - 81 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

T 1

P(O ) c(l ) (5.54)


l 1

Chuùng ta cuõng coù theå tính baèng logarithm ( vì bieåu thöùc treân coù theå vöôït quaù daõy ñoäng cho
pheùp cuûa maùy tính )
T
-log P (O ) = log c(l ) (5.55)
l 1

Nhö vaäy log cuûa P ñöôïc tính chöù khoâng phaûi P, bôûi vì P coù khaû naêng vöôït quaù phaïm vi cho
pheùp cuûa maùy tính.
Neáu söû duïng thuaät toaùn Viterbi logarithm ñeå xaùc ñònh traïng thaùi toái öu nhaát thì phöông
phaùp tæ leä ôû treân laø khoâng caàn thieát.

VI. ÑA QUAN SAÙT

Trong thöïc teá, ñeå taêng ñoä chính xaùc cuûa HMM, ngöôøi ta thöôøng duøng kyõ thuaät ña quan saùt,
nghóa laø duøng moät soá löôïng lôùn quan saùt ñeå huaán luyeän moâ hình. Khi ñoù thuû tuïc öôùc löôïng
laïi tham soá seõ phaûi ñöôïc boå sung.
Ta kyù hieäu K chuoãi quan saùt nhö sau :
O = [ O(1), O(2),…,O(K)]
vôùi O(k) = (O1(k),O2(k),…,OTk(k)) laø chuoãi quan saùt thöù k.
Ta giaû söû caùc chuoãi quan saùt hoaøn toaøn ñoäc laäp nhau vaø muïc tieâu cuûa ta laø hieäu chænh caùc
tham soá cuûa moâ hình ñeå cöïc ñaïi hoaù ñaïi löôïng :
K K
P (O ) = P(O k ) Pk (5.56)
k 1 k 1

Vì caùc coâng thöùc taùi öôùc löôïng döïa treân taàn suaát xuaát hieän cuûa caùc bieán coá khaùc nhau neân
ta seõ coäng caùc taàn suaát xuaát hieän rieâng bieät vôùi töøng chuoãi vaø ñöa vaøo bieåu thöùc. Vì vaäy

caùc coâng thöùc öôùc löôïng laïi ñöôïc boå sung cho aij vaø b j (l ) nhö sau:
K Tk 1
1 k
t (i )aij b j (Otk 1 ) k
t 1 ( j)
aij
k 1 P k t 1
(5.57)
K Tk 1
1 k k
t (i ) t ( j)
k 1 P k t 1

LUAÄN VAÊN TOÁT NGHIEÄP - 82 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

K Tk
1 k k
t ( j) t ( j)
k 1 P k t 1

b j (l ) ot l
(5.58)
K Tk 1
1 k k
t (i ) t ( j)
k 1 P k t 1

Coøn i khoâng caàn öôùc löôïng laïi do 1 =1 vaø i = 0 vôùi i khaùc 1.

Duøng yù töôûng laáy tæ leä ôû phaàn treân, trong ñoù moãi daõy quan saùt coù moät heä soá tæ leä rieâng, ta
nhaän ñöôïc caùc coäng thöùc öôùc löôïng theo caùc bieán ñaõ ñöôïc laáy tæ leä nhö sau:
K Tk 1
k
t (i)aij b j (Ot( k1) ) k
t 1 ( j)
aij k 1 t 1
K Tk 1
(5.59)
k k
t (i) t ( j)
k 1 t 1

K Tk
k k
t ( j) t ( j)
b j (l ) K
k 1 t 1
Tk
(5.60)
1 k k
t ( j) t ( j)
k 1 Pk t 1

VII. CAÙC MAÃU MAÄT ÑOÄ HMM


Nhöõng traïng thaùi cuûa moät HMM caàn coù nhieàu caùch taïo maãu caùc phaân phoái xaùc suaát trong
khoâng gian aâm thanh. Coù 3 caùch thoâng thöôøng ñeå thöïc hieän ñieàu naøy : maãu maät ñoä rôøi raïc,
maãu maät ñoä lieân tuïc, vaø maãu maät ñoä baùn lieân tuïc.

1. Maãu maät ñoä rôøi raïc

Trong phöông phaùp naøy, toaøn boä khoâng gian aâm thanh ñöôïc chia laøm moät soá trung bình
caùc vuøng, baèng thuû tuïc phaân vuøng (clustering procedure) nhö ñaõ giôùi thieäu trong phaàn
löôïng töû hoùa vectô (VQ). Nhaân (centroid) cuûa moãi cluster ñöôïc tieâu bieåu bôûi moät töø maõ
(codeword) voán laø moät chæ muïc ñeán saùch maõ (codebook). Moãi frame ngoõ vaøo ñöôïc ñoåi
thaønh moät codeword baèng caùch tìm ra vectô gaàn nhaát trong codebook. Moãi codebook coù
M codeword ñöôïc goïi laø codebook côõ M. M cuõng laø soá kí hieäu quan saùt ñöôïc cuûa 1
traïng thaùi trong HMM. Nhö vaäy, trong HMM rôøi raïc, soá quan saùt laø höõu haïn. Haïn cheá
cuûa phöông phaùp khoâng tham soá naøy laø noù gaëp phaûi nhöõng sai soá löôïng töû.
Ba baøi toaùn maø ta ñaõ xeùt ôû treân duøng ñeå nhaän daïng vaø huaán luyeän cho caùc tham soá cuûa
HMM ñöôïc aùp duïng hoaøn toaøn cho maät ñoä maãu rôøi raïc.

2. Maãu maät ñoä lieân tuïc:

LUAÄN VAÊN TOÁT NGHIEÄP - 83 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Sai soá löôïng töû coù theå ñöôïc loaïi boû nhôø söû duïng maät ñoä maãu lieân tuïc thay vì duøng saùch
maõ. Trong phöông phaùp naøy, phaân phoái xaùc suaát treân khoâng gian ñöôïc taïo maãu tröïc
tieáp nhôø giaû ñònh laø noù coù daïng tham soá xaùch ñònh vaø sau ñoù coá tìm ra nhöõng tham soá
ñoù. Thöôøng thì daïng tham soá naøy ñöôïc choïn laø phoái hôïp cuûa K bieán Gauss, nghóa laø:
M
b j (o) C jk G(o, jk ,U jk ) (5.61)
k 1

Vôùi b j (o)do 1 , j=1,2,…,N

Vaø C jk laø troïng soá cho töøng phaân phoái Gauss G coù trung bình laø jk vaø traän hieäp
phöông sai U jk sao cho k
C jk = 1. Trong suoát quaù trình huaán luyeän vieä öôùc löôïng laïi
B thì bao goàm caû vieäc ñaùnh giaù laïi C jk , jk , U jk duøng moät taäp hôïp caùc coâng thöùc boå
sung sau ñaây:
T

t ( j, k )
C jk t 1
T M
öôùc löôïng troïng soá haøm phaân boá thöù k ôû traïng thaùi j
t ( j, k )
t 1 k 1

t ( j , k )Ot
jk
t 1
T
vector trung bình haøm phaân boá thöù k traïng thaùi j
t ( j, k )
t 1

t ( j , k )(Ot jk )(Ot jk )T
U jk t 1
T
covariance haøm phaân boá thöù k traïng thaùi j
t ( j, k )
t 1

Trong ñoù t ( j , k ) laø xaùc suaát ôû traïng thaùi j taïi thôøi ñieåm t cuûa haøm maät ñoä thöù k:

( j) ( j) C jk G (Ot , ,U jk )
( j, k ) = (5.62)
t t jk
t N M

j 1
t ( j) t ( j)
m 1
c jm
G (Ot , jm ,U jm )

Nhaän xeùt:
Ñoái vôùi maãu maät ñoä lieân tuïc thì soá quan saùt cuûa HMM laø voâ cuøng. Moãi traïng thaùi
phaùt xaï quan saùt theo phaân phoái troän Gauss.

LUAÄN VAÊN TOÁT NGHIEÄP - 84 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Khi aùp duïng maät ñoä maãu lieân tuïc thì ñaõ coù moät soá thay ñoåi treân coâng töùc huaán luyeän.
t ( j ) laø xaùc suaát ôû traïng thaùi i thôøi ñieåm t seõ ñöôïc thay baèng toång caùc xaùc suaát ôû

traïng thaùi i haøm maät ñoä thöù k taïi thôøi ñieåm t :


M

t ( j) = t ( j, k )
k 1

coøn caùc coâng thöùc taùi öôùc löôïng aij vaø i vaãn gioáng nhö caùc coâng thöùc ñaõ duøng cho
maãu maät ñoä rôøi raïc
Haïn cheá cuûa phöông phaùp naøy laø nhöõng tham soá khoâng ñöôïc duøng chung cho caùc
traïng thaùi, Vaäy neáu coù nhieàu traïng thaùi trong toaøn heä thoáng thì moät giaù trò K lôùn coù
theå daån ñeán coù quaù nhieàu tham soá caàn ñöôïc huaán luyeän töông xöùng coøn neáu giaûm K
thì coù theå khoâng giaùm saùt ñöôïc giaû ñònh raèng phaân phoái coù theå ñöôïc taïo maãu toát baèng
caùch keát hôïp caùc bieán Gauss.

3. Maãu maät ñoä baùn lieân tuïc:

Ñaây laø söï phoái hôïp giöõa hai phöông phaùp treân. Trong moät maãu maät ñoä baùn lieân tuïc thì
cuõng nhö maãu rôøi raïc, cuõng coù moät saùch maõ moâ taû nhöõng cluster aâm thanh ñöôïc duøng
chung cho taát caû caùc traïng thaùi. Nhöng thay vì bieåu dieãn nhöõng cluster nhö nhöõng
centroids rôøi raïc, thì chuùng ñöôïc bieåu dieãn nhö nhöõng haøm maät ñoä lieân tuïc (thöôøng laø
Gauss) treân vuøng khoâng gian laân caän, vì vaäy traùnh ñöôïc sai soá löôïng töû :
L
b j (o ) C jk G(o, k ,U k ) (5.63)
k 1

Vôùi L laø soá muïc töø cuûa saùch maõ, vaø C jk laø troïng soá cho töøng phaân phoái Gauss G coù
trung bình laø jk vaø traän hieäp phöông sai U jk .

Xaùc suaát cuûa o ôû traïng thaùi j coù theå ñöôïc tính nhö sau :
L
b j (o) f (o vk )b j (k ) (5.64)
k 1

Vôùi f (o v k ) laø xaùc suaát ñeå vector o naèm trong codeword k vaø b j (k ) laø troïng soá ño tæ leä
caùc vector thuoäc codeword k xuaát hieän ôû traïng thaùi j.
Khi aùp duïng maãu maät ñoä baùn lieân tuïc ñaõ coù moät soá thay ñoåi treân caùc coâng thöùc huaán
luyeän, ñoù laø :
Xaùc suaát moâ hình ôû traïng thaùi i taïi thôiø ñieåm t vaø nhöõng tín hieäu quan saùt ôû codeword
k laø :

LUAÄN VAÊN TOÁT NGHIEÄP - 85 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

b f (o v ) (i)
ii k 0 t 1
P(O ) (5.65)
t (i, k ) (i)a b (k ) f (o v ) ( j)
N t ij j k t 1
t T
j 1 P(O )

N
(k ) (i, k ) (5.66)
t t
i 1

Öôùc löôïng xaùc suaát codeword k ôû traïng thaùi j


T

t (i, k )
b j (k ) t 1
T
(5.67)
t ( j)
t 1

Öôùc löôïng vector trung bình taïi codeword k


T

t (k )O t
k
t 1
T
(5.68)
t (k )
t 1

Öôùc löôïng covariance taïi codeword k


T

t (k )(Ot k )(Ot k )T
Uk t 1
T
(5.69)
t (k )
t 1

Nhaän xeùt:
cuõng nhö trong tröôøng hôïp lieân tuïc caùc bieán Gauss ñöôïc öôùc löôïng laïi trong suoát quaù
trình huaán luyeän, vì vaây saùch maõ ñöôïc toái öu hoaù vôùi caùc tham soá HMM, ngöôïc laïi vôùi
maãu rôøi raïc trong ñoù saùch maõ vaãn giöõ khoâng ñoåi. Söï toái öu hoaù keát hôïp naøy coù theå laøm
caûi thieän chaát löôïng cuûa heä thoáng hôn.
Caû ba maãu maät ñoä ñeàu ñöôïc duøng roäng raõi duø cho nhuõng maãu maät ñoä lieân tuïc döôøng
nhö cho keát quaû toát nhaát treân nhöõng cô sôõ döõ lieäu lôùn (tuy nhieân thôøi gian chaïy seõ chaäm
hôn 300 laàn ).

VIII. KHÔÛI TAÏO CAÙC THAM SOÁ CHO HMM

LUAÄN VAÊN TOÁT NGHIEÄP - 86 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Veà phöông dieän lyù thuyeát, caùc phöông trình öôùc löôïng neân mang laïi caùc tham soá töông öùng
vôùi moät cöïc ñaïi ñòa phöông. Vì theá, vaán ñeà coát loõi laø laøm sao choïn ñöôïc nhöõng tham soá ban
ñaàu ñeå cöïc ñaïi ñòa phöông baèng hay caøng gaàn giaù trò cöïc ñaïi toaøn cuïc thì caøng toát.

Vaán ñeà naøy khoâng coù caâu traû lôøi chính xaùc maø döïa treân kinh nghieäm cho thaáy laø A vaø
coù theå ñöôïc khôûi ñoäng ngaãu nhieân hay ñoàng nhaát thì ñeàu cho ñöôïc nhöõng keát quûa öôùc
löôïng toát. Tuy nhieân, thöïc teá cuõng cho thaáy vôùi B vieäc khôûi ñoäng toát raát coù lôïi trong tröôøng
hôïp kyù hieäu rôøi raïc vaø khoâng theå thieáu vôùi tröôøng hôïp phaân phoái lieân tuïc.
Chuùng ta coù theå duøng thuaät toaùn sau ñeå khôûi taïo tham soá cuûa B:
ÖÙng vôùi moãi quan saùt Ok = (o1k, o2k, …, oTk) trong taäp ña quan saùt O=[O1, O2,
…, OK], ta phaân hoaïch tuaàn töï caùc quan saùt naøy thaønh N ñoaïn ( N laø soá traïng
thaùi), keát quaû ta seõ coù N taäp quan saùt. Moãi taäp töông öùng vôùi moät traïng thaùi cuûa
moâ hình.
Vôùi moãi taäp quan saùt, bj(k) ñöôïc xaùc ñònh nhö sau:

IX. AÛNH HÖÔÛNG CUÛA TAÄP DÖÕ LIEÄU KHOÂNG ÑAÀY ÑUÛ

Moät khoù khaên chính trong quaù trình huaán luyeän HMM laø taäp döõ lieäu khoâng ñaày ñuû. Khi
tính bj(k), neáu taäp huaán luyeän quaù nhoû thì sau khi öôùc löôïng ta seõ coù bj(k)=0, nghóa laø moâ
hình seõ taïo ra xaùc suaát zero cho nhöõng quan saùt coù qt=j vaø ot=vk.
Ñeå giaûi quyeát vaàn ñeà naøy, coù theå taêng kích thöôùc taäp quan saùt, nhöng ñieàu naøy khoù thöïc
hieän. Höôùng thöù hai laø giaûm bôùt kích thöôùc cuûa moâ hình (giaûm soá traïng thaùi hoaëc caùc heä
soá ma traän), höôùng naøy seõ cho keát quaû keùm. Höôùng thöù ba laø tìm moät öôùc löôïng thoáng keâ
khoâng chuaån döïa treân taäp huaán luyeän giôùi haïn:

bj k if b j k
(5.61)
b
bj k
b elsewhere

X. TOÅ CHÖÙC NHAÄN DAÏNG TIEÁNG NOÙI BAÈNG HMM

LUAÄN VAÊN TOÁT NGHIEÄP - 87 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Hình 5.3 Sô ñoà khoái heä nhaän daïng töø rôøi raïc baèng HMM

Trong sô ñoà nhaän daïng töø rôøi raïc baèng HMM, giaû söû ta caàn nhaän daïng boä töø vöïng coù V töø,
moãi töø ñeàu coù moâ hình Markov rieâng vaø ñöôïc noùi K laàn. Ta thöïc hieän nhöõng böôùc sau:
1. Vôùi moãi töø v trong boä töø vöïng, chuùng ta xaây döïng moät moâ hình Markov aån v.

2. Vôùi moãi töø chöa bieát, chuùng ta xaây döïng moâ hình nhaän daïng nhö treân hình 5.3.
Tín hieäu tieáng noùi ñöôïc trích ñaëc tröng MFCC, roài ñöôïc löôïng töû hoùa ñeå coù ñöôïc
caùc quan saùt rôøi raïc O={o1, o2, …, ot, …, oT}. Tieáp theo, tính xaùc suaát cho taát caû
caùc moâ hình P(O| v ),1≤ v ≤ V, vaø choïn töø coù xaùc suaát lôùn nhaát, töùc laø
v* arg max[ P(O | v ]
1 v V

XI. ÖU ÑIEÅM VAØ NHÖÔÏC ÑIEÅM CUÛA HMM:

1. Öu ñieåm:
HMMs coù nhieàu öùng duïng phong phuù. Khi moät HMM ñöôïc aùp duïng vaøo nhaän
daïng tieáng noùi thì caùc traïng thaùi ñöôïc hieåu laø caùc maãu aâm thanh , cho thaáy
nhöõng aâm naøo coù khaû naêng ñöôïc nghe trong suoát nhöõng segments tieáng noùi
töông öùng; coøn caùc traïng thaùi seõ taïo ra nhöõng raøng buoäc theo thôøi gian cho
thaáy baèng caùch naøo nhöõng traïng thaùi coù theå noái tieáp nhau moät caùch tuaàn töï.
Bôûi tieáng noùi luoân phaùt veà phía tröôùc theo thôøi gian neân caùc chuyeån traïng thaùi
trong moät öùng duïng tieáng noùi seõ luoân tieán tôùi tröôùc töông öùng (hay laëp taïi choã,
cho pheùp moät traïng thaùi coù khoaûng toàn taïi tuyø yù).

LUAÄN VAÊN TOÁT NGHIEÄP - 88 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

Coù theå duøng duøng ñeå giaûi quyeát caùc heä thoáng maø ta khoâng theå bieát ñöôïc chuoãi
traïng thaùi maø heä thoáng traûi qua( coøn goïi laø aån).

2. Nhöôïc ñieåm:
Giaû ñònh baäc moät cho raèng taát caû caùc xaùc suaát chæ phuï thuoäc duy nhaát vaøo
traïng thaùi hieän taïi thì khoâng ñuùng cho nhöõng öùng duïng veà tieáng noùi. Moät haäu
quaû laø caùc HMMs khoù coù ñöôïc caùc maãu phaùt aâm roõ raøng vì nhöõng phaân phoái
aâm thanh trong thöïc teá phuï thuoäc raát nhieàu vaøo nhöõng traïng thaùi quaù khöù. Moät
haäu quaû khaùc laø caùc khoaûng toàn taïi ñöôïc taïo maãu khoâng chính xaùc bôûi moät
phaân phoái haøm muõ giaûm thay vì baèng moät phaân phoái Poisson chính xaùc hay
nhöõng phaân phoái coù daïng chuoâng khaùc.
Giaû ñònh ñoäc laäp cho raèng khoâng coù söï töông quan giöõa nhöõng frames naøo keá
tieáp nhau laø khoâng ñuùng cho nhöõng öùng duïng veà tieáng noùi. Vaø theo giaû ñònh
naøy caùc HMMs chæ kieåm tra moät frame tieáng noùi ôû moät thôøi ñieåm
Nhöõng maãu maät ñoä xaùc suaát (rôøi raïc, lieân tuïc hay baùn lieân tuïc) ñeàu coù ñoä
chính xaùc taïo maãu chöa toái öu. Ñaëc bieät laø caùc maãu rôøi raïc phaûi chòa sai soá
löôïng töû.
XII. TOÙM TAÉT

Chöông naøy ñaõ trình baøy chi tieát veà moâ hình Markov aån, caùc thuaät toaùn ñeå ñaùnh giaù xaùc suaát
moâ hình. Vieäc öôùc löôïng tham soá moâ hình vaø moät soá yeáu toá aûnh höôûng ñeán moâ hình cuõng ñaõ
ñöôïc trình baøy laøm cô sôû cho vieäc xaây döïng heä thoáng nhaän daïng duøng HMM.

LUAÄN VAÊN TOÁT NGHIEÄP - 89 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Chöông 6:

THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG


Sô ñoà khoái ñieàu khieån thieát bò baèng tieáng noùi nhö sau:

Caâu leänh ñieàu khieån ñöôïc noùi vaøo maùy tính, chöông trình treân PC seõ xöû lyù tieáng noùi vöøa môùi
ñöôïc noùi vaøo vaø nhaän daïng töø, caâu vöøa noùi. Neáu caâu vöøa noùi vaøo phuø hôïp vôùi ngöõ phaùp thì PC
seõ ñieàu khieån thieát bò chaáp haønh
Chöông trình huaán luyeän, nhaän daïng tieáng noùi treân PC ñöôïc vieát baèng ngoân ngöõ Matlab, sau
ñoù build thaønh ñoái töôïng COM cho Visual Basic söû duïng.
PC giao tieáp vôùi vi ñieàu khieån treân maïch chaáp haønh thoâng qua coång RS232.
Maïch chaáp haønh mang tính thöû nghieäm heä thoáng nhaän daïng goàm 10 ñeøn Led, töôïng tröng cho
10 thieát bò chieáu saùng, vaø 1 motor töôïng tröng cho 1 quaït (quay vôùi 3 toác ñoä khaùc nhau).
Ñeå thöïc hieän heä thoáng treân, tröôùc heát phaûi xaây döïng heä thoáng nhaän daïng tieáng noùi duøng HMM
nhö sau:

Hình 6.1: Sơ đồ khối hệ thống nhận dạng tiếng nói

I. TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI:


Trong đề taøi naøy ta chọn phương phaùp MFCC để trích đặc trưng tiếng noùi. Chi tiết veà trích ñaëc
tröng MFCC ñaõ ñöôïc trình baøy ở Chương 3
Sơ đồ trích đặc trưng tiếng Noùi duøng MFCC như sau:

LUAÄN VAÊN TOÁT NGHIEÄP - 90 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Hình 6.2 Löu ñoà trích ñaëc tröng


Tín hiệu tiếng noùi:

LUAÄN VAÊN TOÁT NGHIEÄP - 91 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Sau khi qua tieàn nhaán:

Qua khaâu phaùt hieän ñieåm ñaàu-ñieåm cuoái:

LUAÄN VAÊN TOÁT NGHIEÄP - 92 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Keát quaû sau khi qua phaàn trích ñaëc tröng: ma traän P x T , trong ñoù P=24, vaø T laø soá frame cuûa
tieáng noùi ñöôïc thu vaøo. Moãi coät laø 24 heä soá MFCC cuûa moät frame.
Caùc haøm Matlab chính ñöôïc duøng trong phaàn naøy:
x=wavrecord(Nsample,Fs); % record sound
s=filter(1,[1 -0.96],s); % pre-emphasis
y=detector(s); % endpoint detection
y=melcepst(s,Fs,’ed’); % Extract feature vectors

II. LÖÔÏNG TÖÛ HOÙA VECTOR:

Sau khi trích ñaëc tröng, moãi töø cho moät daõy vector phoå. Duøng phöông phaùp LBG ñeå löôïng töû
hoùa vector. Trong ñeà taøi naøy, ta söû duïng codebook size 128.
Giaûi thuaät löôïng töû hoùa vector :

LUAÄN VAÊN TOÁT NGHIEÄP - 93 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Hình 6.3 Löu ñoà löôïng töû hoùa vector


Việc xaùc ñònh taäp nhaân toát nhaát cuûa codebook ñöôïc thöïc hieän nhôø thuaät toaùn LBG

Caùc haøm Matlab chính trong phaàn naøy:


Yc = vqLBGP(data, codeBookSize); % Vector quantization

III. GIAÛI THUAÄT HUAÁN LUYEÄN HMM:

Trong ñeà taøi naøy, moâ hình HMM ñöôïc söû duïng laø moâ hình Bakis, vôùiù 6 traïng thaùi, böôùc nhaûy
2. Moãi töø ñöôïc xaây döïng moät moâ hình Markov aån rieâng.
Quaù trình huaán luyeän ñöôïc thöïc hieän nhö sau:

LUAÄN VAÊN TOÁT NGHIEÄP - 94 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Hình 6.4 Löu ñoà huaán luyeän HMM

Giaûi thuaät ñaùnh nhaõn ma traän MFCC( laø ma traän coù chieàu P x T) cuûa 1 töø ñöôïc thöïc
hieän nhö sau:
o Tính khoaûng caùch Euclide giöõa frame i vôùi töøng codeword trong codebook.
o Tìm giaù trò nhoû nhaát trong caùc khoaûng caùch vöøa tính ñöôïc. Nhaõn cuûa frame naøy
laø chæ soá cuûa codeword öùng vôùi khoaûng caùch nhoû nhaát ñoù.
o Laëp laïi caùc böôùc treân cho ñeán khi taát caû caùc frame ñeàu ñöôïc ñaùnh nhaõn.
Khôûi taïo HMM cho töøng töø: khôûi taïo ma traän A, π, B theo caùch khôûi taïo ngaãu nhieân.

Huaán luyeän HMM cho töøng töø:

LUAÄN VAÊN TOÁT NGHIEÄP - 95 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Hình 6.6 Giaûi thuaät huaán luyeän

Trong luaän vaên naøy, ngöôõng ε ñöôïc choïn 0.00001

IV. GIAÛI THUAÄT NHAÄN DAÏNG:

Sau khi ñaõ huaán luyeän HMM cuûa caùc töø cho heä thoáng, ta coù theå tieán haønh vieäc nhaän daïng töø
ñöôïc noùi laø töø naøo trong soá caùc töø ñaõ huaán luyeän. Giaûi thuaät nhaän daïng tieáng noùi baèng HMM
nhö sau:

LUAÄN VAÊN TOÁT NGHIEÄP - 96 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Hình 6.7: Giaûi thuaät nhaän daïng

V. Giao diện VB:

Form chính:

LUAÄN VAÊN TOÁT NGHIEÄP - 97 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Chöông trình coù 2 cheá ñoä:


o Voice Command: Ñieàu khieån thieát bò baèng tieáng noùi. Caâu leänh ñöôïc ñoïc rôøi raïc trong
voøng 5 giaây. Chöông trình ñöôïc thieát laäp vôùi ngöõ phaùp:

LUAÄN VAÊN TOÁT NGHIEÄP - 98 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

Chæ khi heä thoáng nhaän daïng ñöôïc caùc töø vôùi ngöõ phaùp nhö theá thì thieát bò môùi ñöôïc
ñieàu khieån.

Giao dieän Voice Command

- Nuùt Record: Ghi aâm caâu noùi ñöôïc noùi vaøo, thôøi gian ghi aâm laø 5s

- Nuùt Endpoints: Duøng ñeå tieán haønh taùch töø, xaùc ñònh ñieåm ñaàu ñieåm cuoái cuûa tín
hieäu tieáng noùi.

- Nuùt Feature Extraction: nuùt naøy ñöôïc duøng ñeå trích caùc ñaëc tröng cuûa tín hieäu
sau khi ñaõ laáy Endpoint ôû giai ñoaïn treân. Sau khi ñaõ tính ñöôïc ñaëc tröng cuûa tín
hieäu tieáng noùi, chöông trình seõ töï ñoäng löu caùc ñaëc tröng.

- Nuùt VQ Symbols: Nuùt naøy ñöôïc duøng ñeå xaùc ñònh daõy quan saùt cuûa caùc chuoãi
vector trích ñaëc tröng vöøa môùi coù ñöôïc baèng phöông phaùp löôïng töû vector.

- Nuùt HMMVQ: Tieán haønh nhaän daïng chuoãi quan saùt ñöôïc taïo ra töø böôùc treân. Sau
ñoù tieán haønh nhaän daïng nhöõng töø môùi ñöôïc ghi aâm laø nhöõng töø gì.
o Word Recognition: Nhaän daïng töø rieâng leû.
Heä thoáng nhaän daïng töøng töø rieâng leû:

LUAÄN VAÊN TOÁT NGHIEÄP - 99 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

- Nuùt Record: Ghi aâm caâu noùi ñöôïc noùi vaøo, thôøi gian ghi aâm laø 2s

- Nuùt Endpoints: Duøng ñeå tieán haønh taùch töø, xaùc ñònh ñieåm ñaàu ñieåm cuoái cuûa tín
hieäu tieáng noùi.

- Nuùt Feature Extraction: nuùt naøy ñöôïc duøng ñeå trích caùc ñaëc tröng cuûa tín hieäu
sau khi ñaõ laáy Endpoint ôû giai ñoaïn treân. Sau khi ñaõ tính ñöôïc ñaëc tröng cuûa tín
hieäu tieáng noùi, chöông trình seõ töï ñoäng löu caùc ñaëc tröng.

- Nuùt VQ Symbols: Nuùt naøy ñöôïc duøng ñeå xaùc ñònh daõy quan saùt cuûa caùc chuoãi
vector trích ñaëc tröng vöøa môùi coù ñöôïc baèng phöông phaùp löôïng töû vector.

- Nuùt HMMVQ: Tieán haønh nhaän daïng chuoãi quan saùt ñöôïc taïo ra töø böôùc treân. Sau
ñoù tieán haønh nhaän daïng nhöõng töø môùi ñöôïc ghi aâm laø nhöõng töø gì.

Trong caû 2 mode chöông trình, neáu click vaøo nuùt Word Recognition hoaëc Voice Command
thì chöông trình töï ñoäng thöïc hieän töøng böôùc: Record, Endpoints, Feature Extraction, VQ
Symbols, vaø cuoái cuøng laø HMMVQ. Ngöôïc laïi, chuùng ta coù theå click tuaàn töï ñeå theo doõi quaù
trình tính toaùn cuûa heä thoáng.

LUAÄN VAÊN TOÁT NGHIEÄP - 100 - SVTH: HAØ THUÙC PHUØNG


CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
HEÄ THOÁNG

VI. Mạch chấp haønh


Moâ hình ñöôïc xaây döïng mang tính thöïc nghieäm cho ñeà taøi neân khaù ñôn giaûn. Thieát bò thöû
nghieäm cho ñeà taøi goàm 10 ñeøn led, moâ phoûng cho 10 thieát bò chieáu saùng, 1 ñoäng cô DC moâ
phoûng cho quaït vôùi 3 toác ñoä quay khaùc nhau.

Vi ñieàu khieån ñöôïc söû duïng ôû ñaây laø ATMega16. Khi maùy tính nhaän daïng ñöôïc caâu leänh ñuùng
ngöõ phaùp töø ngöôøi noùi thì leänh ñieàu khieån seõ ñöôïc PC truyeàn xuoáng vi ñieàu khieån thoâng qua
chuaån RS232. Vi ñieàu khieån seõ xuaát tín hieäu ñieàu khieån thieát bò.

LUAÄN VAÊN TOÁT NGHIEÄP - 101 - SVTH: HAØ THUÙC PHUØNG


Chöông 7: KEÁT QUAÛ, KEÁT LUAÄN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ HÖÔÙNG PHAÙT TRIEÅN

CHÖÔNG 7

KEÁT QUAÛ, KEÁT LUAÄN VAØ HÖÔÙNG PHAÙT TRIEÅN


Qua nhöõng quaù trình thöïc hieän ñöôïc trình baøy trong caùc chöông tröôùc, moät heä thoáng nhaän daïng
tieáng noùi – tieáng Vieät ñaõ ñöôïc hoaøn thaønh. Chöông naøy seõ tieán haønh nhöõng thöû nghieäm thöïc teá
nhö laø nhöõng keát quaû cuoái cuøng veà nhaän daïng treân nhöõng boä töø vöïng nhoû coá ñònh, thoâng qua
ñoù keát luaän hieäu naêng cuûa heä thoáng.
Luaän vaên ñaõ xaây döïng heä thoáng nhaän daïng boä töø ñôn goàm 15 töø (goàm 10 chöõ soá töø 1 ñeán 10
vaø 5 töø: “taét”, “môû”, “ñeøn”, “quaït”, “soá”). Duøng 15 töø naøy ñeå ñieàu khieån thieát bò vôùi 1 cuù phaùp
nhaát ñònh.
Chöông trình ñöôïc vieát baèng ngoân ngöõ Matlab. Sau ñoù build thaønh ñoái töôïng COM ñeå söû duïng
trong Visual Basic. Muïc ñích ñeå taêng toác ñoä tính toaùn ñoàng thôøi duøng VB vieäc giao tieáp vôùi vi
ñieàu khieån thuaän tieän hôn. Vieäc build m-file cuûa Matlab thaønh ñoái töôïng COM ñöôïc thöïc hieän
qua Deployment tool cuûa Matlab.

I. KEÁT QUAÛ:
Ñoái vôùi nhaän daïng töø ñôn, chöông trình thöû nghieäm thöïc hieän nhaän daïng 15 töø ñôn, moãi
töø ñoïc 100 laàn.

LUAÄN VAÊN TOÁT NGHIEÄP 102 SVTH: HAØ THUÙC PHUØNG


Chöông 7: KEÁT QUAÛ, KEÁT LUAÄN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ HÖÔÙNG PHAÙT TRIEÅN

Keát quaû nhaän daïng noùi chung chaáp nhaän ñöôïc. Heä thoáng nhaän daïng chöa coù keát quaû toát
vôùi töø “soá”, nhaàm laãn töø naøy vôùi “moät”, “boán”, “saùu” khaù nhieàu. Do töø “soá” phaùt aâm
gaàn gioáng vôùi töø “moät” vaø “boán” laø nhöõng töø coù aâm “oâ” troäi hôn caû. Coøn ñoái vôùi töø
“saùu”, töø naøy coù cuøng phuï aâm “s” trong töø “soá”.
Ngoaøi ra, caùc töø cho keát quaû nhaän daïng döôùi 90% laø : “moät”, “taùm”,”chín”.
Do vieäc nhaän daïng töø “soá” khoâng ñöôïc toát neân aûnh höôûng ñeán vieäc nhaän daïng ñuùng
caâu leänh, laøm cho ñieàu khieån thieát bò khoâng nhö mong muoán. Tuy nhieân, neáu thay theá
cuù phaùp, ví duï:”môû ñeøn soá 1” baèng “môû ñeøn 1”, thì heä thoáng nhaän daïng ñöôïc khaù chính
xaùc. Thoáng keâ thaáy heä thoáng nhaän daïng ñuùng vôùi tæ leä trung bình 92% ñoái vôùi caâu leänh
baét ñaàu vôùi töø “môû” vaø 87% ñoái vôùi caâu leänh baét ñaàu vôùi töø “taét”, noùi trong ñieàu kieän
moâi tröôøng bình thöôøng ( phoøng coù tieáng quaït, maùy tính khaùc phaùt nhaïc, coù tieáng noùi
chuyeän…), vôùi moãi caâu leänh ñieàu khieån 1 thieát bò ñöôïc noùi 10 laàn.

II. KEÁT LUAÄN

Nhaän daïng tieáng noùi – tieáng Vieät laø ñeà taøi haáp daãn vôùi nhöõng öùng duïng voâ cuøng höõu
ích trong nhieàu lónh vöïc; tuy nhieân laïi laø moät baøi toaùn cöïc kì khoù khaên do tính chaát quaù

LUAÄN VAÊN TOÁT NGHIEÄP 103 SVTH: HAØ THUÙC PHUØNG


Chöông 7: KEÁT QUAÛ, KEÁT LUAÄN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ HÖÔÙNG PHAÙT TRIEÅN

phöùc taïp cuûa tieáng noùi. Ñaõ coù nhöõng coâng trình nghieân cöùu veà vaán ñeà naøy vôùi nhieàu
höôùng giaûi quyeát khaùc nhau.
Trong thôøi gian daønh cho ñeà taøi raát haïn heïp vaø tính chaát phöùc taïp cuûa tín hieäu tieáng noùi,
em ñaõ löïa choïn vieäc xöû lyù nhaän daïng tieáng noùi baèng moâ hình Markov aån vaø ñaõ ñaït
ñöôïc nhöõng keát quaû toång quan ban ñaàu trong lónh vöïc nhaän daïng tieáng noùi – tieáng Vieät
trong ñieàu khieån. Heä thoáng ñieàu khieån baèng tieáng noùi naøy ñöôïc thöïc hieän treân boä töø
vöïng nhoû töông öùng vôùi nhöõng taäp leänh coá ñònh vaø thöïc hieän nhaän daïng phuï thuoäc
ngöôøi noùi. Tuy nhieân heä thoáng nhaän daïng tieáng noùi – tieáng Vieät khoâng theå döøng laïi ôû
moät boä töø vöïng coøn quaù nhoû, chöa ñuû ñeå coù nhöõng öùng duïng vaøo thöïc teá ñieàu khieån vôùi
nhöõng taäp leänh lôùn vaø thay ñoåi tuyø lónh vöïc ñieàu khieån. Ñeà taøi luaän vaên naøy khôûi ñaàu
cho vieäc nghieân cöùu giaûi quyeát baøi toaùn nhaän daïng tieáng noùi – tieáng Vieät trong ñieàu
khieån döïa treân Moâ hình Markov aån-phöông phaùp ñaõ vaø ñang ñaït keát quaû toát treân theá
giôùi.

Nhöõng muïc tieâu ñaõ ñaït ñöôïc:


 Tìm hieåu vaø naém ñöôïc caùc noäi dung sau:
Lyù thuyeát tieáng noùi, ñaëc tröng ngöõ aâm tieáng Vieät vaø phöông phaùp nhaän daïng
tieáng noùi tieáng Vieät.
Caùc kieán thöùc veà xöû lí soá tín hieäu: FT, IFT, DFT, FFT, IDFT vaø STFT…
Phöông phaùp phaùt hieän ñieåm ñaàu – ñieåm cuoái cuûa moät töø.
Phöông phaùp MFCC trích ñaëc tröng tieáng noùi tieáng Vieät.
Löôïng töû vector öùng duïng trong xöû lyù tieáng noùi.
Moâ hình Markov aån duøng trong nhaän daïng tieáng noùi.
 Thöïc hieän ñöôïc heä thoáng hoaøn chænh cho nhaän daïng tieáng noùi:
Vieát chöông trình thu aâm tieáng noùi taùch töø
Vieát chöông trình trích ñaëc tröng tieáng noùi
Vieát chöông trình löôïng töû hoùa vector
Vieát chöông trình huaán luyeän moâ hình Markov aån rôøi raïc cho töøng töø
Vieát chöông trình nhaän daïng tieáng noùi duøng HMM
Thieát keá heä thoáng thöû nghieäm ñieàu khieån thieát bò baèng tieáng noùi.

III. HÖÔÙNG PHAÙT TRIEÅN

LUAÄN VAÊN TOÁT NGHIEÄP 104 SVTH: HAØ THUÙC PHUØNG


Chöông 7: KEÁT QUAÛ, KEÁT LUAÄN GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VAØ HÖÔÙNG PHAÙT TRIEÅN

Luaän Vaên chæ döøng laïi ôû vieäc nhaän daïng tieáng noùi vôùi ngöôøi noùi cuõng laø ngöôøi huaán
luyeän. Ñoä chính xaùc chöa thaät söï cao, kích thöôùc boä töø vöïng coøn bò haïn cheá. Keát quaû
nhaän daïng chæ döøng laïi ôû choã nhaän daïng teân cuûa töø chöù khoâng nhaän daïng nghóa cuûa noù,
cuõng nhö chöa khaûo saùt vaø khoâng theå nhaän daïng caùc aâm toá vaø thanh ñieäu caáu taïo neân
aâm tieát ñoù. Vì caùc haïn cheá ñoù, ta coù theå phaùt trieån ñeà taøi cuûa Luaän Vaên theo nhöõng
höôùng sau:
- Coù theå duøng nhieàu ñaëc tröng ñeå theå hieän ñaày ñuû hôn caùc ñaëc tính cuûa tieáng noùi, coù
khaû naêng laøm cô sôû toát hôn ñeå nhaän daïng, ñaëc bieät laø xöû lyù thanh ñieäu trong tieáng Vieät.
- Tìm hieåu theâm veà moâ hình Markov aån lieân tuïc, baùn lieân tuïc öùng duïng trong nhaän daïng
tieáng noùi ñeå traùnh sai soá khi thöïc hieän löôïng töû vector. Theo moät soá nghieân cöùu gaàn
ñaây cho thaáy, söûu duïng HMM trong nhaän daïng tieáng noùi cho pheùp ñaït ñoä chính xaùc cao
nhung toác ñoä nhaän daïng chaäm do soá löôïng pheùp tính lôùn. Trong khi ñoù, duøng maïng
Neuron thì toác ñoä nhanh hôn nhöng keùm chính xaùc hôn so vôùi HMM. Vì vaäy caàn nghieân
cöùu tìm hieåu vieäc keát hôïp HMM vaø maïng Neuron ñeå cho ra moät heä thoáng nhaän daïng
tieáng noùi hoaøn chænh hôn.
- Boä töø vöïng xaây döïng trong luaän vaên chæ coù 15 töø. Boä töø nhaän daïng vôùi soá löôïng nhö
vaäy chöa coù tính öùng duïng thöïc teá cao. Do ñoù, caàn nghieân cöùu ñeå môû roäng theâm voán töø.
- Xaây döïng heä thoáng nhaän daïng ñoäc laäp ngöôøi noùi.
- Xaây döïng heä thoáng nhaän daïng tieáng Vieät treân caùc chip DSP, FPGA ...
- Phaân tích tieáng noùi ñeå nhaän daïng döïa treân caùc aâm toá vaø thanh ñieäu caáu taïo neân aâm
tieát, ñaây chính laø neàn taûng ñeå chuyeån sang phaàn toång hôïp tieáng noùi. Vaø cuõng chính laø
cô sôû cuûa heä thoáng chuyeån ñoåi töø tieáng noùi thaønh chöõ vieát.

LUAÄN VAÊN TOÁT NGHIEÄP 105 SVTH: HAØ THUÙC PHUØNG


TAØI LIEÄU THAM KHAÛO GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

TAØI LIEÄU THAM KHAÛO

[1] Cao Xuaân Haïo, “Tieáng Vieät – Maáy vaán ñeà ngöõ aâm – ngöõ phaùp – ngöõ
nghóa”, Nhaø xuaát baûn Giaùo Duïc, 1998.

[2] Nguyeãn Ñöùc Thaønh, “Matlab öùng duïng trong ñieàu khieån”, Nhaø xuaát baûn Ñaïi
Hoïc Quoác Gia TPHCM, 2004.
[3] Leâ Tieán Thöôøng, “Xöû Lyù Soá Tín Hieäu vaø Wavelets – Taäp 1”, Nhaø xuaát baûn
Ñaïi Hoïc Quoác Gia TPHCM, 2002.

[4] TS Nguyeãn Vaên Giaùp, KS Traàn Vieät Hoàng, “ Kó thuaät nhaän daïng tieáng noùi vaø
öùng duïng trong ñieàu khieån” , Boä moân Cô Ñieän töû, khoa Cô khí, Ñaïi Hoïc Baùch
khoa TPHCM.
[5] Nguyeãn Phuù Bình, “Baøi giaûng Xöû lyù tieáng noùi”, Ñaïi hoïc Baùch khoa Haø Noäi.

[6] Nguyeãn Thanh Phöông, “Nhaän daïng tieáng noùi duøng moâ hình Markov aån”,
Luaän Vaên Thaïc syõ, Tröôøng Ñaïi Hoïc Baùch Khoa TPHCM, 2003.
[7] Traàn Coâng Binh, “Nhaän daïng tieáng noùi-tieáng Vieät trong ñieàu khieån”, Luaän
vaên Ñaïi hoïc, 2002.

[8] Lyù Höõu Tuaán, Buøi Ñaëng Quoác Thònh, “Toång hôïp vaø nhaän daïng tieáng noùi
tieáng Vieät”, Luaän vaên Ñaïi hoïc, 2004.

[9] Lawrence Rabiner, Biing-Hwuang Juang, “Fundamental of Speech


Recognition”, Prentice Hall, 1993, ISBN 0-13-015157-2.

[10] Minh N. Do, “An Automatic Speaker Recognition System”, Audio Visual
communications Laboratory Swiss Federal Institute of Technology, Lausanne,
Switzerland, 2000.
[11] Andrew Knight, “Basics Matlab and Beyond”, Chapman & Hall/CRC, 2000.
[12] Lawrence .R Rabiner, “A tutorial on Hidden Markov Models and Selected
Applications in Speech Recognition”, IEEE, VOL.77, NO.2, 1989.

LUAÄN VAÊN TOÁT NGHIEÄP 84 SVTH: HAØ THUÙC PHUØNG


TAØI LIEÄU THAM KHAÛO GVHD: PHAN NGUYEÃN PHUÏC QUOÁC

[13] Mike Brookes, “VOICEBOX, MATLAB toolbox for speech proceesing”,


Department of Electrical & Electronic Engineering, Imperial College
[14] Nick Bardici, Björn Skarin, “Speech Recognition using Hidden Markov Model”
[15] Moät soá taøi lieäu veà Speech Recognition, Neural Network, Wavelets cuõng nhö
moät soá Matlab Toolbox ñöôïc taûi töø caùc website:
http://www.cs.ubc.ca/~murphyk/Software/HMM/hmm.html
http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html
http://en.wikipedia.org/wiki/Category:Speech_recognition
http://www.mathworks.com/matlabcentral/

LUAÄN VAÊN TOÁT NGHIEÄP 85 SVTH: HAØ THUÙC PHUØNG

You might also like