Professional Documents
Culture Documents
Programme Informatique Th
ematique S
ecurit
e
Introduction la th
eorie de linformation
Cours n2
Codage des sources discr`
etes sans m
emoire
Codage de source
Lid
ee g
en
erale : coder par des mots de code courts les lettres les plus
fr
equentes. Cest le cas du code Morse
A
B
C
D
E
F
G
H
I
J
K
L
M
.-...
-.-.
-..
.
..-.
--.
....
..
.---..-..
--
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
-.
--.--.
--..-.
...
......--..-.---..
0
1
2
3
4
5
6
7
8
9
.
,
?
----.---..--...-.........
-....
--...
---..
----.
.-.-.--..-..--..
Code Morse
On peut repr
esenter le code Morse `
a laide dun arbre binaire. Chaque
nud, `
a lexception de la racine, est un mot de code.
XX
X
XXX
XXX
XX
XXX
XX
XX
X
H
H
HH
@
@
A
A
A
HH
HH
HH
H
N
@
@
@
A
HH
H
S
A -
HH
H
H
@
@
A
A
A
A
A
A
A
@
@
A -
A -
A -
A
A
A
A -
A
A
Code et codage
Soit un alphabet (fini) X .
D
efinition Un code de X est une application : X {0, 1} (lensemble des mots binaires de longueur arbitraire).
D
efinition Un mot de code est un
el
ement de (X ).
D
efinition Un codage de X est une application : X {0, 1} , qui
`
a toute s
equence finie de lettres de X associe une s
equence binaire.
` tout code de X on peut associer le codage
A
(x1, x2 , . . . , xL) ((x1 ) k (x2 ) k . . . k (xL))
(la r
eciproque nest pas vraie)
D
efinition Un code (resp. codage) est dit r
egulier si deux lettres
(resp. s
equences de lettres) distinctes sont cod
ees par des mots distincts.
Un code non r
egulier implique une perte dinformation.
cours n 2: Codage des sources discr`
etes sans m
emoire
Source sans m
emoire Efficacit
e
Une source discr`
ete X = (X , p) est un alphabet X muni dune loi de
probabilit
e p.
D
efinition Une source X = (X , p) est dite sans m
emoire si sa loi de
probabilit
e ne varie pas au cours du temps. Son entropie est
egale `
a
H(X) =
xX
D
efinition La longueur moyenne dun code dune source discr`
ete
sans m
emoire X = (X , p) est d
efinie par
|| =
p(x)|(x)|
xX
H(X)
.
||
Efficacit
e dun codage
p(x1 , . . . , xn) =
p(xi)
i=1
sa probabilit
e. La longueur moyenne par lettre du codage sera d
efinie
par la limite suivante (si elle existe)
1 X
L() = lim
p(x1 , . . . , xn)|(x1, . . . , xn)|
n n
x1,...,xn
D
efinition Soit X une source discr`
ete sans m
emoire et un codage
de X dont la longueur moyenne par lettre est d
efinie. Lefficacit
e de
est
egale `
a
H(X)
E() =
.
L()
D
efinition Un code est dit `
a d
ecodage unique si son codage associ
e
est injectif.
Autrement dit, une s
equence binaire finie donn
ee correspond au plus
`
a un s
equence de lettres de la source.
Condition du pr
efixe
Aucun mot de code nest le d
ebut dun autre
D
efinition Un code est dit pr
efixe sil v
erifie la condition du pr
efixe.
Nous parlerons aussi de code instantan
e.
Proposition Tout code pr
efixe est `
a d
ecodage unique.
Arbre associ
e `
a un code pr
efixe
u
A
A
u
A
A
A
A
u
A
A
A
A
A
u
Au
A
Au
A
A
Au
1
a
b
c
d
0
10
110
111
u
A
A
u
A
A
A
A
u
A
Au
u
A
A
A
A
A
A
A
Au
A
Au
A
A
A
A
AAu
a
b
c
d
00
100
110
111
Inegalit
e de Kraft Th
eor`
eme de Mac Millan
Th
eor`
eme (Kraft) Il existe un code pr
efixe dont les K mots ont pour
longueur n1, n2, . . . , nK si et seulement si
K
X
1
1.
nk
2
k=1
Th
eor`
eme (Mac Millan) Il existe un code `
a d
ecodage unique dont
les K mots ont pour longueur n1, n2, . . . , nK si et seulement si
K
X
1
1.
nk
2
k=1
Premier th
eor`
eme de Shannon
Proposition
1. Pour toute source dentropie H cod
ee au moyen dun code `
a
d
ecodage unique de longueur moyenne n
, on a n
H.
2. Pour toute source dentropie H, il existe un code pr
efixe de lon < H + 1.
gueur moyenne n
telle que H n
Th
eor`
eme (Shannon) Pour toute source discr`
ete sans m
emoire, il
existe un codage r
egulier dont lefficacit
e est arbitrairement proche
de 1.
10