You are on page 1of 10

La reprsentation des donnes

1 - La reprsentation des caractres


Les informations que doivent traiter les ordinateurs sont composes de nombres, lettres, chiffres ou
symboles particuliers. On doit reprsenter linformation traiter, quelle quelle soit, de manire ce
quelle puisse tre utilisable par la machine. Pour cela, on doit coder ces informations afin,
quassimilables par lhomme elles le deviennent par la machine.
Avec un code thorique 1 bit, on pourrait reprsenter 2 tats, nots 0 ou 1, ainsi que nous lavons vu
lors de ltude de la numration binaire, soit 21 combinaisons. Il nous faut donc un code 4 bits pour
reprsenter les 10 chiffres (0 9) utiliss dans le systme dcimal. Si nous voulons reprsenter, en plus
des chiffres, les lettres de lalphabet, il faut un code capable de reprsenter les 26 combinaisons, qui
correspondent aux lettres, plus les 10 combinaisons, qui correspondent aux chiffres, soit 36
combinaisons diffrentes, ce qui implique un code compos au minimum de 6 bits. On rencontrera ainsi
diffrents codes permettant la codification dalphabets plus ou moins importants.
1.1 Le code ASCII (American Standard Code of Information Interchange)
Cest le systme de codage quasi universel. Cest un code 7 positions, le 8ime bit tant rserv au bit
de parit ce qui fait 27 = 128 caractres reprsentables. Ce code comprend :

les chiffres,

les majuscules,

les minuscules,

quelques symboles usuels en informatique ($,@,*,..),

des fonctions de commandes (tabulations, Retour chariot, sonnette..),

des symboles de ponctuations (!,",},...).

Remarques :

Chiffres < Majuscules <Minuscules


C'est l'ordre qui sera respect dans la plupart des utilitaires de tri.
Dans beaucoup de langages de programmation, on peut crire : if a<b pour des caractres, c'est
cet ordre qui sera utilis pour valuer l'expression.

Certains constructeurs, dont IBM suivis par tous les fabricants de compatibles, ont enrichi cette
table ASCII en utilisant le 8ime bit, ce qui double le nombre de caractres reprsentables
(256). Les caractres supplmentaires sont essentiellement :

les caractres accentus utiliss dans la langue franaise notamment,

un jeu de caractres utiliss dans quelques langues (,,...),

quelques symboles mathmatiques ($ , ),

caractres semi-graphiques qui permettent de raliser des petits dessins gomtriques


(cadres, souligns, etc..).

Le code ASCII 8 bits existe en 2 variantes : le jeu de caractres IBM PC (cest le jeu de
caractres standard du DOS) et le jeu de caractres ISO-ANSI (jeu de caractres international
utilis dans Windows). Ces deux jeux diffrent notamment au niveau des caractres nationaux
accentus et des caractres semi-graphiques.

000

001

010

011

100

101

110

111

0000

NUL

DLE

SP

0001

SOH

DC1

0010

STX

DC2

0011

ETX

DC3

0100

EOT

DC4

0101

ENQ

NAK

0110

ACK

SYN

&

0111

BEL

ETB

1000

BS

CAN

1001

HT

EM

1010

10

LF

SUB

1011

11

VT

ESC

Comment coder la lettre A ?


laide du tableau
Dans le tableau, on saperoit que la
lettre A se trouve lintersection de la
colonne de valeur hexadcimale 4 et
de la ligne de valeur hexadcimale 1.
Le code ASCII de la lettre A est donc
41 en hexadcimal (souvent not
41H). Certains logiciels ou langages
peuvent utiliser une codification des
caractres ASCII en dcimal et non en
hexadcimal.
Les caractres ASCII reprsents ou
non sur le clavier sobtiennent par ALT
+ code ASCII.

TABLE DES CODES ASCII


1100

12

FF

FS

<

1101

13

CR

GS

}
1.2 - Code ANSI

1110

14

SO

RS

>

1111

15

SI

US

DEL

Les logiciels sous Windows utilisent la norme ANSI, qui reprend en grande partie le code ASCII, et
propose des extensions diffrentes selon le " code de page " retenu.
Ainsi, le code page 850 est trs employ en France, alors que le code page 864 dfinit un jeu de
caractres " arabe ".
Lutilisation du code ANSI se fait de la mme manire que pour un code ASCII (intersections colonneligne).

1.3 Le code EBCDIC (Exended Binary Coded Decimal Interchange Code)


Code dcimal cod binaire tendu, il est utilis essentiellement par IBM. Cest un code 8 bits.
Ce code peut tre assimil un code 9 bits quand il fait usage dune cl dimparit (bit supplmentaire
destin contrler la validit de loctet associ).

Son utilisation se fait sensiblement de la mme faon que le tableau ASCII, savoir quun caractre est
cod par la lecture des valeurs binaires des intersections ligne/colonne. Ainsi, le caractre A se codera C1
en hexadcimal soit la suite binaire 11000001. Les caractres de commandes ont en principe la mme
signification quen ASCII. Ainsi, SP indique lespace, CR le retour chariot,

1.4 Unicode (UNIversal CODE)


Compte-tenu de lextension mondiale de linformatique et de la diversit de plus en plus importante des
caractres stocker, les organismes de normalisation ISO travaillent depuis 1988 la cration dun code
universel (UNIversal CODE).
Bas sur les pages ASCII, ce code est utilis sous Windows 95 et Windows NT.
Il se reprsente sous 2 formes : Une forme 31 bits (UCS-4) pour Universal Charactere Set 4 octets.
Et une forme 16 bits (UCS-2) ce qui permet de reprsenter thoriquement 65 535 caractres diffrents.
Ces caractres couvrent la majeure partie des principaux langages crits du monde.
1.5 Notion de contrle de parit
A lintrieur de lordinateur les informations sont sans cesse " vhicules ", du clavier vers la mmoire, de
la mmoire vers le processeur, de la mmoire vers lcran, lheure actuelle, les ordinateurs sont de
plus en plus relis entre eux au travers de rseaux locaux ou tendus et linformation est donc
constamment en circulation.
Il est donc ncessaire dassurer une transmission convenable des informations. Pour cela, on utilise
divers moyens allant du simple contrle de parit jusqu llaboration de codes trs sophistiqus.
Nous allons voir en quoi consiste le contrle de parit.
Pourquoi un bit de contrle de parit ?

Pour dtecter des erreurs de transmissions.


Rq : Un caractre ASCII est sur 7 bits, or un octet contient 8 bits, donc le bit de poids le plus fort est
inutilis.
Il va servir au contrle de parit.
Code dit parit ou abusivement parit paire
On complte la chane de n bits de faon ce que la suite de bits transmise comporte un
nombre pair de 1.
Donc le bit de poids le plus fort est mis 1 si le nombre de 1 de loctet est impair, 0 sinon.
Exemple sur 8 bits

Bit de
parit Il est zro (0) car le nombre de 1 est pair (il y a 4 un)
Code dit imparit ou abusivement parit impaire
On complte la chane de n bits de faon ce que la suite de bits transmise comporte un
nombre impair de 1.
Donc le bit de poids le plus fort est mis 1 si le nombre de 1 de loctet est pair, 0 sinon.
Exemple sur 8 bits

Bit de
parit Il est un (1) car le nombre de 1 est pair (il y a 4 un)
Rq :
Cette mthode trs utilise et gnralement suffisante nest en fait efficace que dans la mesure o il ny
a pas derreurs simultanes sur 2, 4, 6, ou 8 bits, ce qui ne changerait pas la parit. (ex. Si nous
mettions la suite binaire 10010000 en parit et que nous recevions la suite 01010000, il serait
impossible de dire sil sagit bien de ce qui a t envoy ou non car, bien que la suite binaire reue soit
diffrente de celle mise, la parit est bien respecte).
Pour accrotre la prcision de la dtection derreurs de transmissions, il existe dautres mthodes plus
complexes que nous ne ferons qunumrer ici : les codes de blocs et les codes cycliques.
2 La reprsentation des informations multimdia

2.1 Reprsentation du son


Comment reprsent un son ? A priori, un son est un signal analogique (cest dire que le signal peut
prendre une infinit de valeur au cours du temps). On mesure intervalle rgulier la valeur de
lamplitude dun signal analogique.
Pour pouvoir stocker ce son dans un ordinateur, il va falloir lchantillonner
Un chantillon sont des mesures intervalles rguliers, de la valeur de lamplitude dun signal analogique

Pour tre cod sous forme numrique, le son doit tout dabord tre chantillonn : la courbe va tre
remplace par des segments de droites, linfinit de valeurs possibles va tre remplac par un ensemble
de niveaux.

Pendant cette opration, on va forcment perdre de linformation. Afin que cette


perte soit le moins sensible possible, on sattachera choisir une frquence dchantillonnage trs grande
(beaucoup de valeurs pour une courte dure) : il faut que la frquence dchantillonnage soit au moins le
double de la plus haute frquence contenue dans le signal. Pour un CD audio, la frquence
dchantillonnage est de 44 100 Hz, cest dire quune seconde de musique est reprsente par 44 100
valeurs diffrentes !
2.2 Reprsentation par des images fixes
Toute image affiche sur un cran ou sur une imprimante est constitue de pixels (abrviation de Picture
Element).
Il existe 2 grands modes de stockage des images : BITMAP et VECTORIEL.
BITMAP
Chaque point de limage est mmoris. Limage devra tre utilise dans la dimension dans laquelle elle a
t cr, sinon un effet descalier sera invitable.

Ces images sont trs gourmandes en mmoire car chaque pixel est cod par un bit dans le cas dune
image noir et blanc, par 3 octets dans le cas dune image couleur.
Pour les images en couleurs, chaque octet correspond une des trois couleurs primaires (Rouge, Vert,
Bleu). Les 256 valeurs codables sur un octet correspondent au poids de chacune des couleurs primaires
qui compose le point color. Ce systme donne un total de 16,5 millions de couleurs codables (2553), ce
qui est grandement suffisant car lil humain est loin de pouvoir en discerner autant.

1 point de couleur : F0 A9 4C
Pour une image 640 x 480, si chaque point est cod sur 3 octets, cela donne une image qui va ncessiter
900 KO de mmoire, cette taille passera plus de 2 MO pour une image 1024 x 768 !
Cest pourquoi, on utilise souvent un autre systme de codage des images bitmaps, le codage laide de
la palette de couleur : On dtermine 256 couleurs importantes dans limage, ces couleurs sont codes
sur 3 octets (mais une seule fois), ensuite chaque pixel est cod sur un octet qui correspond une
entre dans la palette des couleurs. De cette faon, on divise peu prs par trois lencombrement
mmoire dune image, mais on perd quelque peu en nuance et en contraste :

Exemple :
1 point de couleur : A6

...

...

A5

F2 A6 78

A6

19 FE 6A

A7

05 3F 87

...

...3 octets de
couleur

Cest cette technique qui est utilise pour les images bmp.
Lorsquon veut reprsenter une image en mmoire, on est donc en face dun choix : doit on privilgier le
nombre de pixels dune image (640x480 ou 1024x768), cest dire sa dfinition ou au contraire le
nombre de couleurs utilises (256 ou 16,5 millions) ? La plupart du temps, un meilleur rsultat sera
obtenu en privilgiant le nombre de couleurs.

VECTORIEL
Ce sont les quations mathmatiques des portions de droites et de courbes qui sont mmorises.
Un cercle, par exemple, sera dtermin compltement par les coordonnes du centre et la valeur du
rayon avec ventuellement la couleur du trait et lpaisseur de ce trait.
Lintrt de cette mthode est que lon peut modifier la taille du dessin sans en altrer la dfinition et les
proportions. De plus si le dessin est compos de plusieurs objets, ils pourront tre manipuls
sparment.

2.3 Reprsentation des images animes


Un image anime nest autre quune suite dimages fixes se succdant rapidement. Ainsi, au cinma, les
images dfilent la cadence de 25 images par secondes. Un tlviseur affiche cinquante trames par
seconde. (Une trame est constitue des lignes paires ou des lignes impaires de limage, la tlvision
utilisant un affichage entrelac.) Le rsultat correspond 25 images par seconde. Pour afficher des
images animes, lordinateur doit tre capable den faire autant. Or chaque image doit tre calcule, puis
transfre dans la mmoire vido. Ces oprations doivent se faire la mme vitesse, soit 1/25 de
seconde pour une animation de haute qualit.
Animations dobjets simples
Entre deux images successives dun film, tous les objets ne sont pas dplacs. Limage du dcor est
calcule une fois pour toutes. Puis limage de lobjet dplacer est superpose au dcor ; La partie
masque du dcor est mmorise. Pour limage suivante, le dcor est reconstitu et lobjet superpos
avec un dcalage, dans le sens du dplacement. Les objets ainsi manipuls sont appels sprites.
Si lobjet lui-mme est anim, il est reprsent par plusieurs sprites qui saffichent tour de rle ; Par
exemple, un animal qui court sera reprsent par 10 20 sprites diffrents reprsentant les diverses
attitudes de la marche.
Le scrolling
Parfois, le fond lui-mme doit tre anim. Lanimation la plus courante est un dfilement continu
appel scrolling. Dans ce cas, une image du fond dpassant largement la taille de lcran est place dans
la mmoire vido. Un pointeur dsigne la partie de limage qui apparat lcran . Tout se passe alors
comme si le fonc dfilait derrire une fentre. Des objets anims peuvent tre superpose limage.
Pour donner un rsultat plus raliste, on utilise la technique du scrolling diffrentiel. Elle consiste
prsenter le fond sur plusieurs plans dfilant des vitesses diffrentes, pour donner une impression de
relief (cas des dessins anims et jeux video).
Animation par image complte
Il sagit dimages prcalcules, cest le cas des images vido, qui sont filmes par une camra numrique
avant dtre stockes sur disque. Lordinateur na alors qu transfrer des images dans la mmoire
vido, au rythme choisi. Lidal est biensr dafficher des images de la taille de lcran au rythme de 24
par seconde. Cependant, cela nest pas possible cause de la quantit dinformations traiter. Une
image en 640x480 points et 16 millions de couleurs reprsente 900Ko de donnes.

Pour 24 images par seconde, cela donne 21 Mo de donnes transmises et traites par seconde. Pour
rduire la quantit dinformations plusieurs solutions sont utilises :
Diminuer la taille de limage en rduisant la fentre daffichage,
Diminuer le nombre de couleurs (256 couleurs est une quantit raisonnable),
Diminuer le nombre dimage la seconde (18 au lieu de 24),
Compresser les donnes et dcompresser pendant le temps de traitement par une carte dextension
spciale.
Animation par image de synthse
Il est galement possible de raliser une animation en affichant des images synthtises par
lordinateur ; Elles peuvent avoir t calcules pralablement. On se rapproche alors du cas prcdent.
Lordinateur doit calculer les images en temps rel, mesure quelles sont affiches. Cette mthode est
employe dans la plupart des programmes de simulation. Elle ncessite une puissance de calcul trs
leve et des techniques de programmation trs labores.
2.4 La compression des donnes
Les problmes de stockage du son, de limage ou plus gnralement des fichiers binaires posent des
problmes de place mmoire pour le stockage ou la transmission, cest pourquoi avec lre du multimdia
les techniques de compression sont dactualit.
Une photo 24x36 cms, avec une dfinition de lordre de 150 points par mm 2 (qualit photo classique)
reprsente 13 millions de points, 3 octets par points on dpasse les 40 MO !
Un document vido cest 25 images par secondes avec en plus du son ! !
On va donc tre oblig dutiliser des techniques de compression, il en existe 2 grandes catgories :

La compression avec perte dinformations : Image et son peuvent se passer dune


restitution parfaite car de toute faon lil ne peroit pas toutes les nuances, loreille nentend
pas toutes les frquences. Les taux de compression peuvent atteindre 100 pour 1 !
Les formats sappelle par exemple JPEG (Joint Photographic Expert Group) pour les images
fixes, MPEG (Moving Picture Expert Group) pour la vido. Pour la vido, les techniques utilises
englobent le dcoupage dimages en blocs, mais aussi la prdiction de mouvements pour
dterminer les changements oprer dune image lautre.

La compression sans perte dinformations : Un fichier binaire correspondant un


excutable, ou un texte ne peut se permettre la moindre altration.
Les logiciels de compression sappelle ARJ ou PKZIP (Phil Katz) ou DRIVESPACE intgr MSDOS. Les images GIF font galement partie de cette catgorie.
Le principe de la compression sans perte est de reprer les squences rptitives (suite de
valeurs identiques trs frquentes dans les images bitmap par exemple).
Les techniques vont du simple codage de ces squences rptitives sous la forme [valeur-nb
doccurrence], des mthodes plus subtiles qui font intervenir la frquence dapparition de ces
valeurs pour dterminer le nombre de bits qui va servir coder ces diffrentes valeurs (mthode
Huffman).

You might also like