You are on page 1of 128

REPUBLIQUE DU BENIN

UNIVERSITE DABOMEY CALAVI

ECOLE POLYTECHNIQUE DABOMEY CALAVI

CENTRE AUTONOMNE DE PERFECTIONNEMENT

DEPARTEMENT DE GENIE CIVIL


CLASSES PREPARATOIRES AUX ETUDES DINGENIEUR DE CONCEPTION

Filire : Gomtre - Topographe

STATISTIQUE ET PROBABILITE

Professeur : Jol M. ZINSALO


Enseignant Chercheur lEPAC/UAC

Anne Acadmique : 2012 2013

Statistique et Probabilit
Objectifs
Fournir ltudiant les connaissances de base des outils statistiques et de
probabilit et linitier lexploitation de celles-ci dans les prises de dcision.

CONTENU DU COURS
Chapitre 1 : Terminologie et concepts de base en mthodes statistiques
Chapitre 2 : Traitement des donnes dune srie statistique
Chapitre

3 : Caractrisation des donnes dune srie statistique :


Paramtres de position Paramtres de dispersion
Diagrammes en botes

Chapitre 4 : Statistique deux variables - Corrlation


Chapitre 5 : Analyse combinatoire
Chapitre 6 : Notions et Calcul de probabilit
Chapitre 7 : Notions de variables alatoires et de loi de probabilit
Chapitre 8 : Lois de distributions statistiques

Bibliographie
1. Exercices corrigs de statistique descriptive : avec rappels de cours, Grais ,
Bernard, Nouv. d., Paris : Dunod , 1991, 234 pages
2. Statistique descriptive - 6 me dition, Maurice Lethielleux, Dunod; dition :
6e dition (8 septembre 2010), 160 pages
3. Statistiques descriptives, Etienne Bressoud, Jean Claude Kahan, Pearson
education; dition : 2e (26 novembre 2010), 288 pages.
4. Statistique descriptive, Grard Chauvat, Jean-Philippe Rau, Hachette
suprieur (27 septembre 1995), 157 pages
5. Probabilits & Statistiques Rsum des cours. Exercices et problmes
corrigs. Jean Philippe REAU, Grard CHAUVAT, Paris, 2003.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 2

Statistique et Probabilit
INTRODUCTION GENERALE
Lorigine du mot statistique remonte au latin classique status (tat) qui, par
une srie dvolutions successives, aboutit au terme franais statistique, attest
pour la premire fois en 1771.
latin classique

status

Etat

stato

statista

homme dEtat

(1633)
italien

statistica

(1672)
latin moderne

statisticus

(1771)
Franais

Statistique

Cest vers la mme poque que statistik apparat en allemand, alors que les
anglophones utilisent lexpression political arithmetic jusquen 1798, date
laquelle le mot statistics fait son entre dans cette langue.
Dfinition : La statistique est lensemble des mthodes ou techniques qui
permettent lorganisation, lanalyse et la synthse des observations en vue :
-

den accrotre les connaissances scientifiques

de planifier des stratgies

daider la prise de dcision.

On distingue :
-

la statistique descriptive : qui dsigne les mthodes visant rsumer des


informations numriques nombreuses. Il sagit danalyser a priori des
donnes empiriques observes afin de les synthtiser.

La statistique mathmatique

ou statistique infrentielle : Il sagit

dassimiler une distribution statistique un modle, une << loi de


probabilit >> thorique dfinie a priori sur la base de laquelle on peut par
exemple tester des hypothses thoriques.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 3

Statistique et Probabilit
Cet outil est utilis dans des disciplines nombreuses et varies : la dmographie,
la sociologie, lpidmiologie, lconomie, la mtorologie, La statistique
comprend : la collecte des donnes, le traitement des donnes collectes,
l'interprtation des donnes, la prsentation afin de rendre les donnes
comprhensibles par tous.
En effet, le traitement et l'interprtation des donnes ne peuvent se faire que
lorsque celles-ci ont t collectes.
Ainsi la statistique est un domaine des mathmatiques qui possde une
composante thorique ainsi qu'une composante applique. La composante
thorique est proche de la thorie des probabilits et forme avec cette dernire,
les sciences de l'alatoire.
La statistique plus applique est utilise dans presque tous les domaines de
l'activit humaine : ingnierie, management, conomie, biologie, informatique,
etc.
On peut aussi citer comme domaines dapplication :
-

Comptabilit : vrification des comptes par sondages

Finance : comparer plusieurs informations permet la prise de dcisions

Marketing : connaissance des comportements moyen des consommateurs

Production : contrle de la qualit

Economie : visualiser ltat de lconomie.

Actuellement, on distingue gnralement les statistiques (au pluriel) de la


statistique (au singulier). En effet, La statistique (au singulier) dsigne loutil,
lensemble des mthodes. Les statistiques peuvent tre dfinies comme ltude
mthodique des faits sociaux qui dfinissent un Etat, par des procds
numriques (dnombrements, inventaires, recensements,). Les statistiques
dsignent aussi des objets, les donnes numriques observes que ces mthodes
permettent danalyser.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 4

Statistique et Probabilit
Chapitre 1 :
TERMINOLOGIE ET CONCEPTS DE BASE
EN METHODES STATISTIQUES

1. Population
On appelle population est lensemble de tous les lments sur lesquels porte une
tude statistique.
La population statistique peut tre constitue dtres humains, mais galement
danimaux, dobjets, ou dvnements.
On distingue deux types de population.
La population relle : cest celle quon peut trouver dans la nature.
La population fictive : introuvable dans la nature, la population fictive sort de
limagination. On peut bien sr tirer des conclusions sur la population fictive.
2. Echantillon
On appelle chantillon, tout sous-ensemble de la population. Il doit tre choisi de
faon alatoire de faon que tous les lments aient la mme probabilit dtre
choisie.
On peut dduire les proprits de toute une population partir de lanalyse dun
chantillon.
Il est capital que lchantillon soit choisi de faon alatoire et analys de manire
adquate. En particulier, il faut que lchantillon soit reprsentatif de la
population. Un chantillon non reprsentatif est dit biais.

3. Unit statistique
Chaque lment de la population ou de lchantillon est appel unit
statistique ou unit exprimentale et le nombre dunits dans la population
est appel effectif de la population ; Cet effectif de la population est not n.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 5

Statistique et Probabilit
4. Caractre
On appelle caractre tout critre observable sur chaque unit de la population,
et permettant donc de dcrire la population.
Encore appele facteur ou variable cest toute caractristique prise par les
individus de la population. On appelle aussi variable tout ce qui peut prendre
plus dune valeur. Exemples : lge, le sexe, le poids, la taille.
On peut distinguer deux types de caractres : un caractre quantitatif et un
caractre qualitatif. Un caractre est dit quantitatif sil est mesurable ; En
revanche, un caractre est dit qualitatif sil est non mesurable.
Les variables qualitatives sont utilises pour dcrire et se divisent en deux
groupes :
-

Les variables qualitatives nominales : valeur selon des catgories distinctes,


il ny a pas dordre. Exemple : le sexe, les yeux.

Les variables qualitatives ordinales : l on peut dfinir un ordre, une


hirarchie. Exemple : Le niveau scolaire, le rang (1er, 2e, ).

Parmi les caractres quantitatifs, on distingue les caractres quantitatifs


discrets et les caractres quantitatifs continus.
Un caractre quantitatif est dit discret lorsque, sur un intervalle donn, le
caractre ne peut prendre quun nombre fini de valeurs. Exemple : Le nombre
dobjets vendus par jour, le nombre denfants par famille. Il sera en revanche
appel caractre quantitatif continu sil peut prendre nimporte quelle valeur sur
un intervalle donn.
On peut donc tablir la typologie suivante des caractres :
Caractre ou
variable
quantitatif

qualitatif

nominal

ordinal

Professeur : Jol M. ZINSALO/EPAC-UAC

Discret

Continu

Page 6

Statistique et Probabilit
5. Modalits et nomenclature.

Dfinition : on appelle << modalits >> les divers tats que peut prendre un
caractre. La liste des modalits dun caractre est appele << nomenclature >>
du caractre.
La nomenclature associe un caractre nest pas unique et dpend en fait du
degr de dtail que le statisticien entend donner son tude.
Limportant est que la nomenclature respecte les deux proprits suivantes :
Lincompatibilit des modalits : sur aucune unit de la population ne
peuvent tre observes plusieurs modalits du caractre. Par exemple,
pour le caractre << nombre denfants par mnage >>,

0 enfant

0 enfant

1 enfant

1 enfant

2 enfant

2 enfant

3 enfants

3 enfants

4 enfants

2 enfants

Incompatibilit

=> compatibilit

Lexhaustivit des modalits : toute unit de la population correspond


une modalit dans la nomenclature.
0 enfant

0 enfant

1 enfant

1 enfant

2 enfants

2 enfants

3 enfants

3 enfants
4 enfants et plus

Non exhaustivit

=> exhaustivit

Les modalits dun caractre x sont notes x1, x2, , xi,, xk.
Lorsque le caractre tudi est quantitatif continu, les observations sont
regroupes en modalits reprsentant des intervalles numriques appels
classes .

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 7

Statistique et Probabilit
Par exemple, considrons les 40 observations suivantes quant la
consommation de carburant en litres aux 100 Km 90 km/h : 5,6 ;
6,3 ; 4,2 ; 6,5 ; 7,8 ; 8,3 ; 9,4 ; 6,5 ; 5,1 ; 5,6 ; 5,7 ; 6,3 ; 7,5 ; 9,4 ; 4,8 ;
8,6 ; 7,6 ; 12,5 ; 6,6 ; 5,9 ; 6,0 ; 5,8 ; 7,2 ; 7,6 ; 4,9 ; 5,8 ; 6,7 ; 7,9 ; 6,2 ;
5,4 ; 8,1 ; 9,0 ; 10,1 ; 4,9 ; 5,6 ; 5,8 ; 7,5 ; 11,2 ; 5,6 ; 7,2.

Une

telle

distribution,

les

observations

ont

collectes

individuellement, est appele srie non groupe .

Les mesures ont t ralises individuellement et sans souci de


classement. On peut ici proposer la nomenclature suivante :
Xi
[4,5[
[5,6[
[6,7[
[7,8[
[8,9[
[9,10[
[10,11[
[11,12[
[12,13[
Total

Observations
4
11
8
8
3
3
1
1
1
n = 40

[5,6[ contient la valeur 5, toutes les valeurs comprises entre 5 et 6 au sens strict,
mais ne contient pas la valeur 6.
Une telle distribution, o les observations ont t classes et regroupes, est
appele srie groupe .

La distinction entre srie non groupe et srie groupe est capitale car le
traitement de la distribution est diffrent selon que la srie soit groupe ou non.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 8

Statistique et Probabilit
Chapitre 2 :
TRAITEMENT DES DONNEES DUNE SERIE STATISTIQUE

On appelle srie statistique lensemble des donnes obtenues en vrac ou dans


lordre chronologique. Ce sont des lments qui constituent lchantillon. Le
nombre total dlments formant un chantillon est appel taille de lchantillon
et il est not

1. Effectif partiel Frquence relative


On appelle effectif partiel ou frquence absolue

le nombre dlments par

modalit ou par classe selon le type de variable considre.

On appelle frquence relative note

le rapport de leffectif partiel par la taille de

lchantillon. On a :

2. Tableau statistique
On appelle tableau statistique un tableau qui comporte 3 parties :
-

Le titre

Le corps

La source.

Le titre est toujours libell comme suit : Distribution (ou rpartition) de tels
individus ou de telles populations selon tel caractre.
Le corps est le tableau lui-mme.
La source renseigne sur le lieu et la date dlaboration du tableau. Elle permet
au lecteur de vrifier lexactitude des donnes. Sil sagit dun exercice propos, on
crit source fictive ou source inconnue.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 9

Statistique et Probabilit
2.1.

Cas du caractre qualitatif

La couleur des cheveux par exemple est un caractre qualitatif (nominal). Les
modalits peuvent tre : blonde, brune, rousse,

Exercice 1 :
Le Directeur de lInstitut Gographique National du Bnin a projet faire linventaire
des personnes qui ont achet des parcelles depuis 2011 dans la Commune
dAbomey Calavi. Il se propose de comparer la structure socioprofessionnelle et les
aires des champs ceux des autres communes du pays. Sa dmarche consiste
tudier la Catgorie Socioprofessionnelle (CSP) de propritaires terriens tirs au
hasard ainsi que les aires des surfaces de leurs parcelles. (Tableau 1).
On note bien entendu F le sexe fminin et M le sexe masculin. La catgorie
socioprofessionnelle (CSP) est dfinie par les 7 groupes de professions ci-dessous :
1. Agri : agriculteur ; ouvrier agricole
2. Ouv. : ouvrier
3. Emp. : employ
4. C.M. : cadre moyen
5. C.Sup. : cadre suprieur
6. PIC : Commerants, artisans
7. Inact. : inactifs, retraits.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 10

Statistique et Probabilit
Tableau 2 : Catgories socioprofessionnelles et aires en m2 de 50 Propritaires
Terriens
1
Agri. M 150.15 26
PIC
F 314.25
2
Ouv.
F 173.12 27 Inact. F 951.16
3
C.Sup F 88.91 28
PIC
F 63.22
4
C.M. M 65.10 29 C.M. M 95.22
5
Inact. F 39.90 30 Emp. M 99.90
6
C.Sup. F 351.15 31
PIC
M 104.57
7
Emp. F 478.80 32 C.M. M 452.75
8
Emp. F 745.33 33 Emp. F 190.68
9
Ouv. M 841.50 34 Ouv.
F 220.36
10 C.M.
F 555.10 35 Emp. M 250.66
11 Agri.
F 632.13 36 C.Sup. M 250.87
12 Ouv.
F 712.22 37 Ouv.
F 590.14
13 Emp. M 254.13 38 C.M.
F 301.25
14 Ouv.
F 301.52 39 Agri. M 610.90
15 Emp. M 420.15 40 Emp. F 125.34
16 Emp. F 289.90 41 Emp. F 240.90
17 Ouv.
F 251.14 42 Emp. F 290.75
18 Emp. M 190.65 43 Emp. M 241.78
19 C.M.
F 215.85 44 Emp. F 305.90
20 Emp. F 165.44 45 C.M.
F 520.45
21 Emp. F 174.55 46 Ouv. M 490.63
22 Emp. F 135.33 47 Inact. M 210.33
23 Ouv. M 154.66 48 C.M. M 350.44
24
PIC
F 274.15 49 Inact. F 320.90
25 C.Sup. M 293.12 50 Ouv. M 299.90
Questions
1. Elaborer un tableau statistique montrant la rpartition des propritaires
terriens selon la Catgorie Socioprofessionnelle.
2. Elaborer un tableau statistique montrant la rpartition des propritaires
terriens selon le sexe.
3. On peut aussi produire un tableau statistique donnant la rpartition des
hommes et des femmes selon la Catgorie Socioprofessionnelle afin de les
reprsenter simultanment.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 11

Statistique et Probabilit
2.2.

Cas du caractre quantitatif

2.2.1.

Caractre quantitatif discret

Comme nous lavons prcdemment dit, il faut toujours distinguer les trois
parties dun tableau statistique : le titre le corps la source.
Exemple :
On considre le nombre denfants par famille des lves Ingnieur gomtres
Topographes Promotion 2012-2013 lEcole Polytechnique dAbomey Calavi :
5 6 4 1 0 2 6 5 6 - 4 1 7 10 9 8 - 5 6 - 7 - 4 - 3 2 0 1
2 - 3 - 3 4 5 7 4 6 10 9 9 9 8 -10 - 2 -1 5 - 6 4 8 9 7
6 5 4 2 2.
1. Elaborer un tableau statistique.
2. Quel est le nombre dtudiants dont le nombre denfants par famille est
suprieur 6 enfants ?
3. Quel est le nombre dtudiants dont le nombre denfants par famille natteint
pas 9 ?
4. Quel est le nombre dtudiants dont le nombre denfants par famille varie entre
5 et 8 enfants ?
5. Quelle est la proportion des tudiants dont le nombre denfants par famille ne
dpasse pas 5 enfants ?

2.2.2. Cas du caractre quantitatif continu


Dans ce cas, la variable prend un nombre infini de valeurs dans un intervalle
donn. Il faut donc grouper les donnes par classes.
On calcule le nombre

de classes par la formule :

On identifie ensuite la plus grande valeur de la srie note


valeur de la srie note

. On calcule ltendue

Professeur : Jol M. ZINSALO/EPAC-UAC

et la plus petite

par la formule :

Page 12

Statistique et Probabilit
On calcule ensuite lamplitude

par la formule :

On fixe la borne infrieure de la premire classe (juste infrieure

) et on

obtient la borne suprieure en ajoutant lamplitude la borne infrieure fixe. On


procde ensuite au dpouillement des donnes en utilisant :

ou

Les modalits sont ici les classes.


Le corps du tableau statistique se prsente comme suit :
Modalits

Dpouillement Effectif Frquence


partiel relative (%)
7
2

Total

A chaque classe statistique

= [

100

[ est associe un centre de classe ci ainsi

quune amplitude de classe ai.


Lamplitude de classe mesure la taille de lintervalle, lcart entre les bornes
suprieure et infrieure de la classe :

Le centre de classe reprsente la valeur moyenne thorique des observations au


sein de la classe.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 13

Statistique et Probabilit

Exemple :

xi

ai

ci

[4,6[

[6,7[

6,5

[7,8[

7,5

[8,9[

8,5

[9,10[

9,5

[10,13[

11,5

Pour la nomenclature vrifiant les proprits dexhaustivit et dincompatibilit


des modalits, la proprit suivante est vrifie :

se lit somme de i gal 1 k des ni o lindice muet i prend successivement les


valeurs 1, 2, 3 , k. Ainsi,

La nomenclature vrifiant les proprits dexhaustivit et dincompatibilit des


modalits, la proprit suivante est vrifie :

Preuve :

Remarque : Cette proprit de somme unitaire doit imprativement

tre

respecte. Il convient parfois darrondir la valeur de certaines frquences relatives


pour garantir la somme unitaire.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 14

Statistique et Probabilit
Dfinition : On appelle effectifs cumul croissant de la modalit xi du
caractre quantitatif x , not Ni+, le nombre dunits de la population pour
lesquelles la modalit du caractre x observe est infrieure ou gale la ime.

Lecture : Ni+ units de la population vrifient une valeur observe du caractre x


infrieure ou gale e i+. (Ou xi si le caractre est quantitatif discret).

Dfinition : On appelle effectif cumul dcroissant de la modalit xi du


caractre quantitatif x , not Ni-, le nombre dunit de la population pour
lesquelles la modalit du caractre x observe est suprieure ou gale la ime.

Lecture :

units de la population vrifient une valeur observe du caractre X

suprieure ou gale ei-. (Ou xi si le caractre est quantitatif discret).

Exemple : Flotte des navires de pche mtropolitains au 31 / 12/ 2001 selon la


longueur en mtres :

Longueur
en ni
Ni+
mtres
Moins de 12
4199
4199
519
4718
[12 ,16[
811
5529
[16 ,25[
88
5617
[25, 38[
38 et plus
69
5686
Total
5686
Source : Direction des pches maritimes

Ni5686
1487
968
157
69
-

Lecture :
N2+ = 4718

4718 bateaux de la flotte de pche franaises mesuraient moins

de 16 mtres fin 2001.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 15

Statistique et Probabilit
N4+ = 5617

5617 bateaux de la flotte de pche franaises mesuraient

moins de 38 mtres fin 2001.


N2- = 1487

1487 bateaux de la flotte de pche franaises mesuraient 12

mtres et plus fin 2001.


N4- = 157

157 bateaux de la flotte de pche franaises mesuraient 25

mtres et plus fin 2001.

Dfinition : On appelle frquence cumule croissante de la modalit xi du


caractre quantitatif x , not Fi+, la proportion dunits de la population pour
lesquelles la modalit du caractre x observe est infrieure ou gale la ime.

Lecture : (100. Fi+)% des units de la population vrifient une valeur observe du
caractre x infrieure ou gale ei+. (Ou xi si le caractre est quantitatif discret)

Dfinition : On appelle frquence cumule dcroissante de la modalit xi du


caractre quantitatif x , not Fi-, la proportion dunits de la population pour
lesquelles la modalit du caractre x observe est suprieure ou gale la ime.

ou encore :

Lecture : (100. Fi-)% des units de la population vrifient une valeur observe du
caractre x suprieure

ou gale ei+. (Ou xi si le caractre est quantitatif

discret)

Exemple : Flotte des navires de pche mtropolitains au 31 / 12/ 2001 selon la


longueur en mtres :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 16

Statistique et Probabilit
Longueur

en ni

Ni+

Ni-

mtres
Moins de 12

4199

0,7485

[12 ,16[

519

0,8298

0,2615

[16 ,25[

811

0,9724

0,1702

[25, 38[

88

0,9879

0,0276

38 et plus

69

0,0121

Total

5686

Source : Direction des pches maritimes

Lecture :
F2+ = 0,8298

82,98% des bateaux de la flotte de pche franaises

mesuraient moins de 16 mtres fin 2001.


F4+ = 0,9879

98,79% des bateaux de la flotte de pche franaises

mesuraient moins de 38 mtres fin 2001.


F2- = 0,2615

26,15% des

bateaux de la flotte de pche franaises

mesuraient 12 mtres et plus fin 2001.


N4 - =

0,0276

2,76% des

bateaux de la flotte de pche franaises

mesuraient de 25 mtres et plus fin 2001.

Exercice 2
Le Directeur de lInstitut Gographique National du Bnin a projet faire linventaire
des personnes qui ont achet des parcelles depuis 2011 dans la Commune
dAbomey Calavi. Il se propose de comparer la structure socioprofessionnelle et les
aires des champs ceux des autres communes du pays. Sa dmarche consiste
tudier la Catgorie Socioprofessionnelle (CSP) de propritaires terriens tirs au
hasard ainsi que les aires des surfaces de leurs parcelles. (Tableau 1).
On note bien entendu F le sexe fminin et M le sexe masculin. La catgorie
socioprofessionnelle (CSP) est dfinie par les 7 groupes de professions ci-dessous :
1. Agri : agriculteur ; ouvrier agricole
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 17

Statistique et Probabilit
2. Ouv. : ouvrier
3. Emp. : employ
4. C.M. : cadre moyen
5. C.Sup. : cadre suprieur
6. PIC : Commerants, artisans
7. Inact. : inactifs, retraits, chmeurs, tudiants
Tableau 2 : Catgories socioprofessionnelles et aires en m2 de 50 Propritaires
Terriens
1
Agri. 150.15 26
PIC 314.25
2
Ouv. 173.12 27 Inact. 951.16
3
C.Sup 88.91 28
PIC
63.22
4
C.M. 65.10 29 C.M. 95.22
5
Inact. 39.90 30 Emp. 99.90
6
C.Sup. 351.15 31
PIC 104.57
7
Emp. 478.80 32 C.M. 452.75
8
Emp. 745.33 33 Emp. 190.68
9
Ouv. 841.50 34 Ouv. 220.36
10 C.M. 555.10 35 Emp. 250.66
11 Agri. 632.13 36 C.Sup. 250.87
12 Ouv. 712.22 37 Ouv. 590.14
13 Emp. 254.13 38 C.M. 301.25
14 Ouv. 301.52 39 Agri. 610.90
15 Emp. 420.15 40 Emp. 125.34
16 Emp. 289.90 41 Emp. 240.90
17 Ouv. 251.14 42 Emp. 290.75
18 Emp. 190.65 43 Emp. 241.78
19 C.M. 215.85 44 Emp. 305.90
20 Emp. 165.44 45 C.M. 520.45
21 Emp. 174.55 46 Ouv. 490.63
22 Emp. 135.33 47 Inact. 210.33
23 Ouv. 154.66 48 C.M. 350.44
24
PIC 274.15 49 Inact. 320.90
25 C.Sup. 293.12 50 Ouv. 299.90
Question
Etablir la distribution des frquences absolues des achats en kF. On fixera la
borne infrieure de la premire classe 39,9 kF.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 18

Statistique et Probabilit
Exercice 3
Un Ingnieur gomtre topographe doit mesurer les dimensions dune parcelle.
Les donnes issues des mesures sont :
269,7 263,6 264,4 259,7 262,4 263,4 260,7 265,0 267,0 265,6
268,8 260,3 263,4 267,6 264,1 272,9 264,8 261,4 264,5 266,2
265,9 265,3 266,4 255,8 267,1 265,5 264,5 262,2 271,0 264,4
269,8 266,1 268,7 261,2 263,1 264,6 258,7 262,3 261,2 262,1.
1. Dterminer le nombre de classes ncessaires.
2. Dterminer ltendue de la srie
3. Dterminer lamplitude des classes et les classes de donnes. Arrondir
lamplitude lentier suprieur.
4. Dpouiller les donnes de la srie statistique.

3. Diagrammes
On entend souvent quun schma vaut mieux quun long discours. Effectivement,
lorsque lon veut tudier une srie dobservations statistiques, il est souvent
judicieux den donner une reprsentation graphique.
Cette reprsentation dpend de la nature des donnes tudies. En effet, il existe
plusieurs types de donnes : donnes quantitatives continues (mesures par une
unit de grandeur, comme le mtre, le franc), quantitatives discrtes (rsultant
dun dnombrement et sexprimant en nombres entiers) ou qualitatives nominales
(codes par une lettre, par exemple F pour fminin, M pour masculin, ou un
chiffre sans signification numrique) et ordinales (objets classs par ordre de
prfrence).
Les reprsentations graphiques fondamentales sont :
des diagrammes, dans le cas de donnes qualitatives, quantitatives
discrtes ;
des histogrammes, dans le cas de donnes quantitatives continues.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 19

Statistique et Probabilit
3.1.

Cas dun caractre qualitatif

Il existe deux diagrammes de base :


un diagramme circulaire encore appel camembert et
une reprsentation par tuyau dorgues.
Ces diagrammes reprsentent les effectifs ou les pourcentages de lchantillon
suivant chaque modalit de la variable qualitative :
Le diagramme circulaire est constitu dun disque reprsentant la totalit
de lchantillon. Chaque modalit de la variable qualitative est caractrise
par un secteur circulaire dont laire, et par suite langle au centre,
reprsente leffectif de lchantillon correspondant.
Le disque est divis en secteur selon la loi suivante :

tel que :

est la taille de lchantillon et

leffectif partiel de chaque modalit.

La reprsentation par tuyau dorgues : on reporte le long de laxe des


abscisses la liste des modalits de la variable et le long de laxe des
ordonnes leffectif de lchantillon correspondant chacune dentre elles
dans lordre croissant ou dcroissant. Il sagit dun ensemble de rectangles
rgulirement espacs de mme base et deffectif partiel ordonn par ordre
croissant ou dcroissant.

Exercice 4
1. Reprsenter le diagramme circulaire de la rpartition des hommes par
catgorie socioprofessionnelle (voir exercice 1 page 12).

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 20

Statistique et Probabilit
2. Reprsenter le diagramme circulaire de la rpartition des femmes par catgorie
socioprofessionnelle (voir exercice 1 page 12).
3. Faire la reprsentation par tuyau dorgues des clients selon la catgorie
socioprofessionnelle.
4. Reprsenter la rpartition par catgorie socioprofessionnelle pour chaque sexe.
(Rponse voir la remarque page 26).

Remarque
On peut calculer aussi les rpartitions des hommes et des femmes suivant la
CSP, et les reprsenter simultanment. On obtient un diagramme en btons
permettant de comparer les effectifs et non les proportions : la diffrence est
importante, puisquil y a 30 femmes et 20 hommes.
Femmes Hommes
Agriculteur :

Ouvrier :

Employ :

11

Cadre moyen :

Cadre suprieur :

Commerant, artisan :

Inactif :

Figure : Rpartition par CSP pour chaque sexe.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 21

Statistique et Probabilit
4.2.
4.2.1.

Cas du caractre quantitatif


Caractre quantitatif discret

On reprsente les donnes statistiques par


un diagramme en btons : on reporte le long de laxe des abscisses la liste
des modalits de la variable et le long de laxe des ordonnes leffectif de
lchantillon correspondant chacune dentre elles.
Le polygone des frquences ou des effectifs : cest la courbe ferme reliant
les points

et les points

et

Exercice 5
Le tableau suivant reprsente la rpartition du nombre denfants par mnage
dans un quartier donn.
Nombre denfants Nombre de mnages
1

50

60

30

90

1) Reprsenter le diagramme en btons


2) Prsenter le polygone des effectifs.

Exercice 6
Dans un pays, on a tudi, sur une priode de temps trs longue, le nombre de
suicides des jeunes de moins de 20 ans.
Il y a eu 19 annes o on a compt 1 suicide par an
17 annes o on a compt 2 suicides par an
20 annes o on a compt 3 suicides par an
15 annes o on a compt 4 suicides par an
11 annes o on a compt 5 suicides par an
8 annes o on a compt 6 suicides par an
2 annes o on a compt 7 suicides par an
3 annes o on a compt 8 suicides par an
3 annes o on a compt 9 suicides par an
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 22

Statistique et Probabilit
3 annes o on a compt 10 suicides ou plus par an
9 annes o il ny a eu aucun suicide.
1) Prciser la population tudie, lindividu, le caractre tudi et ses
modalits.
2) Etablir le tableau statistique complet.
3) Prsenter le diagramme en btons reprsentatif des effectifs.
4) Prsenter le polygone des effectifs.

Solution
1) La population tudie est lensemble des jeunes de moins de 20 ans dun pays
qui se sont suicids pendant une priode trs longue. Un individu est
reprsent par une anne. Le caractre tudi est le suicide. Les modalits de
celui-ci correspondent au nombre de suicides observs soit de 0 10 et plus.
2) Il sagit de prsenter un tableau statistique 8 colonnes donnant
respectivement Modalits (Nombre de suicides
), Nombre de suicides observs (

), Effectif (nombre dannes

), Frquences relatives (en %), Effectifs

cumuls croissants, Effectifs cumuls dcroissants, Frquences cumules


croissantes, Frquences cumules dcroissantes.

4.2.2.

Caractre quantitatif continu

On peut reprsenter les donnes quantitatives continues par :


-

Un histogramme : cest un ensemble de rectangles de bases respectives les


amplitudes des classes et de hauteurs proportionnelles aux effectifs partiels
des classes. Si les classes nont pas la mme amplitude, on utilise pour
hauteur les densits deffectifs
calcule la densit

en lieu et place des effectifs partiels

connaissant lamplitude

. On

par la formule :

Le polygone statistique ou polygone des effectifs : il est obtenu en joignant


les milieux des sommets des rectangles de lhistogramme. Cest la courbe
ferme joignant les milieux des barres suprieures des rectangles appels
labels y compris les points

Professeur : Jol M. ZINSALO/EPAC-UAC

et

.
Page 23

Statistique et Probabilit
-

Le polygone cumulatif : On distingue le polygone cumulatif croissant et le


polygone cumulatif dcroissant. Pour le polygone cumulatif croissant les
effectifs cumuls croissants sont ports sur laxe des ordonnes ; la donne
cumule est porte au point dabscisse correspondant la borne suprieure
de la classe. Pour le polygone cumulatif dcroissant les effectifs cumuls
dcroissants sont ports sur laxe des ordonnes ; la donne cumule est
porte au point dabscisse correspondant la borne infrieure de la classe.

Exercice 7
En utilisant les donnes de lexercice 3 :
1) Faire un tableau statistique complet.
2) Construire lhistogramme du revenu trimestriel de ces habitants.
3) Construire lhistogramme avec les centres des classes.
4) Prsenter le polygone statistique.
5) Prsenter le graphique reprsentatif des frquences cumules croissantes
et celui des frquences cumules dcroissantes.

Exercice 8
La Direction Rgionale de lagriculture et de la fort dun pays nous a donn en
2011, la rpartition par tranche dges des chefs dexploitation agricole de la
rgion centre.
Moins de 25 ans

580 exploitations

de 25 29 ans

2162 exploitations

de 30 39 ans

8063 exploitations

de 40 49 ans

9569 exploitations

de 50 59 ans

16 660 exploitations

plus de 60 ans

15 913 exploitations.

1) Dfinir la population tudie, lindividu et le caractre tudis ainsi que les


modalits de celui-ci.
2) Etablir le tableau statistique complet de cette srie.
3) Quelle proportion dexploitations ont un chef g de 40 ans ? de moins de
30 ans ? entre 25 et 60 ans ?
4) Prsenter :
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 24

Statistique et Probabilit
a) Lhistogramme reprsentatif des effectifs
b) Le polygone des effectifs
c) le graphique reprsentatif des frquences cumules croissantes et celui
des frquences cumules dcroissantes. Quelle est la signification du
point dintersection ?

Solution
1) La population tudie est lensemble des chefs des exploitations agricoles de la
Rgion centre en 2011. Un individu est constitu dun chef dexploitation. Le
caractre tudi est son ge. Il varie de moins de 25 ans plus de 60 ans : ce
sont ses diffrentes modalits.
2) Tableau statistique
Classes

Centre

Effectifs

ges

de

Nombre

classes

tablis

Frquences
(%)

Effectifs

Effectifs

Frquences

Frquences

Cumuls

Cumuls

Cumules

Cumules

croissants

dcroissants

croissantes

dcroissantes

Total

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 25

Statistique et Probabilit
CHAPITRE 3 :
Caractrisation des donnes :
Paramtres de position Paramtres de dispersion
Diagrammes en botes

De lexamen dune distribution statistique ou dune reprsentation graphique de


cette dernire, on peut retirer plusieurs impressions gnrales :

Lordre de grandeur des observations situes au centre de la distribution :


cest la tendance centrale .

La largeur de la srie, c'est--dire la plus ou moins grande fluctuation


des observations autour de la tendance centrale : cest la dispersion .

1. Caractristiques de tendance centrale


Les mesures de tendance centrale permettent dobtenir une ide juste de lordre
de grandeur des valeurs ainsi que de la valeur centrale de la caractristique que
lon dsire tudier.
Les trois principaux indicateurs de tendance centrale sont le mode, la mdiane,
et les moyennes.

1.1.

Le mode

Le mode dune distribution statistique, not Mo, est la modalit du caractre la


plus reprsente dans la distribution.
Elle est galement appele valeur dominante de la distribution.
Il correspond au sommet de la distribution : le mode est la valeur la plus
frquente.
On appelle distribution unimodale, une distribution prsentant un seul mode

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 26

Statistique et Probabilit
f
r

q
u
e
n
c
e

X
Une distribution bimodale est une distribution prsentant deux modes
f
r

q
u
e
n
c
e

X
modes

Une distribution multimodale ou plurimodale est une distribution prsentant


plusieurs modes (2,3,). Elle est souvent le reflet dune population compose de
plusieurs sous-populations distinctes.
La dtermination du mode dune distribution diffre selon le type du caractre
observ.
1.1.1.

Cas des caractres qualitatifs et quantitatifs discret

Le mode correspondant alors la modalit deffectif (ou de frquence relative)


maximale.
Exemple : Mdailles de la France aux J.O. de Sydney en 2000 :
xi (mtal)
Or
Argent
Bronze
TOTAL

ni
13
14
11
38

Professeur : Jol M. ZINSALO/EPAC-UAC

Mo = argent

Page 27

Statistique et Probabilit
Exemple : Mdailles de la France aux J.O. dAtlanta en 1996 :
xi (mtal)
Or
Argent
Bronze
TOTAL
1.1.2.

ni
15
7
15
37

Mo = {or, bronze}

Cas des caractres quantitatifs continus

Lorsque le caractre est continu, les modalits prennent la forme de classes


dintervalles qui peuvent tre damplitude gale ou variable.
Lorsque les classes ont la mme amplitude, le mode est la modalit
correspondant leffectif le plus lev ou la frquence relative la plus leve.

Exemple : Rpartition des ouvriers dune entreprise selon le salaire mensuel

Salaire en kF

Nombre douvriers

3500 moins de 3700

21

3700 moins de 3900

49

3900 moins de 4100

100

4100 moins de 4300

24

4300 moins de 4500

Source : INSEE, France, 1984.

Leffectif le plus grand est 100. La classe modale est donc

et le mode

Mo est le centre de la classe modale soit :

Pour dterminer le mode dans le cas o les classes nont pas la mme amplitude,
il faut rapporter leffectif de chaque modalit son amplitude, de manire
comparer les diffrentes modalits sur une base commune.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 28

Statistique et Probabilit
Exemple : rparation par ge des habitants dune commune
xi (ge en annes)
[0, 18[
[18, 35[
[35, 55[
[55, 105[
TOTAL

ni
72
102
105
171
450

Source : INSAE, Bnin, 2001


Dans un premier temps, on pourrait conclure que la classe modale est la
modalit [55, 105[. CECI EST FAUX !!! En effet, on ne peut comparer les effectifs
des diffrentes modalits sans les ramener une base commune, do la
dfinition suivante.

Dfinition : on appelle densit de la modalit xi du caractre quantitatif continu


x , note di, le rapport de leffectif de cette modalit sur son amplitude.

La classe modale correspondant alors la modalit dont la densit est maximale.


Le mode est le centre de cette classe modale.
Exemple :

Xi (ge en annes)

ni

ai

d i = ni / ai

[0, 18[

72

18

d1= 72 /18 = 4

[18 ,35[

102

17

d2 = 102 / 17 = 6

[35 ,55[

105

20

d3 = 105 / 20 = 5,25

[55, 105[

171

50

d4 = 171 / 50 = 3,42

Total

350

Lecture : Dans la modalit dge [0, 18[, on trouve en moyenne 4 personnes par
tranche dun an.
Dans la modalit dge [18, 35[ , on trouve en moyenne 6 personnes par tranche
dun an.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 29

Statistique et Probabilit
Dans la modalit dge [35, 55[, on trouve en moyenne 5,25 personnes par
tranche dun an.
Dans la modalit dge [55, 105[, on trouve en moyenne 3,42 personnes par
tranche dun an.
La modalit la plus reprsente est donc bien [18, 35[. On a donc :
Mo = [18, 35[ .

Proprits du mode
Le mode soufre de certains dfauts :
Sa dtermination nest pas prcise pour les variables continues
(Mo = [18 ,35[ dans lexemple).
Il ne se prte pas au calcul algbrique.

En revanche, le mode constitue un indicateur simple et dinterprtation


immdiate.

1.2.

La mdiane

On appelle mdiane dune distribution statistique, note Me, la valeur de la


variable qui partage en deux groupes deffectif identique les observations classes
par ordre croissant. En dautres termes, la mdiane est la valeur du caractre
note Me telle que :

La mdiane est la valeur pour laquelle il y a autant dindividus gauche qu


droite dans lchantillon.
La mdiane est une valeur telle que la moiti des observations xi lui soient
infrieures ou gales

1.2.1.

Cas des variables discrtes.

Il sagit des donnes non groupes par classe. Il faut dans

un premier temps

ordonner les observations par ordre croissant. Le calcul de la mdiane dpend de


la parit de la taille de lchantillon.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 30

Statistique et Probabilit
1.2.1.1. Taille dchantillon impaire
Si n est impair, alors la mdiane est lobservation de rang

dans la srie

ordonne (ordre croissant).


Exemple : On considre la distribution dun chantillon de 9 personnes selon la
taille en cm :
153 157 159 165 167 172 173 178 182.
n= 9 impair => Me = observation de rang (9+1)/2=5=167cm
La moiti des individus de lchantillon mesurent moins de 1,67 mtres, et lautre
moiti plus de 1,67 m.

1.2.1.2. Taille dchantillon paire


Si n est pair, alors on pose

et on dtermine

par la formule :

Les donnes sont ensuite classes par ordre croissant. On identifie ensuite la
donne de rang

et la donne de rang

On calcule la mdiane Me par la

formule :

Exemple : On donne la distribution dun chantillon de 10 personnes selon la


taille en cm :
153 157 159 165 167 172 173 178 182 184
n= 10 est pair =>
On trouve :

La donne de rang 5 est 167 cm et la donne de rang 6 est 172 cm.


La mdiane Me est donc :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 31

Statistique et Probabilit

La moiti des individus de lchantillon mesurent moins de 169,5 cm, et lautre


moiti plus de 169,5 cm.

1.2.2.

Cas des variables continues

Ici les donnes sont groupes par classe.


On dtermine la classe mdiane en dterminant

et on compare cette valeur

avec les effectifs cumuls croissants. La classe mdiane est celle dont leffectif
cumul croissant englobe la

donne (celle dont leffectif cumul

croissant lui est immdiatement suprieure ou gale). On calcule ensuite la


mdiane Me par la formule :

o
est la borne infrieure de la classe mdiane
est le nombre total des donnes dans la srie
est la somme des effectifs partiels de toutes les classes prcdant la classe
mdiane
est leffectif partiel de la classe mdiane
est lamplitude de la classe mdiane.

Exemple : Distribution des communes de mtropole par tranche de population


en 1999.
Tranche de population
Moins de 200
[200,1000[
[1 000, 5 000[
[5 000, 20 000[
[20 000, 50 000[
[50 000, 200 000[
200 000 et plus

ni
10590
17413
6767
1393
298
94
10
36565
Source : INSEE, recensement de la

Professeur : Jol M. ZINSALO/EPAC-UAC

Effectif cumul croissant


10590
28003
34770
36163
36461
36555
36565
population, 1999.

Page 32

Statistique et Probabilit
Dtermination de la classe mdiane :
n/2= 36565/2= 18282,5.
Leffectif cumul croissant immdiatement suprieur cette valeur est 28003. Ce
qui correspond la classe [200,1000[. Par consquent la classe mdiane est
[200,1000[. On calcule la mdiane par la formule :

On a donc :

On a :

La moiti des communes franaises de mtropoles comptent moins de 553


habitants, et lautre moiti plus de 553 habitants.

Proprits de la mdiane
La mdiane nest pas dfinie pour les caractres qualitatifs, et son interprtation
pose problme pour les variables discrtes. En fait, la mdiane est un indicateur
utile et pertinent dans le seul cas des variables continues, o linterprtation de
la mdiane est simple et parlante .
La mdiane a pour avantage dtre peu sensible aux valeurs numriques de la
srie ; elle ne dpend gure que de lordre des observations et est constante mme
si les premires et dernires observations varient considrablement. Elle nest pas
toujours facile calculer, et parfois mme nexiste pas.

Exercice 1
Calculer la mdiane des achats des 50 propritaires terriens en utilisant les
donnes non groupes dune part puis les donnes groupes dautre part (voir
exercice 2 page 22).

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 33

Statistique et Probabilit
1.3.

Moyennes

On tudiera la moyenne arithmtique, la moyenne pondre, la moyenne


gomtrique, la moyenne harmonique et la moyenne quadratique.

1.3.1. Moyenne arithmtique


La moyenne arithmtique ou moyenne ou moyenne arithmtique simple est la
somme des grandeurs mesures divise par le nombre total dindividus. La
moyenne est note

et dtermine par la formule :

Exemple :
Pour un examen de DUT, les notes dun tudiant dans 7 matires sont :
18 16 15 - 14 12 - 17 11.

La note moyenne est donc :

Cette formule est utilise pour des donnes non groupes (c'est--dire des
donnes en vrac ou en ordre chronologique).
Pour calculer la moyenne arithmtique dune variable continue dont les
observations sont donc regroupes en classe, on considre que les valeurs
observes sont rparties de manire uniforme au sein de chaque intervalle. Ceci
revient supposer que la valeur moyenne des observations au sein dune classe
xi est gale au centre ci de cette classe. On utilise les centres
leurs effectifs partiels

des classes et

pour ainsi calculer la moyenne arithmtique. On utilise

la formule :

tant le nombre de classes et n leffectif total.


Le plus souvent il sagit plutt de calculer une moyenne pondre.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 34

Statistique et Probabilit
Il peut arriver que des donnes soient rptes un certain nombre de fois dans
une srie statistique.
La moyenne pondre est une moyenne arithmtique dans laquelle chaque
modalit

de la variable X est multiplie (ou pondre) par leffectif partiel

correspondant. La moyenne pondre se calcule par :

Exemple : notes obtenues par un lve au baccalaurat :


Xi (note sur 20)
4
8
16
13
5
Total

ni (coefficient)
2
3
2
3
2
12

ni. xi
8
24
32
39
10
113

La moyenne pondre de cet lve au baccalaurat est :

La moyenne arithmtique pondre peut galement tre dfinie partir des


frquences relatives :

Proprit :
Sur deux populations Pa et Pb de mme nature, et deffectif respectif na et nb, on a
observ le mme caractre quantitatif X. Sur chaque sous-population, on obtient
la valeur moyenne du caractre, note respectivement

et

. Alors, la moyenne

du caractre x sur lensemble de la population P = Pa U Pb est :

Exemple : Les 300 copies de statistique ont t corriges en deux fois :


120 copies avec une moyenne de 09/20
180 copies avec une moyenne de 11,5/20
Quelle est la note moyenne sur lensemble des copies ?

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 35

Statistique et Probabilit

Exercice 2
Dans une population de 12 000 familles de huit enfants, on tudie le caractre
nombre de garons parmi les huit enfants de chaque famille . La rpartition de
ces familles suivant le nombre de garons est la suivante :
Nombre
Nombre de familles
de garons
ayant n garons
0
48
1
295
2
1425
3
2213
4
3438
5
2457
6
1607
7
453
8
64
1. Construire le diagramme en btons des observations.
2. Quel est le mode de cette srie statistique ?
3. Calculer la mdiane.
4. Calculer la moyenne.

Exercice 3
En vue dtudier la rpartition des ouvriers agricoles dune rgion en fonction du
salaire journalier, on choisit un chantillon reprsentatif de cette population. On
observe que le salaire journalier est compris entre 80 kF et 200 kF, un intervalle
partag en 8 intervalles conscutifs gaux. La rpartition des individus de
lchantillon dans ces 8 classes est la suivante :
Salaires
journaliers

Professeur : Jol M. ZINSALO/EPAC-UAC

Effectifs des
classes
11
56
135
140
96
60
30
8

Page 36

Statistique et Probabilit
1. Construire lhistogramme et le polygone des frquences de cette srie
statistique.
2. Quelle est la classe modale ? Calculer la mdiane de cette srie statistique.
3. Calculer la moyenne.

La moyenne arithmtique est un paramtre de tendance centrale robuste et


simple interprter, except dans certains cas particuliers :

Lorsque la distribution contient de points aberrants (des valeurs


extrmes qui dforment la distribution).

Dans le cas de variables discrtes o linterprtation est problmatique (2,1


enfants par femme ).

Le concept de moyenne nest cependant pas univoque et ne se rduit pas la


seule moyenne arithmtique. Trois autres types de moyennes peuvent tre
dfinies, correspondant chacune un contexte bien particulier dutilisation.
La moyenne possde des proprits mathmatiques intressantes et est facile
manipuler

mathmatiquement.

Elle

dpend

de

toutes

les

valeurs

xi

et

particulirement des valeurs xi trs grandes en valeur absolue, surtout si les


observations sont peu nombreuses.
Lorsque les donnes sont peu nombreuses, que certaines observations sont trs
leves en valeur absolue, et quil existe un risque derreur de mesure non
ngligeable, on choisira la mdiane comme ordre de grandeur des observations.
Lorsque les observations sont prcises, fiables et relativement nombreuses, on
choisira la moyenne comme ordre de grandeur des observations.

1.3.2.

Moyenne gomtrique

Lutilisation de la moyenne gomtrique est exclusivement rserve au calcul des


taux de croissance moyens (cf. chapitre suivant).
Quand les diffrentes modalits de la variable forment une progression
gomtrique, il est plus logique de calculer le terme moyen de cette progression
gomtrique appel moyenne gomtrique.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 37

Statistique et Probabilit
Partons du tableau statistique suivant :
1,08 3
1,07 2
1,09 5
Total 10
et calculons la moyenne arithmtique des mesures prises par la variable

. On

trouve :

Supposons maintenant que nous ayons pendant 10 ans un phnomne


conomique dont la mesure a t effectue annuellement. La mesure initiale est
Ce phnomne a connu pendant trois ans un accroissement annuel de 8%,
laccroissement mesur la fin de chaque anne tant exprim par rapport au
niveau atteint la fin de lanne prcdente.
Ainsi la mesure du phnomne tudi est, la fin de lanne 1 :

Mesure la fin de lanne 2 :

Mesure la fin de lanne 3 :

Supposons que ce phnomne connaisse ensuite un accroissement annuel de 7%


pendant 2 ans, laccroissement tant toujours mesur en fin danne par
rfrence au niveau atteint la fin de lanne prcdente.

Supposons enfin que le phnomne considr connaisse ensuite, pendant 5 ans,


un accroissement annuel de 9%, mesur toujours en fin de chaque anne par
rapport la fin de lanne prcdente.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 38

Statistique et Probabilit
Question :
Quel serait le taux moyen annuel daccroissement (pour 100) du phnomne
tudi sur

Solution
La mesure du phnomne tudi la fin de lanne 10 est :

c'est--dire que la mesure de dpart aura t multiplie trois fois par le coefficient
1,08 ; le rsultat obtenu aura t multipli deux fois par le coefficient 1,07 ; le
rsultat obtenu tant ensuite multipli cinq fois par le coefficient 1,09.

Les oprations faites peuvent tre traduites par le tableau suivant :

Coefficient
annuel

Dsignons par

Nombre de
multiplications

1,08

1,07

1,09

Total

10

(pour 100) le taux moyen annuel daccroissement recherch. La

recherche de ce taux nous conduira crire que si, pendant 10 ans,


laccroissement annuel tait rgi par ce taux

, le phnomne tudi devrait

atteindre, au bout de 10 ans la mesure

mesure qui

pourrait aussi scrire :

soit

En dsignant donc les coefficients successifs 1,08, 1,07, 1,09 par


et les dures correspondantes 3, 2, 5 par
En dsignant par G la quantit

Professeur : Jol M. ZINSALO/EPAC-UAC

, on peut crire :

Page 39

Statistique et Probabilit
En posant

, on a :

G est dite moyenne gomtrique des valeurs de la variable


Ecrivons sous forme logarithmique (logarithme base 10) la formule qui donne
G:

Do :

Ce qui permet dnoncer que le logarithme de la moyenne gomtrique des


valeurs dune variable est gal la moyenne arithmtique pondre des
logarithmes des valeurs prises par la variable .

Terminons le calcul envisag.

1,08

0,10026

1,07

0,05876

1,09

0,18715

Total 10

0,34617

d'o :

Puisque

, on en tire un taux annuel moyen daccroissement tel que :

Exemple : Les bnfices dune entreprise ont augment de


5% par an les deux premires annes
9% par an les cinq annes suivantes
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 40

Statistique et Probabilit
12% par an les trois annes suivantes
Quelle a t laugmentation annuelle moyenne des bnfices au cours de la
dcennie coule ?

Rponse :

Les bnfices ont augment en moyenne de 9,07% par an depuis dix ans.
Exercice
Une entreprise utilise 5 camions dont les consommations

de gasoil sont les

suivantes : 17, 21, 23, 26 et 28 litres aux 100 km.


Calculer la consommation moyenne de gasoil aux 10 km.
Rp. :

1.3.3.

Moyenne harmonique

Exercice :
Depuis quatre ans, une socit consacre un budget fixe not B, chaque anne,
une campagne daffichage publicitaire. Le tableau suivant indique pour chaque
anne le prix unitaire de laffiche publicitaire (affiche + location emplacement).

Anne

2000

2001

2002

2003

Prix Unitaire en

35

38

40

44

Calculer le prix moyen des affiches achetes par cette socit sur la priode de
quatre annes.

Solution
La moyenne arithmtique sera (35+ 38+40+44) /4 = 157 / 4 = 39,25. Elle ne
rpond pas la question pose, mais indique simplement le prix moyen dune
seule affiche sur les quatre annes coules.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 41

Statistique et Probabilit
En effet, ici, la socit consacre chaque anne une somme fixe lachat dun bien
dont le prix unitaire varie, de sorte que la quantit achete chaque anne sera
elle aussi variable.

En procdant intuitivement, dfinissons le prix moyen des affiches achetes par


la socit :

Cette moyenne, que nous venons de dfinir intuitivement, est une moyenne
harmonique.
La moyenne harmonique dune variable, note H, est linverse de la moyenne
arithmtique des inverses des observations.
La moyenne harmonique simple scrit

Exercice
Dans 4 dpartements, on a dnombr le nombre dhabitants par voiture
automobile. Le premier dpartement compte 4 habitants pour une voiture
automobile, ou une automobile pour 4 personnes. Le second dpartement compte
9 habitants pour une voiture, et ainsi de suite. Le tableau statistique est le
suivant :
4
9
3
5
Total

Professeur : Jol M. ZINSALO/EPAC-UAC

800 000
450 000
3 000 000
750 000
5 000 000

Page 42

Statistique et Probabilit
La

colonne

indique

les

nombres

dhabitants

respectifs

pour

les

dpartements ; le premier dpartement compte 800 000 habitants, le second


450000 habitants, etc. La population totale atteint 5 000 000 habitants pour
lensemble des 4 dpartements.
Calculer combien on compte, en moyenne, dhabitants pour une voiture
automobile, sur lensemble des 4 dpartements.

Solution
Le nombre moyen cherch que nous dsignerons par H est videmment le
quotient :

Le nombre de voitures pour chaque dpartement est donn par le quotient :

Le

nombre

moyen dhabitants

pour une

voiture

sur lensemble

des 4

dpartements :

H rpond bien la formule :

1.3.4. Moyenne quadratique


Exercice : Une action a vu son cours voluer de la manire suivante au cours de
la semaine boursire coule :
Lundi

Mardi

+5

-2

Mercredi
+1

Jeudi

Vendredi

+3

-7

Quelle a t lamplitude moyenne de variation journalire au cours de la semaine


coule ?
La moyenne arithmtique scrit (+5 -2 +1 +3 -7) / 5 = 0 / 5=0.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 43

Statistique et Probabilit
On nobtient pas la rponse la question car les variations devraient tre
considres indpendamment de leur signe pour viter quelles ne se compensent
La moyenne quadratique permet de compenser cette lacune.

La moyenne quadratique dune variable, note Q, est gale la racine carre de la


moyenne arithmtique des carres des observations.
Lutilisation de la moyenne quadratique est rserve aux cas o les
observations ne sont pas toutes du mme signe et que lon veut mesurer une
variation moyenne.
On appelle moyenne quadratique simple du caractre x, note Q, la racine
carre de la moyenne arithmtique des n observations.

On appelle moyenne quadratique pondre du caractre x, note Q,


lexpression :

Le cours de laction a varie en moyenne de 4,2 par jour.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 44

Statistique et Probabilit
Recueil dexercices
Exercice 1
Dans une promotion dtudiants, lors de la visite mdicale, on rcapitule leur
poids dans le tableau suivant :
en kg
Effectif

22

42

16

20

Calculer la mdiane, la moyenne arithmtique, la moyenne gomtrique, la


moyenne harmonique.
Exercice 2
Calculer les quantits suivantes :

Exercice 3
Sachant que :

1. Calculer

2. Si de plus, on a :

calculer

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 45

Statistique et Probabilit
Exercice 4
Considrons le tableau suivant :
xi
4
12
7
9

Yi
6
3
8
5

Calculer les quantits :

Exercice 5
Vous faites une enqute dans une maternit auprs de 60 femmes et vous tudiez
lge de la mre la date de la naissance de leur premier enfant.
23
19
23
32
25
24

24
17
18
29
26
23

18
22
20
27
23
31

19
26
27
21
20
26

35
31
29
22
29
27

26
28
24
23
35
20

28
29
24
24
38
21

24
21
22
28
19
22

22
20
23
32
20
23

19
22
23
30
22
28

1) Quelle est la population tudie, quel est leffectif, quel est le caractre tudi,
le caractre tudi est-il discret ou continu ?
2) Calculer lge moyen de la mre la naissance du premier bb.
3) Regroupez cette srie en fonction des valeurs croissantes du caractre. Faire
apparaitre les effectifs. Aprs avoir rappel la notion de frquence calculez les
frquences relatives chacune des modalits.
4) Calculer la moyenne arithmtique en utilisant ce type de regroupement.
5) Classer la srie de 3 ans en 3 ans de la manire suivante :
[15 18[ ; [18 21[etc. en faisant apparaitre les effectifs correspondants.
6) En supposant que vous nayez comme information que ce dernier tableau,
calculez lge moyen au premier enfant.
7) Pourquoi cette moyenne arithmtique est-elle diffrente des moyennes
antrieures ?

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 46

Statistique et Probabilit
Exercice 6
Le tableau suivant indique la rpartition par ge x des condamns inscrits au
casier judiciaire nationale en France en 2000.
xi

nI (en milliers)

[14,16[

18

[16, 18[

21

[18, 20[

47

[20, 25[

118

[25, 30[

88

[30, 40[

135

[40, 60[

136

[60,80[

16

TOTAL

579

Sources : Ministre de la justice (casier judiciaire national), 2000.


1) Identifier la population tudie, le caractre tudi, son type (qualitatif /
quantitatif, discret/ continu).
2) Dterminer les centres de classes. Justifier votre choix pour la premire et
la dernire classe.
3) Dterminer les amplitudes de classes.
4) Calculer la frquence relative des diffrentes modalits. Interprter f4.
5) Quelle proportion des condamns inscrits au casier judiciaire national
correspond des mineurs ? des majeurs ?
6) Calculer le mode de cette distribution, puis interprter cette valeur.
7) Dterminer la valeur mdiane de cette distribution, puis interprter.
8) Calculer lge moyen des condamns inscrits au casier judiciaire national
en France en 2000.
9) Reprsenter le diagramme des frquences cumules croissante de cette
srie.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 47

Statistique et Probabilit
2. Caractristiques de dispersion
Les indicateurs de tendance centrale ne permettent pas eux seuls de
caractriser la distribution statistique. Ils renseignent sur lordre de grandeur
au milieu de la srie , mais nindique rien quant la rpartition des
observations autour du centre de la distribution.
Exemple : Age de mariage de deux groupes dindividus

Groupe 1

21

22

23

24

30

30

36

37

38

39

Groupe 2

28

29

29

30

30

30

30

31

31

32

Groupe 1

: Mo = Me =

= 30

Groupe 1

: Mo = Me =

= 30

Bien que les deux sries aient exactement les mmes caractristiques de
tendance centrale, les distributions sont clairement trs diffrentes :
Dans le groupe 1, les observations sont beaucoup plus disperses autour de la
tendance centrale.
Nous allons ici dfinir les indicateurs synthtiques permettant de mesurer
cette dispersion. Ces indicateurs sont de plusieurs types :
-

Ltendue dune srie

Lcart moyen

La variance et lcart type

Le coefficient de variation

Les quantiles.

2.1.

Ltendue dune srie

Ltendue

dune srie est aussi appele range ou intervalle de variation. Cest la

diffrence entre la valeur la plus leve

et la plus faible

de la srie.

On a :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 48

Statistique et Probabilit
Exemple : ge de mariage
Groupe 1 : tendue = 39 21 = 18
Groupe 2 : tendue = 32 28 = 4
Lentendue, pour simple quelle soit calculer et interprter, ne constitue pas
pour autant une mesure fiable de dispersion. En effet,
-

Elle ne prend en compte que deux des n observations ;

Deux sries la dispersion trs diffrente peuvent avoir une tendue


identique.

2.2.

Lcart moyen

Pour chaque modalit, il est intressant de calculer lcart de chaque valeur de la


variable la moyenne arithmtique, soit

, et den calculer la moyenne

arithmtique. Lcart moyen E se dfinit comme la moyenne arithmtique des


carts la moyenne arithmtique de la srie.
On le note :

2.3.

La variance et lcart type

Pour viter la compensation entre carts positifs et ngatifs la moyenne dans le


but de mesurer la dispersion, une autre solution consiste lever ces carts
une puissance paire, pour liminer les signes - . Cest le principe de dfinition
de la variance.

La variance est la moyenne des carrs des carts la moyenne arithmtique. On


la dsigne par V :
-

pour une srie simple :

pour une srie groupe par classe ou le cas de valeurs distinctes

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 49

Statistique et Probabilit
Exemple : Age au mariage de deux groupes dindividus
Groupe 1

21

29

29

30

30

31

31

39

Groupe 2

29

29

29

30

30

31

31

31

Groupe 1:

Groupe 1:

La dispersion est donc largement suprieure dans le premier groupe.

La variance na pas dinterprtation isolment. En effet, elle nest pas exprime dans
lunit de mesure de la variable (ici lanne), mais en carr de cette variable (des
annes au carr !!). Pour combler ce dfaut, on dfinit lcart type, not , comme la
racine carre de la variance.
Lcart type est donc exprim dans lunit de mesure de la variable :
-

pour une srie simple :

pour une srie groupe par classe ou le cas de valeurs distinctes

Exemple : Age au mariage de deux groupes dindividus.


Groupe 1 :
Groupe 2 :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 50

Statistique et Probabilit
Exemple : Flotte des navires de pche mtropolitaine au 31/12/2001 selon la
longueur en mtres :
Longueur

en Ni

Ci

(Ci )

ni-(C1- )

mtres
Moins de 200

4199

10*

-2,62

28824

[12, 16[

519

14

1,38

988

[16, 25[

811

20,5

7,88

50358

[25, 38[

88

31,5

18,88

31368

38 et plus

69

45*

32,88

72344

TOTAL

5686

183882

Source : Direction des Pches maritimes

2.4.

Le coefficient de variation

Les indicateurs de dispersion prcdents sont exprims dans lunit de mesure de


la variable. Alors, comment comparer la dispersion de deux variables statistiques
dont les units de mesure et les ordres de grandeur diffrent ? Par exemple, la
distribution par taille des navires de pche est-elle plus disperse que celles par
ge au mariage des groupes dindividus ?
Pour saffranchir de lunit de mesure et de lordre de grandeur, on dfinit un
indicateur de dispersion relative, le coefficient de variation.
Le coefficient de variation CV est calcul par la formule :

Il est indpendant de lunit de mesure de la caractristique observe. Si

est

ngative, on retient la valeur absolue de CV.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 51

Statistique et Probabilit
Pour deux variables X et Y, CV(X) > CV(Y) la distribution de X est plus
disperse que celle de Y.
Plus le coefficient de variation est faible (infrieur 15%), plus la srie de
donnes est homogne (concentre autour de ), indiquant ainsi que la moyenne
est bien reprsentative de lensemble des donnes de la srie.

Exemple
Age de mariage de deux groupes dindividus (groupe 1) :

Age de mariage de deux groupes dindividus (groupe 2)

Flotte des navires de pche

On peut conclure que la distribution la plus disperse est celle des bateaux de
pche par taille.

2.5.

Les quantiles

Les quantiles sont les valeurs de la variable statistique qui partagent la


distribution classe en ordre croissant en plusieurs sous-groupes deffectif
identique. Les quantiles les plus frquemment utiliss sont :
Les quartiles : ce sont les valeurs Q1, Q2, Q3, qui partagent lensemble des
observations classes par ordre croissant en 4 sous-ensembles comprenant
chacun 25 % de la population totale.
Les dciles : ce sont les valeurs D1, D2 D3, , D8, D9 qui partagent lensemble des
observations classes par ordre croissant en 10 sous ensembles comprenant
chacun 10% de la population totale.
Les centiles : Ce sont les valeurs C1, C2 C3, , C98 C99 qui partagent lensemble
des observations classes par ordre croissant en 100 sous ensembles comprenant
chacun 1% de la population totale.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 52

Statistique et Probabilit
Le 1er quartile not

dune srie ordonne (ordre croissant) est le nombre en

de duquel se trouvent au plus 25% des donnes ; le deuxime quartile


correspond la mdiane et reprsente le nombre en de duquel se trouvent au
plus 50% des donnes ; cest donc la mdiane. Le troisime quartile

est le

nombre en de duquel se trouvent au plus 75% des donnes. Lorsque les


donnes sont groupes en classes, on utilise les expressions suivantes pour
calculer

et

o
: borne infrieure de la classe qui contient

ou

: nombre de donnes dans la srie


: somme des frquences absolues des classes prcdant la classe qui contient le
premier ou le troisime quartile
: frquence absolue de la classe contenant le premier quartile
: frquence absolue de la classe contenant le troisime quartile
: amplitude de classe.

De faon analogue, on calcule les dciles Dj et les centiles Cj par les formules :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 53

Statistique et Probabilit
2.6.

Diagramme en botes

Intervalle interquartile
On appelle intervalle interquartile IQ la diffrence entre le troisime quartile
le premier quartile

et

Pour construire un diagramme en bote, on positionne de manire ordonne et


lchelle les quartiles, la mdiane et les valeurs extrmes de la srie. On construit
ensuite une bote rectangulaire relie les quartiles

et

, de sorte que la

longueur de la bote est lintervalle interquartile IQ. On trace par la suite un trait
lintrieur de la bote pour reprsenter la mdiane et un autre partir de
chaque extrmit de la bote jusquaux valeurs extrmes de la srie.

Figure : Diagramme en bote

Exercice
Un Ingnieur gomtre topographe doit mesurer les dimensions dune parcelle.
Les donnes issues des mesures sont :
269,7 263,6 264,4 259,7 262,4 263,4 260,7 265,0 267,0 265,6
268,8 260,3 263,4 267,6 264,1 272,9 264,8 261,4 264,5 266,2
265,9 265,3 266,4 255,8 267,1 265,5 264,5 262,2 271,0 264,4
269,8 266,1 268,7 261,2 263,1 264,6 258,7 262,3 261,2 262,1.
1. Calculer les quartiles

et

2. Construire le diagramme en bote.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 54

Statistique et Probabilit
Solution
Il faut dabord ordonner les donnes de la srie.
Tout dpend de la parit de la taille de lchantillon
Si n est impair, les rangs de

et

dans la srie ordonne sont arrondis

lentier suprieur.
Pour cet exercice, la taille de lchantillon n est paire.
-

Calcul du premier quartile

Le rang

est tel que :

soit :

Le premier quartile correspond la moyenne de la 10e et la 11e donne dans la


srie ordonne :

Calcul du deuxime quartile

Le rang

est tel que :

soit :

Le deuxime quartile correspond la moyenne de la 20e et la 21e donne dans la


srie ordonne :

Calcul du troisime quartile

Le rang

est tel que :

soit :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 55

Statistique et Probabilit
Le premier quartile correspond la moyenne de la 30e et la 31e donne dans la
srie ordonne :

2.7.

Rgle pratique pour dtecter une valeur aberrante

Une valeur aberrante est une donne qui scarte de faon marque de lensemble
des donnes. Une rgle pratique utilise pour identifier une valeur aberrante est
la suivante :

Une donne peut tre appele valeur aberrante si elle scarte dune distance dau
moins

au-dessus du troisime quartile ou en-dessous du premier quartile.

Une valeur aberrante doit tre examine avec soin pour identifier la cause
ventuelle de cet cart important par rapport lensemble des donnes. Les
valeurs aberrantes affectent la moyenne arithmtique.

Exercice
En se rfrant aux donnes de lexercice prcdent, dtecter les valeurs
aberrantes sil y a lieu.
On a trouv :

Lintervalle interquartile qui contient 50% des donnes du centre de la


distribution est :

Ainsi, on peut dclarer une donne aberrante :


si elle est suprieure
ou
si elle est suprieure
On constate que les deux valeurs extrmes 255,8 et 272,9 peuvent tre dclares
valeurs aberrantes.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 56

Statistique et Probabilit
Chapitre 4 :
STATISTIQUE A DEUX VARIABLES CORRELATION

1. Corrlation entre deux variables


Jusqu' prsent, nous nous sommes intresss des questions du type:
quelle est la taille moyenne des garons bninois gs d'une vingtaine
d'annes ?
quelle est la probabilit pour qu'un mdicament soit efficace ?
quel pourcentage de voix un parti politique recueillera-t-il aux prochaines
lections ?
quelle fraction des barres mtalliques produites par une usine sera-t-elle
rejete par le client ?
le poids moyen des pains produits dans une boulangerie est-il suprieur
800 grammes ?
Dans toutes ces questions, nous tudions le comportement statistique d'une
seule variable: taille, efficacit du mdicament, pourcentage de voix, longueur des
barres, poids des pains.
Il existe cependant toute une gamme de problmes statistiques o l'on s'intresse
la relation entre plusieurs variables.
Exemples:
les individus les plus grands sont-ils les plus lourds ?
le revenu d'une famille a-t-il une influence sur les rsultats scolaires des
enfants ?
y a-t-il une relation entre le tabagisme et les cancers du poumon ?
le rendement en crales dpend-il de la quantit d'engrais utilise ?
la productivit d'une entreprise est-elle lie au salaire des ouvriers ou
employs ?
Dans ces questions, nous dsirons savoir si le comportement d'une variable est
influenc par la valeur d'une autre variable:
taille

poids

revenu

rsultats

tabagisme

cancer

rendement

engrais

La relation peut tre causale ou non.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 57

Statistique et Probabilit
Pour tudier les relations ou corrlations entre deux variables statistiques, on
peut les porter sur un graphique.
Exemple: relation entre la taille et le poids des individus
pour chaque individu de l'chantillon, on porte sur un graphique:
sa taille en abscisse (l'abscisse d'un point correspond sa projection sur l'axe
horizontal)
son poids en ordonne (l'ordonne d'un point correspond sa projection sur
l'axe vertical)
chaque individu est donc, dans ce graphique, reprsent par un point (point
reprsentatif)
soit un individu mesurant 172 cm et pesant 66 kg:

70
p
66
o
i
d 60
s
(kg)

point reprsentatif

50
150

160

170

172

180

taille (cm)
Dans le graphe, il y aura donc autant de points qu'il y a d'individus dans
l'chantillon.

p
o 80
i
d 70
s
(kg) 60
50
150

.
.
. . .
.. . . . .
.
. .. . . . .
. . .. . . .
. .
160

170
180
190
200
taille (cm)
Relation entre le poids et la taille dans un chantillon de 30 individus.
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 58

Statistique et Probabilit
On peut (par la pense ou rellement) tracer une droite qui passe au mieux par
ces points (au milieu du "nuage" de points).
Si cette droite "monte", on dira qu'il y a corrlation positive entre les deux
variables.
Si elle "descend", c'est une corrlation ngative.
Si elle est "horizontale", ou si on ne peut pas dcider, c'est qu'il y a absence de
corrlation.
Corrlation positive:

.
.
. . .
.. . . . .
.
. .. . . . .
. . .. . . .
. .
x
Corrlation ngative:

. .. .
. . . .. .. . .
. . .
.
. . . .. . .
. .
.
.
.

.
x

Absence de corrlation:

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 59

Statistique et Probabilit

. .. .
. .. . . . .

. .. . .
.
. . .. .. . . . .
. . .. . . . .
. . .

. .. . . . . .
.
.. . . . .
x

La qualit de la corrlation entre deux variables peut se mesure par la dispersion


des points autour de la relation moyenne.
Corrlation parfaite:

. .

..

x
Bonne corrlation (corrlation forte):

. .

. .

.. .

.
. ..

x
Mauvaise corrlation (corrlation faible):

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 60

Statistique et Probabilit

.
. .
.

.
. .

.
.

x
Exemple:
1.

Corrlation entre le poids et la taille pour les garons de 2me candidature

communication (1998).

100

.. . .
. .. ..
..
. .. ...... .
..
. . . ..
.. . .
.

p
o 80
i
d
s
(kg) 60

.
40
140

160
180
taille (cm)

200

On constate une augmentation du poids avec la taille (corrlation positive): les


garons les plus grands sont gnralement les plus lourds.
Mais la dispersion des points est assez grande: la corrlation est assez faible.
2.

Corrlation entre le poids et la taille pour les filles de 2me candi. commu.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 61

Statistique et Probabilit

p
o 80
i
d
s
(kg) 60

. . ..... .
.
. .. .
.
.
. .. ... ....... .
. ..... . ..
...... ...
.

40
140

160
180
taille (cm)

200

On ne constate pas de relation entre le poids et la taille (absence de corrlation): le


poids des filles est indpendant de leur taille.
(Les filles les plus grandes sont donc les plus minces)

2. Mthode des moindres carrs


Si on se contente de tracer main leve la droite qui "passe au mieux" par les
points reprsentatifs, diffrentes personnes vont obtenir des rsultats diffrents.
Il existe une mthode mathmatique pour dterminer la "meilleure" droite: c'est la
mthode des moindres carrs.
Elle consiste, dans sa version la plus simple, trouver la droite qui minimise les
carrs des carts des points reprsentatifs cette droite.

d5
d3
d1

d4

d2

X
Trouver la droite telle que la somme des carrs des carts d1, d2, soit minimale:

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 62

Statistique et Probabilit

d 2 = minimum
Soit

Y = aX + b
l'quation de la droite cherche (droite de rgression)
Les coefficients a et b peuvent tre calculs partir des formules suivantes:
Pente:
a=

(X

)( ) (
)( ) (
)(
(X X ) + (X X ) + L + (X X )

X . Y1 Y + X 2 X . Y2 Y + L + X n X . Yn Y
2

ou:
a=

( X X ).(Y Y )
(X X )2

Ordonne l'origine:

b = Y a. X
Rappels:
1
X
n
1
Y = Y
n
X=

3. Coefficient de corrlation
Le signe de la pente a donne le sens de corrlation, mais pas sa qualit.
a > 0 corrlation positive
a < 0 corrlation ngative
a = 0 pas de corrlation
La qualit de la corrlation peut tre mesure par un coefficient de corrlation r

r=

( X X ).(Y Y )
2
( X X ) (Y Y )2

Le coefficient de corrlation est compris entre 1 et +1.


Plus il s'loigne de zro, meilleure est la corrlation
r = +1 corrlation positive parfaite
r = 1 corrlation ngative parfaite
r = 0 absence totale de corrlation

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 63

Statistique et Probabilit

Quelques exemples de corrlation


(le coefficient de corrlation r est indiqu dans chaque cas)

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 64

Statistique et Probabilit
Exemples:
1.

Supposons

un

chantillon

alatoire

de

firmes

pharmaceutiques

prsentant les dpenses de recherche X et les profits Y suivants (en milliers de


dollars):
X

40

50

40

60

30

40

50

50

Trouvez la droite de rgression et le coefficient de corrlation.


Calculons tout d'abord X et Y:
X =

1
1
160
X = (40 + 40 + 30 + 50 ) =
= 40

n
4
4

Y=

1
1
200
Y = (50 + 60 + 40 + 50 ) =
= 50

n
4
4

Compltons le tableau suivant:

XX

Y Y

(X X )2 (Y Y )2 (X X ) .(Y Y )

40

50

40

60

+10

+100

30

40

10

10

+100

+100

+100

50

50

+10

+100

On a donc:

(X X ) = 200
2
(Y Y ) = 200
(X X )(. Y Y ) = 100
2

Les coefficients de la droite de rgression sont:


a=

(X X )(. Y Y ) = 100 = 0,5


2
200
(X X )

b = Y a. X = 50 0,5 40 = 50 20 = 30

Et le coefficient de corrlation:

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 65

Statistique et Probabilit

r=

(X X )(. Y Y )
2
2
(X X ) (Y Y )

100

200 200

100
= 0,5
200

La corrlation est positive et de qualit moyenne

Y
60

50
40
30
2.

40

50

60

La corrlation entre la taille (X) et le poids (Y) pour les garons de 2me

candi. commu. donne les rsultats suivants:


(a)

droite de rgression

a = 0,816
(b)

Y = aX + b

b = -77,0

coefficient de corrlation

r = 0,61
la corrlation est donc positive, de qualit moyenne
3.

De la mme manire, pour les filles, on obtient:

(a)

droite de rgression

a = 0,239
(b)

b = 16,6

coefficient de corrlation

r = 0,20
la corrlation est positive (les filles les plus grandes tendent tre les plus
lourdes), mais de trs mauvaise qualit (r proche de zro).
Remarques:
1.

Le coefficient de corrlation nous donne des informations sur l'existence

d'une relation linaire (sous forme d'une droite) entre les deux grandeurs
considres.
Un coefficient de corrlation nul ne signifie pas l'absence de toute relation entre
les deux grandeurs. Il peut exister une relation non linaire entre elles.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 66

Statistique et Probabilit
(cf. exemple (f) ci-dessus: la connaissance de X nous donne des informations sur
la valeur de Y).
2.

Il ne faut pas confondre corrlation et relation causale.

Une bonne corrlation entre deux grandeurs peut rvler une relation de cause
effet entre elles, mais pas ncessairement.
Exemples:
1.

Si on compare la dure de vie des individus la quantit de mdicaments

pour le cur qu'ils ont absorbe, on observera probablement une corrlation


ngative. Il serait imprudent de conclure que la prise de mdicaments pour le
cur abrge la vie des individus
(en fait, dans ce cas, la corrlation est l'indice d'une cause commune: la maladie
de cur).
2. Le soleil tire son nergie de ractions nuclaires transformant l'hydrogne
en hlium. Notre socit tire une bonne part de son nergie de la
combustion du ptrole. Si on compare, anne aprs anne, la quantit
d'hlium contenue dans le soleil au prix moyen du ptrole, on obtiendra
une bonne corrlation positive, sans qu'il y ait la moindre relation de
cause effet, ni aucune cause commune.
3. Depuis une dizaine d'annes, la taille de mon fils cadet, n en 1989, est
trs bien corrle avec la puissance de calcul des ordinateurs personnels.
Cette excellente corrlation ne rvle bien videmment aucune relation de
cause effet, ni cause commune.
L'existence d'une corrlation, aussi bonne soit elle, n'est jamais la preuve d'une
relation de cause effet.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 67

Statistique et Probabilit
CHAPITRE 5
ANALYSE COMBINATOIRE

Lanalyse combinatoire est une branche des mathmatiques qui tudie


comment compter les objets. Elle fournit des mthodes de dnombrements
particulirement utiles en thorie des probabilits. Les probabilits dites
combinatoires utilisent constamment les formules de lanalyse combinatoire
dveloppes dans ce chapitre. Un exemple des applications intressantes de cette
dernire est la dmonstration du dveloppement du binme de Newton utilis
dans le calcul des probabilits dune loi binomiale.
1. Arrangement
1.1.

Dfinition

Etant donn un ensemble E de n objets, on appelle arrangements de p objets


toutes suites ordonnes de p objets pris parmi les n objets.
Le nombre darrangements de p objets pris parmi n est not :
Remarque : On a ncessairement 1 p n et n, p
Si n < p, alors

N*

Deux arrangements de p objets sont donc distincts sils diffrent par la nature
des objets qui les composent ou par leur ordre dans la suite.
Exemple :
a) Le nombre de mots de 5 lettres (avec ou sans signification) forms avec les 26
lettres de lalphabet correspond au nombre darrangements possibles avec p
=5 et n =26.
b) Le tierc dans lordre lors dune course de 20 chevaux constitue un des
arrangements possibles avec p = 3 et n =20.

1.2. Arrangements avec rptitions


Lorsqu'un
arrangement,

objet
le

peut

tre

observ

plusieurs

fois

dans

un

nombre darrangement avec rptition de p objets pris

parmi n, est alors :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 68

Statistique et Probabilit

avec
Exemple 1 :
On dispose des 6 premires lettres de lalphabet. Combien de sigles de 4 lettres
peut on former ?
Exemple 2 :
Combien pourrait on thoriquement attribuer de numro de tlphone aux
habitants de COTONOU si chaque numro comprenait 8 chiffres ? (Rep : Cest gal
au nombre darrangement avec rptition dun ensemble de 8 lments dans un
ensemble dcimal ( 10 lments) soit

1.3. Arrangements sans rptition


Lorsque chaque objet ne peut tre observ quune seule fois dans un
arrangement, le nombre darrangements sans rptition de p objets pris parmi
n est alors :

Notons que :

Ainsi :
;

Rappel : Si n

, on appelle factorielle n, note n! , le produit des n premiers

entiers :

1 2 3 ..... p (p + 1) ... (n 1) n = n!
0! =1 par convention car 0! nest en principe pas dfinie.

Ds que n dpasse la dizaine, n! se compte en millions. Il est bon de connatre


la formule dapproximation suivante ( formule de Stirling ) :

Exemples :
a) On dispose des 6 premires lettres de lalphabet. Combien de sigles de 4 lettres
distinctes peut on former ?
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 69

Statistique et Probabilit
b) Pour accder une banque de donnes, vous devez taper un mot de passe de 4
lettres sur votre minitel. Combien de mots de passe de 4 lettres distinctes peuton crer ?
c) Combien peut on crire de nombres de 4 chiffres diffrents dans le systme
dcimal ?
Reponse :
Premire mthode : Si lon considre les dix chiffres de 0 9, il y a
arrangements possibles (tirage sans remise, ordonn), mais parmi ceux-ci
figurent tous les nombres commenant par un zro, qui sont en fait des nombres
de 3 chiffres forms de chiffres de 1 9 ce qui en fait

. Il reste donc :
.

Deuxime mthode : Raisonnement direct


9 choix sont possibles pour le premier chiffre (pas de zro)
9 choix sont possibles pour le deuxime galement (tous les chiffres sauf le
premier)
8 choix sont possibles pour le 3e chiffre et
7 choix sont possibles pour le dernier.
d) Dans le systme dcimal combien peut on crire de nombres de 5 chiffres
diffrents dont le premier soit pair et le dernier impair ?
e) Une course de chevaux comporte 20 partants. Combien peut-il y avoir de
rsultats possibles de tiercs dans l'ordre ?
f) Une urne contient 10 boules numrotes 0, 1, ... , 10. On en tire successivement
trois sans remise. Combien de tirages diffrents peut on faire ?

2. Permutations
2.1. Permutations sans rptition
Etant donn un ensemble E de n objets, on appelle permutations de n objets
distincts toutes suites ordonnes de n objets ou tout arrangement n n de ces
objets.
Le nombre de permutations de n objets est not :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 70

Statistique et Probabilit
La permutation de n objets constitue un cas particulier darrangement sans
rptition de p objets pris parmi n lorsque p = n.
Ainsi le nombre de permutations de n objets est :

NB :

Exemple :
a) Le nombre de manires de placer 8 convives autour dune table est :
P8 = 8! = 40 320 possibilits
b) On dispose des 6 premires lettres de lalphabet. Combien de sigles de 6 lettres
distinctes peut- on former ?
c) Un possesseur de coffre - fort distrait se souvient que pour ouvrir son coffre il
doit former une fois et une seule fois tous les chiffres de 0 9. Ne se rappelant
plus dans quel ordre il faut procder il dcide de former ces chiffres dans tous
les ordres possibles. Sachant que chaque tentative ncessite une minute
combien de temps mettra t il pour les essayer tous ?
d) De combien de faons peut-on repartir 7 personnes sur 7 chaises ?

2.2. Permutations avec rptition


Dans le cas o il existerait plusieurs rptitions k dun mme objet parmi les n
objets, le nombre de permutations possibles des n objets doit tre rapport aux
nombres de permutations des k objets identiques.
Le nombre de permutations de n objets est alors :

En effet, les permutations de k objets identiques sont toutes identiques et ne


comptent que pour une seule permutation.
Exemple :
a) Considrons le mot COMMERCIAL . Combien

de mots possibles (avec ou

sans signification) peut t on crire en permutant ces 10 lettres ?


b) On appelle anagramme dun mot donn tout mot obtenu partir du premier en
changeant ces lettres dans un ordre quelconque.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 71

Statistique et Probabilit
Combien y a t-il danagrammes du mot PROBABILITE ?
c) On considre les chiffres 1, 2, 3 et 4. Combien de nombres de 10 chiffres peut
on crire sachant que le 1 est rpt 5 fois, le 2 est rpt 3 fois et le 3 et le 4
ne figurent quune seule fois ?
3. Combinaison
Pour les combinaisons, on ne parle plus de suite ni de srie puisque la notion
dordre des objets nest plus prise en compte. On parle alors de tirages avec ou
sans remise.
Soit E un ensemble fini de cardinal n et p un entier naturel tel que 0

n.

Une p-combinaison (ou combinaison de p lments) de E est une partie de E


ayant p lments. Le nombre de combinaisons de p lments de E est :

Exemple :
E = {a ; b ; c} et p = 2. Les combinaisons de deux lments de E sont les parties :
{a ; b}, {a ; c} et {b ; c}.
Il est essentiel de noter que :
Dans une partie, les lments sont deux deux distincts.
Deux parties qui contiennent les mmes lments sont gales.
Ainsi {a ; b} = {b ; a}. (L'ordre dans lequel on crit les lments n'a pas
d'importance)

3.1. Combinaison sans remise


Etant donn un ensemble E de n objets, on appelle combinaisons de p objets
tout ensemble de p objets pris parmi les n objets sans remise.
Le nombre de combinaisons de p objets pris parmi n est not :

Remarque : On a ncessairement 1 p n et n, p

N*. Si n < p, alors

Le nombre de combinaisons de p objets pris parmi n et sans remise est :

Remarque : A la notation ancienne

Professeur : Jol M. ZINSALO/EPAC-UAC

, on prfre parfois la notation moderne

Page 72

Statistique et Probabilit
Les nombres n et p constituent les coefficients binomiaux.
reprsente le nombre de faons de choisir p objets parmi n (l'ordre n'importe
pas).

Exemples :
a) On tire au hasard 6 boules parmi 49. Combien de tirages possibles peut on
faire ?
b) Quel est le nombre de comits de 3 personnes que l'on peut lire dans une
assemble de 20 personnes ?
c) Lors dun recrutement pour 4 postes de travail identiques, se prsentent 8
hommes et 6 femmes. Combien de recrutements distincts sont possibles ?
Combien de recrutements sont possibles sachant que lon recrute 2 hommes et 2
femmes ?
d) Dune urne contenant 8 boules (3 blanches et 5 noires) on tire simultanment 4
boules. Combien y a t il de tirages possibles ? Dans combien de cas peut on
obtenir exactement deux boules blanches ? au moins deux boules noires ?

3.2. Combinaisons avec remise


Le nombre de combinaisons de p objet parmi n avec remise est :

Proprits

Donc :

Combinaisons composes ou Formule de Pascal


Si

, on a :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 73

Statistique et Probabilit
TRAVAUX DIRRIGES
Exercice
Dans une banque, chaque client possde un compte dont le code est compos de 3
lettres et 5 chiffres non ncessairement distincts du type

ABC

5.
1) On suppose que les 3 lettres sont distinctes. Combien peut on ouvrir de
comptes dont le code :
a) commence par A B ?
b) commence A ?
c) contient un A ?
d) contient un A et un B ?
e) commence par A et finit par 1 2 3 ?
2) On suppose que les 3 lettres ne sont plus ncessairement distinctes. Combien
peut on ouvrir de comptes dont le code
a) commence par A ?
b) contient au moins deux A ?
3) On suppose que les 3 lettres ne sont pas ncessairement distinctes et quil est
impossible dutiliser les chiffres 0, 1, 2, 3, 4 qui sont rservs des codes
spciaux. Combien peut on ouvrir de comptes dont le code :
a) commence par A ?
b) finit par 999 ?
c) commence par A et finit par 99 ?

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 74

Statistique et Probabilit
CHAPITRE 6 :
NOTIONS ET CALCUL DE PROBABILITE

Les premires personnes stre intresses aux problmes de probabilits


furent des mathmaticiens franais, Blaise Pascal et Pierre de Fermat qui
rpondaient aux questions souleves par un adepte des jeux de hasard, le
chevalier de Mr. A cette poque, la thorie des probabilits se dveloppa
uniquement en relation avec les jeux de hasard. Mais avec Pierre Simon Laplace
et Karl Friedrich Gauss, les bases de la thorie furent tendues dautres
applications et phnomnes. Le calcul des probabilits fournit une modlisation
efficace des situations non dterministes cest--dire des phnomnes alatoires
ou stochastiques. En ce qui concerne les premiers, le rsultat dune exprience
suit une loi rigoureuse connue (taux de croissance dune population bactrienne).
On peut donc ainsi prvoir le rsultat pour un vnement donn. En revanche
dans le cas des phnomnes alatoires, le rsultat de lexprience nest pas connu
avec certitude mais fluctue autour dun rsultat moyen qui est rgit par une loi
(transmission des caractres selon la loi de Mendel).
Il existe deux manires dintroduire la notion de probabilit :
La probabilit a priori, subjective dun vnement est un nombre qui
caractrise la croyance que lon a que cet vnement est ralis avec plus
ou moins de certitude avant lexcution de lexprience : lvnement est
ralis (probabilit 1) et lvnement nest pas ralis (probabilit 0).

La probabilit empirique assimile une frquence est dfinie partir


dexpriences indfiniment renouvelables. La probabilit dun vnement
est alors la frquence dapparition de cet vnement.

Enfin le calcul des probabilits utilise lanalyse combinatoire ainsi que la thorie
des ensembles.

1. Espace fondamental et vnements


La thorie des ensembles qui est succinctement prsente dans ce chapitre
constitue un outil puissant dans plusieurs branches des mathmatiques,
notamment en probabilits.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 75

Statistique et Probabilit
1.1. Dfinitions
En face de situations dont lissue est incertaine, on a bien souvent envie
dattribuer chacune des ventualits possibles une vraisemblance plus ou
moins grande. Afin de donner une rigueur mathmatique ce concept, il est
ncessaire tout dabord de donner quelques dfinitions.

Une exprience ou une preuve est qualifie dalatoire si on ne peut pas


prvoir son rsultat et si, rpte dans des conditions identiques, elle peut
donner des rsultats diffrents.

Le rsultat dune exprience not constitue une ventualit ou un


vnement lmentaire.

Lensemble des vnements lmentaires possibles pour une exprience


alatoire donne constitue lespace fondamental appel univers ou
univers des possibles not .

Exemple :

Lors dun contrle sanguin, lensemble des rsultats possibles si lon


sintresse

(1) au groupe sanguin et au facteur rhsus dun individu est

=

(2) au nombre de globules blancs = N*=

(3) au taux de glycmie = [0 ; 15] au-del de 15, lindividu nest plus en


tat de subir une prise de sang.

Ainsi pour une mme preuve, lunivers peut tre fini (toutes les ventualits
sont connues : cas 1) ou infini (toutes les ventualits ne sont pas connues : cas
2 et 3). Dans ces deux derniers cas, lunivers peut tre dnombrable si on peut
numroter les ventualits connues (cas 2) ou bien continu comme dans le cas
du taux de glycmie (cas 3).

Un vnement quelconque A est un ensemble dvnements lmentaires et


constitue une partie de lunivers des possibles dont on sait dire lissue de
lpreuve sil est ralis ou non.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 76

Statistique et Probabilit
Si

A, alors A est ralis. Mais si

A alors A nest pas ralis et cest

lvnement contraire qui est ralis. Un vnement est donc une assertion
relative aux rsultats dune exprience.
Il est possible quun vnement ne soit constitu que dun seul vnement
lmentaire.
Les vnements sont reprsents par des lettres majuscules, A, B, C, A1, A2, etc.

Exemple :
Dans lexemple concernant les groupes sanguins,
- lvnement A lindividu est de rhsus positif est reprsent par :

avec A

- lvnement B lindividu est donneur universel est reprsent par : B = {O-}


un seul vnement lmentaire
Dans le cadre de cet exemple, lvnement A est ralis si le rsultat du typage
donne lun des
4 groupes sanguins A+,B+,AB+,O+.

Si est fini, chaque partie A de lunivers (A

) est constitue dun nombre

fini dventualits et dans ce cas lensemble des vnements est tel que : () = P
() lunivers des possibles.
Dans le cadre de ce cours, nous nous placerons dans le cas o lensemble des
vnements de lunivers est clairement dfini.
1.2. Evnements remarquables
Lvnement impossible not est lvnement qui ne peut tre ralis quelle
que soit lissue de lpreuve. Bien que constitu daucune ventualit, est
considr comme un vnement :

()

Lvnement certain, not est toujours ralis quelle que soit lissue de
lpreuve. Il est constitu de toutes les ventualits et lon impose que ce soit un
vnement :

()

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 77

Statistique et Probabilit
Lvnement contraire ou complmentaire dun vnement A, not

est

lvnement qui est ralis si et seulement si A ne lest pas. Il est donc


constitu des vnements lmentaires qui ne sont pas dans A.

Dans lexemple concernant les groupes sanguins, lvnement contraire de A


lindividu est
de rhsus positif est constitu des vnements lmentaires suivant :

Par dfinition, on obtient les relations suivantes :


=A;

=;

1.3. Oprations sur les vnements


Si lon considre simultanment la ralisation de deux vnements A et B, il est
possible deffectuer des oprations sur ces ensembles.
1.3.1.

Lintersection de deux vnements

On appelle intersection de deux vnements A et B, lvnement qui est ralis si


et seulement si A et B le sont. Il est donc constitu des ventualits appartenant
la fois A et B.
Cest un vnement not A B
A, B

tel que :

() avec
et

(), A B

( A

AB

B). Lintersection A B

correspond
logique

la
A

Lintersection

conjonction
et

des

.
deux

vnements A et B figure en
vert sur le graphe ci-contre.
Remarque

Lunivers

des

possibles ntant pas limit


uniquement aux vnements A

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 78

Statistique et Probabilit
(parties rouge et verte) et B (parties bleu et verte), lvnement complmentaire
, est form des parties bleu et blanche.
Deux vnements A et B sont incompatibles ou disjoints, sils ne peuvent tre
raliss simultanment. On a alors : A B =
Quelques proprits de lintersection ( ) :
A

vnements incompatibles

A=A

lment neutre ()

A=

lment absorbant ( )

AB=BA

commutativit

A (B C) = (A B) C

associativit

A (B

distributivit avec la runion ( ).

C) = (A B)

(A C)

La runion de deux vnements

1.3.2.

On appelle runion de deux vnements A et B, lvnement qui est ralis si et


seulement si A ou B est ralis. Il est donc constitu des ventualits
appartenant A ou B.
Cest un vnement not A

B tel que :
avec

La runion A

A,B

(), A B

()

( A ou B)

B correspond la disjonction logique A ou B .

La runion des deux vnements A et B figure en vert


sur le graphe ci-contre.
Remarque : La runion de deux vnements nest
pas la somme algbrique des vnements dans la
mesure o la zone de recouvrement nest pas
comptabilise deux fois.
Quelques proprits de la runion ( ) :
A

vnements complmentaires

A=A

lment neutre ( )

A=

lment absorbant ()

B=B

(B

C) = (A

commutativit
B)

Professeur : Jol M. ZINSALO/EPAC-UAC

associativit
Page 79

Statistique et Probabilit
A

(B C) = (A

B) (A

C)

distributivit avec lintersection ()

Selon les lois de Morgan, nous avons :


ce qui correspond la partie hachure sur ce graphe.

=
=

ce qui correspond lensemble vide


possibles nest

lorsque lunivers des

constitu que des vnements A et B

(graphe).
1.3.3.

Linclusion dun vnement

Un vnement A entrane un vnement B si la ralisation de A implique celle de


B. On dit que lvnement A est inclus dans lvnement B. On crit : A

B.

Limplication logique A
se traduit par linclusion A

B
B

.
Exemple

de

linclusion

de

lvnement A en rouge dans


lvnement B en bleu.
Exemple :
Soit une urne contenant des
billes rouges unies et des billes
vertes unies et stries. Si lon
note A lvnement obtention
dune bille strie et B lvnement obtention dune bille verte , la ralisation de
A implique la ralisation de B car A est inclus dans B.
1.4. Systme complet dvnements

A1 ,A2 ,....., An forment un systme complet dvnements si les parties A1 ,A2


,....., An de constituent une partition de telle que :
i

Ai
ij

Professeur : Jol M. ZINSALO/EPAC-UAC

Ai A j =

Page 80

Statistique et Probabilit
Un systme complet dvnements est form de toutes les parties de , cest-dire des familles dvnements 2 2 incompatibles dont la runion constitue
lvnement certain .
Le nombre de partitions possibles dans un ensemble fini de n vnements est :
si Card () = n alors Card (P()) =

1.5. Espace probabilisable


On appelle espace probabilisable (, C), un objet form de deux lments :
-

un espace dventualits

un espace dvnements C

P()

avec :
(P1) A

(P2) Ai

C( i

(P3)

N*)

Ces trois axiomes ou proprits suffisent dfinir un espace probabilisable et on


pourrait montrer quil implique que

C et

2. Probabilits
Le passage dune description de type ensembliste des phnomnes alatoires
llaboration dun vritable modle mathmatique se fait en introduisant les
mesures de probabilit.

2.1. Dfinitions
2.1.1.

Concept mathmatique

On appelle probabilit P toute application de lensemble des vnements dans


lintervalle
[0,1], tel que :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 81

Statistique et Probabilit
satisfaisant les proprits (ou axiomes) suivantes :

Remarque : Le concept mathmatique de probabilit modlise les notions


intuitives de proportion et de frquence. Si lon avance que la probabilit dtre
tudiant en Marketing et Action Commerciale est de 0,8 lInstitut CERCO, on
modlise le fait quenviron 80 % des tudiants de CERCO sont en Marketing et
Action Commerciale.

2.1.2.

Probabilits combinatoires

Soit un espace fondamental fini constitu de N vnements lmentaires sur


lequel on fait lhypothse dquiprobabilit de ralisation des N vnements
lmentaires. On suppose ainsi que tous les vnements lmentaires ont la
mme chance de se raliser. Dans ce cas la probabilit pi dun vnement
lmentaire quelconque I est telle que :

satisfaisant
(P1)

avec I pi 0

(P2)

on doit avoir :

Soit A un vnement quelconque constitu de k vnements lmentaires de ,


on en dduit :

avec

Cette formule snonce souvent comme :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 82

Statistique et Probabilit

Cette formule permet de ramener les calculs de probabilits des dcomptes


dvnements lmentaires effectus par des techniques danalyse combinatoire
qui ne sont pas des probabilits.
Exemples :
(1) En tapant 5 lettres au hasard sur une machine crire (possibilit de taper
plusieurs fois sur la mme touche), la probabilit dobtenir le mot lutte est dune
chance sur 12 millions. En effet il y a exactement 11 881 376 mots de 5 lettres
possibles (Voir Arrangement avec rptition).
(2) La probabilit dobtenir un multiple de trois lors du lanc dun d 6 faces, non
pip est :
A = {3,6} do P(A) = 2/6 = 1/3 avec k =2 et pi =1/6.
Lois des grands nombres

2.1.3.

Si lon rpte N fois une exprience dans laquelle la probabilit dapparition dun
vnement A est P, la frquence de cet vnement au cours des N expriences,
tend vers P lorsque N tend vers linfini. N
Lorsque le nombre dpreuves augmente indfiniment, les frquences observes
tendent vers les probabilits et les distributions observes vers les lois de
probabilit.
2.1.4.
Nous

dfinirons

Espace probabilis
un

espace

probabilis

en

utilisant

laxiomatique

de

Kolmogorov,
Dfinition 1
On appelle probabilit sur (,C) une application P de C dans lintervalle [0,1] telle
que :

P()=1

pour tout ensemble dnombrable dvnements incompatibles 2 2, on a :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 83

Statistique et Probabilit
Dfinition 2 :
On appelle espace probabilis, le triplet (, C, P).
Ainsi un espace probabilis dsigne un espace fondamental et ses
vnements, muni dune mesure de probabilits.

2.2. Proprits des probabilits


Des axiomes prcdents dcoulent les proprits additives des probabilits,
dusage permanent.
2.2.1.

Additivit

Cas dvnements incompatibles


Si A1,A2 ,,Ai,.., An sont n vnements incompatibles deux deux
(Ai Aj =
P(A1

si i j ) alors :

A2

Ai ..

An ) = P(A1) + P(A2) + + P(Ai) +.+ P(An).

La probabilit de la runion dun ensemble fini ou dnombrable dvnements 2


2 incompatibles est gale la somme de leur probabilit do :

Cas de deux vnements quelconques


Si A et B sont deux vnements quelconques, alors : P(A

B) = P(A) + P(B)

P(A B).

Exemple :
Dans lexemple du lancer dun d 6 faces, non pip, on considre lvnement A
le rsultat est pair et lvnement B le rsultat est un multiple de trois .
On a alors :
A = {2, 4, 6} et B = {3,6} donc A B = {2,3,4,6} et A B = {6}
avec P(A) = 3/6 P(B) = 2/6 P(A B) = 4/6 P(A B) = 1/6
on vrifie alors que : P(A

2.2.2.

B) = P(A) + P(B) P(A B) = 3/6 + 2/6 1/6 = 4/6

Evnement contraire

Si A est un vnement quelconque, alors


Exemple :
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 84

Statistique et Probabilit
La probabilit lors du lancer dun d non pip dobtenir plus de 2 se traduit par A
= {3,4,5,6} et A = {1,2} do P(A) = 1 P(A) = 1 2/6 = 4/6 = 2/3.

Remarque : Lapplication de cette proprit est trs utile lorsque le nombre


dvnements lmentaires de A, k, est important et que le calcul des probabilits pi
est fastidieux (cas de la loi de Poisson).

2.2.3.

Evnement impossible

On a :
P( ) = 0.

2.2.4.
Si A

Inclusion

B alors P(A) P(B)

2.3. Indpendance statistique


2.3.1.

Dfinition

Lhypothse dindpendance entre vnements et plus gnralement entre


preuves successives est un pralable lors de ltablissement des lois de
probabilits.
On dit que deux vnements A et B sont indpendants si lon a :
P(A B) = P(A) P(B)
Ainsi si A et B sont deux vnements statistiquement indpendants, la
probabilit de la ralisation conjointe de ces deux vnements est le produit de leur
probabilit respective.
Remarque : Il ne faut pas confondre vnements indpendants et vnements
incompatibles.
Supposons A et B la fois indpendants et incompatibles. On a alors :
P(A B) = P(A)P(B) indpendants
P(A B) = P( ) = 0 incompatibles
do ncessairement P(A) = 0 ou P(B) = 0.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 85

Statistique et Probabilit
Exemples :
(1) Dans lexemple du lancer dun d 6 faces, non pip, les deux vnements : A
le rsultat est pair et B le rsultat est un multiple de trois sont statistiquement
indpendants.
En effet, soit A = {2,4,6} B = {3,6} A B ={6}ainsi P(A) = 3/6 P(B) = 2/6 P(A B) =
1/6
on vrifie alors que : P(A B) = P(A) P(B) = 3/6 X 2/6 = 6/36 = 1/6
(2) Si lon considre une famille de deux enfants, les deux vnements : A enfants
de sexe diffrent et B au plus une fille ne sont pas statistiquement
indpendants.
En effet, lespace probabilis , contient 4 vnements lmentaires (si lon
considre une famille ordonne),
=A

B = {GG, GF, FG, FF}

avec A = {GF, FG}, B = {GG, GF, FG} et A B = {GF, FG}


do sous lhypothse dquiprobabilit : P(A) = 1/2, P(B) = 3/4 et P(A B) = 1/2
On vrifie alors que : P(A B) P(A) P(B) = 1/2 X 3/4 = 3/8 1/2

2.3.2.

Proprits

Les proprits associes lindpendance sont :


(1) si A est un vnement quelconque,
A et sont indpendants : A = A lment neutre
P(A ) = P(A)P() = P(A) car P() = 1
A et

sont indpendants : A =

lment absorbant

P(A ) = P(A)P( ) = P( ) car P( ) = 0


(2) si A et B sont deux vnements quelconques,
A et B sont indpendants si et seulement si A et B (A et B) ou sont
indpendants
A et B sont indpendants si et seulement si A et B le sont.
2.3.3.

Gnralisation n vnements

n vnements (n 2) , A1,A2 ,,Ai,.., An sont dit indpendants dans leur


ensemble
(ou mutuellement indpendants) si on a :
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 86

Statistique et Probabilit

Remarque

vnements

peuvent

tre

indpendants

deux

deux,

[P(Ai Aj) = P(Ai) x P(Aj)] avec i j sans tre indpendants au sens de la dfinition
ci-dessus.
Exemple :
On jette deux ds non pips et on considre les vnements suivants :
A1 le premier d donne un nombre pair
A2 le deuxime d donne un nombre pair
A3 la somme des deux lancers est paire
Le nombre dvnements lmentaires est : card ( )= 36 (voir arrangements avec rptitions avec
p = 2 et n = 6). Les 3 vnements A1, A2 et A3 sont 2 2 indpendants mais ne sont pas
indpendants dans leur ensemble. En effet :
Les probabilits associes aux 3 vnements sont :
P(A1)= 1/2 ; P(A2)=1/2 ; P(A3)=1/2
A2) = 9/36 = 1/4 = P(A1)P(A2)
P(A1
P(A1
A3) = 9/36 = 1/4 = P(A1)P(A3)
P(A2
A3) = 9/36 = 1/4 = P(A2)P(A3)
A2
A3) = 9/36 =
P(A1)P(A2)P(A3) =
P(A1
1/8.




 

Les cases grises reprsentent les


lmentaires raliss dans le cadre soit A1
A3 ou A2
A3 ou A1 A2
A3.

 

vnements
A2 ou A1

3. Probabilits conditionnelles
3.1. Dfinition
Soit deux vnements A et B dun espace probabilis avec P(B) 0, on appelle
probabilit conditionnelle de lvnement A si B (ou A sachant B), le
quotient :

On dfinit ainsi une probabilit sur au sens de la dfinition donne


prcdemment.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 87

Statistique et Probabilit
Thorme :
Soit B un vnement de probabilit non nulle, alors :

.
Remarque : La probabilit P(A) est appele la probabilit a priori et P(A / B) ou PB
(A) la probabilit a posteriori car sa ralisation dpend de la ralisation de B.
On observe les relations suivantes :
P(A / A) = 1
Si B

A, alors A B = B et donc :

3.2. Probabilits composes


Thorme :
Soit deux vnements A et B dun espace probabilis . Alors,
P(A B) = P(B / A) P(A) = P(A / B) P(B)

Formule

des

probabilits

composes.
Par symtrie, P(A B) = P(A / B) P(B) = P(B / A) P(A).
Si A et B sont deux vnements indpendants et que P(B) 0 alors ceci quivaut
affirmer que PB (A) = P(A / B) = P(A).
Lorsque deux vnements sont indpendants, le fait que lun des vnements
soit ralis, napporte aucune information sur la ralisation de lautre. Dans ce
cas la probabilit conditionnelle PB (A) (a posteriori) est gale la probabilit P(A)
(a priori).
Si A et B sont deux vnements indpendants alors ceci quivaut affirmer que :

Lorsque deux vnements sont indpendants, la probabilit conditionnelle de A


est la mme que ce soit B ou

qui est ralis.

Exemple : Dans lexemple du lancer dun d 6 faces, non pip, les deux
vnements : A le rsultat est pair et B le rsultat est un multiple de trois sont
indpendants (voir exemple).
Ainsi la probabilit que la face soit paire sachant que cest un multiple de 3 est :
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 88

Statistique et Probabilit
si
et

A = {2,4,6}
P(A)=3/6

B ={3,6} A B={6}
P(B)=2/6

P(A B)=1/6.

do :

3.3. Probabilits totales


Thorme :
Si {A1, A2,.,Ai,..,An} est un systme complet dvnements, quel que soit
lvnement
B, alors : P(B) = P(B / A1)P(A1) + P(B /A2)P(A2)+..+ P(B /An)P(An).

Exemple :
Une population animale comporte 1/3 de mles et 2/3 de femelles. Lalbinisme
frappe 6 % des mles et 0,36 % des femelles. La probabilit pour quun individu
pris au hasard (dont on ignore le sexe) soit albinos est :
Si A = {mle} et

= {femelle} constitue un systme complet dvnements

B = {albinos} et

= {non albinos}

sachant que P(B) = P(B / A)P(A ) + P(B / )P( )


alors P(B) = (0,06

1/3) + (0,0036

2/3) = 0,0224

soit 2,24% dalbinos dans cette population.

3.4. Le thorme de Bayes


Un corollaire au thorme des probabilits totales est connu sous le nom de
formule de Bayes.
Thorme :
Si {A1, A2,.,Ai,..,An} est un systme complet dvnements, et quel que soit
lvnement B tel que P(B) 0, alors :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 89

Statistique et Probabilit
Cest la Formule de Bayes.

Remarque : La formule de Bayes est utilise de faon classique pour calculer des
probabilits

de

causes

dans

des

diagnostics

(maladies,

pannes,

etc.).

Lapplication du thorme de Bayes est la base de toute une branche de la


statistique appele statistique bayesienne.
Exemple :
Dans une population pour laquelle 1 habitant sur 100 est atteint dune maladie
gntique A, on a mis au point un test de dpistage. Le rsultat du test est soit
positif (T) soit ngatif ( ).
On sait que : P(T / A) = 0,8 et P( / ) = 0,9
On soumet un patient au test. Celui-ci est positif. Quelle est la probabilit que ce
patient soit atteint de la maladie A soit PT(A) ou P(A/T) ?
et aprs le test la probabilit dtre malade est de P(A/T) = 0,075 (probabilit a
posteriori).
Ainsi le test apporte un supplment dinformation.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 90

Statistique et Probabilit
TRAVAUX DIRIGES
Exercice 1
Une entreprise possde 3 machines A, B et C. On note

(respectivement

et

lvnement n ouvriers travaillent sur la machine A (respectivement B et C) . Avec


ces notations, crivez les vnements suivants :
1. Personne ne travaille sur la machine A
2. 2 ouvriers travaillent sur A et 1 ouvrier sur B
3. 1 ouvrier travaille sur A, 1 ouvrier sur B et personne sur C
4. Moins de 3 ouvriers travaillent sur A
5. Plus de trois ouvriers travaillent sur A
6. 2 ouvriers travaillent sur A et au moins 1 ouvrier travaille sur B.

Exercice 2
On range 5 objets dans trois tiroirs discernables. En supposant que les diffrentes
faons deffectuer ces rangements soient quiprobables, calculer la probabilit que
lun des 3 tiroirs contienne au moins 3 objets.

Exercice 3
Dans une entreprise, la probabilit pour quun ouvrier A quitte lentreprise dans
lanne est 1/5 et la probabilit pour quun cadre B quitte lentreprise est 1/8. En
supposant ces 2 vnements indpendants, calculer la probabilit que :
1) A et B quittent lentreprise.
2) lun des 2 quitte lentreprise.
3) ni A, ni B ne quittent lentreprise.
4) B seulement quitte lentreprise.

Exercice 4
Dans une entreprise, lors dune runion comprenant 5 cadres, 7 employs et 15
ouvriers, on choisit au hasard successivement n personnes.
1) Si n = 2, calculer la probabilit de choisir un cadre puis un employ.
2) Si n = 3, calculer la probabilit de choisir un cadre, puis un employ, puis un
ouvrier.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 91

Statistique et Probabilit
Exercice 5
En tudiant une population, on a remarqu que, durant un mois, 40% des individus
sont alls au cinma, 25 % sont alls au thtre et 12,5% sont alls au cinma et
au thtre. Calculer la probabilit que durant un mois, un individu :
1) aille au cinma ou au thtre
2) naille pas au cinma
3) naille ni au cinma, ni au thtre
4) aille au cinma mais pas au thtre
5) sachant quil est all au cinma, aille aussi au thtre
6) sachant quil nest pas all au thtre, naille pas au cinma.

Exercice 6
Un serveur de banque de donnes a calcul en fonction de sa clientle quun
individu essayant un mot de passe au hasard est refoul 999 fois sur 1000.
Sachant que lordinateur accepte trois essais de mot de passe avant de couper la
connexion, quelle est la probabilit de se dconnecter par hasard ?

Exercice 7
Une entreprise utilise 3 machines diffrentes pour fabriquer des arbres de
transmission de mme diamtre et de mme longueur. 40% des arbres sont
fabriqus par la machine A, 30% par la machine B et 30% par la machine C. Malgr
les rglages frquents, ces machines produisent des arbres dfectueux, compte
tenu des normes de fabrication.
Machine

pourcentage de dfectueux 2%

B
4%

C
5%

On a prlev un arbre au hasard dans la production, et lon a constat quil tait


dfectueux. Quelle est la probabilit quil ait t fabriqu par :
1) la machine A ?
2) la machine C ?

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 92

Statistique et Probabilit
Exercice 8
Dans une entreprise, une machine A fabrique 40% des pices et une machine B
fabrique 60% des pices. La proportion des pices dfectueuses fabriques par A
est 3% et par B de 2%. On choisit une pice au hasard.
1) Calculer la probabilit quelle soit dfectueuse.
2) Sachant quelle est dfectueuse, calculer la probabilit quelle soit fabrique
par A.

Exercice 9
On soumet 1080 personnes un test psychotechnique not de 0 5. Les rsultats
sont consigns dans le tableau suivant, o les individus ont t classs en trois
grandes catgories suivant le secteur dactivit de leur emploi actuel.
Notes
Secteur
Industrie
Agriculture
Services

A
B
C

60 60 60 60 60 60
40 40 80 80 0
0
80 60 60 80 80 120

On choisit un individu au hasard dans la population teste.


1) Quelle est la probabilit de choisir un individu du type A et ayant la note 2 ?
2) Quelle est la probabilit de choisir un individu du type A ?
3) Quelle est la probabilit de choisir un individu ayant la note 5 ?
4) Sachant que sa note est 5, quelle est la probabilit que ce soit un individu du
type A ?
5) Sachant que sa note est strictement infrieure 2, quelle est la probabilit que
ce soit un individu du type C ?

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 93

Statistique et Probabilit
Chapitre 7 :
NOTIONS DE VARIABLES ALEATOIRES
ET DE LOI DE PROBABILITE

Dans la plupart des phnomnes alatoires, le rsultat dune preuve


peut se traduire par une grandeur mathmatique, trs souvent reprsente par
un nombre entier ou un nombre rel. La notion mathmatique qui reprsente
efficacement ce genre de situation concrte est celle de variable alatoire (note
galement v.a.). Ainsi le temps de dsintgration dun atome radioactif, le
pourcentage de rponses oui une question pose dans un sondage ou le
nombre denfants dun couple sont des exemples de variables alatoires.

Remarque : On se limitera ici au cas des variables alatoires relles (les entiers
faisant bien sr partie des rels).

Etant donn un espace probabilis despace fondamental et de mesure de


probabilit P, on appelle variable alatoire sur cet espace, toute application X
de dans

telle que :

A chaque vnement lmentaire


de correspond un nombre rel x
associ la variable alatoire X.
Comme lindique le graphe, il ny a
pas

obligatoirement

valeurs
variable

possibles

prises

alatoire

dvnements

autant
par

de
la
que

lmentaires.

La

valeur x correspond la ralisation


de la variable X

pour lvnement

lmentaire .
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 94

Statistique et Probabilit
Exemple :
Si lon considre la constitution dune fratrie de deux enfants, lespace fondamental
est constitu des vnements lmentaires suivant : = {GG, GF, FG, FF}
Les valeurs possibles prises par la variable alatoire X, nombres de fille dans la
famille sont :
X () = {0, 1, 2}.
1. Variables alatoires discrtes
1.1. Dfinition
Une variable alatoire est dite discrte si elle ne prend que des valeurs
discontinues dans un intervalle donn (born ou non born). Lensemble des
nombres entiers est discret. En rgle gnrale, toutes les variables qui rsultent
dun dnombrement ou dune numration sont de type discrtes.
1.2. Loi de probabilit
Une variable alatoire est caractrise par lensemble des valeurs quelle peut
prendre et par lexpression mathmatique de la probabilit de ces valeurs. Cette
expression sappelle la loi de probabilit (ou distribution de probabilit) de la
variable alatoire.

La loi de probabilit dune variable alatoire


discrte est entirement dtermine par les
probabilits pi des vnements {X = xi}, xi
parcourant lunivers image X(). La loi de
probabilit est donne par les (xi, pi)i.
Remarque :
-

Afin

de

simplifier

lcriture,

nous

noterons
pour la suite du cours :
P({X = xi}) quivalent P(X = xi) ou Pi

Une loi de probabilit nest tablie que si

, la somme tant tendue

toutes les indices i.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 95

Statistique et Probabilit
1.3. La fonction de rpartition
On appelle fonction de rpartition dune variable alatoire X, la fonction FX telle
que :
FX : R R
t FX (t) = P(X < t)
Concrtement la fonction de rpartition correspond la distribution des
probabilits cumules. Le plateau atteint par la fonction de rpartition
correspond la valeur de probabilit 1 car

Limportance pratique de la fonction de rpartition est quelle permet de calculer


la probabilit de tout intervalle dans R.
Les proprits associes la fonction de rpartition sont les suivantes :
Soit FX la fonction de rpartition dune variable alatoire discrte X alors :
-

(P1) t

, 0 FX (t) 1

(P2) FX est croissante sur

(P3) lim

(t) = 0 et

lim

(t) = 1
t +

(P4) Si a b alors P (a X b) = FX (b) - FX (a)

Voici pourquoi :
(P1) rsulte de la dfinition dune probabilit.
{X < b } donc P(X < a ) P(X < b ) voir inclusion

(P2) si a b, alors {X < a }

(P3) mme raison que pour P1


(P4) {X < b } = { a X b }

{X < a } ainsi FX (b) = P(a X b) + FX (a)

Exemple :
On considre lvnement lancer de 3 pices . On introduit une variable
alatoire X dfinie par X() nombre de piles de lvnement . La loi de
probabilit de X est :
Nombre P( X =
de piles
0
1/8
1
3/8
2
3/8
3
1/8

Dans le cas dune variable alatoire discrte, on

)
1/8
4/8
7/8
1

Professeur : Jol M. ZINSALO/EPAC-UAC

utilise un diagramme en btons pour visualiser


la distribution de probabilits et une fonction
en escalier pour la fonction de rpartition.

Page 96

Statistique et Probabilit

Exercice 1
Un joueur lance deux ds dont les faces sont numrotes de 1 6. On suppose que
les ds sont non-truqus et donc que pour chaque d, toutes les faces ont la mme
probabilit d'apparition.
Le joueur suivant les rgles suivantes :
- Si les deux ds donnent le mme numro alors le joueur perd 10 points
- Si les deux ds donnent deux numros de parits diffrentes (l'un est pair et
l'autre impair) alors il perd 5 points.
- Dans les autres cas il gagne 15 points.
Le joueur joue une partie et on note X la variable alatoire correspond au nombre
de points obtenus par lui.
a. Dterminez la loi de probabilit de X puis calculez l'esprance de X.
b. Reprsentez graphiquement la fonction de rpartition de X.
Solution
L'univers W est l'ensemble des rsultats possibles aprs le lancer des deux ds.
Ici, W correspond au produit cartsien {1 , 2 , 3 , 4 , 5 , 6}x{1 , 2 , 3 , 4, 5 , 6}. Son
cardinal est Card(W) = 6 = 36.
Comme on suppose qu'il y a quiprobabilit des rsultats des lancers, on a alors :
Pour tout vnement A de W,
P(A) =

Card(A)
Car(W)

a:

La variable alatoire X peut prendre les valeurs -10 , -5 , +15.


L'vnement "X = -10" est l'vnement "obtenir le mme numro".
C'est donc l'vnement A = {(1,1) , (2,2) , (3,3) , (4,4) , (5,5) , (6,6) }.
La probabilit de "X = -10" est donc :
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 97

Statistique et Probabilit
P( X = - 10 ) = 6 / 36 = 1 / 6
De mme, l'vnement "X = -5" est l'vnement "obtenir 2 numros de parits
diffrentes".
C'est donc l'ensemble des couples (a , b) tels que a soit dans {1,3,5} et b soit dans
{2,4,6} ou bien a soit dans {2,4,6} et b soit dans {1,3,5}.
La cardinal de cet vnement est donc : 3x3 + 3x3 = 18.
D'o :

P( X = - 5) = 18 /36 = 1/2.

Comme S P(X = k) = 1 , on en dduit que P(X = 15) = 1 - P(X=-10) - P(X=-5).


D'o :

P(X = 15) = 1 - 1/6 - 1/2 = 1/3

On rsume cela sous la forme d'un tableau :


X=k

-10

-5

15

P(X = k)

b : La fonction de rpartition de X est la fonction F dfinie sur IR par :


Pour tout x rel, F(x) = P( X < x ).
D'aprs le tableau de la loi de probabilit de X, on en dduit que :
Si x < -10 alors F(x) = 0.
Si -10 < x < -5 alors F(x) = 1/6
Si -5 < x < 15 alors F(x) = 1/6 + 1/2 = 2/3 .
Si x > 15 alors F(x) = 1/6 + 1/2 + 1/3 = 1 .
D'o la courbe de la fonction de rpartition de X.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 98

Statistique et Probabilit
Exercice 2
Lors dune enqute, on a interrog 5 hommes et 3 femmes. On choisit au hasard et
sans remise les personnes une une jusqu obtention dun homme. Soit X le
nombre de tirages ncessaires. Dterminer les valeurs de X et sa loi de probabilit.

Exercice 3
Soit X la variable alatoire dfinie par le tableau suivant :
1

0,25

Dterminer la valeur de

et

0,18

5
0,37

sachant que les vnements X=2 et X = 4 sont

quiprobables.

2. Variables alatoires continues


2.1. Dfinition
Une variable alatoire est dite continue si elle peut prendre toutes les valeurs
dans un intervalle donn (born ou non born). En rgle gnrale, toutes les
variables qui rsultent dune mesure sont de type continu.
2.2. Fonction densit de probabilit
Dans le cas dune variable alatoire continue, la loi de probabilit associe une
probabilit chaque ensemble de valeurs dfinies dans un intervalle donn. En
effet, pour une variable alatoire continue, la probabilit associe lvnement
{X = a} est nulle, car il est impossible dobserver exactement cette valeur.
On considre alors la probabilit que la variable alatoire X prenne des valeurs
comprises dans un intervalle [a,b] tel que P(a X b).
Lorsque cet intervalle tend vers 0, la valeur prise par X tend alors vers une
fonction que lon appelle fonction densit de probabilit ou densit de
probabilit.
On appelle densit de probabilit toute application continue par morceaux :

telle que :

(P1)

f (x) 0

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 99

Statistique et Probabilit

(P2)

(en supposant que

Soit une fonction densit


probabilit
(1)

laire

de

f(x) :
hachure

en

vert

correspond la probabilit P(X < 10)


(2)

laire

hachure

en

bleu

correspond la probabilit P(+10


<X < +15).

Remarque : Cette fonction densit de probabilit est une loi de probabilit car
laire sous la courbe est gale 1 pour toutes les valeurs de x dfinies.
Rciproquement :
Une variable alatoire X dfinie sur un univers est dite absolument continue,
sil existe une fonction densit de probabilit telle que :

(voir graphe ci-dessus).

2.3. Fonction de rpartition


Si comme pour les variables alatoires discrtes, on dfinit la fonction de
rpartition de X par :

alors la relation entre la fonction de rpartition FX et la fonction densit de


probabilit f(x) est la suivante :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 100

Statistique et Probabilit
est la primitive (voir cours danalyse) de la

La fonction de rpartition

fonction densit de probabilit f (x), et permet dobtenir les probabilits associes


la variable alatoire X, en effet :
Soit X une variable alatoire absolument continue de densit f et de fonction
de rpartition FX ,
(P1)

P(a X b) =

(P2)

alors :
(b) -

(a) =

avec a < b

P(x = a) = 0 si f est continue droite du point a.

Voici pourquoi :
(P1 ) P(a X b) = P(X < b) - P(X < a) = FX (b) - FX (a) do :

(P2) Si f est continue sur un intervalle de la forme [a, a+h] avec h 0+ alors,

(thorme des accroissements finis).


Ainsi lorsque h 0+ :

f (a+h) f(a) et

h f (a+h) 0

do : P(a X a+h) P(X = a) = 0


Remarque : La proprit P2 implique que P(X t) = P(X < t).
La fonction de rpartition correspond aux probabilits cumules associes la
variable alatoire continue sur lintervalle dtude (graphe ci-dessous).

Fonction densit de probabilit f(x)


Professeur : Jol M. ZINSALO/EPAC-UAC

Page 101

Statistique et Probabilit

Fonction de rpartition FX

Laire hachure en vert sous la courbe de la fonction densit de probabilit


correspond la probabilit P(X < a) et vaut 0,5 car ceci correspond exactement
la moiti de laire totale sous la courbe. Cette probabilit correspond la valeur
de la fonction de rpartition au point dinflexion de la courbe (voir cours
analyse).

Les proprits associes la fonction de rpartition sont les suivantes :


Soit FX la fonction de rpartition dune variable alatoire absolument continue X
alors :
(P1) FX est continue sur

, drivable en tout point o est continue et alors FX = f

(P2) FX est croissante sur


(P3)

FX est valeurs dans [0,1]

(P4)

lim F (t) = 0
X

et

lim F (t) =1
X

t +

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 102

Statistique et Probabilit
Exercice 1
On considre la fonction f de

dans

dfinie par :

Dterminer le rel k pour que f puisse tre considre comme

la densit de

probabilit dune certaine variable alatoire continue X et dterminer la fonction de


rpartition F associe.

Exercice 2
Soit une variable alatoire continue dont la fonction de rpartition F est dfinie
par :

Dterminer une densit de probabilit convenable pour X et la reprsenter


graphiquement.

3. Esprance et Variance
Une loi de probabilit peut tre caractrise par certaines valeurs typiques
correspondant aux notions de valeur centrale, de dispersion et de forme de
distribution.
3.1.

Esprance mathmatique

Lesprance dune variable alatoire E(X) correspond la moyenne des valeurs


possibles de X pondres par les probabilits associes ces valeurs. Cest un
paramtre de position qui correspond au moment dordre 1 de la variable
alatoire X. Cest lquivalent de la moyenne arithmtique
nombre dpreuves n est grand,

3.1.1.

. En effet lorsque le

tend vers E(X) (voir estimation).

Variables alatoires discrtes

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 103

Statistique et Probabilit
Si X est une variable alatoire discrte dfinie sur un univers probabilis , on
appelle esprance de X, le rel dfini par :

Remarque : Si X() est infini, on nest pas sr que lesprance existe.


Lesprance mathmatique est galement note (X), X ou encore si aucune
confusion nest craindre.
Nous pouvons donner une autre dfinition de lesprance dune variable
alatoire discrte X si , on associe limage x telle que X() = x.

Thorme :
Si X est une variable alatoire discrte de loi de probabilit (xi, pi)i dfinit sur un
nombre fini (n) dvnements lmentaires alors :

Exercice
Soit X la variable alatoire dfinie par le tableau ci-contre :
-2

-1

1/8 1/4 1/5 1/8 3/10


Calculer lesprance mathmatique de X.

3.1.2.

Variables alatoires continues

Si X est une variable alatoire absolument continue de densit , on appelle


esprance de X, le rel E(X) , dfini par :

si cette intgrale est convergente.


3.1.3.

Proprits de lesprance

Les proprits de lesprance valent aussi bien pour une variable alatoire
discrte ou une variable alatoire absolument continue.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 104

Statistique et Probabilit
Si X et Y sont deux variables alatoires dfinies sur un mme univers ,
admettant une esprance, alors :
(P1)

E(X+Y) = E(X)+E(Y)

(P2)

E(aX) = aE(X) a

(P3)

Si X 0 alors E(X) 0

(P4)

Si X est un caractre constant tel que :

X () = k alors E(X) = k.

Remarque : Dans le cas continu,

La proprit P1 est vrifie quelques soient les relations de dpendance ou


dindpendance statistique entre les deux variables.
Voici pourquoi :
Nous dmontrerons les proprits dans le cas de deux variables alatoires
discrtes avec pi , la probabilit de ralisation de {X = xi} et {Y = yi} et n
vnements lmentaires.

(P3) X

0 implique que

et comme une probabilit est toujours

positive, E(X) 0.

Nous verrons les applications directes de ces proprits dans le cadre des
oprations sur les variables alatoires.

3.2. Variance
La variance dune variable alatoire V(X) est lesprance mathmatique du carr
de lcart lesprance mathmatique. Cest un paramtre de dispersion qui
correspond au moment centr dordre 2 de la variable alatoire X. Cest

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 105

Statistique et Probabilit
lquivalent de la variance observe S2. En effet lorsque le nombre dpreuves n
est grand, S2 tend vers V(X) (voir estimation).
Si X est une variable alatoire ayant une esprance E(X), on appelle variance de
X le rel :
V(X) = E([X - E(X)]2)
Autre notation :

V(X) = E([X - E(X)]2)


V(X) = E(X2 2XE(X) +E(X)2)
V(X) = E(X2) 2E[XE(X)] +E[E(X)2]

Proprits

P1

de

Proprits

P4

lesprance
V(X) = E(X2) 2E(X)2 + E(X)2 = E(X2) E(X)2
de lesprance

Remarque : Si X() est infini, il nest nullement vident que V(X) existe. De plus
comme :
[X E(X)]2 0 ncessairement V(X) 0. Par dfinition, une variance est toujours
positive.
La variance est galement note 2 si aucune confusion nest craindre.
Si X est une variable alatoire ayant une variance V(X), on appelle cart-type de
X, le rel :

Remarque : Lcart-type permet de disposer dun paramtre de dispersion qui


sexprime dans les mmes units que la variable alatoire elle-mme.
Le terme cart-type se traduit en anglais par le faux-ami standard deviation .

3.2.1.

Variables alatoires discrtes

Si X est une variable alatoire discrte de loi de probabilit (xi, pi)i dfinie sur un
nombre fini (n) dvnements lmentaires alors la variance est gale :

3.2.2.

Variables alatoires continues

Si X est une variable alatoire continue donne par sa densit de probabilit


alors la variance de X est le nombre rel positif tel que :
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 106

Statistique et Probabilit

3.2.3.

Proprits de la variance

Si X est une variable alatoire admettant une variance alors :


(P1)

(P2)

(a, b)

(P3)

V (X) = 0

V (aX) = a2 V (X)

,
,

V (aX + b) = a2 V (X)
X = E(X)

Il est possible dexprimer la variance en fonction du moment dordre 1 (m1) et du


moment dordre 2 (m2). La variance correspond au moment centr dordre 2.
V(X) = E([X - E(X)]2) = E(X2) E(X)2
do :

NB :
Calcul des moments dordre k (k

Variable alatoire finie


On appelle moment dordre k la valeur

suivante :

Variable alatoire dnombrable


On appelle moment dordre k la valeur

suivante :

Calcul des moments centrs dordre k (k

On appelle variable alatoire centre X la variable alatoire dfinie par :

Le moment centr dordre k de la variable alatoire X,


dordre k de la variable centre

est gal au moment

Pour une variable alatoire finie, on a :

Pour une variable alatoire dnombrable, on a :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 107

Statistique et Probabilit

Par convention on a :

4. Couples de variables alatoires


4.1. Loi jointe
Les dfinitions portant sur la loi jointe entre deux variables alatoires X et Y
impliquent que ces dernires soient dfinies sur le mme espace fondamental
. Si X et Y sont dfinies respectivement sur les espaces fondamentaux 1 et 2,
alors il faut envisager un espace qui englobe 1 et 2 appel espace-produit .
Il suffit alors de connatre la loi jointe des deux variables alatoires ou loi de
probabilit du couple (X,Y),la fonction dfinie par :
x,y pxy = P ((X = x) et (Y = y)) dans le cas discret
Dans le cas continu, pxy = P ((xa < X < xb ) et (yc < Y < yd)) permet de dfinir la
probabilit pour que (X,Y) soit dans un rectangle.
Remarque : Ceci peut tre gnralis un nombre quelconque de variables
alatoires.
Exemple :
On place au hasard deux billes rouge et verte dans deux boites A et B. On note X,
la variable alatoire nombre de billes dans la boite A et Y, la variable alatoire
nombre de boites vides .

Les distributions de probabilits associes chacune des variables X et Y ainsi


que celle de la loi jointe sont indiques ci-dessous. Pour chaque loi, la valeur de
lesprance et de la variance est galement indique.
Variable X : X() = {0,1,2}
E(X) = 1 V(X) = 1/2
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 108

Statistique et Probabilit
Variable Y : Y() = {0,1} E(Y) = 1/2 V(Y) =

Variable XY : XY() = {0,1,2}


E(XY) = 1/2 V(XY) = 3/4

4.2.

Indpendance entre variables alatoires

Les proprits concernant lindpendance statistique entre deux variables


alatoires

sappliquent

aussi

bien

aux

variables

alatoires

discrtes

ou

absolument continues.
Thorme :
Si X et Y sont deux variables alatoires indpendantes dfinies sur le mme
univers alors :

Remarque : Lapplication rciproque nest pas vraie. La relation E(XY) = E(X)E(Y)


nimplique pas forcment lindpendance de deux variables alatoires.

Exemple :
Dans lexemple concernant la rpartition des deux billes dans les 2 boites, la
relation
E(XY) = E(X)E(Y) est vrifie car : E(X) = 1 ; E(Y) = 1/2 et E(XY) = cependant les
variables alatoires X et Y ne sont pas indpendantes.

En effet

= P ((X = 0) (Y = 0)) = 0 car il est impossible davoir la fois aucune

bille dans la boite A et aucune boite vide. Or on attend si X et Y sont deux


variables statistiquement indpendantes, ce que P ((X = 0) (Y = 0)) = P(X =
0)P(Y = 0) = 1/4*1/2 = 1/8 0
Thorme :
Si X et Y sont deux variables alatoires indpendantes dfinies sur le mme
univers alors

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 109

Statistique et Probabilit
Remarque : Lapplication rciproque nest pas vraie. La relation V(X + Y) = V(X) +
V(Y) nimplique pas forcment lindpendance de deux variables.
Exemple :
Si lon reprend lexemple de la rpartition de deux billes dans deux boites, la
distribution de probabilit de la variable alatoire (X+Y) est :
Variable X+Y : X+Y()={0,1,2,3}
E(X+Y)=3/2 V(X+Y)=3/4
Comme V(X) = 1/2 et V(Y) = 1/4 alors
V(X) + V(Y) = 3/4 = V(X+Y) On retrouve ainsi la relation V(X + Y) = V(X) + V(Y) bien
que X et Y ne soient pas indpendantes.

4.3. Covariance et Corrlation


Lorsque lon considre deux variables alatoires simultanment, il faut dfinir un
indicateur de leur

liaison qui complte les paramtres qui les caractrisent

chacune sparment (esprance athmatique et variance).


Si X et Y sont deux variables alatoires dfinies sur le mme univers , on appelle
covariance de ces deux variables, le rel :

et coefficient de corrlation, le rel :

Il rsulte de cette dfinition, le thorme suivant :


Thorme :
Si X et Y sont deux variables alatoires dfinies sur le mme univers et
indpendantes, alors :

Les proprits de la covariance sont les suivantes :


Si X et Y sont deux variables alatoires dfinies sur un mme univers , alors :
(P1) (a,b)

V(aX + bY) = a2V(X) + 2abcov(X,Y) + b2V(Y) }

(P2) [cov(X,Y)]2 V(X) V(Y)

(P3)
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 110

Statistique et Probabilit
Remarque : Si X et Y sont indpendantes, = 0 mais la rciproque est fausse. Il
peut arriver, par hasard, que = 0 sans que X et Y soient indpendantes.

4.4. Oprations sur les variables alatoires


Il arrive souvent que lon effectue des transformations sur les variables
alatoires par commodit de calcul et il est important de savoir comment se
comportent les paramtres associs cette variable.
Nous avons rsum dans le tableau ci-dessous quelques transformations
possibles avec a et b

Il existe dautres transformations de variables alatoires qui conduisent des


valeurs de paramtres particulires.
Une variable alatoire X est dite centre si E(X) = 0.
Exemple :
La variable Y = X E(X) est une variable alatoire centre car :
E(Y) = E[X E(X)] = E(X ) E(E(X))
or E(E(X)) = E(X ) voir proprits P4 de lesprance
ainsi E(Y) = E(X ) E(X) = 0.
Une variable alatoire admettant une variance est dite rduite si V(X) = 1.
Exemple :
La variable

est une variable alatoire rduite car

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 111

Statistique et Probabilit

A toute variable alatoire X desprance E(X) et de variance V(X) on peut associer


la variable alatoire

dite variable alatoire centre rduite et dont lemploi est indispensable pour
utiliser la plupart des tables notamment les tables de la loi normale rduite.

4.5. Gnralisation n variables alatoires


Si lon considre une preuve laquelle est associe un espace fondamental et
une variable alatoire X et si lon rpte n fois, de faon indpendante cette
preuve, on obtient une suite X1, X2,. Xn variables alatoires qui sont :
-

dfinies sur le mme espace fondamental

de mme loi de probabilit

indpendantes

alors :

(Proprit P1 de lesprance que les v.a. soient indpendantes ou non ).

(Proprit de la variance dans le cas dindpendance des v.a.).

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 112

Statistique et Probabilit
EXERCICE 1
Dans une ville, une banque met en place 5 guichets automatiques, dans 5 quartiers
diffrents : 3 guichets du type carton rouge et 2 guichets du type carte verte . la
probabilit quun guichet du type carton rouge soit hors service pendant un week
end est 0,1, et la probabilit quun guichet du type carte verte durant un week
end est 0,2. Soit X le nombre de guichets carte rouge hors service et Y le nombre
de guichets carte verte hors service, durant un week end.
1. Donner la loi du couple.
2. Calculer la probabilit quun client possdant une carte rouge puisse se servir
un guichet automatique, un week end.
3. Un client possde une carte rouge et une carte verte. Calculer la probabilit quil
puisse se servir un guichet automatique, sachant tous les guichets carte verte
sont hors service.
4. Calculer E(X) et E(Y).
5. Calculer cov(X,Y).
6. Calculer

et

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 113

Statistique et Probabilit
Chapitre 8 :
LOIS DE DISTRIBUTIONS STATISTIQUES

Il est toujours possible dassocier une variable alatoire une probabilit et


dfinir ainsi une loi de probabilit. Lorsque le nombre dpreuves augmente
indfiniment, les frquences observes pour le phnomne tudi tendent vers
les probabilits et les distributions observes vers les distributions de probabilit
ou loi de probabilit. Identifier la loi de probabilit suivie par une variable
alatoire donne est essentiel car cela conditionne le choix des mthodes
employes pour rpondre une question donne.

1. Lois discrtes
Par dfinition, les variables alatoires discrtes prennent des valeurs entires
discontinues sur un intervalle donn. Ce sont gnralement le rsultat de
dnombrement.
1.1. Loi uniforme
1.1.1. Dfinition
Une distribution de probabilit suit une loi uniforme lorsque toutes les valeurs
prises par la variable alatoire sont quiprobables. Si n est le nombre de valeurs
diffrentes prises par la variable alatoire,
Exemple :
La distribution des chiffres obtenus au lancer de d (si ce dernier est non pip)
suit une loi uniforme dont la loi de probabilit est la suivante :

avec pour esprance :

et pour variance

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 114

Statistique et Probabilit

o les valeurs xi correspondent au rang i de la variable X dans la srie.

1.1.2. Esprance et variance


Dans le cas particulier dune loi discrte uniforme o les valeurs de la variable
alatoire X correspondent au rang xi = i ( i

[1, n]) :

1.2. Loi de Bernoulli


1.2.1. Dfinition
Soit un univers constitu de deux ventualits, S pour succs et E pour chec
= {E, S} sur lequel on construit une variable alatoire discrte, nombre de
succs telle que au cours dune preuve, si S est ralis, X = 1 si E est ralis, X
= 0.
On appelle variable de Bernoulli ou variable indicatrice, la variable alatoire X
telle que :

La loi de probabilit associe la variable de Bernoulli X telle que,


P(X = 0) = q
P(X =1) = p avec p+q = 1
est appele loi de Bernoulli note B(1, p)
Esprance et variance
Lesprance de la variable de Bernoulli est :

La variance de la variable de Bernoulli est :

E(X) = p car par dfinition

V(X) = pq

car par

dfinition

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 115

Statistique et Probabilit
do V(X) = p p2 = p (1 p) = pq

1.3. Loi binomiale


1.3.1. Dfinition
Dcrite pour la premire fois par Isaac Newton en 1676 et dmontre pour la
premire fois par le mathmaticien suisse Jacob Bernoulli en 1713, la loi
binomiale est lune des distributions de probabilit les plus frquemment
rencontres en statistique applique.
Soit lapplication : Sn :
avec :

Sn = X1 + X2 ++ Xi + ...+ Xn o Xi est une variable de Bernoulli

La variable binomiale, Sn , reprsente le nombre de succs obtenus lors de la


rptition de n preuves identiques et indpendantes, chaque preuve ne
pouvant donner que deux rsultats possibles.
Ainsi la loi de probabilit suivie par la somme de n variables de Bernoulli o la
probabilit associe au succs est p, est la loi binomiale de paramtres n et p.
Sn :

La probabilit que Sn = k, cest dire lobtention de k succs au cours de n


preuves indpendantes est :

Il est facile de dmontrer que lon a bien une loi de probabilit car :

Remarque : Le dveloppement du binme de Newton (p+q)n permet dobtenir


lensemble des probabilits pour une distribution binomiale avec une valeur n et
p donne. Il existe galement des tables de la loi binomiale o les probabilits
sont tabules pour des valeurs n et p donnes.
Autre manire de percevoir la loi binomiale
Lhypothse fondamentale de la loi binomiale consiste ne pas modifier la
composition du lot N. celle-ci implique un tirage avec remise ou tirage dit non
exhaustif. On assimile le tirage dun chantillon de taille n sans remise un
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 116

Statistique et Probabilit
tirage non exhaustif si :

. En supposant que lon ait p % de pices

dfectueuses dans un lot et que lon tire un chantillon non exhaustif de taille
n, la loi binomiale donne la probabilit davoir k lments dfectueux dans
lchantillon, on peut crire :

1.3.2. Esprance et variance


Lesprance dune variable binomiale Sn est gale : E(Sn) = np
en effet E(Sn) = E(X1 + X2 ++ Xi + ...+ Xn )
or

et

do E(Sn) = np.
La variance dune variable binomiale Sn est gale :

V(Sn) = npq

en effet V(Sn) = V(X1 + X2 ++ Xi + ...+ Xn ).


or
et

do V(Sn) = npq.

1.3.3. Symtrie et rcurrence de la loi binomiale


La loi binomiale dpend des deux paramtres n et p. Elle est symtrique pour p =
0,5 et dissymtrique pour les autres valeurs de p. La dissymtrie est dautant
plus forte :
(1) pour n fixe, que p est diffrent de q
(2) pour p fixe que n est plus petit.
Afin de faciliter les calculs des probabilits, il est possible dutiliser une formule
de rcurrence donnant les valeurs des probabilits successives :
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 117

Statistique et Probabilit

1.3.4. Stabilit de la loi binomiale


Thorme :
Si Sn et Sm sont deux variables indpendantes suivant des lois binomiales
respectivement
Sn B(n,p) et Sm B(m,p) alors Sn + Sm B(n+m,p)

Exercice
Pour raliser le montage dun systme lectronique, on dispose de rsistances
issues dune production importante, o lon sait que le pourcentage p de
dfectueuses est de 5%. On doit utiliser 4 rsistances.
a) Quelle est la probabilit den avoir 3 de mauvaises ?
b) Quelle est la probabilit den avoir un nombre infrieur ou gal 3 de
mauvaises ?

1.4. Loi gomtrique


Lorsque le nombre de succs n est gal 1, la loi de la variable alatoire discrte
X porte le nom de loi de Pascal ou loi gomtrique de paramtre p telle que :

Exercice 1
Pour accder un guichet automatique, il faut utiliser une carte magntique et un
code confidentiel. Un client tapant un code au hasard est refus 999 fois sur 1000.
Soit X le nombre dessais ncessaires pour accder au guichet.
a) Quelle est la loi de probabilit de X ?
b) Calculer P(X =1).
c) Sachant quau bout de trois essais infructueux, la carte est confisque,
calculer la probabilit daccder au guichet par hasard.
d) Combien faut il dessais en moyenne pour accder au guichet par hasard ?

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 118

Statistique et Probabilit
1.5.

Loi hypergomtrique

Si lon ne peut pas faire lhypothse dun tirage avec remise donc faire lhypothse
dun tirage sans remise dit tirage exhaustif et dans ce cas :

, la loi

binomiale nest pas applicable. En effet, il y a modification de la composition du lot


chaque tirage ; dans ce cas il faut tenir compte des paramtres suivants :
N : taille du lot

n : taille de lchantillon

p : proportion de dfectueux dans le

lot initial
K : nombre dlments dfectueux dans le lot gal N . p
k : nombre dlments dfectueux auxquels on sattend dans lchantillon.
La probabilit davoir k dfectueux est :

Lesprance mathmatique est n . p et la variance est donne par la relation :

Exemple :
Dans un lot de 25 pices dont 5 sont mauvaises, quelle est la probabilit den tirer
3 de dfectueuses pour un chantillon de 5 ?

Rponse :

Exercice 1
Dans une PME, sont employs 6 ouvriers et 5 employs. Le PDG, souhaitant
prendre lavis de son personnel, interroge 7 personnes choisies au hasard parmi
ces 11 personnes. Soit X la variable alatoire : nombre douvriers interrogs .
a) Quelles sont les valeurs prises par X ?
b) Quelle est sa loi de probabilit ?
c) Calculer la probabilit dinterroger 4 ouvriers.

1.6. Loi de Poisson


1.6.1. Dfinition

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 119

Statistique et Probabilit
On appelle processus poissonnien (ou processus de Poisson), le modle
probabiliste des situations qui voient un flux dvnements se produire les uns
la suite des autres de faon alatoire (dans le temps et dans lespace), obissant
aux conditions suivantes :
-

la probabilit de ralisation de lvnement au cours dune petite priode ou


sur une petite portion despace t est proportionnelle t soit pt .

elle est indpendante de ce qui sest produit antrieurement ou ct,

la probabilit de deux apparitions sur le mme t est ngligeable.

Ainsi, des vnements qui se ralisent de faon alatoire comme des pannes de
machines, des accidents davions, des fautes dans un texte, peuvent tre
considrs comme relevant dun processus poissonnien.
Une variable alatoire X valeurs dans R suit une loi de Poisson de paramtre
( > 0) si les rels pk sont donns par :

on note : X P().
Remarque : Une loi de Poisson est donne par sa loi de probabilit :
(1) k, P(X = k) > 0
(2) On a :

Or :

do :

Comme pour la loi binomiale, il est possible dutiliser une formule de rcurrence
pour calculer les valeurs des probabilits successives :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 120

Statistique et Probabilit
1.6.2. Esprance et variance
Lesprance dune variable alatoire de Poisson est E(X) =
Par dfinition :

avec k

N valeurs prises par la v.a. X.

avec :

do

La variance dune variable de Poisson est :

Remarque : Il est noter que dans le cas dune variable alatoire de Poisson,
lesprance et la variance prennent la mme valeur. Ceci est un lment
prendre en compte lors des tests de conformit une loi de probabilit.

1.6.3. Stabilit de la loi de Poisson


Si X et Y sont deux variables alatoires indpendantes suivant des lois de
Poisson respectivement
X P () et Y P () alors X + Y P (+).

Exercice 1
Le nombre de micro-ordinateurs vendus chaque jour dans un magasin sui une loi
de Poisson de paramtre 4. Calculer la probabilit que dans une journe :
a) on ne vende aucun micro-ordinateur,
b) on vende 4 micro-ordinateurs,
c) on vende au moins un micro-ordinateur,
d) le nombre de micro-ordinateurs vendus soit compris (au sens large) entre 2 et
6.

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 121

Statistique et Probabilit
1.7. Loi binomiale ngative
1.7.1. Dfinition
Sous le schma de Bernoulli (preuves identiques et indpendantes), on dsire
obtenir n succs et lon considre la variable alatoire discrte X qui reprsente
le nombre dpreuves indpendantes k ncessaire lobtention des n succs.
X suit une loi binomiale ngative de paramtres n et p note BN (n,p) si :

avec k, n

N et k n.

Remarque :
Dans le cas de la loi binomiale ngative, le nombre de succs n est connu et lon
cherche le nombre dpreuves k, ncessaire pour obtenir les n succs. Ainsi le
dernier vnement est connu car les preuves cessent avec lobtention du nieme
succs et lon choisit n-1 objets parmi k-1.
Exemple :
Pour tudier le domaine vital dune population de poissons, des metteurs radio
sont fixs au niveau de la nageoire dorsale aprs une lgre anesthsie locale.
Suite divers alas, on considre que 30 % des poissons quips ne sont pas
reprs par la suite. Si lon considre quun minimum de 15 poissons doivent tre
suivis pour avoir des rsultats statistiquement acceptables, la variable alatoire X
nombre de poissons devant tre quips suit une loi binomiale ngative X BN
(15, 0,70). En posant comme hypothse que les causes de pertes de liaisons radio
soient suffisamment nombreuses pour assurer lindpendance entre chaque
preuve, la probabilit dtre oblig dquiper 20 poissons est de :

Lesprance associe une loi binomiale ngative est :

La variance associe une loi binomiale ngative est :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 122

Statistique et Probabilit
Problme sur lois discrtes
Problme
Dans une entreprise, on a mis au point le systme de test suivant pour vrifier la
qualit des produits. On teste 10 produits ensemble :
-

si le test est positif, on accepte tous les produits ;

si le test est ngatif, on teste nouveau chaque produit individuellement.

On sait que la probabilit pour quun ensemble de 10 produits soit accept est gale
0,9. On teste 50 produits par groupes. Soit X le nombre total de tests.
1) Quelles sont les valeurs prises par X ?
2) Donner la loi de probabilit de X.
3) Calculer lesprance et lcart type de X.
4) Comparer ces rsultats avec ceux obtenus si chaque produit est test
individuellement. Quelle mthode vous semble la plus intressante ?

2. Lois continues
Par dfinition, les variables alatoires continues prennent des valeurs continues
sur un intervalle donn.
2.1. Loi uniforme
La loi uniforme est la loi exacte de phnomnes continus uniformment rpartis
sur un intervalle. La variable alatoire X suit une loi uniforme sur le segment
[a,b] avec a < b si sa densit de probabilit est donne par :

Fonction de densit de probabilit

Professeur : Jol M. ZINSALO/EPAC-UAC

Fonction de rpartition

Page 123

Statistique et Probabilit
Quelques commentaires :
(1) La loi uniforme continue tant une loi de probabilit, laire hachure en
rouge sur la figure ci-dessus vaut 1. Ceci implique que la valeur prise par f(x)
vaut

(2) La probabilit que X

[a,b] avec a < b et a,b

[a,b] vaut :

(3) La fonction de rpartition associe la loi uniforme continue est telle que :
FX (x) = 0 si x < a
FX (x) = 1 si x > b

Lesprance de la loi uniforme continue vaut :

En effet par dfinition

Or

par dfinition de la loi uniforme continue do

La variance de la loi uniforme continue vaut :

En effet par dfinition :


Professeur : Jol M. ZINSALO/EPAC-UAC

Page 124

Statistique et Probabilit

2.2. Loi normale ou loi de Laplace-Gauss


2.2.1. Dfinition
On parle de loi normale lorsque lon a affaire une variable alatoire continue
dpendant dun grand nombre de causes indpendantes dont les effets
sadditionnent et dont aucune nest prpondrante (conditions de Borel). Cette loi
acquiert sa forme dfinitive avec Gauss (en 1809) et Laplace (en 1812). Cest
pourquoi elle porte galement les noms de : loi de Laplace, loi de Gauss et loi
de Laplace-Gauss.
Exemple

Ainsi

la

taille

corporelle

dun

animal

dpend

des

facteurs

environnementaux (disponibilit pour la nourriture, climat, prdation, etc.) et


gntiques. Dans la mesure o ces facteurs sont indpendants et quaucun nest
prpondrant, on peut supposer que la taille corporelle suit une loi normale.
Une variable alatoire absolument continue X suit une loi normale de
paramtres ( , ) si sa densit de probabilit est donne par :

avec

R et

Notation :

R+

X ( , )

Remarque : On admet dans la mesure o lintgration analytique est impossible


que :

Remarque : Le paramtre reprsente laxe de symtrie et le degr


daplatissement de la courbe de la loi normale dont la forme est celle dune
courbe en cloche.
Lesprance de la loi normale vaut : E(X) =
La variance de la loi normale vaut : V(X) = 2
Professeur : Jol M. ZINSALO/EPAC-UAC

Page 125

Statistique et Probabilit
Thorme : Stabilit de la loi normale
Soient X1 et X2 deux variables alatoires normales indpendantes de paramtres
respectifs (1, 1) , (2, 2), alors leur somme X1+X2 est une variable alatoire
normale de paramtres (1 + 2,

).

Ce thorme se gnralise immdiatement la somme de n variables alatoires


normales indpendantes.
2.2.2. Loi normale rduite
Une variable alatoire continue X suit une loi normale rduite si sa densit de
probabilit est donne par :

Remarque : f est bien une loi de probabilit car :

x R,

f(x) 0

f est intgrable sur ]-, + [ et

Lesprance dune loi normale rduite est : E(X) = 0. La variance dune loi
normale rduite est : V(X) = 1

2.2.3. Relation avec la loi normale


Si X suit une loi normale N (,), alors :

une variable centre rduite suit une la loi normale rduite N (0,1).

2.2.4. Calcul des probabilits dune loi normale


La fonction de rpartition de la loi normale rduite permet dobtenir les
probabilits associes

toutes variables alatoires normales N (,) aprs

transformation en variable centre rduite.


On appelle fonction , la fonction de rpartition dune variable normale rduite
X telle que :

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 126

Statistique et Probabilit
Les proprits associes la fonction de rpartition sont :
(P1) est croissante, continue et drivable sur R et vrifie :
lim (t) = 1
t +
et
lim (t) = 0
t
(P2)

(t) + (-t) = 1 t

(t) - (-t) = 2(t) - 1

Une application directe de la fonction

est la lecture des probabilits sur la

table de la loi normale rduite.

Exercice 1
Les dpts mensuels dans une agence bancaire suivent une loi normale de
moyenne 600 000F et dcart type 10 000F. Calculer la probabilit pour que les
dpts dun mois soient :
a) infrieurs 600 000F ;
b) infrieurs 620 000F ;
c) compris entre 590 000F et 610 000F ;
d) compris entre 560 000F et 620 000F.

2.2.5. Approximations

Approximation de la loi binomiale par la loi normale

Pour n trs grand, p pas trop proche de 0 ou 1, et

, la loi normale constitue

une bonne approximationde la loi binomiale.


C'est--dire que, pour les calculs de probabilit, on peut remplacer la loi binomiale
de paramtre (n, p) par la loi normale de paramtre

Approximation de la loi de Poisson par la loi normale

Pour

, la loi normale constitue une bonne approximation de la loi de Poisson.

C'est--dire que, pour les calculs de probabilit, on peut remplacer la loi de Poisson
de paramtre

par la loi normale de paramtre

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 127

Statistique et Probabilit
Exercice 1
Une usine fabrique des vis dont 3% ont des dfauts.
a) On prlve 1000 vis au hasard ; quelle est la probabilit davoir 50 vis
dfectueuses ? davoir entre 20 et 40 vis dfectueuses ?
b) On veut 1950 vis sans dfaut. Par prudence, on en prlve 2000 au hasard.
Quelle est la probabilit davoir suffisamment de vis en bon tat ?
Exercice 2
Le nombre de pannes, par mois, sur une certaine machine, suit une loi de Poisson
de moyenne 3. Un atelier fonctionne avec 12 machines de ce type, indpendantes.
En un mois, quelle est la probabilit de constater dans cet atelier plus de 42
pannes ? entre 36 et 45 pannes ?

3. Le thorme central limite


Appel galement thorme de la limite centrale, il fut tabli par Liapounoff et
Lindeberg. On se place dans une situation dpreuves rptes, caractrises
par une suite X1, X2, X3, , Xi,, Xn de n variables alatoires indpendantes et de
mme loi (esprance E(Xi) = et variance V (Xi) = 2. On dfinit ainsi deux
nouvelles variables alatoires :
la somme Sn = X1 + X2 ++ Xi + ...+ Xn
la moyenne :

telles que :
E(Sn ) = n
V(Sn ) = n2

E(Mn ) =

Professeur : Jol M. ZINSALO/EPAC-UAC

Page 128

You might also like