Professional Documents
Culture Documents
STATISTIQUE ET PROBABILITE
Statistique et Probabilit
Objectifs
Fournir ltudiant les connaissances de base des outils statistiques et de
probabilit et linitier lexploitation de celles-ci dans les prises de dcision.
CONTENU DU COURS
Chapitre 1 : Terminologie et concepts de base en mthodes statistiques
Chapitre 2 : Traitement des donnes dune srie statistique
Chapitre
Bibliographie
1. Exercices corrigs de statistique descriptive : avec rappels de cours, Grais ,
Bernard, Nouv. d., Paris : Dunod , 1991, 234 pages
2. Statistique descriptive - 6 me dition, Maurice Lethielleux, Dunod; dition :
6e dition (8 septembre 2010), 160 pages
3. Statistiques descriptives, Etienne Bressoud, Jean Claude Kahan, Pearson
education; dition : 2e (26 novembre 2010), 288 pages.
4. Statistique descriptive, Grard Chauvat, Jean-Philippe Rau, Hachette
suprieur (27 septembre 1995), 157 pages
5. Probabilits & Statistiques Rsum des cours. Exercices et problmes
corrigs. Jean Philippe REAU, Grard CHAUVAT, Paris, 2003.
Page 2
Statistique et Probabilit
INTRODUCTION GENERALE
Lorigine du mot statistique remonte au latin classique status (tat) qui, par
une srie dvolutions successives, aboutit au terme franais statistique, attest
pour la premire fois en 1771.
latin classique
status
Etat
stato
statista
homme dEtat
(1633)
italien
statistica
(1672)
latin moderne
statisticus
(1771)
Franais
Statistique
Cest vers la mme poque que statistik apparat en allemand, alors que les
anglophones utilisent lexpression political arithmetic jusquen 1798, date
laquelle le mot statistics fait son entre dans cette langue.
Dfinition : La statistique est lensemble des mthodes ou techniques qui
permettent lorganisation, lanalyse et la synthse des observations en vue :
-
On distingue :
-
La statistique mathmatique
Page 3
Statistique et Probabilit
Cet outil est utilis dans des disciplines nombreuses et varies : la dmographie,
la sociologie, lpidmiologie, lconomie, la mtorologie, La statistique
comprend : la collecte des donnes, le traitement des donnes collectes,
l'interprtation des donnes, la prsentation afin de rendre les donnes
comprhensibles par tous.
En effet, le traitement et l'interprtation des donnes ne peuvent se faire que
lorsque celles-ci ont t collectes.
Ainsi la statistique est un domaine des mathmatiques qui possde une
composante thorique ainsi qu'une composante applique. La composante
thorique est proche de la thorie des probabilits et forme avec cette dernire,
les sciences de l'alatoire.
La statistique plus applique est utilise dans presque tous les domaines de
l'activit humaine : ingnierie, management, conomie, biologie, informatique,
etc.
On peut aussi citer comme domaines dapplication :
-
Page 4
Statistique et Probabilit
Chapitre 1 :
TERMINOLOGIE ET CONCEPTS DE BASE
EN METHODES STATISTIQUES
1. Population
On appelle population est lensemble de tous les lments sur lesquels porte une
tude statistique.
La population statistique peut tre constitue dtres humains, mais galement
danimaux, dobjets, ou dvnements.
On distingue deux types de population.
La population relle : cest celle quon peut trouver dans la nature.
La population fictive : introuvable dans la nature, la population fictive sort de
limagination. On peut bien sr tirer des conclusions sur la population fictive.
2. Echantillon
On appelle chantillon, tout sous-ensemble de la population. Il doit tre choisi de
faon alatoire de faon que tous les lments aient la mme probabilit dtre
choisie.
On peut dduire les proprits de toute une population partir de lanalyse dun
chantillon.
Il est capital que lchantillon soit choisi de faon alatoire et analys de manire
adquate. En particulier, il faut que lchantillon soit reprsentatif de la
population. Un chantillon non reprsentatif est dit biais.
3. Unit statistique
Chaque lment de la population ou de lchantillon est appel unit
statistique ou unit exprimentale et le nombre dunits dans la population
est appel effectif de la population ; Cet effectif de la population est not n.
Professeur : Jol M. ZINSALO/EPAC-UAC
Page 5
Statistique et Probabilit
4. Caractre
On appelle caractre tout critre observable sur chaque unit de la population,
et permettant donc de dcrire la population.
Encore appele facteur ou variable cest toute caractristique prise par les
individus de la population. On appelle aussi variable tout ce qui peut prendre
plus dune valeur. Exemples : lge, le sexe, le poids, la taille.
On peut distinguer deux types de caractres : un caractre quantitatif et un
caractre qualitatif. Un caractre est dit quantitatif sil est mesurable ; En
revanche, un caractre est dit qualitatif sil est non mesurable.
Les variables qualitatives sont utilises pour dcrire et se divisent en deux
groupes :
-
qualitatif
nominal
ordinal
Discret
Continu
Page 6
Statistique et Probabilit
5. Modalits et nomenclature.
Dfinition : on appelle << modalits >> les divers tats que peut prendre un
caractre. La liste des modalits dun caractre est appele << nomenclature >>
du caractre.
La nomenclature associe un caractre nest pas unique et dpend en fait du
degr de dtail que le statisticien entend donner son tude.
Limportant est que la nomenclature respecte les deux proprits suivantes :
Lincompatibilit des modalits : sur aucune unit de la population ne
peuvent tre observes plusieurs modalits du caractre. Par exemple,
pour le caractre << nombre denfants par mnage >>,
0 enfant
0 enfant
1 enfant
1 enfant
2 enfant
2 enfant
3 enfants
3 enfants
4 enfants
2 enfants
Incompatibilit
=> compatibilit
0 enfant
1 enfant
1 enfant
2 enfants
2 enfants
3 enfants
3 enfants
4 enfants et plus
Non exhaustivit
=> exhaustivit
Les modalits dun caractre x sont notes x1, x2, , xi,, xk.
Lorsque le caractre tudi est quantitatif continu, les observations sont
regroupes en modalits reprsentant des intervalles numriques appels
classes .
Page 7
Statistique et Probabilit
Par exemple, considrons les 40 observations suivantes quant la
consommation de carburant en litres aux 100 Km 90 km/h : 5,6 ;
6,3 ; 4,2 ; 6,5 ; 7,8 ; 8,3 ; 9,4 ; 6,5 ; 5,1 ; 5,6 ; 5,7 ; 6,3 ; 7,5 ; 9,4 ; 4,8 ;
8,6 ; 7,6 ; 12,5 ; 6,6 ; 5,9 ; 6,0 ; 5,8 ; 7,2 ; 7,6 ; 4,9 ; 5,8 ; 6,7 ; 7,9 ; 6,2 ;
5,4 ; 8,1 ; 9,0 ; 10,1 ; 4,9 ; 5,6 ; 5,8 ; 7,5 ; 11,2 ; 5,6 ; 7,2.
Une
telle
distribution,
les
observations
ont
collectes
Observations
4
11
8
8
3
3
1
1
1
n = 40
[5,6[ contient la valeur 5, toutes les valeurs comprises entre 5 et 6 au sens strict,
mais ne contient pas la valeur 6.
Une telle distribution, o les observations ont t classes et regroupes, est
appele srie groupe .
La distinction entre srie non groupe et srie groupe est capitale car le
traitement de la distribution est diffrent selon que la srie soit groupe ou non.
Page 8
Statistique et Probabilit
Chapitre 2 :
TRAITEMENT DES DONNEES DUNE SERIE STATISTIQUE
lchantillon. On a :
2. Tableau statistique
On appelle tableau statistique un tableau qui comporte 3 parties :
-
Le titre
Le corps
La source.
Le titre est toujours libell comme suit : Distribution (ou rpartition) de tels
individus ou de telles populations selon tel caractre.
Le corps est le tableau lui-mme.
La source renseigne sur le lieu et la date dlaboration du tableau. Elle permet
au lecteur de vrifier lexactitude des donnes. Sil sagit dun exercice propos, on
crit source fictive ou source inconnue.
Page 9
Statistique et Probabilit
2.1.
La couleur des cheveux par exemple est un caractre qualitatif (nominal). Les
modalits peuvent tre : blonde, brune, rousse,
Exercice 1 :
Le Directeur de lInstitut Gographique National du Bnin a projet faire linventaire
des personnes qui ont achet des parcelles depuis 2011 dans la Commune
dAbomey Calavi. Il se propose de comparer la structure socioprofessionnelle et les
aires des champs ceux des autres communes du pays. Sa dmarche consiste
tudier la Catgorie Socioprofessionnelle (CSP) de propritaires terriens tirs au
hasard ainsi que les aires des surfaces de leurs parcelles. (Tableau 1).
On note bien entendu F le sexe fminin et M le sexe masculin. La catgorie
socioprofessionnelle (CSP) est dfinie par les 7 groupes de professions ci-dessous :
1. Agri : agriculteur ; ouvrier agricole
2. Ouv. : ouvrier
3. Emp. : employ
4. C.M. : cadre moyen
5. C.Sup. : cadre suprieur
6. PIC : Commerants, artisans
7. Inact. : inactifs, retraits.
Page 10
Statistique et Probabilit
Tableau 2 : Catgories socioprofessionnelles et aires en m2 de 50 Propritaires
Terriens
1
Agri. M 150.15 26
PIC
F 314.25
2
Ouv.
F 173.12 27 Inact. F 951.16
3
C.Sup F 88.91 28
PIC
F 63.22
4
C.M. M 65.10 29 C.M. M 95.22
5
Inact. F 39.90 30 Emp. M 99.90
6
C.Sup. F 351.15 31
PIC
M 104.57
7
Emp. F 478.80 32 C.M. M 452.75
8
Emp. F 745.33 33 Emp. F 190.68
9
Ouv. M 841.50 34 Ouv.
F 220.36
10 C.M.
F 555.10 35 Emp. M 250.66
11 Agri.
F 632.13 36 C.Sup. M 250.87
12 Ouv.
F 712.22 37 Ouv.
F 590.14
13 Emp. M 254.13 38 C.M.
F 301.25
14 Ouv.
F 301.52 39 Agri. M 610.90
15 Emp. M 420.15 40 Emp. F 125.34
16 Emp. F 289.90 41 Emp. F 240.90
17 Ouv.
F 251.14 42 Emp. F 290.75
18 Emp. M 190.65 43 Emp. M 241.78
19 C.M.
F 215.85 44 Emp. F 305.90
20 Emp. F 165.44 45 C.M.
F 520.45
21 Emp. F 174.55 46 Ouv. M 490.63
22 Emp. F 135.33 47 Inact. M 210.33
23 Ouv. M 154.66 48 C.M. M 350.44
24
PIC
F 274.15 49 Inact. F 320.90
25 C.Sup. M 293.12 50 Ouv. M 299.90
Questions
1. Elaborer un tableau statistique montrant la rpartition des propritaires
terriens selon la Catgorie Socioprofessionnelle.
2. Elaborer un tableau statistique montrant la rpartition des propritaires
terriens selon le sexe.
3. On peut aussi produire un tableau statistique donnant la rpartition des
hommes et des femmes selon la Catgorie Socioprofessionnelle afin de les
reprsenter simultanment.
Page 11
Statistique et Probabilit
2.2.
2.2.1.
Comme nous lavons prcdemment dit, il faut toujours distinguer les trois
parties dun tableau statistique : le titre le corps la source.
Exemple :
On considre le nombre denfants par famille des lves Ingnieur gomtres
Topographes Promotion 2012-2013 lEcole Polytechnique dAbomey Calavi :
5 6 4 1 0 2 6 5 6 - 4 1 7 10 9 8 - 5 6 - 7 - 4 - 3 2 0 1
2 - 3 - 3 4 5 7 4 6 10 9 9 9 8 -10 - 2 -1 5 - 6 4 8 9 7
6 5 4 2 2.
1. Elaborer un tableau statistique.
2. Quel est le nombre dtudiants dont le nombre denfants par famille est
suprieur 6 enfants ?
3. Quel est le nombre dtudiants dont le nombre denfants par famille natteint
pas 9 ?
4. Quel est le nombre dtudiants dont le nombre denfants par famille varie entre
5 et 8 enfants ?
5. Quelle est la proportion des tudiants dont le nombre denfants par famille ne
dpasse pas 5 enfants ?
. On calcule ltendue
et la plus petite
par la formule :
Page 12
Statistique et Probabilit
On calcule ensuite lamplitude
par la formule :
) et on
ou
Total
= [
100
Page 13
Statistique et Probabilit
Exemple :
xi
ai
ci
[4,6[
[6,7[
6,5
[7,8[
7,5
[8,9[
8,5
[9,10[
9,5
[10,13[
11,5
Preuve :
tre
Page 14
Statistique et Probabilit
Dfinition : On appelle effectifs cumul croissant de la modalit xi du
caractre quantitatif x , not Ni+, le nombre dunits de la population pour
lesquelles la modalit du caractre x observe est infrieure ou gale la ime.
Lecture :
Longueur
en ni
Ni+
mtres
Moins de 12
4199
4199
519
4718
[12 ,16[
811
5529
[16 ,25[
88
5617
[25, 38[
38 et plus
69
5686
Total
5686
Source : Direction des pches maritimes
Ni5686
1487
968
157
69
-
Lecture :
N2+ = 4718
Page 15
Statistique et Probabilit
N4+ = 5617
Lecture : (100. Fi+)% des units de la population vrifient une valeur observe du
caractre x infrieure ou gale ei+. (Ou xi si le caractre est quantitatif discret)
ou encore :
Lecture : (100. Fi-)% des units de la population vrifient une valeur observe du
caractre x suprieure
discret)
Page 16
Statistique et Probabilit
Longueur
en ni
Ni+
Ni-
mtres
Moins de 12
4199
0,7485
[12 ,16[
519
0,8298
0,2615
[16 ,25[
811
0,9724
0,1702
[25, 38[
88
0,9879
0,0276
38 et plus
69
0,0121
Total
5686
Lecture :
F2+ = 0,8298
26,15% des
0,0276
2,76% des
Exercice 2
Le Directeur de lInstitut Gographique National du Bnin a projet faire linventaire
des personnes qui ont achet des parcelles depuis 2011 dans la Commune
dAbomey Calavi. Il se propose de comparer la structure socioprofessionnelle et les
aires des champs ceux des autres communes du pays. Sa dmarche consiste
tudier la Catgorie Socioprofessionnelle (CSP) de propritaires terriens tirs au
hasard ainsi que les aires des surfaces de leurs parcelles. (Tableau 1).
On note bien entendu F le sexe fminin et M le sexe masculin. La catgorie
socioprofessionnelle (CSP) est dfinie par les 7 groupes de professions ci-dessous :
1. Agri : agriculteur ; ouvrier agricole
Professeur : Jol M. ZINSALO/EPAC-UAC
Page 17
Statistique et Probabilit
2. Ouv. : ouvrier
3. Emp. : employ
4. C.M. : cadre moyen
5. C.Sup. : cadre suprieur
6. PIC : Commerants, artisans
7. Inact. : inactifs, retraits, chmeurs, tudiants
Tableau 2 : Catgories socioprofessionnelles et aires en m2 de 50 Propritaires
Terriens
1
Agri. 150.15 26
PIC 314.25
2
Ouv. 173.12 27 Inact. 951.16
3
C.Sup 88.91 28
PIC
63.22
4
C.M. 65.10 29 C.M. 95.22
5
Inact. 39.90 30 Emp. 99.90
6
C.Sup. 351.15 31
PIC 104.57
7
Emp. 478.80 32 C.M. 452.75
8
Emp. 745.33 33 Emp. 190.68
9
Ouv. 841.50 34 Ouv. 220.36
10 C.M. 555.10 35 Emp. 250.66
11 Agri. 632.13 36 C.Sup. 250.87
12 Ouv. 712.22 37 Ouv. 590.14
13 Emp. 254.13 38 C.M. 301.25
14 Ouv. 301.52 39 Agri. 610.90
15 Emp. 420.15 40 Emp. 125.34
16 Emp. 289.90 41 Emp. 240.90
17 Ouv. 251.14 42 Emp. 290.75
18 Emp. 190.65 43 Emp. 241.78
19 C.M. 215.85 44 Emp. 305.90
20 Emp. 165.44 45 C.M. 520.45
21 Emp. 174.55 46 Ouv. 490.63
22 Emp. 135.33 47 Inact. 210.33
23 Ouv. 154.66 48 C.M. 350.44
24
PIC 274.15 49 Inact. 320.90
25 C.Sup. 293.12 50 Ouv. 299.90
Question
Etablir la distribution des frquences absolues des achats en kF. On fixera la
borne infrieure de la premire classe 39,9 kF.
Page 18
Statistique et Probabilit
Exercice 3
Un Ingnieur gomtre topographe doit mesurer les dimensions dune parcelle.
Les donnes issues des mesures sont :
269,7 263,6 264,4 259,7 262,4 263,4 260,7 265,0 267,0 265,6
268,8 260,3 263,4 267,6 264,1 272,9 264,8 261,4 264,5 266,2
265,9 265,3 266,4 255,8 267,1 265,5 264,5 262,2 271,0 264,4
269,8 266,1 268,7 261,2 263,1 264,6 258,7 262,3 261,2 262,1.
1. Dterminer le nombre de classes ncessaires.
2. Dterminer ltendue de la srie
3. Dterminer lamplitude des classes et les classes de donnes. Arrondir
lamplitude lentier suprieur.
4. Dpouiller les donnes de la srie statistique.
3. Diagrammes
On entend souvent quun schma vaut mieux quun long discours. Effectivement,
lorsque lon veut tudier une srie dobservations statistiques, il est souvent
judicieux den donner une reprsentation graphique.
Cette reprsentation dpend de la nature des donnes tudies. En effet, il existe
plusieurs types de donnes : donnes quantitatives continues (mesures par une
unit de grandeur, comme le mtre, le franc), quantitatives discrtes (rsultant
dun dnombrement et sexprimant en nombres entiers) ou qualitatives nominales
(codes par une lettre, par exemple F pour fminin, M pour masculin, ou un
chiffre sans signification numrique) et ordinales (objets classs par ordre de
prfrence).
Les reprsentations graphiques fondamentales sont :
des diagrammes, dans le cas de donnes qualitatives, quantitatives
discrtes ;
des histogrammes, dans le cas de donnes quantitatives continues.
Professeur : Jol M. ZINSALO/EPAC-UAC
Page 19
Statistique et Probabilit
3.1.
tel que :
Exercice 4
1. Reprsenter le diagramme circulaire de la rpartition des hommes par
catgorie socioprofessionnelle (voir exercice 1 page 12).
Page 20
Statistique et Probabilit
2. Reprsenter le diagramme circulaire de la rpartition des femmes par catgorie
socioprofessionnelle (voir exercice 1 page 12).
3. Faire la reprsentation par tuyau dorgues des clients selon la catgorie
socioprofessionnelle.
4. Reprsenter la rpartition par catgorie socioprofessionnelle pour chaque sexe.
(Rponse voir la remarque page 26).
Remarque
On peut calculer aussi les rpartitions des hommes et des femmes suivant la
CSP, et les reprsenter simultanment. On obtient un diagramme en btons
permettant de comparer les effectifs et non les proportions : la diffrence est
importante, puisquil y a 30 femmes et 20 hommes.
Femmes Hommes
Agriculteur :
Ouvrier :
Employ :
11
Cadre moyen :
Cadre suprieur :
Commerant, artisan :
Inactif :
Page 21
Statistique et Probabilit
4.2.
4.2.1.
et les points
et
Exercice 5
Le tableau suivant reprsente la rpartition du nombre denfants par mnage
dans un quartier donn.
Nombre denfants Nombre de mnages
1
50
60
30
90
Exercice 6
Dans un pays, on a tudi, sur une priode de temps trs longue, le nombre de
suicides des jeunes de moins de 20 ans.
Il y a eu 19 annes o on a compt 1 suicide par an
17 annes o on a compt 2 suicides par an
20 annes o on a compt 3 suicides par an
15 annes o on a compt 4 suicides par an
11 annes o on a compt 5 suicides par an
8 annes o on a compt 6 suicides par an
2 annes o on a compt 7 suicides par an
3 annes o on a compt 8 suicides par an
3 annes o on a compt 9 suicides par an
Professeur : Jol M. ZINSALO/EPAC-UAC
Page 22
Statistique et Probabilit
3 annes o on a compt 10 suicides ou plus par an
9 annes o il ny a eu aucun suicide.
1) Prciser la population tudie, lindividu, le caractre tudi et ses
modalits.
2) Etablir le tableau statistique complet.
3) Prsenter le diagramme en btons reprsentatif des effectifs.
4) Prsenter le polygone des effectifs.
Solution
1) La population tudie est lensemble des jeunes de moins de 20 ans dun pays
qui se sont suicids pendant une priode trs longue. Un individu est
reprsent par une anne. Le caractre tudi est le suicide. Les modalits de
celui-ci correspondent au nombre de suicides observs soit de 0 10 et plus.
2) Il sagit de prsenter un tableau statistique 8 colonnes donnant
respectivement Modalits (Nombre de suicides
), Nombre de suicides observs (
4.2.2.
connaissant lamplitude
. On
par la formule :
et
.
Page 23
Statistique et Probabilit
-
Exercice 7
En utilisant les donnes de lexercice 3 :
1) Faire un tableau statistique complet.
2) Construire lhistogramme du revenu trimestriel de ces habitants.
3) Construire lhistogramme avec les centres des classes.
4) Prsenter le polygone statistique.
5) Prsenter le graphique reprsentatif des frquences cumules croissantes
et celui des frquences cumules dcroissantes.
Exercice 8
La Direction Rgionale de lagriculture et de la fort dun pays nous a donn en
2011, la rpartition par tranche dges des chefs dexploitation agricole de la
rgion centre.
Moins de 25 ans
580 exploitations
de 25 29 ans
2162 exploitations
de 30 39 ans
8063 exploitations
de 40 49 ans
9569 exploitations
de 50 59 ans
16 660 exploitations
plus de 60 ans
15 913 exploitations.
Page 24
Statistique et Probabilit
a) Lhistogramme reprsentatif des effectifs
b) Le polygone des effectifs
c) le graphique reprsentatif des frquences cumules croissantes et celui
des frquences cumules dcroissantes. Quelle est la signification du
point dintersection ?
Solution
1) La population tudie est lensemble des chefs des exploitations agricoles de la
Rgion centre en 2011. Un individu est constitu dun chef dexploitation. Le
caractre tudi est son ge. Il varie de moins de 25 ans plus de 60 ans : ce
sont ses diffrentes modalits.
2) Tableau statistique
Classes
Centre
Effectifs
ges
de
Nombre
classes
tablis
Frquences
(%)
Effectifs
Effectifs
Frquences
Frquences
Cumuls
Cumuls
Cumules
Cumules
croissants
dcroissants
croissantes
dcroissantes
Total
Page 25
Statistique et Probabilit
CHAPITRE 3 :
Caractrisation des donnes :
Paramtres de position Paramtres de dispersion
Diagrammes en botes
1.1.
Le mode
Page 26
Statistique et Probabilit
f
r
q
u
e
n
c
e
X
Une distribution bimodale est une distribution prsentant deux modes
f
r
q
u
e
n
c
e
X
modes
ni
13
14
11
38
Mo = argent
Page 27
Statistique et Probabilit
Exemple : Mdailles de la France aux J.O. dAtlanta en 1996 :
xi (mtal)
Or
Argent
Bronze
TOTAL
1.1.2.
ni
15
7
15
37
Mo = {or, bronze}
Salaire en kF
Nombre douvriers
21
49
100
24
et le mode
Pour dterminer le mode dans le cas o les classes nont pas la mme amplitude,
il faut rapporter leffectif de chaque modalit son amplitude, de manire
comparer les diffrentes modalits sur une base commune.
Page 28
Statistique et Probabilit
Exemple : rparation par ge des habitants dune commune
xi (ge en annes)
[0, 18[
[18, 35[
[35, 55[
[55, 105[
TOTAL
ni
72
102
105
171
450
Xi (ge en annes)
ni
ai
d i = ni / ai
[0, 18[
72
18
d1= 72 /18 = 4
[18 ,35[
102
17
d2 = 102 / 17 = 6
[35 ,55[
105
20
d3 = 105 / 20 = 5,25
[55, 105[
171
50
d4 = 171 / 50 = 3,42
Total
350
Lecture : Dans la modalit dge [0, 18[, on trouve en moyenne 4 personnes par
tranche dun an.
Dans la modalit dge [18, 35[ , on trouve en moyenne 6 personnes par tranche
dun an.
Page 29
Statistique et Probabilit
Dans la modalit dge [35, 55[, on trouve en moyenne 5,25 personnes par
tranche dun an.
Dans la modalit dge [55, 105[, on trouve en moyenne 3,42 personnes par
tranche dun an.
La modalit la plus reprsente est donc bien [18, 35[. On a donc :
Mo = [18, 35[ .
Proprits du mode
Le mode soufre de certains dfauts :
Sa dtermination nest pas prcise pour les variables continues
(Mo = [18 ,35[ dans lexemple).
Il ne se prte pas au calcul algbrique.
1.2.
La mdiane
1.2.1.
un premier temps
Page 30
Statistique et Probabilit
1.2.1.1. Taille dchantillon impaire
Si n est impair, alors la mdiane est lobservation de rang
dans la srie
et on dtermine
par la formule :
Les donnes sont ensuite classes par ordre croissant. On identifie ensuite la
donne de rang
et la donne de rang
formule :
Page 31
Statistique et Probabilit
1.2.2.
avec les effectifs cumuls croissants. La classe mdiane est celle dont leffectif
cumul croissant englobe la
o
est la borne infrieure de la classe mdiane
est le nombre total des donnes dans la srie
est la somme des effectifs partiels de toutes les classes prcdant la classe
mdiane
est leffectif partiel de la classe mdiane
est lamplitude de la classe mdiane.
ni
10590
17413
6767
1393
298
94
10
36565
Source : INSEE, recensement de la
Page 32
Statistique et Probabilit
Dtermination de la classe mdiane :
n/2= 36565/2= 18282,5.
Leffectif cumul croissant immdiatement suprieur cette valeur est 28003. Ce
qui correspond la classe [200,1000[. Par consquent la classe mdiane est
[200,1000[. On calcule la mdiane par la formule :
On a donc :
On a :
Proprits de la mdiane
La mdiane nest pas dfinie pour les caractres qualitatifs, et son interprtation
pose problme pour les variables discrtes. En fait, la mdiane est un indicateur
utile et pertinent dans le seul cas des variables continues, o linterprtation de
la mdiane est simple et parlante .
La mdiane a pour avantage dtre peu sensible aux valeurs numriques de la
srie ; elle ne dpend gure que de lordre des observations et est constante mme
si les premires et dernires observations varient considrablement. Elle nest pas
toujours facile calculer, et parfois mme nexiste pas.
Exercice 1
Calculer la mdiane des achats des 50 propritaires terriens en utilisant les
donnes non groupes dune part puis les donnes groupes dautre part (voir
exercice 2 page 22).
Page 33
Statistique et Probabilit
1.3.
Moyennes
Exemple :
Pour un examen de DUT, les notes dun tudiant dans 7 matires sont :
18 16 15 - 14 12 - 17 11.
Cette formule est utilise pour des donnes non groupes (c'est--dire des
donnes en vrac ou en ordre chronologique).
Pour calculer la moyenne arithmtique dune variable continue dont les
observations sont donc regroupes en classe, on considre que les valeurs
observes sont rparties de manire uniforme au sein de chaque intervalle. Ceci
revient supposer que la valeur moyenne des observations au sein dune classe
xi est gale au centre ci de cette classe. On utilise les centres
leurs effectifs partiels
des classes et
la formule :
Page 34
Statistique et Probabilit
Il peut arriver que des donnes soient rptes un certain nombre de fois dans
une srie statistique.
La moyenne pondre est une moyenne arithmtique dans laquelle chaque
modalit
ni (coefficient)
2
3
2
3
2
12
ni. xi
8
24
32
39
10
113
Proprit :
Sur deux populations Pa et Pb de mme nature, et deffectif respectif na et nb, on a
observ le mme caractre quantitatif X. Sur chaque sous-population, on obtient
la valeur moyenne du caractre, note respectivement
et
. Alors, la moyenne
Page 35
Statistique et Probabilit
Exercice 2
Dans une population de 12 000 familles de huit enfants, on tudie le caractre
nombre de garons parmi les huit enfants de chaque famille . La rpartition de
ces familles suivant le nombre de garons est la suivante :
Nombre
Nombre de familles
de garons
ayant n garons
0
48
1
295
2
1425
3
2213
4
3438
5
2457
6
1607
7
453
8
64
1. Construire le diagramme en btons des observations.
2. Quel est le mode de cette srie statistique ?
3. Calculer la mdiane.
4. Calculer la moyenne.
Exercice 3
En vue dtudier la rpartition des ouvriers agricoles dune rgion en fonction du
salaire journalier, on choisit un chantillon reprsentatif de cette population. On
observe que le salaire journalier est compris entre 80 kF et 200 kF, un intervalle
partag en 8 intervalles conscutifs gaux. La rpartition des individus de
lchantillon dans ces 8 classes est la suivante :
Salaires
journaliers
Effectifs des
classes
11
56
135
140
96
60
30
8
Page 36
Statistique et Probabilit
1. Construire lhistogramme et le polygone des frquences de cette srie
statistique.
2. Quelle est la classe modale ? Calculer la mdiane de cette srie statistique.
3. Calculer la moyenne.
mathmatiquement.
Elle
dpend
de
toutes
les
valeurs
xi
et
1.3.2.
Moyenne gomtrique
Page 37
Statistique et Probabilit
Partons du tableau statistique suivant :
1,08 3
1,07 2
1,09 5
Total 10
et calculons la moyenne arithmtique des mesures prises par la variable
. On
trouve :
Page 38
Statistique et Probabilit
Question :
Quel serait le taux moyen annuel daccroissement (pour 100) du phnomne
tudi sur
Solution
La mesure du phnomne tudi la fin de lanne 10 est :
c'est--dire que la mesure de dpart aura t multiplie trois fois par le coefficient
1,08 ; le rsultat obtenu aura t multipli deux fois par le coefficient 1,07 ; le
rsultat obtenu tant ensuite multipli cinq fois par le coefficient 1,09.
Coefficient
annuel
Dsignons par
Nombre de
multiplications
1,08
1,07
1,09
Total
10
mesure qui
soit
, on peut crire :
Page 39
Statistique et Probabilit
En posant
, on a :
Do :
1,08
0,10026
1,07
0,05876
1,09
0,18715
Total 10
0,34617
d'o :
Puisque
Page 40
Statistique et Probabilit
12% par an les trois annes suivantes
Quelle a t laugmentation annuelle moyenne des bnfices au cours de la
dcennie coule ?
Rponse :
Les bnfices ont augment en moyenne de 9,07% par an depuis dix ans.
Exercice
Une entreprise utilise 5 camions dont les consommations
1.3.3.
Moyenne harmonique
Exercice :
Depuis quatre ans, une socit consacre un budget fixe not B, chaque anne,
une campagne daffichage publicitaire. Le tableau suivant indique pour chaque
anne le prix unitaire de laffiche publicitaire (affiche + location emplacement).
Anne
2000
2001
2002
2003
Prix Unitaire en
35
38
40
44
Calculer le prix moyen des affiches achetes par cette socit sur la priode de
quatre annes.
Solution
La moyenne arithmtique sera (35+ 38+40+44) /4 = 157 / 4 = 39,25. Elle ne
rpond pas la question pose, mais indique simplement le prix moyen dune
seule affiche sur les quatre annes coules.
Page 41
Statistique et Probabilit
En effet, ici, la socit consacre chaque anne une somme fixe lachat dun bien
dont le prix unitaire varie, de sorte que la quantit achete chaque anne sera
elle aussi variable.
Cette moyenne, que nous venons de dfinir intuitivement, est une moyenne
harmonique.
La moyenne harmonique dune variable, note H, est linverse de la moyenne
arithmtique des inverses des observations.
La moyenne harmonique simple scrit
Exercice
Dans 4 dpartements, on a dnombr le nombre dhabitants par voiture
automobile. Le premier dpartement compte 4 habitants pour une voiture
automobile, ou une automobile pour 4 personnes. Le second dpartement compte
9 habitants pour une voiture, et ainsi de suite. Le tableau statistique est le
suivant :
4
9
3
5
Total
800 000
450 000
3 000 000
750 000
5 000 000
Page 42
Statistique et Probabilit
La
colonne
indique
les
nombres
dhabitants
respectifs
pour
les
Solution
Le nombre moyen cherch que nous dsignerons par H est videmment le
quotient :
Le
nombre
moyen dhabitants
pour une
voiture
sur lensemble
des 4
dpartements :
Mardi
+5
-2
Mercredi
+1
Jeudi
Vendredi
+3
-7
Page 43
Statistique et Probabilit
On nobtient pas la rponse la question car les variations devraient tre
considres indpendamment de leur signe pour viter quelles ne se compensent
La moyenne quadratique permet de compenser cette lacune.
Page 44
Statistique et Probabilit
Recueil dexercices
Exercice 1
Dans une promotion dtudiants, lors de la visite mdicale, on rcapitule leur
poids dans le tableau suivant :
en kg
Effectif
22
42
16
20
Exercice 3
Sachant que :
1. Calculer
2. Si de plus, on a :
calculer
Page 45
Statistique et Probabilit
Exercice 4
Considrons le tableau suivant :
xi
4
12
7
9
Yi
6
3
8
5
Exercice 5
Vous faites une enqute dans une maternit auprs de 60 femmes et vous tudiez
lge de la mre la date de la naissance de leur premier enfant.
23
19
23
32
25
24
24
17
18
29
26
23
18
22
20
27
23
31
19
26
27
21
20
26
35
31
29
22
29
27
26
28
24
23
35
20
28
29
24
24
38
21
24
21
22
28
19
22
22
20
23
32
20
23
19
22
23
30
22
28
1) Quelle est la population tudie, quel est leffectif, quel est le caractre tudi,
le caractre tudi est-il discret ou continu ?
2) Calculer lge moyen de la mre la naissance du premier bb.
3) Regroupez cette srie en fonction des valeurs croissantes du caractre. Faire
apparaitre les effectifs. Aprs avoir rappel la notion de frquence calculez les
frquences relatives chacune des modalits.
4) Calculer la moyenne arithmtique en utilisant ce type de regroupement.
5) Classer la srie de 3 ans en 3 ans de la manire suivante :
[15 18[ ; [18 21[etc. en faisant apparaitre les effectifs correspondants.
6) En supposant que vous nayez comme information que ce dernier tableau,
calculez lge moyen au premier enfant.
7) Pourquoi cette moyenne arithmtique est-elle diffrente des moyennes
antrieures ?
Page 46
Statistique et Probabilit
Exercice 6
Le tableau suivant indique la rpartition par ge x des condamns inscrits au
casier judiciaire nationale en France en 2000.
xi
nI (en milliers)
[14,16[
18
[16, 18[
21
[18, 20[
47
[20, 25[
118
[25, 30[
88
[30, 40[
135
[40, 60[
136
[60,80[
16
TOTAL
579
Page 47
Statistique et Probabilit
2. Caractristiques de dispersion
Les indicateurs de tendance centrale ne permettent pas eux seuls de
caractriser la distribution statistique. Ils renseignent sur lordre de grandeur
au milieu de la srie , mais nindique rien quant la rpartition des
observations autour du centre de la distribution.
Exemple : Age de mariage de deux groupes dindividus
Groupe 1
21
22
23
24
30
30
36
37
38
39
Groupe 2
28
29
29
30
30
30
30
31
31
32
Groupe 1
: Mo = Me =
= 30
Groupe 1
: Mo = Me =
= 30
Bien que les deux sries aient exactement les mmes caractristiques de
tendance centrale, les distributions sont clairement trs diffrentes :
Dans le groupe 1, les observations sont beaucoup plus disperses autour de la
tendance centrale.
Nous allons ici dfinir les indicateurs synthtiques permettant de mesurer
cette dispersion. Ces indicateurs sont de plusieurs types :
-
Lcart moyen
Le coefficient de variation
Les quantiles.
2.1.
Ltendue
et la plus faible
de la srie.
On a :
Page 48
Statistique et Probabilit
Exemple : ge de mariage
Groupe 1 : tendue = 39 21 = 18
Groupe 2 : tendue = 32 28 = 4
Lentendue, pour simple quelle soit calculer et interprter, ne constitue pas
pour autant une mesure fiable de dispersion. En effet,
-
2.2.
Lcart moyen
2.3.
Page 49
Statistique et Probabilit
Exemple : Age au mariage de deux groupes dindividus
Groupe 1
21
29
29
30
30
31
31
39
Groupe 2
29
29
29
30
30
31
31
31
Groupe 1:
Groupe 1:
La variance na pas dinterprtation isolment. En effet, elle nest pas exprime dans
lunit de mesure de la variable (ici lanne), mais en carr de cette variable (des
annes au carr !!). Pour combler ce dfaut, on dfinit lcart type, not , comme la
racine carre de la variance.
Lcart type est donc exprim dans lunit de mesure de la variable :
-
Page 50
Statistique et Probabilit
Exemple : Flotte des navires de pche mtropolitaine au 31/12/2001 selon la
longueur en mtres :
Longueur
en Ni
Ci
(Ci )
ni-(C1- )
mtres
Moins de 200
4199
10*
-2,62
28824
[12, 16[
519
14
1,38
988
[16, 25[
811
20,5
7,88
50358
[25, 38[
88
31,5
18,88
31368
38 et plus
69
45*
32,88
72344
TOTAL
5686
183882
2.4.
Le coefficient de variation
est
Page 51
Statistique et Probabilit
Pour deux variables X et Y, CV(X) > CV(Y) la distribution de X est plus
disperse que celle de Y.
Plus le coefficient de variation est faible (infrieur 15%), plus la srie de
donnes est homogne (concentre autour de ), indiquant ainsi que la moyenne
est bien reprsentative de lensemble des donnes de la srie.
Exemple
Age de mariage de deux groupes dindividus (groupe 1) :
On peut conclure que la distribution la plus disperse est celle des bateaux de
pche par taille.
2.5.
Les quantiles
Page 52
Statistique et Probabilit
Le 1er quartile not
est le
et
o
: borne infrieure de la classe qui contient
ou
De faon analogue, on calcule les dciles Dj et les centiles Cj par les formules :
Page 53
Statistique et Probabilit
2.6.
Diagramme en botes
Intervalle interquartile
On appelle intervalle interquartile IQ la diffrence entre le troisime quartile
le premier quartile
et
et
, de sorte que la
longueur de la bote est lintervalle interquartile IQ. On trace par la suite un trait
lintrieur de la bote pour reprsenter la mdiane et un autre partir de
chaque extrmit de la bote jusquaux valeurs extrmes de la srie.
Exercice
Un Ingnieur gomtre topographe doit mesurer les dimensions dune parcelle.
Les donnes issues des mesures sont :
269,7 263,6 264,4 259,7 262,4 263,4 260,7 265,0 267,0 265,6
268,8 260,3 263,4 267,6 264,1 272,9 264,8 261,4 264,5 266,2
265,9 265,3 266,4 255,8 267,1 265,5 264,5 262,2 271,0 264,4
269,8 266,1 268,7 261,2 263,1 264,6 258,7 262,3 261,2 262,1.
1. Calculer les quartiles
et
Page 54
Statistique et Probabilit
Solution
Il faut dabord ordonner les donnes de la srie.
Tout dpend de la parit de la taille de lchantillon
Si n est impair, les rangs de
et
lentier suprieur.
Pour cet exercice, la taille de lchantillon n est paire.
-
Le rang
soit :
Le rang
soit :
Le rang
soit :
Page 55
Statistique et Probabilit
Le premier quartile correspond la moyenne de la 30e et la 31e donne dans la
srie ordonne :
2.7.
Une valeur aberrante est une donne qui scarte de faon marque de lensemble
des donnes. Une rgle pratique utilise pour identifier une valeur aberrante est
la suivante :
Une donne peut tre appele valeur aberrante si elle scarte dune distance dau
moins
Une valeur aberrante doit tre examine avec soin pour identifier la cause
ventuelle de cet cart important par rapport lensemble des donnes. Les
valeurs aberrantes affectent la moyenne arithmtique.
Exercice
En se rfrant aux donnes de lexercice prcdent, dtecter les valeurs
aberrantes sil y a lieu.
On a trouv :
Page 56
Statistique et Probabilit
Chapitre 4 :
STATISTIQUE A DEUX VARIABLES CORRELATION
poids
revenu
rsultats
tabagisme
cancer
rendement
engrais
Page 57
Statistique et Probabilit
Pour tudier les relations ou corrlations entre deux variables statistiques, on
peut les porter sur un graphique.
Exemple: relation entre la taille et le poids des individus
pour chaque individu de l'chantillon, on porte sur un graphique:
sa taille en abscisse (l'abscisse d'un point correspond sa projection sur l'axe
horizontal)
son poids en ordonne (l'ordonne d'un point correspond sa projection sur
l'axe vertical)
chaque individu est donc, dans ce graphique, reprsent par un point (point
reprsentatif)
soit un individu mesurant 172 cm et pesant 66 kg:
70
p
66
o
i
d 60
s
(kg)
point reprsentatif
50
150
160
170
172
180
taille (cm)
Dans le graphe, il y aura donc autant de points qu'il y a d'individus dans
l'chantillon.
p
o 80
i
d 70
s
(kg) 60
50
150
.
.
. . .
.. . . . .
.
. .. . . . .
. . .. . . .
. .
160
170
180
190
200
taille (cm)
Relation entre le poids et la taille dans un chantillon de 30 individus.
Professeur : Jol M. ZINSALO/EPAC-UAC
Page 58
Statistique et Probabilit
On peut (par la pense ou rellement) tracer une droite qui passe au mieux par
ces points (au milieu du "nuage" de points).
Si cette droite "monte", on dira qu'il y a corrlation positive entre les deux
variables.
Si elle "descend", c'est une corrlation ngative.
Si elle est "horizontale", ou si on ne peut pas dcider, c'est qu'il y a absence de
corrlation.
Corrlation positive:
.
.
. . .
.. . . . .
.
. .. . . . .
. . .. . . .
. .
x
Corrlation ngative:
. .. .
. . . .. .. . .
. . .
.
. . . .. . .
. .
.
.
.
.
x
Absence de corrlation:
Page 59
Statistique et Probabilit
. .. .
. .. . . . .
. .. . .
.
. . .. .. . . . .
. . .. . . . .
. . .
. .. . . . . .
.
.. . . . .
x
. .
..
x
Bonne corrlation (corrlation forte):
. .
. .
.. .
.
. ..
x
Mauvaise corrlation (corrlation faible):
Page 60
Statistique et Probabilit
.
. .
.
.
. .
.
.
x
Exemple:
1.
communication (1998).
100
.. . .
. .. ..
..
. .. ...... .
..
. . . ..
.. . .
.
p
o 80
i
d
s
(kg) 60
.
40
140
160
180
taille (cm)
200
Corrlation entre le poids et la taille pour les filles de 2me candi. commu.
Page 61
Statistique et Probabilit
p
o 80
i
d
s
(kg) 60
. . ..... .
.
. .. .
.
.
. .. ... ....... .
. ..... . ..
...... ...
.
40
140
160
180
taille (cm)
200
d5
d3
d1
d4
d2
X
Trouver la droite telle que la somme des carrs des carts d1, d2, soit minimale:
Page 62
Statistique et Probabilit
d 2 = minimum
Soit
Y = aX + b
l'quation de la droite cherche (droite de rgression)
Les coefficients a et b peuvent tre calculs partir des formules suivantes:
Pente:
a=
(X
)( ) (
)( ) (
)(
(X X ) + (X X ) + L + (X X )
X . Y1 Y + X 2 X . Y2 Y + L + X n X . Yn Y
2
ou:
a=
( X X ).(Y Y )
(X X )2
Ordonne l'origine:
b = Y a. X
Rappels:
1
X
n
1
Y = Y
n
X=
3. Coefficient de corrlation
Le signe de la pente a donne le sens de corrlation, mais pas sa qualit.
a > 0 corrlation positive
a < 0 corrlation ngative
a = 0 pas de corrlation
La qualit de la corrlation peut tre mesure par un coefficient de corrlation r
r=
( X X ).(Y Y )
2
( X X ) (Y Y )2
Page 63
Statistique et Probabilit
Page 64
Statistique et Probabilit
Exemples:
1.
Supposons
un
chantillon
alatoire
de
firmes
pharmaceutiques
40
50
40
60
30
40
50
50
1
1
160
X = (40 + 40 + 30 + 50 ) =
= 40
n
4
4
Y=
1
1
200
Y = (50 + 60 + 40 + 50 ) =
= 50
n
4
4
XX
Y Y
(X X )2 (Y Y )2 (X X ) .(Y Y )
40
50
40
60
+10
+100
30
40
10
10
+100
+100
+100
50
50
+10
+100
On a donc:
(X X ) = 200
2
(Y Y ) = 200
(X X )(. Y Y ) = 100
2
b = Y a. X = 50 0,5 40 = 50 20 = 30
Et le coefficient de corrlation:
Page 65
Statistique et Probabilit
r=
(X X )(. Y Y )
2
2
(X X ) (Y Y )
100
200 200
100
= 0,5
200
Y
60
50
40
30
2.
40
50
60
La corrlation entre la taille (X) et le poids (Y) pour les garons de 2me
droite de rgression
a = 0,816
(b)
Y = aX + b
b = -77,0
coefficient de corrlation
r = 0,61
la corrlation est donc positive, de qualit moyenne
3.
(a)
droite de rgression
a = 0,239
(b)
b = 16,6
coefficient de corrlation
r = 0,20
la corrlation est positive (les filles les plus grandes tendent tre les plus
lourdes), mais de trs mauvaise qualit (r proche de zro).
Remarques:
1.
d'une relation linaire (sous forme d'une droite) entre les deux grandeurs
considres.
Un coefficient de corrlation nul ne signifie pas l'absence de toute relation entre
les deux grandeurs. Il peut exister une relation non linaire entre elles.
Page 66
Statistique et Probabilit
(cf. exemple (f) ci-dessus: la connaissance de X nous donne des informations sur
la valeur de Y).
2.
Une bonne corrlation entre deux grandeurs peut rvler une relation de cause
effet entre elles, mais pas ncessairement.
Exemples:
1.
Page 67
Statistique et Probabilit
CHAPITRE 5
ANALYSE COMBINATOIRE
Dfinition
N*
Deux arrangements de p objets sont donc distincts sils diffrent par la nature
des objets qui les composent ou par leur ordre dans la suite.
Exemple :
a) Le nombre de mots de 5 lettres (avec ou sans signification) forms avec les 26
lettres de lalphabet correspond au nombre darrangements possibles avec p
=5 et n =26.
b) Le tierc dans lordre lors dune course de 20 chevaux constitue un des
arrangements possibles avec p = 3 et n =20.
objet
le
peut
tre
observ
plusieurs
fois
dans
un
Page 68
Statistique et Probabilit
avec
Exemple 1 :
On dispose des 6 premires lettres de lalphabet. Combien de sigles de 4 lettres
peut on former ?
Exemple 2 :
Combien pourrait on thoriquement attribuer de numro de tlphone aux
habitants de COTONOU si chaque numro comprenait 8 chiffres ? (Rep : Cest gal
au nombre darrangement avec rptition dun ensemble de 8 lments dans un
ensemble dcimal ( 10 lments) soit
Notons que :
Ainsi :
;
Rappel : Si n
entiers :
1 2 3 ..... p (p + 1) ... (n 1) n = n!
0! =1 par convention car 0! nest en principe pas dfinie.
Exemples :
a) On dispose des 6 premires lettres de lalphabet. Combien de sigles de 4 lettres
distinctes peut on former ?
Professeur : Jol M. ZINSALO/EPAC-UAC
Page 69
Statistique et Probabilit
b) Pour accder une banque de donnes, vous devez taper un mot de passe de 4
lettres sur votre minitel. Combien de mots de passe de 4 lettres distinctes peuton crer ?
c) Combien peut on crire de nombres de 4 chiffres diffrents dans le systme
dcimal ?
Reponse :
Premire mthode : Si lon considre les dix chiffres de 0 9, il y a
arrangements possibles (tirage sans remise, ordonn), mais parmi ceux-ci
figurent tous les nombres commenant par un zro, qui sont en fait des nombres
de 3 chiffres forms de chiffres de 1 9 ce qui en fait
. Il reste donc :
.
2. Permutations
2.1. Permutations sans rptition
Etant donn un ensemble E de n objets, on appelle permutations de n objets
distincts toutes suites ordonnes de n objets ou tout arrangement n n de ces
objets.
Le nombre de permutations de n objets est not :
Page 70
Statistique et Probabilit
La permutation de n objets constitue un cas particulier darrangement sans
rptition de p objets pris parmi n lorsque p = n.
Ainsi le nombre de permutations de n objets est :
NB :
Exemple :
a) Le nombre de manires de placer 8 convives autour dune table est :
P8 = 8! = 40 320 possibilits
b) On dispose des 6 premires lettres de lalphabet. Combien de sigles de 6 lettres
distinctes peut- on former ?
c) Un possesseur de coffre - fort distrait se souvient que pour ouvrir son coffre il
doit former une fois et une seule fois tous les chiffres de 0 9. Ne se rappelant
plus dans quel ordre il faut procder il dcide de former ces chiffres dans tous
les ordres possibles. Sachant que chaque tentative ncessite une minute
combien de temps mettra t il pour les essayer tous ?
d) De combien de faons peut-on repartir 7 personnes sur 7 chaises ?
Page 71
Statistique et Probabilit
Combien y a t-il danagrammes du mot PROBABILITE ?
c) On considre les chiffres 1, 2, 3 et 4. Combien de nombres de 10 chiffres peut
on crire sachant que le 1 est rpt 5 fois, le 2 est rpt 3 fois et le 3 et le 4
ne figurent quune seule fois ?
3. Combinaison
Pour les combinaisons, on ne parle plus de suite ni de srie puisque la notion
dordre des objets nest plus prise en compte. On parle alors de tirages avec ou
sans remise.
Soit E un ensemble fini de cardinal n et p un entier naturel tel que 0
n.
Exemple :
E = {a ; b ; c} et p = 2. Les combinaisons de deux lments de E sont les parties :
{a ; b}, {a ; c} et {b ; c}.
Il est essentiel de noter que :
Dans une partie, les lments sont deux deux distincts.
Deux parties qui contiennent les mmes lments sont gales.
Ainsi {a ; b} = {b ; a}. (L'ordre dans lequel on crit les lments n'a pas
d'importance)
Remarque : On a ncessairement 1 p n et n, p
Page 72
Statistique et Probabilit
Les nombres n et p constituent les coefficients binomiaux.
reprsente le nombre de faons de choisir p objets parmi n (l'ordre n'importe
pas).
Exemples :
a) On tire au hasard 6 boules parmi 49. Combien de tirages possibles peut on
faire ?
b) Quel est le nombre de comits de 3 personnes que l'on peut lire dans une
assemble de 20 personnes ?
c) Lors dun recrutement pour 4 postes de travail identiques, se prsentent 8
hommes et 6 femmes. Combien de recrutements distincts sont possibles ?
Combien de recrutements sont possibles sachant que lon recrute 2 hommes et 2
femmes ?
d) Dune urne contenant 8 boules (3 blanches et 5 noires) on tire simultanment 4
boules. Combien y a t il de tirages possibles ? Dans combien de cas peut on
obtenir exactement deux boules blanches ? au moins deux boules noires ?
Proprits
Donc :
, on a :
Page 73
Statistique et Probabilit
TRAVAUX DIRRIGES
Exercice
Dans une banque, chaque client possde un compte dont le code est compos de 3
lettres et 5 chiffres non ncessairement distincts du type
ABC
5.
1) On suppose que les 3 lettres sont distinctes. Combien peut on ouvrir de
comptes dont le code :
a) commence par A B ?
b) commence A ?
c) contient un A ?
d) contient un A et un B ?
e) commence par A et finit par 1 2 3 ?
2) On suppose que les 3 lettres ne sont plus ncessairement distinctes. Combien
peut on ouvrir de comptes dont le code
a) commence par A ?
b) contient au moins deux A ?
3) On suppose que les 3 lettres ne sont pas ncessairement distinctes et quil est
impossible dutiliser les chiffres 0, 1, 2, 3, 4 qui sont rservs des codes
spciaux. Combien peut on ouvrir de comptes dont le code :
a) commence par A ?
b) finit par 999 ?
c) commence par A et finit par 99 ?
Page 74
Statistique et Probabilit
CHAPITRE 6 :
NOTIONS ET CALCUL DE PROBABILITE
Enfin le calcul des probabilits utilise lanalyse combinatoire ainsi que la thorie
des ensembles.
Page 75
Statistique et Probabilit
1.1. Dfinitions
En face de situations dont lissue est incertaine, on a bien souvent envie
dattribuer chacune des ventualits possibles une vraisemblance plus ou
moins grande. Afin de donner une rigueur mathmatique ce concept, il est
ncessaire tout dabord de donner quelques dfinitions.
Exemple :
=
Ainsi pour une mme preuve, lunivers peut tre fini (toutes les ventualits
sont connues : cas 1) ou infini (toutes les ventualits ne sont pas connues : cas
2 et 3). Dans ces deux derniers cas, lunivers peut tre dnombrable si on peut
numroter les ventualits connues (cas 2) ou bien continu comme dans le cas
du taux de glycmie (cas 3).
Page 76
Statistique et Probabilit
Si
lvnement contraire qui est ralis. Un vnement est donc une assertion
relative aux rsultats dune exprience.
Il est possible quun vnement ne soit constitu que dun seul vnement
lmentaire.
Les vnements sont reprsents par des lettres majuscules, A, B, C, A1, A2, etc.
Exemple :
Dans lexemple concernant les groupes sanguins,
- lvnement A lindividu est de rhsus positif est reprsent par :
avec A
fini dventualits et dans ce cas lensemble des vnements est tel que : () = P
() lunivers des possibles.
Dans le cadre de ce cours, nous nous placerons dans le cas o lensemble des
vnements de lunivers est clairement dfini.
1.2. Evnements remarquables
Lvnement impossible not est lvnement qui ne peut tre ralis quelle
que soit lissue de lpreuve. Bien que constitu daucune ventualit, est
considr comme un vnement :
()
Lvnement certain, not est toujours ralis quelle que soit lissue de
lpreuve. Il est constitu de toutes les ventualits et lon impose que ce soit un
vnement :
()
Page 77
Statistique et Probabilit
Lvnement contraire ou complmentaire dun vnement A, not
est
=;
tel que :
() avec
et
(), A B
( A
AB
B). Lintersection A B
correspond
logique
la
A
Lintersection
conjonction
et
des
.
deux
vnements A et B figure en
vert sur le graphe ci-contre.
Remarque
Lunivers
des
Page 78
Statistique et Probabilit
(parties rouge et verte) et B (parties bleu et verte), lvnement complmentaire
, est form des parties bleu et blanche.
Deux vnements A et B sont incompatibles ou disjoints, sils ne peuvent tre
raliss simultanment. On a alors : A B =
Quelques proprits de lintersection ( ) :
A
vnements incompatibles
A=A
lment neutre ()
A=
lment absorbant ( )
AB=BA
commutativit
A (B C) = (A B) C
associativit
A (B
C) = (A B)
(A C)
1.3.2.
B tel que :
avec
La runion A
A,B
(), A B
()
( A ou B)
vnements complmentaires
A=A
lment neutre ( )
A=
lment absorbant ()
B=B
(B
C) = (A
commutativit
B)
associativit
Page 79
Statistique et Probabilit
A
(B C) = (A
B) (A
C)
=
=
(graphe).
1.3.3.
B.
Limplication logique A
se traduit par linclusion A
B
B
.
Exemple
de
linclusion
de
Ai
ij
Ai A j =
Page 80
Statistique et Probabilit
Un systme complet dvnements est form de toutes les parties de , cest-dire des familles dvnements 2 2 incompatibles dont la runion constitue
lvnement certain .
Le nombre de partitions possibles dans un ensemble fini de n vnements est :
si Card () = n alors Card (P()) =
un espace dventualits
un espace dvnements C
P()
avec :
(P1) A
(P2) Ai
C( i
(P3)
N*)
C et
2. Probabilits
Le passage dune description de type ensembliste des phnomnes alatoires
llaboration dun vritable modle mathmatique se fait en introduisant les
mesures de probabilit.
2.1. Dfinitions
2.1.1.
Concept mathmatique
Page 81
Statistique et Probabilit
satisfaisant les proprits (ou axiomes) suivantes :
2.1.2.
Probabilits combinatoires
satisfaisant
(P1)
avec I pi 0
(P2)
on doit avoir :
avec
Page 82
Statistique et Probabilit
2.1.3.
Si lon rpte N fois une exprience dans laquelle la probabilit dapparition dun
vnement A est P, la frquence de cet vnement au cours des N expriences,
tend vers P lorsque N tend vers linfini. N
Lorsque le nombre dpreuves augmente indfiniment, les frquences observes
tendent vers les probabilits et les distributions observes vers les lois de
probabilit.
2.1.4.
Nous
dfinirons
Espace probabilis
un
espace
probabilis
en
utilisant
laxiomatique
de
Kolmogorov,
Dfinition 1
On appelle probabilit sur (,C) une application P de C dans lintervalle [0,1] telle
que :
P()=1
Page 83
Statistique et Probabilit
Dfinition 2 :
On appelle espace probabilis, le triplet (, C, P).
Ainsi un espace probabilis dsigne un espace fondamental et ses
vnements, muni dune mesure de probabilits.
Additivit
si i j ) alors :
A2
Ai ..
B) = P(A) + P(B)
P(A B).
Exemple :
Dans lexemple du lancer dun d 6 faces, non pip, on considre lvnement A
le rsultat est pair et lvnement B le rsultat est un multiple de trois .
On a alors :
A = {2, 4, 6} et B = {3,6} donc A B = {2,3,4,6} et A B = {6}
avec P(A) = 3/6 P(B) = 2/6 P(A B) = 4/6 P(A B) = 1/6
on vrifie alors que : P(A
2.2.2.
Evnement contraire
Page 84
Statistique et Probabilit
La probabilit lors du lancer dun d non pip dobtenir plus de 2 se traduit par A
= {3,4,5,6} et A = {1,2} do P(A) = 1 P(A) = 1 2/6 = 4/6 = 2/3.
2.2.3.
Evnement impossible
On a :
P( ) = 0.
2.2.4.
Si A
Inclusion
Dfinition
Page 85
Statistique et Probabilit
Exemples :
(1) Dans lexemple du lancer dun d 6 faces, non pip, les deux vnements : A
le rsultat est pair et B le rsultat est un multiple de trois sont statistiquement
indpendants.
En effet, soit A = {2,4,6} B = {3,6} A B ={6}ainsi P(A) = 3/6 P(B) = 2/6 P(A B) =
1/6
on vrifie alors que : P(A B) = P(A) P(B) = 3/6 X 2/6 = 6/36 = 1/6
(2) Si lon considre une famille de deux enfants, les deux vnements : A enfants
de sexe diffrent et B au plus une fille ne sont pas statistiquement
indpendants.
En effet, lespace probabilis , contient 4 vnements lmentaires (si lon
considre une famille ordonne),
=A
2.3.2.
Proprits
sont indpendants : A =
lment absorbant
Gnralisation n vnements
Page 86
Statistique et Probabilit
Remarque
vnements
peuvent
tre
indpendants
deux
deux,
[P(Ai Aj) = P(Ai) x P(Aj)] avec i j sans tre indpendants au sens de la dfinition
ci-dessus.
Exemple :
On jette deux ds non pips et on considre les vnements suivants :
A1 le premier d donne un nombre pair
A2 le deuxime d donne un nombre pair
A3 la somme des deux lancers est paire
Le nombre dvnements lmentaires est : card ( )= 36 (voir arrangements avec rptitions avec
p = 2 et n = 6). Les 3 vnements A1, A2 et A3 sont 2 2 indpendants mais ne sont pas
indpendants dans leur ensemble. En effet :
Les probabilits associes aux 3 vnements sont :
P(A1)= 1/2 ; P(A2)=1/2 ; P(A3)=1/2
A2) = 9/36 = 1/4 = P(A1)P(A2)
P(A1
P(A1
A3) = 9/36 = 1/4 = P(A1)P(A3)
P(A2
A3) = 9/36 = 1/4 = P(A2)P(A3)
A2
A3) = 9/36 =
P(A1)P(A2)P(A3) =
P(A1
1/8.
vnements
A2 ou A1
3. Probabilits conditionnelles
3.1. Dfinition
Soit deux vnements A et B dun espace probabilis avec P(B) 0, on appelle
probabilit conditionnelle de lvnement A si B (ou A sachant B), le
quotient :
Page 87
Statistique et Probabilit
Thorme :
Soit B un vnement de probabilit non nulle, alors :
.
Remarque : La probabilit P(A) est appele la probabilit a priori et P(A / B) ou PB
(A) la probabilit a posteriori car sa ralisation dpend de la ralisation de B.
On observe les relations suivantes :
P(A / A) = 1
Si B
A, alors A B = B et donc :
Formule
des
probabilits
composes.
Par symtrie, P(A B) = P(A / B) P(B) = P(B / A) P(A).
Si A et B sont deux vnements indpendants et que P(B) 0 alors ceci quivaut
affirmer que PB (A) = P(A / B) = P(A).
Lorsque deux vnements sont indpendants, le fait que lun des vnements
soit ralis, napporte aucune information sur la ralisation de lautre. Dans ce
cas la probabilit conditionnelle PB (A) (a posteriori) est gale la probabilit P(A)
(a priori).
Si A et B sont deux vnements indpendants alors ceci quivaut affirmer que :
Exemple : Dans lexemple du lancer dun d 6 faces, non pip, les deux
vnements : A le rsultat est pair et B le rsultat est un multiple de trois sont
indpendants (voir exemple).
Ainsi la probabilit que la face soit paire sachant que cest un multiple de 3 est :
Professeur : Jol M. ZINSALO/EPAC-UAC
Page 88
Statistique et Probabilit
si
et
A = {2,4,6}
P(A)=3/6
B ={3,6} A B={6}
P(B)=2/6
P(A B)=1/6.
do :
Exemple :
Une population animale comporte 1/3 de mles et 2/3 de femelles. Lalbinisme
frappe 6 % des mles et 0,36 % des femelles. La probabilit pour quun individu
pris au hasard (dont on ignore le sexe) soit albinos est :
Si A = {mle} et
B = {albinos} et
= {non albinos}
1/3) + (0,0036
2/3) = 0,0224
Page 89
Statistique et Probabilit
Cest la Formule de Bayes.
Remarque : La formule de Bayes est utilise de faon classique pour calculer des
probabilits
de
causes
dans
des
diagnostics
(maladies,
pannes,
etc.).
Page 90
Statistique et Probabilit
TRAVAUX DIRIGES
Exercice 1
Une entreprise possde 3 machines A, B et C. On note
(respectivement
et
Exercice 2
On range 5 objets dans trois tiroirs discernables. En supposant que les diffrentes
faons deffectuer ces rangements soient quiprobables, calculer la probabilit que
lun des 3 tiroirs contienne au moins 3 objets.
Exercice 3
Dans une entreprise, la probabilit pour quun ouvrier A quitte lentreprise dans
lanne est 1/5 et la probabilit pour quun cadre B quitte lentreprise est 1/8. En
supposant ces 2 vnements indpendants, calculer la probabilit que :
1) A et B quittent lentreprise.
2) lun des 2 quitte lentreprise.
3) ni A, ni B ne quittent lentreprise.
4) B seulement quitte lentreprise.
Exercice 4
Dans une entreprise, lors dune runion comprenant 5 cadres, 7 employs et 15
ouvriers, on choisit au hasard successivement n personnes.
1) Si n = 2, calculer la probabilit de choisir un cadre puis un employ.
2) Si n = 3, calculer la probabilit de choisir un cadre, puis un employ, puis un
ouvrier.
Page 91
Statistique et Probabilit
Exercice 5
En tudiant une population, on a remarqu que, durant un mois, 40% des individus
sont alls au cinma, 25 % sont alls au thtre et 12,5% sont alls au cinma et
au thtre. Calculer la probabilit que durant un mois, un individu :
1) aille au cinma ou au thtre
2) naille pas au cinma
3) naille ni au cinma, ni au thtre
4) aille au cinma mais pas au thtre
5) sachant quil est all au cinma, aille aussi au thtre
6) sachant quil nest pas all au thtre, naille pas au cinma.
Exercice 6
Un serveur de banque de donnes a calcul en fonction de sa clientle quun
individu essayant un mot de passe au hasard est refoul 999 fois sur 1000.
Sachant que lordinateur accepte trois essais de mot de passe avant de couper la
connexion, quelle est la probabilit de se dconnecter par hasard ?
Exercice 7
Une entreprise utilise 3 machines diffrentes pour fabriquer des arbres de
transmission de mme diamtre et de mme longueur. 40% des arbres sont
fabriqus par la machine A, 30% par la machine B et 30% par la machine C. Malgr
les rglages frquents, ces machines produisent des arbres dfectueux, compte
tenu des normes de fabrication.
Machine
pourcentage de dfectueux 2%
B
4%
C
5%
Page 92
Statistique et Probabilit
Exercice 8
Dans une entreprise, une machine A fabrique 40% des pices et une machine B
fabrique 60% des pices. La proportion des pices dfectueuses fabriques par A
est 3% et par B de 2%. On choisit une pice au hasard.
1) Calculer la probabilit quelle soit dfectueuse.
2) Sachant quelle est dfectueuse, calculer la probabilit quelle soit fabrique
par A.
Exercice 9
On soumet 1080 personnes un test psychotechnique not de 0 5. Les rsultats
sont consigns dans le tableau suivant, o les individus ont t classs en trois
grandes catgories suivant le secteur dactivit de leur emploi actuel.
Notes
Secteur
Industrie
Agriculture
Services
A
B
C
60 60 60 60 60 60
40 40 80 80 0
0
80 60 60 80 80 120
Page 93
Statistique et Probabilit
Chapitre 7 :
NOTIONS DE VARIABLES ALEATOIRES
ET DE LOI DE PROBABILITE
Remarque : On se limitera ici au cas des variables alatoires relles (les entiers
faisant bien sr partie des rels).
telle que :
obligatoirement
valeurs
variable
possibles
prises
alatoire
dvnements
autant
par
de
la
que
lmentaires.
La
pour lvnement
lmentaire .
Professeur : Jol M. ZINSALO/EPAC-UAC
Page 94
Statistique et Probabilit
Exemple :
Si lon considre la constitution dune fratrie de deux enfants, lespace fondamental
est constitu des vnements lmentaires suivant : = {GG, GF, FG, FF}
Les valeurs possibles prises par la variable alatoire X, nombres de fille dans la
famille sont :
X () = {0, 1, 2}.
1. Variables alatoires discrtes
1.1. Dfinition
Une variable alatoire est dite discrte si elle ne prend que des valeurs
discontinues dans un intervalle donn (born ou non born). Lensemble des
nombres entiers est discret. En rgle gnrale, toutes les variables qui rsultent
dun dnombrement ou dune numration sont de type discrtes.
1.2. Loi de probabilit
Une variable alatoire est caractrise par lensemble des valeurs quelle peut
prendre et par lexpression mathmatique de la probabilit de ces valeurs. Cette
expression sappelle la loi de probabilit (ou distribution de probabilit) de la
variable alatoire.
Afin
de
simplifier
lcriture,
nous
noterons
pour la suite du cours :
P({X = xi}) quivalent P(X = xi) ou Pi
Page 95
Statistique et Probabilit
1.3. La fonction de rpartition
On appelle fonction de rpartition dune variable alatoire X, la fonction FX telle
que :
FX : R R
t FX (t) = P(X < t)
Concrtement la fonction de rpartition correspond la distribution des
probabilits cumules. Le plateau atteint par la fonction de rpartition
correspond la valeur de probabilit 1 car
(P1) t
, 0 FX (t) 1
(P3) lim
(t) = 0 et
lim
(t) = 1
t +
Voici pourquoi :
(P1) rsulte de la dfinition dune probabilit.
{X < b } donc P(X < a ) P(X < b ) voir inclusion
Exemple :
On considre lvnement lancer de 3 pices . On introduit une variable
alatoire X dfinie par X() nombre de piles de lvnement . La loi de
probabilit de X est :
Nombre P( X =
de piles
0
1/8
1
3/8
2
3/8
3
1/8
)
1/8
4/8
7/8
1
Page 96
Statistique et Probabilit
Exercice 1
Un joueur lance deux ds dont les faces sont numrotes de 1 6. On suppose que
les ds sont non-truqus et donc que pour chaque d, toutes les faces ont la mme
probabilit d'apparition.
Le joueur suivant les rgles suivantes :
- Si les deux ds donnent le mme numro alors le joueur perd 10 points
- Si les deux ds donnent deux numros de parits diffrentes (l'un est pair et
l'autre impair) alors il perd 5 points.
- Dans les autres cas il gagne 15 points.
Le joueur joue une partie et on note X la variable alatoire correspond au nombre
de points obtenus par lui.
a. Dterminez la loi de probabilit de X puis calculez l'esprance de X.
b. Reprsentez graphiquement la fonction de rpartition de X.
Solution
L'univers W est l'ensemble des rsultats possibles aprs le lancer des deux ds.
Ici, W correspond au produit cartsien {1 , 2 , 3 , 4 , 5 , 6}x{1 , 2 , 3 , 4, 5 , 6}. Son
cardinal est Card(W) = 6 = 36.
Comme on suppose qu'il y a quiprobabilit des rsultats des lancers, on a alors :
Pour tout vnement A de W,
P(A) =
Card(A)
Car(W)
a:
Page 97
Statistique et Probabilit
P( X = - 10 ) = 6 / 36 = 1 / 6
De mme, l'vnement "X = -5" est l'vnement "obtenir 2 numros de parits
diffrentes".
C'est donc l'ensemble des couples (a , b) tels que a soit dans {1,3,5} et b soit dans
{2,4,6} ou bien a soit dans {2,4,6} et b soit dans {1,3,5}.
La cardinal de cet vnement est donc : 3x3 + 3x3 = 18.
D'o :
P( X = - 5) = 18 /36 = 1/2.
-10
-5
15
P(X = k)
Page 98
Statistique et Probabilit
Exercice 2
Lors dune enqute, on a interrog 5 hommes et 3 femmes. On choisit au hasard et
sans remise les personnes une une jusqu obtention dun homme. Soit X le
nombre de tirages ncessaires. Dterminer les valeurs de X et sa loi de probabilit.
Exercice 3
Soit X la variable alatoire dfinie par le tableau suivant :
1
0,25
Dterminer la valeur de
et
0,18
5
0,37
quiprobables.
telle que :
(P1)
f (x) 0
Page 99
Statistique et Probabilit
(P2)
laire
de
f(x) :
hachure
en
vert
laire
hachure
en
bleu
Remarque : Cette fonction densit de probabilit est une loi de probabilit car
laire sous la courbe est gale 1 pour toutes les valeurs de x dfinies.
Rciproquement :
Une variable alatoire X dfinie sur un univers est dite absolument continue,
sil existe une fonction densit de probabilit telle que :
Page 100
Statistique et Probabilit
est la primitive (voir cours danalyse) de la
La fonction de rpartition
P(a X b) =
(P2)
alors :
(b) -
(a) =
avec a < b
Voici pourquoi :
(P1 ) P(a X b) = P(X < b) - P(X < a) = FX (b) - FX (a) do :
(P2) Si f est continue sur un intervalle de la forme [a, a+h] avec h 0+ alors,
f (a+h) f(a) et
h f (a+h) 0
Page 101
Statistique et Probabilit
Fonction de rpartition FX
(P4)
lim F (t) = 0
X
et
lim F (t) =1
X
t +
Page 102
Statistique et Probabilit
Exercice 1
On considre la fonction f de
dans
dfinie par :
la densit de
Exercice 2
Soit une variable alatoire continue dont la fonction de rpartition F est dfinie
par :
3. Esprance et Variance
Une loi de probabilit peut tre caractrise par certaines valeurs typiques
correspondant aux notions de valeur centrale, de dispersion et de forme de
distribution.
3.1.
Esprance mathmatique
3.1.1.
. En effet lorsque le
Page 103
Statistique et Probabilit
Si X est une variable alatoire discrte dfinie sur un univers probabilis , on
appelle esprance de X, le rel dfini par :
Thorme :
Si X est une variable alatoire discrte de loi de probabilit (xi, pi)i dfinit sur un
nombre fini (n) dvnements lmentaires alors :
Exercice
Soit X la variable alatoire dfinie par le tableau ci-contre :
-2
-1
3.1.2.
Proprits de lesprance
Les proprits de lesprance valent aussi bien pour une variable alatoire
discrte ou une variable alatoire absolument continue.
Page 104
Statistique et Probabilit
Si X et Y sont deux variables alatoires dfinies sur un mme univers ,
admettant une esprance, alors :
(P1)
E(X+Y) = E(X)+E(Y)
(P2)
E(aX) = aE(X) a
(P3)
Si X 0 alors E(X) 0
(P4)
X () = k alors E(X) = k.
(P3) X
0 implique que
positive, E(X) 0.
Nous verrons les applications directes de ces proprits dans le cadre des
oprations sur les variables alatoires.
3.2. Variance
La variance dune variable alatoire V(X) est lesprance mathmatique du carr
de lcart lesprance mathmatique. Cest un paramtre de dispersion qui
correspond au moment centr dordre 2 de la variable alatoire X. Cest
Page 105
Statistique et Probabilit
lquivalent de la variance observe S2. En effet lorsque le nombre dpreuves n
est grand, S2 tend vers V(X) (voir estimation).
Si X est une variable alatoire ayant une esprance E(X), on appelle variance de
X le rel :
V(X) = E([X - E(X)]2)
Autre notation :
Proprits
P1
de
Proprits
P4
lesprance
V(X) = E(X2) 2E(X)2 + E(X)2 = E(X2) E(X)2
de lesprance
Remarque : Si X() est infini, il nest nullement vident que V(X) existe. De plus
comme :
[X E(X)]2 0 ncessairement V(X) 0. Par dfinition, une variance est toujours
positive.
La variance est galement note 2 si aucune confusion nest craindre.
Si X est une variable alatoire ayant une variance V(X), on appelle cart-type de
X, le rel :
3.2.1.
Si X est une variable alatoire discrte de loi de probabilit (xi, pi)i dfinie sur un
nombre fini (n) dvnements lmentaires alors la variance est gale :
3.2.2.
Page 106
Statistique et Probabilit
3.2.3.
Proprits de la variance
(P2)
(a, b)
(P3)
V (X) = 0
V (aX) = a2 V (X)
,
,
V (aX + b) = a2 V (X)
X = E(X)
NB :
Calcul des moments dordre k (k
suivante :
suivante :
Page 107
Statistique et Probabilit
Par convention on a :
Page 108
Statistique et Probabilit
Variable Y : Y() = {0,1} E(Y) = 1/2 V(Y) =
4.2.
sappliquent
aussi
bien
aux
variables
alatoires
discrtes
ou
absolument continues.
Thorme :
Si X et Y sont deux variables alatoires indpendantes dfinies sur le mme
univers alors :
Exemple :
Dans lexemple concernant la rpartition des deux billes dans les 2 boites, la
relation
E(XY) = E(X)E(Y) est vrifie car : E(X) = 1 ; E(Y) = 1/2 et E(XY) = cependant les
variables alatoires X et Y ne sont pas indpendantes.
En effet
Page 109
Statistique et Probabilit
Remarque : Lapplication rciproque nest pas vraie. La relation V(X + Y) = V(X) +
V(Y) nimplique pas forcment lindpendance de deux variables.
Exemple :
Si lon reprend lexemple de la rpartition de deux billes dans deux boites, la
distribution de probabilit de la variable alatoire (X+Y) est :
Variable X+Y : X+Y()={0,1,2,3}
E(X+Y)=3/2 V(X+Y)=3/4
Comme V(X) = 1/2 et V(Y) = 1/4 alors
V(X) + V(Y) = 3/4 = V(X+Y) On retrouve ainsi la relation V(X + Y) = V(X) + V(Y) bien
que X et Y ne soient pas indpendantes.
(P3)
Professeur : Jol M. ZINSALO/EPAC-UAC
Page 110
Statistique et Probabilit
Remarque : Si X et Y sont indpendantes, = 0 mais la rciproque est fausse. Il
peut arriver, par hasard, que = 0 sans que X et Y soient indpendantes.
Page 111
Statistique et Probabilit
dite variable alatoire centre rduite et dont lemploi est indispensable pour
utiliser la plupart des tables notamment les tables de la loi normale rduite.
indpendantes
alors :
Page 112
Statistique et Probabilit
EXERCICE 1
Dans une ville, une banque met en place 5 guichets automatiques, dans 5 quartiers
diffrents : 3 guichets du type carton rouge et 2 guichets du type carte verte . la
probabilit quun guichet du type carton rouge soit hors service pendant un week
end est 0,1, et la probabilit quun guichet du type carte verte durant un week
end est 0,2. Soit X le nombre de guichets carte rouge hors service et Y le nombre
de guichets carte verte hors service, durant un week end.
1. Donner la loi du couple.
2. Calculer la probabilit quun client possdant une carte rouge puisse se servir
un guichet automatique, un week end.
3. Un client possde une carte rouge et une carte verte. Calculer la probabilit quil
puisse se servir un guichet automatique, sachant tous les guichets carte verte
sont hors service.
4. Calculer E(X) et E(Y).
5. Calculer cov(X,Y).
6. Calculer
et
Page 113
Statistique et Probabilit
Chapitre 8 :
LOIS DE DISTRIBUTIONS STATISTIQUES
1. Lois discrtes
Par dfinition, les variables alatoires discrtes prennent des valeurs entires
discontinues sur un intervalle donn. Ce sont gnralement le rsultat de
dnombrement.
1.1. Loi uniforme
1.1.1. Dfinition
Une distribution de probabilit suit une loi uniforme lorsque toutes les valeurs
prises par la variable alatoire sont quiprobables. Si n est le nombre de valeurs
diffrentes prises par la variable alatoire,
Exemple :
La distribution des chiffres obtenus au lancer de d (si ce dernier est non pip)
suit une loi uniforme dont la loi de probabilit est la suivante :
et pour variance
Page 114
Statistique et Probabilit
[1, n]) :
V(X) = pq
car par
dfinition
Page 115
Statistique et Probabilit
do V(X) = p p2 = p (1 p) = pq
Il est facile de dmontrer que lon a bien une loi de probabilit car :
Page 116
Statistique et Probabilit
tirage non exhaustif si :
dfectueuses dans un lot et que lon tire un chantillon non exhaustif de taille
n, la loi binomiale donne la probabilit davoir k lments dfectueux dans
lchantillon, on peut crire :
et
do E(Sn) = np.
La variance dune variable binomiale Sn est gale :
V(Sn) = npq
do V(Sn) = npq.
Page 117
Statistique et Probabilit
Exercice
Pour raliser le montage dun systme lectronique, on dispose de rsistances
issues dune production importante, o lon sait que le pourcentage p de
dfectueuses est de 5%. On doit utiliser 4 rsistances.
a) Quelle est la probabilit den avoir 3 de mauvaises ?
b) Quelle est la probabilit den avoir un nombre infrieur ou gal 3 de
mauvaises ?
Exercice 1
Pour accder un guichet automatique, il faut utiliser une carte magntique et un
code confidentiel. Un client tapant un code au hasard est refus 999 fois sur 1000.
Soit X le nombre dessais ncessaires pour accder au guichet.
a) Quelle est la loi de probabilit de X ?
b) Calculer P(X =1).
c) Sachant quau bout de trois essais infructueux, la carte est confisque,
calculer la probabilit daccder au guichet par hasard.
d) Combien faut il dessais en moyenne pour accder au guichet par hasard ?
Page 118
Statistique et Probabilit
1.5.
Loi hypergomtrique
Si lon ne peut pas faire lhypothse dun tirage avec remise donc faire lhypothse
dun tirage sans remise dit tirage exhaustif et dans ce cas :
, la loi
n : taille de lchantillon
lot initial
K : nombre dlments dfectueux dans le lot gal N . p
k : nombre dlments dfectueux auxquels on sattend dans lchantillon.
La probabilit davoir k dfectueux est :
Exemple :
Dans un lot de 25 pices dont 5 sont mauvaises, quelle est la probabilit den tirer
3 de dfectueuses pour un chantillon de 5 ?
Rponse :
Exercice 1
Dans une PME, sont employs 6 ouvriers et 5 employs. Le PDG, souhaitant
prendre lavis de son personnel, interroge 7 personnes choisies au hasard parmi
ces 11 personnes. Soit X la variable alatoire : nombre douvriers interrogs .
a) Quelles sont les valeurs prises par X ?
b) Quelle est sa loi de probabilit ?
c) Calculer la probabilit dinterroger 4 ouvriers.
Page 119
Statistique et Probabilit
On appelle processus poissonnien (ou processus de Poisson), le modle
probabiliste des situations qui voient un flux dvnements se produire les uns
la suite des autres de faon alatoire (dans le temps et dans lespace), obissant
aux conditions suivantes :
-
Ainsi, des vnements qui se ralisent de faon alatoire comme des pannes de
machines, des accidents davions, des fautes dans un texte, peuvent tre
considrs comme relevant dun processus poissonnien.
Une variable alatoire X valeurs dans R suit une loi de Poisson de paramtre
( > 0) si les rels pk sont donns par :
on note : X P().
Remarque : Une loi de Poisson est donne par sa loi de probabilit :
(1) k, P(X = k) > 0
(2) On a :
Or :
do :
Comme pour la loi binomiale, il est possible dutiliser une formule de rcurrence
pour calculer les valeurs des probabilits successives :
Page 120
Statistique et Probabilit
1.6.2. Esprance et variance
Lesprance dune variable alatoire de Poisson est E(X) =
Par dfinition :
avec k
avec :
do
Remarque : Il est noter que dans le cas dune variable alatoire de Poisson,
lesprance et la variance prennent la mme valeur. Ceci est un lment
prendre en compte lors des tests de conformit une loi de probabilit.
Exercice 1
Le nombre de micro-ordinateurs vendus chaque jour dans un magasin sui une loi
de Poisson de paramtre 4. Calculer la probabilit que dans une journe :
a) on ne vende aucun micro-ordinateur,
b) on vende 4 micro-ordinateurs,
c) on vende au moins un micro-ordinateur,
d) le nombre de micro-ordinateurs vendus soit compris (au sens large) entre 2 et
6.
Page 121
Statistique et Probabilit
1.7. Loi binomiale ngative
1.7.1. Dfinition
Sous le schma de Bernoulli (preuves identiques et indpendantes), on dsire
obtenir n succs et lon considre la variable alatoire discrte X qui reprsente
le nombre dpreuves indpendantes k ncessaire lobtention des n succs.
X suit une loi binomiale ngative de paramtres n et p note BN (n,p) si :
avec k, n
N et k n.
Remarque :
Dans le cas de la loi binomiale ngative, le nombre de succs n est connu et lon
cherche le nombre dpreuves k, ncessaire pour obtenir les n succs. Ainsi le
dernier vnement est connu car les preuves cessent avec lobtention du nieme
succs et lon choisit n-1 objets parmi k-1.
Exemple :
Pour tudier le domaine vital dune population de poissons, des metteurs radio
sont fixs au niveau de la nageoire dorsale aprs une lgre anesthsie locale.
Suite divers alas, on considre que 30 % des poissons quips ne sont pas
reprs par la suite. Si lon considre quun minimum de 15 poissons doivent tre
suivis pour avoir des rsultats statistiquement acceptables, la variable alatoire X
nombre de poissons devant tre quips suit une loi binomiale ngative X BN
(15, 0,70). En posant comme hypothse que les causes de pertes de liaisons radio
soient suffisamment nombreuses pour assurer lindpendance entre chaque
preuve, la probabilit dtre oblig dquiper 20 poissons est de :
Page 122
Statistique et Probabilit
Problme sur lois discrtes
Problme
Dans une entreprise, on a mis au point le systme de test suivant pour vrifier la
qualit des produits. On teste 10 produits ensemble :
-
On sait que la probabilit pour quun ensemble de 10 produits soit accept est gale
0,9. On teste 50 produits par groupes. Soit X le nombre total de tests.
1) Quelles sont les valeurs prises par X ?
2) Donner la loi de probabilit de X.
3) Calculer lesprance et lcart type de X.
4) Comparer ces rsultats avec ceux obtenus si chaque produit est test
individuellement. Quelle mthode vous semble la plus intressante ?
2. Lois continues
Par dfinition, les variables alatoires continues prennent des valeurs continues
sur un intervalle donn.
2.1. Loi uniforme
La loi uniforme est la loi exacte de phnomnes continus uniformment rpartis
sur un intervalle. La variable alatoire X suit une loi uniforme sur le segment
[a,b] avec a < b si sa densit de probabilit est donne par :
Fonction de rpartition
Page 123
Statistique et Probabilit
Quelques commentaires :
(1) La loi uniforme continue tant une loi de probabilit, laire hachure en
rouge sur la figure ci-dessus vaut 1. Ceci implique que la valeur prise par f(x)
vaut
[a,b] vaut :
(3) La fonction de rpartition associe la loi uniforme continue est telle que :
FX (x) = 0 si x < a
FX (x) = 1 si x > b
Or
Page 124
Statistique et Probabilit
Ainsi
la
taille
corporelle
dun
animal
dpend
des
facteurs
avec
R et
Notation :
R+
X ( , )
Page 125
Statistique et Probabilit
Thorme : Stabilit de la loi normale
Soient X1 et X2 deux variables alatoires normales indpendantes de paramtres
respectifs (1, 1) , (2, 2), alors leur somme X1+X2 est une variable alatoire
normale de paramtres (1 + 2,
).
x R,
f(x) 0
Lesprance dune loi normale rduite est : E(X) = 0. La variance dune loi
normale rduite est : V(X) = 1
une variable centre rduite suit une la loi normale rduite N (0,1).
Page 126
Statistique et Probabilit
Les proprits associes la fonction de rpartition sont :
(P1) est croissante, continue et drivable sur R et vrifie :
lim (t) = 1
t +
et
lim (t) = 0
t
(P2)
(t) + (-t) = 1 t
Exercice 1
Les dpts mensuels dans une agence bancaire suivent une loi normale de
moyenne 600 000F et dcart type 10 000F. Calculer la probabilit pour que les
dpts dun mois soient :
a) infrieurs 600 000F ;
b) infrieurs 620 000F ;
c) compris entre 590 000F et 610 000F ;
d) compris entre 560 000F et 620 000F.
2.2.5. Approximations
Pour
C'est--dire que, pour les calculs de probabilit, on peut remplacer la loi de Poisson
de paramtre
Page 127
Statistique et Probabilit
Exercice 1
Une usine fabrique des vis dont 3% ont des dfauts.
a) On prlve 1000 vis au hasard ; quelle est la probabilit davoir 50 vis
dfectueuses ? davoir entre 20 et 40 vis dfectueuses ?
b) On veut 1950 vis sans dfaut. Par prudence, on en prlve 2000 au hasard.
Quelle est la probabilit davoir suffisamment de vis en bon tat ?
Exercice 2
Le nombre de pannes, par mois, sur une certaine machine, suit une loi de Poisson
de moyenne 3. Un atelier fonctionne avec 12 machines de ce type, indpendantes.
En un mois, quelle est la probabilit de constater dans cet atelier plus de 42
pannes ? entre 36 et 45 pannes ?
telles que :
E(Sn ) = n
V(Sn ) = n2
E(Mn ) =
Page 128