Cours de Probabilité MR LAKHAL Elhasan

COURS DE MATHEMATIQUES
PROBABILITES ET STATISTIQUES
Troisième année : Filière Offshoring. Option : qualité logicielle
LAKHEL El Hassan
Université Cadi Ayyad
Ecole Nationale des Sciences Appliquées
Safi
www.ensasafi.ma
Année Universitaire : 2006-2007

Table des matières
I Probabilités 4
1 L’espace de probabilité (Ω, F, P ) 5

1.1 Introduction : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 L’univers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Evénements et opérations sur les événements . . . . . . . . . . . . . . . . . . 6
1.4 Tribu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Le concept de probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.6 Définition d’une probabilité sur un espace Ω fini. . . . . . . . . . . . . . . . . 9
1.6.1 Equiprobabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6.2 Eléments d’analyse combinatoire . . . . . . . . . . . . . . . . . . . . . 11
1.6.3 Exemples fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.7 Résumé du premier chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 Probabilités conditionnelles et indépendance 18

2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Probabilité conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3 Indépendance d’événements et de sous-tribus. . . . . . . . . . . . . . . . . . 21
2.3.1 Indépendance d’événements . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.2 Indépendance de sous-tribus . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 Application : Apparition d’un pile dans un schéma de Bernoulli . . . . . . . . 23
2.5 Résumé du deuxième chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3 Les variables aléatoires 29

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.3 Probabilité image et loi d’une variable aléatoire . . . . . . . . . . . . . . . . . 29
3.4 Cas des variables aléatoires réelles . . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.1 Fonction de répartition . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.5 Lois discrètes et lois continues . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.1 Lois discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.2 Lois continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Les lois usuelles au programme . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.6.1 Le cas fini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.6.2 La loi uniforme discrète . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.6.3 La loi de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.6.4 La loi binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.6.5 Le cas dénombrable . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.6.6 La loi géométrique de paramètre p ∈]0, 1[ . . . . . . . . . . . . . . . . 38
1
3.6.7 La loi de Poisson de paramètre λ ∈]0, ∞[ . . . . . . . . . . . . . . . . 38
3.6.8 Le cas continu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.6.9 La loi uniforme continue sur le segment [a, b] : . . . . . . . . . . . . . . 40
3.6.10 lois gaussiennes (ou lois normales) . . . . . . . . . . . . . . . . . . . . 40
3.6.11 La loi exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.7 Variables aléatoires indépendantes . . . . . . . . . . . . . . . . . . . . . . . . 43
3.8 Résumé du troisième chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.9 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4 Espérance et variance d’une variable aléatoire réelle 50

4.1 Cas des variables aléatoires discrètes . . . . . . . . . . . . . . . . . . . . . . . 50
4.1.1 Espérance d’une fonction d’une variable aléatoire réelle . . . . . . . . 51
4.2 Cas des variables aléatoires à densité . . . . . . . . . . . . . . . . . . . . . . . 52
4.3 Linéarité de l’espérance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.4 Moments, variance et écart-type . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.5 Inégalités classiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.5.1 L’inégalité de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.5.2 L’inégalité de Bienaymé-Tchebycheff . . . . . . . . . . . . . . . . . . . 54
4.5.3 L’inégalité de Jensen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.6 L’espérance et la variance des lois classiques . . . . . . . . . . . . . . . . . . . 55
4.7 Fonctions caractéristiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.7.1 Intégration d’une fonction complexe . . . . . . . . . . . . . . . . . . . 58
4.7.2 Fonction caractéristique d’une variable aléatoire réelle . . . . . . . . . 58
4.7.3 Exemples de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.8 Théorème d’unicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.9 Annexe : Définition de l’espérance d’une variable aléatoire : Cas général . . 62
4.9.1 Théorème de transferet . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5 Variables aléatoires vectorielles 70

5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.2 Couples aléatoires discrets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.3 Couples aléatoires à densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.4 Indépendance et espérance de produits . . . . . . . . . . . . . . . . . . . . . . 73
5.5 Covariance et coefficient de corrélation linéaire . . . . . . . . . . . . . . . . . 73
5.5.1 Covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.5.2 coefficient de corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6 Théorèmes limites 77
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.2 Les différents types de convergence . . . . . . . . . . . . . . . . . . . . . . . . 77
6.2.1 La convergence en probabilité . . . . . . . . . . . . . . . . . . . . . . . 77
6.2.2 La convergence presque sûre . . . . . . . . . . . . . . . . . . . . . . . . 77
6.2.3 La loi faible des grands nombres . . . . . . . . . . . . . . . . . . . . . 78
6.2.4 La convergence en loi . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.3 Le théorème central limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
2
II Statistiques 84
7 Introduction aux statistiques 85

7.1 Introduction : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.1.1 Les statistiques, les probabilités, la statistique . . . . . . . . . . . . . . 85
7.1.2 La démarche statistique . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.2 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
7.3 Estimation ponctuelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
7.3.1 Estimation de la moyenne . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.3.2 Estimation de la variance . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.4 Estimation par intervalle confiance . . . . . . . . . . . . . . . . . . . . . . . . 90
7.4.1 Etude de cas des échantillons de grande taille n ≥ 30 . . . . . . . . . . 90
7.4.2 Etude de cas X ∼ N (m, σ 2 ) . . . . . . . . . . . . . . . . . . . . . . . . 92
7.5 Tests paramètriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8 Examens corrigés des années universitaires 2005-2007 96

8.1 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
3
Première partie
Probabilités
4
Chapitre 1
L’espace de probabilité (Ω, F, P )
1.1 Introduction :
La théorie des probabilités est la science qui étudie les expériences aléatoires. On entend
par expérience aléatoire toute procédure ayant un ensemble bien défini de résultats mais dont
on ne sait pas dire à l’avance lequel va avoir lieu.
Le but du cours de probabilités est de modéliser des situations où intervient le hasard. On
aimerait pouvoir construire un cadre commun pour étudier des expériences aléatoires très
divers :
Exemples :
1. Le jet d’un dé,
2. Le jet successif de n pièces de monnaie,
3. La durée de vie d’une ampoule.
Ce cadre commun sera l’espace de probabilité. Il est composé de plusieurs ingrédients : un
univers qui décrit l’ensemble des issues possibles de l’expérience aléatoire, une tribu qui donne
l’ensemble des événements et une probabilité qui associe à chaque événement un nombre qui
donne la chance qu’à cet événement de se réaliser.
1.2 L’univers
Définition 1.1. L’ensemble des résultats d’une expérience aléatoire est appelé l’univers. On
le note généralement Ω.
Exemples : Dans chacun des exemples précédents, on a :
1. Ω = {1, 2, 3, 4, 5, 6}.
2. Ω = {P, F }n (pour n = 2, on a Ω = {P P, P F, F P, F F } = {P, F }2 ).
3. Ω = R+
Remarque :
On peut aussi modéliser des phénomènes aléatoires plus complexes. Donnons un exemple :
Etude d’une file d’attente. Des clients arrivent successivement d’une manière aléatoire et
forment ainsi une file d’attente devant un guichet. Le temps de service pour chaque client,
peut être également modélisé par une grandeur aléatoire. On étudie la longueur de la file
d’attente, en fonction du temps et des paramètres qui interviennent dans la modélisation, à
savoir la durée de service, le temps d’inter-arrivée des clients.
On se demande si la file à tendance à se diminuer ou au contraire à augmenter.
5
1.3 Evénements et opérations sur les événements
Définition 1.2. Un événement est une partie A de Ω, c’est un fait lié à une expérience qui
peut se produire ou non.
Exemples : Dans nos trois situations, A pourrait, par exemple, être :
1. A = {2, 4, 6} : ”obtenir un nombre pair.”
2. A = {P } × {P, F }n−1 : ” Le premier lancer est pile.”
3. A = [100, +∞[ : ”l’ampoule fonctionne plus de cent heures.”
Notation On note P(Ω) l’ensemble de toutes les parties de Ω.

On va utiliser toutes les opérations sur les ensembles :
Notation vocabulaire ensemblite vocabulaire probabiliste

Ω événement certain
∅ ensemble vide événement impossible
{ω} singleton ω événement élémentaire ω
A⊂B A est inclus dans B A implique B
Ac complémentaire de A Le contraire de A est réalisé
A
S∪ B A union B A ou B est réalisé
i∈I Ai union des (Ai )i ∈ I l’un des Ai est réalisé
A
T∩ B A inter B A et B sont réalisés
i∈I Ai intersection des (Ai )i ∈ I tous les Ai sont réalisés
1.4 Tribu
En général, on ne peut pas prendre toutes les parties de Ω comme événements, on doit se
limiter à des familles vérifiant certaines propriétés :
Définition 1.3. Soit Ω un ensemble. Une famille F de parties de Ω est appelée une tribu si
elle vérifie les propriétés suivantes :
i) Ω est un élément de F
ii) (stabilité par complémentaire) Si A est un élément de F, alors Ac est un élément de
F
iii) (stabilité par union dénombrable) Si les (Ai )i∈N sont des éléments de F, alors ∪i∈N Ai
est un élément de F.
Définition 1.4. Soit Ω un ensemble muni d’une tribu F, le couple (Ω, F) est appelé ensemble
mesurable, et les éléments de F sont appelés des événements.
♣Exercice : Vérifier que P(Ω) et {∅, Ω} sont des tribus sur Ω.
♣ Exercice : Soit A une partie de Ω. Montrer que {∅, A, Ac , Ω} est une tribu sur Ω.
♣♣ Exercice : Soit Ω un ensemble, et A et B deux parties de Ω. on pose

F = {∅, A, B, A ∩ B, A ∪ B, Ac , B c , (A ∩ B)c , (A ∪ B)c , A ∩ B c , Ac ∩ B, A ∪ B c , Ac ∪ B, Ω}
Montrer que F est une tribu.
Remarque : Si Ω = R, la tribu habituellement utilisée est la plus petite tribu contenent tous
les intervalles ouverts. On l’appelle tribu borélienne et on la note B(R)
6
Proposition 1.5. Soit Ω un ensemble muni d’une tribu F, alors :
i) ∅ est dans F,
ii) Pour tout A et B de F, on a A ∩ B, A ∪ B A\B sont dans F.
iii) Si les (Ai )i∈N , sont des éléments de F, alors ∩i∈N Ai est un élément de F (stabilité
par intersection dénombrable).
Preuve.
i) ∅ = Ω et Ω ∈ F, donc ∅ ∈ F.
ii) A ∪ B ∈ F par définition.
A ∩ B = A ∪ B ∈ F car A ∪ B ∈ F
A\B = A ∩ B ∈ F d’après ce qui précède.
iii) ∩i∈N Ai = ∪i∈N Ai ∈ F.
Remarque : Une tribu est stable par réunion et intersection finie.
1.5 Le concept de probabilité

Définition 1.6. Soit Ω un ensemble muni d’une tribu F. Une application P de F dans [0, 1]
est une probabilité si elle vérifie les propriétés suivantes :
i) P (Ω) = 1
ii) (σ−additivité) Si les (Ai )i∈N sont des éléments de F deux à deux disjoints, alors
[ X
P ( Ai ) = P (Ai ).
i∈ N N
i∈
Le triplet (Ω, F, P ) est alors appelé un espace de probabilité.

Remarques :
1. Les événements sont donc les parties de Ω auxquels on saura attribuer une probabilité
de se réaliser.
2. Si Ω est fini, on peut remplacer ii) par ii)’ pour tout A, B de P(Ω) tels que A∩B = ∅,
P (A ∪ B) = P (A) + P (B).
Exemples :
1. Jet d’un dé : Ω = {1, 2, ..., 6}, les faces sont équiprobables. On prend F = P(Ω) et on
définit P par :
1
P ({1}) = P ({2}) = ... = P ({6}) = .
6
1
P ({2, 3}) = P ({2}) + P ({3}) = .
3
2. Jet d’une pièce de monnaie Ω = {P, F }, si la pièce est équilibrée, on choisit :
1
P ({P }) = P ({F }) = .
2
Attention ! Le mot probabilité désigne donc deux choses différentes : l’application et le
nombre associé par cette application à un événement. Le contexte permet en général de lever
toute ambiguı̈té.
♣ Exercice : Soit P1 et P2 deux probabilités sur un espace mesurable (Ω, F), et soit α ∈
[0, 1]. Montrer que P = αP1 + (1 − α)P2 est une probabilité sur (Ω, F).
7
Nous avons regroupé dans la proposition suivante les règles fondamentales auxquelles obéit
une probabilité :
Proposition 1.7. Soit (Ω, F, P ) un espace de probabilité.
i) P (∅) = 0
ii) si (Ai )1≤i≤n sont des éléments de F deux à deux disjoints, alors
n
[ n
X
P( Ai ) = P (Ai ).
i=1 i=1
iii) si A est dans F, alors P (Ac )

= 1 − P (A),
iv) si A et B sont des éléments de F tels que A ⊂ B, alors P (A) ≤ P (B).
v) si A et B sont deux éléments de F, alors
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
vi) si (Ai )1≤i≤n sont des éléments de F, alors
[ X
P ( Ai ) ≤ P (Ai )
i∈N i∈ N
vii) si (Ai )1≤i≤n forment une suite croissante d’éléments de F, c’est à dire s’ils vérifient
∀i ∈ N Ai ⊆ Ai+1 , alors
[
P ( Ai ) = limi−→+∞ P (Ai ).
i∈ N
viii) si (Ai )1≤i≤n forment une suite décroissante d’éléments de F, c’est à dire s’ils vérifient
∀i ∈ N Ai+1 ⊆ Ai , alors
\
P ( Ai ) = limi−→+∞ P (Ai ).
i∈ N
Preuve.
i) On applique le ii) de la définition à la famille d’événements disjoints (Ω, ∅, ∅, ...) :
∞
X
1 = P (Ω) + P (∅).
i=1
La série dans le membre de droite ne converge alors que si P (∅) = 0.
ii) On applique le ii) de la définition à la famille d’événements disjoints (A1 , A2 , . . . , An , ∅, ∅, . . .)

en utilisant que P (∅) = 0 :
n
[ n
X n
X n
X
P( Ai ) = P (Ai ) + P (∅) = P (Ai )
i=1 i=1 i=n+1 i=1
iii) On applique ii) à famille d’événements disjoints (A, Ac ) : P (A) + P (Ac ) = P (A ∪

Ac ) = P (Ω) = 1 d’après le i) de la définition.
iv) Soit A et B deux événements tels que A ⊂ B. Comme B = (B ∩ A) ∪ (B ∩ Ac ), avec
(B ∩ A) ∩ (B ∩ Ac ) ⊂ A ∩ Ac = ∅, on peut appliquer ii) :
P (B) = P (B ∩ A) + P (B ∩ Ac ) or P (B ∩ Ac ) ≥ 0
≥ P (B ∩ A) = P (A)
car A ⊂ B
8
v) On écrit A ∪ B comme la réunion disjointe A ∩ B c , A ∩ B et B ∩ Ac (vérifier et faire
un dessin), et on remarque que A est la réunion disjointe A ∩ B c , et A ∩ B, tandis que
B est la réunion disjointe A ∩ B et B ∩ Ac . On obtient donc :
P (A ∪ B) = P (A ∩ B) + P (A ∩ B c ) + P (B ∩ Ac )
= (P (A ∩ B c ) + P (A ∩ B)) + (P (A ∩ B) + P (B ∩ Ac )) − P (A ∩ B)
= P (A) + P (B) − P (A ∩ B).
Pour les trois derniers points, on construit à partir de la famille (Ai )i∈N une famille
(Bi )i∈N de la façon suivante :
i−1
[
B0 = A0 et ∀i ≥ 1, Bi = Ai \ ( Aj ),
j=0
on vérifie alors (exercice) que

• ∀i ∈ N, Bi ⊂ Ai , et donc P (Bi ) ≤ P (Ai ).
• i 6= j =⇒SBi ∩ Bj =S∅, S S
• ∀nS∈ N, ni=0 Bi S = ni=0 Ai (par
P récurrence)Pet donc i∈N Bi = i∈N Ai
vi) P ( Si∈N Ai ) = P ( Si∈N Bi ) = i∈N P (BiP ) ≤ i∈N P (Ai ).
n
vii) P ( Pi∈N Ai ) = P ( i∈NSBi ) = limn−→∞ S i=1 P (Bi ).
n n n
Mais i=1 P (Bi ) = P ( B
i=1 i ) = P ( i=1 Ai ) = P (An ) par croissance de la suite
(An )n∈N .
Donc [
P( Ai ) = limn−→∞ P (An ).
i∈N
viii) Utiliser le point précédent et passer aux complémentaires (exercice).
♣ Exercice : Un dé a six faces, avec deux faces marquées 5. Donner un espace de probabilité
correspondant au lancer de ce dé.
1.6 Définition d’une probabilité sur un espace Ω fini.

Quand l’univers Ω est fini, on peut facilement décrire les probabilités sur Ω.
Théorème 1.8. Soit Ω = {ω1 , ω2 , ..., ωn }. Soit p1 , p2 , ..., pn n nombres réels.

Il existe une probabilité P sur (Ω, P(Ω)) telle que :
½
∀i ∈ P {1, 2, ..., n}, pi ≥ 0
∀i ∈ {1, 2, ..., n}, P ({ωi }) = pi ⇐⇒ n
et i=1 pi = 1.
P est alors unique, et on a pour tout événement A ∈ P(Ω)

X
P (A) = P ({ωi })
i/ωi ∈A
Preuve.
⇒) Supposons qu’il existe une probabilité P sur (Ω, P(Ω)) telle que pour tout
i ∈ |[1, n]| pi = P ({ωi }). P P
On a : pi ≥ 0, ∀i ∈ |[1, n]| et ni=1 pi = ni=1 p({ωi }) = P (Ω) = 1.
De plus pour tout événement A ∈ P(Ω) :
X X
P (A) = P ({ωi }) = pi .
i/ωi ∈A i/ωi ∈A
Donc P est uniquement déterminée par la donnée des pi .
9
⇐) Supposons que ½
∀i ∈ P
{1, 2, ..., n}, pi ≥ 0,
n
et i=1 pi = 1.
Soit P l’application définie sur P(Ω) par :

X
∀A ∈ P(Ω), P (A) = pi
i/ωi ∈A
Montrons que P est une probabilité sur (Ω, P(Ω)).

On a : ∀i ∈ |[1, n]|, pi ≥ 0, donc P (A) ≥ 0 ∀A ∈ P(Ω).
Et,
X n
X
P (A) = pi ≤ pi = 1.
i/ωi ∈A i=1
Donc P est une application de P(Ω) dans [0, 1].

De plus,
Xn
P (Ω) = pi = 1.
i=1
Si A et B sont deux événements disjoints, on a :

X X X
P (A ∪ B) = pi = pi + pi = P (A) + P (B).
i/ωi ∈A∪B i/ωi ∈A i/ωi ∈B
Donc P est une probabilité sur (Ω, P(Ω)) et par définition de P , P ({ωi }) = pi pour
tout i ∈ |[1, n]|.
Exemple : Un dé biaisé :
Ω 1 2 3 4 5 6
1 1 1 1 1
pi 3 6 12 12 4 p
Déterminer p pour que les pi définissent une probabilité. Calculer la probabilité que le résultat
du dé soit pair.
1.6.1 Equiprobabilité
Définition 1.9. On dit qu’il y a équiprobabilité, lorsque les probabilités de tous les événements
élémentaires sont égales.
On dit aussi que P est la probabilité uniforme sur (Ω, P(Ω)).
Remarque : L’univers Ω est nécéssairement fini. En effet, si Ω est infini, on a

+∞
X +∞
X
P (Ω) = pi = α = 1,
i=1 i=1
avec α = pi . La série de terme général

P+∞ α converge, donc limi−→∞ α = 0.
Donc α = 0. Contradiction avec i=1 α = 1. Par suite l’univers Ω est fini.
10
Proposition 1.10. S’il y a équiprobabilité, pour tout événement A, on a :
card(A) nb de cas f avorables
P (A) = =
card(Ω) nb de cas possibles
Preuve.
Dans un univers muni de l’équiprobabilité, de cardinal n, la probabilité d’un événement
élémentaire vaut n1 . En effet, posons α = pi . On a :
n
X n
X
1 = P (Ω) = pi = α = nα.
i=1 i=1
Donc α = n1 .
De plus, si A est un événement quelconque de P(Ω), on a :
X X 1 card(A)
P (A) = pi = = .
n n
i/ωi ∈A i/ωi ∈A
Le calcul de la probabilité d’un événement A se ramène donc à un problème de dénombrement,

il s’agit de calculer le nombre d’éléments de A et de Ω.
Exercice : Un sac contient deux boules blanches et trois boules noires. On tire une boule du
sac. Quelle est la probabilité qu’elle soit blache ?
On peut choisir deux modèles ; deux univers Ω1 , Ω2 peuvent modéliser le tirage aléatoire
précédent :
1) Ω1 = {B, N }, la probabilité P1 étant définie par
2 3
P1 ({B}) = , P1 ({N }) =
5 5
P1 n’est pas une probabilité uniforme.
2) On choisit Ω2 = {B1 , B2 , N1 , N2 , N3 }. Chaque boule du sac a la même probabilité d’être
tirée. On considère sur Ω2 la probabilité uniforme, que l’on note P2 .
1
P2 ({B1 }) = P2 ({B2 }) = P2 ({N1 } = P2 ({N2 } = P2 ({N3 }) = .
5
Soit A l’événement ”tirer une boule blanche”. Et on a :
card(A) 2
P2 (A) = = .
card(Ω) 5
1.6.2 Eléments d’analyse combinatoire

1- Les p-listes : Elles correspondent à un tirage successif et avec remise c’est à dire
que les répétitions sont possibles et que l’ordre est important.
2- les suites de p éléments distincts : Elles correspondent à un tirage successif et

sans remise, c’est à dire que les répétitions sont impossibles et que l’ordre est important.
3- Les permutations : Toutes suite de n éléments distincts choisis parmi les n éléments
d’un ensemble E est appelé permutation de n éléments. Le nombre total de permuta-
tions d’un ensemble de n éléments est n!.
11
Afin d’aborder les problèmes d’analyse combinatoire, rappelons les définitions et les pro-
priétés des coefficients Cnk et Akn .
Coefficient Cnk :
Cnk est un entier naturel qui est défini par
n!
Cnk = , 0 ≤ k ≤ n, avec (0! = 1)
k!(n − k)!
Cnk possède une interprétation très utile en pratique : Cnk est le nombre de façons de choisir
simultanément k éléments parmi n éléments.
Cnk est aussi le nombre de parties à k éléments distincts, pris dans un ensemble à n éléments.
Coefficient Akn :
Par définition :
n!
Akn = , 1 ≤ k ≤ n.
(n − k)!
(Akn est le nombre de façons de choisir successivement et sans remise k éléments parmi n
éléments).
Nous sommes à présent en mesure de préciser les trois modèles de base qui interviennent
fréquemment en pratique.
1.6.3 Exemples fondamentaux

a. Modèle de tirage avec remise :
Un sac contient k boules différentes que l’on suppose numérotées de 1 à k. On note
E = {1, 2, ..., k}.
On effectue n tirages avec remise (on remet la boule dans le sac après chaque tirage).
L’ensemble Ω des résultats possibles, est l’ensemble des n-listes, c’est-à-dire l’ensemble
des suites d’éléments de E de longueur n (une n-liste est un élément de E n ).
On note Ω = E × E × ... × E = E n .
Alors :
card(Ω) = (cardE n ) = k n .
En effet, pour former toutes les n-listes, on a k possibilités pour choisir le premier
élément, k pour le second, etc...
On met sur Ω la probabilité uniforme :
1
P ({ωi }) = .
kn
Exemple : On reprend l’exemple classique du jet d’un dé équilibré à six faces.
On suppose que le dé est jetté 3 fois.
Ici E = {1, 2, 3, ..., 6}. k = 6 et n = 3.
Ω l’ensemble des triplets ou 3-listes d’éléments de E.
Ainsi : (1, 2, 2) ∈ Ω, (5, 3, 1) ∈ Ω
La probabilité de chaque événement élémentaire est 613 = 216 1
.
En particulier
1
P ({(5, 3, 1)}) = P ({(1, 2, 2)}) = .
216
12
b. Modèle de tirage sans remise et sans ordre : Combinaison.
Un sac contient k boules différentes numérotées de 1 à k. On tire en une seule fois m
boules du sac m ≤ k. On choisit pour Ω l’ensemble des parties à m éléments. On a
card(Ω) = Cnm . On prend sur Ω la probabilité uniforme :
1
P ({ω}) = .
Cnm
Exemple : On distribue 4 cartes parmi 32, quelle est la probabilité p d’avoir 4 figures
(valet, dame, roi) ?
Le nombre de résultats possibles est

4 32! 32 × 31 × 30 × 29
C32 = = = 71920.
4!28! 4×3×2
4 = 990 choix possibles de quatre figures parmi 12. Puisque
Il y a 12 figures, donc C12
l’on a choisi sur Ω la probabilité uniforme
4
C12
p= 4 = 0, 014.
C32
c. Modèle de tirage sans remise et avec ordre : Arrangements
On choisit le même sac que précédemment et on tire une à une, sans les remettre, m
boules d’un sac contenant initialement k boules avec m ≤ k.
Les résultats possibles sont les suites de m éléments de {1, 2, ..., k}, deux à deux distincts.
Ainsi si k = 4 et m = 2.,
Ω = {(1, 2), (1, 3), (1, 4), (2, 1), (2, 3), (2, 4), (3, 1), (3, 2), (3, 4), (4, 1), (4, 2), (4, 3)}
Pour compter le nombre des suites, on remarque que l’on a k possibilités pour choisir
le premier élément, cet élément étant donné, le deuxième doit être distinct du premier,
il ne reste que (k − 1) possibilités , etc,...
On a ainsi
k!
card(Ω) = k(k − 1)(k − 2)...(k − m + 1) = = Am k .
(k − m)!
Exercice : Un sac contient 2 V et 3 B. On effectue 2 tirages sans remise.
Donner Ω, calculer la probabilité d’avoir 2 vertes exactement, 2 blanches exactement,
1 V et 1 B.
On pose E = {V1 , V2 , B1 , B2 , B3 }. Ω est l’ensemble des suites de deux éléments de E
deux à deux disjoints.
On écrit :
Ω = {(V1 , V2 ), (V1 , B1 ), (V1 , B2 ), (V1 , B3 ), (V2 , V1 ), ...}
On a card(Ω) = A25 = 20.
card(B) A22 2 1
P(A) = card(Ω) = 20 = 20 = 10 .
card(A) A23 6 3
P(B) = card(Ω) = 20 = 20 = 10 .
card(C) 12
P(C) = card(Ω) = 20 = 53 ,
card(C) = 2 × 3 × 2 = 12.
13
1.7 Résumé du premier chapitre
1. Phénomène aléatoire : Tout phénomène dans lequel intervient le hasad est dit
aléatoire ou stochastique. En revanche, si l’on est certain de l’évolution du phénomène,
on parle de phénomène déterministe.
2. L’univers Ω : Il peut être soit

a) fini : Ω = {x1 , ..., xk } (ex. Ω = {1, 2, 3})
b) infini dénombrable : Ω = {x1 , ..., xk , ...} (ex. Ω = N).
3) infini non dénombrable : (ex. Ω = R, [0, ∞[, [a, b], ...).
Mathématiquement, l’univers est un ensemble quelconque. Intuitivement, c’est l’en-
semble des issues possibles d’une expérience aléatoire.
3. La probabilité P : C’est une fonction définie sur les sous-ensembles

P∞ de Ω, à valeurs
dans [0, 1] et qui vérifie en outre P (Ω) = 1 et P (∪∞
i=0 Ai ) = i=0 P (Ai ) si les Ai sont
disjoints deux à deux.
A l’aide de ces trois axiomes, on démontre d’autres formules. Les plus utiles à retenir
sont :
P (A ∪ B) = P (A) + P (B) − P (A ∩ B).

et
P (A) = 1 − P (A).
14
1.8 Exercices
Exercice 1. Trois boules sont tirées d’un sac contenant des boules blanches et des boules
rouges. Soient les événements :
A= “ la première boule est blanche ”

B= “ la deuxième boule est blanche ”
C= “ la troisième boule est blanche”.
Exprimer les événements suivants en terme de A , B et C :
D= “ toutes les boules sont blanches ”,

E= “ les deux premières sont blanches”,
F= “ au moins une est blanche”,
G= “ une boule au plus est blanche”,
H= “ toutes les boules sont rouges”
K= “ seulement la troisième est blanche”.
Exercice 2. Soit Ω un ensemble.
1) Décrire P(Ω) si Ω = {1, 2, 3}
2) Calculer le cardinal de P(Ω) quand Ω est un ensemble fini (resp. infini).
Soit n et k deux entiers non nuls tels que k < n.
3) Montrer que Cnk = Cnn−k .
k−1
4) Montrer que Cnk = Cn−1 k .
+ Cn−1
5) Etablir l’identité suivante :
n
X
(1 − x)n = (−1)k Cnk xk .
k=0
Exercice 3. On lance 3 dés équilibrés. Quelle est la probabilité d’obtenir :

1) A = “ une fois 1, une fois 2, une fois 3”,
2) B = “ trois fois 1”,
3) C= “ une fois 1 et deux fois 5”.
Exercice 4. On lance 2 dés équilibrés, l’un après l’autre, et on considère les événements
suivants :
A = “ le premier dé donne un résultat pair”
B = “ le deuxième dé donne un résultat impair”
C = “ les deux dés donnent des résultats de même parité”.
1) Calculer P (A ∩ B ∩ C) et P (A).P (B).P (C).
2) Calculer P (A ∩ B) et P (A).P (B).
Exercice 5. Dans un aquarium, il y a cinq poissons rouges trois poissons noirs et deux
poissons argentés. On pêche au hasard trois poissons. Calculer la probabilité des événements
suivants :
A = “ les trois poissons pêchés sont de la même couleur”,

B = “ les trois poissons pêchés sont de trois couleurs différentes”,
C= “ les trois poissons pêchés sont de deux couleurs exactement”.
15
Exercice 6. Soit (Ω, B) un espace probabilisable ( B est l’ensemble des événements).
Pn p1 , p2 , ..., pn
sont n probabilités sur (Ω, B). λ1 , λ2 , ..., λn sont n réels positifs tels que i=1 λi = 1. On
pose
Xn
P = λi pi .
i=1
Montrer que P est une probabilité sur (Ω, B)
x
Exercice 7. Soit f l’application de R dans R définie par f (x) = 3 .
(1+x2 ) 2
Ω = {a, b, c}. Soit F une primitive de f sur R. ( F existe car f est continue).
α et β deux réels tels que 0 < α < β.
On considère l’application P de P(Ω) dans R définie par :
 Rα Rβ

 P {a} = 0 f (x)dx, P {b} = α f (x)dx, P {c} = 1 − F (β)



 P {a, b} = P {a} + P {b}

P {a, c} = P {a} + P {c}

 P {b, c} = P {b} + P {c}



 P (Ω) = P {a} + P {b} + P {c}

P (∅) = 0
Déterminer F pour que P soit une probabilité sur (Ω, P(Ω))
Exercice 8. Un jeu de toto foot consiste à prévoir les résultats de dix équipes de football
en inscrivant les prévisions sur une feuille réponse. Pour chaque match trois résultats sont
possibles : victoire d’une équipe, victoire de l’autre équipe, match nul. combien de chances
a-t-on de gagner si on a joué, d’abord une feuille et puis deus feuilles ?
Exercice 9. On fait remplir un questionnaire à 20 questions binaires. Quelle est la proba-

bilité qu’un candidat répondant au hasard obtienne au moins 16 bonnes réponses ?
Exercice 10.
Soit (Ω, A) un espace probabilisable et A un événement. On appelle fonction indicatrice
de l’événement A et on note IA la fonction définie sur Ω à valeurs dans {0, 1} définie par :
½
1 si ω ∈ A
IA (ω) =
0 si ω ∈ /A
Soit B ∈ A. Montrer que :

1. IA = IB si, et seulement si, A = B.
2. IAc = 1 − IA .
3. IA∩B = IA IB .
4. IA∪B = IA + IB − IA IB .
5. Soit A1 ,..., An des sous ensembes du même Ω, deux à deux disjoints, montrer que
n
X
I∪ni=1 Ai = IAi .
i=1
6. Montrer que si A ⊆ B, IA ≤ IB .
Exercice 11. Soit (An ) une suite d’événements. On pose
\ [ [ \
lim sup An = ( Am ) et lim inf An = ( Am ).
n n
n m≥n n m≥n
16
1) Interpréter lim supn An et lim inf n An . Montrer que lim inf n An ⊆ lim supn An .
2) Montrer la propriété suivante :
X
Si P (An ) < +∞, alors P (lim sup An ) = 0.
n
n≥0
Exercice 12. Soit Γ = {B1 , ..., BN } une partition de Ω. On appelle tribu engendée par Γ
et on note BΓ la plus petite tribu contenant les éléments de Γ. Les Bn sont les “informations
élémentaires” qu’il est possible d’obtenir sur Ω.
1) Montrer que BΓ est constituée de ∅ , Ω et de toutes les réunions d’éléments de Γ.
2) Montrer que si F1 et F2 sont deux tribus sur Ω, alors il en est de même de F = F1 ∩ F2 .
3) En déduire que si H est une famille quelconque de parties de Ω, il existe une σ−algèbre
contenant H et qui est contenue dans toutes les tribus contenant H (ce qui revient à dire qu’il
existe une plus petite σ−algèbre contenant H notée σ(H)).
4) Soit d ∈ N∗ . On appelle tribu borélienne sur Rd la tribu engendrée par la famille O des
ensembles ouverts de Rd . On la notera B(Rd ). Ainsi B(Rd ) = σ(O). Montrer que :
σ(O) = σ(F),
où σ(F) est la tribu engendrée par les ensembles fermés de Rd .
17
Chapitre 2
Probabilités conditionnelles et
indépendance
2.1 Introduction
Il s’agit de définir la façon dont les probabilités affectées aux événements sont susceptibles
d’être modifiées par l’arrivée d’informations nouvelles. Une information est ici une affirma-
tion du type 00 l’événement A est réalisé 00 ou 00 l’événement B est réalisé 00 .
Exemple :
On lance une fois un dé cubique parfait dont les faces sont numérotées de 1 à 6.
Soit A l’événement : 00 on obtient un nombre inférieur ou égal à 5 00
et B l’événement : 00 on obtient un nombre supérieur ou égal à 3 00 .
Supposons que l’on sache que A est réalisé.
Le résultat du lancer est donc un élément de {1, 2, 3, 4, 5} et il y a 5 cas possibles.
B est réalisé si, et seulement si, ω ∈ {3, 4, 5}. Il y a donc 3 cas favorables pour que B soit
réalisé.
La probabilité que B soit réalisé sachant A l’est est 35 .
Or, on a P (A) = 56 et P (A ∩ B) = 36 , donc
3 P (A ∩ B)
= .
5 P (A)
2.2 Probabilité conditionnelle

Définition 2.1. Soit (Ω, A, P ) un espace de probabilité et soit A un événement de probabilité
non nulle. Pour tout événement B ∈ A, on appelle probabilité conditionnelle de B sachant A
la quantité, notée P (B/A) et définie par :
P (A ∩ B)
PA (B) = P (B/A) = .
P (A)
Remarques :
1. La Probabilité conditionnelle est une vraie probabilité. Pour cela, montrons que PA
est une application de A dans [0, 1] telle que pour toute suite (Bn )n∈N d’éléments 2 à 2
disjoints de A on a : X
PA (∪n∈N Bn ) = PA (Bn ).
n∈ N
18
• On a A ∩ B ∈ A donc P (A ∩ B) existe et on a aussi A ∩ B ⊂ A donc PA (B) ∈ [0, 1].
• Soit (Bn )n∈N une suite d’éléments 2 à 2 disjoints. On a :
∞
P (A ∩ (∪n≥0 Bn )) P (∪n≥0 (A ∩ Bn ) X P (A ∩ Bn )
PA (∪∞
n=0 Bn ) = = = .
P (A) P (A) P (A)
n=0
2. Si A, B ∈ A sont tels que P (A) > 0 et P (B) > 0, on a la propriété évidente mais très
utile suivante :
P (A ∩ B) = PB (A)P (B) = PA (B)P (A).
Théorème 2.2. (Formule des probabilités composées)
Soit (Ai )1≤i≤n une famille d’événements telle que P (A1 ∩ A2 ∩ ... ∩ An−1 ) 6= 0. Alors,
P (∩ni=1 Ai ) = P (A1 )PA1 (A2 )...PA1 ∩A2 ∩...∩An−1 (An ).
Preuve.
Voir TD.
Remaraque : Toutes les probabilités écrites ont un sens car :

∀j ∈ {1, 2, ..., n − 1} A1 ∩ A2 ∩ ... ∩ An−1 ⊂ A1 ∩ A2 ∩ ... ∩ Aj .
Donc
P (A1 ∩ A2 ∩ ... ∩ Aj ) ≥ P (A1 ∩ A2 ∩ ... ∩ An−1 ) > 0.
Exemple : Un sac contient 3 boules blanches et 7 noires. On tire successivement 3 boules
sans remise. Quelle est la probabilité d’obtenir les trois boules blanches ?
Soit Bk (resp. Nk ) l’événement 00 le k ieme tirage donne une boule blanche 00 (resp. noire).
Soit A l’événement 00 on obtient 3 boules blanches 00 .
A = B1 ∩ B2 ∩ B3 .
D’après la formule des probabilités composées, on a :
P (A) = P (B1 )PB1 (B2 )PB1 ∩B2 (B3 ).

Puisque le sac contient 10 boules dont 3 blanches, on a :
3
P (B1 ) = .
10
À l’issue du premier tirage, le sac contient 9 boules et si la première boule tirée est blanche,
il ne reste que 2 boules blanches donc,
2
PB1 (B2 ) = .
9
À l’issue du deuxième tirage, le sac contient 8 boules et si les deux boules tirées sont blanches,
il ne reste que 1 boule blanche donc,
1
PB1 ∩B2 (B3 ) = .
8
Finalement,
3 2 1 1
P (A) = × × = .
10 9 8 120
19
Définition 2.3. Une suite finie ou non (Bn )n∈I⊆N d’événements de Ω est appelée une
partition de Ω si les Bn sont deux à deux disjoints et si leur réunion est égale à Ω.
On a alors le théorème :
Théorème 2.4. (Principe des probabilités totales)

Soit (Ω, A, P ) un espace probabilisé, soit (Bn )n∈I⊆N une partition telle que P (Bn ) > 0 pour
tout n ∈ I et soit A ∈ A.
On a : X
P (A) = PBn (A)P (Bn ).
n∈I
Preuve.
P (A) = P (A ∩ Ω) = P (A ∩ ∪n∈I Bn )
=PP(∪n∈I (A ∩ Bn )) P
= n∈I P (A ∩ Bn ) = n∈I PBn (A)P (Bn ).
Remarque : Quand n = 2, on obtient en particulier :
P (A) = PB (A)P (B) + PB c (A)P (B c ).
Exemple On effectue des tirages sans remise dans un sac contenant 3 boules blanches et 7
boules noires.
Quelle est la probabilité d’obtenir une boule noire au deuxième tirage ?
Le premier tirage a donné soit une boule blanche soit une boule noire, donc :
P (N2 ) = P (B1 )PB1 (N2 ) + P (N1 )PN1 (N2 )
On a
3 7
P (B1 ) = , et P (N1 ) = .
10 10
À l’issue du premier tirage, le sac ne contient que 9 boules dont 7 noires si B1 a été réalisé
et 6 boules noires si c’est N1 qui a été réalisé. Donc :
7 6
PB1 (N2 ) = et PN1 (N2 ) =
9 9
D’où :
3 7 7 6 7
P (N2 ) = × + × = .
10 9 10 9 10
Théorème 2.5. (Formule de Bayes) Soit (Ω, A, P ) un espace probabilisé, soit (Bk )nk=1 une
partition de Ω telle que P (Bk ) > 0, pour tout k ∈ {1, ..., n} :
PB (A)P (Bk )
PA (Bk ) = P k
n PBn (A)P (Bn )
Preuve. On a :
X
PBk (A)P (Bk ) = PA (Bk )P (A) = PA (Bk ) PBn (A)P (Bn ).
20
Interprétation : Soient (Bk )nk=1 une partition de Ω.
A chacun des événements (Bk ) correspond une information initiale qui permet d’évaluer a
priori (en partant de ce qui précéde) les probabilités P (B1 ), P (B2 ),...,P (Bn ).
Soit A un événement quelconque pour lequel on connaı̂t a priori les probabilités condition-
nelles PB1 (A), PB2 (A),..., PBn (A).
Le théorème de Bayes permet de calculer les probabilités conditionnelles a posteriori( en
partant de ce qui vient) PA (Bk ) à partir des probabilités a priori les P (Bk ) et les PBk (A).
Exemple : Reprenons l’exemple précédent et effectuons deux tirages. Le second tirage ayant
donné une boule blanche, quelle est la probabilité que la première boule tirée ait été blanche ?
Cherchons PB2 (B1 ) :
PB2 (B1 ) = P (B 2 ∩B1 )
P (B2 )
P (B1 )PB1 (B2 )
= P (B1 )PB1 (B2 )+P (N1 )PN1 (B2 )
3
× 29
= 3
10
× + 7 ×3
2 = 29 .
10 9 10 9
♣ Exercice : Une entreprise utilise trois machines différentes A, B, et C pour fabriquer

des pièces. 40% sont fabriquées par A, 30% par B et 30% par C. La machine A produit 2%
de pièces défectueuses, B 4% et C 5%.
1. On prélève une pièce au hasard. Quelle est la probabilité qu’elle soit défectueuse ?
2. On prélève une pièce. Elle est défectueuse. Quelle est la probabilité qu’elle vienne de
A?
3. On prélève une pièce. Elle est saine. Quelle est la probabilité qu’elle vienne de C ?
Solution :
Soit A : ”être fabriqué par A”, B : ” être fabriqué par B”,...
D : ” être défectueuse” et D : ”saine”.
On a
P (A) = 0.4, P (B) = 0.3, P (C) = 0.3.
A, B et C sont tels que A ∩ B = A ∩ C = B ∩ C = ∅ et A ∪ B ∪ C = Ω.
1) En applicant la formule des probabilités totales on a :
P (D) = PA (D)P (A) + PB (D)P (B) + PC (D)P (C)

= 0.02 × 0.4 + 0.04 × 0.3 + 0.05 × 0.3 =
2) D’après le théorème de Bayes,

PA (D)P (A) 0.02 × 0.4
PD (A) = = .
P (D) P (D)
3)
PC (D)P (C) 0.95 × 0.3
PD (C) = = .
P (D) 1 − P (D)
2.3 Indépendance d’événements et de sous-tribus.

2.3.1 Indépendance d’événements
Parfois, A et B sont tels que PB (A) = P (A). Autrement dit le fait de savoir que B est réalisé
ne donne aucune information supplémentaire sur le fait de savoir que A l’est. Cela conduit
à la :
21
Définition 2.6. Soit (Ω, A, P ) un espace probabilisé.
1. Deux événements A et B sont dits indépendants si :
P (A ∩ B) = P (A)P (B).
2. Une suite finie (Ai )i∈{1,2,...,n} d’événements est dite mutuellement indépendante si,
pour toute partie non vide I ⊂ {1, 2, ..., n}, on a
Y
P (∩i∈I Ai ) = P (Ai )
i∈I
3. Une suite finie ou non (Ai ) d’événements est dite indépendante deux à deux si, on a
P (Ai ∩ Aj ) = P (Ai )P (Aj ), ∀i 6= j.
Remarques :
1. L’indépendance mutuelle implique évidemment l’indépendance deux à deux. Mais at-

tention, si n ≥ 3, la réciproque est fausse.
Exemple : Soit Ω = {1, 2, 3, 4} avec P ({1}) = P ({2}) = P ({3}) = P ({4}) = 14 .
Les événements A = {1, 2}, B = {1, 3} et C = {1, 4} sont deux à deux indépendants
(On a : P (A ∩ B) = P (A)P (B) = 14 , P (A ∩ C) = P (A)P (C) = 14 et P (C ∩ B) =
P (C)P (B) = 14 ).
Mais pas mutuellement indépendants ( P (A ∩ B ∩ C) = 14 6= 18 = P (A)P (B)P (C)).
2. La notion d’indépendance dépend de la probabilité considérée. On peut imaginer un

espace mesurable (Ω, A), sur lequel existent deux probabilités P et Q telles que les
événements A et B soient indépendants sous P et pas sous Q. (Voir série d’exercice
no 2).
♠ Attention : Ne confondez pas ”événements indépendants et événements disjoints” ! ! Par
exemple, A et Ac sont disjoints et ne sont pas indépendants : si on sait que A est réalisé, on
est sûr que Ac n’est pas réalisé.
P (A ∩ Ac ) = P (∅) = 0.
Et
P (A)P (Ac ) = P (A)(1 − P (A)) 6= 0 en général.
♣ Exercice Soit A et B deux événements. Montrer que si A et B sont indépendants, alors
Ac et B (resp. A et B c , Ac et B c ) sont indépendants.
2.3.2 Indépendance de sous-tribus

Définition 2.7. Deux sous tribus G et G 0 de A sont indépendantes si
∀A ∈ G, ∀A0 ∈ G 0 , P (A ∩ A0 ) = P (A)P (A0 ).
i.e. tout événement de G est indépendant de tout événement de la tribu G 0 .

Exemple : Soit Ω = {ω1 , ω2 , ω3 , ω4 }, et A = P(Ω)
On pose :
G = {∅, Ω, {ω1 , ω2 }, {ω3 , ω4 }},
22
et
G 0 = {∅, Ω, {ω1 , ω3 }, {ω2 , ω4 }}.
Alors G et G 0 sont deux sous tribus de A indépendantes.
♣ Exercice : Si deux tribus A1 et A2 sur (Ω, A, P ) sont indépendantes et ayant un élément
commun A, on a :
P (A) = 0 ou 1.
On a :
P (A ∩ A) = P (A)2 = P (A).
D’où
P (A) = 0 ou 1.
2.4 Application : Apparition d’un pile dans un schéma de Ber-

noulli
On considère une suite infinie de lancers de pile ou face indépendants ; on suppose qu’à
chaque lancer on a une probabilité p ∈]0, 1[ d’obtenir pile. Montrer qu’avec probabilité 1, face
va apparaitre dans la suite de lancers.
On note An l’événement 00 pile apparait au n-ième lancer 00 . On sait par les hypothèses
que les (An )n∈N∗ sont indépendants et que P (An ) = p > 0 pour tout n.
On note A l’événement 00 pile apparait au mois une fois 00 . Alors
Ac = ∩n≥1 Acn
et donc, pour tout N ∈ N∗ ,

N
Y
c
P (A ) ≤ P (∩N c
n=1 An ) = P (Acn ) = (1 − p)N
n=1
qui tend vers 0 quand N tend vers l’infini.

Donc,
P (Ac ) = 0.
Par suite,
P (A) = 1.
23
2.5 Résumé du deuxième chapitre
1. Ce qui concerne les probabilités conditionnelles
Probabilité sachant B : si PB (A) = P P(A∩B)
(B) .
Partition de Ω : (B1 , B2 , ..., Bn ) est une partition de Ω si
Ω = ∪ni=1 Bi
et si Bi ∩ Bj = ∅ chaque fois que i 6= j (càd que les Bi sont deux à deux disjoints).
Principe des probabilités totales : si (B1 , B2 , ..., Bn ) est une partition de Ω telle
que P (Bi ) > 0 pour tout i, on a :
n
X
P (A) = PBi (A)P (Bi ).
i=1
Formule de Bayes : si (B1 , B2 , ..., Bn ) est une partition de Ω telle que P (Bi ) > 0
pour tout i, on a :
PBk P (Bk )
PA (Bk ) = Pn .
i=1 PBi (A)P (Bi )
2. Ce qui concerne l’indépendance
Dans un espace probabilisé (Ω, A, P ), deux événements A et B sont indépendants si :
P (A ∩ B) = P (A)P (B).
L’indépendance de deux événements dépend de la probabilité choisie.

Généralisation Des événements (Ai )i∈I sont mutuellement indépendants si, pour
toute partie J ⊂ I, on a Y
P (∩i∈J Ai ) = P (Ai ).
i∈J
Cette notion est plus forte que l’indépendance deux à deux. Par exemple, il peut arriver
que trois événements A, B et C soient deux à deux indépendants, mais ne vérifient
pas la condition supplémentaire P (A ∩ B ∩ C) = P (A)P (B)P (C) pour l’indépendance
mutuelle.
24
2.6 Exercices
Exercice 1. (Formule du crible de Poincaré )

(Ω, P(Ω), P ) est un espace de probabilité. A1 , A2 ,...An sont n événements.
Montrer , par récurrence, que :
n
[ n
X X n
\
k+1 n+1
P( Ai ) = P (Ai ) + ... + (−1) P (Ai1 ∩ ... ∩ Aik ) + ... + (−1) P( Ai ).
i=1 i=1 1≤i1 <...<ik ≤n i=1
Application : (Problème des chapeaux).

Cinq personnes ont accroché leur chapeau au porte-chapeau en entrant au restaurant. Après
le repas, elles récupèrent leur chapeau au hasard. On convient de numéroter les personnes de
1 à 5.
Pour i ∈ |[1, 5]|, on note Ai l’événement : ”la personne numéro i repart avec son chapeau”,
et A l’événement ”Aucune personne ne repart avec son chapeau”.
1. Quel univers peut-on associer à cette expérience aléatoire ?
2. Calculer les probabilités P (Ai ) et P (Ai ∩ Aj ), pour i 6= j.
3. Calculer P (A).
Exercice 2.
Dans une usine on dispose de 3 machines A, B, C fabriquant des pièces mécaniques d’un
type déterminé. La machine A assure 25% de la production, la machine B assure 35% et C
en assure 40%.
5% des pièces fabriquées à l’aide de la machine A sont défectueuses. Les pourcentages sont
respectivement égaux à 4% et 2% pour les machines B et C.
1) On tire une pièce au hasard quelle est la probabilité qu’elle soit défectueuse ?
2) On tire une pièce d’un lot constitué de pièces fabriquées, dans les proportion indéquées, par
les machines A, B et C. On constate que cette pièce est défectueuse. Calculer la probabilité
qu’elle ait été fabriquée :
- par la machine A
- par la machine B
3) On tire une pièce au hasard. Elle est saine. Quelle est la probabilité qu’elle vienne de C.
Exercice 3.
Un test sanguin a une probabilité de 0.95 de détecter un certain virus lorsque celui ci est
effectivement présent. Il donne néanmoins un faux résultat positif pour 1% des personnes
non infectées. Notons V = {la personne testée a le virus}, T = {la personne testée a un test
positif}.
1. Si 0.5% de la population est porteuse du virus, quelle est la probabilité qu’une personne
ait le virus sachant qu’elle a un test positif ?
2. Interpréter le résultat.
Exercice 4.
T
1. Soit n ≥ 2, Etablir que, si (A1 , ..., An ) est une suite d’événements telle que P ( ni=1 Ai ) >
0, alors
\n Yn
P ( Ai ) = P (A1 ) P∩i−1 Ak (Ai ).
k=1
i=1 i=2
25
(Indication : On pourra raisonner par rucurrence sur n).
Exercice 5.
Un sac contient initialement une boule blanche et une boule noire. On réalise indéfiniment
l’expérience suivante : on tire une boule, on regarde sa couleur, on la remet dans le sac
et on rajoute une nouvelle boule de la même couleur que celle obtenue.
Notons X le nombre de tirage(s) nécessaire(s) avant d’obtenir une boule noire, avec la
convention X = 0 si on ne tire jamais de boule noire.
Notons Bi l’événement “On obtient une boule blanche au ieme tirage”.
a. Montrer que {X = 1} = B1c et que {X = n} = B1 ∩ B2 ∩ ... ∩ Bn−1 ∩ Bnc pour n ≥ 2.
b. Que vaut la probabilité de Bnc sachant B1 ∩ B2 ∩ ... ∩ Bn−1 ?
c. Calculer, pour i ∈ {2, ..., n − 1}, la probabilité de Bi sachant B1 ∩ B2 ∩ ... ∩ Bi−1 .
d. À l’aide de la question 1) (en choisissant Ai = Bi si i < n et An = Bnc ),

1
montrer que P (X = n) = n(n+1)
Qn−1 i 2×3×...×(n−1)
(On remarquera que i=2 i+1 = 3×...×(n−1)×n = n2 )
1
e. En remarquant que n(n+1) = n1 − n+1
1
, montrer que
+∞
X
(X = n) = 1.
n=1
f. Que vaut P (X = 0) ? Interpréter le résultat.

Exercice 6.
1) Soient A et B deux événements. Montrer que si A et B sont indépendants, alors Ac et B
(resp. A et B c , Ac et B c ) sont indépendants.
2) Pour montrer que l’indépendance n’est pas une propriété intrinsèque des événements et
qu ’elle dépend de la probabilité considérer, on choisit Ω = {1, 2, 3, 4, 5, 6} muni de la tribu
P(Ω).
Soit P1 et P2 les probabilités définies sur (Ω, P(Ω)) par :
i 1 2 3 4 5 6 i 1 2 3 4 5 6
et
P1 ({i}) 16 16 13 19 19 19 P2 ({i}) 16 16 16 16 16 16
On pose A = {1, 2} et B = {2, 3}.

T
1) Pour i=1, 2, calculer Pi (A), Pi (B) et Pi (A B).
2) Conclure.
Exercice 7. Pour juger de l’éfficacité d’une compagne publicitaire ayant porté sur un produit,
on a sondé 1500 personne ; 1000 dans la région du Nord et 500 dans la région du sud. Les
résultats sont :
Région C. p. et le consomment C.p. ne le consomment pas Ne connaissent pas le produit

Nord 80 150 770
Sud 50 130 320
Calculer les probabilités suivantes :

1. Probabilité de connaı̂tre le produit.
26
2. Probabilité de connaı̂tre le produit et le consommer.
3. Probabilité de connaı̂tre le produit et ne pas le consommer.
4. Probabilité d’être du nord.
5. Quelle est la probabilité pour qu’une personne qui connaisse le produit soit consom-
matrice de ce produit ?
6. Quelle est la probabilité pour qu’une personne prise au hasard du sud ne connaisssent
pas le produit ?
Exercice 8.
guerre passe au-dessus de trois batteries antiaériennes. Chaque batterie a une chance sur trois
d’abattre l’avion. Quelle est la probabilité que l’avion soit abattu ?
Exercice 9.
Une usine s’adresse à deux fournisseurs A et B pour l’approvisionnement d’un composant
électronique. Le contrôle de conformité efféctué sur un échantillon aléatoire de composants
électroniques a donné la répartition suivante des pourcentages de défauts :
Fournisseur\ Répartition du nb de défauts 0 défauts 1 défauts 2 défauts
A 60 % 35% 5%
B 65% 25% 10%
Sachant que 70% des composants sont achetés à A et 30% à B.

1) Calculer la probabilité pour qu’un composant ne présente aucun défaut.
2) Calculer la probabilité pour qu’un composant tiré aÃléatoirement et ne présente aucun dédaut
provient de B.
Exercice 10.
Dans cet exercice on étudie une maladie rare qui atteint, disons 1 individu sur 1000 ( par
exemple la maladie de la vache foulle). On met au point un test pour détecter si un individu
est infecté par la maladie. Lorsqu’un individu est malade, le test a une prbabilité de 0.99 de
se révéler positif. Si un individu n’est pas porteur de la maladie, le test a une probabilité 0.98
de l’identifier comme tel.
On teste un individu est le rérultat est positif.
1) Quelle est la probabilité que l’individu ainsi testé soit effectivement infecté ?
2) Déduire que si on applique un tel test pour dépister la maladie de la vache foulle et qu’on
abat les vaches testées positives, on va déclencher un massacre inutile.
Exercice 11.
On considère n “ menteurs” I1 ,..., In . I1 reçoit une information sous la forme de “ oui” ou
“non”, la transmet à I2 , et ainsi de suite jusqu’à In et In l’annonce au monde. Chacun d’eux
transmet ce qu’il a entendu avec la probabilité p ∈]0, 1[, le contraire avec la probabilité 1 − p.
Les réponses des n personnes sont indépendantes.
On note Ak = “Ik transmet l’information initiale”, Bk = “Ik transmet ce qu’il a entendu” et
pk = P (Ak ).
1. a. Montrer que, pour tout k = 2, ..., n , Ak = (Ak−1 ∩ Bk ) ∪ (Ack−1 ∩ Bkc )
1. b. En déduire que, pour tout k = 2, ..., n, pk = 1 − p + (2p − 1)pk−1 .
2. Montrer que la suite (uk ) définie par uk = pk − 21 est géométrique1 de raison 2p − 1.
En déduire une formule explicite pour un puis pour pn .
3. Quelle est la limite de pn quand n −→ ∞ ? interpréter le résultat.
27
1
Rappel : Une suite (xk ) est géométrique de raison q si, pour tout k ∈ N, xk+1 − qxk = 0. Dans ce cas, on
a la formule explicite xn = x0 q n valable pour tout n ∈ N.
28
Chapitre 3
Les variables aléatoires
3.1 Introduction
Soit Ω l’univers associe à une expérience aléatoire. Il est parfois intéressant d’associer à
chaque ω un nombre réel, par exemple la somme des points obtenus lorsqu’on jette deux dés.
On est donc amené à étudier des applications de Ω dans R qui sont sous certaines conditions
appelées variables aléatoires réelles.
3.2 Variables aléatoires

Définition 3.1. Soit (Ω, A) et (E, B) deux espaces probabilisables. On appelle variable
aléatoire toute application X de Ω dans E telle que :
∀B ∈ B, X −1 (B) ∈ A
avec
X −1 (B) = {ω ∈ Ω/X(ω) ∈ B}.
On dit aussi que X est une application (A, B)−mesurable.
Exemple :
1. Si A = P(Ω) ou B = {∅, E}, alors toute application : X : Ω −→ E est une v.a.
2. Fonction indicatrice d’un événement. Soit (Ω, A) un espace mesurable et A un élément
de A. On définit la fonction indicatrice de A, notée 1A :
½
1 si ω ∈ A,
∀ω ∈ Ω, 1A (ω) =
0 sinon
alors 1A est une v. a. de (Ω, A) dans ({0, 1}, P({0, 1})).
3. Toute application continue de (R, BR ) est une v. a.
♣ Exercice : On lance deux dés équilibrés et on note X la somme des deux résultats. Décrire
un espace de probabilité correspondant à cette expérience aléatoire et définir précisément X.
3.3 Probabilité image et loi d’une variable aléatoire

Proposition 3.2. Soit (Ω, A, P ) un espace probabilisé, (E, B) un espace probabilisable et
X : Ω −→ E une v.a. A toute élément B de B, on peut associe le nombre
P (X −1 (B)) = P ({ω ∈ Ω/ X(ω) ∈ B}) = P (X ∈ B)
29
et l’application
PX : B −→ [0, 1]
B 7−→ PX (B) = P (X −1 (B)) = P (X ∈ B)
définit une probabilité sur (E, B), appelée loi de X ou loi image de P par la variable
aléatoire X.
Preuve. Vérifions les trois axiomes des probabilités :
i) Il est clair que PX est à valeur dans [0, 1].
ii) PX (E) = P (X −1 (E)) = P (Ω) = 1.
iii) Si (Bi )i∈N est une suite d’événements deux à deux disjoints, on a :
PX (∪∞
i=1 Ai ) = P (X
−1 (∪∞ A ))
i=1 i
=PP (∪i=1 X −1 (Ai )) (car X −1 (∪∞
∞ ∞
i=1 Ai ) = ∪i=1 X
−1 (A ))
i
= Pi∈N P (X (Ai ) (car Les (X (Ai )i∈N sont 2 à 2 disjoints)
−1 −1
= i∈N PX (Ai ).
♠ Attention : Ne pas confondre la variable aléatoire avec sa loi. Considérons un dé bleu et
un dé rouge, et notons Xb , respectivement Xr , le résultat du lancer du bleu, respectivement
rouge. Alors P (Xb 6= Xr ) > 0 ( En effet ;
6
[ 6 1
P (Xb = Xr ) = P ( (Xb , Xr ) = (k, k)) = = .
36 6
k=1
5
Donc P (Xb 6= Xr ) = 6 ).
Donc les variables aléatoires Xb et Xr sont différentes ; par contre,
elles ont la même loi.
Exemple :
On tire, avec remise chaque fois, deux boules d’un sac contenant 3 boules numérotées de 1
à 3.
Soit X la v.a. : ”Somme des points obtenus”. On a :
Ω = {1, 2, 3}2 et card(Ω) = 32 = 9. On a aussi :
X(Ω) = {2, 3, 4, 5, 6}.
D’où :
{X = 2} = {(1, 1)}, P (X = 2) = 19 .
{X = 3} = {(1, 2), (2, 1)}, P (X = 3) = 29 .
{X = 4} = {(1, 3), (3, 1), (2, 2)}, P (X = 4) = 39 = 13 .
{X = 5} = {(2, 3), (3, 2)}, P (X = 5) = 29
{X = 6} = {(3, 3)}, P (X = 6) = 19 .
On peut représenter les résultats sous forme d’un tableau :
xi 2 3 4 5 6
1 2 3 2 1
P (X = xi ) 9 9 9 9 9
On vérifie que
1 2 3 2 1
+ + + + =1
9 9 9 9 9
Remarque : La loi de X est déterminer par X(Ω) et des valeurs
pi = P (X = xi ) = PX ({xi }).
Pn
Autrement dit, la loi de X est l’ensemble des (xi , pi ) tels que pi ≥ 0 et i=1 pi = 1.
30
3.4 Cas des variables aléatoires réelles
Quand l’espace d’arrivée E d’une v. a. X est une partie de R, On dit que X est une v.
a. réelle.
3.4.1 Fonction de répartition

Définition 3.3. Soit X une v. a. r. définie sur l’espace de probabilité (Ω, P ). La fonction
FX définie sur R par :
FX (x) = PX (] − ∞, x]) = P (X −1 (] − ∞, x])) = P (X ≤ x),
est appelée la fonction de répartition de X.
La fonction de répartition FX d’une v. a. r. X vérifie les propiétés suivantes :
Proposition 3.4. 1. 0 ≤ FX ≤ 1, limt−→−∞ FX (t) = 0 et limt−→+∞ FX (t) = 1.

2. FX est croissante
3. FX est continue à droite avec des limites à gauche (càdlàg).
4. pour tout x ∈ R, on a : en notant F (x− ) = limε−→0 F (x − ε) la limite à gauche :
P (X = x) = FX (x) − F (x− ).
Preuve.
1. L’encadrement 0 ≤ FX ≤ 1 vient du fait que P est à valeurs dans [0, 1].
On a :
∅ = ∩n∈N∗ {X ≤ −n}
et d’après la propriété de la continuité monotone, on a
0 = P (∅) = lim P (X ≤ −n) = lim FX (−n) = lim FX (n).

n−→+∞ n−→+∞ n−→−∞
Tandis que :
[
Ω= (X ≤ n) (d’après la propriété d’Archimid),
n∈N
Par suite :
1 = P (Ω) = lim P (X ≤ n) = lim FX (n)
n−→+∞ n−→+∞
2. La croissance découle de la croissance de P .

3. Montrons que limn−→+∞ FX (x + n1 ) = FX (x).
On a :
1 1
FX (x + ) = PX (] − ∞, x + ]).
n n
La suite des événements An =] − ∞, x + n1 ] est ↓ et
1
] − ∞, x] = ∩+∞
n=1 ] − ∞, x + ].
n
1
(En effet, pour tout y ∈] − ∞, x], on a y ≤ x ≤ x + n pour tout n et donc
1
y ∈ ∩] − ∞, x + ].
n
31
Réciproquement, tout y dans cette intersection vérifié : ∀n ∈ N∗ , y ≤ x + n1 . Le passage
à la limite qd n tend vers l’infini conservant cette inégalité large.
On en déduit y ≤ x i.e. y ∈] − ∞, x].)
D’après la propriété de la croissance monotone,
FX (x) = PX (] − ∞, x]) = P (∩] − ∞, x + n1 ])

= limn−→+∞ P (] − ∞, x + n1 ])
= limn−→+∞ FX (x + n1 ).
La limite à gauche est également une conséquence de la croissance de FX (Exercice.)

(Ind. écrire ∪n ] − ∞, x − n1 ] =] − ∞, x[ et FX (x− ) = PX (] − ∞, x[)).
4. On remarque que pour tout x ∈ R et tout n ∈ N∗ :
1 1 1
PX (]x − , x]) = PX (] − ∞, x]) − PX (] − ∞, x − ]) = FX (x) − FX (x − ).
n n n
Or,
1
{x} = ∩n∈N∗ ]x − , x].
n
Ce qui donne :
1
P ({x}) = lim PX (]x −
, x]).
n−→+∞ n
Remarque : On peut démontrer que deux variables aléatoires X et Y ont la même fonction
de répartition ssi elles ont la même loi. Autrement dit :
PX = PY ⇐⇒ FX = FY .
En pratique : On retrouve la probabilité des intervalles à partir de la fonction de répartition

de la façon suivante : Soit P une probabilité sur (R, BR ), et F sa fonction de répartition,
alors pour tous a < b :
P (]a, b]) = F (b) − F (a)

P ([a, b]) = F (b) − F (a− )
P (]a, b[) = F (b− ) − F (a)
P ([a, b[) = F (b− ) − F (a− )
P ({a}) = F (a) − F (a− )
Démonstration : La première propriété est claire par définition de la fonction de répartition.
Montrons la deuxième : on a
1
[a, b] = ∩n≥1 ]a − , b].
n
Par limite décroissante, on obtient :
1
P ([a, b]) = lim P (]a − , b]).
n−→+∞ n
Mais,
1 1
P (]a − , b]) = F (b) − F (a − )
n n
et
1
lim F (a − ) = F (a− ),
n−→∞ n
ce qui prouve le résultat.
32
♣ Exercice : Montrer les autres inéglités.
Exemple : Considérons l’exemple précédent. On a :
X(Ω) = {2, 3, 4, 5, 6}
On a :
xi 2 3 4 5 6
1 2 3 2 1
P (X = xi ) 9 9 9 9 9
Déterminons la fonction de répartition de X :
FX (x) = P (X ≤ x).
• Si x < 2, on a (X ≤ x) = ∅ =⇒ FX (x) = 0.
• Si 2 ≤ x < 3, on a (X ≤ x) = (X = 2) =⇒ FX (x) = P (X = 2) = 19 .
• Si 3 ≤ x < 4, on a (X ≤ x) = (X = 2) ∪ (X = 3), de plus les événements (X = 2) et
(X = 3) sont disjoints =⇒ FX (x) = P (X = 2) + P (X = 3) = 91 + 92 = 13 .
• Si 4 ≤ x < 5 , on a : FX (X) = 19 + 29 + 39 = 23 .
• Si 5 ≤ x < 6, on a Fx (x) = 23 + 29 = 89 .
• Si x ≥ 6, on a FX (x) = 1.
Fig. 1 -Fonction de répartition F de la v.a. X
3.5 Lois discrètes et lois continues

3.5.1 Lois discrètes
Définition 3.5. On dit qu’une v.a. X est discrète si elle prend ses valeurs dans un ensembles
fini ou dénombrable.
X(Ω) = {xi ∈ R/i ∈ I} avec I = N ou Z ou une de leurs parties finies.
Dans ce cas, connaitre la loi de probabilité de X, c’est connaitre les probabilités élémentaires :
∀xi ∈ X(Ω) : P (X = xi ) = pi .
P
Remarque : Il est toujours utile de vérifier que pi ≥ et i∈I pi = 1.
33
♣ Exercice : Soit X une v.a. réelle dont la loi est définie par :
xi -1 1 2
1 1 1
pi 4 2 4
Déterminer la loi de Y = 2X + 1 et de Z = X 2 .
Solution :
On a l’univers image de Y est {−1, 3, 5}.
1
P (Y = −1) = P (X = −1) = .
4
1
P (Y = 3) = P (X = 1) = .
2
1
P (Y = 5) = P (X = 2) = .
4
De même , l’univers image de Z est {1, 4}. On a :
3
P (Z = 1) = P (X = −1) + P (X = 1) = .
4
1
P (Z = 4) = P (X = 2) = .
4
Remarques :
1. Soit X une v.a. de Ω dans {x1 , x2 , ..., xn }.
La fonction de répartition vérifie :
• x ∈] − ∞, x1 [, FX (x) = P (∅) = 0,
• x ∈ [x1 , x2 [, FX (x) = P (X ≤ x) = FX (x1 ) = P (X = x1 ) = p1 .
..
.
• x ∈ [xi , xi+1 [, FX (x) = p1 + p2 + ... + pi ( car {X ≤ x} = {X = xi ou X =
xi−1 ou ....ou X = x1 }).
• X ≥ xn , FX (x) = 1 = P (Ω).
2. Dans le cas discret, comme
FX (xi ) − FX (xi−1 ) = pi = P (X = xi ).
Si on connait la fonction de répartition, on peut reconstruire la loi de X par différence

successives.
Exercice : Soit (a, b) ∈ N∗2 ; a < b ; X est une variable aléatoire discrète de Ω dans N ∗
telle que :
∀x ∈ |[1, ab]| ; P (X = x) = a1 − 1b et P (X = x) = 0 ailleurs.
1) Déterminer une CNS sur a et b pour que les relations précédentes définissent effecti-
vement une loi de probabilité.
2) Dans ces conditions, tracer la représentation graphique de la fonction de répartition
FX de X.
3) Calculer la probabilité pour que X ∈ |[a, a+b

2 ]|.
3.5.2 Lois continues

Quand la v. a. r. X prend ses valeurs dans un intervalle de R, ou dans une réunion
d’intervalles de R, on dit que X est une variable aléatoire continue.
34
Définition 3.6. On dit qu’une v. a. r. X admet une densité s’il existe une fonction positive
fX : R −→ R
telle que, pour tout intervalle [a, b] de R, on a

Z b
PX ([a, b]) = P (X ∈ [a, b]) = fX (t)dt.
a
Faisons quelques remarques concernant cette notion :
1. Une densité fX est positive et vérifie

Z +∞
fX (t)dt = 1.
−∞
Réciproquement toute fonction vérifiant ces deux conditionsR b est la densité d’une v.a.r.
(on définit la v.a. dont la loi est donnée par P ([a, b]) = a fX (t)dt)
2. Par définition même, on a
Z x
FX (x) = fX (t)dt.
−∞
Par conséquent, si la fonction fX est continue ( ou continue par morceaux), on a :
(FX )0 = fX .
On passe donc facilement de la fonction de répartition à la fonction densité et vice-

versa.
3.6 Les lois usuelles au programme

Dans toute la suite du chapitre, on fixe un espace probabilisé (Ω, A, P ), on désigne par X
une v. a. réelle sur (Ω, A).
3.6.1 Le cas fini

3.6.2 La loi uniforme discrète
Définition 3.7. La v.a.r. X suit la loi uniforme sur {a1 , a2 , ..., an } si X(Ω) = {a1 , a2 , ..., an }
et
1
PX ({ai }) = , 1 ≤ i ≤ n.
n
Autrement dit, PX est l’équiprobabilité sur {a1 , a2 , ..., an }.
Dans ce cas, on note X ∼ U{a1 ,a2 ,...,an } .
Exemple : On jette un dé non truqué et on note X le résultat obtenu. On a :
X ∼ U{1,2,...,6} .
35
3.6.3 La loi de Bernoulli
Définition 3.8. La v. a. r. X suit la loi de Bernoulli de paramètre p ∈ [0, 1] si elle ne prend
que deux valeurs 0 et 1 avec :
P (X = 1) = p, P (X = 0) = 1 − p = q.
Dans ca cas, on note X ∼ B(p).
Exemple : On jette une pièce de monnaie qui tombe sur pile avec la probabilité p et on
définit X par X = 1 si on tombe sur pile et X = 0 sinon. X est une v. a. de Bernoulli.
Remarques :
1. Si X ∼ B(p), on peut toujours écrire
X = 1A , avec A = {ω ∈ Ω/X(ω) = 1}.
càd que la v. a. de Bernoulli est une v. a. indicatrice : elle indique la réalisation

éventuelle de l’événement de probabilité p.
2. Les v. a. de Bernoulli sont naturellement associées à une expérience aléatoire qui a
deux issues possibles : blan ou noir, pile / face, succès / échec, pièce correcte / pic̀e
défectueuse, oui / non,....
3.6.4 La loi binomiale

Définition 3.9. La v. a. r. X suit la loi binomiale de paramètre n et p (n ∈ N∗ et p ∈ [0, 1])
si l’ensemble des valeurs possibles est X(Ω) = {0, 1, 2, ..., n} et
P (X = k) = Cnk pk (1 − p)n−k , ∀k = 0, 1, ..., n.
Dans ce cas, on note X ∼ B(n, p).

Remarques :
1. La formule ci-dessus définit bien une loi de probabilité puisque les Cnk pk (1−p)n−k sont
positifs et
Xn
Cnk pk (1 − p)n−k = (p + (1 − p))n = 1n = 1.
k=0
2. Les v. a. binomiales sont naturellement associées à la répétition de n expériences

identiques et indépendantes de Bernoulli à deux issues possibles : succès ou échec.
On s’intéresse au nombre X de succès obtenus au cours de la réalisation de n expériences
aléatoires identiques et indépendantes.
On introduit (ε1 , ε2 , ..., εn ) la suite des résultats de ces n expériences :
½
1 si le résultat de la i-ième expérience est S, i = 1, ..., n
εi =
0 Sinon.
P
Il est évident que X = ε1 + ... + εn = ni=1 εi .
Montrons que X ∼ B(n, p).
- Les valeurs possibles de sont {0,1,2,...,n}.
36
- Le nombre de ω tels que X(ω) = k est le nombre de suites de longueur n, formées
de k lettres S et (n − k) lettres E. Si la place de S est fixée, celle de E l’est aussi.
Ce qui revient à choisir k place parmi n soit Cnk .
D’où
P (X = k) = Cnk pk (1 − p)n−k , ∀k = 0, 1, ..., n.
Par exemple, si n = 5 , k = 3 et et ω0 = (S, E, E, S, S). On a choisi ω0 tel que
X(ω0 ) = 3. Les résultats sont indépendantes :
P ({ω0 }) = p(1 − p)(1 − p)pp = p3 (1 − p)2 .
Plus généralement, la probabilité d’un événement élémentaire vaut :
P ({ω}) = pk (1 − p)n−k .
où k désigne le nombre de fois ou l’on a recontré la lettre S dans ω.
♣ Exercice .
Un couple souhaite avoir exactement n enfants (n ∈ N∗ ). On considère qu’à chaque naissance
l’ensemble des possibilités est Ω = {G, F } : G étant l’événement ”avoir un garçon“ et F étant
l’événement ”avoir une fille“, ces 2 événements étant équiprobables.
On considère que les naissances sont indépendantes.
A la ieme naissance, on associe la variable aléatoire discrète Xi de Bernoulli, qui prend la
valeur 1 si G est réalisé, et la valeur 0 sinon. Soit X = X1 + ... + Xn .
1. Dans cette question n = 3.

a. Déterminer la probabilité que parmi ces trois enfants, le couple ait exactement 3
garçons ; exactement 2 garçons ; exactement 2 filles ; exactement 3 filles.
b. Déterminer la fonction de répartition de X.
2. Déterminer la plus petite valeur de n pour que la probabilité de ne pas avoir de garçon
soit < 10−2 .
Solution :
1-a. X ∼ B(3, 12 )
1 3
P (X = 3) = P (X = 0) = , P (X = 2) = P (X = 1) = .
8 8
1-b. La fonction de répartition de X :
x<0 0≤x<1 1≤x<2 2≤x<3 x≥3

1 1 7
F(x) 0 8 2 8 1
2. Dans le cas général X ∼ B(n, n1 ).
1
P (X = 0) =
2n
Cette probabilité est < 10−2 dès que n ≥ 7.
37
3.6.5 Le cas dénombrable
On rappelle qu’un ensemble Ω est dit dénombrable si et seulement si il existe une bijection
de N dans Ω. Un ensemble dénombrable est donc un ensemble dont on peut numéroter les
éléments.
3.6.6 La loi géométrique de paramètre p ∈]0, 1[

Définition 3.10. Soit X une v. a. r.. On dit que X suit la loi géométrique de paramètre p
si et seulement si :
• X(Ω) = N∗ .
• ∀k ∈ N∗ , P (X = k) = p(1 − p)k−1 .
Remarque : Le fait que la somme des probabilités fasse 1 vient de la formule de sommation
des progressions géométriques :
X ∞
X 1
rn converge ⇐⇒ |r| < 1 et alors rn = .
1−r
n∈ N n=0
Exemple : On lance une pièce de monnaie - qui tomble sur pile avec la probabilité p- jusqu’à
ce qu’on tombe sur pile et ci on note X le nombre de lancers effectués, la v. a. X suit la loi
géométrique de paramètre p.
En effet, soit (Xk )k∈N une suite de v. a. de bernoulli indépendante et de même loi B(p)
P (X = k) = P (X1 = 0, X2 = 0, ..., Xk = 1) = (1 − p)k−1 p.
3.6.7 La loi de Poisson de paramètre λ ∈]0, ∞[

Définition 3.11. Soit X une v. a. r.. On dit que X suit la loi Poisson de paramètre λ > 0
si et seulement si :
• X(Ω) = N.
k e−λ
• ∀k ∈ N, P (X = k) = λ k! .
Dans ce cas, on note X ∼ P(λ).
Remarque : Le fait que la somme des probabilités fasse 1 vient de la formule de sommation
de la série exponentielle :
X λn X λn
∀λ ∈ R, converge et = exp(λ).
n! n!
n∈ N n∈ N
Champs d’applications : C’est la loi qu’on obtient en comptant des événements aléatoires
indépendants :
1. Arrivée des particules sur un capteur,
2. Nombre de clients entrant dans un magasin,
3. comptage de voiture sur une route,
4. Etude d’attente dans les réseaux dec communication...
Exemple : On supppose que le nombre de clients entrant dans un magasin un jour donné
est une variable aléatoire de Poisson de paramètre λ = 12. Quelle est la probabilité de ne pas
tomber en dessous de 250 entrées de clients durant un mois de 22 jours ouverables ?
(On suppose que les v. a. comptant le nombre d’entrées de chaque jour sont indépendantes.)
38
Soit X le nombre de clients entrant dans le magasin durant un mois de 22 jours ouverables.
On a X = X1 + X2 + ... + X22 , avec les Xi sont i.i.d. et Xi ∼ P(12).
Donc,
X ∼ P(12 × 22) = P(264).
249
X (264)i
P (X ≥ 250) = 1 − P (X < 250) = 1 − e−264 = 0, 813.
i!
i=0
La loi de Poisson s’obtient par passage à la limite :

Proposition 3.12. Soit (Xn ) une suite de v. a. r. de loi B(n, pn ) avec (pn ) une suite de
[0, 1] vérifiant limn−→∞ npn = λ. On a pour tout k ∈ N :
λk
lim P (Xn = k) = e−λ .
n−→∞ k!
Preuve. On a
P (Xn = k) = Cnk pkn (1 − pn )n−k
n! npn −k (npn )k npn n
= (n−k)!nk
(1 − n ) k! (1 − n )
xn n
De la limite bien connue limn−→∞ (1 + n ) = ex valable qd xn −→n−→∞ x.
On en déduit que :
λk
lim P (Xn = k) = e−λ .
n−→∞ k!
Remarque : En pratique, on remplace la loi binomiale par la loi de Poisson P(np) dès que :
n > 50 et p < 0, 1. Plus p est petit l’approximation est meilleure.
Exemple : Un jeu de tombola comptant 100 billets ait lieu pendant 100 jours. Chaque
tombola ne compte qu’un billet gagnant. Une personne décide de participer au jeu en achetant
un billet par jour. Notons X le nb de fois où elle gagne pendant ces 100 jours. Calculer la
probabilité des événements suivants :
(X = 0), (X = 1), (X = 2), (X = 3).
Soit
1
X ∼ B(100, ) et Y ∼ P(1).
100
D’après la proposition précédente, on ne se retrompe pas beaucoup en approximant la loi de
X par celle de Y .
Voici une comparaison numérique pour les petites valeurs de k.
k 0 1 2 3
P(X=k) 0.3660 0.3697 0.1849 0.0794
P(Y=k) 0.3679 0.3679 0.1839 0.0803
L’intérêt de cette approximation est que les calculs des probabilités liées à la loi de Poisson
sont plus faciles à effectuer.
39
3.6.8 Le cas continu
3.6.9 La loi uniforme continue sur le segment [a, b] :
Définition 3.13. Une v.a.r. x est dite uniforme sur l’intervalle [a, b] (avec b > a) si elle
admet pour densité :
½ 1
1 b−a si a ≤ x ≤ b,
f (x) = 1 (x) =
b − a [a,b] 0 sinon.
Dans ce cas, on note X ∼ U[a,b] .

Remarques :
1) f est clairement mesurable (elle est C ∞ par morceaux), positive, et
Z Z b
1
f (x)dx = dx = 1.
R a b−a
2) Soit [α, β] ⊂ [a, b], on a :

Z β
1 β−α
PX ([α, β]) = P (α ≤ x ≤ β) = dx = .
α b−a b−a
De plus tous les intervalles de même longueur ont même probabilité.
♣Exercice : Calculer la fonction de répartition de la loi U[a,b] .
3.6.10 lois gaussiennes (ou lois normales)

Définition 3.14. Une v. a. r. X est dite gaussienne de moyenne m et de variance σ 2 ∈ R∗+ ,
si elle admet pour densité :
1 (x − m)2
f (x) = √ exp(− )
2πσ 2 2σ 2
Dans ce cas, on note X ∼ N (m, σ 2 ).

Lorsque m = 0, et σ = 1 la v. a. X est dite centée réduite.
Remarques :
1. f est clairement mesurable (elle est C ∞ ), positive, et on peut montrer que l’intégrale
de la densité vaut bien 1- voir TD.
2. Les régions de R à forte probabilité pour N (0, 1) sont les régions où la densité est
élevé.
Si X ∼ N (0, 1) :
P (X ∈ [−3, 3]) = Π(3) − F (−3) = 2Π(3) − 1 = 99, 7%,
avec Π est la fct de répartition de la loi N (0, 1).

3. On ne peut pas calculer la fonction de répartition avec des fonction classiques. On
utilise si nécessaire une table de valeurs.
Champs d’applications : La loi gaussienne est la lois la plus utilisée en théorie des
probabilités et en statistique. Cela est dû au caractéristiques suivantes :
1. Elle permet des développements mathématiques efficaces.
2. Toute l’information est donnée directement par les paramètres m et σ, qui caractérisent
respectivement la valeur moyenne et la dispersion autour de cette valeur moyenne.
3. C’est la loi qu’on obtient naturellement en additionnant un grand nombre de v. a.
indépendantes (voir théorème central limite-ch. 7).
40
4. La plupart des lois de probabilité intervenant dans les tests statistiques comme la loi
χ2 et la loi de student se déduisent de la loi gaussienne par des transformations simples.
n
X
χ2 = Xi2 avec Xi ∼ N (0, 1) et sont indépendantes
i=1
5. Elle présente un grand nombre de phénomènes aléatoires comme les erreurs liées aux
mesures, la fluctuation des prix, la distribution des tailles de personnes choisies au
hasard dans une population donnée, les variations de la longueur des pièces fabriquées
en série, etc...
Exemple : On suppose que la taille des individus suit une loi normale de paramètres m et
σ.
Sachant que 4% des individus mesurent moins de 160 cm et 11% mesurent plus de 180 cm.
Quelle est la valeur de m et σ ?
Solution : On pose :
X −m
Z= .
σ
On a, d’après Exo 11 série no 3, Z ∼ N (0, 1).
D’où :
160 − m 160 − m
P (X ≤ 160) = P (Z ≤ ) = π( ).
σ σ
Or 4% des individus mesurent moins de 160 cm, donc :
160 − m
π( ) = 0, 04.
σ
On a aussi 96% des individus mesurent plus de 160 cm, d’où
m − 160
π( ) = 0, 96.
σ
La table de la loi N (0, 1) donne : m−160
σ = 1, 76.
De même :
180 − m 180 − m
P (X > 160) = P (Z > ) = 1 − π( ).
σ σ
Or 11% des individus mesurent plus de 180 cm, d’où :
180 − m
π( ) = 0, 89.
σ
La table de la loi N (0, 1) donne : 180−m
σ = 1, 23.
D’où le système : ½ ½
m − 160 = 1, 76σ m = 172
=⇒
−m + 180 = 1, 23σ σ = 6, 7.
3.6.11 La loi exponentielle

Définition 3.15. Soit θ > 0
a. La probabilité P sur (R, B, (R)), dont la densité est donnée par

 θ exp(−θx) si x > 0,
f (x) = = θ exp(−θx)1]0,+∞[ (x)

0 sinon
est appelée loi exponentielle de paramètre θ.
41
b. Soit (Ω, F, P ) un espace de probabilité quelconque et X une variable aléatoire de Ω
dans R. On dit que X suit la loi exponentielle de paramètre θ si et seulement si elle
admet pour densité le f défini précédemment.
Remarque 3.1. f est clairement borélienne (elle est C ∞ par morceaux), positive, et
Z Z ∞
f (x)dx = θ exp(−θx)dx = 1.
R 0
♣ Exercice : Montrer que la fonction de répartition de la loi exponentielle est donnée par :
F (x) = (1 − e−θx )1[0,+∞[ (x).
Tracer la courbe de F.
Champs d’applications :
1. La loi exponentielle intervient en fiabilité pour modéliser la durée de fonctionnement
d’un équipement technique : par exemple la durée de vie d’un appareil électrique.
2. Elle intervient dans le domaine de la radioactivité : chaque atome radioactif possède
une durée de vie qui sui une loi exponentielle exp(θ), le paramètre θ s’appelle la
constante de désintégration.
3. Elle intervient aussi pour modéliser le temps séparant les arrivées de deux clients dans
l’étude d’un phénomène d’attente : Le temps d’attente T entre deux arrivées suit une
loi exponentielle de paramètre θ, et on a :
P (T > t) = exp(−θt).
Exemple : La fiabilité globale d’une carte électronique suit une loi exponentielle de paramètre
θ, avec θ = 12.10−6 h−1 . Pour un fonctionnement 24 heures sur 24 pendant 208 jours par an,
donnez la probabilité que cette carte électronique fonctionne encore au bout de ces 208 jours.
On a
t = 24 × 208 = 5000heures.
Soit X la durée de vie de cette carte électronique, on a
P (X > 5000) = exp(−0, 000012 × 5000) = 0, 9418.
càd , la probabilité d’avoir une défaillance pendant la durée de fonctionnement de 5000h est
5, 8%. L’inérêt qu’on porte à cette loi est dû à la :
Proposition 3.16. Soit X une v. a. r. suivant la loi exp(θ), alors X vérifie la propriété
d’absence de mémoire :
∀s ∈ R+ , ∀t ∈ R+ , P (X > t + s/X > t) = P (X > s)
(On parle aussi de la propriété de non vieillissement).
Preuve. On a X ∼ exp(θ), donc

P (X>t+s)
PX>t (X > t + s) = P (X>t)
R +∞
θ t+s e−θx dx
= R +∞
θ t e−θx dx
e−θ(t+s)
= e−θt
= e−θs = P (X > s).
42
Interprétation :
Si X modélise la durée de vie d’un individu A, la propriété que X est sans mémoire exprime
que A ne vieillit pas : si A a vécu t années, la probabilité pour qu’il vive encore s années est
la même que la probabilité pour qu’un individu similaire à A qui vient de naı̂tre vive lui aussi
s années. Autrement dit : La durée de vie au-delà de l’instant t est indépendante de l’instant
t.
3.7 Variables aléatoires indépendantes

Soient X et Y deux variables aléatoires.
a. Cas où X et Y sont discriètes :
Notons {xi } (resp.{yi }) l’ensemble des valeurs prises par X (resp. par Y ).
Définition 3.17. X et Y sont dites indépendantes si, pour tous i et j, on a :
P ({X = xi } ∩ {Y = yj }) = P (X = xi )P (Y = yj ).
b. Cas où X et Y sont à densité.
Définition 3.18. X et Y sont dites indépendantes si, pour tous intrevalles I et J de

R, on a :
P ({X ∈ I} ∩ {Y ∈ J}) = P (X ∈ I)P (Y ∈ J).
43
3.8 Résumé du troisième chapitre
Les lois de probabilités théoriques essaient de décrire des phénomènes aléatoires dans le but
de calculer la probabilité de certains événements et donc d’avoir une certaine représentation
de l’avenir.
I. Lois discrètes :
1. Loi de Bernoulli B(p)
La loi de Bernoulli intervient dans le cas d’une seule expérience aléatoire à laquelle
on associe un événement aléatoire quelconque.
La réalisation de l’événement au cours de cette expérience est appelée succès et la
probabilité de réalisation est dite probabilité de succès, notée par p. Par contre la non
réalisation de l’événement est appelée échec et la probabilité de non réalisation de
l’événement est dite probabilité d’échec, noté par q = 1 − p.
La v. a. X qui caractérise le nombre de succès au cours d’une seule

expérience aléatoire est appelée v.a. de Bernoulli : elle prend les valeurs
dans {0, 1} avec probabilités respectives q et p.
Remarque : La v.a. de Bernoulli est une v.a. indicatrice : elle indique la réalisation
éventuelle de l’événement de probabilité p. Le shéma de Bernoulli est le plus simple
des modèles probabilistes.
2. Loi Binomiale B(n, p)

La loi Binomiale intervient dans le cas de plusieurs (n) expériences aléatoires identiques
et indépendantes auxqelles on associe un événement aléatoire quelconque.
Les probabilités p et q restent constantes au cours de cette suite de n expériences.
La v. a. X qui caractérise le nombre de succès au cours de n expériences
aléatoires indépendantes est appelée variable binomiale : elle prend les va-
leurs dans {0, ..., n}.
La probabilité d’obtenir k succès et donc n − k échecs au cours de n expériences
aléatoires indépendantes est,
P (X = k) = Cnk pk (1 − p)n−k , k = 0, ..., n

Remarque :
– n = : nb d’épreuves.
– k : nb de succès.
– p : probabilité de succès.
Il y a des tables pour éviter de calculer les probabilités d’événements liés à la loi
binomiales.
3. Loi Géométrique G(p)

On se place dans une optique différente. A la base il y a toujours l’epreuve de Bernoulli
qui a deux résultats possibles : événement de probabilité p et l’autre. Mais cette fois
on ne connait pas le nombre d’expériences.
Par exemple : si on lance une pièce de monnaie - qui tombe sur pile avec probabilité
p- jusqu’à ce qu’on tombe sur pile et si on note X le nombre de lancers effectués, la
v.a. X suit la loi de Géométrique de paramètre p : elle prend les valeurs dans
N∗ .
P (X = k) = p(1 − p)k−1 , k ∈ N∗ .
44
4. Loi de Poisson P (m)
La loi de Poisson intervient pour des phénomènes aléatoires dont le nombre de
réalisations varie de 0 à +∞ et dont le nombre moyen de réalisations est connue.
Exemple : nb d’appels reçus par un standard téléphonique, nb d’accidents de la cir-
culation, nb de visiteurs d’un centre commercial...
La variable aléatoire X qui caractérise le nombre de réalisations de ce
phénomène est appelée variable de Poisson : elle prend les valeurs 0,1, ...
e−m mk
P (X = k) = .
k!
Théorème d’approximation Soit X une v.a. vérifiant X ∼ B(n, p), telle que
npn −→ m quand n −→ ∞.
Alors Xn −→ P (m) quand n −→ ∞.

En pratique
n > 50 et p < 0.1
Plus p est petit, meilleure est l’approximation. Pour cette raison la loi de Poisson a été
appelée la loi des phénomènes rares.
II. Lois continues : La loi normale est la loi continue la plus importante et la plus
utilisée dans le calcul de probabilité. (Voir le cours).
X Très important !
Il faut connaı̂tre d’une part toutes les définitions des lois usuelles, mais aussi et surtout
savoir, en pratique, décider si le résultat X de mon expérience aléatoire a pour loi plutôt la
loi uniforme, la loi binomiale, la loi de Poisson, etc.
C’est la chose la plus dure à faire. Ensuite, tout ce que l’on peut vous demander (espérance,
variance, etc.) , ce n’est plus que des calculs.
45
3.9 Exercices
Exercice 1.
1. On lance un dé équilibré ; prenons Ω = {1, ..., 6}, on muni Ω de la tribu P(Ω). On
met sur P(Ω) la probabilité uniforme ( ce qui correspond au fait que le dé est équilibré).
Soit X la v.a. réelle définie par X(3) = X(6) = 1 et X(1) = X(2) = X(4) = X(5) = 0.
X indique si le numéro sorti est un multiple de 3.
Donner la loi PX de la v.a. X.
2. On lance un dé équilibré jusqu’à obtention d’un numéro multiple de 3. on note Y le

nombre de lancers nécessaires pour l’obtenir.
Calculer la loi de probabilité de Y .
(Indication calcuer P (Y = n), pour n ∈ N∗ ).
Exercice 2.
On jette l’un après l’autre deux dés tétraédriques (les 4 faces numérotées de 1 à 4), équilibrés.
Associons à cet expérience l’univers Ω = {1, ..., 4}2 . On note X le plus grand ( au sens large)
des numéros apparus.
1. Donner un espace probabilisé qui modélise cet expérience aléatoire.
2. Montrer que X est une variable aléatoire.
3. Calculer la loi PX de la v.a. X.
4. Trouver la fonction de répartition FX de la v.a. X.
5. Tracer la courbe représentative de FX .
Exercice 3.
Un couple souhaite avoir exactement n enfants (n ∈ N∗ ). On considère qu’à chaque naissance
l’ensemble des possibilités est Ω = {G, F } : G étant l’événement ”avoir un garçon“ et F étant
l’événement ”avoir une fille“, ces 2 événements étant équiprobables.
On considère que les naissances sont indépendantes.
A la ieme naissance, on associe la variable aléatoire discrète Xi de Bernoulli, qui prend la
valeur 1 si G est réalisé, et la valeur 0 sinon. Soit X = X1 + ... + Xn .
1. Dans cette question n = 3.

a. Déterminer la probabilité que parmi ces trois enfants, le couple ait exactement 3
garçons ; exactement 2 garçons ; exactement 2 filles ; exactement 3 filles.
b. Déterminer la fonction de répartition de X.
2. Déterminer la plus petite valeur de n pour que la probabilité de ne pas avoir de garçon
soit < 10−2 .
Exercice 4.
On suppose que 5 % des pièces en sortie d’une chaine de production soient défectueuses.
1. Quelle est la probabilité qu’un échantillion de 20 pièces issu de cette chaı̂ne ne contienne
46
aucune pièce défectueuse ?
2. Quelle est la probabilité que la première pièce défectueuse ne soit pas l’une des 20
premières sorties de la chaı̂ne ?
Exercice 5.
Soit X1 , ..., Xn , n variables définies sur le même espace de probabilité, indépendantes et qui
suivent la même loi de Bernoulli B(p) de paramètre p, où p ∈]0, 1[. On note S la variable
aléatoire discrète qui vaut 0 si pour tout i ∈ {1, ..., n} Xi = 0, et qui vaut 1 dans le cas
contraire.
Déterminer la plus petite valeur de n pour que P (S = 0) ≤ 10−3 .
Application :
Un texte comporte une erreur. On relit ce texte n fois de manière indépendante, à chaque
fois, la probabilité de remarquer cette erreur est 21 . Déterminer la plus petite valeur de n pour
1
que la probabilité de ne pas avoir remarqué cette erreur soit ≤ 1000 .
Exercice 6.
Dans une pépinière 95% des fleurs sont supposées sans virus. Par commodité les fleurs sont
rangées par paquets de 2. Un paquet est dit sain si les deux fleurs le sont.
1. Quelle est la probabilité d’avoir un paquet sain ?

2. X = nb de paquets sains sur un lot de 10. Quelle est la loi de X.
3. Un lot de 10 est accépté par l’acheteur si 9 au moins des paquets sont sains.
Quelle est la probabilité qu’un lot soit accépté ?
Exercice 7.
Une usine employant 30 personnes dont 4 ingénieurs, 10 techniciens et 16 ouvriers.
1. On choisit de façons successive 3 employés : calculer la probabilité d’avoir un employé
de chaque catégorie professionnelle.
2. On choisit de façon successive 3 employés et soit X la variable aléatoire qui représente
le nombre d’ingénieurs choisis. Donner la loi de probabilité de X.
Exercice 8. On étudie la durée des communications téléphoniques dont la fonction de

répartition est : ½
0 si x < 0
F (x) = −kx
1−e si x ≥ 0.
Sachant que k = 56 .
1. Quelle est la probabilité pour qu’une communication dure plus de 3 minutes ?
2. Quelle est la probabilité pour qu’une communication ait une durée entre 3 et 6 mi-
nutes ?
3. Si on ne connaı̂t pas k, quelle valeur faudrait-il lui donner pour que la probabilité
d’une communication supérieure à 3 minutes soit égale à 0.1 ?
Exercice 9.
Interprétation du graphique d’une f.d.r.
La variable aléatoire X a pour fonction de répartition F dont le graphe est représenté par la
figure 1.
47
1. Pour tout x ∈ R, montrer que :
P (X = x) = F (x) − F (x−),
avec F (x−) = limε−→0 F (x − ε).

2. En exploitant les informations fournies par ce graphique1 , donner les valeurs des pro-
babilités suivantes.
P (X = 0), P (X ≥ 0), P (4 ≤ X ≤ 6), P (0 < X < 4), P (X ≥ 6).
3. La variable aléatoire X est-elle à densité ?
Exercice 10.
Soit (a, b) ∈ N∗2 ; a < b ; X est une variable aléatoire discrète de Ω dans N ∗ telle que :
FX de X.

2 ]|.
Exercice 11. (Loi normale)
On considère la fonction f (u) définie par :

u2
f (u) = ke− 2 , ∀u ∈ R.
1. Déterminer la constante k de telle sorte que f (x) puisse être considérée comme la
densité de probabilité d’une v.a. continue U .
2. Soit Π(z) la fonction de répartition de U . Montrer que
Π(−z) = 1 − Π(z)
3. Soit FX la fonction de répartition de X. Montrer que

x−m
FX (x) = Π( ).
σ
4. Soit X la v.a. définie par
X = m + σU
où m et σ sont des réels non nuls. Déterminer la densité de probabilité g(x) de X.
5. Montrer que par le changement de variable z = x−m σ toutes les varibles aléatoires
normales N (m, σ) se ramèment à la loi normale centrée réduite U .
6. Application : Le stock journalier d’un produit destiné à un atelier suit une loi nor-
male de moyenne 120 pièces et d’écart type 50 pièces.
48
a. Calculer la probabilité pour que le nombre de pièces en stock soit compris entre 80
et 160.
b. Calculer la probabilité pour que le nombre de pièces en stock soit supérieur à 200.
c. Calculer la probabilité pour qu’il y ait rupture de stock.
d. Interpret́er ces résultats.
On donne
Π(0, 8) = 0, 7881, Π(1, 6) = 0, 9452 et Π(2, 4) = 0, 9918.

Exercice 12.
Soit U une v. a. r. de loi uniforme sur [0, 1], et X la variable aléatoire définie par
1
X = − ln(U ),
p
où p > 0. Déterminer la loi de X.
Exercice 13.
Environ 5% des réservations aériennes sur une ligne donnée ne sont pas utilisées, et c’est
pourquoi une compagnie vend 100 billets pour 97 places.
Quelle est la probabilité pour que tous les passagers aient une place ? Faire le calcul exact
(avec une loi binomiale), et le calcul approché (avec une loi de Poisson).
Exercice 14.
Soit X une v. a. uniforme sur [−1, +1].
1. Calculer P (|X| > 12 )
2. Quelle est la densité de la v. a. Y = |X|.

Exercice∗∗ 15.
On jette 5 dés. Après le premier lancer, on reprend et on lance les dés qui n’ont pas donné
de six, jusqu’à ce qu’onobtienne 5 six. Soit X le nombre de lancers nécessaires.
1. Calcuer P (X ≤ n) puis P (X = n) pour n ∈ N.

2. Combien de lancers sont nécessaires en moyenne pour obtenir les 5 six ?
Exercice 16.
On désire modéliser le temps d’attente d’une panne de machine à l’aide de variables alátoires
sans mémoire : la probabilité pour que la machine tombe en panne après la date k + n sachant
qu’elle fonctionne à l’instant n est indépendante de n.
1. Montrer que la loi géométrique de paramètre p est sans mémoire : c’est à dire que
P (X > k + n/X > n) est indépendante de n.
2. Caractériser toutes les lois des variables aléatoires X à valeurs dans N∗ qui sont sans
mémoire. On pourra calculer P (X > 1 + n) en fonction de P (X > 1).
3. Caractériser toutes les lois des variables aléatoires X à valeurs dans N qui sont sans
mémoire.
1
Cet exercice constitue le sujet d’un devoir libre.
49
Chapitre 4
Espérance et variance d’une

variable aléatoire réelle
Soit (Ω, F, P ) un espace de probabilité et X une v. a. de Ω dans R.
4.1 Cas des variables aléatoires discrètes

Considérons le cas où Ω est fini et F = P(Ω). La moyenne des valeurs X(ω) est :
P
X(ω)
m = ω∈Ω .
card(Ω)
1
Si P est l’équiprobabilité, pour tout ω ∈ Ω, P ({ω}) = card(Ω) .
Donc X
m= X(ω)P ({ω})
ω∈Ω
P
Si P est une probabilité quelconque, ω∈Ω X(ω)P ({ω}) est la moyenne des valeurs X(ω)
pondérées par les probabilités des événements élémentaires {ω}.
En calcul des probabilités, cette moyenne est appelée espérance de X et notée E(X).
Donc si Ω est fini, X
E(X) = X(ω)P ({ω}).
ω∈Ω
Soit X une v. a. r. discrète prenant ses valeurs dans l’ensemble {xi }i∈I , I ⊂ N. En
regroupant les ω pour lesquels X prend la même valeur, on obtient
X X
E(X) = xi P (X = xi ), car P (X = xi ) = P ({ω})
i∈I ω/X(ω)=xi
Nous allons définir le concept de probabilité d’une v. a. r., qui, représentera sa valeur
moyenne.
P
Définition 4.1. 1. On dit que X est intégrable si la somme i∈I |xi |P (X = xi ) converge.
2. Si X est intégrable, son espérance est donnée par :
X X
E(X) = xi P (X = xi ) = xP (X = x).
i∈I x∈X(Ω)
P
Remarques : 1) La somme i∈I |xi |PX (xi ) est soit une somme finie (si X(Ω) est fini)
et dans ce cas, l’espérance existe toujours, soit une série à terme positifs (si X(Ω) est une
50
partie dénombrable infinie), et dans ce cas, la série peut être divergente et avoir une somme
égale à +∞.
Rappelons que dans le cas d’une série à termes positifs, la suite des sommes partielles est
croissante, et deux cas se présentent donc :
- soit la suite de ces sommes partielles est majorée et la série est convergente ;
- soit la suite de ces sommes parielles tend vers +∞ et la série diverge vers +∞.
Exemples :
1. Si X est une v.a. constante X = c, alors E(X) = c.
2. Soit X une v.a. discrète dont la loi est donnée par :
x 2 3 4 5 6
1 2 3 2 1
P(x=x) 9 9 9 9 9
1 2 3 2 1
E(x) = 2 × + 3 × + 4 × + 5 × + 6 × = 4.
9 9 9 9 9
3. Soit X une v.a. de Bernoulli de paramètre p.
On a X = 1A , alors E(X) = E(1A ) = P (A) = p.
En effet, X(Ω) = {0, 1}.
On a {X = 1} = A = {ω/X(ω) = 1}.
Donc
E(X) = 0.P (X = 0) + 1 × P (X = 1)
= P (X = 1) = P (A).
Remarque : Si pour tout i ∈ I, on a : a ≤ xi ≤ b, on a :
a ≤ E(X) ≤ b,
car X X
aP (X = xi ) ≤ E(X) ≤ bP (X = xi )
i∈I i∈I
P
et comme i∈I P (X = xi ) = 1, on a le résultat.
En particulier, si X ≥ 0, alors E(X) ≥ 0.
4.1.1 Espérance d’une fonction d’une variable aléatoire réelle

Soit g une fonction définie sur X(Ω) à valeurs dans R.
Théorème 4.2. (ThéorèmePde transfert)
Si I est fini ou si la série i∈I g(xi )P (X = xi ) est absolument convergente, alors la v.a.
g(X) admet une espérance et on a :
X
E(g(X)) = g(xi )P (X = xi ).
i∈I
Preuve. Dans le cas où I = |[1, n]|.

Soit Y = g(X). Y prend les valeurs : y1 , y2 ,,...,ym avec les probabilités :
X
P (Y = yj ) = P (X = xi )
i∈Ij
où
Ij = {i/g(xi ) = yj }.
51
Donc :
P P P
E(Y ) = m
j=1 yj P (Y = yj ) = m j=1 yj [ i∈Ij P (X = xi )]
P P P P
= m
j=1 [ i∈Ij yj P (X = xi )] = m j=1 [ i∈Ij g(xi )P (X = xi )]
P
= i∈I g(xi )P (X = xi ), car (Ij )1≤j≤m est une partition de |[1, n]|.
Remarque :
1. Si g = id, on retrouve la formule donnant l’espérance.
2. Si la fonction g est bornée, la formule pour E(g(X))est valable sans aucune condition.
4.2 Cas des variables aléatoires à densité

Définition 4.3. Soit X une v. a. r. à densité. R
1. On dit que X est intégrable si l’intégrale R |x|fX (x)dx converge.
2. Si X est intégrable, son espérance est donnée par :
Z
E(X) = xfX (x)dx.
R
Exemple :
Soit X ∼ U[a,b] avec a < b.
Alors : Z +∞ Z +∞
x 1 x2 b b+a
E(X) = xf (x)dx = dx = [ ] = .
−∞ −∞ b−a b−a 2 a 2
Exemple :
Soit X ∼ U[a,b] avec a < b. Et soit g(x) = exp(x)
Alors : R +∞
E(g(X)) = E(exp(X) = −∞ g(x)f (x)dx
R +∞
= −∞ exp(x) 1 b
b−a dx = b−a [exp(x)]a =
exp(b)−exp(a)
b−a .
L’analogue du théorème de transfert, dans ce cas, est le résultat suivant :
Théorème 4.4. Soient X une v. a. r. Rà densité et h une fonction continue. Alors h(X) est
intégrable si et seulement si l’intégrale R |h(x)|fX (x)dx converge.
Dans ce cas, on a Z
E(h(X)) = h(x)fX (x)dx.
R
4.3 Linéarité de l’espérance

Proposition 4.5. 1. Si X et Y sont deux v. a. intégrables, et si a ∈ R, alors aX + Y
est integrable et
E(aX + Y ) = aE(X) + E(Y ).
2. Si X est une v. a. positive, alors E(X) ≥ 0.
Si X et Y sont deux v. a. intégrables, et si X ≤ Y , alors E(X) ≤ E(Y ).
Autrement dit, X 7−→ E(X) est une forme linéaire positive.
Preuve.
1. La démonstration repose sur un schéma classique : on montre d’abord la linéarité pour
les v. a. simples, puis par approximation, pour les v. a. positives, et finalement, pour
toutes les variables aléatoires intégrables en utilisant que E(X) = E(X + ) − E(X − ).
(Hors programme).
52
2. Clair par définition de l’espérance d’une variable aléatoire. On déja démontré le
rérultat dans le cas discret. Noter aussi que si X ≤ Y , alors Y − X ≥ 0.
4.4 Moments, variance et écart-type

Définition 4.6. Soient X une v.a.r. et k ∈ N∗ . On dit que X admet un moment d’ordre k
si la v. a. r. X k est intégrable.
Dans ce cas, la valeur E(X k ) est appelée moment d’ordre k de X. On note
mk (X) = E(X k ).
Remarque 4.1. 1. Le moment d’ordre 1 de X, si il existe, est l’espéranceR de X.

+∞
2. Soit X v. a. à densité f . Comme la fonction x → xr est continue, donc si −∞ xr f (x)dx
converge absolument, mr (X) existe et on a :
Z +∞
mr (X) = xr f (x)dx. ( théorème de transfert).
−∞
3. Si la v. a. r. X admet un moment absolu d’ordre r fini, elle a aussi un moment absolu

d’ordre p fini pour tout p ∈ |[0, r]| : En effet :
Si 0 ≤ p ≤ r, on a :
|X|p ≤ 1{|X|≤1} + |X|p 1{|X|>1} ≤ 1 + |X|r .
( car : 1Ω = 1{|X|≤1}∪{|X|>1} =⇒ |X|p = |X|p 1{|X|≤1} + |X|p 1{|X|>1} .)

Définition 4.7. Soit X une v. a. r. admettant un moment d’ordre 2.
1. La variance de X est par définition :
V ar(X) = E[(X − E(X))2 ]
2. L’écart-type de X est par définition égal :

p
σ(X) = V ar(X).
Remarque 4.2. La variance d’une v. a. r. représente sa dispersion autour de sa moyenne.

C’est un nombre toujours positif, ce qui est évident vu sa définition.
Nous allons montrer dans le paragraphe qui suit l’inégalité suivante :
V ar(X)
P (|X − E(X)| > a) ≤ .
a2
En pratique, on utilise la
Proposition 4.8. Soit X une v. a. r. admettant un moment d’ordre 2. On a :
V ar(X) = E(X 2 ) − E(X)2 .
Preuve. Il suffit d’utiliser la linéarité de l’espérance :
V ar(X) = E(X − E(X))2 = E(X 2 − 2E(X)X + E(X)2 )

= E(X 2 ) − 2E(X)2 + E(X)2 = E(X 2 ) − E(X)2 .
53
La variance vérifie également les propriétés suivantes :
Proposition 4.9. Soit X une v. a. r. admettant un moment d’ordre 2. On a :
1. V ar(aX + b) = a2 V ar(X), pour tout a, b ∈ R.
2. V ar(X) = 0 si et seulement si X est une constante.
Preuve.
1. Laissée en exercice.
2. Cela repose sur le résultat important suivant : si Z est une v. a. r. positive telle que
E(Z) = 0, alors Z = 0. En effet, on a
1
Z≥ 1 1 .
n {Z≥ n }
Donc P (Z ≥ n1 ) = 0 pour tout n ∈ N∗ .
On a aussi,
P (Z > 0) = P (∪n {Z ≥ n1 })
= limn−→∞ P (Z ≥ n1 )
= limn−→∞ 0 = 0.
Il suffit d’appliquer ce résultat à Z = (X − E(X))2 .
4.5 Inégalités classiques

4.5.1 L’inégalité de Markov
Proposition 4.10. Si X est une v. a. r. positive, intégrable, et si a ∈ R∗+ , On a :
E(X)
P (X > a) ≤ .
a
Preuve.
Elle découle de l’inégalité X ≥ a1X>a et de la positivité de l’espérance.
4.5.2 L’inégalité de Bienaymé-Tchebycheff

Proposition 4.11. Si X est une v. a. r. admettant un moment d’ordre 2, et si a ∈ R∗+ , On
a:
V ar(X)
P (|X − E(X)| > a) ≤ .
a2
Preuve.
Il suffit d’appliquer l’inégalité de Markov à (X − E(X))2 après avoir remarqué que :
{|X − E(X)| > a} = {(X − E(X))2 > a2 }.
54
4.5.3 L’inégalité de Jensen
Proposition 4.12. Soient X une v. a. r. intégrable, et g : R −→ R une fonction convexe
telle que la v. a. r. g(X) soit intégrable. Alors :
g(E(X)) ≤ E(g(X)).
Preuve.
La convexité de g assure qu’en tout point son graphe est au-dessus de sa tangente : Pour tout
t ∈ R, il existe δ (on peut prendre pour δ gd0 (t) ou gg0 (t)), tel que :
g(x) ≥ g(t) + δ(x − t).
On prend : x = X(ω) et t = E(X) et on prend l’espérance, on obtient :
g(E(X)) ≤ E(g(X)).
4.6 L’espérance et la variance des lois classiques

Proposition 4.13. Soit X une v. a. de loi uniforme discrète sur {1, 2, ..., n}. Alors, on a :
n+1 n2 − 1
E(X) = et V ar(X) = .
2 12
Preuve.
• On commence par le calcul de l’espérance, par définition :
n
X n
1X 1 n(n + 1) n+1
E(X) = kP (X = k) = k= ( )= .
n n 2 2
k=1 k=1
• Pour déterminer V ar(X), on calcule E(X 2 ) :

n
X n
2 2 1 X 2 n(n + 1)(2n + 1)
E(X ) = k P (X = k) = k = .
n 6n
k=1 k=1
Pn
(car, on peut montrer par récurrence que : k=1 k 2 = n(n+1)(2n+1)
6 ).
Or,
n(n + 1)(2n + 1) (n + 1)2 n2 − 1
V ar(X) = E(X 2 ) − E(X)2 = − = .
6 4 12
Proposition 4.14. Soit X une v. a. de Bernoulli de paramètre p. Alors, on a :
E(X) = p et V ar(X) = p(1 − p).
Preuve.
• On a X = 1A où A = {ω/X(ω) = 1}.
Donc
E(X) = P (A) = p,
et
V ar(X) = E(X 2 ) − E(X)2 = p(1 − p).
55
Proposition 4.15. Soit X une v. a. binomiale B(n, p) de paramètres n et p. Alors, on a :
E(X) = np et V ar(X) = np(1 − p).
Preuve.
Soit X le nombre de succès obtenus au cours de la réalisation de n épreuves indépendantes
de Bernoulli de paramètre p.
Donc
X = X1 + X2 + ... + Xn avec Xi ∼ B(p).
En utilisant la linéarité de l’espérance :
E(X) = E(X1 ) + ...E(Xn ) = np.
Pour calculer la variance, on utilise la relation suivante
V ar(X1 +...+Xn ) = V ar(X1 )+...+V ar(Xn ) si les (Xi ) sont indépendantes ( voir chapitre 6).
D’où
V ar(X) = V ar(X1 ) + ... + V ar(Xn ) = np(1 − p).
Proposition 4.16. Soit X une v. a. géométrique X ∼ G(p). Alors, on a :

1 1−p
E(X) = et V ar(X) = .
p p2
Preuve. Laissée en exercice.
Proposition 4.17. Soit X une v. a. de Poisson de paramètre λ. Alors, on a :
E(X) = λ et V ar(X) = λ.
Preuve.
•
+∞
X +∞
X λn−1
E(X) = nP (X = n) = λe−λ = λ.
(n − 1)!
n=0 n=1
•
+∞
X +∞
X
E(X 2 ) = n2 P (X = n) = n2 P (X = n) + P (X = 1).
n=0 n=2
λ1 0 n−1
Or, n2 = n(n − 1) + n et P (X = 1) = e−λ 1! = e−λ λλ
0! = e
−λ λλ
(n−1)! pour n = 1,
et
+∞
X +∞
X +∞
λn−2 −λ X −λ λn−1
n2 P (X = n) = λ2 e + λe
(n − 2)! (n − 1)!
n=2 n=2 n=2
Donc,
+∞
X +∞
X
λn−2 −λ λn−1
E(X 2 ) = λ2 e−λ e + λe−λ = λ2 + λ.
(n − 2)! (n − 1)!
n=2 n=1
Donc,
V ar(X) = E(X 2 ) − E(X)2 = λ2 + λ − λ2 = λ
56
Proposition 4.18. Si X ∼ U[a,b] , a, b ∈ R, a < b. Alors, on a :
a+b (b − a)2
E(X) = et V ar(X) = .
2 12
Remarque : La définition est la même pour les intervalles ]a, b[, [a, b[, ..., (car U[ a, b] est
absolument continue).
Preuve.
• Z +∞ Z +∞
x 1 x2 b b+a
E(X) = xf (x)dx = dx = [ ]a = .
−∞ −∞ b − a b−a 2 2
• Z +∞
1 b3 − a3
E(X 2 ) = x2 f (x)dx =
−∞ 3 b−a
Donc,
1 b3 − a3 (a + b)2 (b − a)2
V ar(X) = − = .
3 b−a 4 12
Proposition 4.19. Si X ∼ N (m, σ 2 ). Alors, on a :

E(X) = m et V ar(X) = σ 2 .
Preuve. Il suffit de montrer que si X ∗ ∼ N (0, 1), alors E(X ∗ ) = 0 et V ar(X ∗ ) = 1.
Ensuite,
X −m
X∗ = ⇐⇒ X = σX ∗ + m.
σ
Et ona :
E(X) = E(X ∗ ) + m = m et V ar(X) = E(σ 2 (X ∗ )2 ) = σ 2 E(X ∗ )2 = σ 2 .
Soit maitenant X ∗ ∼ N (0, 1).On a :
• Pour l’espérance : Z +∞
1 x2
E(X ∗ ) = x √ e− 2 dx
−∞ 2π
Or, Z +∞ x2 −x2
xe− 2 dx = [−e 2 ]+∞
0 = 1,
0
2 R +∞ x2
comme la fonction x −→ xe− x2 est impaire, alors −∞ x √12π e− 2 dx = 0, donc E(X ∗ ) = 0.
• Pour la variance, Z +∞
∗ 2 1 x2
E(X ) = x2 √ e− 2 dx
−∞ 2π
2
Par une intégration par partie, on pose g(x) = x et f 0 (x) = xe− x2 , on obtient :
Z +∞ Z +∞ Z +∞ √
2 − x2
2 −x2
+∞ − x2
− x2 2π
x e dx = [−xe 2 ]0 + e 2 dx = e 2 dx = .
0 0 0 2
R +∞ x2 √ x2
(car −∞ e− 2 dx = 2π et x −→ e− 2 est paire.)
−x2
De plus x −→ x2 e 2 est paire, donc
Z +∞ √
−x2
x2 e 2 dx = 2π
−∞
En conclusion,
V ar(X ∗ ) = 1.
57
Proposition 4.20. Soit X ∼ E(θ), θ > 0. Alors, on a
1 1
E(X) = et V ar(X) = .
θ θ2
Preuve. Laissée en exercice.
4.7 Fonctions caractéristiques

4.7.1 Intégration d’une fonction complexe
Rappelons ici rapidement et sans démonstrations quelques propriétés de l’intégration des
fonctions complexes. Soit (Ω, F, P ) un espace de probabilité et f : Ω → C une fonction
complexe.
1. f est mesurable si et seulement ses parties réelle Ref et imaginaire Imf sont mesu-
rables de (Ω, F) dans (R, B(R)).
2. f est intégrable par rapport à P si et seulement si ses parties réelle Ref et imaginaire
Imf sont intégrables par rapport à P , et
Z Z Z
f dP = Ref dP + i Imf dP.
Ω Ω Ω
p
3. f est intégrable par rapport à P si et seulement si son module |f | = (Ref )2 + (Imf )2
est intégrable par rapport à P , et
¯Z ¯ Z
¯ ¯
¯ f dP ¯ ≤ |f |dP.
¯ ¯
Ω Ω
Preuve. Montrons le dernier point.RL’intégrale de f est un nombre complexe que l’on

peut écrire sous forme trigonométrique : Ω f dP = ρeiθ . Alors
¯R ¯ R R
¯ f dP ¯ = ρ = e−iθ f dP = −iθ dP (∈ R)
Ω Ω Ω fe
¡R −iθ dP
¢ R −iθ )dP
= Re Ω fe = Ω Re(f e (d’après 2)
R −iθ |dP
R
≤ Ω |f e = Ω |f |dP.
4.7.2 Fonction caractéristique d’une variable aléatoire réelle

Définition 4.21. Soit X une variable aléatoire réelle définie sur un espace de probabilité
(Ω, F, P ). Sa fonction caractéristique ϕX est définie par :
Z
itX
∀t ∈ R, ϕX (t) = E(e ) = eitx dPX (x) (∈ C).
Ω
Théorème 4.22. Soit X une variable aléatoire réelle définie sur un espace de probabi-
lité (Ω, F, P ). Sa fonction caractéristique ϕX est uniformément continue sur R, de module
inférieur ou égal à 1,et vérifie ϕX (0) = 1.
Preuve. R R R
1. |ϕX (t)| = | Ω eitx dPX (x)| ≤ Ω |eitx |dPX (x) = Ω 1dPX (x) = PX (Ω) = 1.
2. ϕX (0) = E(ei0X ) = E(1) = 1
58
3. Découle du théorème de la convergence dominée :
|ϕX (t + h) − ϕX (t)| ≤ |E(ei(t+h)X − eitX )|

≤ E| e|ihX{z− 1} ||eitX | −→ 0 quand h −→ 0.
≤2
Et on prend le supt .
Théorème 4.23. Soit X une variable aléatoire réelle telle que E(|X|m ) < +∞, avec m ≥ 1.
Alors ϕX est m-fois dérivable sur R et
dm ϕX
(t) = im E(X m eitX ).
dtm
et, en particulier
(k)
ϕX (0) = ik EX k .
Preuve. Découle du théorème de dérivation d’une intégrale dépendant d’un paramètre :
Puisque
dk itX
(e ) = (iX)k eitX ,
dtk
on a
dk itX
|(e )| ≤ |X|k ,
dtk
et on peut appliquer m fois le théorème de dérivation d’une intégrale dépendant d’un pa-
ramètre.
¦ En pratique : si E(|X|) < ∞ alors EX = iϕ0X (0),

si E(X 2 ) < ∞ alors E(X 2 ) = −ϕ00X (0).
Proposition 4.24. Si X et Y sont deux variables aléatoires indépendantes et si Z = X + Y ,

alors
∀t ∈ R, ϕZ (t) = ϕX (t)ϕY (t).
♣ Exercice : Faire la preuve.
4.7.3 Exemples de calcul

Par le théorème de transfert, la définition de la fonction caractéristique se décline de la
façon suivante :
1. Si X est discrète, X
ϕX (t) = eitx P (X = x).
x∈X(Ω)
2. Si X a pour densité f , Z
ϕX (t) = eitx f (x)dx.
R
59
♣ Exercice : Dans tous les exemples qui suivent, retrouver espérance et variance en dérivant
la fonction caractéristique.
• Loi de Bernoulli de paramètre p
X
ϕX (t) = eitx P (X = x) = eit P (X = 1) + ei0 P (X = 0) = peit + 1 − p.
x∈X(Ω)
• Loi binômiale de paramètre B(n, p)

µ ¶
P Pn Pn n
ϕX (t) = x∈X(Ω) eitx P (X = x) = k=0 eitk P (X = k) = k=0 eitk pk (1 − p)n−k
k
µ ¶
Pn n
= k=0 (peit )k (1 − p)n−k = (peit + 1 − p)n .
k
• Loi de Poisson de paramètre λ
P itx
P∞ itk P∞ itk −λ λk
ϕX (t) = x∈X(Ω) e P (X = x) = k=0 e P (X = k) = k=0 e e k!
.
P∞ (λeit )k
= e−λ k=0 k! = exp(λ(eit − 1))
♣ Exercice : Déterminer la fonction caractéristique de la loi géométrique de paramètre p.
• Loi uniforme sur [−a, a]
R R 1
ϕX (t) = R eitx fX (x)dx = R eitx 2a 1[−a,a] (x)dx
1
Ra itx dx 1
Ra Ra
= 2a −a e = 2a ( −a cos(tx)dx +i −a sin(tx)dx)
1
Ra 1 1 sin(at)
= 2a −a cos(tx)dx = 2a [ t sin(tx)]a−a = at .
• Loi normale centrée réduite :
Méthode par équation différentielle
R R
ϕX (t) = R eitx fX (x)dx = R eitx √12π exp(−x2 /2)dx
R 1 2 1 2
R 1 2
R
= R cos(tx) √2π exp(−x /2)dx + i R sin(tx) √2π exp(−x /2)dx = R cos(tx) √2π exp(−x /2)dx.
Comme la loi normale admet des moments de tout ordre, on peut dériver ϕX :
R d R
ϕ0X (t) = R dt (cos(tx)) √12π exp(−x2 /2)dx) = R (−x sin(tx)) √12π exp(−x2 /2)dx
R 1 2
= − R t cos(tx)) √2π exp(−x /2)dx) (par IPP)
= −tϕX (t).
On a donc établit une équation différentielle linéaire satisfaite par ϕX (t) : donc
∀t ∈ R, ϕX (t) = Cexp(−t2 /2), et ϕX (0) = 1 = C.
Donc ∀t ∈ R, ϕX (t) = exp(−t2 /2).
Méthode par prolongement analytique
Soit λ ∈ R : R
E(exp(λX)) = R exp(λx)fX (x)dx
R 1 2
= R exp(λx) √2π exp(−x /2)dx .
R 1 2
= R √2π exp(−(x − 2λx)/2)dx
60
Cette intégrale est convergente pour tout λ ∈ R.
De plus x2 − 2λx = (x − λ)2 − λ2 , d’où :
R
E(exp(λX)) = R √12π exp(λ2 /2) exp(−(x − λ)2 /2)dx
R 1
= exp(λ2 /2) 2 2
R √2π exp(−(x − λ) /2)dx = exp(λ /2)
Maintenant, par le théorème de dérivation sous le signe intégrale, h1 : z 7→ E(exp(zX)) est
holomorphe sur C et h2 : z 7→ E(exp(z 2 /2)) est holomorphe sur C. Or ses deux fonctions
coı̈ncident sur R. Par le théorème de prolongement analytique, h1 h2 coı̈ncident sur C.
En particulier,
h1 (it) = ϕX (t) = h2 (it) = exp((it)2 /2) = exp(−t2 /2).
¦En pratique : On essaie d’identifier le résultat (h2 ) sur une partie de C où on sait faire
calculer h1 explicitement (ici R), puis on prolonge ce résultat par prolongement analytique.
• Loi normale quelconque
Rappelons que si X ∼ N (0, 1) et si Y = σX + m, alors Y ∼ N (m, σ 2 ). On a alors
ϕY (t) = E(eitY ) = E(eit(σX+m) )
= E(eitm ei(tσX) ) = eitm E(ei(tσ)X ) = eitm ϕX (tσ) = eitm exp(−t2 σ 2 /2).
4.8 Théorème d’unicité

L’idée est la suivante : on a vu que l’intégration contre des fonctions-test continues bornées
caractérise la loi d’une variable aléatoire réelle. Ici, on diminue la classe des fonctions-test
pour limiter aux exponentielles complexes :
Théorème 4.25. Soit X et Y deux variables aléatoire réelles. Si ∀t ∈ R, ϕX (t) = ϕY (t),
alors X et Y ont la même loi.
Preuve. Admis.
Utilise des résultats de densité de type Stone-Weierstrass.
¦Exemple : Soit X ∼ P(µ) et Y ∼ P(µ) deux variables aléatoire indépendantes.
Déterminer la loi de Z = X + Y .
Par indépendance,
ϕZ (t) = ϕX (t)ϕY (t) = exp(λ(eit − 1)) exp(µ(eit − 1)) = exp((λ + µ)(eit − 1)).
On reconnaı̂t la fonction caractéristique d’une variable aléatoire de loi de Poisson de pa-
ramètre λ + µ.
Donc
Z ∼ P(λ + µ).
♣ Exercice : Soit (Xi )1≤i≤n des variables aléatoire indépendantes suivant toutes des lois
gaussiennes. Montrer que toute combinaison linéaire des (Xi )1≤i≤n suit encore une loi gaus-
sienne.
♣ Exercice : Soit (XP i )1≤i≤n des v.a.i.i.d. de loi Bernoulli de paramètre p.
Déterminer la loi de ni=1 Xi .
En déduire, sans calcul, espérances et variances des lois binomiales.
61
4.9 Annexe : Définition de l’espérance d’une variable aléatoire :
Cas général
Le cadre est le suivant : on a un espace de probabilité (Ω, F, P ), et X une variable aléatoire
définie sur Ω à valeur dans R. Comment définir sa valeur moyenne, ou espérance ? On sait
que pour une variable aléatoire discrète, on utilise une moyenne des valeurs prises par X,
pondérées chacune par la probabilité qu’a X de prendre cette valeur :
X
E(X) = xP (X = x).
x∈X(Ω)
On connait aussi la formule de la valeur moyenne pour une “bonne” fonction (continue par
exemple) sur un intervalle [a, b] :
Z b
1
m= f (x)dx.
b−a a
On voudrait construire une formule générale qui englobe les deux précédentes :
Z Z
EX = X(ω)dP (ω) = xdPX (x),
Ω R
c’est-à-dire être capable d’intégrer une fonction sur Ω par rapport à la probabilité P , ou une
fonction sur R par rapport à la loi image PX . Cette formule d’égalité entre deux intégrales
sur deux espaces différents sera fondamentale pour les calculs pratiques, on l’appelle théorème
de transfert.
Dans toute la suite, l’ensemble R est muni de la tribu boriélienne B(R), et on considérera
des variables aléatoires
X : (Ω, F) −→ (R, B(R)).
Pour les variables aléatoires simples

Définition 4.26. Soit A une partie de Ω. On appelle indicatrice de A l’application suivante :
1A : Ω −→ {0, 1} ½
1 si ω ∈ A,
ω 7−→ 1A (ω) =
0 sinon.
Définition 4.27. Une variable aléatoire X : Ω → R est dite simple si et seulement si il

existe un entier n > 0, une famille (Ai )1≤i≤n d’éléments de F et une famille (ai )1≤i≤n des
nombres réels distincts tels que :
Xn
X= ai 1Ai .
i=1
Les ai sont des nombres réels distincts, donc cette écriture est la représentation canonique
de X.
Une variable aléatoire simple ne prend qu’un nombre fini de valeurs. Si (Ω, F) = (R, B(R)),
une fonction simple est une fonction en escaliers avec un nombre fini de marches.
Pn
Définition 4.28. Si X = i=1 ai 1Ai est une variable aléatoire simple, on définit son
espérance de la façon suivante
X n
EX = ai P (Ai ).
i=1
62
Remarque :
Il fautPvérifier que cette définition ne dépend pas de l’écriture particulière choisie pour X. Si
X= m i=1 bi Bi représente une écriture non canonique de X ( i.e. les bi ne sont pas distincts),
on pose :
Ai = X −1 ({ai }), et Ai = ∪j∈Ji Bj , Ji = {j ∈ [1, m]/bj = ai }, ∪ni=1 Ji = [1, n].
P P P
E(X) = ni=1 ai P (∪j∈Ji Bj ) = ni=1 ai j∈Ji P (Bj )
Pn P Pm
= i=1 j∈Ji bj P (Bj ) = i=1 bj P (Bj ).
En conclusion la définition de l’espérance ne dépend pas de l’écriture de X.
Proposition 4.29. L’ensemble des fonctions simples est un R−espace vectoriel. Sur cet
ensemble, l’espérance est une application linéaire positive : si X et Y sont deux v. a. simples
et si a est un nombre réel, alors :
E(aX + Y ) = aE(X) + E(Y ), et si X ≥ 0, alors E(X) ≥ 0.
On rappelle que X ≥ 0 signifie que pour tout ω ∈ Ω, X(ω) ≥ 0.
Preuve. La positivité est claire, et la linéarité est laissée en exercice.
Pour les variables aléatoires positives

Définition 4.30. Si X est une variable aléatoire positive, on définit son espérance de la
façon suivante :
E(X) = sup{E(Y )/ Y fonction simple positive telle que Y ≤ X}.
Remarque : L’espérance d’une v. a. positive est positive, remarquons aussi que cette
1
espérance peut valoir +∞ (prenez la loi de Cauchey : f (x) = π(1+x 2 ) , pour tout réel x).
Pour les variables aléatoires quelconques

Définition 4.31. Soit X une v. a. réelle, on pose :
½ + ½
X = max(X, 0) X = X+ − X−
− et on a
X = max(−X, 0) |X| = X + + X − .
Définition 4.32. Une variable aléatoire réelle X est dite intégrable si et seulement si
E|X| < +∞, si et seulement si E(X + ) < +∞ et E(X + ) < +∞. On définit alors son
espérance de la façon suivante :
E(X) = E(X + ) − E(X − ).
Remarque : L’ensemble des variables aléatoires réelles intégrables sur l’espace de probabilité
(Ω, F, P ) est noté L1 (Ω, F, P ). C’est un R-espace vectoriel, et l’espérance est une application
linéaire positive sur cet espace. L’espérance de X est notée :
Z Z
E(X) = X(ω)dP (ω) = X.dP
Ω Ω
Cette espérance prolonge celle introduite les variables aléatoires
Pn discrètes.
−1
(Si X(Ω) = {x1 , ..., xn }, on posant Ai = X ({xi }) et X = i=1 xi 1Ai , d’où :
n
X n
X
E(X) = xi P (Ai ) = xi P (X = xi )).
i=1 i=1
63
Théorème d’approximation
Théorème 4.33. Soit X variable aléatoire positive. Il existe une suite (Xn )n∈N de variables
aléatoires simples croissante à valeurs positives qui converge simplement vers X.
Preuve. Il suffit de prendre
½
k2−n si k2−n ≤ X(ω) < (k + 1)2−n .
Xn (ω)
n si X(ω) ≥ n.
Vérifier la fin de la preuve.
Proposition 4.34. Soit (Xn )n∈N une suite de variables aléatoires simples croissante à va-
leurs positives qui converge simplement vers X. Alors X est une v. a. positive et
E(X) = limn−→∞ E(Xn ).

Preuve.
Admis
4.9.1 Théorème de transferet

Considérons (Ω, F, P ) un espace de probabilité. Rappelons que si X : Ω −→ (R, B(R)) est
une variable aléatoire, alors elle permet de définir, à partir de P sur (Ω, F), une probabilité
PX sur (R, B(R)) appelée loi de X de la façon suivante :
∀ B ∈ B(R) PX (B) = P ({ω ∈ Ω/X(ω) ∈ B}) = P (X −1 (B)) = P (X ∈ B).
On aimerait utiliser ce lien entre les probabilités P sur (Ω, F) et PX sur (R, B(R)) pour
calculer les espérances des variables aléatoires d’une autre manière :
Théorème 4.35. Soit X : (Ω, F) −→ (R, B(R)) une variable aléatoire, et
h : (R, B(R)) −→ (R, B(R))
une application mesurable. On pose Y = h(X), qui est encore une variable aléatoire réelle
définie sur Ω.
1. Y ∈ L1 (Ω, F, P ) ⇐⇒ h ∈ L1 (R, B(R), PX )
2. Dans ce cas, R R
E(Y ) = RΩ Y dP = Ω h(X)dPR
= RΩ Y (ω)dP (ω) = RΩ h(X(ω))dP (ω)
= R h(x)dPX (x) = R hdPX .
Preuve. On va utiliser la stratégie usuelle : d’abord on le montre pour des fonctions in-
dicatrices, puis pour des fonctions simples, puis pour des fonctions positives, puis pour des
fonctions quelconques.
1. Soit B ∈ B(R), posons h = 1B .
E(Y ) = E(h(X)) = E(1B (X)) = E(1X∈B )

= P (X ∈ B) par définition de l’espérance de l’indicatrice de {X ∈ B} ∈ F
=PR X (B) par déf. de la loi image
= RR 1B (x)dPX (x) par déf. de l’espérance de l’indicatrice de {B} ∈ B(R)
= R h(x)dPX (x).
64
2. Si h est une fonction simple, on utilise la linéarité de l’espérance
Pn sur chacun des deux
espaces de probabilités (Ω, F, P ) et (R, B(R), PX ) : soit h = i=1 ai 1Ai , on a :
P
E( ni=1 ai 1Ai (X))
E(Y ) = E(h(X)) = P
= Pni=1 ai E(1
R Ai (X))
n
= R i=1
P ai R 1Ai (x)dPX (x) d’après
R l’étape précédente
= R ( ni=1 ai 1Ai (x))dPX (x) = R h(x)dPX (x).
3. Si h est une fonction mesurable positive, on utilise le résultat d’approximation : soit

(hn )n∈N une suite de fonction simples positive qui converge en croissant vers h. On sait
par l’étape précédente que
Z Z
E(hn (X)) = hn (X(ω))dP (ω) = hn (x)dPX (x).
Ω R
puis on utilise le résultat de croissance monotone de chaque côté, en passant à la limite
quand n tend vers l’infini, on obtient :
Z
E(X) = h(x)dPX (x).
R
4. Finalement, pour h intégrable quelconque, on prend h = h+ − h− : la condition
nécessaire et suffisante d’intégrabilité est alors claire, et on utilise la linéarité sur cha-
cun des deux espaces de probabilités (Ω, F, P ) et (R, B(R), PX )
Nous allons maitenant décliner ce résultat dans les deux cas que nous avons vu précédemment :
v. a. discrètes et v. a. à densité.
Corollaire 4.36. 1. Soit X une v. a. réelle avec X(Ω) = {x1 , x2 , ..., xn , ...} fini ou
dénombrable.
La v. a. h(X) est intégrable si et seulement si
X
|h(xi )|PX (xi )
i≥1
est une série convergente et dans ce cas :

X
E(h(X)) = h(xi )PX (xi ).
i≥1
2. Soit X une v. a. réelle à densité f . La v. a. h(X) est intégrable si et seulement si

Z
|h(x)|f (x)dx < +∞
R
est une intégrale convergente, et dans ce cas
Z Z Z
E(h(X)) = h(X)dP = h(x)dPX (x) = h(x)f (x)dx.
Ω R R
65
4.10 Exercices
Exercice 1. Soit X une variable aléatoire représentant le nombre d’heures de vie d’une
ampoule éléctrique. Supposons que X soit distribué avec la densité de probabilité suivante :
1 −x
f (x) = e 1000 1[0,+∞[ (x).
1000
Trouver la durée de vie moyenne attendue d’une telle ampoule.
Exercice 2.
1. Soit X une variable aléatoire à valeurs dans N. Montrer que :
+∞
X
E(X) = P (X ≥ j).
j=1
2. Montrer que si X est une variable aléatoire discrète à valeurs entières (positives,
négatives ou nulles) dont l’espérance mathématique existe, on a :
+∞
X
E(X) = [P (X ≥ j) − P (X ≤ −j)].
j=1
Exercice 3. Soit X une variable aléatoire de loi de Poisson de paramètre λ > 0 (i. e.
k
P (X = k) = e−λ λk! , k ≥ 0).
1 1
1. Vérifier que 1+X est une variable aléatoire intégrable. Calculer E( 1+X ).
1 1
2. Calculer E( (1+X)(2+X) ) et en déduire E( 1+X ).
Exercice 4. Un joueur joue à pile ou face de la manière suivante : la première fois il parie
1 euro ; s’il gagne, il gagne 2 euros et il s’arrête ; sinon, la deuxième fois il parie 2 euros ; s’il
gagne, il gagne 4 euros et il s’arrête, etc... C’est-à-dire que tant qu’il perd il double sa mise
pour le coup suivant et il s’arrête dès le premier succès.
Quelle est l’espérance de gain du joueur ?
Exercice 5. Dans une classe de n élèves, la probabilité qu’un élève sache son cours pour
la colle est p; p ∈]0, 1[. La probabilité qu’un élève qui sait son cours sache faire l’exercice
en colle est α ; α ∈]0, 1[. Aura une bonne note un élève qui connaı̂t son cours et qui réussit
l’exercice. On note X la variable égale au nombre d’élèves sachant leur cours, et Y celle égale
au nombre d’élèves ayant une bonne note.
1. Quelle est la loi de X
2. Quelle est la loi de Y ; calculer l’espérance et la variance 2 de Y .
Exercice 6. X est une VARD qui suit la loi de Poisson de paramètre λ.
Montrer que :
P (X ≥ λ + 1) ≤ λ.
Exercice 7. Un satellite de télédétection effectue 6 passages par mois au-dessus d’une région
donnée. Les photos réalisées lors des différents passages peuvent être inutilisables, du fait
notamment de la présence d’une couverture nuageuse.
2
La variance d’une v.a. mesure la ”dispersion” de cette v.a. par rapport à son espérance. Si la variance
est petite, la v.a. est ”concentrée” autour de sa moyenne. La variance est tjrs positive et une variance faible
correspond à un niveau homogène, proche de la moyenne.
66
1. Soit X la v.a. qui désigne le nombre de photos valables pour les 6 passages. Trouver
la loi de X.
2. Quelle doit être la probabilité d’obtenir une photo valable lors d’un passage donné pour
que la probabilité d’avoir au moins une photo valable par mois soit de 0,9 ?
Exercice 8. Un appareil électronique utilise 20 transistors identiques dans sa fabrication. On

admet que ces transistors sont les seules sources de panne de l’appareil. La probabilité qu’un
transistor soit défectueux est de 0,1. Dès qu’un appareil contient au moins deux transistors
défectueux, il tombe en panne.
a. Quelle est la probabilité qu’un appariel tombe en panne ?
b. Jugeant l’appariel précédant peu rentable, on en construit un autre dont la probabilité
de tomber en panne est égale à 0,2.
Sur un lot de 2000 appariels, quel est le nombre (moyenne) d’appariels en panne auquel
doit-on s’attendre ? et avec quel écart type ?
Exercice 9. Une confiture peut être qualifiée de ”pur sucre” si elle contient entre 440 et 520
grammes de sucre par kilogramme de confiture. Un fabricant vérifie 200 pots de confiture de 1
kilogramme chacun. Il trouve que le poids moyen de sucre est de 480 grammes avec un écart
type de 20 grammes.
Sachant que le poids en sucre est distribué normalement, calculer le pourcentage de la produc-
tion du fabricant qui ne doit pas porter la mention ”pur sucre” en considérant que l’échantillon
des 200 pots est représentatif de la production globale.
Exercice 10. Soit X une v. a. ayant pour densité de probabilité la fonction f définie par :
f (x) = αe−αx pour x ≥ 0

f (x) = 0 pour x < 0
où α est un réel positif.
1. Vérifier que f est bien une densité de probabilité .
2. Déterminer la fonction de répartition de X.
3. Calculer E(X) et plus généralement E(X k ). En déduire la valeur de V (X).
4. Soit X0 la v.a. ayant pour densité de probabilité :
g(x) = k(x0 ).f (x) pour x ≥ x0

g(x) = 0 pour x < x0
où x0 est un réel positif donné.

a) Quelle est la valeur de k(x0 ) ?
b) Calculer E(X0 ) et V (X0 ).
Exercice 11. Soit X une variable aléatoire réelle admettant une variance. Montrer que la
fonction
x 7−→ E((X − x)2 )
admet un minimum global et le calculer.
67
Exercice 12. (Loi de Cauchy )
On considère la fonction f (x) définie par :
k
f (x) = , ∀x ∈ R.
1 + x2
1) Déterminer la constante k telle que f (x) puisse être considérée comme la densité de pro-
babilité d’une v.a. continue X.
2) Que peut-on dire des moments de cette v.a. ?
Exercice 13. Si U1 et U2 sont deux variables aléatoires normales centrées, réduites et

indépendantes, calculer :
a. P (U1 > U2 ).
b. P (U1 + 2U2 > 5)
c. calculer k tel que P (U1 + kU2 > 2) = 0.05.
Exercice 14 . Le lait produit par une usine a une teneur en matières grasses qui suit une
loi normale de moyenne 160 grammes par litre et d’écart type 3 10 grammes par litre les
consommateurs n’acceptent que le lait dont la teneur en matières grasses est comprise entre
135 grammes par litre et 185 grammes par litre.
Calculer la proportion de la production du lait inacceptable par les consommateurs.
Exercice1 15 . Soit un vendeur de lots de pièces mécaniques disposant, à une date t0 , d’un
stock s.
La demande X, pour un intervalle de temps [t0 , t1 ], est une v. a. entière ayant une loi de
probabilité définie par :
P (X = x) = k(x0 )p q x−1 pour x ≥ x0

=0 pour x < x0
où p et q sont deux réels positifs tels que p + q = 1 et x0 est un entier naturel inférieur à s.
1) Calculer k(x0 ) et E(X).
2) Si X est inférieure au stock s, les lots restants sont vendus à perte et le vendeur aura
à affronter une dépense moyenne de c1 DH. Si X est supérieure au stock s, il faut un ap-
provisionnement spécial de pièces manquantes et le supplément du coût représente une perte
moyenne de c2 DH.
Calculer l’éspérence mathématique des dépenses que va devoir affronter le vendeur pendant
la période [t0 , t1 ].
Exercice 16. Soit X une variable aléatoire réelle. On appelle fonction caractéristique de X
la fonction φX définie par
φX (t) = E(e itX

R itx )
=P R e fitk
(x)dx dans le cas des v.a continue : c’est la transformée de Fourier de la fonction f
= k∈N e pk dans le cas discret
1) Vérifier que φX (0) = 1 et que |φX (t)| ≤ 1 ∀t ∈ R.

2) Déterminer la f. c. φX de la v. a. X dans les cas suivants :
a. X = a, a ∈ R.
b. X est une v. a. de Bernoulli de paramètre p.
3
p
L’écart type est par définition σ = V (X). Une v.a. X est dite centrée réduite si E(X) = m = 0 et σ = 1.
68
c. X est une v. a. de binomiale de paramètres n et p, i.e. X ∼ B(n, p).
e. X est une v. a. de binomiale de paramètre λ, i.e. X ∼ P (λ).
f. X est une variable aléatoire de loi uniforme sur [−a, a]

2) Déduire que X ∼ N (m1 , σ12 ) et Y ∼ N (m2 , σ22 ) , alors X + Y ∼ N (m1 + m2 , σ12 + σ22 ).
Exercice 17. Soit X v. a. r. de densité p(x) = xe−x 1x≥0 .
1. Déterminer la loi de la v. a. Y = eX − 1.
2. Déterminer la fonction caractéristique de X.
3. En déduire la moyenne et la variance de X.
4. Soit Z une v. a. indépendante de X et de même loi. Calculer l’espérance et la variance

de 3X − 4Z.
1
Cet exercice constitue le sujet d’un devoir libre.
69
Chapitre 5
Variables aléatoires vectorielles
5.1 Introduction
De nombreux problèmes concrets fond intervenir plusieurs variables aléatoires, regroupées
dans un vecteur aléatoire. Il est important de caractériser la loi d’un tel vecteur et les relations
liant ses composantes.
Nous allons voir dans ce chapitre que tout ce que l’on a construit pour une variabble
aléatoire réelle se transpose quasiment mot par mot au cas d’un vecteur aléatoire. Les prin-
cipales différences sont :
- la notion de loi marginale

- la notion de covariance, qui essaie de traduire un certainlien entre les coordonnées du
vecteur aléatoire.
Dans la suite, nous n’allons définir les notions que pour les couples de variables aléatoires.
Mais la plupart des résultats énoncés se généralisent facilement à un nombre quelconque de
variables.
Notation : Un couple de v. a. est une application mesurable donnée par :
(X, Y ) : (Ω, F) −→ (R2 , B(R2 )).
5.2 Couples aléatoires discrets

Définition 5.1. 1. On dit qu’un couple aléatoire est discret s’il prend ses valeurs dans
un ensemble {(xi , yj )(i,j)∈I×J } avec I × J ⊂ N2 ou dans Z2 .
2. La loi conjointe de X et Y (i.e. la loi du couple (X, Y ))) est la donnée des nombres
positifs :
pij = P ({X = xi } ∩ {Y = yj }), (i, j) ∈ I × J
avec X
pij = 1.
(i,j)∈I×J
3. Si l’on s’intéresse uniquement au comportement de l’une des deux variables, on intro-

duit les lois marginales de X et Y définies par
X X
pi. = P (X = xi ) = pij et p.j = P (Y = yj ) = pij .
j∈J i∈I
70
Remarque : Les deux événements (X = xi ) et (∪j∈J Y = yj , X = xi ) sont identiques.
Donc X
pi. = pij .
j∈J
De plus, X XX X
pi. = pij = pij = 1.
i∈I i∈I j∈J (i,j)∈I×J
Exemple :
On tire, avec remise, deux boules d’un sac contenant 3 boules numérotées 1, 2, et 3.
On considère la v. a. X qui est la somme des points obtenus et soit Y le maximum des points
obtenus. Calculer la loi conjointe de X et Y .
Déduire les lois marginales de X et Y .
On a
X(Ω) = {2, 3, 4, 5, 6} et Y (Ω) = {1, 2, 3}.
Il s’agit d’évaluer P (X = i, Y = j) lorsque 2 ≤ i ≤ 6 et 1 ≤ j ≤ 3.
Les résultats sont donnés dans le tableau suivant :
yj /xi 2 3 4 5 6 Loi de Y
1 1
1 9 0 0 0 0 9
2 1 3
2 0 9 9 0 0 9
2 2 1 5
3 0 0 9 9 9 9
1 2 3 2 1
Loi de X 9 9 9 9 9 1
Les cas possibles sont :
(1, 1) −→ X = 2
(1, 2), (2, 1) −→ X = 3
(1, 3)(3, 1)(2, 2) −→ X = 4
(3, 2)(2, 3) −→ X = 5
(3, 3) −→ X = 6.
Explicitons le calcul de la première ligne :
1
P (X = 2, Y = 1) = P ({(1, 1)} = , P (X = a, Y = 1) = 0 si a ≥ 3.
9
La formule donnant l’espérance de h(X) se généralise au contexte d’un couple de v. a. de X
et Y . XX
E(h(X, Y )) = h(xi , yj )pi,j
i∈I j∈J
où h est une fonction de deux variables.

En particulier : XX
E(XY ) = xi yj pi,j
i∈I j∈J
♣ Exercice : Calculer E(XY ) pour X et Y de l’exemple précédent.
71
5.3 Couples aléatoires à densité
Définition 5.2. • On dit qu’un couple aléatoire (X, Y ) est à densité s’il existe une fonction
f(X,Y ) : R2 −→ R positive telle que pour tout domaine D de R2 , on a
Z Z
P(X,Y ) (D) = P ((X, Y ) ∈ D) = f(X,Y ) (x, y)dxdy.
D
R
avec R2 f(X,Y ) (x, y)dxdy = 1.
• Les densités marginales de X et Y sont données par :
Z Z
fX (x) = f(X,Y ) (x, y)dy et fY (y) = f(X,Y ) (x, y)dx.
R R
♣ Exercice :
On pose
x2 + y 2
f (x, y) = cexp(− ).
2
1. Déterminer c pour que f soit une densité de probabilitéd’un vecteur aléatoire Z =
(X, Y ) de R2 .
2. Calculer les densités des lois marginales de Z.

Solution :
1. • f est continue de R2 dans R, donc mesurable.
• f ≥ 0 si c ≥ 0.
• pour l’intégrale :
RR RR 2
− x +y
2
1 = R f
2 (x, y)dxdy = c R 2 e 2 dxdy
R − x2 R − y2
= c(√R e√ 2 dx)( R e 2 dy)
= c 2π 2π.
Donc
1
c= .
2π
2. Z Z
1 − x2 +y2 1 − x2 1 y2 1 x2
fX (x) = e 2 dy = √ e 2 ( √ e− 2 dy) = √ e− 2 .
R 2π 2π R 2π 2π
Donc
X ∼ N (0, 1).
De même :
1 y2
fY (y) = √ e− 2 .
2π
Donc
Y ∼ N (0, 1).
Enfin, on a aussi l’analogue du théorème de transfert :
Proposition 5.3. Soit h : R2 −→ R une fonction et (X, Y ) un couple aléatoire admettant
pour
R R densité f(X,Y ) . Alors, la v. a. h(X, Y ) est integrable si et seulement si l’intégrale double
R2 |h(x, y)|f(X,Y ) (x, y)dxdy est convergente.
Dans ce cas, on a :
Z Z
E(h(X, Y )) = h(x, y)f(X,Y ) (x, y)dxdy.
R2
72
5.4 Indépendance et espérance de produits
En général, la donnée des lois de probabilités de deux variables aléatoires X et Y ne
permet pas de calculer la loi du couple aléatoire (X, Y ) (alors que la réciproque est vraie).
C’est toutefois possible dans un cas particulier très important, celui des variables alétoires
indépendantes.
Définition 5.4. 1. Soit X et Y deux v. a. discrètes à valeurs respectivement dans {ai }
et {bj }. Les v. a. X et Y sont indépendantes si et seulement si :
Pij = P ({X = ai } ∩ {Y = bj }) = P (X = ai )P (Y = bj ).
2. Soit X et Y deux v. a. à densité. Les v. a. X et Y sont indépendantes si et seulement
si :
f(X,Y ) = fX (x).fy (y).
Conséquence :
X q Y =⇒ E(XY ) = E(X)E(Y ).
En effet, RR
E(XY ) = R R2 xyf(X,YR) (x, y)dxdy
= R xfX (x)dx R yfY (y)dy.
= E(X)E(Y ).
5.5 Covariance et coefficient de corrélation linéaire

5.5.1 Covariance
Pour mesurer le lien entre deux grandeurs aléatoires, on fait appel à la notion de cova-
riance :
Définition 5.5. Soit (X, Y ) un couple aléatoire tel que X et Y admettent toutes les deux un
moment d’ordre 2.
On appelle covariance de X et Y et on note cov(X, Y ) la quantité :
cov(X, Y ) = E([X − E(X)][Y − E(Y )]).
Remarque :
1. On peut montrer qu’il existe une autre formule pour calculer la covariance :
cov(X, Y ) = E(XY ) − E(X)E(Y ).
2. Si X q Y , alors cov(X, Y ) = 0.
La proposition suivante donne quelques propriétés de la covariance.
Proposition 5.6. Soit X, Y et Z trois v. a. r. admettant un moment d’ordre 2. on a :

1. cov(X, X) = V ar(X),
2. cov(aX + bY, Z) = acov(X, Z) + bcov(Y, Z), ∀a, b ∈ R.
3. V ar(X + Y ) = V ar(X) + 2cov(X, Y ) + V ar(Y ).
4. cov(X, Y )2 ≤ V ar(X)V ar(Y ) (Inégalité de Cauchy-Schwartz.)
Preuve.
1. Il suffit d’appliquer la définition de la variance.

2 et 3. C’est immédiat en utilisant la linéarité de l’espérance.
4. Il suffit de remarquer que (X, Y ) −→ cov(X, Y ) est une forme bilinéaire symétrique
sur l’ensemble des v. a. r. de carrée intégrable.
73
5.5.2 coefficient de corrélation
L’importance de la notion de covariance réside dans le fait qu’elle permet, dans certaine
mesure, de caractériser numériquement la dépendance stochastique entre deux v. a. On peut
en particulier affirmer que : cov(X, Y ) = 0 si X et Y sont indépendantes. Mais la réciproque
est fausse comme le montre l’exemple suivant :
Exemple :
Soit X une v. a. de Bernoulli de paramètre 0 < p < 1.
Alors E(X(1 − X)) = 0 et bien entendu X et 1 − X ne sont pas indépendantes : par exemple :
P (X = 0, 1 − X = 0) = 0 6= P (X = 0)P (X = 1) = p(1 − p).
L’inconvinient de la covariance tient au fait qu’elle peut être très grande en valeur absolue, ce
qui la rend inutilisable pour mesurer le degré de dépendance entre X et Y . Pour des besoins
pratiques, la covariance est donc remplacée par une mesure standarisée : le coefficient de
corrélation linéaire.
Définition 5.7. Soit (X, Y ) un couple aléatoire tel que X et Y soient non constantes et
admettent toutes les deux un moment d’ordre 2. On appelle coefficient de corrélation linéaire
de X et Y , et on note ρ(X, Y ), la quantité :
cov(X, Y )
ρ(X, Y ) = ,
σ(X)σ(Y )
où σ(X) et σ(Y ) sont les écarts-types de X et Y .
Remarque :
1. −1 ≤ ρ(X, Y ) ≤ +1, (d’après l’inégalité de Cauchy-Schwartz).
2. ρ(X, Y ) = 0 si X et Y sont indépendantes.
X Y
3. On peut écrire ρ(X, Y ) sous la forme Cov( σ(X) , σ(Y ) ), c’est à dire comme la cova-
riance de deux v. a. dont la variance est égale à 1.
4. Si X et Y sont centrées, on a :
< X, Y >
ρ(X, Y ) =
kXk2 kY k2
1
où kXk2 = (E(X 2 )) 2 .
ρ(X, Y ) s’interprète alors comme le cosinus de l’angle que forment les deux vecteurs X
et Y , égale au rapport du produit scalaire sur le produit des normes.
Une corrélation élevée indique une relation linéaire forte alors qu’une corrélation faible
n’indique pas l’absence de relation, mais simplement l’absence de relation linéaire.
74
5.6 Exercices
Exercice 1. Deux variables aléatoires X1 et X2 prennent les valeurs 0,1,2.
1. Comment doit-on choisir p pour que le tableau ci-dessus donne une loi conjointe de
(X1 , X2 ) ?
X1 \X2 0 1 2
p p
0 p 2 4
p
1 2p p 2
2 4p 2p p
2. Quelles sont les lois marginales de X1 et de X2 .
Ces deux variables sont-elles indépendantes ?
3. Soit Y = X1 + X2 . Calculer l’espérance de Y .
Exercice 2. Soit (X, Y ) un couple aléatoire à valeurs dans N∗ × N∗ tel que :
λn−1
∀(n, k) ∈ N∗ × N∗ , P (X = k, Y = n) = (1 − q n )q n(k−1) e−λ ,
(n − 1)!
avec q ∈]0, 1[ et λ > 0.
Déterminer les lois marginales de X et de Y . Ces deux variables sont-elles indépendantes ?
Exercice 3. Soit X1 et X2 deux variables aléatoires indépendantes et soient F1 (x) et F2 (x)

leurs fonctions de répartition.
Déterminer les fonctions de répartition des v. a .
Y = M ax(X1 , X2 )
et
Z = M in(X1 , X2 ).
Exercice 4. Soient X et Y deux variables aléatoires et soit r leur coefficient de corrélation.
1) Montrer que le coefficient de corrélation r est compris entre −1 et 1.
2) Soient 4 réels non nuls : a, b, c et d.
Calculer le coefficient de corrélation des v. a.
U = aX + b
et
V = cY + d.
1
L’espérance mathématique du couple (X, Y ) est par définition E(X, Y ) = (EX, EY )
2
L’espérance mathématique du produit X.Y est donnée par :
XX
E(XY ) = xi yj pij , ( cas discret )
i∈I j∈J
et
Z Z
E(XY ) = xyf (x, y)dxdy, ( cas continu )
R2
75
Quelles conclusions peut-on tirer des résultats de ce calcul ?
Exercice 5. Soient X et Y deux variables aléatoires indépendantes et de même densité

1
f (x) = 1 (x).
x2 [1,+∞[
X
On pose U = XY et V = Y .
1. Calculer la loi du couple (U, V ). Les v.a.r. U et V sont-elles indépendantes ?

2. Calculer les lois marginales de U et de V .
3. Calculer
1
E( √ ).
UV
3
La fonction de répartition du couple (X, Y ) est définie par :
F(X,Y ) (x, y) = P (X ≤ x et Y ≤ y).
4
X et Y sont indépendantes si :
P (X = xi et Y = yj ) = PX (xi )PY (yj ) (v. a. discrètes )
f(X,Y ) (x, y) = fX (x)fY (y) (v. a. continues)
76
Chapitre 6
Théorèmes limites
6.1 Introduction
Soit (Xn ) une suite de v. a. r. définies sur un espace de probabilité (Ω, F, P ).
Une suite de v. a. réelles étant une suite de fonctions Ω dans R. Il existe divers façons de
définir la convergence de (Xn ) dont certaines jouent un grand rôle en calcul des probabilités
et en statistique.
6.2 Les différents types de convergence

6.2.1 La convergence en probabilité
Définition 6.1. La suite (Xn ) de v. a. converge en probabilité vers la constante a, si :
∀ε > 0, lim P (|Xn − a| > ε) = 0.

n−→∞
On note
P
Xn a.
−→
Remarque :
1. On définit la convergence en probabilité de (Xn ) vers X comme la convergence de
(Xn − X) vers 0.
2. La convergence en probabilité signifie que l’écart entre la valeur de Xn et la constante
a est très faible quand la taille de l’échantillon est grande.
6.2.2 La convergence presque sûre

Définissons d’abord l’égalité presque sûre de deux v. a.
Définition 6.2. Soit X et Y deux v. a. r., X et Y sont égaux presque sûrement si :
P ({ω/X(ω) 6= Y (ω)}) = 0.
Définition 6.3. La suite (Xn ) converge p. s. vers X si :
P ({ω/ lim Xn (ω) 6= X(ω)}) = 0.

n−→∞
Autrement dit, ∃Ω0 ⊂ Ω tel que P (Ω0 ) = 1 et ∀ω ∈ Ω0 , limn−→∞ Xn (ω) = X(ω).
77
On note
p.s.
Xn X.
−→
Remarque : La convergence presque sûre implique la convergence en probabilité.
En effet, ∀ε > 0, ∃n0 ∀n ≥ n0 , |Xn (ω) − X(ω)| < ε ∀ω ∈ Ω0 .
Donc :
∀ε > 0, ∃n0 , ∀n ≥ n0 , {|Xn − X| > ε} ⊂ Ωc0 .
Par suite,
lim P (|Xn − X| > ε) = 0.
n−→∞
6.2.3 La loi faible des grands nombres

Théorème 6.4. Soit (Xn ) une suite de v. a. r. indépendantes, de même loi et de carré
intégrable (EX12 < +∞). On a alors,
P
X1 + X2 + ... + Xn
−→ E(X1 ).
n
n −→ ∞
Preuve. D’après l’inégalité de B. T. , on a :
P (| X1 +...+X
n
n
− E(X1 )| > ε) = P (|(X1 + ... + Xn ) − E(X1 + ... + Xn )| > nε)
V ar(X1 +...+Xn ) V ar(X1 )

≤ ε2 n2
= nε2
(car V ar(X1 + X2 + ... + Xn = nV ar(X1 ), par indépendance).

Remarque :
1. La condition EX12 < +∞ assure que la grandeur EX1 est bien définie.
2. Intuitivement le résultat pécédent signifie que le facteur n, qui figure au dénominateur,
est trop grand.
√
Le théorème central limite affirme qu’il faut remplacer n par n mais aussi le mode de
convergence.
3. Si (An ) est une suite d’événements indépendantes et de même probabilité p. La suite
1 Pn
des v. a. n i=1 1Ai converge en probabilité vers p.
6.2.4 La convergence en loi

Définition 6.5. Soit (Xn ) une suite de v. a. définies sur le même espace probabilisé, de
fonction de répartition Fn . Soit X une v. a. définie sur le même espace probabilisé, de fonction
de répartition F .
On dit que (Xn ) converge en loi vers X si en tout point x où F est continue, on a :
lim Fn (x) = F (x).

n−→∞
Remarque :
1. Pour les v. a. discrètes la convergence en loi vers une v. a. discrète s’exprime par :
limn−→+∞ P (Xn = x) = P (X = x)
C’est ainsi qu’on a établi la convergence de la loi binomiale vers la loi de Poisson. (Voir
Chapitre 3).
78
2. Une suite de v. a. discrètes peut cependant converger en loi vers une v. a. continue.
Par exemple :
♣ Exercice : Soit (Xn ) une suite de v. a. r. de loi uniforme sur {0, n1 , n2 , ..., 1}.
Montrer que :
Loi
Xn X,
−→
avec X ∼ U[0,1] .
Remarque : La convergence en loi peut s’exprimer par : pour toute fonction de C 0 = {f ∈
C(R, R)/ lim|x|−→∞ f (x) = 0}, on a
Z Z
f dPXn −→ f dPX .
R R
Proposition 6.6. La convergence en probabilité entraı̂ne la convergence en loi.
Preuve. Supposons que (Xn ) converge en probabilité vers X.
Soit ϕ ∈ C 0 , et soit ε > 0, la continuité uniforme de ϕ sur R entraı̂ne l’existence de α > 0,
tel que pour tout u et v vérifiant |u − v| ≤ α, on ait |ϕoXn − ϕoX| ≤ ε.
Il suit, en notant M = kϕk∞ :
R R
|E(ϕoXn ) − E(ϕoX)| ≤ |Xn −X|≤α |ϕoXn − ϕoX|dP + |Xn −X|>α |ϕoXn − ϕoX|dP
≤ ε + 2M P (|Xn − X| > α).
On conclut.
Récapitulons :
Convergence p.s =⇒ Convergence en probabilité =⇒Convergence en loi.
6.3 Le théorème central limite

Théorème 6.7. (Le théorème central limite)
Soit (Xn ) une suite de v. a. r. indépendantes de même loi et admettant un moment d’odre 2.
On pose :
Sn = X1 + X2 + ... + Xn ,
alors, on a : √
n Sn loi
( − m) N (0, 1),
σ n −→
avec m = E(X1 ) et σ 2 = V ar(X1 ).
Remarque :
1. Ce théorème permet de comprendre l’importance de la loi normale puisqu’il signifie
que la somme des v. a. i.i.d. tend à suivre une loi normale quelles que soient les lois
suivies par ces variables.
2. Le théorème central limite implique, si n est grand, que la loi de Sn∗ = Sn −E(S )
√ n est voi-
σ n
sine de N (0, 1), ce qui est équivalent à dire que la loi de Sn est voisine de N (nm, nσ 2 ).
79
Application : On se sert souvent du théorème central limite pour calculer rapidement des
probabilités en avoir une première estimation.
Exemple (1) : Dans une file d’attente, dix personnes attendent avant d’être servies. Si le
temps de service d’une personne est une v. a. de loi exponentielle de paramètre θ = 1 minute,
quelle est la probabilité que la durée d’attente totale dépasse 15 minutes ?
On pose :
T = T1 + T2 + ... + T10 .
où Ti (i=1,...,10) sont des v. a. indépendantes de loi E(1).
On utilise le théorème central limite pour la v. a. T .
T peut être approchée par une v. a. normale de moyenne
E(T ) = 10E(T1 ) = 10
et de variance :
V ar(T ) = 10V ar(T1 ) = 10.
On trouve alors rapidement :
P (T > 15) ' P (N (0, 1) > 15−10

√
10
)
= P (N (0, 1) > 1, 511) = 0, 057.
On peut donc attendre dans la file sans crainte d’y rester plus de 15 minutes.
Exemple (2) : Donnons un autre exemple, issu du contrôle de la qualité. Si on sait qu’en
moyenne 5% des articles produits par un certain procédé de fabrication sont défectueuses.
Quelle est la probabilié qu’il y ait au plus 60 pièces défectueuses dans un lot de 1000 pièces
choisies au hasard ?
Notons X le nombre de pièces défectueuses dans le lot.

De manière exacte, X ∼ B(1000, 0, 05).
Si on voulait faire le calcul exact, ce serait très compliqué.
On utilise le T.C.L. et faire comme si le nbr X de pièces défectueuses suit une loi normale
de paramètre m = 1000 × 0, 05 = 50 et σ = 1000var(Xi ) = 1000 × 0, 05 × 0, 95 = 47, 5.
On trouve :
60 − 50
P (X ≤ 60) ' P (N (0, 1) ≤ ) = 0, 9265.
6, 9
Remarque : En pratique, l’approximation de la loi binomiale par la loi normale donne des
résultats convenables si np ≥ 5 et n(1 − p) ≥ 5.
Dans ces conditions, on peut retenir l’approximation :
B(n, p) ' N (np, np(1 − p)).
Remarque : Vitesse de convergence dans la loi des grands nombres

Le théorème central limite précise la convergence donnée par la loi des grands nombres.
Plaçons-nous dans le cas d’une suite réelle (un )n∈N qui converge vers une limite l. On sup-
pose qu’on ne connaı̂t pas exactement la valeur de l, et qu’on sait facilement calculer les
termes successifs de la suite (un )n∈N . On aimerait donc donner une valeur approchée de l en
disant pour n suffisament grand, un n’est pas loin de l. Toute la question est de savoir dire
rigoureusement ce que veut dire ”un n’est pas loin de l”, autrement dit d’être capapled’estimer
l’erreur commise entre un et l. Ceci revient à étudier la vitesse de convergence de la suite
80
(un )n∈N vers l c’est -à-dire de trouver le terme suivant dans le développement asymptotique
de un quand n tend vers l’infini : par exemple,
3 1
un = l − 2
+ o( 2 ) ⇐⇒ limn−→∞ n2 (un − l) = 3.
n n
1
Dans ce cas, la vitesse est en n2
. Remarquons que
si α<2 , alors limn−→∞ nα (un − l) = 0

si α>2 , alors limn−→∞ nα (un − l) = +∞.
Le cas α = 2celui qui donne une limite finie, est donc celui qui donne la bonne vitesse de
convergence.
Revenons maintenant au cas des v. a. i.i.d. La loi faible des grands nombres dit que
X1 + ... + Xn
−→P EX1 .
n
Pour étudier la vitesse de convergence de cette suite, on cherche α tel que
X1 + ... + Xn
nα ( − EX1 ) converge en un certain sens.
n
Ici, on n’obtient pas de limite détrministe, ce qui n’est pas surprenant vu qu’on est en train
de regarder des limites de variables aléatroires, mais le TCL nous dit que la limite est une loi
gaussienne, que la vitesse de convergence est en √1n et que la notion de convergence considérée
ici est la convergence en loi.
81
6.4 Exercices
Exercice 1. (Méthode de monte-Carlo)
Soit h : [0, 1] −→ R une fonction continue et soit (Xn ) une suite de v.a.r. indépendantes et
même loi uniforme sur [0, 1].
Montrer que
Z 1
h(X1 ) + ... + h(Xn )
−→P h(x)dx quand n −→ +∞.
n 0
Comment se servir de ce résultat pour approximer une intégrale ?

Exercice 2.
1. Démontrer que si np −→ λ quand n −→ ∞ et p −→ 0, et si X ∼ B(n, p).
Alors X converge en loi vers une v. a. Y ∼ P (λ).
2. Application : Un contrôle rigoureux des ampoules électriques fournies par un atelier
a permis de constater que sur 14760 ampoules, il y avait 738 ampoules défectueuses.
Soit X le nombre des ampoules défectueuses figurant dans un lot de 60 ampoules.
a) Indiquer la loi de probabilité de X.
b) Quelle est la probabilité d’avoir plus de 3 ampoules défectueuses dans un lot de 60
ampoules ?
c) Quelle est la probabilité d’avoir 78 ampoules bonnes dans un lot de 80 ampoules ?
Exercice 3.
Une caisse d’assurance maladie reçoit 120 personnes pour l’obtention de remboursements.
On admet que la caisse doit payer, en moyenne, à chaque personne 1000 dh avec un écart
type de 600 dh.
La caisse dispose de 130000 dh. Calculer la probabilité que cette somme soit suffisante.
Exercice 4.
Une usine possède un restaurant d’entreprise qui assure chaque jour 2 services. Chacun des
900 employés de l’usine se présente indifféremment à l’un ou à l’autre des services avec une
probabilité de 0,5. Par ailleurs les choix des employés sont indépendants.
a) Quelle est la probabilité pour que le nombre de personnes se présentant au premier
service soit supérieur à 500 ?
b) De quel nombre de places faut-il diposer dans le restaurant pour que la probabilité de
pouvoir répondre à la demande aux deux services sont supérieure à 95%.
c) Le nombre total des repas à servir chaque jour est une variable aléatoire ; chaque
employé a chaque jour une probabilité de 0,75 de prendre son repas à l’usine.
- Quelle est l’espérance mathématique de cette variable ?
- Combien de repas convient-il de préparer pour que la probabilité de satisfaire la de-
mande soit supérieure à 99% ?
Exercice 5
2% des individus d’une population présentent une certaine mutation.
- Calculer le nombre moyen de mutants dans un échantillon de 100 individus.
- Quelle est la probabilité qu’il n’y ait aucun mutant ?
82
- Quelle est la probabilit qu’il y en ait au moins 5 ? Faire le calcul exact (avec une loi
binomiale), et le calcul approché (avec une loi de Poisson).
Exercice 6
On lance une pièce équilibrée 1000 fois. On veut calculer la probabilité pour que le nombre
de pile soit compris entre 450 et 550.
- Soit X le nombre de pile . Quelle est la loi de X ?
- Écrire la probabilité cherchée. Cette expression est trop longue à calculer !
- Quelle est l’espérance m et l’écart-type σ de X ?
- Montrer que l’on peut approximer X par une loi normale N (m, σ).
- Il ne reste plus qu’à répondre à la question initiale.
83
Deuxième partie
Statistiques
84
Chapitre 7
Introduction aux statistiques
7.1 Introduction :
7.1.1 Les statistiques, les probabilités, la statistique
1. Les statistiques sont des ensembles de données, d’observations : recensement...ce sont
donc des chiffres.
2. Les probabilités forment une branche des mathématiques et sont donc rigoureuses et
exactes ; pour cela il travaillent sur des objets mathématiques parfaitement définis et
abstraits (bien que toujours d’origine concrète).
3. La statistique est la science qui utilise les méthodes mathématiques (venant généralement
des probabilités) pour étudier et analyser des statistiques eu vue :
- d’en accoı̂tre les connaissances scientifiques ;
- de planifier des stratégies ;
- d’aider à la prise de décision.
Dans la théorie des probabilités que nous avons développé jusqu’à présent, nous avons
réaliser des calculs de nature probabiliste : par exemple, en évaluant la probabilité d’événements
ou en déterminant l’espérance d’une variable aléatoire. On a toujours supposé que les différents
paramètres qui interviennent dans le modèle sont connus. Ce qui est rarement le cas en pra-
tique.
Nous nous intéressons à la modélisation d’une grandeur aléatoire à valeurs réelles. Dans
le cadre probabiliste, cette notion correspond au concept de variable aléatoire ; soit X cette
variable aléatoire. Donnons un exemple : si l’on s’intéresse à compter le nombre de fois ou
apparait le résultat S, au cours de k expériences indépendantes, à deux issus possibles S et
E, on choisira pour X une v. a. de loi B(k, p). En général le paramètre p n’est pas connu.
Dans d’autres situations, on peut choisir pour X une v. a. de loi de Poisson P(λ), ou une
loi de Gauss N (m, σ 2 ). Les valeurs de λ, m et σ étant inconnues. Le but de la statistique
est de pouvoir évaluer ces paramètres inconnus à l’aide des valeurs X1 , X2 , ..., Xn que l’on a
observées en réalisant une série de n expériences indépendantes.
7.1.2 La démarche statistique

Après le recueil des données que nous n’aborderons pas ici, la démarche statistique consiste
à traiter et interpréter les informations recueillies.
Elle comporte deux grand aspects : l’aspect descriptif ou exploratoitre et l’aspect inférentiel
ou décisionnel.
85
A- La statistique exploratoire :
Son but est de synthétiser , résumer, structurer l’information contenue dans les données.
Elle utilise pour cela des représentations des données sous forme de tableaux, de gra-
phiques, etc.
L’étude statistique porte sur un caractère. Si le caractère est quantitatif, les mesures
sont alors les valeurs d’une variable statistique (ex. un âge , une taille,...). Si le ca-
ractère est qualitatif, on est obligé de quantifier (ex. sexe, mensonge,...).
B- La statistique inférentielle :
Son but est d’étendre les propriétés constatées sur l’échantillon à la population toute
entière. Le calcul des probabilités joue un rôle fondamental. Donnons quelques exemples :
B.1. Estimation d’une moyenne : Une même grandeur est mesurée n fois de suite
par un même observateur, l’imprécision de l’instrument de mesure et d’autres fac-
teurs rendent fluctuantes ces mesures et on obtient n valeurs différentes x1 , x2 , ..., xn .
Comment déterminer la vraie valeur m ? La loi des grands nombres montre que la
moyenne
x1 + x2 + ... + xn
x=
n
constitue une bonne approximation de m. x est une estimation de m. L’estimation
consiste à donner des valeurs approchées aux paramètres d’une population (m, σ, etc)
à l’aide d’un échantillon de n observations issues de cette population.
B.2. Vérification d’une hypothèse ou test : Le cas suivant est classique en contrôle
de qualité. Un client commande à son fournisseur des lots de pièces dont la qua-
lité est spécifiée par contrat : le fournisseur s’engage à respecter un taux de pièces
défectueuses inférieur à 4%. Avant de livrer, le fournisseur effectue un contrôle sur
50 pièces et en trouve 3 défectueuses soit 6% : Doit-on livrer quand même au risque
de refuser la marchandise ?
Le raisonnement est alors le suivant : si le taux théorique de défectueux est de 4%
quelles sont les chances d’observer un tel nombre de défectueux ? Le calcul des pro-
babilités montre alors qu’il y a une probabilité voisine de 0.32 d’observer trois pièces
défectueuses ou plus (loi binomiale B(50, 0.04)). Cette probabilité étant assez forte,
l’événement constaté paraı̂t donc normal au fournisseur et ne semble pas de nature
à remettre en cause l’hypothèse formulée. Mais le client serait-il d’acord ?... Il faut
alors calculer le risque d’un refus par le client.
On contate la similitude de cette démarche statistique avec la démarche scientifique habi-
tuelle : observation, hypothèses, vérification.
Le but de la statistique est de pouvoir évaluer ces paramètres inconnus à l’aide de la

réalisation de n expériences indépendantes.
Le problème central de la statistique est le suivant : on dispose d’un échantillon de n
observations et on désire en déduire les propriétés de la population dont il est issu. Pour
cela :
• Il faut que les tirages soient équiprobables et indépendants les uns des autres.
• Il faut que l’échantillon soit représentatif de la population. (On appel population un
ensemble d’objets. Ces objets sont appelés des individus ou unités statistique.)
Dans ce qui suit, nous tacherons de désigner les variables aléatoires par des majuscules
et les résultats des expériences par des minuscules pour bien distinger ce qui est aléatoire de
86
ce qui ne l’est pas.
7.2 Définitions
1. On modélise une expérience aléatoire par une v.a. X. On note Q sa loi. Q est appelée
la loi vraie. Comme nous l’avons expliqué précédemment, on peut choisir, Q = P(λ)
si la v. a. est à valeurs entières , ou Q = N (m, σ) lorsque la v. a. est à valeurs réelles.
On peut aussi ne faire aucune hypothèse spécifique sur Q.
2. Un échantillon de taille n de X (ou un n-échantillon de X) est une suite de v.

a. X1 , X2 ,...,Xn , qui sont indépendantes, de même loi Q (on fait l’hypotèse essentielle,
qu’il est possible de reproduire n fois l’expérience, indépendamment à chaque fois).
3. Les valeurs observées de X1 , X2 ,...,Xn sont notées x1 , x2 ,...,xn . Ce sont les valeurs
numériques fournies par l’expérience.
4. Une statistique est une v. a. Yn = f (X1 , X2 , .., Xn ). Par exemple :

X1 + X2 + ... + Xn
Xn = .
n
7.3 Estimation ponctuelle

L’estimation ponctuelle consiste à donner des valeurs approchées aux paramètres inconnus
(m, σ, λ, etc...) à l’aide d’un échantillon de n observations issues de la population. On
construit une v. a. estimateur T qui est une fonction de l’échantillon aléatoire X1 ,...,Xn et
dont la valeur observée constitue une estimation de la valeur du paramètre recherché.
Soit θ un paramètre de la loi de X que l’on cherche à estimer.
Définition 7.1. On appelle estimateur T de θ, une variable aléatoire qui est une fonction
de l’échantillon :
Tn = f (X1 , ..., Xn ).
Remarque :
1. Un estimateur Tn dépend du choix de l’échantillon.
2. Un estimateur n’est pas unique, il s’agit d’en choisir un ”bon”. Les propriétés usuelles
d’un ”bon” estimateur sont : l’absence de biais et la convergence.
Définition 7.2. 1. L’estimateur Tn est sans biais si :
E(Tn ) = θ.
2. L’estimateur Tn est asymptotiquement sans biais si
lim E(Tn ) = θ
n−→∞
3. L’estimateur Tn est convergent si :
lim V ar(Tn ) = 0.
n−→∞
87
7.3.1 Estimation de la moyenne
Posons :
n
1X
Xn = Xi .
n
i=1
Xn est appelée moyenne empirique1 de l’échantillon (X1 , ..., Xn ).

P
Proposition 7.3. Xn = n1 ni=1 Xi est un estimateur sans biais et convergent de m = E(X).
Preuve.
•
1 1
E(X n ) = (E(X1 ) + ... + E(Xn )) = (m + m + ... + m) = m = E(X).
n n
•
1 1
V ar(X n ) = n2
V ar(X1 + ... + Xn ) = n2
(V ar(X1 ) + ... + Xn )
= n1 V ar(X1 ) −→ 0 (quand n −→ ∞).
On a utilisé que (Xi )ni=1 sont i.i.d. avec EX1 = EX = m et V ar(X1 ) = V ar(X) = σ 2 .
7.3.2 Estimation de la variance

Posons :
n
1 X
Sn2 = (Xk − X)2 , (Statistique Sn2 )
n−1
k=1
Proposition 7.4. Sn2 est un estimateur sans biais et convergent de la variance.
Preuve. On introduit la nouvelle statistique :

n
1X
Sbn2 = (Xk − X)2 ( variance empirique de l’échantillon).
n
k=1
Décomposition de Sbn2 : Partons de Xi − m = Xi − X + X − m.

On a alors :
n
X n
X n
X n
X
(Xi − m)2 = (Xi − X)2 + (X − m)2 + 2(X − m) (Xi − X) .
i=1 i=1 i=1
|i=1 {z }
=0
D’où
n n
1X 1X
(Xi − m)2 = (Xi − X)2 + (X − m)2 .
n n
i=1 i=1
Donc,
n
1X
Sbn2 = (Xi − m)2 − (X − m)2 .
n
i=1
1
La moyenne empirique : la moyenne calculée en se basant sur l’oservation et l’expérience.
88
Calculons E(Sbn2 ) :
Pn
E(Sbn2 ) = 1
n i=1 E(Xi − m)2 − E(X − m)2
1 Pn
= n i=1 V ar(Xi ) − V ar(X)
σ2 n−1 2
= σ2 − n = n σ .
Pour conclure, remarquons que :

n b2
Sn2 = S .
n−1 n
Donc,
E(Sn2 ) = σ.
Variance de Sbn2 : Un calcul dont la longueur est la seule difficulté montre que :
n−1
V ar(Sbn2 ) = [(n − 1)µ4 − (n − 3)σ 4 ],
n3
avec µi est le moment centré d’ordre i de X et si n −→ ∞ :
µ4 − σ 4
V ar(Sbn2 ) ∼ .
n
Donc Sbn2 est convergent.
Remarque :
1. Sbn2 est un estimateur de la variance, qui est biaisé, c’est la raison pour laquelle on
utilise Sn2 .
2. Sbn2 est un estimateur asymptotiquement sans biais et convergent. Pour n grand Sbn2 est
très peu différent de Sn2 .
Exercice 1. On a enregistré, minute après minute, le nombre de désintégrations subies par

un fragment de roche radioactive.
Le résultat de cette expérience est :
0 0 0 1 0 3 0 0 1 0 1 1 0 0 0 2 0 2 1 0.
Estimer la moyenne m et l’écart-type σ de l v. a. X définie comme le nombre de désintégrations

par minute pour ce fragment de roche.
La machine à calculer fournit :
x1 + x2 + ... + xn
x= = 0, 60.
20
Et
1
s2 =((x1 − x) + ... + (x20 − x)2 ) = 0, 88
19
En pratique : On observe un échantillon de taille n. On obtient pour chaque Xk une valeur
observée de Tn (elle dépend de l’échantillon observée). Cette valeur observée est appelée une
estimation ponctuelle de θ.
89
7.4 Estimation par intervalle confiance
Les paramètres estimés ponctuellement à partir d’un échantillon ne sont pas exactes.
On voudrait connaitre leur degré de précision. La démarche de l’estimation par intervalle de
confiance consiste à trouver un intervalle aléatoire qui contient θ avec une probabilité donnée.
Définition 7.5. Un intervalle de confiance, relatif au paramètre θ, de niveau de confiance
1 − α (ou de risque α) est un intervalle aléatoire [C1 , C2 ], où C1 et C2 sont deux statistiques,
telles que :
P (C1 ≤ θ ≤ C2 ) = 1 − α.
Remarque : Les valeurs couramment utilisées sont 1 − α = 0, 90 , 0, 95, ou 0, 99.
Dans la suite on va s’intéresser à θ = m = E(X).
On choisit alors :
C1 = X − ε, C2 = X + ε.
Par conséquent [X − ε, X + ε] est un intervalle de confiance de m, de risque α si :
P (X − ε ≤ m ≤ X + ε) = P (|X − m| ≤ ε) = 1 − α. (7.4.1)
Concrétement on se donne n et α et on cherche ε tel que (7.4.1) soit vérifiée. Nous allons
expliciter le calcul de ε lorsque la taille de l’échantillon est grande, ou sous une hypothèse de
normalité.
7.4.1 Etude de cas des échantillons de grande taille n ≥ 30

On a :
X1 + X2 + ... + Xn X1 + X2 + ... + Xn − nm σ
X −m= −m= = Sn∗ √ ,
n n n
où l’on a posé :

X1 + X2 + ... + Xn − nm
Sn∗ = √
n
D’après le T.C.L.
loi
Sn∗ N (0, 1).
−→n−→∞
Par conséquent,
√ √
σ ε n ε n
P (|X − m| ≤ ε) = P (|Sn∗ √ | ≤ ε) = P (|Sn∗ | ≤ ) ≈ P (|G| ≤ )
n σ σ
où G ∼ N (0, 1).

Or,
P (|G| ≤ a) = P (−a ≤ G ≤ a) = π(a) − π(−a) = 2π(a) − 1.
En conclusion √
ε n
P (|X − m| ≤ ε) ≈ 2π( ) − 1. (7.4.2)
σ
On introduit la définition suivante :
Définition 7.6. On note Zu le réel positif tel que :
1
π(Zu ) = u, ≤ u ≤ 1.
2
90
On déduit de (7.4.1) et (7.4.2) que ε, n et α sont liés par :
√ √
2π( ε σ n ) − 1 = 1 − α ⇐⇒ π(
√ σ
ε n
)=1− α
2
⇐⇒ ε σ n = Z1− α2
⇐⇒ ε = √σn Z1− α2 .
En conclusion, si n ≥ 30, [X − √σn Z1− α2 , X + √σn Z1− α2 ] est un intervalle de confiance de

la moyenne m, de niveau de confiance 1 − α (ou de risque α).
En pratique : On observe un échantillon de taille n. On obtient pour chaque v. a. Xk une

valeur observée xk . On en déduit les valeurs observées C1 et C2 :
σ
C1 = x − √ Z1− α2 ,
n
et
σ
C2 = x + √ Z1− α2 .
n
L’intervalle [C1 (x1 , ..., xn ), C2 (x1 , ..., xn )] est une estimation de l’intervalle de confiance de θ
de niveau de confiance 1 − α.
Remarque :
1. On ne peut être sûr que θ est dans l’intervalle [C1 , C2 ]. La probabilité α de se tromper
est donnée par :
P (θ ∈ [C1 , C2 ]) = 1 − α.
2. On rappelle :
Z0,950 = 1, 64, Z0,975 = 1, 96 et Z0,995 = 2, 58.
♣ Exercice 2. Un échantillon de taille 100, a pour moyenne 125,7 et variance 968,51.

Déterminer un intervalle de confiance de m avec seuil 1%.(i. e. de risque 1%).
Solution
α
On a α = 0, 01 donc 1 − 2 = 0, 995 et Z0,995 = 2, 575.
ε est donnée par : √
σ 968, 51
ε = √ Z1− α2 = × 2, 575 = 0, 80.
n 10
Par conséquent, L’intervalle cherché est [117, 7; 133, 7].
L’approche que nous avons développée s’applique à l’estimation de la probabilité p d’un

événement A se produisant au cours d’une expérience aléatoire E.
On reproduit cette expérience E, de manière indépendante, et on note (Xn ) la suite des v. a.
de comptage associées à A.
½
1 si A se produit à l’expérience n
Xn =
0 sinon
Les v. a. Xn sont indépendantes, et Xn est une v. a. de Bernoulli de paramètre p. Ce qui

signifie que (X1 , ..., Xn ) est un échantillon.
Mais,
m = E(X) = p = P (A).
91
Par conséquent, si n est grand,
√
ε n
P (|X − p| ≤ ε) ≈ 2π( ) − 1.
σ
En conclusion, [X − √σn Z1− α2 , X + √σn Z1− α2 ] est un intervalle de confiance de p = P (A),
de niveau de confiance 1 − α, lorsque n ≥ 30.
♣ Exercice 3. (Controle de qualité).

Lors de la production en série d’un article, on vaut évaluer la proportion d’articles défectueux.
On prélève 200 pièces au hasard, on trouve 18 articles défectueux.
Construire un intervalle de confiance de m de seuil 5%.
(Rep. ε ≈ 0, 04 [0, 05; 0, 13])
7.4.2 Etude de cas X ∼ N (m, σ 2 )

L’estimation de la moyenne repose sur le résultat suivant :
σ2
X ∼ N (m, )
n
(en effet, ∀i, Xi ∼ N (m, σ 2 ). De plus les Xi sont i.i.d.).
Déterminons l’intervalle de confiance pour la moyenne.
On charche ε tel que :
P (|X − m| ≤ ε) = 1 − α,
où α désignant un seuil donné.
Mais, X = m + √σn G avec G ∼ N (0, 1).
On en déduit : √
σ ε n
P (|X − m| ≤ ε) = P ( √ |G| ≤ ε) = P (|G| ≤ ).
n σ
On procède comme dans le cas des échantillons de grand taille, on a :
√
ε n
P (|X − m| ≤ ε) = 2π( ) − 1.
σ
En conclusion :
[X − √σn Z1− α2 , X + √σn Z1− α2 ] est un intervalle de confiance de la moyenne m, de niveau de
confiance 1 − α.
Remarque :
1. Si σ n’est pas connu, on peut le remplacer pas s.
2. Quand la taille de l’échantillon est petite et si X ne suit pas la loi normale, aucune
règle générale ne permet de déterminer l’intervalle de confiance. La technique adéquate
dépend essentiellement de la loi suivie par X.
♣ Exercice 4. On mesure le taux d’uré de 10 personnes, on trouve les résultats suivants :
24, 40, 30, 19, 48, 32, 35, 21, 18, 40.
déterminer un intervalle de confiance pour le risque 5%.
92
7.5 Tests paramètriques
Les tests statistiques sont des outils d’aide à la décision quand l’information est im-
complète. Ils fornissent un cadre scientifique qui permet de valider certaines hypothèses. Nous
allons faire des tests sur un paramètre inconnu θ.
On veut décider s’il faut raisonnablement rejeter ou accepter une hypothèse sur θ. En pra-
tique, on teste une hypothèse H0 “dite hypothèse nulle” contre une hypothèse “alternative”
H1 . Par exemple :
1) H0 : m = 2 H1 : m 6= 3
2) H0 : m = 5 H1 : m < 5
Remarques
· Le test 1) est appelé un test bilatéral.
· Le test 2) est appelé un test unilatéral.
On veut décider de choisir H0 ou H1 , uniquement apès avoir réaliser une série d’expériences :
x1 , x2 , ..., xn .
On choisit un estimateur T de θ. On définit une région de rejet R, qui dépend de θ, T, H0 et
H1 telle que :
· si t ∈ R, on rejette H0 et on accepte H1 ,
· si t ∈ Rc , on accepte H0 ,
avec t désignant la valeur observée de T (T statistique, T = f (X1 , ..., Xn ), alors t = f (x1 , ..., xn )).
La région Rc est aussi appelé région d’acceptation.
Il est évident qu’il existe un risque d’erreur. On définit :
· Le risque de premir̀e espèce qui est la probabilité α de rejetter à tord H0 (rejetter
H0 alors que H0 est vraie).
· Le risque de deuxième espèce qui est la probabilité β d’accepter à tord H0 ( accepter
H0 alors que H1 est vraie).
α et β sont données par les relations :
α = P ( T ∈ R | H0 ) ; β = P ( T ∈ R | H1 ).
La notation P ( T ∈ R | H0 ) représente la probabilité pour que T appartienne à R, lorsque

l’hypothèse H0 est satisfaite. Ainsi si H0 est m = 3,
α = P ( T ∈ R | H0 ) = P ( T ∈ R | m = 3)
est la probabilité pour que T ∈ R, lorsque la moyenne de X vaut 3. En pratique on se borne

à évaluer α, le calcul de β est souvent difficile à réaliser.
Dans la suite nous ne considérerons que des tests portant sur la moyenne θ = m. On
choisit :
1
T = X = (X1 + X2 + ... + Xn ),
n
Lorsque H0 : m = m0 et H1 : m 6= m0 , on prend :
Rc =]m0 − ε , m0 + ε[ ; ε > 0.
On a :
{T ∈ R} = {X ∈ R} = {|X − m0 | ≥ ε}.
Comme précédemment, α et n étant donnés, on cherche ε tel que
P (|X − m0 | > ε|m = m0 ) = α.
Condition équivalente à :
P (|X − m| ≤ ε|m = m0 ) = 1 − α.
93
On peut reproduire l’analyse développée pour la détermination d’un intervalle de confiance.
Si n est grand (n ≥ 30), ou si X suit une loi gaussienne, ε est donné par la formule :
σ
ε = √ z1−α/2 .
n
Lorsqu’on teste H0 : m = m0 contre H1 : m 6= m0 , avec un risque de première

h i
espèce α > 0, la région d’acceptation de H0 est X − √σ z1−α/2 , X+ √σ z1−α/2 .
n n
Exercice 5.
Une machine prouduit des pièces ayant une moyenne de 8,3 cm avec un écart-type de 0,6
cm. Avant de passer une commande importante, le responsable de la machine veut tester
si m = 8, 3 ou si m a changé. Pour ce faire, il prélève 100 pièces et trouve une longueur
moyenne de 8,4 cm.
Doit-il accepter la production avec un seuil d’erreur de 5% ?
Exercice 6.
La durée de vie d’un équipement électrique est de 400 heures avec un écart-type de 60 heures.
On voudrait tester si la moyenne vaut 400 heures au moins de 400 heures. On effectue un
test avec 25 appareils. On trouve une moyenne de 378,1 heures.
Que peut-on en conclure, avec un risque de 5% ?
94
7.6 Exercices
Exercice 1. Loi de Pareto
Soit Y une variable exponentielle de paramètre λ > 0.
1. Quelle est la loi de la v.a. X = eY . Cette loi est appelée la loi de Pareto P(λ, 1).
2. Déterminer une condition nécessaire et suffissante d’existence de E(X), puis la calcu-
ler.
3. D’éterminer une condition nécessaire et suffissante d’existence de V (X), puis la cal-
culer.
Exercice 2. Loi de Weibull
Une variable aléatoire X est dite de Weibull de paramètre (α, λ) (α > 0, λ > 0), si la v.a.
X α suit une loi exponentielle de paramètre λ > 0.
Déterminer une densité de X et calculer E(X).
Exercice 3. Loi du Chi-deux : χ2

Soit X une v.a. suivant une loi normale centrée et réduite N (0, 1).
1. Montrer que la v.a. Y = X 2 est une variable à densité que l’on déterminera.
On dit que Y suit une loi du Chi-deux à un degré de liberté.
En général, si X1 , X2 , ..., Xr est une suite de v.a. indépendantes toutes de loi N (0, 1),
alors la loi de la v.a. Z = X12 + ... + Xr2 est appelée la loi du Chi-deux à r degré de
liberté et notée χ2r
2. Montrer que Y admet une espérance que l’on calculera.
Exercice 4. Soit T une v. a. réelle dont une densité de probabilité est f définie par
½ 2x
R2
si 0 ≤ x ≤ R
f (x) =
0 sinon
où R est un réel strictement positif inconnu.
1. a) Vérifier que f est bien une densité de probabilité.

b) Montrer que T admet une espérance et une variance que l’on calculera.
2. Soit T1 , ..., Tn n variables aléatoires indépendantes de même loi que T .

On pose
n
1X
Xn = Ti .
n
i=1
a) Calculer E(Xn ) et V ar(Xn ).

b) Xn est-il un estimateur sans biais de R ?
c) Déterminer un réel λ tel que
Xbn = λXn
soit un estimateur sans biais de R.

3. On considère un nombre ε > 0 donné.
a) À l’aide de l’inégalité de Bienaymé-Tchebycheff, montrer que
2
bn − R| ≥ ε) ≤ R .
P (|X
8nε2
bn − R| ≥ ε) = 0.
b) En déduire que : limn−→∞ P (|X
b
( On dit que Xn est un estimateur convergent de R.)
95
Chapitre 8
Examens corrigés des années

universitaires 2005-2007

Safi
Devoir surveillé N 1.
Epreuve de Probabilites et Statistiques Durée du sujet : 1H :30min
Examen de 13 mars 2006 Responsable : Lakhel El Hassan
Horaire : 10H :30min-12H :00
Exercice 1.
en assure 40%.
1) On tire une pièce au hasard quelle est la probabilité qu’elle soit défectueuse ?
2) On tire une pièce d’un lot constitué de pièces fabriquées, dans les proportion indéquées, par
les machines A, B et C. On constate que cette pièce est défectueuse. Calculer la probabilité
qu’elle ait été fabriquée :
- par la machine A
- par la machine B
3) On tire une pièce au hasard. Elle est saine. Quelle est la probabilité qu’elle vienne de C.
Exercice 2.
Un test sanguin a une probabilité de 0.95 de détecter un certain virus lorsque celui ci est
effectivement présent. Il donne néanmoins un faux résultat positif pour 1% des personnes
non infectées. Notons V = {la personne testée a le virus}, T = {la personne testée a un test
positif}.
1. Si 0.5% de la population est porteuse du virus, quelle est la probabilité qu’une personne
ait le virus sachant qu’elle a un test positif ?
2. Interpréter le résultat.
96
Exercice 3.
T
1. Soit n ≥ 2, Etablir que, si (A1 , ..., An ) est une suite d’événements telle que P ( ni=1 Ai ) >
0, alors
\n Yn
P ( Ai ) = P (A1 ) P∩i−1 Ak (Ai ).
k=1
i=1 i=2
(Indication : On pourra raisonner par rucurrence sur n).
2. Application :
Un sac contient initialement une boule blanche et une boule noire. On réalise indéfiniment
l’expérience suivante : on tire une boule, on regarde sa couleur, on la remet dans le sac
et on rajoute une nouvelle boule de la même couleur que celle obtenue.
Notons X le nombre de tirage(s) nécessaire(s) avant d’obtenir une boule noire, avec la
convention que X = 0 si on ne tire jamais de boule noire.
Notons Bi l’événement “On obtient une boule blanche au ieme tirage”.
a. Montrer que {X = 1} = B1c et que {X = n} = B1 ∩ B2 ∩ ... ∩ Bn−1 ∩ Bnc pour n ≥ 2.
b. Que vaut la probabilité de Bnc sachant B1 ∩ B2 ∩ ... ∩ Bn−1 ?
c. Calculer, pour i ∈ {2, ..., n − 1}, la probabilité de Bi sachant B1 ∩ B2 ∩ ... ∩ Bi−1 .
d. À l’aide de la question 1) (en choisissant Ai = Bi si i < n et An = Bnc ),

1
montrer que P (X = n) = n(n+1)
Qn−1 i 2×3×...×(n−1)
(On remarquera que i=2 i+1 = 3×...×(n−1)×n = n2 )
1
e. En remarquant que n(n+1) = n1 − n+1
1
, montrer que
+∞
X
P (X = n) = 1.
n=1
f. Que vaut P (X = 0) ? Interpréter le résultat.
Barême approximatif :
Exercice 1 : 4 points
Exercice 3 : 12 points.
97
Corrigé du DS N 0 1 - A. U. 2005-2006- :
Exercice 1 :

On a
P (A) = 0.25, P (B) = 0.35, P (C) = 0.4.
= 0.05 × 0.25 + 0.04 × 0.35 + 0.02 × 0.4 = 0.0345 = 3.45%.
PA (D)P (A) 0.05 × 0.25
PD (A) = = = 36%.
P (D) P (D)
P (D/B)P (B) 0.04 × 0.35
P (B/D) = = = 40%.
P (D) 0.0345
3)De même :
PC (D)P (C) 0.98 × 0.4
PD (C) = = = 40%.
P (D) 1 − P (D)
Exercice 2 :
1. On cherche P (V /T ).
On sait que :
P (V ) = 0.005, P (T /V ) = 0.95, et P (T /V c ) = 0.01.
On en déduit :
P (T ∩V ) P (T /V )P (V )
P (V /T ) = P (T ) = P (T /V )P (V )+P (T /V c )P (V c )
0.95×0.005
= 0.95×0.005+0.01×0.995 = 0.323
2. Le test n’est pas fiable : si la personne présente un test positif, la probabilité qu’elle
ne soit pas porteuse du virus est deux fois plus élvée que celle qu’elle le soit ( en effet ;
P (V /T ) ' 33%. )
Exercice 3 :
1. On raisonne par récurrence sur n.

Si n = 2, l’égalité devient P (A1 ∩ A2 ) = P (A1 )PA1 P (A2 ) et se justifie même par la
définition de la probabilité conditionnelle PA1 .
Supposons que la propriété soit vraie au rang n et montrons la au rang n + 1 :
n+1
\ n
\ n
\
P( Ai ) = P ( Ai ∩ An+1 ) = P ( Ai )PTnk=1 Ak (An+1 )
i=1 i=1 i=1
Par hypothèse de récurrence,

n
Y n+1
Y
= P (A1 ) PTi−1 Ak (Ai )PTnk=1 Ak (An+1 ) = P (A1 ) PTi−1 Ak (Ai ).
k=1 k=1
i=2 i=2
98
Ainsi, la propriété se transmet du rang n au rang n + 1.
Finalement, nous avans prouvé, par récurrence
n
\ n
Y
∀n ≥ 2 : P ( Ai ) = P (A1 ) PTi−1 Ak (Ai ).
k=1
i=1 i=2
2. a. Si X = 1, c’est que l’on a tiré une boule noire dès le premier tirage.
Ainsi :
{X = 1} = B1c .
Si X = n avec n ≥ 2, c’est que, lors des n − 1 premiers tirages, on a tiré des boules
blanches et qu’au n-ième tirage, on a tiré une boule noire.
Ainsi :
{X = n} = B1 ∩ B2 ∩ ... ∩ Bn−1 ∩ Bnc .
b. Si B1 ∩ B2 ∩ ... ∩ Bn−1 a lieu, c’est que l’on a réalisé n − 1 tirages et que l’on a tiré
des boules blanches. Ainsi, à ce stade, le sac contient n + 1 boules dont n blanches.
la probabilité de tirer une boule noire est donc nb de cas favorables 1
nb de cas possibles = n+1 .
En d’autres termes :
n
PB1 ∩B2 ∩...∩Bn−1 (Bnc ) = .
n+1
c. Par un raisonnement similaire au précédent, on trouve
i
∀i ∈ {2, ..., n − 1} : PB1 ∩B2 ∩...∩Bi−1 (Bi ) = .
i+1
d. En suivant les indications de l’énoncé, on peut écrire
T Q
P (X = n) = P (B1 ∩ B2 ∩ ... ∩ Bn−1 ∩ Bnc ) = P ( ni=1 Ai ) = P (A1 ) ni=2 PTi−1 Ak (Ai )
Q Qn−1 i k=1
= P (B1 ) n−1
i=2 P Ti−1
Bk (Bi )P Tn−1
Bk (B c) = 1
n 2 i=2 i+1 × 1
n+1 = 1
n(n+1) .
k=1 k=1
e. On a :
N
X N
X N
X N
X +1
1 1 1 1
P (X = n) = = − =1− .
n(n + 1) n n N +1
n=1 n=1 n=1 n=2
Par suite,
+∞
X N
X 1
P (X = n) = lim P (X = n) = lim (1 − ) = 1.
N −→∞ N −→∞ N +1
n=1 n=1
f. Par définition d’une probabilité,

+∞
X
P (X = n) = 1.
n=0
D’où : P (X = 0) = 0, En d’autres termes, on finira toujours par tirer une boule

noire (quitte à attendre suffisamment longtemps.)
99
Safi
Devoir surveillé N o 2.
Epreuve de Probabilités et Statistiques Durée du sujet : 1h :30min
Examen de 17 avril 2006. Responsable : Lakhel El Hassan
Horaire : 10h :30-12h :00.
Exercice 1. Interprétation du graphique d’une f.d.r. (5 points)

La variable aléatoire X a pour fonction de répartition F dont le graphe est représenté par la
figure 1.

1. Pour tout x ∈ R, montrer que :
P (X = x) = F (x) − F (x−),
avec F (x−) = limε−→0 F (x − ε).

2. En exploitant les informations fournies par ce graphique1 , donner les valeurs des pro-
babilités suivantes.
P (X = 0), P (X ≥ 0), P (4 ≤ X ≤ 6), P (0 < X < 4), P (X ≥ 6).
3. La variable aléatoire X est-elle à densité ?
Exercice 2. (5points)
Soit (a, b) ∈ N∗2 ; a < b ; X est une variable aléatoire discrète de Ω dans N ∗ telle que :
1
Ne perdez pas de temps à le reproduire sur votre copie.
100
FX de X.

2 ]|.
Exercice 3. (10 points)
On considère la fonction f (u) définie par :

u2
f (u) = ke− 2 , ∀u ∈ R.
1. Déterminer la constante k de telle sorte que f (x) puisse être considérée comme la
densité de probabilité d’une v.a. continue U .
2. Que valent E(U ) et V (U ) ?
3. Soit X la v.a. définie par

X = m + σU
où m et σ sont des réels non nuls. Déterminer la densité de probabilité g(x) de X.
4. Soit FX la fonction de répartition de X. Montrer que
x−m
FX (x) = Π( ).
σ
Montrer que par le changement de variable z = x−m σ toutes les varibles aléatoires nor-
males N (m, σ) se ramèment à la loi normale centrée réduite U .
5. Soit Π(z) la fonction de répartition de U . Montrer que
Π(−z) = 1 − Π(z)
6. Application : Le stock journalier d’un produit destiné à un atelier suit une loi nor-
male de moyenne 120 pièces et d’écart type 50 pièces.
a. Calculer la probabilité pour que le nombre de pièces en stock soit compris entre 80
et 160.
b. Calculer la probabilité pour que le nombre de pièces en stock soit supérieur à 200.
c. Calculer la probabilité pour qu’il y ait rupture de stock.
d. Interpret́er ces résultats.
On donne
Π(0, 8) = 0, 7881, Π(1, 6) = 0, 9452 et Π(2, 4) = 0, 9918.
101
Corrigé du DS no 2 -16 mars 2006-
Exercice 1
1. Voir le cours.
2. Calcul des probabilités par la lecture du graphe de F
P (X = 0) = F (0) − F (0−) = 0, 4 − 0, 2 = 0, 2
P (X ≥ 0) = 1 − P (X < 0) = 1 − F (0−) = 1 − 0, 2 = 0, 8
P (4 ≤ X ≤ 6) = P (X ≤ 6) − P (X < 4) = F (6) − F (4−) = 1 − 0, 6 = 0, 4
P (0 < X < 4) = P (X < 4) − P (X ≤ 0) = F (4−) − F (0) = 0, 6 − 0, 4 = 0, 2
P (X ≥ 6) = 1 − P (X < 6) = 1 − F (6−) = 1 − 1 = 0
3. La v.a. X n’est pas à densité car sa fonction de répartition n’est pas continue.
Exercice 2
Voir série d’exercice N ◦ 4
Exercice 3

 f ≥0
1. f est une densité ⇔ et
 R +∞
−∞ f (x)dx = 1
On doit avoir Z +∞
u2
k e− 2 du = 1.
−∞
R +∞ − x2
2 √
On a vu dans le cours −∞ e dx = 2π.
On doit donc avoir
1
k=√ .
2π
2. U ∼ N (0, 1)
Donc E(U ) = 0 et V ar(U ) = 1 (Voir CH.4).
3. On a :
X = m + σU
Par suite
E(X) = m + σE(U )
V (X) = σ 2 V (U )
Comme E(U ) = 0 et V (U ) = 1 on aura :
E(X) = m
V (X) = σ 2
4. Soit Π(u) la fonction de répartition de U et G(x) celle de X.

On peut écrire :
G(x) = P (X ≤ x) = P (m + σU ≤ x) (car X = m + σU )
Mais
x−m
P (m + σU ≤ x) = P (σU ≤ x − m) = P (U ≤ )
σ
Or
x−m x−m
P (U ≤ ) = Π( )
σ σ
Donc
x−m
G(x) = Π( ).
σ
102
• Si f (u) est la densité de probabilité de U et g(x) celle de X
On sait que :
f (U ) = Π0 (U )
.
g(x) = G0 (x)
Mais, on a :
1 0 x−m
G0 (x) = Π( ).
σ σ
Par conséquent
1 x−m
g(x) = f( ).
σ σ
Finalement,
1 1 x − m
g(x) = √ e− 2 ( )2 .
σ 2π σ
5◦ ) Montrons que Π(−z) = 1 − Π(z).
1ere méthode : D’apès le graphe de la fonction Π.

On ramarque que : Π(−z) = 1 − Π(z).
2ieme méthode :
R −z x2
Π(−z) = −∞ √12π e− 2 dx
R +∞ x2 R +∞ x2
= −∞ √12π e− 2 dx − −z √1
2π
e− 2 dx
R +∞ x2
= 1 − −z √12π e− 2 dx
Or, par le changement de variable u = −x, on obtient :

Z +∞ Z +z
1 − x2
2 1 x2
√ e dx = √ e− 2 dx = Π(z)
−z 2π −∞ 2π
Finalement,
Π(−z) = 1 − Π(z).
6. Application : X ∼ N (120, 50)
a. Probabilité pour que le nombre de pièces en stock soit compris entre 80 et 160 :
P (80 ≤ X ≤ 160) = P ( 80−120
50 ≤ X−120
50 ≤ 160−120
50 )
= P (−0, 8 ≤ U ≤ 0, 8)
= Π(0, 8) − Π(−0, 8)
= Π(0, 8) − (1 − Π(0, 8))
Or Π(0, 8) = 0, 7881, donc :
P (80 ≤ X ≤ 160) = 0, 5762.
Interpretation :
Il y a 57, 62% de chances pour que le nombre de pièces en stock soit compris entre
80 et 160.
b.
P (X > 200) = 1 − P (X ≤ 200)
= 1 − P ( X−120
50 ≤ 200−120
50 )
= 1 − P (U ≤ 1, 6) = 1 − Π(1, 6)
= 1 − 0, 9452 = 0, 0548.
Interpretation :
Il y a 5, 48% de chances pour que le nombre de pièces en stock soit superieur à 200.
103
c. P (X ≤ 0) = 0, 0082.
Interpretation :
Il y a un risque trés faible de moins de 1% pour qu’il y a rupture du stock.
104
Safi
Devoir surveillé N o 3.
Examen de 15 juin 2006. Responsable : Lakhel El Hassan
Horaire : 10h :30-12h :00.
Question de cours :(3 points) Soit U une v.a. réelle qui suit la loi uniforme sur [0, 1].
Si λ > 0 quelle est la loi de Y = − λ1 ln U .
Soient r un réel strictement supérieur à 2 et X une variable aléatoire réelle de densité f
r
donnée par f (x) = xr+1 si x ≥ 1 et f (x) = 0 sinon.
1. Donner l’allure du graphe de f puis vérifier que c’est bien une densité de probabilité.
2. Calculer l’espérance et la variance de X.
3. Déterminer la densité de la variable aléatoire Y = ln X
4. Le nombre de kilomètres couverts par une batterie de voiture avant défaillance est une
variable aléatoire ayant la même loi que Y et d’espérance égale à 9000 kilomètres.
Une personne achète une batterie neuve et souhaite se lancer dans un voyage de 3000
kilomètres. Avec quelle probabilité terminera-t-elle son voyage sans avarie de batterie ?
Soit T une v. a. réelle dont une densité de probabilité est f définie par
½ 2x
R2
si 0 ≤ x ≤ R
f (x) =
0 sinon
où R est un réel strictement positif inconnu.
1. a) Vérifier que f est bien une densité de probabilité.

b) Montrer que T admet une espérance et une variance que l’on calculera.
2. Soit T1 , ..., Tn n variables aléatoires indépendantes de même loi que T .

On pose
n
1X
Xn = Ti .
n
i=1
a) Calculer E(Xn ) et V ar(Xn ).
b) Xn est-il un estimateur sans biais de R ?
c) Déterminer un réel λ tel que
Xbn = λXn
soit un estimateur sans biais de R.
3. On considère un nombre ε > 0 donné.
a) À l’aide de l’inégalité de Bienaymé-Tchebycheff, montrer que
2
bn − R| ≥ ε) ≤ R .
P (|X
8nε2
bn − R| ≥ ε) = 0.
b) En déduire que : limn−→∞ P (|X
b
( On dit que Xn est un estimateur convergent de R.)
105
Corrigé du DS no 3 -15 juin 2006-
Question de cours :
Soit U une v.a. réelle de loi uniforme sur [0, 1].
On pose
1
Y = − LnU , λ > 0.
λ
Pour trouver la loi de Y , on se donne une fonction test h quelconque, on met
Z +∞
1 1
E(h(Y )) = E(h(− LnU )) = h(− Lnu)fU (u)du
λ −∞ λ
R +∞
sous la forme −∞ h(y)fy (y)dy à l’aide du changement de variable y = − λ1 Lnu et la densité
de Y est alors fy trouvée.
On a : R1
E(h(Y )) = E(h(− λ1 LnU )) = 0 h(− λ1 Lnu)du
R +∞
= 0 h(y)λe−λy dy.
Par conséquent, Y admet pour densité fY donnée par
fY (y) = λe−λy 1[0,+∞[ (y) ⇒ Y ∼ ε(λ).
Exercice 1
1. La fonction f est à valeurs positives. On a de plus

Z +∞ Z +∞
r
f (x)dx = r+1
dx = [−x−r ]+∞
1 =1
−∞ 1 x
car r > 0. La fonction f est donc bien une densité.
2. On a
Z +∞ Z +∞ · ¸+∞
−r r r
|x|f (x)dx = rx dx = − x−r+1 = < +∞
−∞ 1 r−1 1 r−1
car r − 1 > 0. On en déduit que X admet une espérance.

Comme Z +∞ Z +∞
|x|f (x)dx = xf (x)dx,
−∞ −∞
on a
r
E(X) = .
r−1
On a :
Z +∞ Z +∞ · ¸+∞
2 −r+1 r r
x f (x)dx = rx dx = − x−r+2 = < +∞
−∞ 1 r−2 1 r−2
car r − 2 > 0.
r
On en déduit que X admet un moment d’ordre 2 et qu’il vaut r−2 . Par conséquent, X
r r 2 r
admet une variance qui vaut r−2 − ( r−1 ) = (r−1)2 (r−2) .
Remarque. Ceux qui ont donné les bonnes valeurs pour E(X) et V ar(X) sans justifier
leur existence ont quand même eu tous les poinnts.
106
3. Soit h une fonction bornée. On a
Z +∞
E{h(Y )} = E{h(lnX)} = h(lnx)rx−r−1 dx.
1
Faisons le changement de variable y = lnx ⇔ x = ey . On obtient

Z +∞
E{h(Y )} = h(y)re−ry dy.
0
On en dédui que la densité fy de Y est donnée par fY (y) = re−ry si y ≥ 0 et fY (y) = 0

sinon. On reconnait la densité de la loi exponentielle de paramètre r.
Remarque. On pouvait aussi utiliser la fonction de répartition.
4. Le nombre N de kilomètres couverts avant défaillance suit donc une loi exponentielle.
L’enoncé nous apprend que EN = 9000. Or on sait que l’espérance d’une loi exponen-
tielle est égale à l’inverse de son paramètre. Par conséquent, N suit la loi exponentielle
1
de paramètre 9000 .
La probabilité que la personne termine son voyage sans avarie de batterie est donc égale
à : Z +∞
1 − x −x −1
P (N > 3000) = e 9000 dx = [−e 9000 ]+∞
3000 = e
3 .
3000 9000
Exercice 2
1. a. Vérifions que f est bien une densité de probabilité :

On a ∀x ∈ R, f (x) ≥ 0. De plus,
Z
f (x)dx = 1.
R
b. Montrons que T admet une espérance :
Z Z R
2x2 2
E(T ) = xf (x)dx = = R.
R 0 R 2 3
Montrons que T admet une variance : on a,
V ar(T ) = E(T 2 ) − E(T )2 .
Calculons : E(T 2 ) : Z +∞
2 R2
E(T ) = x2 f (x)dx = .
−∞ 2
Or, E(T ) = 23 R.
Donc E(T )2 = 49 R2 .
Finalement,
R2
V ar(T ) = E(T 2 ) − E(T )2 = .
18
1 Pn
2. On pose : Xn = n i=1 Ti .
a. Calculons E(Xn ) :
1 Pn
E(Xn ) = E(P n i=1 Ti )
1 n
n E( i=1 Ti ))
1 Pn
n i=1 E(Ti )).
107
Or les Ti ont la même loi et on a : E(Ti ) = 32 R.
D’où :
2
E(Xn ) = R
3
Calculons V ar(Xn ) :
P
V ar(Xn ) = V ar( n1 ni=1 Ti )
P `tes
= n12 V ar( ni=1 Ti ), Les Ti sont .
2
= n12 n R18 .
Donc :
R2
V ar(Xn ) =
.
18n
b. Vérifions si Xn est un estimateur sans biais : On a,
2
E(Xn ) = R 6= R.
3
Par suite, Xn est un estimateur biaisé.
c. Déterminons λ tel que Xcn = λXn soit sans biais.
c cn ) = R.
Pour que Xn soit un estimateur sans biais de R, il faut que E(X
Comme
E(Xcn ) = λE(Xn ) = λ 2 R.
3
Donc
3
λ= .
2
3.
bn − R| ≥ ε) ≤ R2
a. Montrons que P (|X 8nε2
.
D’après l’inégalité de B. T., on a :
V ar(Xcn )
bn − R| ≥ ε) ≤
P (|X .
ε2
cn ) :
Cherchons V ar(X
cn ) = V ar( 3 Xn ) = 9 V ar(Xn ).
V ar(X
2 4
Or,
R2
V ar(Xn ) = .
18n
D’où :
2
cn ) = R .
V ar(X
8n
Donc :
2
bn − R| ≥ ε) ≤ R .
P (|X
8nε2
b. On a,
2
bn − R| ≥ ε) ≤ R .
P (|X
8nε2
bn − R| ≥ ε) ≤ limn−→∞ R2
D’où : limn−→∞ P (|X 8nε2
= 0.
Donc X bn est un estimateur convergent de R.
108
Safi
Examen de rattrapage
Examen de 28 juin 2006. Responsable : Lakhel El Hassan
Horaire : 16h :30-18h :00.

On lance quatre fois de suite une pièce de monnaie non truquée. Soient X le nombre de
séquences ”Pile-Face” (dans cet ordre) obtenues 1 et Y le nombre de Piles obtenus.
1 3
1. Expliquer pourquoi P ({X = 0} ∩ {Y = 1}) = 16 et P ({X = 1} ∩ {Y = 1}) = 16 .
Dans la suite, on admettra que la loi du couple aléatoire (X,Y)est donnée par
X \ Y 0 1 2 3 4
1 1 1 1 1
0 16 16 16 16 16
3 1 3
1 0 16 4 16 0
1
2 0 0 16 0 0
2. Donner la loi de X et dessiner sa fonction de répartition.

3. La variable aléatoire Y suit une loi usuelle. Laquelle ? Quels sont ses paramètres ?
Donner E(Y ) et V ar(Y ) sans faire de calcul.
4. Montrer que les variables aléatoires X et Y ne sont pas indépendantes. (On pourra
comparer P ({X = 0} ∩ {Y = 1}) et P (X = 0)P (Y = 1))
5. Calculer le coefficient de corrélation linéaire ρ(X, Y )
6. On sait que pour toutes variables aléatoires indépendantes X1 et X2 on a
ρ(X1 , X2 ) = 0.
Est-ce que la réciproque de cette proposition est vraie ?
Soient r un réel strictement supérieur à 2 et X une variable aléatoire réelle de densité f
r
donnée par f (x) = xr+1 si x ≥ 1 et f (x) = 0 sinon.
1. Donner l’allure du graphe de f puis vérifier que c’est bien une densité de probabilité.
2. Calculer l’espérance et la variance de X.
3. Déterminer la densité de la variable aléatoire Y = ln X
4. Le nombre de kilomètres couverts par une batterie de voiture avant défaillance est une
variable aléatoire ayant la même loi que Y et d’espérance égale à 9000 kilomètres.
Une personne achète une batterie neuve et souhaite se lancer dans un voyage de 3000
kilomètres. Avec quelle probabilité terminera-t-elle son voyage sans avarie de batterie ?
1
Par exemple, la séquence P P F P donne X = 1 ; F P P P donne X = 0, P F P F donne X = 2; etc...
109
Correction d’examen de rattrapage -28 juin 2006-
Exercice 1 :
1. L’univers Ω = {P, F }4 est de cardinal 24 = 16. Calculons X(ω) et Y (ω) pour chaque
ω ∈ Ω.
Si ω = P P P P alors X(ω) = 0 et Y (ω) = 4
Si ω = P P P F alors X(ω) = 1 et Y (ω) = 3
Si ω = P P F P alors X(ω) = 1 et Y (ω) = 3
Si ω = P F P P alors X(ω) = 1 et Y (ω) = 3
Si ω = P P F F alors X(ω) = 1 et Y (ω) = 2
Si ω = P F P F alors X(ω) = 2 et Y (ω) = 2
Si ω = P F F P alors X(ω) = 1 et Y (ω) = 2
Si ω = P F F F alors X(ω) = 1 et Y (ω) = 1
Si ω = F P P P alors X(ω) = 0 et Y (ω) = 3
Si ω = F P P F alors X(ω) = 1 et Y (ω) = 2
Si ω = F P F P alors X(ω) = 1 et Y (ω) = 2
Si ω = F P F F alors X(ω) = 1 et Y (ω) = 1
Si ω = F F P P alors X(ω) = 0 et Y (ω) = 2
Si ω = F F P F alors X(ω) = 1 et Y (ω) = 1
Si ω = F F F P alors X(ω) = 0 et Y (ω) = 1
Si ω = F F F F alors X(ω) = 0 et Y (ω) = 0.
1
On en déduit P (X = 0) ∩ {Y = 1} = P ({F F F P }) = 16 . Et P (X = 1) ∩ {Y = 1} =
3
P ({P F F F }) + P ({F P F F }) + P ({F F P F }) = 16 .
2. La v. a. X prend ses valeurs dans {0, 1, 2} et on a :

1 1 1 1 1 5
P (X = 0) = 16 + 16 + 16 + 16 + 16 + = 16 ,
5
P (X = 1) = 8 ,
1
P (X = 2) = 16 .
La fonction de répartition de X est donnée par :
3. La v. a. Y compte le nombre de piles obtenus quand on jette quatre fois de suite une pièce
de monnaie non truquée, donc Y suit la loi binomiale de taille n et de paramètre 21 .
Donc
1
E(Y ) = 4 × = 2.
2
Et
1 1
V ar(Y ) = 4 × × (1 − ) = 1.
2 2
4. On a P ({X = 0} ∩ {Y = 1}) = 16 . P ({X = 0}) = 16 et P ({Y = 1}) = 14 .
1 5
Donc P ({X = 0} ∩ ∩{Y = 1}) 6= P ({X = 0})P ({Y = 1}). Or, si X et Y sont indépendantes,
110
on aurait (par définition)
P ({X = 0} ∩ {Y = 1}) 6= P ({X = x})P ({Y = y}),
pour tous (x, y) ∈ {0, 1, 2} × {0, 1, 2, 3, 4}.

Donc X et Y ne sont pas indépendantes.
3 1 9 1
5. On a : E(XY ) = 16 + 2 + 16 + 4 = 32 .
Donc :
Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 0.
Par suite,
%(X, Y ) = 0.
6. La réciproque de cette proposition est fausse, car X et Y ne sont pas indépendantes et elles
vérifient pourtant %(X, Y ) = 0.
Exercice 2 :
Voir Exo 1. du DS N o 3.
111
Safi
Epreuve de Probabilites et Statistiques Responsable : Lakhel El Hassan
Examen de 16 octobre 2006 Horaire : 09H :00min-10H :30min
Exercice 1.
On considère trois cartes : une avec les deux faces rouges, une avec les deux faces blanches,
et une avec une face rouge et une face blanche. On tire une carte au hasard. On expose une
face au hasard. Elle est rouge. Parieriez-vous que la face cachée est blanche ? pour vous aider
dans votre choix :
1. Déterminer l’espace de probabilité.
2. Calculer la probabilité que la face cachée est blanche sachant que la face visible est
rouge.
Exercice 2.
en assure 40%.
1. On tire une pièce au hasard quelle est la probabilité qu’elle soit défectueuse ?
2. On tire une pièce d’un lot constitué de pièces fabriquées, dans les proportion indéquées,
par les machines A, B et C. On constate que cette pièce est défectueuse. Calculer la
probabilité qu’elle ait été fabriquée par la machine A
3. On tire une pièce au hasard. Elle est saine. Quelle est la probabilité qu’elle vienne de C.
Exercice 3 : (La formule du crible)

(Ω, P(Ω), P ) est un espace de probabilité. A1 , A2 ,...An sont n événements.
1. Montrer que P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 ∩ A2 ).

2. Établir une formule analogue pour P (A1 ∪ A2 ∪ A3 ).
3. Montrer , par récurrence, que :
n
[ n
X X n
\
P( Ai ) = P (Ai )+...+(−1)k+1 P (Ai1 ∩...∩Aik )+...+(−1)n+1 P ( Ai ).
i=1 i=1 1≤i1 <...<ik ≤n i=1
Application : On utilise dans la suite la formule du crible.

1. Pour fêter leur réussite à un concours, n étudiants se donnent rendez-vous dans un
restaurant. En entrant chaque personne dépose sa veste dans un vestiaire. Après le re-
pas, ils récupèrent leur veste au hasard. Quelle est la probabilité pour qu’une personne
au moins ait sa propre veste ? Déduire la probabilité qu’aucune personne ne repart avec
sa veste.
112
2. En s’inspirant de la question précédente, calculer la probabilité πn (k) pour que k per-
sonne exactement aient leur propre veste ?
3. Calculer la limite π(k) de πn (k) quand n −→ ∞. Vérifier que la famille (π(k), k ∈ N)

détermine une probabilité sur N.
Exercice 1 : 4 points, Exercice 2 : 6 points, Exercice 3 : 10 points.
113
Corrigé du DS N 0 1 - A. U. 2006-2007- :
Exercice 1 :
On numérote les faces de la première carte a ,b, de la dexième c, d, et de la troisième e,

f . Les couleurs des faces sont :
a = R, b = R, c = R, e = B, f = B.
Une carte c’est une face exposée et une face cachée : (E, C). L’univers Ω est donc :
Ω = {(a, b), (b, a), (c, d), (d, c), (e, f ), (f, e)}.
On munit (Ω, P(Ω)) de la probabilité uniforme.

D’après la définition de la probabilté conditionnelle, on a :
P (E = R, C = B) Card{(c, d)} 1
P (C = B/E = R) = = = .
P (E = R) Card{(a, b), (b, a), (c, d)} 3
Exercice 2 :
On a
P (A) = 0.25, P (B) = 0.35, P (C) = 0.4.

= 0.05 × 0.25 + 0.04 × 0.35 + 0.02 × 0.4 = 0.0345 = 3.45%.

PA (D)P (A) 0.05 × 0.25
PD (A) = = = 36%.
P (D) P (D)
3)
PC (D)P (C) 0.98 × 0.4
PD (C) = = = 40%.
P (D) 1 − P (D)
Exercice 3 :
Partie I. Voir TD
Application :
On pose Ai = {i a sa veste }, on a par la formule du crible :
S P P
P ( 1≤i≤n Ai ) = np=1 (−1)p+1 1≤i1 <...<ip ≤n P (Ai1 ∩ ... ∩ Aip ).
Pn p+1 C p (n−p)
Pn p+1 1 .
= p=1 (−1) n n! = p=1 (−1) p!
Or \ [
P( Ai ) = 1 − P ( Ai )
1≤i≤n 1≤i≤n
Donc
\ n
X 1
P( Ai ) = 1 − (−1)p+1 .
p!
1≤i≤n p=1
114
On note
γ(n) = Card{ permutations de {1,...,n} sans points fixe}.
On a :
n
γ(n) X 1
1− = (−1)p+1 .
n! p!
p=1
Donc
n
X 1
γ(n) = n! (−1)p
p!
p=0
On en déduit donc le nombre de permutations de {1, ..., n} sans points fixe.

2) Remarquons que
Card{ permutations de {1,...,n} ayant k points fixes }

πn (k) = .
Card{ permutation de {1,...,n}}
Il existe Cnk possibilités pour les k points fixes. On en déduit

k card{ permutation de {1,...,n} sans point fixe }
Cn
πn (k) = Card{ permutation de {1,...,n}}
k γ(n−k)
Cn 1 Pn−k p1
= n! = k! p=0 (−1) p! .
3) On a :
1 −1
limn−→∞πn (k) = π(k) = e .
k!
D’où
∞
X X∞
1 −1
π(N) = π(k) =e = 1.
k!
k=0 k=0
P
(On peut poser pk = π(k), on a donc pk ≥ 0 et k pk = 1, d’où le résultat.)
115
Université Cadi Ayyad Année Universitaire 2006-2007
Ecole Nationale des Sciences Appliquées Responsable : Lakhel El Hassan
Safi
Devoir libre N o 1. Probabilités et statistiques

À rendre au plus tard le 10 décembe.
Exercice 1.
On désire modéliser le temps d’attente d’une panne de machine à l’aide de variables aléatoires
sans mémoire : la probabilité pour que la machine tombe en panne après la date k + n sachant
qu’elle fonctionne à l’instant n est indépendante de n.
1. Montrer que la loi géométrique de paramètre p est sans mémoire : c’est à dire que
P (X > k + n/X > n) est indépendante de n.
2. Caractériser toutes les lois des variables aléatoires X à valeurs dans N∗ qui sont sans
mémoire. On pourra calculer P (X > 1 + n) en fonction de P (X > 1).
3. Caractériser toutes les lois des variables aléatoires X à valeurs dans N qui sont sans
mémoire.
Exercice 2.
La durée de vie, exprimée en années, d’un circuit électronique est une variable aléatoire T
dont la fonction de répartition F est définie par :
½
0¡ ¢ si t < 0
F (t) = 1 2
1 − exp − 2 t si t ≥ 0
1. Donner la densité de probabilité f de T . Calculer E[T ].

2. Sachant que le circuit a déjà fonctionné durant 1 an, quelle est la probabilité qu’il
continu à fonctionner encore durant au moins 2 ans ? La loi est-elle sans mémoire ?
3. Un équipement électronique E est composé de 10 circuits identiques et indépendantes.
Au circuit i (1 ≤ i ≤ 10) est associée la variable aléatoire :
½
1 si la durée de vie du circuit i est inférieure à un an
Xi =
0 sinon.
a. Quelle est la loi de probabilité de la variable aléatoire N égale au nombre de circuit

dont la durée de vie est inférieure à un an ?
b. L’équipement E est dit en série si la défaillance de l’un de ses circuits entraı̂ne sa

défaillance. Quelle est alors la probabilité qu’il soit défaillant avant un an ?
c. L’équipement E est dit en parallèle si sa défaillance ne peut se produire que si tous

ses circuits sont défaillants. Quelle est alors la probabilité qu’il soit défaillant avant
un an ? avant t ans ?
Exercice 3.
Une usine employant 30 personnes dont 4 ingénieurs, 10 techniciens et 16 ouvriers.
116
1. On choisit de façons successive 3 employés : calculer la probabilité d’avoir un employé
de chaque catégorie professionnelle.
2. On choisit de façon successive 3 employés et soit X la variable aléatoire qui représente
le nombre d’ingénieurs choisis. Donner la loi de probabilité de X.
Exercice 4. Soit X et Y deux variables aléatoires réelles.
1. Montrer que X + Y (resp. XoY) est une variable aléatoire réelle.

2. Montrer que X.Y (resp. X Y si Y ne s’annulle pas) est une variable aléatoire réelle.
3. Soit (Xn ) une suite de variables aléatoires réelles.
Si les fonctions inf n Xn , supn Xn , lim inf Xn , lim supn Xn sont bien définies, montrer
que ces fonctions sont des variables aléatoires réelles.
Exercice 5. Soit un vendeur de lots de pièces mécaniques disposant, à une date t0 , d’un
stock s.
La demande X, pour un intervalle de temps [t0 , t1 ], est une v. a. entière ayant une loi de
probabilité définie par :
P (X = x) = k(x0 )p q x−1 pour x ≥ x0

=0 pour x < x0
où p et q sont deux réels positifs tels que p + q = 1 et x0 est un entier naturel inférieur à s.
1) Calculer k(x0 ) et E(X).
2) Si X est inférieure au stock s, les lots restants sont vendus à perte et le vendeur aura
à affronter une dépense moyenne de c1 DH. Si X est supérieure au stock s, il faut un ap-
provisionnement spécial de pièces manquantes et le supplément du coût représente une perte
moyenne de c2 DH.
Calculer l’éspérence mathématique des dépenses que va devoir affronter le vendeur pendant
la période [t0 , t1 ].
117
Safi
Epreuve de Probabilités et Statistiques Responsable : Lakhel El Hassan
Examen de 25 décembre 2006 Horaire : 8H :30min-10H :00
On lance trois fois de suite une pièce de monnaie non truquée. Soient X le numéro du lancer
où on obtient Pile la première fois 1 (avec la convention que X = 4 si on n’obtient pas de
Pile ) et Y le numéro du lancer où on obtient Face la première fois (avec la convention que
Y = 4 si on n’obtient pas de Face).
1. Donner la loi du couple (X, Y ).
2. Donner la loi de X, son espérance et sa variance.
3. Donner la loi de Z = X + Y , son espérance et sa variance.
4. Calculer le coefficient de corrélation linéaire ρ(X, Y ) et interpréter le résultat obtenu.
5. Montrer que pour toutes variables aléatoires indépendantes X1 et X2 on a
ρ(X1 , X2 ) = 0.
Est-ce que la réciproque de cette proposition est vraie ?
Problème 2. ( Une somme doublement aléatoire) (11 points)

Sur le même espace probabilisé (Ω, F, P ), on suppose définies
- une variable aléatoire N à valeurs dans N,
- une suite de variable aléatoire positives (Xi )i≥1 , ayant toutes même loi.
On pose alors :
Xn
S0 := 0, Sn = Xi (n ≥ 1).
i=1
On définit la variable aléatoire T par

N
X
T := Xi ,
i=1
autrement dit,
∀ω ∈ Ω, T (ω) = SN (ω) (ω).
Ce modèle est d’un usage courant. Par exemple si une compagnie d’assurances s’intéresse
au risque pour une certaine catégorie de véhicules, dans une ville donnée, N représente le
nombre de sinistres déclarés au cours d’une période de temps donnée et Xi le remboursement
payé par la compagnie pour le i-ème sinistre déclaré pendant cette période. On peut imaginer
facilement d’autres applications comme le cumul des hauteurs de pluie sur une année, le total
des retraits effectués sur un distributeur automatique bancaire en une journée, etc.
1
Par exemple, la séquence P P P donne X = 1 et Y = 4 ; F P F donne X = 2 et Y = 1 ;, F F P donne X = 3
et Y = 1 ; F F F donne X = 4 et Y = 1 ; etc.
118
Le but de cet exercice est de calculer l’espérance de T en fonction des espérances des Xi
et de N sans supposer connues les loi des Xi ou de N .
On suppose de plus que N est indépendante de la suite (Xi )i≥1 , ce qui implique notamment
(on ne vous demande pas de le justifier) que pour tout j ∈ N et tous boréliens B et B 0 de R,
les évènement {Sj ∈ B} et {N ∈ B 0 } sont indépendants.
1. Trouvez l’erreur dans le raisonnement suivant : Par additivité de l’espérance des va-
riables aléatoires positives,
ÃN ! N
X X
ET = E Xi = EXi = N EX1 .
i=1 i=1
2. Soit A ∈ F un événement et Y une variable aléatoires sur (Ω, F, P ) tels que pour tout
t ≥ 0, les événements {Y > t} et A soient indépendants. Montrer que
∀t ≥ 0, P (Y 1A > t) = P (Y > t)P (A).
(Indication : commencer par calculer P ({Y 1A > t} ∩ Ac ).)
3. Soit X une variable aléatoire positive. Montrer que :

Z +∞
E(X) = P (X > t)dt.
0
4. Déduire de ce qui précède que
∀j ∈ N, E(Sj 1{N =j} ) = P (N = j)jEX1 .
5. Pour tout entier n ≥ 1, on pose Tn := T 1{N ≤n} . Justifiez l’égalité

n
X
Tn = Sj 1{N =j} .
j=0
En déduire que
n
X
∀n ∈ N∗ , ETn = EX1 jP (N = j).
j=0
6. Vérifier que X
T = Sj 1{N =j} .
j∈ N
(on comparera les valeurs prises par les deux membres en un ω quelconque).
7. Déduire que :
E(T ) = E(N )E(X1 ).
Exercice 1 : 9 points Problème 2 : 11 points
119
Corrigé du DS N o 2 - A. U. 2006-2007 :
Exercice 1 :
A Ecrire
Problème 2 :
120
Safi
Epreuve de Probabilités et Statistiques 1 Responsable : Lakhel El Hassan
Contrôle continu de 09 janvier 2007 Horaire : 10H :30min-12H :00
Soit α un réel et f la fonction réelle définie par :
(
α
(x−1)2
si x < 0,
f (x) = −2x
αe si x ≥ 0.
1. Calculer α pour que f soit une densité de probabilité.

2. Déterminer la fonction de répartition F associée à f .
3. Soit X une v. a. r. de densité f . Déterminer la loi de la v. a. Y = sgn(X) avec
sgn(x) = −1 si x < 0, sgn(x) = 1 si x > 0 et sgn(0) = 0.

La durée de vie, exprimée en années, d’un circuit électronique est une variable aléatoire T
dont la fonction de répartition F est définie par :
½
0¡ ¢ si t < 0
F (t) =
1 − exp − 12 t2 si t ≥ 0
1. Donner la densité de probabilité f de T . Calculer E[T ].

2. Sachant que le circuit a déjà fonctionné durant 1 an, quelle est la probabilité qu’il
continu à fonctionner encore durant au moins 2 ans ? La loi est-elle sans mémoire ?
3. Un équipement électronique E est composé de 10 circuits identiques et indépendantes.
Au circuit i (1 ≤ i ≤ 10) est associée la variable aléatoire :
½
1 si la durée de vie du circuit i est inférieure à un an
Xi =
0 sinon.
a. Quelle est la loi de probabilité de la variable aléatoire N égale au nombre de circuit

dont la durée de vie est inférieure à un an ?
b. L’équipement E est dit en série si la défaillance de l’un de ses circuits entraı̂ne sa

défaillance. Quelle est alors la probabilité qu’il soit défaillant avant un an ?
c. L’équipement E est dit en parallèle si sa défaillance ne peut se produire que si tous

ses circuits sont défaillants. Quelle est alors la probabilité qu’il soit défaillant avant
un an ? avant t ans ?
1
la qualité et la clarté de la rédaction constituent des éléments essentiels dans l’appréciation de la copie.
121
Exercice 3 : (Vitesse moyenne) (4 points)
On veut estimer par intervalle de confiance la vitesse moyenne des automobiles dans un
certain virage d’une route à grand trafic. Pour cela on a enregistré à l’aide d’un radar les
vitesses X1 (ω) = x1 , ..., X400 (ω) = x400 de 400 automobiles en une période de temps de 2
heures avec des conditions de circulation homogènes (météo, visibilité, densité de trafic,. . .).
On a obtenu les statistiques suivantes
400
X 400
X
xi = 35200km/h, x2i = 3107600(km/h)2 .
i=1 i=1
L’homogénéité des conditions de trafic permet de supposer que les variables aléatoires X1 , . . .
,X400 , dont on a ainsi observé une réalisation, sont indépendantes et de même loi. Proposez un
intervalle de confiance au niveau 98% pour la vitesse moyenne EX1 en indiquant clairement
quels résultats du cours légitiment les approximations faites. Les données numériques ci-
dessus ont été arrangées pour vous permettre de faire facilement tous les calculs à la main
si vous ne disposez pas d’une calculatrice.
122
Corrigé du DS N o 3 - A. U. 2006-2007 :
Exercice 1 :
A Ecrire
Exercice 2 :
1. La densité de probabilité f de T est

1
f (t) = texp(− t2 )It>0 .
2
L’esprance vaut
R +∞
E[T ] = 0 t2 exp(− 21 t2 )dt
R +∞
= [−texp(− 21 t2 )]+∞
0 + 0 exp(− 21 t2 )dt
1
R +∞
= 2 −∞ t2 exp(− 12 t2 )dt
√
2π
= 2 .
2. La probabilité s’écrit
9
P (T ≥ 3) ∩ P (T ≥ 1) P (T ≥ 3) e− 2 −4
P (T ≥ 3/T ≥ 1) = = = 1 = e .
P (T ≥ 1) P (T ≥ 1) e− 2
On a pas P (T ≥ 3/T ≥ 1) = P (T ≥ 2) = e−2 . Donc la loi n’est pas sans mémoire.
3. a. La loi de probabilité de la variable aléatoire N égale au nombre de circuit dont la

1
durée de vie est inférieure à un an est : B(10, 1 − e− 2 ). En effet, le v. a. Xi sont
indépendantes et suivent une loi de Bernoulli de paramètre :
1
p = P (X1 = 1) = P (T ≤ 1) = F (1) = 1 − e− 2 .
b. La probabilité que l’équipement en série soit défaillant avant un an vaut :
P (∪i=10
i=1 (Xi = 1)) = 1 − P (∩10 (X = 0))
Q10 i=1 i
= 1 − i=1 P (Xi = 0)
10
= 1 − e− 2
' 0.99
c. La probabilité que l’équipement en parallèle soit défaillant avant 1 an est :

Y 1
P (∩10
i=1 (Xi = 1)) = P (Xi = 1) = (1 − e− 2 )10 = 8.9.10−5 .
10
1
Soit Ti la durée de vie de l’équipement i. La probabilité que l’équipement en parallèle

soit défaillant avant t ans vaut :
10
Y 1 2
P (∩10
i=1 (Ti ≤ t)) = P (Ti ≤ t) = (1 − e− 2 t )10 = pt .
i=1
123
on obtient p2 = 0.23 p3 = 0.099
Exercice 3 :
Nous allons chercher pour EX1 un intervalle de confiance centré sur X = 35200/400 =
88km/h. Pour construire cet intervalle de confiance, on ne peut pas utiliser ici le théorème
limite central classique car l’écart-type σ des Xi est inconnu. On va utiliser le TLC avec
autonormalisation où l’onremplace σ par S, laracine carrée de la variance empirique
n n
1X 1X 2 2
S2 = (Xi − E(Xi ))2 = Xi − X
n n
i=1 i=1
Les Xi étant de carré intégrable, le TLC avec autonormalisation nous dit que
√ X − E(X1 )
n −→ N (0, 1) (en loi)
S
Cette convergence légitime pour n grand, l’approximation
√ X − E(X1 )
P (| n | ≤ t) = P (|N (1, 1)| ≤ t) = 2π(t) − 1,
S
où π est la f.d.r. de la loi N (0, 1).
Par suite :
√ X − E(X1 ) tS tS
| n | ≤ t ⇐⇒ X − √ ≤ E(X1 ) ≤ X + √ .
S n n
Cette inégalité nous donne alors un intervalle de confiance pour EX1 au niveau 2π(t) − 1. Il
s’agit bien d’un intervalle de confiance puisque les bornes XtSn−1/2 sont calculables à partir
des observations sans connaissance de la loi des Xi . Pour terminer les calculs, on détermine
t en résolvant 2π(t) − 1 = 0, 98, ce qui équivaut à π(t) = 0, 99,.
D’où
t = 2, 33.
On calcule ensuite X(ω) et S(ω) :
400
1 X
X=x= xi = 35200km/h = 88Km/h.
400
i=1
Et
400
1 X 2 3107600
S(ω) = s = xi − x2 = − (88)2 = 25Km/h2 .
400 400
i=1
d’où S(ω) = s = 5km/h. Un intervalle de confiance I au niveau 98% pour EX1 en km/h est
donc
2.33 × 5 2.33 × 5
I = [88 − , 88 + ] = [87, 41; 88, 59].
20 20
124
Safi
Sujet de contrôle de rattrapage.

Epreuve de Probabilités et Statistiques 1 Responsable : Lakhel El Hassan
Contrôle de 23 janvier 2007 Horaire : 8H :30min-10H :00
1. Soit X : Ω −→ N une variable aléatoire. Qu’est- ce que la loi de X ? Comment calcule-
t-on l’espérance de X, la variance de X ?
2. Soit X : Ω −→ R une variable aléatoire de densité f . Comment calcule-t-on P (X ∈

[a, b]) pour un intervalle [a, b] de R. Comment calcule-t-on E(X), E(X 2 ) ?
Quand dit-on que X est intégrable ?
3. Si X est une v. a. r. positive, intégrable, et si a ∈ R∗+ , montrer que :
E(X)
P (X > a) ≤ .
a
4. Si X est une v. a. r. admettant un moment d’ordre 2, et si a ∈ R∗+ , montrer que :
V ar(X)
P (|X − E(X)| > a) ≤ .
a2
Soit T une variable aléatoire à valeurs dans N. Pour tout n ∈ N, on suppose que P (T ≥
n) > 0 et que
P{T ≥n} (T ≥ n + 1) = P (T ≥ 1). (1)
1. On pose p = P (T = 0). Si G est une variable aléatoire de loi géométrique G(p), mon-
trer que Z = G − 1 vérifie P (Z = k) = p(1 − p)k pour k ∈ N.
2. Pour n ∈ N, calculer P (Z ≥ n).
3. On pose fn = P (T ≥ n). Montrer que fn+1 = fn f1 pour tout n ∈ N.
4. En déduire P (T ≥ n) pour n ∈ N (on remarquera que (fn ) est une suite géométrique).
5. Montrer que deux variables aléatoires X et Y à valeurs dans N ont la même loi si
P (X ≥ n) = P (Y ≥ n) pour tout n ∈ N.
6. En déduire que T et Z ont la même loi.
7. Quel est l’analogue de (1) dans le cas continu ?
1
la qualité et la clarté de la rédaction constituent des éléments essentiels dans l’appréciation de la copie.
125
Corrigé du contrôle de rattrapage - A. U. 2006-2007 :
Exercice 1 :
Voir le cours.
Exercice 2 :
1. On a p = P (T = 0). Montrons que Z = G − 1 vérifie P (Z = k) = p(1 − p)k pour

k ∈ N.
On a G prend ses valeurs dans N∗ , donc Z prend ses valeurs dans N. Par définition de
la loi géométrique, on a P (G = l) = p(1 − p)l−1 . Donc, pour k ∈ N, on a
P (Z = k) = P (G = k + 1) = p(1 − p)k .
2. Calculons P (Z ≥ n), pour tout n ∈ N.

On a :
P P∞
P (Z ≥ n) = +∞ k=n P (Z = k) = p(1 − p)
n
k=n (1 − p)
k−n
P∞ 1
= p(1 − p)n l=0 (1 − p)l = p(1 − p)n 1−(1−p) = (1 − p)n .
3. On a fn = P (T ≥ n). Montrons que fn+1 = fn f1 pour tout n ∈ N.

Pour tout n ∈ N, on a :
fn + 1 = P (T ≥ n + 1) = P (T ≥ n + 1 et T ≥ n) = PT ≥n (T ≥ n + 1)P (T ≥ n)
(1)
P (T ≥ 1)P (T ≥ n) = f1 fn .
=
4. En déduire P (T ≥ n) pour n ∈ N. Remarquons que (fn ) est une suite géométrique).

La suite (fn ) est géométrique de raison f1 = P (T ≥ 1) = 1 − P (T = 0) = 1 − p.
Donc, pour n ∈ N, on a :
P (T ≥ n) = fn = (f1 )n = (1 − p)n .
5. Par définition, deux v. a. X et Y à valeurs dans N ont la même loi si P (X = n) =

P (Y = n) pour tout n ∈ N.
On suppose que P (X ≥ n) = P (Y ≥ n) pour tout n ∈ N.
On a
P (X = n) = P (X ≥ n) − P (X ≥ n + 1) = P (Y ≥ n) − P (Y ≥ n + 1) = P (Y = n).
Donc X et Y ont la même loi.
6. C’est une conséquence immédiate des questions 2), 4) et 5).
7. La propriété d’absence de mémoire : Soit X une v. a. r. suivant la loi exp(θ), alors

X vérifie :
∀s ∈ R+ , ∀t ∈ R+ , P (X > t + s/X > t) = P (X > s)
(On parle aussi de la propriété de non vieillissement).
126
8.1 Bibliographie
Voici une bibliographie très incomplète. Allez voir vous même à la Bibliothèque. Gardez
en mémoire qu’un bon livre est un livre qui vous donne envie d’apprendre et de travailler son
contenu ! !
A compléter.
127

Cours de Probabilité MR LAKHAL Elhasan

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Cours de Probabilité MR LAKHAL Elhasan

Uploaded by

Copyright:

Available Formats

COURS DE MATHEMATIQUES

Année Universitaire : 2006-2007

1 L’espace de probabilité (Ω, F, P ) 5

2 Probabilités conditionnelles et indépendance 18

3 Les variables aléatoires 29

4 Espérance et variance d’une variable aléatoire réelle 50

5 Variables aléatoires vectorielles 70

7 Introduction aux statistiques 85

8 Examens corrigés des années universitaires 2005-2007 96

L’espace de probabilité (Ω, F, P )

Notation On note P(Ω) l’ensemble de toutes les parties de Ω.

Notation vocabulaire ensemblite vocabulaire probabiliste

♣Exercice : Vérifier que P(Ω) et {∅, Ω} sont des tribus sur Ω.

♣♣ Exercice : Soit Ω un ensemble, et A et B deux parties de Ω. on pose

Remarque : Une tribu est stable par réunion et intersection finie.

1.5 Le concept de probabilité

Le triplet (Ω, F, P ) est alors appelé un espace de probabilité.

iii) si A est dans F, alors P (Ac )

La série dans le membre de droite ne converge alors que si P (∅) = 0.

ii) On applique le ii) de la définition à la famille d’événements disjoints (A1 , A2 , . . . , An , ∅, ∅, . . .)

iii) On applique ii) à famille d’événements disjoints (A, Ac ) : P (A) + P (Ac ) = P (A ∪

on vérifie alors (exercice) que

1.6 Définition d’une probabilité sur un espace Ω fini.

Théorème 1.8. Soit Ω = {ω1 , ω2 , ..., ωn }. Soit p1 , p2 , ..., pn n nombres réels.

P est alors unique, et on a pour tout événement A ∈ P(Ω)

Donc P est uniquement déterminée par la donnée des pi .

Soit P l’application définie sur P(Ω) par :

Montrons que P est une probabilité sur (Ω, P(Ω)).

Donc P est une application de P(Ω) dans [0, 1].

Si A et B sont deux événements disjoints, on a :

Remarque : L’univers Ω est nécéssairement fini. En effet, si Ω est infini, on a

avec α = pi . La série de terme général

Le calcul de la probabilité d’un événement A se ramène donc à un problème de dénombrement,

1.6.2 Eléments d’analyse combinatoire

2- les suites de p éléments distincts : Elles correspondent à un tirage successif et

1.6.3 Exemples fondamentaux

Le nombre de résultats possibles est

2. L’univers Ω : Il peut être soit

3. La probabilité P : C’est une fonction définie sur les sous-ensembles

P (A ∪ B) = P (A) + P (B) − P (A ∩ B).

A= “ la première boule est blanche ”

D= “ toutes les boules sont blanches ”,

Exercice 3. On lance 3 dés équilibrés. Quelle est la probabilité d’obtenir :

A = “ les trois poissons pêchés sont de la même couleur”,

Montrer que P est une probabilité sur (Ω, B)

Déterminer F pour que P soit une probabilité sur (Ω, P(Ω))

Exercice 9. On fait remplir un questionnaire à 20 questions binaires. Quelle est la proba-

Soit B ∈ A. Montrer que :

1) Montrer que BΓ est constituée de ∅ , Ω et de toutes les réunions d’éléments de Γ.

2) Montrer que si F1 et F2 sont deux tribus sur Ω, alors il en est de même de F = F1 ∩ F2 .

où σ(F) est la tribu engendrée par les ensembles fermés de Rd .

2.2 Probabilité conditionnelle

Remaraque : Toutes les probabilités écrites ont un sens car :

P (A) = P (B1 )PB1 (B2 )PB1 ∩B2 (B3 ).

Théorème 2.4. (Principe des probabilités totales)

Remarque : Quand n = 2, on obtient en particulier :

P (A) = PB (A)P (B) + PB c (A)P (B c ).

P (N2 ) = P (B1 )PB1 (N2 ) + P (N1 )PN1 (N2 )

♣ Exercice : Une entreprise utilise trois machines différentes A, B, et C pour fabriquer

P (D) = PA (D)P (A) + PB (D)P (B) + PC (D)P (C)

2) D’après le théorème de Bayes,

2.3 Indépendance d’événements et de sous-tribus.

P (Ai ∩ Aj ) = P (Ai )P (Aj ), ∀i 6= j.