You are on page 1of 448

17 nalyse

J numrique
pour ingnieurs
Andr Fortin
EDITIONS DE L ECOLE DE MONTREAL
A vaut-propos
Ce manuel reflte mon exprience comme professeur et comme coordon-
nateur du wurs d'analyse numrique 215 offert aux tudiants de l'cole
Polytechnique de MontraL Chaque anne, environ 500 tudiants suivent ce
cours qui propc un survol des principales mthodes numriques lmen-
tai res et couvre plus particulirement les sujets sui\-ants;
analyse d'erreurs;
racines d'une quation algbrique;
systmes d'quations linaires et non linaires;
interpola tion, diffrentiation et intgration numriques;
quations diffrentielles ordinaires.
La premire tche du coordonnateur consiste trou\er un livre qui convienne
parfaitement la mat ire fixe par les exigences du programme d'eJJscigne-
mcnt. On trouve sur le march de nombreux livres qui trai tent de l'analyse
numrique. Cette branche des mathmatiques appliques conn ait en effet un
essor considrable depuis plusieurs annes et peu prs toutes les facults de
gnie offrent au moins un COilTS d'introduction l'analyse numrique, ~ u v
trs souvent d'un second cours plus avanc. On peut mettre la main sur
nombre de bons manuels conus aux tats- Unis et donc publis en anglais.
Du ct qubcois, comme on peut s'y attendre, la product ion est mince en
raison de l'troitesse du march. Enfin, les ouvrages en provenance d'Europe
ne conviennent pas nos besoins en raison de leur contenu mathmatique
t rop avanc.
Cet tat de fa.i t m'aconduit tenter l'exprience de rassembler mes not es
de cours et de publier ce manuel. Le lecteur y trouvera une introduction
l'analyse numrique lmentaire motive pa.r les applications en ingnierie.
VI Avant-propos
n m'a paru intressant d'aborder du mme coup un domaine en pleine ex-
pansion que j'ai eu l'occasion d'explorer pendant mes actiVits de recherche,
savoir les systmes dynamiques. ll ne s'agit ici que d'illustrer la contribu-
tiOn des mthodes numriques au dveloppement de ce champ d'activits.
J'attire tout au plus l'attentiOn sur quelques comportements des systmes
dynamiques qui peuvent tre observs l'aide de mthodes numriques l-
mentaires.
L'approche pdagogique de ce manuel repose sur une comprhension pro-
fonde des mthodes plutt que sur l'aspect calculatoire. Cela signifie que les
exemples choisis cherchent avant tout illustrer diffrents aspects des m-
thodes et souligner leurs avantages et leurs inconvnients. Cette approche
est justifie en partie par le fait que de plus en plus d'ingnieurs utilisent des
outils logiciels commerciaux. L'objectif de ce manuel est donc de faire des
tudiants des utilisateurs intelligents, en ce sens qu'ils sauront exactement
quoi s'attendre de chaque mthode et qu'ils seront en mesure de valider
leurs rsultats.
En terminant, j'aimerais remercier toutes les personnes qui ont contribu
la rahsatwn de ce manuel. En particulier, Mme Carole Burney-Vincent et
M. Gilles Savard du dpartement de mathmatiques et de gnie industriel ont
patiemment lu et comment plusieurs chapitres. M. Robert Roy a accept de
se servir d'une version prliminaire pour le cours d'analyse numrique donn
pendant l't de 1994; ses remarques et ses suggestiOns ont t trs utiles. J'a1
galement pu compter sur la collaboration de toute l'quipe professorale du
cours d'analyse numrique. ll me faut galement souligner la participation
du Serv1ce Pdagogique de l'cole Polytechnique de Montral.
Enfin, je ne peux passer sous silence l'appui inconditionnel de mon pouse
Marie et de mes fils Michel et Jean-Philippe qui ont d, entre autres choses,
subir mes absences frquentes lors de la rdaction et de la mise en pages
finale de cet ouvrage. Je tiens de plus souhgner que la page couverture de
ce manuel est inspire des dessins de Michel et Jean-Philippe.
Veuillez tous trouver in l'expression de ma plus profonde reconnaissance.
Table des matires
1 Analyse d'erreurs
1.1 Introduction ..
1
1
1.2 Erreurs de modlisation . . . . . . . . . 5
1.3 Reprsentation des nombres sur ordinateur 9
1.3.1 Reprsentation des entiers signs 9
1.3.2 Reprsentation des nombres rels 13
1.4 Erreurs dues la reprsentation 18
1.5 Arithmtique flottante . . . . 23
1.5.1 Oprations lmentaires 24
1.5.2 Oprations risques . . . . 27
1.5.3 valuation des polynmes 32
1.6 Erreurs de troncature . . . . . 33
1.6.1 Dveloppement de Taylor en une variable 34
1.6.2 Dveloppement de Taylor en plusieurs variables 41
1.6.3 Propagation d'erreurs dans le cas gnral 43
1.7 Exercices
2 quations non linaires
2.1 Introduction . . . . .
2.2 Mthode de la bissection .
2.3 Mthodes des points fixes
2.3.1 Convergence de la mthode des points fixes
2.3.2 Interprtation gomtrique
2.3.3 Extrapolation d'Aitken
2.4 Mthode de Newton .....
2.4.1 Interprtation gomtrique
2.4.2 Analyse de convergence
2.4.3 Cas des racines multiples
47
53
53
54
61
64
70
72
75
77
78
80
VIII
Table des matires
2.5 Mthode de la scante . . . . . . . . . .
2.6 Applications ............... .
2.7
2.6.1 Modes de vibration d'une poutre
2.6.2 Premier modle de viscosit
Exercices
3 Systmes d'quations algbriques
3.1 Introduction ........... .
3.2 Systmes linaires . . . . . . . .
3.3 Oprations lmentaires sur les lignes .
3.3.1 Multiplication d'une ligne par un scalaire
3.3.2 Permutation de deux lignes
3.3.3 >..lj) .
3.4 limination de Gauss . . . . . .
3.5 Dcomposition LU . . . . . . .
3.5.1 Principe de la mthode
3.5.2 Dcomposition de Crout
3.5.3 Dcomposition LU et permutation de lignes
3.5.4 Calcul de la matrice inverse A-
1
3.6 Effets de l'arithmtique flottante . . . . . .
3.7 Conditionnement d'une matrice ...... .
3.7.1 Bornes d'erreurs et conditionnement
3.8 Systmes non linaires . . . . . . . . . . .
3.9 Applications . . . . . . . . . . . . . . . . .
3.9.1 Calcul des tensions dans une ferme
3.9.2 Deuxime modle de viscosit
3.10 Exercices
4 Systmes dynamiques discrets
4.1 Introduction ......... .
4.2 Application quadratique . . .
4.3 Mthodes de points fixes: cas complexe .
4.4 Mthodes de points fixes en dimension n
4.4.1 Attracteur d'Hnon ....... .
4.5 Mthodes itratives pour les systmes linaires
4.5.1 Mthode de Jacobi ....
4.5.2 Mthode de Gauss-Seidel
4.6 Exercices
85
88
88
91
95
101
101
102
107
109
110
111
113
118
118
119
127
132
135
142
150
155
162
162
166
169
177
177
177
188
192
201
205
207
214
218
Table des matires
5 Interpolation
5.1 Introduction .
5.2 Matrice de Vandermonde
5.3 Interpolation de Lagrange
5.4 Polynme de Newton .
5.5 Erreur d'interpolation
5.6 Splines cubiques
5. 7 Krigeage . . . . . . . .
5.7.1 Effet ppite ..
5. 7.2 Courbes paramtres .
5. 7.3 Cas multidimensionnel
5.8 Application: courbe des puissances classes
5.9 Exercices ................. .
6 Diffrentiation et intgration numriques
6.1 Introduction ....... .
IX
221
221
223
224
230
240
251
262
273
277
282
284
287
293
293
6.2 Diffrentiation numrique . . . . 294
6.2.1 Drives d'ordre 1 . . . . 294
6.2.2 Drives d'ordre suprieur 301
6.3 Extrapolation de Richardson . . 306
6.4 Intgration numrique . . . . . . . 309
6.4.1 Formules de Newton-Cotes simples et composes 310
6.4.2 Mthode de Romberg . . . . . 327
6.4.3 Quadratures de Gauss . . . . . 331
6.4.4 Intgration l'aide des splines 340
6.5 Applications . . . . . . . . . . . . . . . 343
6.5.1 Courbe des puissances classes 343
6.5.2 Puissance lectrique d'un ordinateur 344
6.6 Exercices ...... .
7 quations diffrentielles
7.1 Introduction .... .
7.2 Mthode d'Euler .. .
7.3 Mthodes de Taylor
7.4 Mthodes de Runge-Kutta .
7.4.1 Mthodes de Runge-Kutta d'ordre 2
7.4.2 Mthode de Runge-Kutta d'ordre 4.
7.5 Mthodes pas multiples .....
7.6 Systmes d'quations diffrentielles .....
346
351
351
355
361
368
368
372
376
385
x
7.7 quations d'ordre suprieur
7.8 Mthode de tir . . . . . . .
7.9 Mthodes des diffrences finies
7.10 Applications .......... .
7.10.1 Problme du pendule ..
7.10.2 Systmes de masses et de ressorts.
7.10.3 Attracteur trange de Lorenz
7.11 Exercices ............ .
Rponses aux exercices du chapitre 1 .
Rponses aux exercices du chapitre 2 .
Rponses aux exercices du chapitre 3 .
Rponses aux exercices du chapitre 4 .
Rponses aux exercices du chapitre 5 .
Rponses aux exercices du chapitre 6 .
Rponses aux exercices du chapitre 7 .
Table des matires
388
391
400
403
403
406
410
415
419
422
424
429
431
436
438
Chapitre 1
Analyse d'erreurs
1.1 Introduction
Les cours traditionnels de mathmatiques nous familiarisent avec des
thories et des mthodes qui permettent de rsoudre de faon analytique
un certain nombre de problmes. C'est le cas notamment des techniques
d'intgration et de rsolution d'quations algbriques ou diffrentielles. Bien
qu'on puisse proposer plusieurs mthodes pour rsoudre un problme donn,
celles-ci conduisent un mme rsultat, prcis et unique.
C'est ici que l'analyse numrique se distingue des autres champs plus
classiques des mathmatiques. En effet, pour un problme donn, il est pos-
sible d'utiliser plusieurs techniques de rsolution qui rsultent en diffrents
algorithmes. Ces algorithmes dpendent de certains paramtres qui influent
sur la prcision du rsultat. De plus, on utilise en cours de calcul des ap-
proximations plus ou moins prcises. Par exemple, on peut remplacer une
drive par une diffrence finie de faon transformer une quation diffren-
tielle en une quation algbrique. Le rsultat final et son degr de prcision
dpendent des choix que l'on fait.
Une partie importante de l'analyse numrique consiste donc contenir
les effets des erreurs ainsi introduites, qui proviennent de trois sources prin-
cipales:
les erreurs de modlisation;
les erreurs de reprsentation sur ordinateur;
les erreurs de troncature.
2 Chapitre 1
Les erreurs de modlisation, comme leur nom l'indique, proviennent de
l'tape de mathmatisation du phnomne physique auquel on s'intresse.
Cette tape consiste faire ressortir les causes les plus dterminantes du
phnomne observ et les mettre sous forme d'quations (diffrentielles le
plus souvent). Si le phnomne observ est trs complexe, il faut simplifier
et ngliger ses composantes qui paraissent moins importantes ou qui rendent
la rsolution numrique trop difficile. C'est ce que l'on appelle les erreurs de
modlisation.
La seconde catgorie d'erreurs est lie l'utilisation de l'ordinateur. En
effet, la reprsentation sur ordinateur (gnralement binaire) des nombres
introduit souvent des erreurs. Mme infimes au dpart, ces erreurs peu-
vent s'accumuler lorsqu'on effectue un trs grand nombre d'oprations. Par
exemple, la fraction 1/3 n'a pas de reprsentation binaire exacte, car elle ne
possde pas de reprsentation dcimale finie. Ces erreurs se propagent au fil
des calculs et peuvent compromettre la prcision des rsultats.
Enfin, les erreurs de troncature proviennent principalement de l'utilisa-
tion du dveloppement de Taylor, qui permet par exemple de remplacer
une quation diffrentielle par une quation algbrique. Le dveloppement
de Taylor est le principal outil mathmatique du numricien. ll est donc
primordial d'en matriser l'nonc et ses consquences.
Ce chapitre traite donc principalement d'erreurs numriques, et non des
invitables erreurs de programmation qui font, hlas, partie du quotidien
du numricien. Il devrait permettre au lecteur de mieux grer les erreurs au
sein des processus numriques afin d'tre en mesure de mieux interprter les
rsultats.
Tout d'abord, un peu de terminologie est ncessaire pour ventuellement
quantifier les erreurs.
Dfinition 1.1
Soit x, un nombre, et x*, une approximation de ce nombre. L'erreur
absolue est dfinie par:
~ x = l x - x l (1.1)
Analyse d'erreurs
Dfinition 1.2
Soit x, un nombre, et x*, une approximation de ce nombre. L'erreur
relative est dfinie par:
E ( ) = lx- x*l = l ~ x l
r x lxi Jxl
(1.2)
De plus, en multipliant par 100%, on obtient l'erreur relative en pour-
centage.
3
En pratique, il est difficile d'valuer les erreurs absolue et relative, car on
ne connat gnralement pas la valeur exacte de x et on n'a que x*. Dans le
cas de quantits mesures dont on ne connat que la valeur approximative,
il est impossible de calculer l'erreur absolue; on dispose en revanche d'une
borne suprieure pour cette erreur qui dpend de la prcision des instruments
de mesure utiliss. Cette borne est quand mme appele erreur absolue, alors
qu'en fait on a:
lx- x*l ~ ~ x
ce qui peut galement s'crire:
x* - ~ x ~ x ~ x* + x (1.3)
et que l'on note parfois x = x* x On peut interprter ce rsultat en disant
que l'on a estim la valeur exacte x partir de x* avec une incertitude de
~ x de part et d'autre.
L'erreur absolue donne une mesure quantitative de l'erreur commise et
l'erreur relative en mesure l'importance. Par exemple, si on fait usage d'un
chronomtre dont la prcision est de l'ordre du dixime de seconde, l'erreur
absolue est borne par 0,1 s. Mais est-ce une erreur importante? Dans le
contexte d'un marathon d'une dure de 2 h 20 min, l'erreur relative lie au
chronomtrage est trs faible:
0
'
1
= 0 000 0119
2 x 60 x 60 + 20 x 60 '
et ne devrait pas avoir de consquence sur le classement des coureurs. Par
contre, s'il s'agit d'une course de 100 m d'une dure d'environ 10 s, l'erreur
relative est beaucoup plus importante:
0,1
10 0 = 0,01
'
4 Chapitre 1
soit 1% du temps de course. Avec une telle erreur, on ne pourra vraisem-
blablement pas faire la diffrence entre le premier et le dernier coureur.
Cela nous amne parler de prcision et de chiffres significatifs au sens
de la dfinition suivante.
Dfinition 1.3
Si l'erreur absolue vrifie
alors le chiffre correspondant la me puissance de 10 est dit significatif
et tous ceux sa gauche (correspondant aux puissances de 10 suprieures
m) le sont aussi.
Exemple 1.1
On obtient une approximation de 1r (x= 1r) au moyen de la quantit 22/7
(x*= 22/7 = 3,142 857 ). On en conclut que:
22
~ x l1r- 71 = 0,00126
Puisque l'erreur absolue est plus petite que 0,5 x 10-
2
, le chiffre des cen-
times est significatif et on a en tout 3 chiffres significatifs (3,14) .

Exemple 1.2
Si on retient 3,1416 comme approximation de 1r, on a:
~ x l1r- 3,14161 ~ 0,73 x 10-
5
et l'erreur absolue est infrieure 0,5 x 10-
4
. Le chiffre correspondant cette
puissance de 10 ( 6) est significatif au sens de la dfinition, ainsi que tous les
chiffres situs sa gauche. ll est remarquer que le chiffre 6 dans 3,1416 est
significatif mme si la quatrime dcimale de 1r est un 5 (3,14159 ).
Analyse d'erreurs 5
L'approximation 3,1416 possde donc 5 chiffres significatifs .

Remarque 1.1
Inversement, si un nombre est donn avec n chiffres significatifs, cela signifie
que l'erreur absolue est infrieure 0,5 fois la puissance de 10 correspondant
au dernier chiffre significatif. 0
Exemple 1.3
On a mesur le poids d'une personne et trouv 90,567 kg. On vous assure
que l'appareil utilis est suffisamment prcis pour que tous les chiffres fournis
soient significatifs. D'aprs la dfinition, puisque le dernier chiffre significatif
correspond aux millimes (milligrammes), cela signifie que:
~ x :=:; 0,5 x 10-
3
kg
En pratique, on conclut que:
~ x 0,5 x 10-
3
kg

1.2 Erreurs de modlisation
La premire tape de la rsolution d'un problme, et peut-tre la plus dli-
cate, consiste modliser le phnomne observ. n s'agit en gros d'identifier
tous les facteurs internes et externes qui influent (ou que l'on souponne
d'influer) sur les rsultats. Dans le cas d'un phnomne physique, on fait
l'inventaire des forces en prsence: gravitationnelle, de friction, lectrique,
etc. On a par la suite recours aux lois de conservation de la masse, de l'ner-
gie, de la quantit de mouvement et d'autres principes mathmatiques pour
traduire l'influence de ces diffrents facteurs sous forme d'quations. Le plus
souvent, on obtient des quations diffrentielles ou aux drives partielles.
L'effort de modlisation produit en gnral des systmes d'quations com-
plexes qui comprennent un grand nombre de variables inconnues. Pour rus-
sir les rsoudre, il faut simplifier certaines composantes et ngliger les moins
importantes. On fait alors une premire erreur de modlisation.
6
Chapitre 1
m
Figure 1.1: Problme du pendule
De plus, mme bien dcompos, un phnomne physique peut tre difficile
mettre sous forme d'quations. On introduit alors un modle qui dcrit au
mieux son influence, mais qui demeure une approximation de la ralit. On
commet alors une deuxime erreur de modlisation. illustrons cette dmarche
l'aide d'un exemple.
Exemple 1.4
Le problme du pendule est connu depuis trs longtemps (voir par exemple
Simmons, rf. (20]). Une masse m est suspendue une corde de longueur
l (voir la figure 1.1). Au temps t = 0, on suppose que l'angle 0(0) entre la
corde et la verticale est 0
0
et que sa vitesse angulaire 0'(0) est 0 ~ Les forces
en prsence sont la gravit agissant sur la masse et la corde, d'une part, et
la friction de l'air agissant sur tout le systme, d'autre part.
Suivant la deuxime loi de Newton, la force due l'acclration tangen-
tielle mlO"(t) est quilibre par la composante tangentielle de l'acclration
gravitationnelle mg sin(O(t)) et par la force de friction Ff qui s'oppose au
mouvement. On a alors:
mlO"(t) = -mgsin(O(t))- FJ
Analyse d'erreurs 7
Pour connatre comment se comporte la force de friction Ff en fonction de
O(t), il faut recourir des mesures exprimentales, qui dmontrent que la
friction est peu prs proportionnelle la vitesse ZO'(t) avec un coefficient
de proportionnalit Cf. ll est important de remarquer que cette loi est ap-
proximative et que le coefficient Cf est obtenu avec une prcision limite.
Tout cela entrane des erreurs de modlisation.
On obtient une quation diffrentielle du second ordre:
O"(t)
0(0)
O'(O)
Oo
O'
0
c10'(t) gsin(O(t))
m l
(1.4)
(1.5)
(1.6)
L'quation diffrentielle 1.4 est non linaire et on dmontre qu'elle ne possde
pas de solution analytique simple.
Une brve analyse montre qu'il est raisonnable de ngliger la friction
de l'air, car les vitesses de mouvement sont faibles. ll s'agit encore d'une
erreur de modlisation, qui parat acceptable cette tape de l'analyse. Si
les rsultats s'avrent insatisfaisants, il faudra revenir en arrire et identifier,
parmi les forces ngliges, celle qui tait la plus importante. Une analyse
adimensionnelle est souvent ncessaire pour y arriver.
Mme en ngligeant la friction, ce qui revient poser Cf = 0, l'quation
rsultante ne possde toujours pas de solution simple. En effet, sa rsolution
fait intervenir les intgrales elliptiques (Simmons, rf. [20]) qui ne peuvent
s'exprimer en fonctions lmentaires. Puisque tel est le but, on doit encore
simplifier le problme. On peut par exemple supposer que les angles sont
petits et que:
sin( 0( t)) ~ 0( t)
n en rsulte le problme simplifi suivant:
O"(t)
0(0)
O'(O)
g O(t)
---
Oo
O'
0
l
L'quation 1.7 possde la solution priodique classique:
O(t) = Acos(wt) + B sin(wt)
(1.7)
(1.8)
(1.9)
(1.10)
o w
2
= gjl et les constantes A et B sont dtermines par les conditions
initiales (A= 0
0
, B = ~ / w .
8 Chapitre 1
0,10
0,08
0,06
e(tJ
0,04
0,02
0
....
-- --- ---
-0,02
-0,04
-0,06
-0,08
10 15 20
Temps (s)
Friction non nglige
0,10
0,08
(\
r
1\
~
(\
1\
9(t)
0,06
0,04
0,02
0
--- --
...... ....
-0,02
-0,04
-0,06
-0,08
-0,10
v v v v
0 10 15 20
Temps (s)
Friction nglige
Figure 1.2: Deux solutions au problme du pendule
La figure 1.2 permet la comparaison entre les solutions des quations
diffrentielles 1.4 et 1.7 dans le cas o 0
0
= 0,1 et 0 ~ = O. L'quation 1.10
est la solution analytique de l'quation diffrentielle 1.7, alors que l'quation
diffrentielle 1.4 ne possde qu'une solution numrique (nous la reverrons au
chapitre 7). On remarque immdiatement que la solution numrique (o la
friction n'est pas nglige) prvoit l'amortissement du mouvement avec le
temps, tandis que la solution analytique reste parfaitement priodique. La
solution numrique est de toute vidence plus prs de ce que l'on observe
pour un pendule.

Analyse d'erreurs 9
Remarque 1.2
Les erreurs de modlisation, quoique trs importantes, ne font pas partie de
la matire de ce livre. Nous faisons l'hypothse que les problmes tudis
sont bien modliss, bien que ce ne soit pas toujours le cas en pratique. 0
1.3 Reprsentation des nombres sur ordinateur
Un ordinateur ne peut traiter les nombres de la mme manire que l'tre
humain. n doit d'abord les reprsenter dans un systme qui permette l'ex-
cution efficace des diverses oprations. Cela peut entraner des erreurs de
reprsentation sur ordinateur, qui sont invitables et dont il est souhaitable
de comprendre l'origine afin de mieux en matriser les effets. Cette section
prsente les principaux lments d'un modle de reprsentation des nombres
sur ordinateur. Ce modle s'avre utile pour comprendre le fonctionnement
type des ordinateurs; il ne peut bien entendu tenir compte des caractris-
tiques sans cesse changeantes des ordinateurs modernes.
La structure interne de la plupart des ordinateurs s'appuie sur le systme
binaire. L'unit d'information ou bit prend la valeur 0 ou 1. videmment, trs
peu d'information peut tre accumule au moyen d'un seul bit. On regroupe
alors les bits en mots de longueur variable (les longueurs de 8, de 16, de 32
ou de 64 bits sont les plus courantes). Les nombres, entiers et rels, sont
reprsents de cette manire, bien que leur mode prcis de reprsentation
dpende du fabricant.
1.3.1 Reprsentation des entiers signs
Nous traitons de trois formes parmi les plus courantes de reprsentation
des entiers sur ordinateur. Plusieurs autres variantes existent, et il importe de
connatre celle qui est utilise par l'ordinateur afin de pouvoir s'y retrouver.
Pour transformer un entier positif N dans sa reprsentation binaire habi-
tuelle, il faut dterminer les ai tels que:
ou encore
10 Chapitre 1
11
1
11
1
1
1
1
1
111
1
11
1
111
1
1 olol
Figure 1.3: Reprsentation signe et grandeur sur 16 bits d'un entier
Dans ce qui prcde, le sous-indice indique la base utilise. On obtient la
valeur des ai en suivant la dmarche suivante: en divisant N par 2, on obtient
a
0
(le reste de la division) plus un entier; on refait le mme raisonnement
avec la partie entire de N /2 (en ngligeant la partie fractionnaire ou reste)
pour obtenir a
1
; on continue ainsi jusqu' ce que la partie entire soit nulle.
Exemple 1.5
Si N = (1000)10, on a:
1000/2 500 reste 0 c.--d.
ao = 0
500/2 250 reste 0 c.--d.
a1 = 0
250/2 125 reste 0 c.--d.
a2 = 0
125/2 62 reste 1 c.--d. a3 = 1
62/2
31 reste 0 c.--d. a4 = 0
31/2 15 reste 1 c.--d. a
5
= 1
15/2 7 reste 1 c.--d.
as= 1
7/2 3 reste 1 c.--d. a7 = 1
3/2
1 reste 1 c.--d. a
8
= 1
1/2 0 reste 1 c.--d.
lZ9 = 1
Ainsi, l'entier dcimal 1000 s'crit 111110 1000 en base 2 .

Voyons maintenant quelques variantes de reprsentation binaire des en-
tiers signs: la reprsentation signe et grandeur, la reprsentation en
complment 2 et la reprsentation par excs. Ces variantes prsentent
toutes un certain nombre d'avantages et d'inconvnients au regard de l'ex-
cution des oprations arithmtiques lmentaires.
Reprsentation signe et grandeur
Pour illustrer la reprsentation signe et grandeur, il suffit de prendre un
exemple. Considrons un mot de 16 bits tel qu'illustr la figure 1.3. Dans
Analyse d'erreurs
cette reprsentation, un bit (le premier) est consacr au signe:
0 pour un entier positif
1 pour un entier ngatif
11
Les autres bits peuvent alors servir la reprsentation de l'entier lui-mme.
Ainsi:
01011100 1010 0100 =
+ ( 1 x 2
14
+ 0 x 2
13
+ 1 x 2
12
+ ... + 1 x 2
2
+ 0 x 2
1
+ 0 x 2)
est la reprsentation binaire du nombre dcimal 23 716. Le premier bit (0)
indique un entier positif. Le plus grand entier reprsentable dans ce cas est
bien sr 0111111111111111 qui reprsente 32 767, c'est--dire 2
15
- 1 en
base 10. ll est remarquer que le nombre 0 peut tre reprsent de deux
faons, savoir:
+0 = 0000 0000 0000 0000
-0 = 1000 0000 0000 0000
Un mot de 16 bits permet d'exprimer tous les entiers compris entre -32 767
et +32 767. Si un calcul sur des nombres entiers rsulte en un entier su-
prieur 32 767, le compilateur enverra un message d'erreur indiquant un
dbordement ( overftow).
Remarque 1.3
Dans la reprsentation signe et grandeur et galement dans les reprsenta-
tions qui suivent, nous utilisons la convention que le premier bit est celui
situ le plus gauche. En informatique, on utilise plus souvent une numro-
tation des bits allant de 0 jusqu' n- 1 en commenant par le bit le plus
droite dit le moins significatif. D
Reprsentation en complment 2
La reprsentation en complment 2 est trs frquemment utilise. Si on
dispose de n bits pour exprimer l'entier N, on pose:
ll faut remarquer le signe ngatif devant le terme an-l On constate facile-
ment que tous les entiers positifs vrifient:
12 Chapitre 1
Les entiers positifs sont donc reprsents par 0 suivi de leur expression
binaire habituelle en ( n -1) bits. Pour obtenir la reprsentation d'un nombre
ngatif, il suffit de lui ajouter 2n-l et de transformer le rsultat en forme
binaire.
Exemple 1.6
La reprsentation sur 4 bits de 0101 vaut:
soit 5 en forme dcimale. Par contre, 1101 vaut:
c'est--dire -8 + 5 = -3. Inversement, la reprsentation binaire de -6 sera
1 suivi de la reprsentation sur 3 bits de:
-6 + 2
3
= 2
qui est 010. On aura donc ( -6)
10
= (1010)2 dans la reprsentation en com-
plment 2.

Reprsentation par excs
illustrons la reprsentation par excs en prenant pour exemple un mot de
4 bits ( n = 4 ). On peut alors reprsenter au plus 2
4
(2n dans le cas gnral)
entiers diffrents, y compris les entiers ngatifs. Si on veut exprimer un entier
dcimal N, il suffit de lui ajouter un excs d et de donner le rsultat sous
forme binaire. Inversement, si on a la reprsentation binaire par excs d'un
entier, il suffit de calculer sa valeur en base 10 et de soustraire d pour obtenir
l'entier recherch.
La reprsentation par excs a l'avantage d'ordonner la reprsentation
binaire en assignant 0000 le plus petit entier dcimal reprsentable, savoir
-d. En gnral, la valeur de d est 2n-l (2
3
sur 4 bits). Ainsi, avec 4 bits et
d 2
3
, on obtient:
Analyse d'erreurs 13
Forme binaire Forme dcimale
0000 -8
0001 -7
1110 +6
1111 +7
Pour obtenir ce tableau, il suffit de remarquer que, par exemple, 1111 vaut
15 en dcimal, auquel on soustrait 2
3
pour obtenir 7.
Exemple 1.7
Soit un mot de 8 bits et un excs d = 2
7
= 128. Pour reprsenter ( -100)
10
,
il suffit de lui ajouter 128, ce qui donne 28, et d'exprimer le rsultat sur 8
bits, soit 00011100.

Remarque 1.4
n existe d'autres reprsentations des entiers signs, comme la reprsentation
en complment 1. Notre but n'tant pas d'en donner une liste exhaustive,
nous nous limitons celles qui ont dj t prsentes. D
1.3.2 Reprsentation des nombres rels
La tche de reprsentation est plus complexe dans le cas des nombres rels.
En effet, dans le systme dcimal, nous avons l'habitude de reprsenter un
nombre x sous la forme:
x= mx 10
1
o m est la mantisse, l est l'exposant et 10 est la base. De faon gnrale,
selon une base b quelconque, on peut crire:
La forme gnrale de la mantisse est la suivante:
14
ce qui signifie que:
m = d1 X b-
1
+ d2 X b-
2
+ d3 X b-
3
+ + dn X b-n
o n est le nombre de chiffres de la mantisse. Les di vrifient:
:S:(b-1)
:S:(b-1) pour i=2,3,,n
Chapitre 1
(1.11)
(1.12)
La premire ingalit signifie que la mantisse est normalise, c'est--dire
que son premier chiffre est toujours diffrent de O. La normalisation permet
d'assurer l'unicit de la reprsentation et d'viter les ambiguts entre:
0,1020 X 10
2
et 0,0102 x 10
3
pour reprsenter 10,2. La dernire expression n'est jamais retenue. Dans cet
exemple, on a utilis la base b = 10 et n = 4 chiffres dans la mantisse. Ainsi,
la mantisse satisfait toujours:
1
- < m < 1
b-
car la plus petite mantisse possible est 0,1000, qui vaut 1/b.
Ces considrations servent de lignes directrices pour la reprsentation
d'un nombre rel sur ordinateur. Dans le cas qui nous intresse, la base
sera gnralement 2 (b = 2). li faut donc trouver un moyen de reprsenter la
mantisse (une fraction), l'exposant (un entier sign) et le signe de ce nombre.
Remarque 1.5
Les calculatrices de poche se distinguent des ordinateurs principalement par
le fait qu'elles utilisent la base 10 (b = 10) et une mantisse d'une longueur
d'environ 10 ( n = 10). L'exposant l varie gnralement entre -100 et 100.0
Considrons titre d'exemple un mot de 8 bits tel que l'illustre la fi-
gure 1.4. li est entendu qu'en pratique les mots sont beaucoup plus grands.
Le premier bit donne le signe du nombre. Il reste donc 7 bits pour reprsen-
ter la mantisse et l'exposant. On retient 3 bits pour l'exposant et les 4 bits
suivants pour la mantisse. Il est noter que cette dernire est normalise et
que son premier bit est toujours 1. Il faut ensuite dterminer quelle est la re-
prsentation utilise pour l'exposant. Par exemple, si l'exposant est exprim
suivant la reprsentation signe et grandeur, alors 01011011 se dcompose de
la faon suivante:
Analyse d'erreurs 15
0 1 0 1 1 0 1
1
1
1
+
21 20
'
2-1 2-2 2-3 2-4
Exposant Mantisse
Figure 1.4: Reprsentation signe et grandeur sur 8 bits d'un rel
Exposant
101
Ce nombre est donc positif. L'exposant est ngatif et vaut:
et la mantisse est:
1 x T
1
+ 0 x T
2
+ 1 x T
3
+ 1 x 2-
4
= 0,6875
Ainsi, 0101 1011 reprsente le nombre dcimal:
0,6875 x 2-
1
= 0,343 75
Par contre, si l'exposant est exprim suivant la reprsentation en compl-
ment 2, la valeur binaire 101 qui reprsente l'exposant signifie alors -3 et
(01011011)2 vaut 0,085 9375 en base 10.
Conversion d'une fraction dcimale en valeur binaire
La mthode de conversion d'une fraction dcimale en valeur binaire est
similaire celle que l'on utilise dans le cas des entiers. Soit J, une fraction
dcimale comprise entre 0 et 1. n faut donc trouver les di tels que:
ou encore
f = d1 x T
1
+ d2 x T
2
+ d3 x 2-
3
+
Si on multiplie f par 2, on obtient d1 plus une fraction. En appliquant
le mme raisonnement (2f- di), on obtient d
2
On poursuit ainsi jusqu'
ce que la partie fractionnaire soit nulle ou que l'on ait atteint le nombre
maximal de chiffres de la mantisse.
16
Exemple 1.8
Si f = 0,0625, on a:
0,0625 x 2
0,1250 x 2
0,2500 x 2
0,5000 x 2
0,1250 c.--d.
0,2500 c.--d.
0,5000 c.--d.
1,0000 c.--d.
ce qui signifie que (0,0625)
10
= (0,0001)2 .
Exemple 1.9
Si f = 1/3, on a:
1/3 x 2
2/3 x 2
1/3 x 2
2/3 x 2

0 + 2/3 c.--d.
1 + 1/3 c.--d.
0 + 2/3 c.--d.
1 + 1/3 c.--d.
dl= 0
d2 = 0
d3 = 0
d4 = 1
dl= 0
d2 = 1
d3 = 0
d4 = 1
On peut poursuivre la conversion l'infini et dmontrer que:
1
- = (0,010 101 .. )2
3
Chapitre 1
En pratique, puisqu'on n'utilise qu'un nombre fini de chiffres dans la man-
tisse, il faudra s'arrter aprs n bits .

Norme IEEE
L'Institute for Electrical and Electronic Engineers (IEEE) s'efforce de
rendre aussi uniformes que possible les reprsentations sur ordinateur. ll
propose une reprsentation des nombres rels en simple prcision sur 32 bits
et en double prcision sur 64 bits (convention IEEE-754 ). Les reprsentations
Analyse d'erreurs 17
en simple et double prcision sont construites comme suit. Le premier bit
tmoigne du signe du nombre, les 8 bits suivants (11 en double prcision)
dterminent l'exposant avec un excs de 127 ou 2
8
-
1
- 1 (1023 ou 2
11
-
1
- 1
en double prcision) et les 23 derniers bits (52 en double prcision) sont
pour la mantisse normalise. Puisque l'on normalise la mantisse, le premier
bit est toujours 1 et il n'est pas ncessaire de le garder en mmoire. La
mantisse normalise peut donc commencer par un 0 tout en conservant la
mme prcision qu'avec 24 bits (53 en double prcision).
Ainsi, suivant la notation de Cheney et Kincaid (rf. [5]), les 32 bits de
la reprsentation en simple prcision IEEE:
dsignent le nombre dcimal:
(-1)d
1
x 2(d
2
d
3
d
9
)2 x 2-
127
x (1,d10d11d32h
On remarque immdiatement les diffrentes composantes: le bit de signe,
l'exposant avec un excs de 127 et la mantisse normalise par l'ajout du 1
manquant.
Remarque 1.6
La norme IEEE traite le nombre rel 0 de faon particulire. D
Exemple 1.10
Les 32 bits suivants (en simple prcision IEEE):
1100 00011110 0000 0000 0000 0000 0000
se dcomposent en:
( -1)1 x 2(10000011)2 x 2-127 x (1,11)2
-16 x 1,75 = -28
On obtient la reprsentation du nombre dcimal (30,0625)10 en simple pr-
cision au moyen de l'opration inverse. Tout d'abord, la partie entire (30)10
18 Chapitre 1
devient (11110)2 en forme binaire et la partie fractionnaire (0,0625)10 est
tout simplement (0,0001)2. Ainsi, on a:
(30,0625)10 = (11110,0001)2 = 1,111000 01 x 2
4
Dans la dernire expression, la mantisse est normalise et le bit 1 la gauche
de la virgule n'est pas conserv en mmoire. L'exposant 4 est dcal de
127 pour devenir 131. La reprsentation de 131 sur 8 bits est (1000 0011)2.
Puisque le nombre (30,0625)
10
est positif, sa reprsentation en simple prci-
sion IEEE sera:
0 1000 0011 1110 00010000 0000 0000 000

1.4 Erreurs dues la reprsentation
Le fait d'utiliser un nombre limit de bits pour reprsenter un nombre
rel a des consquences importantes sur la propagation des erreurs. On peut
par exemple rechercher quel est le plus petit nombre positif reprsentable sur
8 bits (voir la figure 1.4 ). En choisissant la reprsentation signe et grandeur
pour l'exposant, on constate que le nombre doit tre positif (0), que son
exposant doit tre ngatif (1), que sa valeur doit tre la plus petite possible
compte tenu du signe (11) et, enfin, que la mantisse doit tre la plus petite
possible compte tenu de la normalisation (1000). On obtient:
qui vaut 0,0625. Consquemment, on ne peut pas reprsenter tout nombre
rel positif plus petit que 0,0625 dans ce systme 8 bits. Un calcul rsultant
en un nombre plus petit que 0,0625 donnerait lieu un sous-dpassement
( underflow).
On peut se demander quel serait le nombre suivant. Il s'agit bien sr de
01111001, dont la valeur dcimale est 0,070 3125. Il n'est donc pas possible
de reprsenter exactement sur 8 bits les nombres entre 0,0625 et 0,070 3125.
Si on cherche par exemple reprsenter le nombre rel 0,07, l'ordinateur
choisira soit 01111000 (c'est--dire (0,0625)10), soit 01111001 (c'est--dire
(0,070 3125)10) Le choix dpend de l'utilisation de la troncature ( chopping),
qui consiste choisir systmatiquement la borne infrieure, ou de l'arrondi
Analyse d'erreurs 19
( rounding), qui consiste choisir la borne infrieure seulement si le nombre
que l'on souhaite reprsenter est plus petit que:
0,0625 + 0,070 3125
2
Par ailleurs, le plus grand nombre reprsentable sur 8 bits est 0011 1111, qui
vaut 7,5. Tout calcul rsultant en un nombre plus grand que 7,5 donnerait
lieu un dbordement.
Cet exemple sur 8 bits exagre grandement les effets de la reprsenta-
tion des nombres rels sur ordinateur. Personne ne songe faire des calculs
numriques avec seulement 8 bits. Si on travaille avec plus de bits, le plus
petit nombre reprsentable devient de plus en plus petit et l'cart entre
les nombres reprsentables diminue galement. Les conclusions qui suivent
restent cependant vraies.
Quel que soit le nombre de bits utiliss, il existe un plus petit et un
plus grand nombre positifs reprsentables (de mme pour les nombres
ngatifs). TI existe donc un intervalle fini l'extrieur duquel on se
heurte invitablement un dbordement ou un sous-dpassement.
l'intrieur de cet intervalle fini, seulement un nombre fini de nombres
sont reprsentables exactement, et on doit recourir la troncature ou
l'arrondi pour reprsenter les autres rels.
La reprsentation en point flottant induit une erreur relative qui d-
pend du nombre de bits de la mantisse, de l'utilisation de la troncature ou
de l'arrondi ainsi que du nombre x que l'on veut reprsenter. En effet, nous
avons vu l'importance sur la prcision du nombre de bits de la mantisse et
nous avons galement constat qu'un nombre fini seulement de rels peuvent
tre reprsents exactement. L'intervalle entre les nombres reprsentables
varie en longueur selon l'exposant devant la mantisse.
Dfinition 1.4
La prcision machine E est la plus grande erreur relative que l'on puisse
commettre en reprsentant un nombre rel sur ordinateur en utilisant la
troncature.
20 Chapitre 1
Remarque 1.7
La prcision machine dpend bien sr de l'appareil utilis et du nombre de
bits de la mantisse. De plus, si on utilise l'arrondi, la prcision machine est
tout simplement E/2.0
Thorme 1.1
La prcision machine vrifie:
(1.13)
o b est la base utilise et n le nombre de bits de la mantisse.
Dmonstration:
Soit x, un nombre quelconque. Sa reprsentation exacte en base b est donc
de la forme:
ce qui entrane que l'erreur absolue commise par troncature est:
< O,(b- 1)(b- 1)(b- 1) X bl-n
en vertu de l'quation 1.12. L'erreur relative satisfait donc:
Er(x) =
~ x
lxi
<
<
<
O,(b- 1)(b- 1)(b- 1) X bl-n
O,d1 d2d3 dndn+l dn+2 X b
1
O,(b-1)(b-1)(b-1) X bl-n
0,100 000 ... x bl
On note alors que b
1
-n est une borne suprieure pour la prcision machine.
Dans ce qui suit, on ne fera plus la distinction entre la prcision machine E
et sa borne suprieure b
1
-n, bien que ces deux quantits soient lgrement
diffrentes. 0
Analyse d'erreurs 21
n est facile de montrer que cette borne est presque atteinte pour tous les
nombres x de dveloppement en base b de la forme:
x = 0,100 000 O(b- 1)(b- 1) .x b
1
(1.14)
c'est--dire dont le 1 est suivi de ( n - 1) zros et ensuite d'une infinit de
chiffres valant (b-1). L'erreur relative est alors:
O,(b- 1)(b- 1) X b
1
-n
Er(x) = 1
0,100 000 O(b- 1)(b- 1) x b
qui est trs prs de b
1
-n.
Exemple 1.11
Suivant la norme IEEE, la mantisse d'un rel contient 23 bits en simple
prcision (52 bits en double prcision), mais avec une prcision de 24 bits
(53 en double prcision) puisque, aprs la normalisation, le premier 1 n'est
pas gard en mmoire. La prcision machine vaut alors:
2
1
-
24
= 0,119 x 10-
6
en simple prcision et
2
1
-
53
= 0,222 x 10-
15
en double prcision.

Ce rsultat peut tre vrifi directement sur ordinateur au moyen de l'al-
gorithme qui suit (voir Chapra et Canale, rf. [4]). Cet algorithme permet de
construire une suite de nombres de forme similaire celle de l'quation 1.14.
Algorithme 1.1: Prcision machine
1. E = 1
2. Lorsque 1 + E > 1, effectuer E = t:/2
3. E = 2 x E et arrt
4. Prcision machine = E D
22 Chapitre 1
Dans l'algorithme prcdent, le nombre (1 + E) prend successivement les
valeurs suivantes:
Forme dcimale Forme binaire
2 0,1 x 2-.:
1,5 0,11 x 2
1
1,25 0,101 x 2
1
1,125 0,1001 x 2
1
1,0625 0,100 01 x 2
1
Cette suite continue jusqu' ce que le nombre de zros intercals dans la
reprsentation binaire soit trop grand et dpasse la longueur de la mantisse.
On aura alors 1 + E = 1 et l'algorithme s'arrtera. TI est noter que la
reprsentation binaire de 1 + E est de forme similaire celle de la relation 1.14.
Sur un IBM RISC 6000, la concordance entre le rsultat de cet algorithme
et l'quation 1.13 est parfaite.
Terminons cette section par deux exemples illustrant les effets parfois
tonnants de la reprsentation binaire.
Exemple 1.12
Si on convertit la fraction dcimale 0,1 en sa valeur binaire, on a:
0,1 x 2 0,2 c.--d.
dl= 0
0,2 x 2 0,4 c.--d. d2 = 0
0,4 x 2 0,8 c.--d. d3 = 0
0,8 x 2 1,6 c.--d.
d4 1
0,6 x 2 1,2 c.--d. d
5
= 1
0,2 x 2 0,4 c.--d.
d6 = 0
ou encore
(0,1)10 = (0,00011001100)2
Ainsi, une fraction ayant un dveloppement dcimal fini peut avoir un dve-
loppement binaire illimit.

Analyse d'erreurs 23
Lorsqu'on utilise un nombre fini de bits dans la mantisse pour reprsenter
(0,1)10, l'importance de l'erreur commise dpend du nombre de bits utiliss.
Exemple 1.13
Le problme consiste sommer 10 000 fois le nombre (1,0)
10
, qui possde un
dveloppement binaire fini, et le nombre (0,1)
10
, qui n'a pas de reprsentation
exacte sur un nombre fini de bits. On obtient, sur un IBM RISC 6000, les
rsultats suivants:
10 000,000 00 et 999,902 8931
en simple prcision et:
10 000,000 000 000 0000 et 1000,000 014 90116119
en double prcision. Cela dmontre l'effet des erreurs de reprsentation sur
ordinateur. Des oprations en apparence identiques donnent, dans un cas, un
rsultat exact et, dans l'autre, un rsultat erron dont la prcision augmente
avec le nombre de bits de la mantisse .

1.5 Arithmtique flottante
Les erreurs ont tendance se propager et quelques fois s'amplifier au fil
des calculs. Dans cette section, nous suivons l'volution des erreurs au fil des
oprations lmentaires. Afin de simplifier l'expos, nous utilisons le systme
dcimal, mais les effets dcrits valent galement pour les autres bases.
Tout nombre rel x s'crit sous la forme:
Dfinition 1.5
Soit x, un nombre rel. On note fi( x) sa reprsentation en notation flot-
tante n chiffres dfinie par:
24 Chapitre 1
Remarque 1.8
La notation flottante d'un nombre dpend du nombre n de chiffres dans la
mantisse, mais aussi du procd retenu pour liminer les derniers chiffres.
Ainsi, la troncature consiste retrancher les chiffres partir de la position
n + 1. Avec l'arrondi, on ajoute 5 au ( n + 1 )e chiffre de la mantisse avant
d'effectuer la troncature. La troncature est dite biaise, car on a toujours,
pour des nombres positifs, fi( x) x. Par contre, l'arrondi est non biais, car
on a tour tour x fl(x) ou x 2:: fl(x). Nous utilisons l'arrondi dans les
exemples qui suivent. 0
Remarque 1.9
La norme IEEE recommande l'utilisation de l'arrondi dans la reprsentation
binaire des nombres rels. 0
Exemple 1.14
Si on choisit n = 4, alors on a:
fl(1/3)
fl(7r)
fl(12,4551)
0,3333 x 10
0,3142 x 10
1
0,1246 x 10
2

1.5.1 Oprations lmentaires
Les oprations lmentaires sont l'addition, la soustraction, la multiplica-
tion et la division. Soit x et y, deux nombres rels. On effectue ces oprations
en arithmtique flottante de la faon suivante:
x+y
x y
x-7-y
xx y
--+
--+
--+
--+
fl(fl(x) + fl(y))
fi( fi( x) - fl(y))
fl(fl( x) -7- fl(y))
fi( fi( x) x fl(y))
Analyse d'erreurs 25
En un mot, on doit d'abord reprsenter les deux oprandes en notation
flottante, effectuer l'opration de la faon habituelle et exprimer le rsultat
en notation flottante.
Exemple 1.15
Si on prend n = 4, alors on a:
1/3 x 3 --+ fl(fl(1/3) x fl(3))
fl((0,3333 x 10) x (0,3000 x 10
1
))
fl(0,099 990 00 x 10
1
)
0,9999 x 10
On remarque une lgre perte de prcision par rapport la valeur exacte de
cette opration qui est 1.

La multiplication et la division sont particulirement simples en arith-
mtique flottante cause de la loi des exposants.
Exemple 1.16
Toujours avec n = 4, eff-ectuer les oprations suivantes:
a) (0,4035 x 10
6
) x (0,1978 x 10-
1
)
fl(0,4035 x 10
6
x 0,1978 x 10-
1
)
fl(0,079 8123 x 10
5
)
fl(0,798123 x 10
4
)
0,7981 x 10
4
b) (0,567 89 x 10
4
) 7 (0,123 4321 x 10-
3
)
fl(0,5679 x 10
4
7 0,1234 x 10-
3
)
fi( 4,602106 969 x 10
7
)
fl(0,460 210 6969 x 10
8
)
0,4602 x 10
8

26 Chapitre 1
Par contre, il faut tre plus prudent avec l'addition et la soustraction.
On ajoute d'abord des zros la mantisse du nombre ayant le plus petit
exposant de telle sorte que les deux exposants soient gaux. On effectue
ensuite l'opration habituelle et on met le rsultat en notation flottante.
Exemple 1.17
Toujours avec n = 4, effectuer les oprations suivantes:
a) (0,4035 x 10
6
) + (0,1978 x 10
4
)
fl(0,4035 x 10
6
+ 0,1978 x 10
4
)
fl(0,4035 x 10
6
+ 0,001 978 x 10
6
)
fl(0,405 4 78 x 10
6
)
0,4055 x 10
6
b) (0,567 89 x 10
4
)- (0,123 4321 x 10
6
)
fl(0,5679 x 10
4
- 0,1234 x 10
6
)
fl(0,005 679 x 10
6
- 0,1234 x 10
6
)
-fl(O,l17 72 x 10
6
)
-0,1177 x 10
6
On constate qu'il est primordial de dcaler la mantisse avant d'effectuer
l'addition ou la soustraction.

Remarque 1.10
TI faut bien remarquer que des oprations mathmatiquement quivalentes
ne le sont pas forcment en arithmtique flottante. L'ordre des oprations
est trs important. En voici un exemple. 0
Exemple 1.18
La proprit de distributivit de la multiplication sur l'addition n'est pas tou-
jours respecte en arithmtique flottante. En effet, en arithmtique exacte:
122 x (333 + 695) = (122 x 333) + (122 x 695) = 125 416
Analyse d'erreurs
En arithmtique flottante avec n = 3, on obtient d'une part:
122 x (333 + 695)
et d'autre part:
fi[(0,122 x 10
3
) x fi(0,333 x 10
3
+ 0,695 x 10
3
)]
fi[(0,122 x 10
3
) x fi(1,028 x 10
3
)]
fi[(0,122 x 10
3
) x (0,103 x 10
4
)]
fi(0,012 566 x 10
7
)
0,126 x 10
6
(122 x 333) + (122 x 695) fl[fl((0,122 x 10
3
) x (0,333 x 10
3
))
27
+ fi((0,122 x 10
3
) x (0,695 x 10
3
))]
fi[fi(0,040 626 x 10
6
) + fi(0,084 79 x 10
6
)]
fi[(0,406 x 10
5
) + (0,848 x 10
5
)]
fi(1,254 x 10
5
)
0,125 x 10
6
On constate donc une lgre diffrence entre les deux rsultats, ce qui indique
que les deux faons d'effectuer les oprations ne sont pas quivalentes en
arithmtique flottante.

1.5.2 Oprations risques
Un certain nombre de calculs sont particulirement sensibles aux erreurs
d'arrondi. Nous prsentons quelques exemples d'oprations viter.
Exemple 1.19
Additionner deux nombres dont les ordres de grandeur sont trs diffrents:
(0,4000 x 10
4
) + (0,1000 x 10-
2
)
fi(0,4000 x 10
4
+ 0,1000 x 10-
2
)
fi(0,4000 x 10
4
+ 0,000 0001 x 10
4
)
fi(0,400 0001 x 10
4
)
0,4000 x 10
4
La loi des exposants et l'arrondi font en sorte que le petit nombre disparat
compltement devant le plus grand. Ce comportement est encore plus en
vidence dans l'exemple suivant .

28 Chapitre 1
Exemple 1.20
Calculer une somme de termes positifs:
n 1

i=l z z
On peut valuer analytiquement cette srie en utilisant les fractions par-
tielles. En effet:
n 1
Sn = 1 + L -.
2
-.
i=l z + z
n (1 1 )
1+2:: -:---.-
i=l z z + 1
1 1 1 1 1
1 + (1--) + (---) + ... + (-- -)
2 2 3 n n+1
1
2---
n+1
On peut calculer cette somme tout d'abord directement:
1 1 1
St n = 1 + - + - + + --
' 2 6 n
2
+ n
et ensuite rebours:
1 1 1
s2 n = + ... + - + - + 1
' n
2
+ n 6 2
Les rsultats calculs sur IBM RISC 6000 sont rsums dans le tableau ci-
dessous pour diffrentes valeurs de n.
n
sl n S2,n
Valeur exacte de Sn
99 1,989 999 890 1,990 000 010 1,99
999 1,999 001026 1,999 000 072 1,999
9999 1,999 791 980 1,999 899 983 1,9999
On remarque que S2,n est plus prcis que St,n Cela est d au fait que lors-
qu'on somme S
1
non accumule dans S
1
n les sommes intermdiaires. Cons-
' '
quemment, St,n devient de plus en plus grand par rapport et on finit
Analyse d'erreurs 29
par additionner un trs grand et un trs petit nombre (ce type d'opration
est viter). Inversement, lorsqu'on somme S2,m les sommes intermdiaires
augmentent, mais les termes qui s'ajoutent au fil de la sommation croissent
galement et le phnomne prcdent ne se produit pas .

Exemple 1.21
Soustraire deux nombres presque identiques:
(0,5678 x 10
6
)- (0,5677 x 10
6
)
fi(0,5678 x 10
6
- 0,5677 x 10
6
)
fl(0,0001 x 10
6
)
0,1000 x 10
3
La soustraction de ces 2 nombres de valeur trs proche fait apparatre trois
0 non significatifs dans la mantisse du rsultat. On appelle ce phnomne
l'limination par soustraction des chiffres significatifs. L'exemple suivant en
illustre les consquences possibles .

Exemple 1.22 (Chapra et Canale, rf. [4])
Calculer les racines de:
ax
2
+ bx + c
qui sont bien sr:
-b + y'b
2
- 4ac -b - v'b
2
- 4ac
r1 = et r2 = ------
2a 2a
On considre le cas o a = 1, b = 3000,001 et c = 3. Les racines exactes sont
r
1
= -0,001 et r
2
= -3000. Un calcul en simple prcision (norme IEEE)
donne r
1
= -0,000 988 28133 et r
2
= -3000,0000, dont l'erreur relative
est respectivement de 1,17% et de 0,0 %. Le calcul de r
2
ne pose aucune
difficult particulire. L'erreur relative lie r
1
provient de l'addition de
( -b ), qui vaut -3000,000 977, et de v'b
2
- 4ac, qui vaut 2999,999 023. Cette
30 Chapitre 1
opration revient soustraire des nombres trs voisins. Pour viter cela, on
peut multiplier r1 par son conjugu et calculer:
r
1
= ( -b + y'b2- 4ac) ( -b- y'b
2
- 4ac)
2a -b - y'b2 - 4ac
-2c
b+ v'b
2
- 4ac
On obtient de cette manire:
r1 = -0,001000000047
et une erreur relative extrmement faible .

Exemple 1.23
valuer une srie de nombres de signes alterns (Chapra et Canale, rf [4]).
Nous verrons un peu plus loin que le dveloppement de Taylor de la
fonction e-x autour de 0 est:
(1.15)
On remarque que les termes de la srie changent constamment de signe.
Dans l'expression 1.15, Sn dsigne la somme des ( n + 1) premiers termes
de la srie. Le tableau ci-dessous prsente quelques rsultats intermdiaires
obtenus lors de l'valuation de e-
10
, qui consiste poser tout simplement
x = 10 dans l'quation 1.15.
Analyse d'erreurs 31
n
xnjn!
Somme partielle Sn
0 + 1,000 000 00 +1,000 000 000
1 -10,000 0000 -9,000 000 000
2 +50,000 0000 +41 ,000 000 00
3 -166,666 718 -125,666 6718
4 +416,666 687 +291,000 0000
5 -833,333 374 -542,333 37 40
10 +2755,73217 +1342,587 402
20 +41,103 1875 +13,396 75140
30 +0,376 998 9125 x 10-
2
+0,852 284 9530 x 10-
3
31 -0,121612 5558 x 10-
2
-0,363 840 6051 x 10-
3
32 +0,380 039 2442 x 10-
3
+0,161986 3906 x 10-
4
33 -0,115 163 4060 x 10-
3
-0,989 647 6690 x 10-
4
34 +0,338 715 9086 x 10-
4
-0,650 931 7609 x 10-
4
35 -0,967 759 7518 x 10-
5
-0,747 707 7452 x 10-
4
40 +0,122 5618007 x 10-
7
-0,726 567 8660 x 10-
4
41 -0,298 931 2131 x 10-
8
-0,726 576 6908 x 10-
4
42 +0,7117409990x 10-
9
-0,726 569 5604 x 10-
4
43 -0,165 5211662 x 10-
9
-0,726 5712338 x 10-
4
44 +0,376 184 4655 x 10-lO -0,726 570 8700 x 10-
4
45 -0,835 965 4982 x 10-
11
-0,726 570 9428 x 10-
4
Voil un exemple parfait de calcul instable. On remarque immdiate-
ment que le rsultat final est faux, car on obtient une valeur ngative pour
l'exponentielle dont la valeur exacte est 0,453 9993 x 10-
4
On voit aussi
qu'il est inutile de continuer pour des valeurs de n plus grandes que 45, car
la valeur de xn / n! est trop petite pour modifier substantiellement le rsul-
tat. Cela revient additionner un trs grand et un trs petit nombre. On
constate enfin que le phnomne d'limination par soustraction des chiffres
significatifs se produit de faon systmatique en raison de l'alternance des
signes.
On peut contourner ces difficults en valuant la srie de manire diff-
rente. Une possibilit consiste utiliser l'algorithme de Horner pour l'va-
luation des polynmes.

1.5.3 valuation des polynmes
n est trs frquent d'avoir valuer des polynmes de degr lev en
analyse numrique. n est donc important de pouvoir les valuer rapidement
et de la faon la plus stable possible du point de vue de l'arithmtique
flottante. C'est ce que permet l'algorithme de Horner appel aussi algorithme
de multiplication imbrique. Pour valuer un polynme de la forme:
en un point x quelconque, il suffit de regrouper judicieusement les termes de
la faon suivante:
p(x) = ao +x( al+ x(a2 + x(a3 + + x(an-l + anx) )))
Voyons l'valuation d'un polynme l'exemple suivant.
Exemple 1.24
Soit le polynme:
p( x) = 2 + 4x + 5x
2
+ 3x
3
(1.16)
qui ncessite 6 multiplications et 3 additions. En suivant le mode de regrou-
pement de l'quation 1.16, on obtient:
p(x) = 2 + x(4 + x(5 + 3x))
qui ncessite seulement 3 multiplications et 3 additions (et aucune lvation
de puissance). On rduit donc substantiellement le nombre d'oprations n-
cessaires et, de plus, cette nouvelle expression est moins sensible aux effets
de l'arithmtique flottante.

La mthode de Horner est facile programmer grce l'algorithme sui-
vant.
Algorithme 1.2: Mthode de Horner
1. tant donn les coefficients ai d'un polynme de degr n
2. tant donn une abscisse x
Analyse d'erreurs 33
3. tant donn la variable Pn qui contiendra la valeur du polynme en x
4. Pn =an
5. Pour i = n, n- 1, n- 2, , 2, 1:
Pn =ai-l+ PnX
6. crire x, p(x) = Pn D
Exemple 1.25
La mthode de Horner peut servir reprendre le calcul e-
10
par la srie
alterne 1.15. Les coefficients du polynme sont:
( -1)i
a;=-.-,-
z.
Pour le polynme de degr n = 45, on obtient la valeur approximative
0,453 999 X 10-
4
, qui est trs prs de la valeur exacte et qui ne change plus
pour les valeurs suivantes de n .

1.6 Erreurs de troncature
Les erreurs de troncature constituent la principale catgorie d'erreurs.
Tout au long de ce manuel, nous abordons des mthodes de rsolution qui
comportent des erreurs de troncature plus ou moins importantes. L'ordre
d'une mthode dpend du nombre de termes utiliss dans les dveloppements
de Taylor appropris. li est donc essentiel de revoir en dtaille dveloppe-
ment de Taylor, car il constitue l'outil fondamental de l'analyse numrique.
Remarque 1.11
li est important de ne pas confondre les erreurs de troncature traites dans
cette section et la troncature utilise pour la reprsentation des nombres sur
ordinateur. D
34
\
\
'
'
'
'
xo
f(x)
P
2
(x)
P
1
(x)
P
0
(x)
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Chapitre 1
Figure 1.5: Approximation de f( x) au voisinage de xo
1.6.1 Dveloppement de Taylor en une variable
li existe plusieurs faons d'introduire le dveloppement de Taylor. Une
faon trs simple consiste le prsenter formellement comme un problme
d'approximation au voisinage d'un point x
0
On se demande alors quel est
le polynme de degr 0 (not Po( x)) qui donne la meilleure approximation
d'une fonction f(x) donne dans le voisinage du point xo.
Selon la figure 1.5, ce polynme est:
Po( x)= f(xo)
On peut pousser plus loin l'analyse et chercher le meilleur polynme de
degr 1 de la forme:
Pt(x) = ao + at(x- xo) ( 1.17)
On pourrait tout aussi bien chercher un polynme de forme plus classique:
Ces deux expressions sont quivalentes et aboutissent au mme rsultat. La
forme 1.17 est plus pratique et plus naturelle puisqu'elle s'articule autour du
point xo.
On doit introduire deux conditions pour dterminer les deux constantes.
Intuitivement, la meilleure droite (polynme de degr 1) est celle qui passe
Analyse d'erreurs 35
par ( xo, f( xo)) et dont la pente est celle de la fonction f( x) en x
0
, ce qui
entrane que:
ou encore
f(xo)
!'(xo)
ao f(xo)
a1 !'(xo)
li en rsulte l'expression suivante:
P1(x) = f(xo) + f'(xo) (x- xo)
(1.18)
(1.19)
On peut bien sr poursuivre ce raisonnement condition que la fonction
f( x) soit suffisamment drivable. Dans le cas d'un polynme de degr 2, on
imposerait:
pour obtenir facilement:
P2(xo)
~ ( x o )
~ ( x o )
f(xo)
J'( xo)
!"(xo)
J"(x ) (x x )
2
P2(x)=f(xo)+f'(xo)(x-xo)+
0
2
-
0
(1.20)
(1.21)
(1.22)
En poursuivant ce raisonnement jusqu' l'ordre n, c'est--dire en imposant
l'galit des drives jusqu' l'ordre n, on obtient le polynme de Taylor de
degr n de la fonction f( x) autour de x
0

Dfinition 1.6
Le polynme de Taylor de degr n de la fonction f( x) autour de xo est
dfini par:
Pn(x)
f(xo) + f'(xo) (x- xo) + f"(xo) ~ ~ - xo)
2
(1.23)
f"'(xo) (x- xo? f(n)(xo) (x- xo)n
+ 3! + .. + ----'-----'--n...:.!----'--
o f(n)(xo) dsigne la drive d'ordre n de f(x) en xo.
36 Chapitre 1
Ce polynme donne une approximation de la fonction f( x) au voisinage
de x
0
li n'y a cependant pas galit en ce sens que si on utilise l'quation 1.23
pour estimer f( x) on commettra une erreur.
Remarque 1.12
On choisit gnralement le point x
0
o on dveloppe le polynme de Taylor
de faon ce que l'on puisse facilement valuer la fonction f( x) ainsi que
ses drives. 0
Le rsultat suivant quantifie l'erreur commise lorsqu'on utilise le poly-
nme de Taylor (Thomas et Finney, rf. [22]).
Thorme 1.2
Soit f( x), une fonction dont les drives jusqu ' l'ordre ( n + 1) existent au
voisinage du point x
0
On a l'galit suivante:
f(x) = Pn(x) + Rn(x) (1.24)
o Pn(x) est le polynme de Taylor 1.23 et Rn(x) est l'erreur commise, qui
est donne par:
f(n+l)((x)) (x- xo)(n+l)
Rn( x)= (n +
1
)!
(1.25)
pour un certain (x) compris entre x
0
et x. 0
Remarque 1.13
1. L'quation 1.24 est une galit et ne devient une approximation que
lorsque le terme d'erreur est nglig.
2. Le terme d'erreur de l'quation 1.25 devient de plus en plus grand
lorsque x s'loigne de xo en vertu du terme (x - x
0
)(n+I) (voir la
figure 1.5).
3. Inversement, pour une valeur de x prs de x
0
, le terme d'erreur de
l'quation 1.25 est de plus en plus petit lorsque n augmente.
4. On sait que le point ( x) existe et qu'il varie avec x, mais on ne connat
pas sa valeur exacte. li n'est donc pas possible d'valuer le terme
d'erreur exactement. On peut tout au plus lui trouver une borne su-
prieure dans la plupart des cas.
Analyse d'erreurs 37
5. On commet une erreur de troncature chaque fois que l'on utilise le
dveloppement de Taylor et que l'on nglige le terme d'erreur de l'qua-
tion 1.25. 0
Un cas particulier important du thorme prcdent est le premier tho-
rme de la moyenne, qui quivaut poser n = 0 dans le dveloppement de
Taylor.
Corollaire 1.1
Soit f(x), une fonction drivable dans l'intervalle [xo, x]. Alors il existe
dans [x
0
,x] tel que:
f(x) = f(xo) + J'()(x- xo)
qui s'crit galement sous la forme:
f(x)- f(xo) = J'()(x- xo) 0 (1.26)
On cre une forme plus pratique du dveloppement de Taylor en remplaant
x par x
0
+ h ou encore l'expression x - x
0
par h. On obtient ainsi:
f(xo + h) = Pn(h) + Rn(h) (1.27)
o
f(xo) + f'(xo) h + " ( ~ ~ ) h
2
(1.28)
et
j(n+l)((h)) h(n+l)
Rn(h) = (n +
1
)!
(1.29)
pour (h) compris entre xo et x
0
+ h.
Exemple 1.26
On considre la fonction f( x) = ex au voisinage de x
0
= O. Puisque toutes
les drives de ex sont gales ex et valent 1 en x
0
= 0, le dveloppement
38 Chapitre 1
de Taylor de degr n devient:
h2 h3 hn
exo+h e h ~ P, (h) = 1 + h +- +- + ... +-
n 2! 3! n!
et l'expression du terme d'erreur de l'quation 1.29 est:
e(h) hn+l
Rn(h) = (n +
1
)!
o (h) E [0, h]. On peut mme dterminer une borne suprieure pour le
terme d'erreur. La fonction exponentielle tant croissante, on a:
dans l'intervalle [0, h] et on conclut que:
ehhn+l
Rn ( h) ~ ( n +
1
)!
(1.30)
On peut utiliser ce dveloppement pour estimer la valeur de e
0
'
1
en pre-
nant h = 0,1.
n Pn(0,1) Erreur absolue Nombre de chiffres Borne pour le
significatifs terme d'erreur
0 1,000 0000 0,105 X lQU 1 0,111 x 10
1 1,100 0000 0,517 x 10-
2
2 0,552 x 10-
2
2 1,105 0000 0,171 x 10-
3
4 0 184 x 10-
3
'
3 1,1051667 0,420 x 10-
5
6 0,460 x 10-
5
On obtient l'erreur absolue simplement en comparant le rsultat avec la
valeur exacte 1,105 170 918, tandis que la borne suprieure de l'erreur pro-
vient de l'quation 1.30 avec h = 0,1. Enfin, si on prend h = 0,05 et n = 3
pour estimer e
0
,
05
, on obtient:
P3(0,05) = 1,051 270 833
et une erreur absolue d'environ 0,263 x 10-
6
. On remarque de plus que le
rapport des erreurs absolues lies P
3
( h) est:
IP3(0,1)- e
0
'
1
1
IP3(0,05)- eo,o51
0,4245 x 10-
5
= 16 14
0,263 x 10-
6
'
Analyse d'erreurs 39
La valeur de ce rapport n'est pas fortuite. La dfinition suivante permet de
comprendre d'o provient cette valeur (Bourdeau et Glinas, rf. [1]) .

Dfinition 1. 7
Une fonction f(h) est un grand ordre dehn au voisinage de 0 (not f(x) =
O(hn)) s'il existe une constante positive C telle que:
au voisinage de O.
Bien qu'imprcise, cette dfinition exprime assez bien les caractristiques
d'une fonction de type O(hn). Lorsque h est assez petit, la fonction O(hn)
dcrot comme Chn. Plus n est grand, plus la dcroissance est rapide. Ainsi,
une fonction O(h
3
) dcrot plus vite qu'une fonction O(h
2
), qui elle-mme
dcrot plus vite qu'une fonction 0( h ). Pour avoir une ide du comportement
d'une fonction de type 0( hn ), il suffit de remarquer que, lorsque h est divis
par 2, la fonction 0( hn) diminue selon un facteur approximatif de 2n. En
effet, si on remplace h par h/2 dans Chn, on obtient:
Remarque 1.14
Le terme d'erreur du polynme de Taylor de degr n est gnralement de type
O(hn+l ). Cela explique le rapport de 16,14 obtenu dans l'exemple prcdent.
En effet, on y trouve un polynme de Taylor de degr 3 dont le terme d'erreur
est de type O(h
4
). En passant de h = 0,1 h = 0,05, on divise h par un
facteur de 2, d'o une diminution selon un facteur de 2
4
= 16 de l'erreur.
Bien sr, le facteur de 16 est approximatif et n'est atteint qu' des valeurs
de h trs petites. Dans le cas gnral, on note:
40 Chapitre 1
Dfinition 1.8
Une approximation dont le terme d'erreur est un grand ordre de hn
(O(hn)) est dite d'ordre n.
Remarque 1.15
Suivant cette dfinition, le polynme de Taylor de degr n est gnralement
(mais pas toujours) une approximation d'ordre ( n + 1) de f( x). Par exemple,
le dveloppement de Taylor de degr n de ex autour de x = 0 est d'ordre
(n+1).D
Remarque 1.16
Dans certains manuels, il y a confusion entre le degr et l'ordre du polynme
de Taylor. ll faut s'assurer de bien distinguer ces deux notions. o
Exemple 1.27
Calculer le dveloppement de Taylor d'ordre 5 de la fonction sin x autour de
xo = O. Les drives de la fonction sont respectivement:
f(x) sin x, f(O) 0
!'(x) cos x, f'(O) 1
!"(x) -sin x, J"(O) 0
!"'(x) -cos x, f"'(O) -1
!""(x) sin x,
f""(O) 0
!""'(x) cos x
Le dveloppement de Taylor est donc:
. ( h) . (h) h h
3
cos((h))h
5
sm x0 + = sm = - 1 +
1
3. 5.
Analyse d'erreurs 41
il suffit de calculer le polynme de Taylor de degr 3 (P3(h)) pour obtenir
une approximation d'ordre 5 de la fonction sin h. Puisque la fonction cos x
est borne en valeur absolue par 1, on note immdiatement que:
Si on prend maintenant h = 0,1, on peut obtenir l'approximation:
. (0,1?
sm(0,1) 0,1-----:31 = 0,099833333
soit une erreur absolue de 0,8332 x 10-
7
. il est noter que la borne suprieure
de l'erreur vaut 0,8333 x 10-
7
, ce qui est trs prs de la valeur exacte. Si on
prend h = 0,2, on trouve:
. (0,2?
sm(0,2) 0,2 - --
1
- 0,198 666 6667
3.
et une erreur absolue de 0,2664 x 10-
5
. On remarque de plus que le rapport
entre les deux erreurs absolues est:
0,2664 x 10-
5
- 1
0 8332 x 10-
7
-
3
'
97
'
ce qui confirme que cette approximation est bien d'ordre 5. En prenant une
valeur de h deux fois plus grande, on trouve une erreur peu prs 2
5
= 32
fois plus grande. Cet exemple montre que le polynme de Taylor de degr 3
de la fonction f( x) = sin x est d'ordre 5 .

1.6.2 Dveloppement de Taylor en plusieurs variables
On peut reprendre, dans le cas de plusieurs variables, le raisonnement
qui a men au dveloppement de Taylor d'une variable. Nous nous limitons,
pour les fins de l'expos, trois variables, le cas gnral tant similaire.
42 Chapitre 1
Thorme 1.3
Soit f(xt, x
2
, x3), une fonction de trois variables, que l'on suppose suffisam-
ment diffrentiable. On a alors:
+
Les termes suivants (dsigns par les pointills) font intervenir les diffrentes
drives partielles d'ordre 3, 4, 5 de la fonction f(xt, x
2
, X3). On voit bien
la similitude avec le cas d'une variable. En pratique, on utilise principalement
le dveloppement de degr 1, qui ne fait intervenir que les drives partielles
d'ordre 1. D
Exemple 1.28
Soit la fonction de deux variables:
f(xt, Xz) =xi+ Xt sin Xz
que l'on dveloppe autour de x ~ , x
2
) = (1, 0). On a alors /(1, 0) = 1. De
plus, les drives partielles du premier ordre de f sont:
f x ~ , xz) .
= 2x1 +sm x2
Xt
et celles du deuxime ordre sont:
8
2
f(xt, xz) =
2
xi
Analyse d'erreurs
Au point (1, 0), ces drives partielles valent:
et
8/(1' 0) = 2
8x1
8f(1' 0) = 1
8xz
8Zj(1,0)=2 8zf(1;0)=0 8zf(1,0)=1
8xi 8xz 8x18xz
43
Le dveloppement de Taylor de degr 2 de cette fonction de deux variables
autour du point (1 , 0) est donc:
c'est--dire
/(1 + h1,hz) ~ 1 + 2ht +hz+ hi+ hthz
En choisissant par exemple h
1
= hz = 0,1, on obtient l'approximation sui-
vante:
!(1,1' 0,1) ~ 1,32
qui est proche de la valeur exacte 1,319 816 758 avec une erreur absolue
d'environ 0,000 183. Si on prend maintenant h
1
= hz = 0,05, on obtient
une approximation de /(1,05, 0,05) qui vaut 1,155. L'erreur absolue dans ce
dernier cas est d'environ 0,000 021825, qui est environ 8,4 fois plus petite
qu'avec h
1
=hz= 0,1. Ce facteur de 8 s'explique par le choix d'un dvelop-
pement de degr 2 (et d'ordre 3) et par la division des valeurs de h
1
et hz
par 2.

1.6.3 Propagation d'erreurs dans le cas gnral
Nous approfondissons dans cette section plusieurs notions vues plus haut.
Que peut-on dire, par exemple, de la prcision des rsultats obtenus lorsqu'on
additionne ou qu'on multiplie des valeurs connues avec une prcision limite?
Plus gnralement, si on a:
x x*
y y* y
quelle sera la prcision de la fonction d'une variable f( x*) ou de la fonction
de deux variables g(x*, y*)? Ici encore, le dveloppement de Taylor apporte
44 Chapitre 1
une solution. Considrons d'abord le cas d'une variable. Une quantit x
inconnue est approche par une valeur approximative x* avec une erreur
absolue On estime la valeur inconnue f( x) par l'approximation f( x*).
L'erreur absolue lie ce rsultat est:
= lf(x)- f(x*)l
On a de plus:
f(x) = f(x* f(x*) J'( x*)


En ngligeant les termes d'ordre plus grand ou gal 2, on obtient:
c:::: lf'(x*)l
que l'on peut galement crire:
f(x) = f(x*) (1.31)
Exemple 1.29
On a mesur la longueur d'un ct d'une bote cubique et obtenu l* = 10,2
cm avec une prcision de l'ordre du millimtre = 0,1 cm). On cherche le
volume v de cette bote. Dans ce cas, f(l) = l
3
= v et l'erreur lie au volume
est:
lf'(l*)l = 3 (10,2)
2
x 0,1 = 31,212::; 0,5 x 10
2
La valeur approximative du volume est (10,2)
3
= 1061,2 cm
3
, dont seuls les
deux premiers chiffres sont significatifs .

On traite les fonctions de plusieurs variables en faisant appel au dve-
loppement de Taylor en plusieurs variables. Nous donnons le rsultat en
dimension 3 seulement, car le cas gnral ne pose aucune difficult suppl-
mentaire.
Analyse d'erreurs 45
Thorme 1.4
Soit f( x, y, z), une fonction de trois variables x, y et z dont on estime la valeur
par x*, y* et z* avec une prcision de de et de respectivement.
L'erreur absolue est donne par:
= 1 z*) 1 + 1 z*) 1
(1.32)
+ D
Exemple 1.30
Un signal lectrique est donn par:
V= A sin(wt- cf;)
o V est la tension, A est l'amplitude du signal (A* = 100 V), w est la
frquence (w* = 3 rad/s), cp est le dphasage (cp* = 0,55 rad) et t est le
temps ( t* = 0,001 s ). En supposant que A et w sont connus exactement
(A= A*, w = w*) et que cp* et t* possdent respectivement 2 et 1 chiffres
significatifs, il s'agit d'valuer l'erreur absolue lie V ainsi que le nombre
de chiffres significatifs.
Puisque A et w sont connus exactement, on sait immdiatement que
et sont nuls et qu'ils n'ont aucune contribution l'erreur lie V. Par
ailleurs:
0,5 x 10-
3
0,5 x 10-
2
et l'erreur totale est:
c'est--dire
IA*w*cos(w*t*- cj;*)lx(0,5x10-
3
)+1-A*cos(w*t*- cj;*)lx(0,5x10-
2
)
46 Chapitre 1
ce qui donne:
256,22666235 x (0,5 x 10-
3
) + 1-85,40887451 x (0,5 x 10-
2
)
= 0,555157 684
La tension approximative V* est bien sr:
V* =A* sin(w*t*- cp*)= -52,012 730 71
et puisque ::::; 0,5 x 10
1
, ce nombre n'a qu'un seul chiffre significatif .

Quelques cas particuliers mritent de l'attention. De l'quation 1.32, on
peut dduire la faon dont se propagent les erreurs dans les oprations l-
mentaires. En effet, en prenant par exemple f(x, y)= xjy, on trouve:
ou encore
A( ..!... ) = +
ux.y
2
y
On obtient ainsi le tableau suivant partir de l'quation 1.32.
y)
-
-
y)
-
-
x y)
-
+
-
(1.33)
y)
-
+
-
y2
On remarque que les erreurs absolues pour la soustraction s'additionnent.
Le tableau montre galement la similitude entre la propagation d'erreurs et la
diffrentiation d'une somme, d'une diffrence, d'un produit et d'un quotient
de deux fonctions.
Analyse d'erreurs 47
1. 7 Exercices
1. Tous les chiffres des nombres suivants sont significatifs. Donner une
borne suprieure de l'erreur absolue et estimer l'erreur relative.
a) 0,1234 b) 8, 760 c) 3,14156
d) 0,112 35 x 10-
3
e) 8,000 f) 0,223 56 x 10
8
2. Exprimer les nombres dcimaux suivants en reprsentation binaire clas-
sique.
a) 32 b) 125 c) 1231 d) 876 e) 999 f) 12345
3. Exprimer les entiers signs 125, -125, 0, 175 et -100 dans une forme
binaire sur 8 bits en utilisant:
a) la reprsentation signe et grandeur.
b) le complment 2.
c) la reprsentation par excs ( d = 2
7
).
4. Traduire les nombres binaires 0000 0011, 1000 0001 et 11111111 dans
la forme dcimale selon que la reprsentation utilise est:
a) la reprsentation binaire classique.
b) la reprsentation signe et grandeur.
c) le complment 2.
d) la reprsentation par excs ( d = 2
7
).
5. Pour reprsenter les nombres rels, considrer un mot de 16 bits dont
1 exprime le signe du nombre, 5, l'exposant et 10, la mantisse.
a) Reprsenter le plus petit et le plus grand nombre positifs en utilisant
le complment 2 pour l'exposant.
b) Dterminer la prcision machine.
6. Convertir en forme binaire les fractions dcimales suivantes.
a) 0,5 b) 0,2 c) 0,9 d) 1/3 e) 0,25 f) 3/8
48 Chapitre 1
7. Un ordinateur fictif reprsente les nombres rels sur 32 bits dans l'ordre
suivant:
1 bit pour le signe du nombre (0 = positif, 1 = ngatif);
7 bits pour l'exposant en reprsentation signe et grandeur;
24 bits pour la mantisse (normalise).
a) Que reprsentent (en base 10) les 32 bits:
1000 10111010 1000 0010 0000 0000 0000
b) Donner une borne suprieure de l'erreur relative lie cette repr-
sentation (on suppose que l'ordinateur utilise la troncature).
c) Donner l'expression binaire sur 32 bits du plus petit nombre rel
positif reprsentable et donner sa valeur en base 10.
8. Convertir les nombres suivants en simple prcision IEEE.
a) -52,234375 b)7112,0 c)16,2
Vrifier les rponses en les retransformant en nombres dcimaux. va-
luer l'erreur de reprsentation commise en c).
9. Donner la reprsentation en notation flottante en base 10 des nombres
suivants (arrondir en conservant 4 chiffres dans la mantisse).
a) e b) 1/6 c) 2/3
d) 12,487 x 10
5
e) 213 456 f) 2000,1
10. Montrer que la loi d'associativit de l'addition n'est pas toujours res-
pecte en arithmtique flottante. Utiliser l'arithmtique flottante
3 chiffres et les nombres suivants: x = 0,854 x 10
3
, y= 0,251 x 10
3
et
z = 0,852 x 10
3

11. Effectuer les oprations suivantes en arithmtique flottante 3 chiffres.
a) 1r(1j1r)
b) 2136 (9993 + 0,004 567)
c) (1,235)
4
d) 10 200 + 341
e) (10200+ 341)- 9800
f) (125 x 25) + (10 x 2,5)
Analyse d'erreurs 49
12. Combien de nombres diffrents peut-on reprsenter en arithmtique
flottante 3 chiffres (base 10) si l'exposant l est compris entre -9
et 9?
13. Est-ce que (x . y) est quivalent (x x (1
flottante?
y)) en arithmtique
14. On doit effectuer l'opration 1 - cosx pour des valeurs de x voisines
de O. Expliquer ce qui risque de se produire du point de vue de l'arith-
mtique flottante et proposer une solution de rechange.
15. Donner une faon d'valuer les expressions suivantes qui permette
d'viter le plus possible les erreurs dues l'arithmtique flottante.
a) cos
2
e- sin
2
e pour des valeurs de e autour de 7r /4
b) p(2), o p(x) = 1- 2x + 3x
2
- 4x
3
100 1
c) L-=2
i=l z
16. La srie divergente:
00 1
2:-
n=l n
devient convergente en arithmtique flottante. Expliquer brivement
pourquoi.
17. Dmontrer que l'erreur relative lie la multiplication et la division
de deux nombres est la somme des erreurs relatives lies chacun des
nombres.
18. Effectuer les dveloppements de Taylor suivants l'ordre demand.
Utiliser la forme de l'quation 1.28. Donner l'expression analytique
du terme d'erreur. Donner galement une borne suprieure de l'erreur
lorsque c'est possible.
a) cos(x) autour de xo = 0 (ordre 8)
b) sin( x) autour de xo = 0 (ordre 9)
c) arctan( x) autour de x
0
= 0 (ordre 5)
d) cos( x) autour de xo = 1r /2 (ordre 7)
e) sin( x) autour de xo = 1r /2 (ordre 8)
50 Chapitre 1
19. valuer les erreurs commises dans l'valuation des fonctions suivantes.
Tous les chiffres fournis sont significatifs. Indiquer le nombre de chiffres
significatifs du rsultat.
a) ln(x) en x*= 2,01
b) arctan(x) en x*= 1,0100
c) x
8
en x*= 1,123
d) (sin(x))
2
en x*= 0,11
20. valuer les erreurs commises dans l'valuation des fonctions de plu-
sieurs variables suivantes. Tous les chiffres fournis sont significatifs.
Indiquer le nombre de chiffres significatifs du rsultat.
a) x
2
y
3
en x*= 12,1, y*= 3,721
b) -xyz en x* = 1,260, y* = 0.5 x 10-
3
, z* = 12,93
21. l'aide d'une mthode numrique, on a valu la drive d'une fonc-
tion pour deux valeurs de h.
h J'( xo)
Erreur absolue
0,1 25,3121 0,0004
0,05 25,312 475 0,000 025
a) Donner le nombre de chiffres significatifs de chaque approximation
et arrondir au dernier chiffre significatif.
b) Quel est l'ordre de la mthode de diffrentiation numrique utilise.
22. a) Calculer le dveloppement de Taylor d'ordre 5, c'est--dire dont le
terme d'erreur est de type O(h
5
), de la fonction f(x) = ln(x) autour
de x
0
= 1. Donner l'expression analytique du terme d'erreur.
b) l'aide de ce dveloppement, donner une approximation de ln(1,1).
Par comparaison avec la valeur exacte (ln 1,1 = 0,095 310 179 8), don-
ner le nombre de chiffres significatifs de l'approximation.
c) Par quel facteur approximatif l'erreur obtenue en b) serait-elle r-
duite si on valuait ln(1,025) au moyen du dveloppement de Taylor
obtenu en a)? (Ne pas faire les calculs.)
23. En se servant d'un dveloppement de Taylor de la fonction arctan x
autour de xo = 0, on a obtenu les rsultats suivants:
arctan(0,4) = 0,380 714 667 (erreur absolue = 0,208 29 x 10-
3
)
arctan(0,1) = 0,099 668 667 (erreur absolue = 0,1418 x 10-
7
)
Analyse d'erreurs 51
Quel tait l'ordre du dveloppement de Taylor utilis?
24. a) Obtenir le dveloppement de Taylor autour de x
0
= 0 de la fonction:
1
f(x) = -
1
-
-x
b) Poser x = -t
2
dans le dveloppement en a) et obtenir le dvelop-
pement de Taylor de:
1
g(t) = 1 + t2
c) Intgrer l'expression obtenue en b) et obtenir le dveloppement de
Taylor d 'arctan t.
d) Utiliser l'expression obtenue en a) et obtenir le dveloppement de
Taylor de ln(l +x). (Remplacer x par -x en premier lieu.)
25. La fonction d'erreur f( x) est dfinie par:
2 rx 2
f(x)= .Jii}o e-t dt
Pour en obtenir le dveloppement de Taylor, on peut suivre les tapes
suivantes:
a) Obtenir le dveloppement de Taylor de e-x. (Limiter le dveloppe-
ment aux 6 premiers termes.)
b) Dduire de a) le dveloppement de Taylor de e-t
2

c) Dduire de b) le dveloppement de Taylor de f( x).
d) Donner une approximation de f(l) en utilisant les 4 premiers termes
de son dveloppement de Taylor.
e) Quel est l'ordre de l'approximation obtenue end)?
f) Donner le nombre de chiffres significatifs de l'approximation obtenue
en d) en la comparant avec la valeur exacte f( 1) = 0,842 701.
Chapitre 2
,
Equations non linaires
2.1 Introduction
Le numricien est souvent confront la rsolution d'quations alg-
briques de la forme:
f(x)=O (2.1)
et ce dans toutes sortes de contextes. Introduisons ds maintenant la termi-
nologie qui nous sera utile pour traiter ce problme.
Dfinition 2.1
Une valeur de x solution de f( x) = 0 est appele une racine ou un zro
de la fonction f( x) et est note r.
Nous avons tous appris au secondaire comment rsoudre l'quation du second
degr:
dont les deux racines sont:
ax
2
+ bx + c = 0
-b v'b
2
- 4ac
2a
Certains ont galement vu comment calculer les racines d'une quation du
troisime ordre et se souviennent que la formule est beaucoup plus com-
plexe. On peut aussi obtenir une formule gnrale pour le quatrime degr.
Par contre, la plupart des tudiants ignorent qu'il n'existe pas de formule
permettant de trouver les racines des polynmes de degr plus grand ou gal
54 Chapitre 2
5. Non pas que les mathmaticiens ne l'aient pas encore trouve, mais
Galois
1
a dmontr que cette formule n'existe pas.
Puisqu'il n'existe pas de formule gnrale pour des fonctions aussi simples
que des polynmes, il est peu probable que l'on puisse rsoudre analytique-
ment l'quation 2.1 dans tous les cas qui nous intressent. n faudra donc
recourir aux mthodes numriques. Dans ce qui suit, nous prsentons plu-
sieurs techniques de rsolution, chacune ayant ses avantages et ses inconv-
nients. Nous tcherons de mettre en vidence ces avantages et inconvnients
de faon tirer le meilleur parti de chacune des mthodes proposes.
n faudra galement se souvenir des enseignements du chapitre prcdent
pour viter de dvelopper des algorithmes numriquement instables.
2.2 Mthode de la bissection
La mthode de la bissection repose sur une ide toute simple, savoir
qu'en gnral, de part et d'autre d'une solution de l'quation 2.1, une fonction
continue f( x) change de signe et passe du positif au ngatif ou vice versa
(voir la figure 2.1 ). De toute vidence, ce n'est pas toujours le cas puisque
la fonction f( x) peut aussi tre tangente l'axe des x (voir la figure 2.2).
Supposons pour l'instant qu'il y ait effectivement un changement de signe
autour d'une raciner de f(x). Nous nous occuperons des cas pathologiques
un peu plus tard. Soit [xi. x
2
], un intervalle ayant un changement de signe,
c'est--dire:
On pose alors:
Xm =
Xl+ Xz
2
(2.2)
qui est bien sr le point milieu de l'intervalle. n suffit alors de dterminer,
entre les intervalles [xi. Xm] et [xm, xz], celui qui possde encore un chan-
gement de signe. La racine se trouvera forcment dans cet intervalle. la
premire itration de la figure 2.1, ce serait l'intervalle [xw, x
2
], tandis qu' la
deuxime itration ce serait [xi. xml Cela nous amne l'algorithme suivant.
1
Le mathmaticien variste Galois (1811-1832) fut tu dans un duel l'ge de
21 ans, non sans avoir eu le temps d'apporter une contribution considrable la tho-
rie des groupes.
quations non linaires
10

-2 -1.5 -1
x,
0.5

-1
0.2 0,4 0.6 0.8 l 12 1.4 1.6 1.8 2
Xl Xm Xz
0,8
0.4
0,2
-0,2
-0.4
-0,6
-0.8
x,
0,1 0,2 0.3
0,2
0.1

-0.2
-0.3

-0.5
-0,6
-0,7
0.5
x,
0,4 0,5 0,6
xm
0.55 0.6 0,65
0.7 0,8 0,9
Xz
0,7 0,75 0,8 0,85 0,9
xm
Figure 2.1: Mthode de la bissection: f( x) = e-x - x
55
0,95 1
Xz
56 Chapitre 2
Algorithme 2.1: Algorithme de la bissection
1. tant donn un intervalle [xt, x
2
] pour lequel f( x) possde un change-
ment de signe
2. tant donnE, le critre d'arrt, et N, le nombre maximal d'itrations
3. Poser:
Xm =
S
. lx2- x1l
4. 1 1 1 < E:
2 Xm
convergence atteinte
crire la racine x m
crire f (x m )
arrt
5. crire x1, x2, Xm, f(x!), f(x2), f(xm)
6. Si f(xl) X f(xm) < 0, alors X2 = Xm
7. Si f(xm) X f(x2) < 0, alors X1 = Xm
8. Si le nombre maximal d'itrations N est atteint:
convergence non atteinte en N itrations
arrt
9. Retour l'tape 3 D
L'expression:
lx2- x1l
2lxml
est une approximation de l'erreur relative. En effet, l'tape 3 de l'algorithme
de la bissection, la racine recherche est soit dans l'intervalle [xt, Xm] ou dans
l'intervalle [xm, x
2
], qui sont tous deux de longueur:
quations non linaires 57
ce qui constitue une borne suprieure de l'erreur absolue. En divisant par
Xm, on obtient une approximation assez fiable de l'erreur relative.
Remarque 2.1
Dans l'algorithme prcdent, il faut prendre garde au cas o la racine re-
cherche est O. ll y a alors risque de division par 0 au cours de l'valuation
de l'erreur relative. Ce cas est toutefois rare en pratique. 0
Remarque 2.2
ll est parfois utile d'introduire un test d'arrt sur la valeur de f(x), qui doit
tendre galement vers O. 0
Exemple 2.1
La fonction f( x) = x
3
+ x
2
3x - 3 possde un zro dans l'intervalle [1, 2).
En effet:
!(1) x !(2) = -4,0 x 3,0 = -12,0 < 0
On a alors Xm = 1,5 et !(1,5) = -1,875. L'intervalle [1,5, 2) possde encore
un changement de signe, ce qui n'est pas le cas pour l'intervalle [1, 1,5).
Le nouvel intervalle de travail est donc [1,5, 2], dont le point milieu est
Xm = 1,75. Puisque f(1,75) = 0,17187, on prendra l'intervalle [1,5, 1,75) et
ainsi de suite. Le tableau suivant rsume les rsultats.
Xl Xz Xm f(xl) f(xz) f(xm) Erreur absolue
lie Xm
1,0 2,0 1,5 -4,0 3,0 -1,875 0,5
1,5 2,0 1,75 -1,875 3,0 +0,17187 0,25
1,5 1,75 1,625 -1,875 0,17187 -0,943 35 0,125
1,625 1,75 1,6875 -0,94335 0,17187 -0,40942 0,0625
1,6875 1,75 1,718 75 -0,40942 0,17187 -0,124 78 0,03125

On remarque aisment que la longueur de l'intervalle entourant la racine
est divise par deux chaque itration. Cette constatation permet de dter-
miner l'avance le nombre d'itrations ncessaires pour obtenir une certaine
58 Chapitre 2
erreur absolue ~ sur la raciner. Soit L = x
2
-Xt, la longueur de l'intervalle
de dpart. Aprs une itration, le nouvel intervalle est de longueur L/2 et
aprs n itrations la longueur de l'intervalle est:
Si on veut connatre la valeur de n ncessaire pour avoir:
il suffit de rsoudre cette quation en fonction de n et on trouve la condition:
n > ln(ir)
ln 2
(2.3)
n est clair que, sur le plan pratique, on doit prendre pour valeur de n le plus
petit entier vrifiant cette condition.
Exemple 2.2
Dans l'exemple prcdent, L = 2,0- 1,0. Si on veut une erreur absolue plus
petite que 0,5 x 10-2, ce qui revient s'assurer que le chiffre des centimes
est significatif, il faut effectuer au moins:
1 ( 1,0 )
n o,sxlo
2
= 7 64 itrations
ln2 '
On fera donc 8 itrations pour s'assurer de cette prcision. On peut aisment
vrifier qu'aprs 8 itrations l'erreur maximale lie Xm est de 0,003 906 25
et que la vritable erreur est 0,001 582 .

Exemple 2.3
On souhaite calculer v'2 avec une calculatrice dote seulement des 4 opra-
tions lmentaires. Cela revient rsoudre:
quations non linaires
59
Cette fonction prsente un changement de signe dans l'intervalle [1, 2].
L'algorithme de la bissection donne les rsultats suivants avec f = 10-
3
.
Xl X2 Xm !(xl) f(x2) f(xm) (xmh
1,0 2,0 1,5 -1,0 2,0 +0,25 1,1
1,0 1,5 1,25 -1,0 0,25 -0,4375 1,01
1,25 1,5 1,375 -0,4375 0,25 -0,1094 1,011
1,375 1,5 1,4375 -0,1094 0,25 +0,06641 1,0111
1,375 1,4375 1,4062 -0,1094 0,06641 -0,02246 1,011 01
1,4062 1,4375 1,4219 -0,022 46 0,06641 +0,021 73 1,011011
1,4062 1,4219 1,4141 -0,02246 0,02173 -0,00043 1,0110101
1,4141 1,4219 1,4180 -0,00043 0,021 73 +0,010 64
1,4141 1,4180 1,4160 -0,00043 0,01064 +0,00510
1,4141 1,4160 1,4150 -0,00043 0,00510 +0,002 33
1,4141 1,4150 1,4146 -0,00043 0,002 33 +0,00095
1,4141 1,4146 1,4143 -0,00043 0,000 95 +0,00026
On a arrondi 5 chiffres les rsultats de ce tableau. La racine trouve
est alors 1,414184 57, ce qui se rapproche de la valeur exacte ( 10 chiffres
significatifs) 1,414 213 562. Cet exemple est particulirement intressant du
point de vue de la reprsentation binaire. En effet, l'intervalle de dpart tant
[1, 2] et puisque les nombres 1 et 2 possdent des reprsentations binaires
exactes, chaque itration de la mthode de la bissection permet de fixer
1 bit de la reprsentation binaire de la racine. la ( n + 1 )e itration, on est
assur que les n premiers bits de la mantisse de Xm sont exacts. On peut
constater ce phnomne la dernire colonne du tableau, qui contient la
reprsentation binaire de Xm.

Remarque 2.3
La convergence de la mthode de la bissection n'est pas trs rapide, mais elle
est sre partir du moment o on a un intervalle avec changement de signe.
On parle alors de mthode ferme, car on travaille dans un intervalle ferm.
C'est galement le cas de la mthode de la fausse position (voir les exercices de
fin de chapitre). Les mthodes des sections qui suivent sont dites ouvertes en
ce sens qu'il n'y a pas d'intervalle dterminer ayant un changement de signe.
Au contraire des mthodes fermes, les mthodes ouvertes ne garantissent
nullement la convergence, mais elles possdent d'autres avantages. D
60
Chapitre 2
Figure 2.2: Cas pathologiques pour la mthode de la bissection
quations non linaires 61
Remarque 2.4
TI existe des cas o la mthode de la bissection achoppe. La figure 2.2 illustre
certains de ces cas. La premire situation critique est celle o la fonction f( x)
est tangente l'axe des x et ne prsente donc pas de changement de signe.
La bissection ne peut alors s'appliquer. TI y a aussi celle o deux racines
(ou un nombre pair de racines) sont prsentes dans l'intervalle de dpart;
en ce cas, il n'y a toujours pas de changement de signe. Enfin, si l'intervalle
de dpart contient un nombre impair de racines, f( x) change de signe mais
l'algorithme peut avoir des difficults choisir parmi ces racines. On peut
assez facilement viter ces cueils en illustrant graphiquement la fonction
f( x) dans l'intervalle d'intrt. D
2.3 Mthodes des points fixes
Avant d'aborder les mthodes des points fixes, il importe de dfinir ce
qu'est un point fixe d'une fonction.
Dfinition 2.2
Un point fixe d'une fonction g(x) est une valeur de x qui reste invariante
pour cette fonction, c'est--dire toute solution de:
x= g(x) (2.4)
est un point fixe de la fonction g( x).
n existe un algorithme trs simple permettant de dterminer des points
fixes. n suffit en effet d'effectuer les itrations de la faon suivante:
{
xo
Xn+l
donn
g(xn)
(2.5)
partir d'une valeur estime initiale x
0
L'intrt de cet algorithme rside
dans sa gnralit et dans la relative facilit avec laquelle on peut en faire
l'analyse de convergence. TI en rsulte l'algorithme plus complet suivant.
62 Chapitre 2
Algorithme 2.2: Algorithme des points fixes
1. tant donn t:, un critre d'arrt
2. tant donn N, le nombre maximal d'itrations
3. tant donn x
0
, une valeur estime initiale du point fixe
4. Effectuer Xn+l = g(xn)
S
. lxn+l - Xnl
5. 1 1 1 < f:
Xn+l
convergence atteinte
crire la solution Xn+l
arrt
6. Si le nombre maximal d'itrations N est atteint:
convergence non atteinte en N itrations
arrt
7. Retour l'tape 4 D
On peut rsoudre des quations non linaires de la forme f( x) = 0 en
utilisant l'algorithme des points fixes. Il suffit pour ce faire de transformer
l'quation f( x) = 0 en un problme quivalent de la forme x = g( x). L'ennui,
c'est qu'il y a une infinit de faons diffrentes de le faire. Nous verrons que
certains choix donnent lieu des algorithmes convergents et d'autres pas.
Exemple 2.4
Commenons par un exemple simple. On cherche rsoudre l'quation du
second degr x
2
- 2x- 3 = O. Il n'est pas ncessaire de recourir aux mthodes
numriques pour rsoudre ce problme, dont les deux solutions sont r
1
= 3
et r
2
= -1. Cet exemple permet cependant de mieux comprendre ce qui se
passe lorsqu'on utilise l'algorithme des points fixes. Puisqu'il y a une infinit
de faons diffrentes de transformer cette quation sous la forme x = g( x),
nous en choisissons trois au hasard. Vous pouvez bien sr recourir d'autres.
quations non linaires 63
x y2x +3
9l(x)
(en isolant x
2
)
3
92(x)
(en crivant x(x- 2)- 3 = 0) x
x-2
(2.6)
x
2
- 3
93(x)
(en isolant le x de - 2x) x
= =
2
Si on applique l'algorithme des points fixes chacune des fonctions 9i( x) en
partant de xo = 4, on obtient pour 91 (x):
Xl 91( 4)
y2 x 4 + 3 3,316 6248
X2 91(3,316 6248) y2 x 3,316 6248 + 3 3,103 7477
X3 91(3,103 7477) y2 x 3,103 7477 + 3 3,034 3855
X4 91 ( 3,034 3855) y2 x 3,034 3855 + 3 3,0114402
xw
=
91(3,000 04 70) y2 x 3,000 0470 + 3 3,000 0157
L'algorithme semble donc converger vers la racine r1 = 3. Reprenons l'exer-
cice avec 92(x ), toujours en partant de x
0
= 4:
92( 4)
3
1,5 Xl
4-2
92(1,5)
3
-6,0 X2
1,5-2
92( -6,0)
3
-0,375 X3
-6,0- 2
92( -0,375)
3
-1,263 1579 X4
-0,375- 2
92( -0,998 9841)
3
-1,0003387 xw
=
-0,998 9841- 2
On remarque que, contrairement au cas prcdent, les itrations convergent
vers la racine r
2
= -1 en ignorant la racine r1 = 3. En dernier lieu, essayons
64 Chapitre 2
l'algorithme avec la fonction 93( x):
Xt
=
93(4)
( 4)
2
- 3
6,5
2
X2 93(6,5)
(6,5)
2
- 3
19,625
2
X3 93(19,625)
=
(19,625)
2
- 3
191,0703
2
X4 93(191,0703)
(191,0703)
2
- 3
=
18252,43
2
Visiblement, les itrations tendent vers l'infini et aucune des deux solutions
possibles ne sera atteinte.
Cet exemple montre clairement que l'algorithme des points fixes, selon le
choix de la fonction itrative 9( x), converge vers l'une ou l'autre des racines
et peut mme diverger compltement dans certains cas. n faut donc une
analyse plus fine afin de dterminer dans quelles conditions la mthode des
points fixes est convergente.

2.3.1 Convergence de la mthode des points fixes
Nous nous intressons dans cette section au comportement de la mthode
des points fixes pour la rsolution de l'quation f( x) = O. On a d'abord
transform cette quation sous la forme quivalente x = 9( x). Soit r, une
valeur qui est la fois une racine de f( x) et un point fixe de la fonction 9( x),
c'est--dire qui vrifie f(r) = 0 et:
r = 9(r) (2.7)
On dfinit l'erreur l'tape n comme tant:
en= Xn- r
On cherche dterminer sous quelles conditions l'algorithme des points fixes
converge vers la racine r. Ce sera bien sr le cas si l'erreur en tend vers
quations non linaires 65
0 lorsque n devient grand. n est intressant de suivre le comportement de
l'erreur au fil des itrations. On a en vertu des relations 2.5 et 2.7:
en+l = Xn+l - r = g(xn)- g(r)
On constate aisment que:
x n = r + (x n - r) = r + en
(2.8)
et on peut alors utiliser un dveloppement de Taylor de la fonction g( x)
autour de la racine r. La relation 2.8 devient alors:
en+l g(r +en)- g(r)
(
g"(r)e
2
g"'(r)e
3
)
g(r) + g'(r)en +
2
! n +
3
! n + - g(r)
On en conclut que:
, g"(r)e'?t
en+l=g(r)en+
2
+
3
! +
(2.9)
L'tude de la relation 2.9 est fondamentale pour la comprhension des m-
thodes de points fixes. Au voisinage de la racine r, le premier terme non nul
de l'expression de droite sera dterminant pour la convergence.
Selon l'quation 2.9, si g'( r) =/:: 0 et si on nglige les termes d'ordre
suprieur ou gal 2 en en, on a:
(2.10)
On voit que l'erreur l'tape ( n+ 1) est directement proportionnelle l'erreur
l'tape n. L'erreur ne pourra donc diminuer que si:
Jg'(r)J < 1 (2.11)
La condition 2.11 est une condition ncessaire de convergence d'une mthode
de points fixes. On remarque galement que le signe de g'(r) a une influence
sur la convergence. En effet, si:
-1<g'(r)<0
l'erreur changera de signe chaque itration en vertu de l'quation 2.10 et
les valeurs de Xn oscilleront de part et d'autre der. La convergence n'en sera
pas moins assure.
66 Chapitre 2
La relation 2.10 donne de plus la vitesse laquelle l'erreur diminue. En
effet, plus g'(r) est petit, plus l'erreur diminue vite et donc plus la conver-
gence est rapide. Cela nous amne la dfinition suivante.
Dfinition 2.3
Le taux de convergence d'une mthode de points fixes est donn par lg'(r)l.
Plus le taux de convergence est petit, plus la convergence est rapide. Le
cas limite est celui o g'(r) = O. Dans ce cas, on dduit de l'quation 2.9
que l'erreur en+l est proportionnelle e ~ Cela nous amne une autre
dfinition.
Dfinition 2.4
On dit qu'une mthode de points fixes converge l'ordre p si:
(2.12)
o C est une constante. La convergence d'ordre 1 est galement dite
linaire, tandis que celle d'ordre 2 est dite quadratique.
Remarque 2.5
Si lg'(r)l < 1 et lg'(r)l =/:: 0, la mthode de points fixes converge l'ordre 1.
Si lg'(r)l = 0 et lg''(r)l =/:: 0, on a une convergence quadratique; si lg'(r)l =
lg''(r)l = 0 et lg'"(r)l =/:: 0, la convergence est d'ordre 3; et ainsi de suite. 0
Remarque 2.6
La convergence d'une mthode de points fixes est galement assujettie au
choix de la valeur initiale x
0
En effet, un mauvais choix de x
0
peut rsulter
en un algorithme divergent mme si la condition 2.11 est respecte. 0
Cela nous amne dfinir le bassin d'attraction d'une racine r.
quations non linaires
Dfinition 2.5
Le bassin d'attraction de la racine r pour la mthode de points fixes
Xn+l = g(xn) est l'ensemble des valeurs initiales x
0
pour lesquelles Xn
tend vers r lorsque n tend vers l'infini.
67
En d'autres termes, le bassin d'attraction de r comprend tous les points
x
0
pour lesquels la mthode de points fixes converge vers r. Pour s'assurer
de la convergence, il faut donc choisir x
0
dans le bassin d'attraction de r.
Intuitivement, on choisit x
0
aussi prs que possible de r en utilisant par
exemple une mthode graphique. TI faut aussi se souvenir que les problmes
rencontrs proviennent le plus souvent de l'ingnierie et que le numricien
doit utiliser ses connaissances pour estimer x
0
Par exemple, si la racine que
l'on cherche correspond une longueur ou une concentration, il serait peu
raisonnable de prendre une valeur ngative de x
0
. Trs souvent, le simple
bon sens permet de choisir x
0
avec succs.
Dfinition 2.6
Un point fixer de la fonction g(x) est dit attractif si:
lg'(r)l < 1
et rpulsif si:
19'(r )1 > 1
Le cas o lg'(r)l = 1 est indtermin.
Exemple 2.5
Considrons la fonction g( x) = x
2
qui possde les points fixes x = 0 et x = 1.
Ce dernier est rpulsif, car la drive de g( x) (2x) vaut 2 en x = 1. Le seul
point fixe intressant est donc x = O. La mthode des points fixes engendre,
partir de la valeur initiale xo, la suite:
32
Xo ...
Cette suite convergera vers 0 seulement si x
0
E ]-1, 1[. Ce dernier intervalle
68 Chapitre 2
constitue donc le bassin d'attraction de ce point fixe. Toute valeur de x
0
choisie l'extrieur de cet intervalle rsultera en un algorithme divergent .

Remarque 2.7
Dans le cas d'un point fixe rpulsif, le bassin d'attraction se rduit peu de
choses, le plus souvent l'ensemble {r} constitu d'un seul point. 0
Le rsultat suivant permet dans certains cas de s'assurer de la conver-
gence (voir Burden et Faires, rf. [2]).
Thorme 2.1
Soit g(x), une fonction continue dans l'intervalle 1 = [a,b] et telle que
g(x) E 1 pour tout x dans/. Si de plus g'(x) existe et si:
lg'(x)IS:k<l
pour tout x dans l'intervalle ouvert (a, b ), alors tous les points x
0
de
l'intervalle 1 appartiennent au bassin d'attraction de l'unique point fixe r
de/. o
Remarque 2.8
il est possible que la mthode des points fixes converge dans le cas o:
lg'(r)l = 1
il s'agit d'un cas limite intressant. Nous verrons plus loin un exemple de
cette situation. La convergence dans ce cas est au mieux extrmement lente,
car le taux de convergence est prs de 1. 0
Exemple 2.6
Revenons aux trois fonctions 9i(x) de l'exemple prcdent. On veut s'assurer
que la condition 2.11 est vrifie l'une ou l'autre des racines r
1
= 3 et
quations non linaires
r
2
= -1. On doit d'abord calculer les drives:
9i(x) =
9 ~ x )
9j(x) =
1
v2x+3
-3
(x- 2)
2
x
Les rsultats sont compils dans le tableau suivant.
r
1
= 3 r
2
= -1
9i(r) 0,333 33 1
9 ~ r )
-3 -0,333 33
9 ~ r )
3 -1
69
Ce tableau aide comprendre les rsultats obtenus prcdemment. La
mthode de points fixes applique 9
1
(x) a converg vers r
1
= 3, puisque
9i(3) < 1. De mme, avec 9
2
(x), la mthode de points fixes ne peut converger
vers r
1
= 3, car la drive de 9
2
( x) en ce point est plus grande que 1. Les
itrations ignorent r
1
et convergent vers r
2
, o la valeur de la drive est
infrieure 1.
Enfin, la fonction 9
3
( x) a galement une drive plus grande que 1 en
r1. L'analyse de la convergence autour de r
2
= -1 est plus subtile. En
effet, puisque 9j(x) = x, on constate que la valeur absolue de la drive
est infrieure 1 droite de r
2
et suprieure 1 gauche de r
2
De plus,
cette drive est ngative, ce qui signifie que la mthode des points fixes
oscillera de part et d'autre de la racine. une itration, la pente 9'(xn) sera
infrieure 1 et l'itration suivante la pente 9'(xn+1) sera suprieure 1 en
valeur absolue. On en conclut que l'algorithme de points fixes s'approchera
lgrement de r
2
une itration et s'en loignera la suivante. En un mot,
l'algorithme pitinera. On peut vrifier ce raisonnement en effectuant les
itrations partir de x
0
= -0,95. On obtient aprs l 000 itrations la valeur
x10ooo = -0,986 36, ce qui signifie que la convergence est extrmement lente .

70 Chapitre 2
Exemple 2.7
Considrons la fonction g( x) = x
2
+ 1 j 4 dont l'unique point fixe est 1/2.
On a bien sr g'(x) = 2x, qui vaut prcisment 1 en 1/2. En partant de
x
0
= 1/4, on obtient la valeur 0,4990095 aprs 1000 itrations et donc une
convergence trs lente. Cela s'explique par le fait que la drive de g(x)
est lgrement infrieure 1 pour les valeurs de x infrieures 1/2 et que
les rsultats des itrations restent toujours infrieurs 1/2. Par contre, en
partant de x
0
= 0,51, l'algorithme diverge violemment aprs une centaine
d'itrations. On constate aisment que la drive de g( x) est suprieure 1
pour les valeurs de x suprieures 1/2 .

2.3.2 Interprtation gomtrique
L'algorithme de points fixes possde une interprtation gomtrique trs
lgante qui permet d'illustrer la convergence ou la divergence. La figure 2.3
prsente les diffrents cas possibles: 0 < g'(r) < 1, -1 < g'(r) < 0 et
g'(r) > 1. On peut interprter cette figure de la manire suivante. Les courbes
y = x et y = g( x) sont reprsentes et les points fixes sont bien entendu
l'intersection de ces deux courbes. partir de la valeur initiale x
0
, on se
rend sur la courbe y= g(x) au point (x
0
,g(x
0
)) et de l sur la droite y= x
au point (g( x
0
), g( x
0
) ), qui est en fait ( Xt, xt). On recommence le mme
processus partir de x1 pour se rendre ( x
1
, g( xl)) et de l sur la droite
y= x au point (g(xl),g(xt)) = (x2,x2). On rpte ce trajet jusqu' la
convergence (ou la divergence) de l'algorithme.
On voit immdiatement la diffrence de comportement entre les cas
convergents 0 < g' ( r) < 1 et -1 < g' ( r) < O. Bien que les itrations oscillent
de part et d'autre de la racine lorsque la pente est ngative, la convergence
n'en est pas moins assure. Par contre, lorsque la pente est suprieure 1,
les itrations s'loignent de la racine recherche. On obtiendrait un rsultat
similaire dans le cas o g' ( r) < -1; les itrations s'loigneraient de la racine
en oscillant de part et d'autre de la racine.
Nous terminons cette section par un dernier exemple qui illustre la conver-
gence gnralement linaire des mthodes de points fixes.
quations non linaires 71
y= g(x)

Figure 2.3: Interprtation gomtrique de la mthode des points fixes
72 Chapitre 2
Exemple 2.8
On considre la rsolution de e-x -x = 0, que l'on transforme en un problme
de points fixes x = e-x. En partant de xo = 0 et en posant en = Xn - r,
l'erreur l'tape n, on obtient le tableau suivant.
n Xn
lenl
~
1 1,000 0000 0,4328 X 10+u -
2 0,367 8794 0,1992 X 10+
0
0,4603
3 0,692 2006 0,1250 x 10+
0
0,6276
4 0,5004735 0,6667 x 10-
1
0,5331
5 0,606 2435 0,3910 x 10-
1
0,5864
6 0,545 3957 0,2174 x 10-
1
0,5562
7 0,579 6123 0,1246 x 10-
1
0,5733
14 0,566 9089 0,2344 x 10-
3
0,5670
15 0,5672762 0,1329 x 10-
3
0,5672
35 0,5671433 ~ o 0,5671
Pour remplir ce tableau, on a d'abord calcul la racine r = 0,567143 29, ce
qui a permis d'valuer les erreurs par la suite. L'analyse de ce tableau il-
lustre plusieurs points dj discuts. En premier lieu, on constate la conver-
gence vers la racine r = 0,567143 29 puisque l'erreur en tend vers O. Fait
plus important encore, la troisime colonne converge vers environ 0,5671. Ce
nombre n'est pas arbitraire. En effet, en vertu de la relation 2.10, ce ratio
doit converger vers lg'(r)l, qui vaut dans cet exemple 0,56714. On constate
bien la convergence de ce ratio vers lg'(r)l pour cet exemple .

2.3.3 Extrapolation d'Aitken
partir d'une mthode de points fixes convergeant l'ordre 1, on peut
obtenir une mthode convergeant l'ordre 2. il suffit de remarquer que pour
une mthode d'ordre 1:
quations non linaires
et
On a alors immdiatement:
c'est--dire
x2- r x1- r
~
x1- r xo- r
En isolant r, on trouve facilement que:
x2xo- xi
r ~
x2- 2x1 + xo
73
qui est une formule numriquement instable. On lui prfrera l'expression
quivalente:
(2.13)
La relation 2.13 est dite formule d'extrapolation d'Aitken et permet d'ob-
tenir partir de x
0
, x1 et x
2
une meilleure approximation du point fixe r.
Cela peut rsulter en un algorithme qui acclre grandement la convergence
d'une mthode de points fixes. C'est l'algorithme de Steffenson.
Algorithme 2.3: Algorithme de Steffenson
1. tant donn E, un critre d'arrt
2. tant donn N, le nombre maximal d'itrations
3. tant donn xo, une valeur estime initiale du point fixe
4. Effectuer:
x1 = g(xo)
x2 = g(xl)
convergence atteinte
74 Chapitre 2
crire la solution Xe
arrt
6. Si le nombre maximal d'itrations N est atteint:
convergence non atteinte en N itrations
arrt
7. xo = Xe et retour l'tape 4 D
Exemple 2.9
Reprenons l'exemple prcdent de la mthode des points fixes:
( )
-Xn
Xn+l = 9 Xn = e
en partant de x
0
= O. L'algorithme de Steffenson consiste faire deux it-
rations de points fixes, extrapoler pour obtenir xe, faire deux nouvelles
itrations de points fixes partir de xe, extrapoler nouveau et ainsi de
suite. On obtient dans ce cas:
1,0
0,367 8794
La valeur extrapole est alors:
(1- 0)
2
Xe = 0- 0,367 8794- 2(1) + 0 = 0,612 6998
partir de cette nouvelle valeur, on fait deux itrations de points fixes:
xl = e-0,6126998 = 0,5418859
x2 = e-0,5418859 = 0,5816503
La valeur extrapole est alors:
Xe =
8 (0,541 8859- 0,612 6998)
2
o,
612 699
- 0,5816503- 2(0,5418859) + 0,612 ?998
0,567 3509
quations non linaires 75
En continuant ainsi, on obtient:
xo Xl X2 Xe
0,567 3509 0,5670256 0,567 2101 0,5671433
0,5671433 0,5671433 0,5671433 0,5671433
On remarque que la convergence est plus rapide avec l'algorithme de Steffen-
son qu'avec la mthode de points fixes dont elle est issue. Quatre itrations
suffisent pour obtenir la mme prcision. On peut montrer en fait que la
convergence est quadratique. On note toutefois que chaque itration de l'al-
gorithme de Steffenson demande plus de calculs qu'une mthode de points
fixes. n y a un prix payer pour obtenir une convergence quadratique .

2.4 Mthode de Newton
La mthode de Newton est l'une des mthodes les plus utilises pour la
rsolution des quations non linaires. Cette mthode possde galement une
belle interprtation gomtrique. Nous commenons cependant par donner
une premire faon d'en obtenir l'algorithme, base sur l'utilisation du dve-
loppement de Taylor. Cette approche est galement valable pour les systmes
d'quations non linaires que nous verrons au chapitre 3.
Soit une quation rsoudre de la forme:
f(x)=O
partir d'une valeur initiale x
0
de la solution, on cherche une correction 8x
telle que:
0=f(xo+8x)
En faisant un dveloppement de Taylor autour de x = x
0
, on trouve:
0 = f(xo) + f'(xo)8x +

+

+
il suffit maintenant de ngliger les termes d'ordre suprieur ou gal 2 en
8x pour obtenir:
0 f(xo) + f'(xo)8x
On peut alors isoler la correction recherche:
0
__ f(xo)
x- f'(xo)
76 Chapitre 2
La correction 8x est en principe la quantit que l'on doit ajouter x
0
pour
annuler la fonction f(x). Puisque nous avons nglig les termes d'ordre su-
prieur ou gal 2 dans le dveloppement de Taylor, cette correction n'est
pas parfaite et on pose:
Xt = xo + 8x
On recommence le processus en cherchant corriger x
1
d'une nouvelle quan-
tit 8x. On obtient alors 1 'algorithme suivant.
Algorithme 2.4: Algorithme de la mthode de Newton
1. tant donn E, un critre d'arrt
2. tant donn N, le nombre maximal d'itrations
3. tant donn x
0
, une valeur initiale de la solution
f(xn)
4. Effectuer: Xn+l = Xn- f'(xn)
S
. lxn+l- Xnl
5. 1 1 1 < E:
Xn+l
convergence atteinte
crire la solution Xn+l
arrt
6. Si le nombre maximal d'itrations N est atteint:
convergence non atteinte en N itrations
arrt
7. retour l'tape 4 D
Remarque 2.9
L'algorithme de la mthode de Newton est un cas particulier de celui de la
mthode des points fixes o:
g(x) =x- f(x) D
f'(x)
quations non linaires 77
Exemple 2.10
On cherche rsoudre l'quation f(x) = e-x - x = O. Pour utiliser la
mthode de Newton, il faut obtenir la drive de cette fonction, qui est
f'(x) = -e-x 1. L'algorithme se rsume :
!( Xn) e-Xn - Xn
Xn+1 = Xn - -J'( ) = Xn - -x
1 Xn -e n-
Les rsultats sont compils dans le tableau suivant partir de x
0
= O.
n Xn
lenl
1 ~ l 1
0 0,000 0000 0,5671 X 10+
0
-
1 0,500 0000 0,6714 x 10-
1
0,1183 X 10+
0
2 0,566 3110 0,8323 x 10-
3
0,1239 x 10-
1
3 0,5671432 0,1250 x 10-
6
0,1501 x 10-
3
4 0,5671433 0,4097 x 10-
9
~ o
On remarque la convergence trs rapide de cette mthode. il suffit en effet
pour s'en convaincre de comparer ces valeurs avec les rsultats obtenus avec
la mthode des points fixes pour le mme problme. On note galement que
le nombre de chiffres significatifs double chaque itration. Ce phnomne
est caractristique de la mthode de Newton et nous en verrons la raison au
moment de l'analyse de convergence. La dernire colonne, qui converge vers
0, donne une indication ce sujet. Cette colonne est cense converger vers
lg'(r)l, qui est donc nul dans ce cas, ce qui semble indiquer que la convergence
est quadratique.

2.4.1 Interprtation gomtrique
La figure 2.4 permet de donner une interprtation gomtrique assez
simple de la mthode de Newton. Sur cette figure, on a reprsent la fonc-
tion f(x), la valeur initiale xo et le point (xo,f(x
0
)) qui est sur la courbe.
La droite tangente la courbe en ce point est de pente f'(x
0
) et a pour
quation:
Y= f(xo) + f'(xo)(x- xo)
78 Chapitre 2
' '
----------- ~ ~ ~ _,.....,.._ :--....-.--:.;;,;,.;-- ~ ..:.:..:. --.:.::..:..--:..:..:..:-- ~
r
Figure 2.4: Interprtation gomtrique de la mthode de Newton
qui correspond au dveloppement de Taylor de degr 1 autour de x
0
Cette
droite coupe l'axe des x en y = 0, c'est--dire en:
f(xo)
Xt = xo- f'(xo)
qui devient la nouvelle valeur estime de la solution. On reprend ensuite le
mme raisonnement partir du point (xt, f(x
1
)) et ainsi de suite.
2.4.2 Analyse de convergence
La mthode de Newton est un cas particulier de la mthode des points
fixes o:
f(x)
g(x) =x- f'(x)
ll n'est donc pas ncessaire de reprendre l'analyse de convergence zro. En
effet, on sait que la convergence dpend de g'(r) et on a dans ce cas prcis:
, (f'(x))
2
- f(x)J"(x) f(x)f"(x)
g (x)= 1- (f'(x))2 = (f'(x))2
(2.14)
Puisque f(r) = 0, r tant une racine, on a immdiatement g'(r) = 0 et donc
une convergence au moins quadratique en vertu de la relation 2.9.
quations non linaires 79
Remarque 2.10
ll faut noter que dans le cas o f'(r) est galement nul, le rsultat prcdent
n'est plus vrai dans la mesure o g'(r) pourra tre diffrent de O. Nous
tudierons cette question en dtail un peu plus loin. 0
Pour s'assurer que la convergence de la mthode de Newton est bel et
bien quadratique en gnral, il suffit de calculer g"( r ). On a, en vertu de
l'quation 2.14:
, [f'(x)f"(x) + f(x)f"'(x)](f'(x))2- 2f(x)f'(x)(f"(x))2
g (x)= (f'(x))
4
(2.15)
On en conclut que puisque /( r) = 0:
g" ( r) = J" ( r)
f'(r)
et que g"(r) n'a a priori aucune raison d'tre nul. ll reste que l'on a suppos
que f'(r) =/= 0, ce qui n'est pas toujours vrai. Enfin, de la relation 2.9 on
dduit:
"' g" ( r) 2 - !" ( r) 2
en+1 - -2-en - 2/'(r) en
qui dmontre bien la convergence quadratique (si f'(r) =/= 0).
Exemple 2.11
Reprenons l'exemple o on doit calculer J2 en rsolvant:
f(x)=x
2
-2=0
(2.16)
Dans ce cas, f'(x) = 2x et f'(J2) = 2J2 =/=O. On doit donc s'attendre une
convergence quadratique. Voici les rsultats obtenus l'aide de la mthode
de Newton.
n Xn
lenl
1 = ~

1
1:?--1
en-1
0 2,0000000 0,5858 X 10+u -
-
1 1,5000000 0,8578 x 10-
1
0,1464 x 10+
0
0,0868
2 1,4166666 0,2453 x 10-
2
0,2860 x 10-
1
0,3333
3 1,414 2157 0,2124 x 10-
5
0,8658 x 10-
3
0,3529
4 1,414 2136 0,1594 x 10-
11
0,7508 x 10-
6
0,3535
80 Chapitre 2
Le tableau prcdent est encore une fois trs instructif. On remarque que
en tend vers 0 et que le ratio len/ en-11 tend aussi vers 0 (c'est--dire vers
g'(r), qui est 0 dans ce cas). De plus, le ratio l e n f e ~ _

l tend vers peu prs


0,3535. Encore une fois, ce nombre n'est pas arbitraire et correspond :
f"(r) = J"( V2) = -
1
- ~ 0 353 553
2/'(r) 2f'(V2) 2yi2 '
en vertu de la relation 2.16.

Remarque 2.11
Tout comme c'tait le cas avec la mthode des points fixes, la convergence
de la mthode de Newton dpend de la valeur initiale x
0
Malgr ses belles
proprits de convergence, une mauvaise valeur initiale peut provoquer la
divergence de cette mthode. 0
2.4.3 Cas des racines multiples
ll arrive parfois que la mthode de Newton ne converge pas aussi vite que
l'on s'y attendait. Cela est souvent le signe d'une racine multiple, dont nous
rappelons la dfinition.
Dfinition 2. 7
Une racine r de la fonction f( x) est dite de multiplicit m si la fonction
f(x) peut s'crire sous la forme:
f(x) =(x- r)mh(x) (2.17)
et ce pour une fonction h( x) qui vrifie h( r) -:/= O.
Si on a une racine de multiplicit men x= r, on peut mettre en facteur
un terme de la forme (x - r )m de telle sorte que le reste h( x) ne s'annule
pas en x= r.
ll est facile de dmontrer, en utilisant un dveloppement de Taylor autour
de r, que le rsultat suivant est vrai.
quations non linaires 81
Thorme 2.2
Une racine r est de multiplicit m (o m est un entier) si et seulement
SI:
f(r) = J'(r) = J"(r) = = j(m-l)(r) = 0, f(m)(r)-:/= 0 (2.18)
c'est--dire si la fonction de mme que ses ( m- 1) premires drives s'an-
nulent en r (la drive d'ordre m ne doit pas s'annuler en r ). 0
Exemple 2.12
La fonction f( x) = x sin x possde une racine de multiplicit 2 en x = O. En
effet:
f(x) xsinx
J' (x) = sin x + x cos x
J" (x) = 2 cos x - x sin x
et on conclut aisment que f(O) = 0 , f'(O) = 0 et f"(O)-:/= O .

Qu'arrive-t-il si on applique la mthode de Newton ce cas? Rappelons
que:
'( ) _ f(x)f"(x)
g x - (J'( x ))2
et que, si on est en prsence d'une racine de multiplicit m, on a:
f(x) (x-rrh(x)
J'( x) m(x- r)m-
1
h(x) +(x- r)mh'(x)
J"( x) m(m- 1)(x- r)m-
2
h(x)
+ 2m(x- r)m-lh'(x) +(x- rrh"(x)
En remplaant et en simplifiant le facteur (x- r )
2
m-
2
, on trouve:
g'(x) = h(x)[m(m- 1)h(x) + 2m(x- r)h'(x) +(x- r?h"(x)]
[mh(x) +(x- r)h'(x)]2
Cela entrane que:
'( ) _ h(r)[m(m-1)h(r)+ 0]
g r - m2(h(r))2
82 Chapitre 2
Puisque h(r)-:/= 0, on peut simplifier cette relation et obtenir:
1 1
g (r) = 1--
m
On constate maintenant que g'(r) = 0 seulement si m = 1, c'est--dire
si on a une racine simple (de multiplicit 1 ). La convergence ne sera donc
quadratique que pour les racines simples. Si m =/= 1, la mthode de Newton
converge linairement avec un taux de convergence de 1-1/m. On remarque
aussi que plus m est grand, plus la convergence est lente, car g'(r) est de
plus en plus prs de 1.
Exemple 2.13
On considre la rsolution de
En partant de x
0
= 0, on obtient le tableau suivant.
n Xn
lenl
1 e::0
1
1
~
en-1
0 0,000 0000 1,0000
-
1 0,428 5714 0,5714 0,5714 0,5714
2 0,685 7143 0,3142 0,5499 0,9625
3 0,832 8654 0,1671 0,5318 1,6926
4 0,9133299 0,0866 0,5185 3,1017
5 0,955 7833 0,0442 0,5102 5,8864
6 0,977 6551 0,0223 0,5045 11,429
On voit tout de suite que la convergence vers la racine r = 1 est lente.
On vrifie aisment que /(1) = /'(1) = 0 et donc que 1 est une racine
de multiplicit 2 (m = 2). Cela est confirm par la quatrime colonne du
tableau, qui doit normalement converger vers 1- 1/m, c'est--dire vers 0,5
dans ce cas prcis. On note enfin que les valeurs de la dernire colonne
semblent augmenter sans cesse et tendre vers l'infini. Cela indique une fois
de plus que la convergence est linaire et non quadratique .

n existe des moyens de rcuprer la convergence quadratique dans le
cas de racines multiples. ll suffit en effet de transformer le problme en un
quations non linaires 83
problme quivalent ayant les mmes racines, mais de multiplicit 1. Dans
cette optique, considrons la fonction:
On a immdiatement:
u(x) = f(x)
f'(x)
(x- r)h(x)
mh(x) +(x- r)h'(x)
et
u'(x)
[h(x) +(x- r)h'(x)][mh(x) +(x- r)h'(x)]
[mh(x) +(x- r)h'(x)F
[(x- r)h(x)][mh'(x) + h'(x) +(x r)h"(x)]
[mh(x) +(x- r)h'(x)F
Puisque h(r) =/= 0, on a u(r) = 0 mais aussi u'(r) = 1/m =/=O. rest donc
une racine simple de u( x), mais une racine multiple de f( x). On peut ds
lors appliquer l'algorithme de Newton la fonction u( x) pour trouver cette
racine. L'algorithme devient:
ou plus succinctement:
(2.19)
On note que cet algorithme requiert la connaissance de f(x), de f'(x)
et de f"(x), ce qui peut rendre laborieux le processus de rsolution. Si on
reprend le problme de l'exemple prcdent en utilisant cette fois l'algo-
rithme 2.19, on retrouve la convergence quadratique, comme en tmoignent
les rsultats suivants.
n
Xn lenl
l ~ ~ l 1
lfl---1
en-1
0 0,000000 0,1000 x 10+1
- -
1 1,105 263 0,1053 x 10+
0
0,1052 x 10+
0
0,1053
2 1,003 082 0,3081 x 10-
2
o,2927 x w-
1
0,2781
3 1,000002 0,2382 x w-s 0,7729 x 10-
3
0,2508
84 Chapitre 2
Figure 2.5: Cas pathologique pour la mthode de Newton
Remarque 2.12
n existe un autre algorithme qui permet de rcuprer la convergence qua-
dratique de la mthode de Newton, mais il exige de connatre l'avance
la multiplicit m de la racine recherche. Cela est videmment trs rare en
pratique. On retrouvera cet algorithme dans les exercices de fin de chapitre.
0
Exemple 2.14
Les racines multiples ne sont pas la seule source de difficults que l'on peut
rencontrer avec la mthode de Newton. Quelques cas pathologiques, comme
celui qu'illustre la figure 2.5, aboutissent la divergence de l'algorithme. Le
choix de la valeur initiale x
0
est primordial, car la convergence de l'algorithme
en dpend fortement. Dans l'exemple de la figure 2.5, une valeur de xo plus
prs de la racine r permettrait de retrouver la convergence .

quations non linaires 85
2.5 Mthode de la scante
La mthode de Newton possde de grands avantages, mais elle ncessite
le calcul de la drive de f( x). Si la fonction f( x) est complexe, cette drive
peut tre difficile valuer et peut rsulter en une expression complexe. On
contourne cette difficult en remplaant le calcul de la pente J'( xn) de la
droite tangente la courbe par l'expression suivante:
Cela revient utiliser la droite scante passant par les points (xn, f(xn))
et (xn-b f(xn-t)) au lieu de la droite tangente passant par (xn, f(xn)). Ce
choix est reprsent la figure 2.6. ll en rsulte l'algorithme suivant.
Algorithme 2.5: Algorithme de la mthode de la scante
1. tant donn E, un critre d'arrt
2. tant donn N, le nombre maximal d'itrations
3. tant donn xo et Xt, deux valeurs initiales de la solution
4. Effectuer:
5
Si lxn+l- Xnl < E:
. lxn+tl
convergence atteinte
crire la solution Xn+l
arrt
6. Si le nombre maximal d'itrations N est atteint:
convergence non atteinte en N itrations
arrt
7. retour l'tape 4 0
86 Chapitre 2
',,\ (x
1
j(x
1
))
'
(x2j(x2 ))
' .
0 . . , ~ -
--- -!------------- -!------- :--------- -!----------------- :
: : : : :
' ' ' ' .
r
Figure 2.6: Interprtation gomtrique de la mthode de la scante
Remarque 2.13
Plusieurs remarques s'imposent au sujet de cet algorithme.
1. La drive de f(x) n'apparat plus dans l'algorithme.
2. ll faut fournir au dpart 2 valeurs initiales. C'est ce qu'on appelle un
algorithme deux pas.
3. On choisit les valeurs initiales le plus prs possible de la racine recher-
che. Il n'est cependant pas ncessaire qu'il y ait un changement de
signe dans l'intervalle [xo, x
1
], comme c'est le cas avec la mthode de
la bissection.
4. L'analyse de convergence de cet algorithme est plus dlicate que celle
de la mthode de Newton. On est cependant en mesure d'avancer que
la convergence quadratique est perdue, mais que la convergence est plus
que linaire. En effet, on peut montrer (voir Conte et de Boor, rf. [6])
que:
lVs
len+tl ~ Clenl
2
= Clenl
1
'
618033

Cet ordre de convergence quelque peu tonnant vient justement du fait
que la mthode est deux pas. 0
quations non linaires 87
illustrons cette mthode l'aide d'un exemple.
Exemple 2.15
On cherche rsoudre:
que nous avons dj abord par d'autres mthodes. En prenant x
0
= 0 et
x
1
= 1, on trouve la premire itration:
(e-
1
- 1)(1- 0)
1- (e_
1
_
1
) _ (eO _ O) = 0,6126998
Les rsultats sont compils dans le tableau suivant.
n Xn
lenl
1 1 1-#rs-1
en-1
n-1
0 0,000 0000 0,5671 X 10+u - - -
1 1,000 0000 0,4328 x 10+
0
0, 7632 x 10+
0
1,0835 1,342
2 0,612 6998 0,4555 x 10-
1
0,1052 x 10+
0
0,1766 0,243
3 0,563 8384 0,3305 x 10-
2
0,7254 x 10-
1
0,4894 1,592
4 0,5671704 0,2707 x 10-
4
0,8190 x 10-
2
0,2796 2,478
5 0,5671433 0,1660 x 10-
7
0,6134 x 10-
3
0,4078 22,66
6 0,5671433
La chose la plus importante remarquer est que le ratio len/ en-1l tend vers
0 mais que le ratio len/

tend vers l'infini, ce qui confirme que l'ordre


de convergence se trouve quelque part entre 1 et 2. On remarque que le
quotient len/

semble se stabiliser autour de 0,4 bien que la prcision


soit insuffisante pour tre plus affirmatif. ll semble bien que cette suite ne
tend ni vers 0 ni vers l'infini, ce qui confirme que l'ordre de convergence se
situe autour de 1,618.

88 Chapitre 2
Figure 2. 7: Problme de la poutre encastre
2.6 Applications
Nous prsentons dans cette section quelques exemples d'applications des
mthodes numriques vues dans ce chapitre des problmes d'ingnierie.
Chaque problme est brivement dcrit de manire donner une ide assez
prcise du contexte, sans toutefois s'attarder sur les dtails.
2.6.1 Modes de vibration d'une poutre
Une poutre de longueur L encastre aux deux extrmits (voir la fi-
gure 2.7) subit une dformation au temps t = 0 et se met par la suite
vibrer. La dformation u(x, t) de la poutre la position x et au temps test
solution de:
(2.20)
qui est une quation aux drives partielles d'ordre 4. La constante c dpend
de l'lasticit de la poutre. Les conditions aux limites traduisent l'tat de la
poutre chaque extrmit. Nous avons choisi le cas o celle-ci est encastre,
ce qui impose les conditions:
u(O, t) = u(L, t) = 0
Ux(O, t) = Ux(L, t) = 0
(fixe aux 2 extrmits)
( aux 2 extrmits)
(2.21)
quations non linaires 89
Des conditions relatives la dformation u(x, 0) et la vitesse Ut( x, 0) ini-
tiales compltent ce systme.
Une mthode classique de rsolution de l'quation 2.20 consiste sparer
les variables (voir Kreyszig, rf. [15]) et rechercher des solutions de la forme:
u(x, t) = F(x)G(t) (2.22)
Les conditions aux limites 2.21 imposent des conditions la fonction F( x),
qui sont:
F(O) = F(L) = 0
F'(O) = F'(L) = 0
En remplaant l'quation 2.22 dans l'quation 2.20, on obtient:
F""( x)
F(x)
G"(t)
c
2
G(t)
(2.23)
o on remarque l'galit d'une fonction de x et d'une fonction de t, pour
tout x et t. Cela n'est possible que si les deux fonctions sont gales une
constante. On peut vrifier que cette constante ne peut tre ngative ou
nulle et nous la notons {3
4
On en vient considrer les deux quations
diffrentielles ordinaires:
F""( x) - {3
4
F( x) = 0
G"(t) + c
2
f3
4
G(t) = 0
dont les solutions respectives sont de la forme
2
:
F( x) = A cos(f3x) + B sin(f3x) + C cosh(f3x) + D sinh(f3x)
G(t) = acos(cf3
2
t) + bsin(cf3
2
t)
On conclut de plus que:
F' (x) = {3(- A sin(f3x) + B cos(f3x) + C sinh(f3x) + D cosh(f3x))
2
cosh x et sinh x sont les fonctions hyperboliques dfinies par:
ex+ e-x
coshx = et
2
x -x
e - e
sinh x=
2
d'o l'on tire les proprits classiques (laisses en exercices):
( cosh x)
1
= sinh x, (sinh x)'= cosh x et cosh
2
x- sinh
2
x= 1
(2.24)
90 Chapitre 2
La constante f3 est pour le moment arbitraire. Les conditions 2.23 impo-
sent les contraintes:
F(O)=A+C=O
F'(O) = f3(B + D) = 0
La fonction F(x) peut alors s'crire:
c.--d. C = -A
c.--d. D = - B
F( x) = A( cos(f3x) - cosh(f3x)) + B( sin(f3x) - sinh(f3x))
et sa drive:
F' (x) = {3( A(- sin(f3x) - sinh(f3x)) + B( cos(f3x) - cosh(f3x)))
Les deux dernires conditions aux limites imposent:
F(L) = A(cos(f3L)- cosh(f3L)) + B(sin(f3L)- sinh(f3L)) = 0
F'(L) = f3(A(- sin(f3L)- sinh(f3L)) + B(cos(f3L)- cosh(f3L))) = 0
ce qui peut encore s'exprimer sous la forme du systme linaire:
[
( cos(f3 L) - cosh(f3 L)) ( sin(f3 L) - sinh(f3 L)) l [ A l [ 0 l
-f3(sin(f3L) + sinh(f3L)) f3(cos(f3L)- cosh(f3L)) B 0
Si la matrice prcdente est inversible, la seule solution possible est
A = B = 0, ce qui signifie que F( x) = 0, qui est une solution triviale.
Pour obtenir des solutions non triviales, le dterminant doit tre nul, ce qui
signifie que:
f3(cos(f3L)- cosh(f3L))
2
+ f3(sin(f3L)- sinh(f3L))(sin(f3L) + sinh(f3L)) = 0
c'est--dire
1 - cos(f3L) cosh(f3L) = 0 (2.25)
Les seules valeurs intressantes de f3 sont celles qui vrifient cette quation
non linaire. On est amen rechercher les racines de la fonction:
f(x) = 1- cosxcoshx
Cette fonction varie fortement, car cosh x prend des valeurs trs grandes
tandis que cos x oscille du positif au ngatif. Pour simplifier le traitement
numrique, une bonne stratgie consiste considrer la fonction:
1 - cos x cosh x 1
ft(x) = =---cos x
cosh x coshx
quations non linaires 91
1,5
1,0
0,5
0,0
-0,5
-1,0
0 2 4 6 8 10 12 14
Figure 2.8: Fonction ft (x) = (1- cos x cosh x)/ cosh x
qui possde les mmes racines que f( x) et qui est illustre la figure 2.8.
Heureusement, il est suffisant de trouver les premires racines seulement, qui
correspondent aux modes de vibration les plus importants.
On constate aisment l'aide de la figure qu'il y a un changement de
signe dans les intervalles [3, 5], [6, 8] et [10, 12]. La mthode de la bissec-
tion applique chacun de ces trois intervalles converge vers x
1
= 4,730,
x
2
= 7,853 et x
3
= 10,996, correspondant aux trois premiers modes de vi-
bration. On pbtient les valeurs respectives de f3 en divisant les Xi par la
longueur L de la poutre. D'autres mthodes de rsolution d'quations non
linaires que nous avons vues dans ce chapitre auraient pu donner des rsul-
tats similaires.
2.6.2 Premier modle de viscosit
Les polymres (plastiques) sont largement utiliss pour la production
d'objets de toutes sortes, allant des simples jouets jusqu' bon nombre de
pices d'automobile. La mise en forme de ces polymres requiert une tape
de plastification o le polymre est fondu dans le but de lui donner sa forme
finale, trs souvent par moulage. Un des paramtres fondamentaux de cette
92 Chapitre 2
tape est la viscosit. Les rhologues ont pour tche de dterminer comment
varie cette viscosit 'Tf en fonction du taux de cisaillement ")t. Des appareils
nomms rhomtres permettent de mesurer la viscosit pour diffrentes va-
leurs du taux de cisaillement. On obtient alors des rsultats de la forme
suivante.
Taux de cisaillement Viscosit
i'i(s-
1
) 'f/i(Pa s)
0,0137 3220,0
0,0274 2190,0
0,0434 1640,0
0,0866 1050,0
0,137 766,0
0,274 490,0
0,434 348,0
0,866 223,0
1,37 163,0
2,74 104,0
4,34 76,7
5,46 68,1
6,88 58,2
Ces valeurs caractrisent une solution de 2% de polyisobutylne dans du
primol 355 (voir Carreau, De Kee et Chhabra, rf. [3]). On cherche ensuite
modliser cette variation selon une loi aussi simple que possible. Un modle
trs populaire est la loi puissance de la forme:
'Tf = 'f/oi'/3-1 (2.26)
o 'fjo est la consistance et f3 est l'indice de pseudoplasticit. Ces deux der-
niers paramtres sont inconnus et doivent tre dtermins partir des don-
nes du tableau. On doit choisir ces paramtres de faon rendre compte
le mieux possible des donnes. Un moyen courant d'y parvenir consiste
minimiser la fonction:
1
npt
F( 'f/o, {3) = 2 2:) 'f/oi'f-
1
- 'f/i)
2
i=1
o npt est le nombre de mesures. C'est ce qu'on appelle une mthode de
moindres carrs qui permet de minimiser la distance entre les points de
mesure et la courbe reprsente par la relation 2.26.
quations non linaires

Viscosit
(Pa s)
1000
lOO
Exprience
Modle
<>

0,01 0,1
Taux de cisaillement (lis)
Figure 2.9: Loi puissance: 'Tf= ry
0
-=yf3-
1
({3 = 0,3797, 'f/o = 228,34)
L'cart minimal est atteint lorsque:
8F( 'f/o, {3) = 8F( 'f/o, {3) =
0
8ryo 8{3
On obtient ainsi les conditions d'optimalit
3
:
8F( 'f/o, f3) _ tJ-1 ). /3-1 _
0
- L...J 'f/O'Yi - 'f/z 'Yi -
8ryo i=1
8F( 'fjo, {3)
8{3
npt
""'( . f]-1 ) . /3-11 . 0
L...J 'f/O'Yi - 'f/i 'f/O'Yi n'Yi =
i=1
10
93
De la premire quation, on tire une expression pour 'f/o en fonction de f3 de
la forme:
npt
L.:'f/f-
1
i=1
'flo = _n_p_t ----- (2.27)
L -=r:f]-2
i=1
3
La drive par rapport x de af(x) est af(x)f'(x)lna.
94 Chapitre 2
n reste donc trouver {3, solution de:
!({3)
_ F( 11o, {3) _ ~ . {3-1 ) . /3-1
1
. _
0
- f3 - 1--- 170/i - 1 1 ~ 17o/i n 1 ~ -
~ = 1
o 17o est donn par l'quation 2.27. n n'est pas facile d'tablir la drive de
la fonction f(f3). Dans le cas prsent, la mthode de la scante est presque
aussi efficace que la mthode de Newton. L'indice de pseudoplasticit f3 est un
nombre positif compris entre 0 et 1. partir des valeurs initiales f3o = 0,5 et
{3
1
= 0,4, la mthode de la scante a converg en 4 itrations vers f3 = 0,3797
ce qui donne une valeur 17o = 228,34 en vertu de l'quation 2.27.
La figure 2.9 trace les points de mesure de mme que la courbe de l'qua-
tion 2.26 pour ces valeurs. On remarque immdiatement que la correspon-
dance n'est pas parfaite. Nous verrons au prochain chapitre un autre modle
qui colle davantage aux donnes rhologiques, mais qui ncessite la rsolution
d'un systme d'quations non linaires.
quations non linaires 95
2. 7 Exercices
1. Faire trois itrations de la mthode de la bissection pour les fonctions
suivantes et partir des intervalles indiqus. Dterminer le nombre
d'itrations ncessaires pour obtenir une solution dont le chiffre des
millimes est significatif.
a) f(x) = -0,9x
2
+ 1,7x + 2,5 dans l'intervalle [2,8 ,3,0]
1- 0,61x .
b) f( x) = dans l'mtervalle [1,5, 2,0]
x
c) f(x) = x
2
lsinxl-4,1 dans l'intervalle [0,4]
d) f(x) = x
6
- x- 1 dans l'intervalle [1 ,2]
2. Une variante de la mthode de la bissection, appele mthode de la
fausse position, consiste remplacer le point milieu Xm de l'intervalle
[xll x2] par le point d'intersection x ~ de la droite joignant les points
(xll f(xt)) et (x2, J(x2)), avec l'axe des x. lllustrer l'aide d'un gra-
phique cette mthode. Obtenir l'quation de la droite et calculer son
point d'intersection x ~ avec l'axe des x. Modifier l'algorithme de la
bissection en remplaant Xm par x ~
3. Reprendre l'exercice 1 en utilisant cette fois la mthode de la fausse
position.
4. Obtenir la multiplicit m de la racine r des fonctions suivantes.
a) f(x) = x
2
- 2x + 1, en r = 1
b) f( x) = x
3
- 2x
2
+ x, en r = 0
c) f (x) = x sin x, en r = 0
sm x
d)f(x)=-,enr=O
x
5. Calculer les points fixes des fonctions suivantes et vrifier s'ils sont
attractifs ou rpulsifs.
a) g( x) = 4x - x
2
b) g(x) =..fi
c) g(x) = arcsinx
d) g(x) = 5 +x- x
2
96 Chapitre 2
6. Utiliser l'algorithme des points fixes avec les fonctions suivantes. Une
fois la racine obtenue, calculer lenl et len/en-tl Obtenir exprimenta-
lement le taux de convergence de la mthode.
a) g(x) = 1- x- x; (xo = 5)
b) g(x) = v'1+X (xo = 1,5)
7. Utiliser la mthode de Newton pour dterminer les racines des fonc-
tions suivantes. Une fois la racine obtenue, calculer lenl, len/en-tl et
len/ e;_
1
1. Conclure sur la convergence de la mthode. Si la conver-
gence est linaire, modifier votre algorithme de faon rcuprer la
convergence quadratique.
a) /(x) = x
3
- 2x
2
- 5 ( xo = 3)
b) f(x) = 0,51x- sin x (x
0
= 2; et ensuite partir de x
0
= 1)
c) f(x) = x
6
- x- 1 (xo = 1,5)
d) f(x) = x
5
- 3x
4
+ 4x
3
- 4x
2
+ 3x- 1 (xo = 1,2)
8. Faire 5 itrations de la mthode de la scante pour les fonctions de
l'exercice prcdent.
9. Montrer que l'algorithme suivant permet de rcuprer la convergence
quadratique lorsque la multiplicit m de la racine est connue.
f(xn)
Xn+l = Xn- m f'(xn)
Vrifier en premier lieu si cet algorithme converge vers une racine de
f( x). Montrer ensuite que la convergence est forcment quadratique.
10. On cherche rsoudre l'quation:
qui possde les deux racines r1 = -0,458 9623 et r2 = 0,91 ainsi qu'une
troisime racine situe prs de 4. On vous propose les mthodes de
quations non linaires 97
points fixes suivantes pour obtenir r
1
.
1) x = gl (x) = - ~
2) x (
x) = _ (ex - 3x
2
- 3,385 712 869x)
g
2
3,385 712 869
)
_ ( ) __ (ex - 3x
2
- 3,76189x)
3
x - g
3
x - 3 761 89
'
a) Lesquelles, parmi ces trois mthodes de points fixes, sont suscep-
tibles de converger vers r1? (Ne pas faire les itrations.)
b) Dterminer celle qui produit une convergence quadratique vers r
1
.
c) La mthode de la bissection convergera-t-elle vers l'une des racines
si on prend [-1,0] comme intervalle de dpart?
d) Utiliser la mthode de Newton pour dterminer la troisime racine
avec 4 chiffres significatifs. Quel est l'ordre de convergence de cette
mthode?
11. valuer la quantit:
Suggestion: Mettre cette quation au cube et obtenir une quation de
la forme f( s) = O. Rsoudre cette dernire l'aide de la mthode de
Newton partir de s
0
= 1.
12. On cherche rsoudre l'quation:
(dont la solution est J2) au moyen de la mthode de points fixes:
Xn+l = g(xn)
o
g(xn) = Xn - p x ~ - 2)
et p est une constante.
98
Chapitre 2
a) Pour quelles valeurs de p cette mthode de points fixes est-elle
convergente l'ordre 1 (au moins)?
b) Quel est l'ordre de convergence pour p = vf2/ 4?
c) Quel est l'ordre de convergence si p = 3y!2?
13. On a calcul une racine de:
f( x) = x
3
+ 4x
2
- 10
en utilisant l'algorithme de points fixes:
On a obtenu les rsultats suivants.
n Xn ienl
le:\ 1
1 1,50000 0,134 77
-
2 1,286 95 0,078 28 0,580 84
3 1,402 54 0,037 31 0,476 62
4 1,345 46 0,019 77 0,529 88
5 1,37517 0,009 94 0,502 78
6 1,360 09 0,00514 0,51710
7 1,367 85 0,002 62 0,509 72
8 1,363 89 0,00134 0,51145
9 1,365 92 0,000 69 0,514 92
17 1,365 23 0,000 00
-
On a ontenu les rsultats des deux dernires colonnes en considrant
que la valeur exacte de la racine est r = 1,365 23.
a) Expliquer pourquoi la mthode itrative prcdente a converg.
b) Les valeurs de 1 e:=.
1
1 semblent converger vers 0,51. Expliquer ce r-
sultat et donner la valeur exacte vers laquelle le quotient 1--".n.....l devrait
en-1
converger.
c) Quel est l'ordre de la mthode utilise?
quations non linaires 99
14. Une variante de la mthode de Newton pour rsoudre des quations de
la forme f( x) = 0 rsulte en l'algorithme suivant:
donn
Note: La valeur de la drive apparaissant au dnominateur est fixe
J'( x
0
) pour toutes les itrations. Ce n'est donc pas la mthode de
Newton.
a) Donner une interprtation gomtrique de cette mthode.
b) On aimerait se servir de cette mthode pour valuer la racine r = J2
de l'quation:
Donner une condition ncessaire sur x
0
pour que la mthode converge
vers J2.
Suggestion: Considrer cette variante de la mthode de Newton comme
une mthode de points fixes.
Chapitre 3
Systmes d'quations
algbriques
3.1 Introduction
Les systmes d'quations algbriques jouent un rle trs important en in-
gnierie. On peut classer ces systmes en deux grandes familles: les systmes
linaires et les systmes non linaires.
Ici encore, les progrs de l'informatique et de l'analyse numrique permet-
tent d'aborder des problmes de taille prodigieuse. On rsout couramment
aujourd'hui des systmes de plusieurs centaines de milliers d'inconnues. On
rencontre ces applications en mcanique des fluides et dans l'analyse de struc-
tures complexes. On peut par exemple calculer l'coulement de l'air autour
d'un avion ou l'coulement de l'eau dans une turbine hydraulique complte.
On peut galement analyser la rsistance de la carlingue d'un avion diff-
rentes contraintes extrieures et en vrifier numriquement la solidit.
Ces calculs complexes requirent des mthodes sophistiques comme les
mthodes d'lments finis (voir Reddy, rf. [24]). On obtient gnralement
des systmes d'quations non linaires de taille considrable, qu'on doit r-
soudre l'aide de mthodes efficaces qui minimisent le temps de calcul et
l'espace-mmoire requis.
Dans ce chapitre, nous allons aborder les principales mthodes de rso-
lution des systmes linaires, savoir la mthode d'limination de Gauss et
la dcomposition LU. L'effet des erreurs dues l'arithmtique flottante sera
galement tudi, et nous introduirons le concept de conditionnement d'une
matrice.
102 Chapitre 3
Par la suite, nous verrons comment rsoudre les systmes non linaires
au moyen d'une suite de systmes linaires. C'est ce que nous appelons la
linarisation du problme.
3.2 Systmes linaires
De faon gnrale, la rsolution d'un systme d'quations linaires consiste
trouver un vecteur x= [x1 Xz X3 xnV (x dnotera toujours un vecteur
colonne et l'indice suprieur T dsignera sa transpose) solution de:
an xl + a12x2 + a13X3 + + atnXn
az1x1 + azzXz + a23x3 + + aznXn
a31X1 + a3zXz + a33X3 + + a3nXn
an1X1 + anzXz + an3X3 + ... + annXn bn
(3.1)
On peut utiliser la notation matricielle, qui est beaucoup plus pratique et
surtout plus compacte. On crit alors le systme prcdent sous la forme:
Ax= b (3.2)
o A est la matrice:
an a12 a13 a ln
az1 azz a23 a zn
a31 a32 a33 a3n
anl anz an3 ann
et o b = [b1 bz b3 bn]T est le membre de droite. Bien entendu, la
matrice A et le vecteur b sont connus. ll reste dterminer le vecteur x.
Le problme 3.1 (ou 3.2) est un systme de n quations et n inconnues.
En pratique, la valeur de n varie considrablement et peut s'lever jusqu'
plusieurs centaines de milliers. Dans ce chapitre, nous nous limitons des
systmes de petite taille, mais les stratgies dveloppes sont valides quelle
que soit la taille du systme. Notons finalement que le cot de la rsolution
crot rapidement avec n.
Remarque 3.1
Dans la plupart des cas, nous traitons des matrices non singulires ou in-
versibles, c'est--dire dont la matrice inverse existe. Nous ne faisons pas non
Systmes d'quations algbriques 103
plus de rvision systmatique de l'algbre linaire lmentaire que nous sup-
posons connue. Ainsi, la solution de l'quation 3.2 peut s'crire:
et la discussion peut sembler dose. Nous verrons cependant que le calcul
de la matrice inverse A-l est plus difficile et plus long que la rsolution du
systme linaire de dpart. D
Exemple 3.1
Considrons le systme linaire suivant:
2x1 + 3xz 8
3xl + 4xz 11
Pour le rsoudre, on peut utiliser la mthode classique qui consiste liminer
les quations une une par substitution successive. Dans un premier temps,
on isole Xt de la premire quation:
8- 3xz
2
que l'on substitue dans la deuxime quation:
(
8- 3xz)
3
2
+ 4xz = 11
ou encore
12 - 9xz/2 + 4xz = 12 - 0,5x
2
= 11
On dduit alors facilement que x
2
= 2 et par la suite que x
1
= 1.

ll est thoriquement possible d'tendre la substitution successive des
systmes de grande taille. n est cependant difficile de transcrire cette faon
de faire sous forme d'algorithme (qui peut par la suite tre programm dans
un langage informatique quelconque). ll est donc prfrable de recourir
d'autres mthodes pour simplifier le systme d'quations.
104 Chapitre 3
On peut d'abord se demander quels types de systmes linaires sont
faciles rsoudre, et ce mme s'ils sont de grande taille. Le cas le plus simple
est sans doute celui des systmes diagonaux, c'est--dire dont la matrice A
n'a de coefficients non nuls que sur la diagonale.
Exemple 3.2
Le systme suivant:
est trs facile rsoudre. ll suffit de considrer sparment chaque ligne. On
obtient ainsi x= [2 1 3f. On voit tout de suite comment rsoudre le cas
gnral:
bi
Xi = - pour i = 1, 2, , n
aii
On remarque de plus que le systme a une solution unique seulement si
tous les termes diagonaux sont non nuls. Hlas, on rencontre rarement des
systmes diagonaux en pratique et il faudra travailler un peu plus pour
s'attaquer aux applications.

Le deuxime type de systme simple est le systme triangulaire infrieur
ou suprieur.
Systmes d'quations algbriques 105
Dfinition 3.1
Une matrice est dite triangulaire infrieure (ou suprieure) si tous les aij
(ou tous les a ji) sont nuls pour i < j. Une matrice triangulaire infrieure
a la forme type:
au 0 0 0 0
az1 azz 0 0 0
a31 a32 a33 0 0
an-11 an-12 an-13 an-1 n
0
anl anz an3 ann-1 ann
Une matrice triangulaire suprieure est tout simplement la transpose
d'une matrice triangulaire infrieure.
Les systmes triangulaires sont galement faciles rsoudre. ll suffit en
effet de commencer par l'quation qui se trouve la pointe du triangle (la
premire pour une matrice triangulaire infrieure et la dernire pour une
matrice triangulaire suprieure) et de rsoudre une une les quations. On
parle de descente triangulaire ou de remonte triangulaire, selon le cas.
Exemple 3.3
La descente triangulaire du systme:
consiste rsoudre la premire quation:
bl 9
Xt =- =- = 3
au 3
Puisque x1 est maintenant connue, on peut dterminer x
2
:
bz- az1x1 7- (1)(3)
Xz = azz = 2 = 2
106
La dernire quation s'crit:
b3- a31X1 - a3zxz
a33
14- (3)(3)- (2)(2) = 1
1

Chapitre 3
De l'exemple prcdent, on peut rapidement dduire le cas gnral pour
la descente triangulaire:
(3.3)
pour i = 2,3,,n
Pour la remonte triangulaire, on a:
(3.4)
Xi pour i = n - 1, n- 2, , 2, 1
Remarque 3.2
Les quations 3.3 et 3.4 sont valides si les aii sont tous non nuls. Dans le cas
contraire, la matrice A n'est pas inversible et, donc, le systme Ax = b n'a
pas une solution unique. On se souvient en effet que le dterminant d'une
matrice triangulaire infrieure (ou suprieure) est:
n
dt Atriangu/aire = II aii
i=l
(3.5)
En d'autres mots, le dterminant est le produit des termes de la diagonale
de A. Le produit est donc non nul seulement si aucun des aii n'est nul. D
Les matrices triangulaires sont primordiales pour la rsolution des sys-
tmes linaires. Dans les sections qui suivent, nous voyons comment rame-
ner un systme linaire quelconque un ou plusieurs systmes triangulaires.
Nous abordons essentiellement deux mthodes dites directes au sens de la
dfinition suivante.
Systmes d'quations algbriques 107
Dfinition 3.2
Une mthode de rsolution d'un systme linaire est dite directe si la
solution du systme peut tre obtenue par cette mthode en un nombre
fini et prdtermin d'oprations.
Autrement dit, les mthodes directes permettent d'obtenir le rsultat
aprs un nombre connu de multiplications, divisions, additions et soustrac-
tions. On peut alors en dduire le temps de calcul ncessaire la rsolution
(qui peut tre trs long si n est grand). Les mthodes directes s'opposent sur
ce point aux mthodes dites itratives, qui peuvent converger en quelques
itrations, converger en un trs grand nombre d'itrations ou mme diverger,
selon le cas. Nous prsentons quelques exemples de mthodes itratives la
fin du chapitre 4.
Les deux principales mthodes directes sont la mthode d'limination de
Gauss et la dcomposition LU. ll s'agit en fait d'une seule et mme m-
thode puisque la mthode d'limination de Gauss est un cas particulier de
dcomposition LU. La stratgie de rsolution est base sur la question sui-
vante: Quelles oprations sont permises sur les lignes du systme 3.1 pour
le ramener un systme triangulaire? Ou encore: Pour ramener un systme
linaire quelconque un systme triangulaire, quels sont les coups permis,
c'est--dire ceux qui ne changent pas la solution du systme de dpart? C'est
ces questions que nous rpondons dans la section suivante.
3.3 Oprations lmentaires sur les lignes
Revenons au systme:
(3.6)
et voyons comment on peut le transformer sans en modifier la solution. La
rponse est toute simple. On peut toujours multiplier ( gauche de chaque
ct) les termes de cette relation par une matrice W inversible; la solution
n'est pas modifie puisque l'on peut remultiplier par w-l pour revenir au
systme de dpart. Ainsi:
WAx= Wb
possde la mme solution que le systme 3.6.
108 Chapitre 3
Remarque 3.3
Ce rsultat n'est plus vrai si la matrice W n'est pas inversible. On ne peut
plus en effet revenir en arrire si la matrice w-
1
n'existe pas. D
Exemple 3.4
Nous avons vu que la solution du systme:
est x = [3 2 l]T. Si on multiplie ce systme par la matrice inversible:
on obtient le nouveau systme:
dont la solution est toujours x = [3 2 l]T. Par contre, si on multiplie le
systme de dpart par la matrice non inversible:
on obtient le systme singulier:
qui possde une infinit de solutions, la dernire quation tant redondante .

Systmes d'quations algbriques 109
Pour transformer un systme quelconque en systme triangulaire, il suffit
d'utiliser trois oprations lmentaires sur les lignes de la matrice. Ces trois
oprations lmentaires correspondent trois types de matrices W diffrents.
C'est la base de la mthode d'limination de Gauss.
L'approche suivie est similaire celle de Burden et Faires (rf. [2]). On
note la ligne i de la matrice A. Cette notation est quelque peu ambigu,
car on se trouve de ce fait placer une ligne de la matrice A dans un vecteur
colonne. Cela n'empche cependant pas la comprhension de la suite.
Les trois oprations lmentaires dont on a besoin sont les suivantes:
1. +--- remplacer la ligne i par un multiple d'elle-mme.
2. fj): intervertir la ligne i et la ligne j.
3. Opration ( +--- + ij ): remplacer la ligne i par la ligne i plus un
multiple de la ligne j.
Ces trois oprations lmentaires sont permises car elles quivalent
multiplier le systme 3.6 par une matrice inversible.
3.3.1 Multiplication d'une ligne par un scalaire
Remplacer la ligne i par un multiple d'elle-mme +--- revient
multiplier le systme linaire 3.6 par une matrice diagonale inversible
W = +--- dont tous les lments diagonaux sont 1, sauf aii, qui
vaut . Tous les autres termes sont nuls. Cette matrice a pour effet de mul-
tiplier la ligne i par le scalaire .
Remarque 3.4
Le dterminant de la matrice diagonale +--- est . La matrice est
donc inversible si :/= O. 0
Remarque 3.5
La matrice inverse de +--- est simplement +---

c'est--
dire:

+--- (3.7)
n suffit donc de remplacer par 1/ pour inverser la matrice. 0
110
Exemple 3.5
Soit le systme:
Chapitre 3
(3.8)
dont la solution est x = [1 1 1 jY. Si on souhaite multiplier la ligne 2 par un
facteur 3, cela revient multiplier le systme par la matrice:
et on obtient:
La solution de ce nouveau systme reste la mme que celle du systme de
dpart puisque la matrice M(z 3G) est inversible (et son dterminant est
3).

3.3.2 Permutation de deux lignes
L'opration lmentaire qui consiste intervertir deux lignes ( l; +-+ fj)
est galement connue sous le nom de permutation de lignes. Cette opration
est quivalente la multiplication du systme 3.1 par une matrice inversible
W = P(l; +-+ fj), qui contient des 1 sur la diagonale, sauf la ligne i, o le 1
est dans la colonne j, et la ligne j, o le 1 est dans la colonne i. Tous les
autres termes sont nuls.
Systmes d'quations algbriques 111
Exemple 3.6
On veut intervertir la ligne 2 et la ligne 3 du systme de l'exemple prcdent.
n suffit de le multiplier par la matrice:
P(z +--+ i;) =
[

001 001 l
et on obtient:

La matrice P( +--+ est inversible. Pour obtenir son inverse, il suffit
de rflchir une seconde. En effet, quelle est l'opration inverse de celle qui
inverse deux lignes, sinon l'inversion des deux mmes lignes?
Remarque 3.6
L'inverse de la matrice P(i; donc la matrice
c'est--dire:
(3.9)
Remarque 3. 7
On montre assez facilement que le dterminant de P( +--+ est -1. Lorsque
l'on permute deux lignes, le dterminant du systme de dpart change de
signe. D
3.3.3 Opration ( t- + >.;)
La dernire opration lmentaire consiste remplacer la ligne i par la
ligne i plus un multiple de la ligne j +--- + Cela est encore une
fois quivalent multiplier le systme de dpart par une matrice inversible
W = +--- l; + qui vaut 1 sur toute la diagonale et 0 partout ailleurs,
sauf aij, qui vaut >-..
112 Chapitre 3
Exemple 3.7
Dans le systme 3.8, on souhaite remplacer la deuxime ligne par la deuxime
ligne (i = 2) moins deux fois ( = -2) la premire ligne (j = 1). n suffit
alors de multiplier le systme par:
ce qui donne:

Remarque 3.8
La matrice T( +--- + lj) est inversible. Pour obtenir son inverse, il suffit
de remplacer par -, c'est--dire:
(3.10)
Cela signifie que pour revenir en arrire il suffit de soustraire la ligne que
l'on vient d'ajouter. 0
Remarque 3.9
On peut montrer facilement que le dterminant de T( +--- + lj) est 1. 0
Remarque 3.10
Dans cet exemple, en additionnant le bon multiple de la ligne 1 la ligne 2,
on a introduit un 0 la position a
21
. En remplaant la ligne 3 par la ligne
3 moins (5/3) fois la ligne 1 (ou encore l; +--- l;- (5/3)i;.), on introduirait
un terme 0 la position a
31
. On peut ainsi transformer un systme linaire
quelconque en systme triangulaire. C'est l la base sur laquelle repose la
mthode d'limination de Gauss. 0
Systmes d'quations algbriques 113
Remarque 3.11
Des trois oprations lmentaires, seule l'opration ~ +--- ~ + . . ~ ) n'a pas
d'effet sur le dterminant. La permutation de deux lignes en change le signe,
tandis que la multiplication d'une ligne par un scalaire multiplie le dtermi-
nant par ce mme scalaire. 0
3.4 limination de Gauss
Tous les outils sont en place pour la rsolution d'un systme linaire.
n suffit maintenant d'utiliser systmatiquement les oprations lmentaires
pour introduire des zros sous la diagonale de la matrice A et obtenir ainsi
un systme triangulaire suprieur.
La validit de la mthode d'limination de Gauss repose sur le fait que
les oprations lmentaires consistent multiplier le systme de dpart par
une matrice inversible.
Remarque 3.12
En pratique, on ne multiplie jamais les systmes considrs par les diffrentes
matrices W, car ce serait trop long. ll faut cependant garder en tte que les
oprations effectues sont quivalentes cette multiplication. 0
La mthode d'limination de Gauss consiste liminer tous les termes
sous la diagonale de la matrice A. Avant de considrer un exemple, intro-
duisons la matrice augmente.
Dfinition 3.3
La matrice augmente du systme linaire 3.1 est la matrice de dimension
n sur n+ 1 que l'on obtient en ajoutant le membre de droite b la matrice
A, c'est--dire:
an al2 a13 a ln bl
a21 azz a23 a zn bz
a31 a32 a33 a3n b3
(3.11)
anl anz an3 ann bn
114 Chapitre 3
Puisque les oprations lmentaires doivent tre effectues la fois sur
les lignes de la matrice A et sur celles du vecteur b, cette notation est trs
utile.
Remarque 3.13
TI arrive galement que l'on doive rsoudre des systmes de la forme Ai = b
avec k seconds membres b diffrents (la matrice A tant fixe). On peut alors
construire la matrice augmente contenant les k seconds membres dsirs.
La matrice augmente ainsi obtenue est de dimension n x ( n + k ). D
Exemple 3.8
Considrons l'exemple suivant:
[
rn 1 2 10 ]
6 4 0 26
8 5 1 35
On a indiqu ci-dessus la matrice augmente de mme que les oprations
lmentaires (et les matrices associes) qui sont ncessaires pour liminer les
termes non nuls sous la diagonale de la premire colonne. n est noter que
l'on divise par 2 (an) les coefficients qui multiplient la ligne 1. On dit alors
que 2 est le pivot. On obtient, en effectuant les oprations indiques:
0 [] -6 -4
[
2 1 2 10 l
0 1 -7 -5 T3(b z;- (1/[])G)
Pour produire une matrice triangulaire suprieure, il suffit maintenant d'in-
troduire des 0 sous la diagonale de la deuxime colonne. L'opration est
indique ci-dessus et le pivot est 1 puisque maintenant a
22
= 1. On obtient
donc:
[
2 1 2 10 l
0 1 -6 -4
0 0 -1 -1
(3.12)
ll reste ensuite faire la remonte triangulaire de l'algorithme 3.4. On ob-
tient:
x
3
= -1/- 1 = 1
Systmes d'quations algbriques 115
d'o:
-4- ( -6)(1)
X2 = = 2
1
et enfin:
10- (1)(2)- (2)(1)
X1 = = 3
2
On a construit le systme triangulaire 3.12 en effectuant des oprations l-
mentaires directement sur les lignes de la matrice. La matrice triangulaire
obtenue est note U. Les oprations effectues pour obtenir U sont quiva-
lentes multiplier le systme de dpart par une suite de matrices inversibles.
On a en fait:
o les matrices Ti correspondent aux diffrentes oprations effectues sur les
lignes de la matrice. Plus explicitement, on a:
[
~ ~ ~

] [ ~ ~ ~ l [ ~ ~ l [
0 0 -1 0 -1 1 -4 0 1
Si on poursuit le raisonnement, on a galement:
1 0
-3 1
0 0
Puisque l'on sait inverser les matrices Ti, on a immdiatement que:
[
~ ~ l [ ~ ~ l [ ~ ~ l [ ~ ~ l [ ~ ~

]
8 5 1 0 0 1 4 0 1 0 1 1 0 0 -1
ou encore
[
~ ~ l [ ~ ~ l [ ~ ~

]
8 5 1 4 1 1 0 0 -1
On remarque que les coefficients de la matrice triangulaire infrieure sont
ceux qui ont permis d'liminer les termes non nuls sous la diagonale de
la matrice A. Tout cela revient dcomposer la matrice A en un produit
d'une matrice triangulaire infrieure, note L, et d'une matrice triangulaire
suprieure U. C'est ce que l'on appelle une dcomposition LU .

116 Chapitre 3
Remarque 3.14
La mthode d'limination de Gauss revient factoriser la matrice A en un
produit de deux matrices triangulaires L et U seulement dans le cas o
aucune permutation de lignes n'est effectue. 0
Remarque 3.15
Le dterminant de la matrice de dpart est le mme que celui de la ma-
trice triangulaire 3.12 puisqu'on n'a effectu que des oprations de la forme
(i-; +-- Z: + ~ , ce qui revient multiplier le systme de dpart par une
matrice dont le dterminant est 1. On a donc:
dt A= (2)(1)( -1) = -2
soit le produit des termes diagonaux de la matrice 3.12. Pour tre plus prcis:
dt A= dt T
1
-
1
dt r
2
-
1
dt T3
1
dt u = (1)(1)(1)[(2)(1)( -1)]
puisque le dterminant des trois matrices Ti est 1. 0
Exemple 3.9
Soit le systme linaire suivant:
XI X2
+
2x3 X4 -8
2x
1
2x2
+
3x3 3x4 -20
Xl
+
X2
+
X3
-2
Xl X2
+
4x
3 +
3x4 +4
dont la matrice augmente est:
[
qJ = ~ ~ = ~ -=-280 l
1 1 1 0 -2
1 -1 4 3 4
En faisant les oprations indiques (le pivot an est 1), on limine les termes
non nuls sous la diagonale de la premire colonne et on obtient:
[
-1
[QJ
2
0
Systmes d'quations algbriques 117
Ici, la procdure est interrompue par le fait que le nouveau pivot serait 0
et qu'il n'est pas possible d'liminer les termes sous ce pivoi. Mais on peut
encore, parmi les oprations lmentaires, interchanger deux lignes. Le seul
choix possible dans cet exemple est d'intervertir la ligne 2 et la ligne 3. On
se rend immdiatement compte qu'il n'y a plus que des 0 sous le nouveau
pivot et que l'on passer la colonne suivante.
[
1 -1
0 2
0 0
0 0
2
-1
8J
2
-1
1
-1
4
-8] 6
-4
12 T5(t (2/GJ)l;)
En effectuant cette dernire opration, on obtient le systme triangulaire:
[
1 -1 2
0 2 -1
0 0 -1
0 0 0
-1 -8]
1 6
-1 -4
2 4
La remonte triangulaire (laisse en exercice) donne la solution:
X= [-7 3 2 2]T
Encore ici, la matrice triangulaire est le rsultat du produit des oprations
lmentaires:
U= T5P4T3T2T1A
ou encore
A_ r-1r.-1r.-1 p-1r.-1u
- 1 2 3 4 5
qui s'crit:
[ t
-1 2
-1 ]
[ t
0 0
][
-1 2

-2 3 -3 0 1 2 -1
1 1 0 1 0 0 -1 -1
-1 4 3 0 -2 0 0 2
On remarque que la premire matrice du terme de droite n'est pas triangu-
laire infrieure. Cela est d au fait que l'on a permut deux lignes .

118 Chapitre 3
Remarque 3.16
Le dterminant de la matrice A associe cet exemple est tout simplement:
dt A dt T
1
-
1
dt T
2
-
1
dt T
3
-
1
dt P
4
-
1
dt T
5
-
1
dt u
(1 )( 1 )(1 )( -1 )(1 )[(1 )(2)( -1 )(2)]
4
Le dterminant est donc le produit de la diagonale de la matrice triangulaire
un signe prs puisqu'on a permut une fois 2lignes et que dt P
4
= -1. D
Nous n'insistons pas davantage sur la mthode d'limination de Gauss
puisque nous avons dmontr qu'il s'agit d'un cas particulier de dcompo-
sition d'une matrice en un produit d'une matrice triangulaire infrieure et
d'une matrice triangulaire suprieure (A = LU). Nous abordons maintenant
directement cette dcomposition.
3.5 Dcomposition LU
3.5.1 Principe de la mthode
Supposons un instant que nous ayons russi exprimer la matrice A en un
produit de deux matrices triangulaires Let U. Comment cela nous permet-il
de rsoudre le systme Ai= b? ll suffit de remarquer que:
Ai= LUx= b
et de poser Ux = fi. La rsolution du systme linaire se fait alors en deux
tapes:
Lfl = b
ux = il
(3.13)
qui sont deux systmes triangulaires. On utilise d'abord une descente trian-
gulaire sur la matrice L pour obtenir fi et par la suite une remonte trian-
gulaire sur la matrice U pour obtenir la solution recherche x.
ll faut tout de suite souligner que la dcomposition LU n'est pas unique.
On peut en effet crire un nombre rel comme le produit de deux autres
nombres d'une infinit de faons. n en est de mme pour les matrices.
Systmes d'quations algbriques 119
Exemple 3.10
Pour illustrer la non-unicit de la dcomposition LU, il suffit de vrifier les
galits:
et:
[
=! ~

l [ ~ ~ l [
6 -3 1 3 0 1 0
... , ..
Remarque 3.17
-0,5
1
0
-1
-4
0
-0,5]
-0,5
1
-1 l

La dcomposition LU n'tant pas unique, il faut faire au pralable des choix
arbitraires. Le choix le plus populaire consiste imposer que la matrice U
ait des 1 sur sa diagonale. C'est la dcomposition de Crout. 0
3.5.2 Dcomposition de Crout
Pour obtenir cette dcomposition (ou factorisation), nous considrons une
matrice de dimension 4 sur 4, le cas gnral tant similaire. On doit donc
dterminer les coefficients lij et Uij des matrices L et U de telle sorte que
A = LU. En imposant que la diagonale de U soit compose de 1, on doit
avoir:
[ an au a13 a14 ] [ ln
0 0
l. ][
u12
U13 U14 ]
a21 a22 a23 a24 _ l21 [22 0 1 u23 u24
a31 a32 a33 a34 - !31 [32 [33 0 1 U34
a41 a42 a43 a44 ~ ~ [42 [43 0 0 1
n suffit de procder de faon systmatique par identification des coefficients.
On remarque d'abord qu'il y a exactement 16 (n
2
dans le cas gnral) in-
connues dterminer. On peut faire le produit des matrices Let U, et se
servir des diffrents coefficients aij. On obtient ainsi les 16 ( n
2
) quations
ncessaires pour dterminer les coefficients lij et Uij.
120
1. Produit des lignes de L par la premire colonne de U
On obtient immdiatement que:
Chapitre 3
et la premire colonne de L est tout simplement la premire colonne
de A.
2. Produit de la premire ligne de L par les colonnes de U
On obtient respectivement:
d'o on tire que:
a12
u12 =-
ln
a13
U13 =-
ln
a14
U14 =-
ln
On a donc la premire ligne de U, si ln =1- O.
3. Produit des lignes de L par la deuxime colonne de U
Les diffrents produits donnent:
l21 u12 + l22 a22
l31 u12 + l32 a32
l41 u12 + l42 a42
ou encore
l22 a22 - l21 u12
h2 a32 - l31 U12
l42 a42 - l41 u12
et la deuxime colonne de L est connue.
4. Produit de la deuxime ligne de L par les colonnes de U
On trouve immdiatement que:
l21 U13 + l22U23 a23
l21 U14 + l22u24 a24
Systmes d'quations algbriques
ce qui donne:
a23- l21 u13
122
a24 - l21 u14
122
5. Produit des lignes de L par la troisime colonne de U
La mme suite d'oprations donne:
l31 U13 + l32U23 + l33 a33
l41 U13 + l42U23 + l43 a43
ce qui permet d'obtenir la troisime colonne de L:
l33 a33 - l31 U13 - l32U23
l43 a43 - l41 U13 - l42U23
6. Produit de la troisime ligne de L par la quatrime colonne de U
On voit que:
ce qui permet d'obtenir:
U34 =
a34 - l31 U14 - l32U24
133
7. Produit de la quatrime ligne deL par la quatrime colonne de U
On obtient:
l41 u14 + l42U24 + l43U34 + l44 = a44
Le dernier coefficient recherch est donc:
De faon gnrale, on a l'algorithme suivant.
121
122
Algorithme 3.1: Dcomposition de Crout
1. Dcomposition LU (sans permutation de lignes)
Premire colonne de L:
li1 = ail pour i = 1, 2, , n
Premire ligne de U:
ali .
Uli =- pour z = 2, 3, , n
ln
Pour i = 2, 3, 4, , n- 1:
- Calcul du pivot:
i-1
[ii = Uii - L likUki
k=l
Pour j = i + 1, i + 2, , n:
* Calcul de laie colonne de L:
i-1
lji = Uji - L ljkUki
k=l
* Calcul de la ie ligne de U:
Calcul de lnn:
n-1
lnn = Unn - L lnkUkn
k=l
Chapitre 3
(3.14)
(3.15)
(3.16)
(3.17)
(3.18)
(3.19)
Systmes d'quations algbriques
2. Descente et remonte triangulaires
Descente triangulaire pour rsoudre Lif = b:
Y1 = bl/ln
Pour i = 2, 3, 4, , n:
Remonte triangulaire pour rsoudre U i = if ( Uii = 1 ):
Xn = Yn
Pour i = n- 1, n- 2, 2, 1:
Remarque 3.18
n
Xi =Yi- L UikXk
k=i+l
0
123
(3.20)
(3.21)
L'algorithme prcdent ne fonctionne que si les pivots [ii sont tous non nuls.
Ce n'est pas toujours le cas et il est possible qu'il faille permuter deux lignes
pour viter cette situation, tout comme pour l'limination de Gauss. Le
coefficient [ii est encore appel pivot. Nous abordons un peu plus loin les
techniques de recherche du meilleur pivot. 0
Remarque 3.19
Une fois utiliss, les coefficients de la matrice A ne servent plus rien. lls
peuvent donc tre dtruits au fur et mesure que la dcomposition progresse.
De fait, on peut les remplacer par les valeurs de lij ou Uij selon le cas. C'est
ce que l'on nomme la notation compacte. La notation compacte vite de
garder inutilement en mmoire des matrices de grande taille. 0
124 Chapitre 3
Dfinition 3.4
La notation compacte de la dcomposition LU est la matrice de coeffi-
dents:
u12 u13 u14]
l22 U23 U24
l32 l33 U34
142 143 144
(3.22)
dans le cas d'une matrice de dimension 4 sur 4. La matrice initiale A est
tout simplement dtruite. Les coefficients 1 sur la diagonale de la matrice
U ne sont pas indiqus explicitement, mais doivent tout de mme tre
pris en compte. De faon plus rigoureuse, la notation compacte revient
mettre en mmoire la matrice:
et dtruire la matrice A.
Exemple 3.11
Soit le systme:
L+U-I
[
~ -;
1
~ l [ ~ l [ ~ l
2 -2 -1 X3 2
que l'on doit dcomposer en un produit LU. Pour illustrer la notation com-
pacte, on remplace au fur et mesure les coefficients aij par les coefficients
lij ou Uij; les cases soulignent que l'lment aij correspondant a t dtruit.
1. Premire colonne de L:
C'est tout simplement la premire colonne de A:
[
0 -1 2]
ITJ 2 3
rn -2 -1
Systmes d'quations algbriques 125
2. Premire ligne de U:
Le pivot de la premire ligne est 3. On divise donc la premire ligne
de A par 3:

r n ~ ~ ]
liJ 2 3
[]] -2 -1
3. Deuxime colonne deL:
De la relation 3.17, on tire:
[22 a22 - l21 u12
2- (1)( -1/3)
7/3
[32 a32 - !31 u12
-2- (2)( -1/3)
-4/3
On a maintenant:
[0
~ ]
liJ
[]]
4. Deuxime ligne de U:
De la relation 3.18, on tire:
a23- l21 U13
U23
[22
3- (1)(2/3)
7/3
=
1
La matrice compacte devient:
[0
~ ]
liJ liJ
[]]
-1
126 Chapitre 3
5. Calcul de l33:
D'aprs la relation 3.19, on a:
l33 = a33 - l31 u13 - l3zuz3
-1- (2)(2/3)- ( -4/3)(1)
= -1
La matrice compacte est donc:
[
rn
[]
[]]
~ ]
[]
GJ
La matrice de dpart A (maintenant dtruite) vrifie ncessairement:
A ~ [[
0
~ ][
-1/3
Tl
7/3
1
-4/3 0
6. Rsolution de Ly = b:
La descente triangulaire donne:
Y1 =
bd ln
12/3
=
4
bz - lz1Y1
Yz =
lzz
=
11-(1)(4)
7/3
=
3
Y3
b3 - l31Y1 - l3zYz
=
[33
2- (2)( 4)- ( -4/3)(3)
( -1)
=
2
Systmes d'quations algbriques
7. Rsolution de U x= fl:
3- (1)(2)
1
Xl Yl - U12X2 - U13X3
4- ( -1/3)(1)- (2/3)(2)
3
La solution recherche est donc x= [3 1 2jT .

3.5.3 Dcomposition LU et permutation de lignes
127
Comme nous l'avons dj remarqu, l'algorithme de dcomposition LU
exige que les pivots Iii soient non nuls. Dans le cas contraire, il faut essayer de
permuter deux lignes. Contrairement la mthode d'limination de Gauss, la
dcomposition LU n'utilise le terme de droite b qu' la toute fin, au moment
de la descente triangulaire Lfl = b. Si on permute des lignes, on doit en garder
la trace de faon effectuer les mmes permutations sur b. cette fin, on
introduit un vecteur 6 dit de permutation qui contient tout simplement la
numrotation des quations.
Remarque 3.20
Dans une dcomposition LU, la permutation de lignes s'effectue toujours
aprs le calcul de chaque colonne deL. On place en position de pivot le plus
grand terme en valeur absolue de cette colonne (sous le pivot actuel), pour
des raisons de prcision que nous verrons plus loin. D
illustrons cela par un exemple.
128 Chapitre 3
Exemple 3.12
Soit:
Au dpart, le vecteur 6 indique que la numrotation des quations n'a pas
encore t modifie.
1. Premire colonne de L:
Puisqu'il s'agit de la premire colonne de A, on a
Le vecteur de permutation n'a pas t modifi, mais on a un pivot nul.
On effectue alors l'opration (h +-+ G). On aurait tout aussi bien pu
permuter la ligne 1 et la ligne 2, mais on choisit immdiatement le plus
grand pivot possible (en valeur absolue). Le vecteur de permutation est
alors modifi:
2. Premire ligne de U:
[
[1] 0
[] 0
@] 2
il suffit de diviser cette ligne par le nouveau pivot 3:
3. Deuxime colonne de L:
De la relation 3.17, on tire:
0 (1)(0)=0
Systmes d'quations algbriques 129
On a maintenant:
2- (0)(0)
2
[
rn @J mj
[] @] 0
@J m 1
et encore un pivot nul, qui oblige intervertir les lignes 2 et 3 et
modifier 6 en consquence (G +-+ G):
[
rn @J mj- [3]
@J m 1 o= 1
ITJ @] 0 2
4. Calcul de u23:
La relation 3.18 mne :
=
a23- l21 u13
[22
1- (0)(1/3)
2
= 1/2
et la matrice compacte devient:
5. Calcul de b3:
On calcule enfin:
[
rn @J m] [3]
@J m m 0= 1
ITJ @] 0 2
b3 a33 - b1 U13 - l32U23
= 0- (1)(1/3)- (0)(1/2)
= -(1/3)
130
La dcomposition LU de la matrice A est donc:
[
[]] [QJ
@][]
[IJ[QJ
ll faut toutefois remarquer que le produit LU donne:
[
3 0
0 2
1 0
0 l [ 1 0 1/3]
0 0 1 1/2
-1/3 0 0 1
Chapitre 3
c'est--dire la matrice A permute suivant le vecteur 6. On veut maintenant
rsoudre:
Compte tenu du vecteur 6, on rsout d'abord:
noter l'ordre des valeurs dans le membre de droite. La descente triangu-
laire (laisse en exercice) donne iJ = [-2/3 5/2 1]T. ll suffit maintenant
d'effectuer la remonte triangulaire:
qui nous donne la solution finale x = [ -1 2 1 ]Y .

Remarque 3.21
Le dterminant de la matrice A de l'exemple prcdent est donn par:
dt A= (-1)(-1)[(3)(2)(-1/3)] = -2
Systmes d'quations algbriques 131
Comme on a permut deux lignes deux fois, le dterminant a chang de signe
deux fois. D
Cela nous amne au thorme suivant.
Thorme 3.1
On peut calculer le dterminant d'une matrice A l'aide de la mthode
de dcomposition LU de la faon suivante:
n
dt A= ( -1)N II lii (3.23)
i=l
o N est le nombre de fois o on a interverti deux lignes. D
Nous avons mentionn que la dcomposition LU est une mthode directe,
c'est--dire que l'on peut prvoir le nombre exact d'oprations arithmtiques
ncessaires pour rsoudre un systme d'quations. On a de fait le rsultat
suivant (voir Burden et Faires, rf. [2]).
Thorme 3.2
Une dcomposition LU pour la rsolution d'un systme linaire de di-
mension n sur n requiert exactement:
n
3
- n
multiplications/ divisions
3
et
2n
3
- 3n
2
+ n
6
additions/ soustractions
l'tape de dcomposition en un produit LU. De plus, les remonte et des-
cente triangulaires ncessitent:
n
2
multiplications/ divisions
et
n
2
- n additions/soustractions
pour un total de:
n
3
+ 3n
2
- n
multiplications/ di visions
3
132 Chapitre 3
et
2n
3
+ 3n
2
- 5n dd" . / .
6
a 1t10ns soustractiOns
Du point de vue informatique, une multiplication (ou une division) est une
opration plus coteuse qu'une simple addition (ou soustraction). C'est donc
principalement le nombre de multiplications/divisions qui est important. De
plus, on note que sin est grand le nombre total de multiplications/divisions
est de l'ordre de n
3
/3, en ngligeant les puissances de n infrieures 3.
Enfin, et cela est trs important, la dcomposition de la matrice A en un
produit LU cote beaucoup plus cher (':::::::. n
3
/3 multiplications/divisions) que
les remonte et descente triangulaires (':::::::. n
2
multiplications/divisions). Le
gros du travail se trouve donc dans la dcomposition elle-mme. D
3.5.4 Calcul de la matrice inverse A -
1
Le calcul de la matrice inverse A-
1
est rarement ncessaire. En effet, il
est inutile de calculer A-
1
pour rsoudre un systme linaire. Nous avons
vu dans les sections prcdentes comment parvenir une solution sans ja-
mais faire intervenir A-
1
Cependant, si pour une raison ou une autre on
souhaite calculer cet inverse, il est important de suivre le bon cheminement
afin d'viter des calculs longs et parfois inutiles.
Nous avons indiqu que la solution du systme linaire 3.2 est donne
par:
Si on veut dterminer la matrice inverse, il suffit de remarquer que le produit
d'une matrice par le vecteur i dont toutes les composantes sont nulles, sauf
la ie qui vaut 1, donne la ie colonne de la matrice A. L'exemple suivant en
fait la dmonstration.
Exemple 3.13
La produit de la matrice A suivante par le vecteur 3 donne:
Systmes d'quations algbriques 133
qui est bien la troisime colonne de la matrice A de dpart .

Si on applique ce raisonnement la matrice A-
1
, on constate qu'aprs
avoir not i, la ie colonne de A-
1
, on a:
ou de faon quivalente
(3.24)
La rsolution de la relation 3.24 donne laie colonne de A-
1
On peut donc
affirmer que le calcul de la matrice A-l est quivalent la rsolution de n
systmes linaires (un par colonne de A-
1
).
Remarque 3.22
Puisque le calcul de A-l est quivalent la rsolution den systmes linaires,
il est clair qu'il ne faut jamais calculer A-l pour rsoudre un systme linaire.
ll vaut mieux utiliser directement une dcomposition LU sans passer par
l'inverse. D
Remarque 3.23
Si on veut quand mme calculer A-
1
, il faut effectuer d'abord la dcompo-
sition LU de A une seule fois ( n
3
/3 multiplications/divisions), puis n re-
montes et descentes triangulaires ( ~ n x n
2
= n
3
multiplications/ divisions),
pour un total approximatif de 4n
3
/3 multiplications/divisions. Ces valua-
tions montrent bien que le calcul d'un inverse est beaucoup plus coteux
~ 4n
3
/3 multiplications/divisions) que la rsolution d'un systme linaire
( n
3
/3 multiplications/ divisions).
Le tableau suivant indique le nombre approximatif de multiplications et
de divisions ncessaires pour rsoudre un systme linaire Ax = b et pour
calculer l'inverse de la matrice A, pour diffrentes valeurs de n.
n Rsolution de Ax = b Calcul deA-
1
~ n
3
/3 mult./div.) ~ 4n
3
/3 mult.fdiv.)
10 333 1333
100 333 333 1333 333
1000 333 333 333 1333 333 333
Ainsi, le calcul de l'inverse d'une matrice de dimension 1000 sur 1000 n-
cessite peu prs un milliard de multiplications/ divisions de plus que la
rsolution d'un systme linaire de mme dimension. D
134
Exemple 3.14
On doit calculer l'inverse de la matrice:
[ ~ ~ l
dont nous avons dj obtenu la dcomposition LU:
[
3 0
0 2
1 0
0 l [ 1 0 1/3]
0 0 1 1/2
-1/3 0 0 1
Chapitre 3
On a recours encore une fois au vecteur de permutation 6. Pour obtenir la
matrice inverse de A, on doit rsoudre les trois systmes linaires suivants:
A1 = i A2 = 2 A3 = e3
dont le rsultat nous donne les trois colonnes de la matrice A-
1
Le premier
systme est rsolu d'abord par la descente triangulaire:
n faut prendre garde ici au membre de droite. n s'agit bien du vecteur
1 = [1 0 o]Y, mais ordonn suivant le vecteur 6 = [3 1 2]Y pour
tenir compte des lignes qui ont t permutes lors de la dcomposition LU.
La rsolution conduit if= [0 1/2 o]Y. TI reste effectuer la remonte
tri angulaire:
[ ! :{q [ ::J = [ ~
dont le rsultat [0 1/2 O]T reprsente la premire colonne de A-
1
Le
deuxime systme exige dans un premier temps la rsolution de:
Systmes d'quations algbriques 135
( surveiller l'ordre des composantes du vecteur
2
droite), dont la solution
est y= [0 0 - 3]T. Par la suite:
[
1 0 1/3] [ X1 l
0 1 1/2 xz
0 0 1 X3
qui donne la deuxime colonne de A-
1
, soit C2 = [1 3/2 - 3]T. Enfin, un
raisonnement similaire dterminerait la troisime colonne c3 = [0 -1/2 1jT.
La matrice inverse est donc:
0
1/2
0
1
3/2
-3

3.6 Effets de l'arithmtique flottante
Jusqu'ici, nous n'avons utilis que l'arithmtique exacte. n est grandement
temps de regarder si l'arithmtique flottante utilise par les ordinateurs a une
influence quelconque sur les rsultats. ll est probable que oui. En fait, nous
allons voir que certaines matrices sont trs sensibles aux effets de l'arithm-
tique flottante et d'autres, trs peu. Dans le cas de matrices sensibles, nous
parlerons de matrices mal conditionnes.
Remarque 3.24
En arithmtique flottante m chiffres dans la mantisse, on doit effectuer
chaque opration arithmtique en reprsentant les oprandes en notation
flottante et en arrondissant le rsultat de l'opration au me chiffre de la
mantisse (voir la section 1.5). D
illustrons cela l'aide d'un exemple.
136 Chapitre 3
Exemple 3.15
On doit effectuer la dcomposition LU en arithmtique flottante 4 chiffres
de la matrice suivante:
[ 1,012
-2,132
3,104]
-2,132 4,096 -7,013
3,104 -7,013 0,014
Les oprations sont rsumes ci-dessous:
ln
=
1,012
121
=
-2,132
131
=
3,104
u12
=
fi( -2,132/1,012)
=
-2,107
U13
=
fl(3,104/1,012)
=
3,067
122
=
fi( 4,096- fi[( -2,132)( -2,107)])
=
fi( 4,096- 4,492)
=
-0,3960
132
=
fi( -7,013- fl[(3,104)( -2,107)])
=
fi( -7,013 + 6,540)
=
-0,4730
U23
=
fi ( -7,013 - fi[( -2,132)(3,067)])
-0,3960
=
fi ( -7,013 + 6,539)
-0,3960
=
1,197
b3 = fl(0,0140- fl[(3,104)(3,067)]- fi[( -0,4730)(1,197)])
= fl(0,0140- 9,520 + 0,5662)
= -8,940
Systmes d'quations algbriques
On a donc:
LU= [
1,012
-2,132
3,104
0
-0,3960
-0,4730

-2,107
1
0
3,067]
1,197
1
137
Les exemples suivants montrent comment l'arithmtique flottante peut
affecter sensiblement la prcision de la rsolution d'un systme linaire. Nous
discutons galement des moyens d'en diminuer les effets.
Exemple 3.16
Soit le systme suivant:
[
1
1,1
dont la solution exacte est x = [4 3]T. Si on remplace le terme 1,1 de
la matrice par 1,05, la nouvelle solution exacte devient x = [8 1jT. Cet
exemple dmontre qu'une petite modification sur un terme de la matrice
peut entraner une grande modification de la solution exacte. En pratique,
l'arithmtique flottante provoque invitablement de petites modifications de
chaque terme de la matrice et de sa dcomposition LU. ll est alors tout
fait possible que ces petites erreurs aient d'importantes rpercussions sur
la solution et, donc, que les rsultats numriques soient trs loigns de la
solution exacte.
Exemple 3.17
Considrons le systme:

[
0,0003 3,0000 l [ x1 l = [ 2,0001 ]
1,0000 1,0000 x2 1,0000
dont la solution exacte est x= [1/3 2/3JT. ll s'agit maintenant d'effectuer
la dcomposition LU en arithmtique flottante 4 chiffres. On remarque que
138 Chapitre 3
le systme devient en notation flottante 4 chiffres:
[
0,3000 X 10-
3
0,3000 X 10
1
l [ X1 l = [ 0,2000 X 10
1
l
0,1000 X 10
1
0,1000 X 10
1
X2 0,1000 X 10
1
et que le 1 de 2,0001 disparat. La dcomposition LU donne dans ce cas:
LU= [ 0,3000 x 10-
3
0,1000 x 10
1
0 l [ 0,1000 x 10
1
0,1000 x 10
5
]
-0,9999 x 10
4
0 0,1000 x 10
1
Le terme u
12
est trs grand puisque le pivot 0,0003 est presque nul. La
descente triangulaire donne alors:
(
0,2000 x 10
1
) 4
Y1 =fi 0,
3
000 x
10
_
3
= 0,6667 x 10
et
- fl(1- 6667) -
Y2 - _
9999
- 0,6667
Puis la remonte triangulaire donne:
X2 = 0,6667
et
X1 = 6667- (10 000)(0,6667) = 0
Si on compare ce rsultat avec la solution exacte [1/3 2/3JT, on constate une
variation importante de la valeur de x1. On imagine aisment ce qui peut
se produire avec un systme de plus grande taille. Mais comment peut-on
limiter les dgats? Une premire possibilit consiste utiliser plus de chiffres
dans la mantisse, mais cela n'est pas toujours possible. Si on passe en revue
les calculs prcdents, on en vient rapidement souponner que la source
des ennuis est la division par un pivot presque nul. On sait qu'une telle
opration est dangereuse numriquement. Une solution de rechange consiste
donc permuter les lignes mme si le pivot n'est pas parfaitement nul. Dans
notre exemple, on aura:
[
1,0000 1,0000 l [ X1 l = [ 1,0000 l
0,0003 3,0000 X2 2,0001
Cette fois, la dcomposition LU (toujours 4 chiffres) donne:
LU = [ 1,0000 0 l [ 1,0000 1,0000 l
0,0003 3,0000 0 1,0000
Systmes d'quations algbriques 139
car:
l22 = fl[3- fl[(1)(0,0003)]] = fl[3- 0,0003] = 3
La descente triangulaire donne if= [1 0,6666jT et la remonte nous donne
la solution i = [0,3334 0,6666jT, qui est trs prs de la solution exacte .

Remarque 3.25
Une excellente stratgie de recherche du pivot consiste, une fois laie colonne
de L calcule, placer en position de pivot le plus grand terme en valeur
absolue de cette colonne. Cette recherche ne tient compte que des lignes
situes sous le pivot actuel. D
Exemple 3.18
Cet exemple illustre comment effectuer une permutation de faon systma-
tique. Seules les grandes tapes de la dcomposition sont indiques, les cal-
culs tant laisss en exercice. Les coefficients de la matrice sont dtruits au
fur et mesure que les calculs progressent et sont remplacs par lij ou Uij.
Considrons donc la matrice:
La premire colonne de L tant la premire colonne de A, on a
On peut alors permuter la ligne 3 et la ligne 1 de manire placer en position
de pivot le plus grand terme de la premire colonne de L.
140 Chapitre 3
On a maintenant:
[rn
6
n
[n
1 0=
[] 6
On calcule la premire ligne de U:
[rn rn]
0=
[n
1 2
[] 6 9
La deuxime colonne de L devient alors:
[rn ml
[n
2 1w1 2
0=
[] 4 9
On voit qu'il faut maintenant permuter les deux dernires lignes pour amener
en position de pivot le plus grand terme de la colonne, qui est 4.
En continuant ainsi, on trouve la dcomposition LU sous forme compacte:
[
rn [3]
[] [!] 3/2 6 = 1
l-31 9/2
2

La stratgie de recherche du pivot amliore souvent la prcision des r-
sultats, mais cette opration n'est pas toujours suffisante. L'exemple qui suit
montre comment la mise l'chelle peut galement contribuer la qualit
des rsultats.
Systmes d'quations algbriques 141
Exemple 3.19
Soit le systme suivant:
[
2,0000 100 000 l [ XJ l = [ 100 000 l
1,0000 1,0000 X2 2,0000
dont la solution exacte est [1,00002 0,99998f. Nul besoin ici de rechercher
un plus grand pivot. La dcomposition LU (en arithmtique flottante 4
chiffres) donne:
LU= [ 2 0 l [ 1 50 000 l
1 -50 000 0 1
La descente triangulaire conduit fi = [50 000 1 f et la remonte trian-
gulaire, i = [0 1f. Ici encore, l'erreur est considrable par rapport la
solution exacte. Cet cart est d au fait que la matrice A est constitue de
termes d'ordre de grandeur trs diffrents. Par exemple, quand on calcule le
terme l22, on doit effectuer en arithmtique flottante 4 chiffres:
1- (1)(50 000) = -50 000
On a donc effectu une autre opration dangereuse, savoir soustraire (ou
additionner) des termes dont les ordres de grandeur sont trs diffrents.
Une solution partielle ce problme est d'effectuer une mise l'chelle des
coefficients de la matrice.

Dfinition 3.5
La mise l'chelle consiste diviser chaque ligne du systme linaire par
le plus grand terme (en valeur absolue) de la ligne correspondante de la
matrice A. On ne tient pas compte du terme de droite b pour dterminer
le plus grand terme de chaque ligne.
142 Chapitre 3
Dans notre exemple, il suffit de diviser la premire ligne par 100 000 (le
plus grand terme de la deuxime ligne tant 1) et de rsoudre:
[
0,2000 X 10-
4
1 l [ Xt l [ 1 l
1,0000 1,0000 X2 = 2,0000
La recherche d'un nouveau pivot est maintenant ncessaire. On peut montrer
que la rsolution en arithmtique flottante 4 chiffres donne la solution
i = [1 1f, ce qui est beaucoup plus prs du rsultat exact.
Remarque 3.26
La mise l'chelle utilise la dernire opration lmentaire sur les lignes d'un
systme linaire, soit la multiplication d'une ligne par un scalaire. D
Remarque 3.27
Lorsqu'on multiplie une ligne par un scalaire, le dterminant de la matrice
est multipli par ce scalaire. Aprs avoir effectu la dcomposition LU, on
peut rcuprer le dterminant de la matrice A en divisant le produit de la
diagonale de L par ce scalaire. D
Les exemples prcdents montrent clairement que certains systmes li-
naires sont trs sensibles aux erreurs dues l'arithmtique flottante. Dans
la prochaine section, nous allons essayer de mesurer cette sensibilit.
3.7 Conditionnement d'une matrice
Cette section traite d'erreur et de mesure d'erreur lie aux systmes li-
naires. TI nous faut tout de suite introduire une mtrique permettant de
mesurer l'cart entre une solution numrique et une solution exacte. Cela
nous amne donc aborder la notion de norme vectorielle au sens de la
dfinition suivante.
Systmes d'quations algbriques 143
Dfinition 3.6
Une norme vectorielle est une application de Rn dans R (R dsigne l'en-
semble des rels) qui associe un vecteur i un scalaire not JJiJJ et qui
vrifie les trois proprits suivantes:
1. La norme d'un vecteur est toujours strictement positive, sauf si le
vecteur a toutes ses composantes nulles:
JJiJJ > 0, sauf si i = 0 (3.25)
2. Si a est un scalaire, alors:
JI ai Il= JaJJJiJJ
(3.26)
o Jal est la valeur absolue de a.
3. L'ingalit triangulaire est toujours vrifie entre deux vecteurs i
et fi quelconques:
IIi+ Y11 li ill+ IIY11
(3.27)
Toute application vrifiant ces trois proprits est une norme vectorielle.
La plus connue est sans doute la norme euclidienne.
Dfinition 3. 7
La norme euclidienne d'un vecteur i est note JJille et est dfinie par:
(3.28)
Thorme 3.3
La norme euclidienne vrifie les trois proprits d'une norme vectorielle.
Dmonstration (facultative):
1. La dmonstration de la proprit 3.25 est triviale puisque la racine
carre d'un nombre ne peut s'annuler que si ce nombre est nul. Or,
144 Chapitre 3
pour que le terme sous la racine carre soit nul, il faut que toutes les
composantes de i soient nulles.
2. La proprit 3.26 dcoule de:
3. L'ingalit triangulaire 3.27 est un peu plus difficile obtenir. Soit i
et y, deux vecteurs et a, un scalaire. En vertu de la proprit 3.25 dj
dmontre, on a d'abord pour un scalaire a quelconque:
o < IIi+ y l l ~
c'est--dire un polynme du deuxime degr en a. On aura reconnu
dans l'expression prcdente le produit scalaire habituel de deux vec-
teurs, not ( i y). Puisque ce polynme est toujours positif, et ce quel
que soit a, le discriminant B
2
- 4AC doit vrifier l'ingalit:
(3.29)
Dans le cas contraire, le polynme aurait deux racines relles et pren-
drait des valeurs ngatives entre ces racines. En remplaant les valeurs
de A, B et C dans la relation 3.29 et en divisant par 4, on obtient:
li YI ~ llille IIY1Ie
(3.30)
Systmes d'quations algbriques 145
qui est l'ingalit de Cauchy. Cette ingalit permet de dmontrer la
troisime proprit. En effet, en prenant a = 1 et en utilisant l'ingalit
de Cauchy, on a:
+ 2(x y)+
< li IIY1Ie +
(llxlle + IIY1Ie)
2
qui est le rsultat attendu. D
On peut dfinir, en plus de la norme euclidienne, plusieurs normes vri-
fiant les trois proprits ncessaires.
Dfinition 3.8 Normes lt et loo
La norme Zt est dfinie par:
n
llilh = L lxii
i=l
tandis que la norme loo est dfinie par:
Exemple 3.20
Pour le vecteur i = [1 - 3 - 8JT, on a:
llilh 1+3+8
max(1, 3, 8)

(3.31)
(3.32)
12
8
146 Chapitre 3
Puisque nous nous intressons plus particulirement aux systmes li-
naires, il importe de pouvoir dfinir des normes relatives aux matrices.
Dfinition 3.9
Une norme matricielle est une application qui associe une matrice A
un scalaire not IIAII vrifiant les quatre proprits suivantes:
1. La norme d'une matrice est toujours strictement positive, sauf si la
matrice a toutes ses composantes nulles:
IIAII > 0, sauf si A= 0 (3.33)
2. Si a est un scalaire, alors:
Il aA Il= laiiiAII
(3.34)
3. L'ingalit triangulaire est toujours vrifie entre deux matrices A
et B quelconques, c'est--dire:
liA+ Bll IIAII + IIBII
(3.35)
4. Une quatrime proprit est ncessaire pour les matrices:
IIABII IIAIIIIBII
(3.36)
Toute application qui vrifie ces quatre proprits est une norme matri-
cielle. Voici quelques exemples.
Systmes d'quations algbriques
Dfinition 3.10 Quelques normes matricielles
IIAIIt
liAI loo
max
l ~ j ~ n
max
9 ~ n
n
147
La norme IIAIIt consiste sommer (en valeur absolue) chacune des co-
lonnes de A et choisir la plus grande somme. La norme IIAIIoo fait
un travail similaire sur les lignes. Enfin, la norme IIAII2 est en quelque
sorte l'quivalent de la norme euclidienne pour les matrices. On l'appelle
quelquefois la norme de Frobenius.
Exemple 3.21
Soit la matrice:
Les diffrentes normes prennent alors les valeurs suivantes:
IIAIIt
max(5, 12, 10)
liAI loo
max(8, 9, 10)
v1 + 4 + 25 + 9 + 1 + 25 + 1 + s1

12
10
n ne reste qu'un point important aborder pour avoir un portrait com-
plet de la situation. Nous avons des normes vectorielles et matricielles qui
permettent de manipuler des vecteurs et des matrices respectivement. Lorsque
148 Chapitre 3
l'on s'intresse aux systmes linaires, on doit souvent manipuler des pro-
duits de matrices par des vecteurs, d'o l'intrt de la dfinition suivante.
Dfinition 3.11
Une norme vectorielle et une norme matricielle sont dites compatibles si
la condition:
IIAxll IIAIIIIxll
(3.37)
est valide quels que soient la matrice A et le vecteur x.
Les trois normes qui apparaissent dans la relation 3.37 sont respectivement
une norme vectorielle (car Ai est un vecteur), une norme matricielle et une
norme vectorielle.
Remarque 3.28
Les normes vectorielles et matricielles ne sont pas toutes compatibles entre
elles. On peut dmontrer que:
llillt et IIAIIt
llxlloo et IIAIIoo
llxlle et IIAII2
sont compatibles deux deux. D
Exemple 3.22
Considrons de nouveau le vecteur x = [1 - 3 - 8]T et la matrice:
Le produit Ai donne le vecteur [ -33 34 28]T et donc:
IIAillt = 95 IIAilloo = 34 et IIAX'IIe = J3029
Systmes d'quations algbriques 149
L'ingalit 3.37 devient respectivement en norme h:
95 ::; (12)(12)
en norme loo:
34 ::; (10)(8)
et en norme euclidienne:
J3029 ::; ( v'147) ( v'74) = v' l 8 78

Nous en arrivons au point cl. de cette section, qui est le conditionnement
d'une matrice. Introduisons d'abord sa dfinition.
Dfinition 3.12
Le conditionnement d'une matrice (not condA) est dfini par:
condA = IIAIIIIA-
1
11 (3.38)
ll s'agit simplement du produit de la norme de A et de la norme de son
mverse.
Remarque 3.29
Le conditionnement dpend de la uorme matricielle utilise. On utilise le
plus souvent la norme IIAIIoo 0
ll ne reste plus qu' montrer en quoi le conditionnement d'une matrice
est si important pour dterminer la sensibilit d'une matrice aux erreurs
d'arrondis et l'arithmtique flottante.
Tout d'abord, on montre que le conditionnement est un nombre suprieur
ou gal 1. En effet, si I dsigne la matrice identit (ayant des 1 sur la
diagonale et des zros partout ailleurs), on a:
IIAII = IIAIII::; IIAIIIIIII
en vertu de la relation 3.36. Cela entrane, aprs division par IIAII de chaque
ct, que IIIII 1, quelle que soit la norme matricielle utilise. On en conclut
que:
150 Chapitre 3
et donc que:
1 s; condA < oo (3.39)
3.7.1 Bornes d'erreurs et conditionnement
Considrons le systme linaire:
et notons x, la solution exacte et X*, une solution approximative qu'on ob-
tient en utilisant l'arithmtique flottante. Ces deux vecteurs devraient tre
prs l'un de l'autre, c'est--dire que la norme de l'erreur:
lle11 = llx- X* li
devrait tre petite. Ce n'est pas toujours le cas. Dfinissons le rsidu par:
r= "b-AX* (3.40)
On a alors:
f' = b- AX* = Ax - A X* = A( x - X*) = A
ce qui signifie que = A-
1
f'. Si on utilise des normes vectorielles et matri-
cielles compatibles, on a en vertu de la relation 3.37:
De faon analogue, puisque A r:
qui peut s'crire:
llf11 s; IIAIIIIe11
llf11 < lle11
IIAII-
En regroupant les relations 3.41 et 3.42, on obtient:
(3.41)
(3.42)
(3.43)
Par ailleurs, en refaisant le mme raisonnement avec les galits Ax = b et
x A-
1
b, on trouve:
Systmes d'quations algbriques 151
Aprs avoir invers ces ingalits, on trouve:
1 < _1_ < IIAII
IIA-
1
IIIIbll - llxll - llbll
(3.44)
En multipliant les ingalits 3.43 et 3.44, on obtient le rsultat fondamental
suivant.
Thorme 3.4
1 llf11 < ll11 < condA llf11
condA llbll - llxll - llbll
0
(3.45)
Remarque 3.30
Plusieurs remarques s'imposent pour bien comprendre l'ingalit prcdente.
1. Le terme du milieu reprsente l'erreur relative entre la solution exacte
x et la solution approximative X*.
2. Si le conditionnement de la matrice A est prs de 1, l'erreur relative
est coince entre deux valeurs trs prs l'une de l'autre. Si la norme du
rsidu est petite, l'erreur relative est galement petite et la prcision
de la solution approximative a toutes le chances d'tre satisfaisante.
3. Par contre, si le conditionnement de la matrice A est grand, la valeur
de l'erreur relative est quelque part entre 0 et un nombre possiblement
trs grand. Il est donc craindre que l'erreur relative soit alors grande,
donc que la solution approximative soit de faible prcision et mme,
dans certains cas, compltement fausse.
4. Mme si la norme du rsidu est petite, il est possible que l'erreur rela-
tive lie la solution approximative soit quand mme trs grande.
5. Plus le conditionnement de la matrice A est grand, plus on doit tre
attentif l'algorithme de rsolution utilis.
6. ll importe de rappeler que, mme si une matrice est bien condition-
ne, un mauvais algorithme de rsolution peut conduire des rsultats
errons. 0
152 Chapitre 3
On peut obtenir une autre ingalit qui illustre le rle du conditionnement
d'une matrice quant la prcision de la solution numrique d'un systme
linaire. Soit le systme linaire:
Lorsque l'on rsout un tel systme sur ordinateur, o la reprsentation des
nombres n'est pas toujours exacte, on rsout en fait:
o la matrice E reprsente une perturbation du systme initial, due par
exemple aux erreurs de reprsentation sur ordinateur des coefficients de la
matrice A. La matrice E peut galement reprsenter les erreurs de mesure
lorsque les coefficients de la matrice A sont obtenus exprimentalement. Nous
noterons encore X*, la solution du systme perturb. On a donc la relation:
On en conclut que:
x- X* = A-
1
EX*
Donc, en vertu des relations 3.36 et 3.37:
!lx- X* li< IIA-tiiiiEIIIIX*II = IIAIIIIA-tiiiiEIIIIX*II
- liAI!
d'o l'on tire le thorme suivant.
Thorme 3.5
!lx- X* li IIEII
llx*ll condA liAI!
0
(3.46)
Remarque 3.31
Les remarques suivantes permettent de bien mesurer la porte de l'inga-
lit 3.46.
1. Le terme de gauche est une approximation de l'erreur relative entre la
solution exacte et la solution du systme perturb. (On devrait avoir
!lXII au dnominateur pour reprsenter vraiment l'erreur relative.)
Systmes d'quations algbriques 153
2. Le terme de droite est en quelque sorte l'erreur relative lie aux coef-
ficients de la matrice A multiplie par le conditionnement de A.
3. Si condA est petit, une petite perturbation sur la matrice A entrane
un petite perturbation sur la solution x.
4. Par contre, si condA est grand, une petite perturbation sur la matrice
A pourrait rsulter en une trs grande perturbation sur la solution du
systme. ll est par consquent possible que les rsultats numriques
soient peu prcis et mme, dans certains cas, compltement faux. 0
Remarque 3.32
Trs souvent, la perturbation E de la matrice A provient des erreurs dues
la reprsentation des nombres sur ordinateur. Par dfinition de la prcision
machine E et de la norme loo, on a dans ce cas:
IIEIIoo S: E IIAIIoo
ce qui permet de rcrire la conclusion 3.46 du thorme sous la forme:
IIX- X*lloo -1
IIX*IIoo ::; E condA = E IIAIIoo liA lloo
(3.47)
On constate que, plus le conditionnement est lev, plus la prcision machine
E doit tre petite. Si la simple prcision est insuffisante, on recourt la double
prcision. 0
Exemple 3.23
La matrice:
A=[
1,012 -2,132
3,104]
-2,132 4,096 -7,013
3,014 -7,013 0,014
a comme inverse:
A-1 = [
-13,729 -6,0755
0,62540 l
-6,0755 -2,6888 0,133 99
0,62540 0,133 99 -0,11187
154 Chapitre 3
On a alors IIAIIoo = 13,241 et IIA-
1
IIoo = 20,43. On conclut que le condi-
tionnement de la matrice A est:
condA = (13,241 )(20,43) = 270,51

Remarque 3.33
En utilisant une autre norme matricielle, on obtiendrait un conditionnement
diffrent. Toutefois, on pourrait montrer que le conditionnement, s'il est
grand dans une norme, sera grand dans toutes les normes. 0
Exemple 3.24
La matrice:
a comme mverse:
[
3,02
A= 4,33
-0,83
-1,05
0,56
-0,54
2,53]
-1,78
1,47
[
5,661 -7,273 -18,55]
A-
1
= 200,5 -268,3 -669,9
76,85 -102,6 -255,9
Pour cette matrice, IIAIIoo = 6,67 et IIA-
1
IIoo = 1138,7. Le conditionnement
de la matrice est donc 7595, ce qui est le signe d'une matrice mal condition-
ne.

Exemple 3.25
Nous avons dj considr la matrice:
A= [ 0,0003 3,0 l
1,0 1,0
Systmes d'quations algbriques 155
dont l'inverse est:
-1 [ -0,333 367 1,0001 l
A = 0,333 367 1,0001 x 10-
4
On a ainsi un conditionnement d'environ 4, ce qui est relativement faible.
Nous avons vu que la rsolution d'un systme linaire l'aide de cette ma-
trice, sans effectuer de permutation de lignes, aboutit de mauvais rsultats.
Cela dmontre bien qu'un algorithme mal choisi (la dcomposition LU sans
permutation de lignes dans ce cas) peut s'avrer inefficace, et ce mme si la
matrice est bien conditionne.

3.8 Systmes non linaires
Les phnomnes non linaires sont extrmement courants en pratique. lls
sont sans doute plus frquents que les phnomnes linaires. Dans cette sec-
tion, nous examinons les systmes non linaires et nous montrons comment
les rsoudre l'aide d'une suite de problmes linaires, auxquels on peut
appliquer diverses techniques de rsolution comme la dcomposition LU.
Le problme consiste trouver le ou les vecteurs x= [ Xt x2 X3 xnJT
vrifiant les n quations non linaires suivantes:
ft(xt, x2, X3, , Xn) 0
!2(x1,x2,x3, ,xn) 0
/3(Xt,X2,X3,,Xn) 0
(3.48)
fn(Xt,X2,X3,,xn) 0
o les fi sont des fonctions den variables que nous supposons diffrentiables.
Contrairement aux systmes linaires, il n'y a pas de condition simple asso-
cie aux systmes non linaires qui permette d'assurer l'existence et l'unicit
de la solution. Le plus souvent, il existe plusieurs solutions possibles et seul
le contexte indique laquelle est la bonne.
Les mthodes de rsolution des systmes non linaires sont nombreuses.
Notamment, presque toutes les mthodes du chapitre 2 peuvent tre gn-
ralises aux systmes non linaires. Pour viter de surcharger notre expos,
nous ne prsentons que la mthode la plus importante et la plus utilise en
pratique, soit la mthode de Newton.
156 Chapitre 3
L'application de cette mthode un systme de deux quations non
linaires est suffisante pour illustrer le cas gnral. ll serait galement bon
de rviser le dveloppement de la mthode de Newton pour une quation
non linaire (voir le chapitre 2) puisque le raisonnement est le mme pour
les systmes.
Considrons donc le systme:
ft(xt,x2) 0
h(xt,x2) 0
Soit xg), une approximation initiale de la solution de ce systme. Cette
approximation initiale est cruciale et doit toujours tre choisie avec soin. Le
but de ce qui suit est de dterminer une correction ( 8xt, 8x
2
) xg) de
telle sorte que:

= 0
+ 8x1, xg + 8x2) = 0
Pour dterminer ( 8x
1
, 8x2), il suffit maintenant de faire un dveloppement
de Taylor en deux variables pour chacune des deux fonctions (voir la sec-
tion 1.6.2; voir aussi Thomas et Finney, rf. [22]):
f
(
0 0) 8ft ( 0 0) >: 8ft ( 0 0) >:
0 = 1 x
1
,x
2
+ -
8
x
1
,x
2
ux1 + -
8
x
1
,x
2
ux2 +
Xl X2
f
(
0 0) 8 h ( 0 0) >: 8 h ( 0 0) >:
0 = 2 x
1
,x
2
+ -
8
x
1
,x
2
ux1 + -
8
x
1
,x
2
ux2 +
Xl X2
Dans les relations prcdentes, les pointills dsignent des termes d'ordre
suprieur ou gal deux et faisant intervenir les drives partielles d'ordre
correspondant. Pour dterminer (8x
1
, 8x2), il suffit de ngliger les termes
d'ordre suprieur et d'crire:
8 h ( 0 0) >: 8 h ( 0 0) >:
-
8
x
1
, x
2
ux1 + -
8
x
1
, x
2
ux
2
Xl X2
ou encore sous forme matricielle:
Systmes d'quations algbriques 157
Ce systme linaire s'crit galement sous une forme plus compacte:
(3.49)
o J( xg) dsigne la matrice des drives partielles ou matrice jacobienne
value au point xg), o 8-; est le vecteur des corrections relatives
chaque variable et o - R( xg) est le vecteur rsidu valu en xg).
Le dterminant de la matrice jacobienne est appel le jacobien. Le jacobien
doit bien entendu tre diffrent de 0 pour que la matrice jacobienne soit
inversible. On pose ensuite:
xi 8x1
xg + 8x2
qui est la nouvelle approximation de la solution du systme non linaire. On
cherchera par la suite corriger (xi, d'une nouvelle quantit (8-;), et ce
jusqu' la convergence.
De manire plus gnrale, on pose:
h(:t)
x1
fi(:t)
x2
fi(:t)
Xn
J(:i) =
h(:t)
x1
h(:t)
x2
h (:i)
Xn
fn(:i)
x1
fn(:i)
x2
fn(:i)
Xn
c'est--dire la matrice jacobienne value au point if = (xi, De
plus on pose:
[
ft(X) l
- . h(X)
R(:tt) = .
fn(:i)
[
8x1 l _ 8x2
8x = .
8xn
pour en arriver l'algorithme gnral suivant.
158 Chapitre 3
Algorithme 3.2: Mthode de Newton applique aux systmes
1. tant donnE, un critre d'arrt
2. tant donn N, le nombre maximal d'itrations
3. tant donn XO = x ~ xg x ~ J T une approximation initiale de la
solution du systme
4. Rsoudre le systme linaire:
(3.50)
et poser:
convergence atteinte
crire la solution xi+l
arrt
6. Si le nombre maximal d'itrations N est atteint:
convergence non atteinte en N itrations
arrt
7. Retour l'tape 4 D
Exemple 3.26
On cherche trouver l'intersection de la courbe x
2
= ex
1
et du cercle de
rayon 4 centr l'origine d'quation xi + ~ = 16. L'intersection de ces
courbes est une solution de:
eXl - X2 0
xi+ ~ - 16 0
Systmes d'quations algbriques 159
-8 -6 -4 -2 0 2 4 6 8
Figure 3.1: Intersection de deux courbes
La premire tape consiste calculer la matrice jacobienne de dimension 2.
Dans ce cas, on a:
Un graphique de ces deux courbes montre qu'il y a deux solutions ce pro-
blme non linaire (voir la figure 3.1 ). La premire solution se trouve prs du
point ( -4, 0) et la deuxime, prs de (2,8, 2,8). Prenons le point (2,8, 2,8)
comme approximation initiale de la solution de ce systme non linaire,
c'est--dire xo = [2,8 2,8jT.
1. Itration 1:
Le systme 3.50 devient:
[ l [ l = - [ (2,8)::
8
16]
c'est--dire
[
16,445 -1 l [ 5x
1
l = _ [ 13,645 ]
5,6 5,6 5x
2
-0,3200
dont la solution est l!c = [ -0,778 90 0,836 04jT. La nouvelle approxi-
mation de la solution est donc:
&x1
= xg + &x2 =
2,8- 0,778 90
2,8 + 0,836 04
2,0211
3,636 04
160 Chapitre 3
2. Itration 2:
On effectue une deuxime itration partir de (xl, xD. Le systme 3.50
devient alors:
c'est--dire
[
7,5466 -1 l [ 5x
1
l [ 3,9106]
4,0422 7,2721 5x
2
= - 1,3056
dont la solution est &"";; = [ -0,5048 0,101 06]T. On a maintenant:
xi x ~ + 5x
1
2,0211 - 0,504 80 1,5163
x ~ = x ~ 5x
2
= 3,636 04 + 0,10106 = 3,7371
3. Itration 3:
la troisime itration, on doit rsoudre:
[
4,5554 -1 l [ 5x
1
] [ 0,81824]
3,0326 7,4742 5x
2
= - 0,265 08
ce qui entrane que 5-; = [ -0,172 08 0,034 355f. La nouvelle solution
est:
4. Itration 4:
1,5163- 0,172 08
3,7371 + 0,034 355
Le systme linaire rsoudre est:
1,3442
3,7715
[
3,8351 -1 l [ 5x
1
l [ 0,063617]
2,6884 7,5430 5x
2
= - 0,031086
ce qui entrane que 5-; = [ -0,016 1616 0,016 384 7]T. La nouvelle ap-
proximation de la solution est:
xi x{ + &x1 1,3442- 0,016 1616
xi = x ~ 5x
2
= 3,7715 + 0,016 3847
1,3280
3,7731
Systmes d'quations algbriques 161
5. Itration 5:
Enfin, partir de [1,3280 3,7731]T, on doit rsoudre:
[
3,7735 -1 l [ 5x
1
l [ 0,348 86 x 10-
3
]
2,6560 7,5463 5x
2
= - 0,169 46 x 10-
3
dont la solution est l?c = [9,03 x 10-
5
9,25 x 10-
6
]T. La solution du
systme non linaire devient:
1,3281
3,7731
On dduit la convergence de l'algorithme de Newton du fait que les modules
de 5;, et de R diminuent avec les itrations .

3.34
1. La convergence de la mthode de Newton dpend de l'approximation
initiale XO de la solution. Un mauvais choix de XO peut rsulter en un
algorithme divergent.
2. On peut dmontrer que, lorsqu'il y a convergence de l'algorithme, cette
convergence est gnralement quadratique dans le sens suivant:
(3.51)
Cela signifie que la norme de l'erreur l'itration i + 1 est approxima-
tivement gale une constante C multiplie par le carr de la norme
de l'erreur l'tape i. L'analogie est vidente avec le cas d'une seule
quation non linaire tudi au chapitre 2.
3. La convergence quadratique est perdue si la matrice jacobienne est
singulire au point x, solution du systme non linaire. Encore une
fois, ce comportement est analogue au cas d'une seule quation o la
mthode de Newton perd sa convergence quadratique si la racine est de
multiplicit plus grande que 1 (J' ( r) = 0).
4. Pour obtenir la convergence quadratique, on doit calculer et dcompo-
ser une matrice de taille n sur n chaque itration. De plus, il faut
fournir un ventuel programme informatique les n fonctions fi( x) et
les n
2
drives partielles de ces fonctions. Cela peut devenir rapidement
fastidieux et coteux lorsque la dimension n du systme est grande.
162 Chapitre 3
5. ll existe une variante de la mthode de Newton qui vite le calcul
des n
2
drives partielles et qui ne ncessite que les n fonctions fi( x).
La mthode de Newton modifie consiste remplacer les drives par-
tielles par des diffrences centres (voir le chapitre 6). On utilise alors
l'approximation du second ordre (O(h
2
)):
fi(Xt, , Xj-1
1
Xj + h, , Xn)- fi(Xl, , Xj-1, Xj- h, , Xn)
2h
(3.52)
Cette approximation introduit une petite erreur dans le calcul de la
matrice jacobienne, mais gnralement la convergence est quand mme
trs rapide. D
Exemple 3.27
Dans l'exemple prcdent, le calcul du premier terme de la matrice ja-
cobienne de la premire itration donnait:
h (2 8 ) -
218
- 646
- , , 2,8 - e - 16,444 77
X1
tandis que l'approximation 3.52 donne pour h = 0,001:
!1(2,801' 2,8)- !1(2,799' 2,8) = 16 44465
(2)(0,001) '
On constate que l'erreur introduite est minime .

3.9 Applications
3.9.1 Calcul des tensions dans une ferme
Une ferme est une structure bidimensionnelle relativement simple compo-
se de membrures mtalliques droites jointes par des rotules. Les quations
Systmes d'quations algbriques
1
1
1
VIOOOO N
Figure 3.2: Membrures et rotules d'une ferme
163
de la mcanique nous assurent que les efforts dans une telle structure se
rduisent des tractions-compressions. Cette structure, dont on nglige le
poids, est par la suite soumise une charge qui provoque des tensions ou
des compressions dans les membrures. Cela provoque galement des dpla-
cements de faible amplitude des rotules. Typiquement, on a la situation de
la figure 3.2, o une ferme reprsentant grossirement un pont de chemin de
fer est constitue de 11 membrures et de 7 rotules. Le premire rotule est
fixe sur un support qui prvient tout dplacement et qui exerce une pousse
horizontale H
1
et une pousse verticale V
1
. l'autre extrmit, la rotule 7
est fixe sur un rail qui ne prvient que les dplacements verticaux et qui
fournit une pousse verticale V
2
Des charges de -10000 Net de -20000 N
sont exerces sur les rotules 3 et 5 respectivement. Les forces sont considres
positives si elles agissent vers le haut suivant la verticale et vers la droite
suivant l'horizontale.
Pour calculer les tensions Ti dans les membrures, il suffit de recourir
aux quations d'quilibre horizontal et vertical chaque rotule. Nous sup-
posons que chaque membrure est en tension. Si nous obtenons un rsultat
ngatif pour l'un des Ti, cela signifie que la membrure en question est en
compression. Une membrure en tension exerce une pousse sur les rotules
qui, en raction, poussent sur les membrures. L'quilibre est atteint lorsque
ces pousses sont compenses par les charges externes agissant sur la rotule.
La figure 3.3 illustre les forces exerces sur chaque rotule. l'aide de cette
figure, on peut tablir les conditions d'quilibre.
Rotule 1: Fixe
Rotule 2: quilibre horizontal et vertical
-T1 cos 30 + T3 cos45 + T
4
0
164 Chapitre 3

/ <50
I; I;
45

45
19
'{, E .. I;o
20000 N

:0/
19 -z;l
Figure 3.3: Forces exerces sur les rotules
Rotule 3: quilibre horizontal et vertical
Rotule 4: quilibre horizontal et vertical
Rotule 5: quilibre horizontal et vertical
Rotule 6: quilibre horizontal et vertical
-T
8
- Tg cos 45 + T
1
1 cos 30 0
Systmes d'quations algbriques
165
Rotule 7: quilibre horizontal seulement
- T
10
- T11 cos 30 0
Sous forme matricielle, on obtient un systme linaire de 11 quations de
la forme:
AT= b
La matrice A complte est:
-a 0 b 1 0 0 0 0 0 0 0
-0,5 0 -b 0 0 0 0 0 0 0 0
0 -1 -b 0 b 1 0 0 0 0 0
0 0 b 0 b 0 0 0 0 0 0
0 0 0
-1 -b 0 b 1 0 0 0
A= 0 0 0 0 -b 0 -b 0 0 0 0
0 0 0 0 0 -1 -b 0 b 1 0
0 0 0 0 0 0 b 0 b 0 0
0 0 0 0 0 0 0 -1 -b 0 a
0 0 0 0 0 0 0 0 -b 0 -0,5
0 0 0 0 0 0 0 0 0 -1 -a
o a= cos 30 = 0,866 025 404 et b = cos 45 = sin 45 = 0,707 106 781.
T1 0
T2 0
T3 0
T4
10000
T5 0
T= T6 b= 0
T1 0
Ts
20000
Tg 0
Tw 0
T11 0
Une dcomposition LU permet la rsolution de ce systme. On obtient les
valeurs suivantes pour les tensions (en newtons) exerces sur les diffrentes
166
membrures:
-27 320,5
23 659,5
19 321,4
-37 319,7
- -5177,1
T = 40980,0
5177,1
-44640,2
23111,4
28 300,5
-32 679,5
Chapitre 3
Ainsi, les membrures 1, 4, 5, 8 et 11 sont en compression et toutes les autres
sont en tension. Pour vrifier la validit de ces rsultats, on peut calculer les
forces verticales Vi et V
2
L'quilibre des forces verticales la rotule 1 nous
assure que:
V1 = -T1 sin 30 = 13 660,25 N
et de la mme manire la rotule 7:
V2 = -Tu sin 30 = 16 339,75 N
Le total de V
1
+ V
2
est bien 30 000 N, correspondant la charge totale.
On pourrait maintenant facilement tudier l'effet de diffrentes rparti-
tions de charge sur cette structure. Seul le vecteur b serait affect. La matrice
A ne change pas tant que l'on ne modifie pas la ferme elle-mme.
3.9.2 Deuxime modle de viscosit
Au chapitre prcdent (voir la section 2.6.2), nous avons considr un
modle de viscosit exprim par la loi puissance de la forme:
1J = TJoi'(J-1
Un modle plus raliste est le modle de Carreau
1
qui est de la forme:
(3.53)
1
P. Carreau est professeur au Dpartement de gnie chimique de l'cole Polytechnique
de Montral.
Systmes d'quations algbriques 167
Les paramtres TJo, et f3 sont dtermins en fonction des mesures ex-
primentales. Nous sommes donc amens rechercher les valeurs minimales
de la fonction de moindres carrs:
1 {3-1
F(TJo, , (3) =
2
L..)TJo(1 +
2
'}'f)-2 - TJi)
2
i=l
o npt est le nombre de donnes mesures l'aide d'un rhomtre. Nous
utilisons les mmes donnes rhologiques qu' la section 2.6.2, ce qui nous
permettra de comparer le modle de Carreau et la loi puissance. Le minimum
sera atteint lorsque:
F(TJo,,(3) = F(TJo,,f3) = F(TJO,,(3) = O
TJo f3
c'est--dire lorsque
2
:
F( TJo, , (3)
TJo
F( TJo, , (3)

npt
'""' 2 {3-1 2 {3-1
L._.,(TJo(1 + -yl)-2 - TJi)(1 + i't)-2 = 0
i=l
que l'on peut simplifier lgrement en extrayant de la sommation les termes
qui ne dpendent pas de l'indice i. On obtient en bout de course le systme
de trois quations non linaires suivant:
0
i=l
0 (3.54)
i=l
npt
L(TJo(1 +
2
i't)f3:/ - TJi)(1 +
2
i't)f3;-
1
ln(l +
2
i'f) 0
i=l
2
La drive de af(x) est af(x) f'(x) ln a.
168
Viscosit
(Pa s)
Chapitre 3

Exprience
Modle
10C0
100

0,01 0,1 10
Taux de cisaillement (lis)
o
1
331-1
Figure 3.4: Loi de Carreau: 1J = 4926,08(1 + (116,922f)'
2
) 2
On a utilis la mthode de Newton modifie (voir l'quation 3.52) pour r-
soudre ce systme. partir de l'approximation initiale [5200 140 0,38]T, la
mthode a converg en 8 itrations vers la solution [4926,08 116,922 0,331 JT.
Une comparaison du modle de Carreau avec les donnes exprimentales est
prsente la figure 3.4.
On remarque une meilleure correspondance entre les valeurs exprimen-
tales et celles calcules l'aide du modle de Carreau que celle qui a t
obtenue par la loi puissance (voir la figure 2.9).
Systmes d'quations algbriques 169
3.10 Exercices
1. Soit la matrice:
u l
Identifier les matrices W qui permettent d'effectuer les oprations sui-
vantes:
a) ; +--- ;- 3i;.
b) ; <--+ ;
c) ; +--- si;
d) ; +--- ; +si;
Calculer le dterminant de chaque matrice w et son ililverse w-
1
.
2. Rsoudre les systmes triangulaires suivants:
a)
b)
Calculer le dterminant de ces deux matrices.
3. En indiquant bien les oprations effectues sur les lignes, utiliser l'li-
mination de Gauss pour triangulariser les systmes linaires suivants:
a)
b)
170 Chapitre 3
Calculer le dterminant de ces deux matrices.
4. Obtenir les matrices W correspondant aux oprations lmentaires ef-
fectues sur les matrices de l'exercice prcdent. Montrer pour ces deux
exemples que la mthode d'limination de Gauss est quivalente une
dcomposition LU.
5. a) Rsoudre le systme linaire suivant par limination de Gauss et en
utilisant l'arithmtique flottante 4 chiffres, mais sans permutation
de lignes.
[
0, 729 0,81
1 1
1,331 1,21
0,9] [ Xt l [ 0,6867]
1 X2 = 0,8338
1,1 X3 1
b) Rsoudre le mme systme linaire en arithmtique flottante
4 chiffres, mais cette fois en permutant les lignes de faon avoir le
plus grand pivot possible.
c) Comparer les deux solutions numriques avec la solution exacte
x= [0,2245 0,2814 0,3279]T et calculer les erreurs relatives en norme
loo
6. On veut rsoudre le systme linaire suivant par limination de Gauss.
a) La matrice de ce systme linaire est-elle singulire?
b) Combien de solutions ce systme linaire possde-t-il?
7. a) Effectuer l'limination de Gauss (sans permutation de lignes) sur le
systme:
[

~ -_
6
; l [ ; : l [ l
b) Calculer le dterminant de A en vous servant de l'limination de
Gauss.
c) Dterminer les valeurs de a et de {3 pour lesquelles la matrice A est
non inversible (singulire).
d) Que pouvez-vous dire de la solution de ce systme quand a = 1/3
et {3 = 1?
Systmes d'quations algbriques 171
8. Rsoudre les systmes linaires suivants par la mthode de dcompo-
sition LU de Crout (sans permutation de lignes).
a)
b)
[
1 2 1 4 ] [ Xt ] [ 13 ]
2 4 3 X2 28
4 2 2 1 X3 20
-3 1 3 2 x
4
6
9. Rsoudre le systme linaire:
2 6
8 -1
3 2
par dcomposition LU avec permutation de lignes.
10. La matrice:
[
1 2 3]
2 7 18
4 13 38
possde la dcomposition LU suivante (notation compacte, obtenue
sans permutation de lignes):
[
1 2 3]
2 3 4
4 5 6
En utilisant la mthode de Crout, on a rsolu les systmes Ax = b
suivants:
1) Sir;= (1 o of:
x= (1,7777 - 0,222 22 - 0,11111f
2) Si r; = co 1 o)r:
x= ( -2,0555 1,4444 - 0,277 77f
172 Chapitre 3
En compltant au besoin les donnes prcdentes, rpondre aux ques-
tions suivantes:
a) dt A=
b) IIAIIoo =
c) A-
1
=
d) condA = (Utiliser lllloo)
11. La matrice:
[ J6 ~ q l
possde la dcomposition LU suivante (notation compacte, obtenue
sans permutation de lignes):
-1/2 0 l
1 2
-1 2
En utilisant la dcomposition LU, effectuer les oprations suivantes:
a) Calculer dt A.
b) Rsoudre le systme linaire Ax = b o:
c) Sans calculer A
2
, rsoudre le systme A
2
x = b pour b donn en
b ). (Rappel: A
2
x = A( Ax).)
12. Rsoudre le systme linaire:
[ t ! l [ ~ l [ l
2 1 2 x
3
8
en arithmtique flottante 3 chiffres avec pivotage. Comparer le rsul-
tat numrique avec la solution exacte:
x= ( -2952/13 6200/13 - 2310/13f
Calculer l'erreur relative commise en utilisant la norme [
00

Systmes d'quations algbriques 173
13. Pour la matrice de l'exercice prcdent, calculer les quantits IIAII
11
IIAII2, IIAIIoo, IIA-
1
IIoo et condA.
14. Reprsenter graphiquement dans le plan les ensembles suivants:
a) {x lllxll2 < 1}
b) {x 1 Il xli oo < 1}
15. Est-ce que ldt Al pourrait tre une norme matricielle?
16. Peut-on dfinir le conditionnement d'une matrice singulire?
17. Calculer le dterminant et le conditionnement de la matrice:
18. Les matrices mal conditionnes ont souvent un dterminant voisin de O.
Est-ce que les matrices dont le dterminant est prs de 0 sont forcment
mal conditionnes? Donner un contre-exemple.
19. En utilisant un logiciel, calculer le conditionnement de la matrice de
Hilbert de dimension 5, dfinie par:
1
aij = i + j- 1
20. On considre le systme linaire:
En utilisant une calculatrice, on trouve comme solution le vecteur:
[1,586 206 - o,448 2759 - 1,ooo ooof
Aprs avoir multipli la matrice par ce vecteur, on trouve:
[5,999 9963 8,999 9938 2,999 9962f
ce qui semble indiquer que la solution obtenue est acceptable.
174 Chapitre 3
Le mme calcul effectu sur ordinateur produit la solution:
[0,62o 6896 2,112 4137 3,ooooV
Aprs multiplication de la matrice A du systme par ce vecteur, l'or-
dinateur affiche:
[5,999 9995 8,999 9998 3,000 0014]T
ce qui semble tout aussi acceptable. Que penser de ces rsultats?
21. Considrer le systme linaire suivant:
(
1 5 ) ( Xt ) ( 6,0000 )
1,0001 5 X2 6,0005
dont la solution exacte est x= [5 0,2V.
a) Calculer les rsidus correspondant aux solutions approximatives
Xt = [5,1 0,3]T et x2 = [1 1]T. Calculer les quantits llrilloo, lif'2lloo,
ii x- x1 !loo et li x- x21ioo, puis comparer les rsultats.
b) Trouver la solution exacte du systme aprs le remplacement du
membre de droite par [6 6jT.
c) la lueur des rsultats obtenus en a) et en b ), conclure sur le
conditionnement de la matrice de ce systme.
22. Rsoudre le systme non linaire suivant l'aide de la mthode de
Newton en prenant (0, 0) comme approximation initiale:
x ~ - 10x
1
+ ~ + 8 0
X t X ~ + X1 - 10x2 + 8 0
23. Rsoudre le systme non linaire suivant l'aide de la mthode de
Newton en prenant (0,1 , 0,1 , -0,1) comme approximation initiale:
3xt - cos(x2x3)- 1/2 0
x ~ 81(x
2
+ 0,1? + sinx
3
+ 1,06 0
e-x1x2 + 20x
3
+ (107r- 3)/3 0
Systmes d'quations algbriques 175
24. Tout comme dans le cas d'une quation d'une variable, la convergence
de la mthode de Newton pour les systmes non linaires dpend de
l'approximation initiale x ~ , xg). Considrant le systme:
X2 + ~ - Xt - 1/2 0
X2 + 5Xt X2 - xr 0
expliquer pourquoi (0, -0,2) est une mauvaise approximation initiale.
Chapitre 4
Systmes dynamiques
discrets
4.1 Introduction
Nous voyons dans ce chapitre comment de simples mthodes itratives,
telles les mthodes de points fixes, peuvent mener des systmes au com-
portement complexe. On pourrait croire, la suite du chapitre 2, que la dis-
cussion sur la convergence d'une mthode de points fixes s'arrte lorsqu'on a
dtermin si le point fixe est attractif ou rpulsif. Nous allons pousser cette
discussion beaucoup plus loin et tcher d'tudier un certain nombre de ph-
nomnes intressants rencontrs dans l'tude des systmes dynamiques. n
ne s'agit pas de faire une analyse mathmatique profonde de la thorie des
systmes dynamiques, mais bien de dmontrer que des mthodes itratives
simples peuvent rsulter en des systmes complexes.
4.2 Application quadratique
Nous reprenons ici une partie du travail de Feigenbaum (rf. [10]) sur l'ap-
plication quadratique. Cette application remarquablement simple conduit
un comportement de nature universelle.
Considrons la mthode itrative:
{
xo
Xn+l
donn
( 4.1)
178 Chapitre 4
qui est en fait une mthode de points fixes (voir l'quation 2.5) applique
la fonction:
g(x)=x(1-x)
Le paramtre est appel varier, si bien que le comportement de l'algo-
rithme 4.1 sera trs diffrent suivant la valeur de .
Tout d'abord, il est facile de montrer que la fonction g( x) est une applica-
tion de l'intervalle [0, 1] dans lui-mme (g(x) E [0, 1] si xE [0, 1]) seulement
pour:
En effet, le maximum de g(x) est atteint en x= 1/2 et vaut /4. Nous nous
limitons donc ces valeurs de , qui sont de loin les plus intressantes. En
premier lieu, il convient de dterminer les points fixes de g( x) et de vrifier
s'ils sont attractifs ou rpulsifs. Bien entendu, cela dpendra de . Les points
fixes sont les solutions de:
x = g( x) = x( 1 - x)
On constate immdiatement que 0 est une solution de cette quation et est
donc un point fixe. Si on suppose que x f:. 0 et que l'on divise chaque ct
de l'galit par x, on obtient:
1 = (1- x)
ce qui entrane que:
-1
x*=--

( 4.2)
est un autre point fixe. En fait, 0 et x* sont les deux seuls points fixes de
g(x). Voyons maintenant s'ils sont attractifs. Pour ce faire, il faut calculer la
drive de g( x), savoir:
g'(x) = (1- 2x) ( 4.3)
On a donc d'une part:
g'(O) =
ce qui signifie que 0 sera un point fixe attractif si:
jg'(O)I < 1
c'est--dire si:
0 << 1 = l
Systmes dynamiques discrets
puisqu'on ne considre pas les valeurs ngatives de . D'autre part:
-1
g'(x*) = .X(1- 2x*) = .X(1- 2(-_x-)) = 2-
Le point fixe x* est donc attractif si:
ou encore si:
12- .Xl< 1
-1
-3 <
< 2- <
-
<
1
<

1
-1
179
On note .X
2
la borne suprieure de cet intervalle, soit .X
2
= 3. On en
conclut que x* est attractif pour ces valeurs de . On remarque de plus que,
lorsque = 1, x* = 0 et il n'y a alors qu'un seul point fixe. On montre que
ce point fixe est attractif mme si g'(O) = 1 en vertu de l'quation 4.3. La
convergence est cependant trs lente. La situation est illustre aux figures 4.1
et 4.2, o la fonction g(x) est trace pour deux valeurs de , soit 0,5 et 1,5.
On voit dans le premier cas ( = 0,5) que la pente de g( x) est infrieure
1 en x = 0 et qu'il n'y a pas d'autre point fixe dans l'intervalle [0, 1]. Par
contre, pour = 1,5, il y a bien deux points fixes x = 0 et x = x*, dont seul
x* est attractif car g'(x*) < 1.
Vrifions tout cela avec quelques exemples. Prenons d'abord = 0,5. On
a alors:
x*= -1
qui ne peut tre attractif puisqu'il est l'extrieur de l'intervalle [0, 1]. partir
de x
0
= 0,9 par exemple, on trouve les itrations suivantes.
n Xn
0 0,9000000
1 0,045 0000
2 0,0214875
3 0,010 5128
4 0,005 2011
5 0,002 5871
6 0,0012902
7 0,000 6426
8 0,0003219
9 0,0001609
10 0,0000804
180 Chapitre 4
1,0
g(x)
0,8
0,6
0,4
0,2
__ .... --
______ ........................... ..
.. --- -......
. ..
0,0
0 0,2 0,4 0,6 0,8 1,0
x
Figure 4.1: Application quadratique: = 0,5
1,0
g(x)
0,8
0,6
0,4
0,2
0,0
0 0,2 0,4 0,6 0,8 1,0
x
Figure 4.2: Application quadratique: = 1,5
Systmes dynamiques discrets 181
Ces itrations convergent rapidement vers le point fixe O. Si on prend main-
tenant = 0,95, toujours partir de x
0
= 0,9, on obtient les itrations
suivantes.
n Xn
0 0,900 0000
1 0,0855000
2 0,074 2802
3 0,065 3245
4 0,058 0044
5 0,0519079
6 0,046 7527
7 0,042 3386
8 0,038 5187
9 0,0351833
10 0,032 2482
Ces dernires convergent vers 0, mais beaucoup plus lentement. Cela tient
au fait que le taux de convergence g'(O) = vaut 0,5 dans le premier cas et
0,95 dans le second cas. La convergence est donc plus rapide pour = 0,5.
Pour s'assurer de la convergence vers 0, il faudrait faire beaucoup plus que
10 itrations. Par exemple, pour = 0,95, on trouverait x2oo = 0,114 1385 x
w-s.
Passons maintenant = 1,5, pour lequel x* = 1/3. L'analyse a d-
montr que dans ce cas 0 est rpulsif puisque g'(O) = 1,5, mais que x* est
attractif. partir cette fois de x
0
= 0,1 , on obtient les itrations suivantes.
n Xn
0 0,100 0000
1 0,0855000
2 0,074 2802
3 0,0653245
4 0,058 0044
5 0,0519079
6 0,046 7527
7 0,042 3386
8 0,038 5187
9 0,0351833
10 0,032 2482
20 0,333 3313
182 Chapitre 4
Les itrations convergent donc vers x* = 1/3, un rsultat qui confirme l'ana-
lyse prcdente. On obtiendrait des rsultats similaires pour des valeurs de
situes dans l'intervalle ]1, 3[. Notons cependant que la valeur de x* varie
avec .
La question fondamentale est maintenant la suivante: que se passe-t-il
si on prend des valeurs de suprieures 3? On pourrait s'attendre ce
que les itrations de l'algorithme 4.1 divergent. Heureusement, ce n'est pas
le cas, mais pour expliquer ce comportement il nous faut largir la notion
de convergence. Jusqu' maintenant, nous n'avons parl de convergence que
vers un point (fixe). Or, il arrive qu'un algorithme converge vers autre chose
qu'un point fixe. On parle alors d'un attracteur (voir par exemple Gulick,
rf. [13]).
Dfinition 4.1
Un ensemble A C Rn est dit un attracteur d'une application:
o V est un sous-ensemble de Rn, si les conditions suivantes sont respec-
tes:
1. Si xE A, alors g(x) E A.
2. ll existe un voisinage U de A tel que, si x
0
E U, la suite Xn+l = g( xn)
converge vers A.
Remarque 4.1
On ne considre pour l'instant que le cas n = 1 des applications de R dans
R. Le cas gnral sera trait un peu plus loin. 0
Remarque 4.2
La dfinition qui prcde indique que, pour que A soit un attracteur, il faut
que tout point x de l'ensemble A soit projet sur un autre point de A par
l'application g( x). C'est bien sr le cas d'un point fixe qui est envoy sur
lui-mme. La deuxime condition traduit le fait que, si l'on part d'un point
xo suffisamment prs de A, les itrations de l'algorithme de points fixes
s'approchent de plus en plus de l'ensemble A. 0
Systmes dynamiques discrets
183
Remarque 4.3
Un point fixe est donc un attracteur (voir le chapitre 2) s'il existe un in-
tervalle I contenant ce point fixe pour lequel g( x) E I, V x E I, et qui
vrifie:
jg'(x)I<1VxE/ D
Cette dfinition d'un attracteur est quelque peu imprcise, mais elle suffit
aux besoins de l'expos. Prenons par exemple = 3,1 et observons ce qui se
passe. partir de x
0
= 0,5, on obtient les itrations suivantes.
n Xn
1 0,7750000
2 0,540 5625
3 0,769 8995
4 0,5491781
5 0,767 5026
6 0,5531711
7 0,766 2357
8 0,5552674
9 0,765 5310
10 0,556 4290
11 0,7651288
12 0,557 0907
13 0,764 8960
14 0,557 4733
15 0,764 7601
16 0,5576964
17 0,764 6804
18 0,557 8271
19 0,764 6336
20 0,5579039
47 0,764 5665
48 0,558 0140
49 0,764 5665
50 0,558 0140
184 Chapitre 4
On remarque immdiatement un comportement surprenant. Les itrations
oscillent entre les valeurs de 0,5580 et de 0,7645. ll n'y a donc pas conver-
gence au sens habituel. En fait, les itrations paires convergent vers environ
0,558 014 et les itrations impaires, vers 0, 764 566. Pour comprendre ce qui se
passe, il suffit de constater que les itrations paires et impaires correspondent
aux itrations de la fonction compose:
91(x) = 9(9(x)) = 9(x)(1- 9(x)) = (x(1- x))(1- x(1- x))
c'est--dire
Pour dterminer les points fixes de la fonction 9
1
(x), il suffit de rsoudre:
ll est clair que tout point fixe de 9( x) est un point fixe de 9
1
(x). Le point
x* donn par l'quation 4.2 ainsi que 0 sont donc des points fixes de 9
1
(x),
mais nous savons qu'ils sont rpulsifs pour > 3. ll existe cependant d'autres
points fixes de 91 (x) qui ne sont pas des points fixes de 9( x). Aprs avoir
divis l'quation prcdente par x de chaque ct, quelques manipulations
algbriques nous amnent rsoudre l'quation:
dont les trois racines sont x* et:
( 4.4).
On montre alors que:
c'est--dire que x
1
est envoy sur x
2
par l'application 9( x) et vice versa.
Dans le cas o = 3,1, on a en vertu de l'quation 4.4:
Xl 0,558 014 et X2 0,764 566
ce qui correspond bien ce que nous avons observ numriquement. L'en-
semble { x
1
, x
2
} est donc un attracteur au sens de notre dfinition. De plus,
puisque les itrations oscillent entre deux valeurs, on parlera d'un attracteur
Systmes dynamiques discrets 185
de priode 2 ou d'un 2-cycle. On peut ds lors s'interroger sur sa stabilit.
En d'autres termes, pour quelles valeurs de ce 2-cycle est-il attractif?
Thorme 4.1
L'attracteur de priode 2 (ou 2-cycle) donn par l'quation 4.4 est at-
tractif pour:
3 < < 3 = 1 + v'6 ~ 3,449 489
Dmonstration (voir Gulick, rf. [13]):
il suffit de montrer que x
1
et x
2
sont des points fixes attractifs de la fonction
g
1
(x) = g(g(x)). La dmonstration n'est faite que pour Xt, puisque l'autre
cas est similaire. Par la rgle de drivation en chane, on a:
g ~ x ) = g
1
(g(x))g'(x)
de telle sorte que:
Un simple calcul l'aide de l'quation 4.4 mne aux galits:
de telle sorte que:
ou encore
1
X1 + X2 = 1 +:x
n reste obtenir les valeurs de pour lesquelles on aura:
186 Chapitre 4
C'est le cas si:
-1
<
-.\
2
+2.\+4
<
1
{:} -1
<
-(- 1)
2
+ 5
<
1
{:} -6
<
-(.\- 1)2
<
-4
{:} 4
<
(A- 1)
2
<
6
{:}
2
<
. ~ - 1 )
< V6
{:}
3
<

<
1+V6
0
On peut mme dmontrer que le cas .\
3
= 1 + vf6 donne galement lieu
un 2-cycle attractif (la dmonstration est cependant dlicate). Pour toute
valeur de E ].\2, .\
3
] = ]3, 1 + vf6], on observe donc un 2-cycle attractif. La
valeur des points x
1
et x
2
varie avec , mais le comportement gnral est
le mme. Le tableau suivant rsume la convergence de l'application quadra-
tique.
0 < :::; l = 1
.\
1
< :::; 2 = 3
.\
2
< :::; 3 = 1 + V6
0 est un point fixe attractif
x* est un point fixe attractif
{ Xt, x
2
} est un 2-cycle attractif
L'tude du cas o > 1 + vf6 est relativement complexe, mais on peut en
comprendre les grandes lignes. Le 2-cycle devient rpulsif et est remplac
par un 4-cycle (2
2
-cycle ), qui est constitu des 4 points fixes { Xt, x
2
, x
3
, x
4
}
de la fonction:
92(x) = Y1(91(x)) = g(g(g(g(x))))
vrifiant:
Ce 4-cycle est attractif pour E ].\
3
, .\
4
]. Selon Gulick (rf. [13]), la valeur
de .\
4
se situe autour de 3,539 58. son tour, ce 4-cycle est remplac par un
8-cycle (2
3
-cycle) attractif dans l'intervalle ].\
4
, .\
5
] et ainsi de suite. chaque
tape, la priode de l'attracteur est double et on parle d'une cascade de
ddoublements de priode.
Systmes dynamiques discrets 187
Plusieurs phnomnes intressants se produisent alors:
La distance entre les valeurs critiques n o se produisent les ddou-
blements de priode diminue et tend mme vers O. Cela signifie que
l'intervalle o un 2n-cycle sera attractif est d'autant plus troit que n
est grand. n est par consquent difficile d'observer exprimentalement
un 2n-cycle pour n grand.
On peut montrer que:
lim n = 3,61547 ...
n-+oo
La distance entre les n conscutifs est rgie par ce qui semble une loi
universelle de la forme:
. n- n-l ( )
lim = d
00
= 4,669 202... 4.5
n-+oo n+l - n
Le nombre d
00
est appel constante universelle de Feigenbaum. La cons-
tante est universelle en ce sens que tout phnomne physique qui subit
une cascade de ddoublements de priode obit la loi 4.5. On a ob-
serv les cascades de ddoublements de priode en laboratoire dans
des problmes de mcanique des fluides, de convection naturelle, de
ractions chimiques, etc. Chaque fois, on a russi mettre au moins
partiellement en vidence la relation 4.5.
Pour les valeurs de suprieures
00
, le comportement de l'applica-
tion quadratique est trs complexe. Sans en faire l'tude dtaille, on
peut noter que les itrations successives se comportent parfois de faon
priodique (de priode souvent impaire) et parfois de faon chaotique.
On dit d'un comportement qu'il est chaotique s'il n'est pas priodique
et s'il donne l'apparence d'tre alatoire.
La situation complte est rsume la figure 4.3, o l'on a plac en abs-
cisse les valeurs de . On obtient cette figure en faisant 2000 itrations de
l'algorithme 4.1 et en mettant en ordonne les valeurs des 1000 dernires
itrations seulement, et ce pour toutes les valeurs de dans l'intervalle
[2,8, 3,7] par incrment de 0,001. Dans le cas o les itrations convergent
vers un point fixe, ces 1000 itrs se confondent en un seul point. Dans le cas
o on a un 2-cycle attractif, les itrations se superposent sur deux points, etc.
Les 1000 premires itrations permettent d'liminer tout effet transitoire et
de s'assurer que la convergence est bien tablie. Un tel graphique est appel
diagramme de bifurcation.
188
Chapitre 4
1,0 .------.----,---.-----.---,---.------.----,---.--------,
x
0,9
0,8
0,7
0,6
0,5
0,4
0,3

2,7 2,8 2,9 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7

Figure 4.3: Application quadratique: diagramme de bifurcation
4.3 Mthodes de points fixes: cas complexe
On peut utiliser les mthodes de points fixes du chapitre 2 dans le cas
d'quations non linaires de la forme:
f(z) = 0 ( 4.6)
o z =x+ iy est un nombre complexe et f(z) est une fonction non linaire
d'une variable complexe. Dans ce cas prcis, l'interprtation gomtrique que
nous avons donne de cette mthode n'est plus valable, mais l'algorithme de
base reste le mme:
donn
( 4.7)
Remarque 4.4
La drivation d'une fonction d'une variable complexe suit les mmes rgles
que celle des fonctions relles. D
Systmes dynamiques discrets 189
En particulier, la mthode de Newton s'crit dans le cas complexe:
donn
{
zo
Zn+l
(4.8)
Exemple 4.1
On dsire rsoudre l'quation:
f(z) = z
2
+ 1 = 0
qui ne possde videmment pas de solution relle, les deux solutions tant
z = i. L'algorithme devient dans ce cas:
z ~ + 1) Zn 1
Zn+l = Zn - = - - -
2zn 2 2zn
partir de z
0
= 1 + i, l'algorithme 4.8 donne les valeurs suivantes:
n Zn
0 1,0 + i
1 0,25 + i 0,75
2 -0,75 + i 0,975
3 0,001 715 + i 0,9973
4 0,928 x 10-
5
+ i 1,000 002 162
On constate donc la convergence vers la solution z = +i .

Remarque 4.5
Dans certains langages informatiques, le calcul peut s'effectuer directement
avec les nombres complexes. n est galement possible de sparer les parties
relles et imaginaires; on peut alors traiter seulement les nombres rels. On
obtiendrait ainsi:
o Zn = X n + i Yn.
Si z
0
est choisi sur l'axe rel (y
0
= 0), l'algorithme diverge, car tous les Zn
restent sur l'axe rel et ne peuvent jamais s'approcher de z = i. D
190 Chapitre 4
La convergence des mthodes de points fixes appliques aux variables
complexes obit des rgles similaires au cas rel. On a le rsultat suivant.
Thorme 4.2
Soit g( z ), une fonction continue dans une rgion D du plan complexe et
telle que g(z) E D pour tout z dans D. Si de plus g'(z) existe et si:
lg'(z)l k < 1
pour tout z dans D, alors tous les points z
0
de D appartiennent au bassin
d'attraction de l'unique point fixe r de D. 0
Remarque 4.6
Ce rsultat est en parfaite concordance avec celui obtenu au chapitre 2,
la diffrence prs que la norme de g' ( z) est la norme complexe (ou module
complexe) dfinie par:
lzl = lx+ iyl = Jx
2
+ y
2
0
Dfinition 4.2
La suite Zn dfinie par l'algorithme 4. 7 est appele l'orbite du point z
0
.
En d'autres termes, l'orbite du point zo est la trajectoire du plan com-
plexe que tracent les diffrents points Zn Dans le dernier exemple, la trajec-
toire du point z
0
= 1+i convergeait vers z = i. Cette dfinition nous entrane
vers un exemple trs intressant qui montre une fois de plus que des notions
simples peuvent aboutir des comportements complexes. Considrons le cas
particulier de la fonction:
Yc(z) = z
2
+ c (4.9)
o c = Cr + ici est un nombre complexe pour le moment quelconque. Pour
une valeur de c donne, l'orbite de z
0
= 0 aura typiquement deux compor-
tements trs diffrents l'un de l'autre. Pour certaines valeurs de c, les itrs
Systmes dynamiques discrets 191
de l'algorithme 4. 7 tendront vers l'infini. Par contre, pour d'autres valeurs
de c, la suite Zn restera borne. Cela nous permet de prsenter l'ensemble de
Mandelbrot (rf. [18]).
Dfinition 4.3
L'ensemble de Mandelbrot est dfini comme tant l'ensemble des valeurs
de c pour lesquelles l'orbite de z
0
= 0 pour l'algorithme de points fixes:
reste borne lorsque n ---+ oo.
Pour reprsenter l'ensemble de Mandelbrot, on utilise un algorithme trs
facile programmer.
Algorithme 4.1: Ensemble de Mandelbrot
1. tant donn N, le nombre maximal d'itrations
2. tant donn M, une borne suprieure pour l'orbite
3. tant donn NP IX H et NP I XV, la rsolution horizontale et verti-
cale de l'cran utilis
4. Considrer seulement les valeurs de c = Cr + ici pour lesquelles:
5. Diviser les intervalles Ir et Ii en respectivement NP IX H et NP I XV
sous-intervalles. Noter Ci,j, le point milieu du rectangle form par le
produit cartsien du ie intervalle horizontal par le f intervalle vertical.
Le point Ci,j est ainsi associ au pixel situ la ie range et la
je colonne de l'cran.
6. Effectuer les oprations suivantes:
(a) partir de zo = 0
(b) effectuer z1 = z5 + Ci,j
( c) effectuer zo = z1
192 Chapitre 4
( d) si 1 zo 1 > M:
orbite non borne
Ci,j n'appartient pas l'ensemble de Mandelbrot
allumer le pixel associ Ci,j
passer la valeur de Ci,j suivante
( e) si 1 zol < M et si le nombre maximal d'itrations N est atteint:
orbite borne
Ci,j appartient l'ensemble de Mandelbrot
pixel associ ci,j reste non allum (noir)
passer la valeur de Ci,j suivante
(f) retour l'tape (b) 0
Voici quelques valeurs prcises qui permettent d'obtenir de bons rsul-
tats.
Le nombre maximal d'itrations N peut tre fix 128.
La borne suprieure M pour la norme de Zn peut tre fixe 4.
On peut prendre les intervalles:
Ir= [-2, 1] et Ii= [-1,1, 1,1]
On peut galement introduire des variantes. On peut en effet colorer
le pixel associ une valeur de c qui n'appartient pas l'ensemble de
Mandelbrot en fonction du nombre d'itrations ncessaires pour que
lznl >M.
On a obtenu la figure 4.4 en utilisant les valeurs prcdentes. On remarque
l'extrme irrgularit de la frontire de cet ensemble. Des agrandissements
successifs de certaines parties permettraient de constater que le motif gnral
se rpte 1 'infini.
4.4 Mthodes de points fixes en dimension n
ll est facile d'imaginer ce que peut tre un point fixe dans le cas de
plusieurs variables. n s'agit simplement d'une solution de:
- -( -)
x=gx ( 4.10)
Systmes dynamiques discrets
ou encore de
Dfinition 4.4
Figure 4.4: Ensemble de Mandelbrot
91(x1,x2,x3, ,xn)
92(x1,x2,x3, ,xn)
93(x1,x2,x3,,xn)
193
(4.11)
Tout vecteur r solution du systme 4.10 ou 4.11 est appel point fixe de
l'application g( x).
Remarque 4. 7
Nous ne faisons pas la distinction entre le point ( x
1
, x
2
, x
3
, , xn) et le
vecteur x= [x
1
x
2
X3 xnf Les deux notations sont utilises indiff-
remment dans cette section. 0
194 Chapitre 4
L'algorithme de base des mthodes de points fixes en dimension n reste
le mme:
{
XO donn,
;ri+I g( :ti)
(4.12)
o X [xi x ~ x ~ x ~ j T Bien que prsentant des similitudes avec le
cas unidimensionnel, l'analyse de convergence des mthodes de points fixes
en dimension n est cependant beaucoup plus dlicate. C'est pourquoi nous
prfrons procder par analogie avec le cas unidimensionnel. Nous avons vu
que la convergence vers une racine r de l'algorithme des points fixes est
assujettie la condition:
lg'(r)l < 1
n faut donc trouver l'expression analogue de cette condition en dimension n.
Pour y parvenir, on doit revoir les notions de valeurs et de vecteurs propres
qui seront la base de la convergence de l'algorithme 4.12.
Dfinition 4.5
Si A est une matrice de dimension n, on dfinit le polynme caractristique
de A par:
p(.>.) = dt (A->..!) ( 4.13)
o I est la matrice identit.
Le polynme p( >..) est de degr n et possde donc n racines relles ou
complexes conjugues.
Dfinition 4.6
Les racines (ou zros) du polynme caractristique sont appeles valeurs
propres de la matrice A.
Si >.. est une valeur propre, la matrice A - >..! est singulire (puisque son
dterminant est nul) et le systme:
(A- >..I)x = o
ou encore
Ai= >..Ix= >..x ( 4.14)
Systmes dynamiques discrets 195
possde des solutions non nulles. En effet, le systme 4.14 possde toujours
la solution i = 0; si est une valeur propre, il existe galement d'autres
solutions.
Dfinition 4. 7
Une solution non nulle du systme 4.14 est appele vecteur propre de A
associ la valeur propre .
Exemple 4.2
Soit la matrice:
Le polynme caractristique est alors:
Les racines de ce polynme sont:
_3iv'l5
1,2- 2
qui sont donc les 2 valeurs propres de la matrice A .

Remarque 4.8
Ce sont uniquement les valeurs propres qui sont importantes dans ce qui
suit. Pour cette raison, nous ne nous attardons pas au calcul des vecteurs
propres. 0
Revenons aux mthodes de points fixes par le biais d'un cas particulier
de l'quation 4.10 de la forme:
(c'est--dire fi( i) = Ai)
196 Chapitre 4
o A est une matrice de dimension n sur n quelconque. On note que 0 est
toujours un point fixe et que l'algorithme de points fixes 4.12 prend la forme:
( 4.15)
ll y aura convergence vers 0 de la mthode de points fixes si la suite AiXO
tend vers 0 lorsque i tend vers l'infini. ll reste donc tablir sous quelles
conditions cela se produit. Pour ce faire, il nous faut introduire deux autres
dfini ti ons.
Dfinition 4.8
La rayon spectral d'une matrice A est dfini par:
(4.16)
o Iil est le module complexe de la valeur propre i de A.
Remarque 4.9
Le calcul du rayon spectral requiert le calcul de la plus grande valeur propre
en module. Certaines techniques permettent de dterminer le rayon spectral,
mais ce n'est pas un problme facile surtout dans le cas des matrices de
grande taille. 0
Dfinition 4.9
Une matrice A est dite convergente si:
lim An= 0
n-+oo
( 4.17)
Selon cette dernire dfinition, il est clair que l'algorithme de points
fixes 4.15 convergera vers le vecteur 0 si la matrice A est convergente. Le
thorme suivant fournit des conditions quivalentes et permet de dterminer
si une matrice est convergente.
Systmes dynamiques discrets 197
Thorme 4.3
Les conditions suivantes sont quivalentes.
1. La matrice A est convergente.
2. Pour toute norme matricielle:
( 4.18)
3. Pour tout vecteur x:
( 4.19)
4. Le rayon spectral de A est strictement infrieur 1 (p( A) < 1 ). 0
Le lecteur intress trouvera la dmonstration complte de ce rsultat dans
Varga (rf. [26]). ll est assez facile de se convaincre de l'quivalence des
3 premiers noncs. La partie la plus exigeante de la dmonstration consiste
montrer que la matrice est convergente lorsque le rayon spectral est infrieur
l.
Remarque 4.10
Le thorme prcdent permet d'affirmer que 0 est un point fixe attractif
de l'algorithme 4.15 si et seulement si le rayon spectral de la matrice A est
infrieur 1. Dans ce cas particulier, l'algorithme convergera quel que soit
le vecteur initial XO choisi, en vertu des relations 4.15 et 4.19.0
Exemple 4.3
Soit la matrice:
[
1/2 0 l
A= 1/3 1/4
dont les valeurs propres sont tout simplement >.
1
simple calcul permet de s'assurer que:
1/4. Un
2 [ 1/4 0 l
A = 1/4 1/16
A10 = [ 0,976 56 x 10-
3
0,0 l
0,130 08 x 10-
2
0,953 67 x 10-
6
198 Chapitre 4
et que:
50 [ 0,888 18 x 10-lS 0,0 l
A = 0,11842 x 10-
14
0,788886 x 10-
30
On constate que chaque coefficient de la matrice An tend vers O. 0

Nous avons maintenant en main les outils ncessaires pour aborder le cas
gnral de l'algorithme 4.12. L'exercice consiste dterminer sous quelles
conditions un point fixe not r d'un systme de dimension n est attractif.
On sait qu'en dimension 1 la convergence vers le point fixe r est lie
g'(r), dont le rle en dimension n est jou par la matrice jacobienne:
J(r) =
L'quivalent multidimensionnel de la condition:
jg'(r)l < 1
est tout simplement:
p(J(f)) < 1
Le thorme suivant, dmontr dans Burden et Faires (rf. [2]), rsume la
situation.
Thorme 4.4
Soit r, un point fixe de l'application:
- -(-)
x=gx
rest attractif si le rayon spectral p( J ( f)) de la matrice jacobienne de g( x)
est infrieur 1; il est rpulsif si p( J ( f)) > 1. Le cas o p( J ( f)) = 1 est
indtermin. 0
Systmes dynamiques discrets 199
Remarque 4.11
Ce thorme est une gnralisation du cas unidimensionnel, auquel cas la
matrice jacobienne se rduit la matrice 1 x 1, dont le seul coefficient est
g'(r). L'unique valeur propre est bien sr g'(r), de telle sorte que le r.yon
spectral est lg'( r) 1 Ce dernier doit tre infrieur 1 pour que le point fixe r
soit attractif. 0
Remarque 4.12
Dans le cas gnral comme dans le cas unidimensionnel, le fait que le point
fixe r soit attractif ne garantit pas la convergence de l'algorithme 4.12. On
doit toujours s'assurer que le vecteur initial XO appartient au bassin d'at-
traction du point fixe. La tche est d'autant plus difficile que le systme est
de grande dimension. 0
Exemple 4.4
n est facile de dmontrer que l'application:
X2 yfxl
ne possde que le seul point fixe [1 1 jT (voir les exercices de fin de chapitre).
La matrice jacobienne est dans ce cas:
qui, value en r = [1 1 f' donne:
J(1, 1) = [ 0 -1 l
1/2 0
Le polynme caractristique est alors:
200
Chapitre 4
et les valeurs propres sont iJI72. Le point fixe [1 1 V est attractif puisque
le rayon spectral est yTf2 et est infrieur 1.
Si on retient le vecteur XO = [0 oV comme solution initiale, on trouve les
valeurs suivantes de l'algorithme 4.12.
n
x!
xn
2
1 0,14142 x 10
1
0,000 00 x 10
2 0,14142 x 10
1
0,118 92 x 10
1
3 0, 765 37 x 10 0,118 92 x 10
1
4 0,76537 x 10 0,87 4 85 x 10
5 0,11111 x 10
1
0,87 4 85 x 10
6 0,11111 x 10
1
0,105 41 x 10
1
7 0,942 79 x 10 0,105 41 x 10
1
8 0,942 79 x 10 0,970 98 x 10
9 0,102 82 x 10
1
0,970 98 x 10
10 0,102 82 x 10
1
0,10140 x 10
1
11 0,985 80 x 10 0,10140 x 10
1
12 0,985 80 x 10 0,992 87 x 10
13 0,100 71 x 10
1
0,992 87 x 10
14 0,100 71 x 10
1
0,100 35 x 10
1
15 0,996 46 x 10 0,100 35 x 10
1
16 0,996 46 x 10 0,998 23 x 10
17 0,100 18 x 10
1
0,998 23 x 10
18 0,100 18 x 10
1
0,100 09 x 10
1
19 0,99911 x 10 0,100 09 x 10
1
20 0,999 11 x 10 0,999 56 x 10
21 0,100 04 x 10
1
0,999 56 x 10
22 0,100 04 x 10
1
0,100 02 x 10
1
23 0,999 78 x 10 0,100 02 x 10
1
24 0,999 78 x 10 0,999 89 x 10
25 0,100 01 x 10
1
0,999 89 x 10
On constate une convergence relativement lente vers le point fixe [1 1 V .

Systmes dynamiques discrets
4.4.1 Attracteur d'H non
Considrons un cas bien particulier d'application non linaire:
9t(Xt,X2)
92(x1,x2)
201
( 4.20)
o les paramtres a et b sont prciss plus loin. L'algorithme de points fixes
en dimension 2 devient dans ce cas:
donn
1- a(x1)
2
+ x2
bx!
( 4.21)
Dterminons en premier lieu les points fixes de cette application. ll suffit de
rsoudre:
x1 = 1 - axi + x2
x2 = bx
1
En substituant bx
1
x
2
dans la premire quation, on conclut que cette
application possde deux points fixes:
fi = (
2
1
a ( b - 1 + J (1 - b )
2
+ 4a) )
J!_(b- 1 + /(1- b)
2
+ 4a)
2a V
f
2
= (
2
1
a ( b - 1 - J (1 - b )2 + 4a) )
J!._(b-1- 1(1-b)2+4a)
2a V
La matrice jacobienne de (x) est:
dont les valeurs propres sont:
202 Chapitre 4
0,41
x2
0,40
0,39
0,38
1-
0,37
1-
0,36
-
0,35
-
0,34
-
0,33
-
0,32
1
_]
1,05 1,10 1,15 1,20 1,25 1,30 1,35
xl
Figure 4.5: Application d'Hnon: a = 0,1
TI est alors possible de dmontrer (voir Gulick, rf. [13]) que ri est attractif
pour des valeurs de a et b satisfaisant la condition:
1
--(1
4
Le point fixe f2 est rpulsif.
(a =J 0)
Ce qui suit ressemble beaucoup ce que nous avons vu au sujet de
l'application quadratique. Si on fixe b = 0,3 et si on fait varier le paramtre
a, f
1
est attractif pour les valeurs de a dans l'intervalle ] - 0,1225, 0,3675[.
Par exemple, pour a = 0,1, le point fixe prend la valeur approximative
f
1
= [1,211699 0,365 097]T. partir de XO = [1 1jT, l'algorithme de points
fixes 4.12 a donn les rsultats de la figure 4.5. On note la convergence vers
le point fixe Fi = [1,211699 0,365 097]T. Cette figure est le produit des
9000 dernires itrations effectues sur un total de 10 000 itrations. Le seul
point visible est en fait constitu de 9000 points superposs.
Si on augmente la valeur de a 0,5 (voir la figure 4.6), on remarque
la convergence vers un attracteur priodique de priode 2 ( 2-cycle) cons-
titu de deux points. Si on augmente progressivement la valeur de a, le
comportement observ pour l'application quadratique se rpte et on passe
Systmes dynamiques discrets
x2
0,45
<>1
1 1 1
0,40 1-
0,35 1-
0,30
0,25
0,20 1-
0,15
0,10
0,05
0
----------------------------------0---
-0,05
: 1 1 1 1 1 1
-0,2 0 0,2 0,4 0,6 0,8 1,0 1,2 1,4
x 1
Figure 4.6: Application d'Hnon: a 0,5
203
1,6
des attracteurs de priode 4, 8, 16, 32, etc. Selon Derrida,
Gervais et Pomeau (rf. [8]), les valeurs prcises de a o se produisent les
doublements de priode sont les suivantes.
a Priode
-0,1225 1
0,3675 2
0,9125 4
1,0260 8
1,0510 16
1,0565 32
La figure 4. 7 illustre l'attracteur de priode 16. ll est intressant de constater
que:
1,0510- 1,0260 54

1,0565- 1,0510 '
ce qui est une bonne approximation de la constante universelle de Feigen-
baum (voir l'quation 4.5). Si on se donnait la peine de localiser prcisment
204
x2
Chapitre 4
0,4
~ 00
1 1
!
1 1 1 1 1 1
0,3 r- 0 0
-
0()
0,2 r-
-
0,1
-
1
0 ~ r - - - - - - - - - - - - - - ~ - - - - - - - - - - - - - - - - - - - - - - - -
-0,1 r-
-0,2 1-
-0,3
1 1
-0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 1,0
Figure 4.7: Application d'Hnon: a= 1,054
0
0
1,2
XI
1,4
les valeurs de a o apparaissent les attracteurs de priode 64, 128, 256, etc.,
on verrait ressortir la loi universelle 4.5. La cascade de ddoublements de
priode s'arrte autour de a= 1,058 0459.
Si on continue augmenter la valeur de a, on observe un comportement
gnral de plus en plus complexe. Par exemple, pour a = 1,4, les itrations
convergent vers l'attracteur prsent la figure 4.8, et ce quel que soit le
point de dpart de l'algorithme. Ce qui est plus intressant encore, c'est
que les itrs (x j', x2) de l'algorithme de points fixes 4.21 parcourent cet
attracteur de faon apparemment alatoire, sans jamais s'en loigner. On
parle alors d'un attracteur trange.
La complexit gomtrique d'un tel attracteur est rvle par les agran-
dissements successifs de certaines parties de l'attracteur d'Hnon. Ce qui
semblait tre un trait gras sur la figure 4.8 devient, si on regarde de plus
prs, une srie de 6 courbes sur la figure 4.9. Enfin, si on agrandit une sec-
tion de ce qui semble tre 3 courbes la figure 4.9, on voit poindre 6 autres
courbes la figure 4.10. Ce phnomne peut thoriquement se reproduire
l'infini. Mais, pour le vrifier, il faudrait calculer beaucoup plus que les
50 000 points illustrs dans les figures mentionnes.
Systmes dynamiques discrets 205
0,4
x2
0,3
0,2
0,1
0
-0,1
-0,2
-0,3
-0,4
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
x 1
Figure 4.8: Attracteur d'Hnon: a = 1,4
L'attracteur d'Hnon est en fait un objet de dimension fractionnaire ou
fractale. En effet, la dimension (terme qu'il faudrait prciser) de cet ensemble
est suprieure 1, mais strictement infrieure 2. Les figures prcdentes
montrent que l'attracteur d'Hnon est plus qu'une courbe (de dimension 1),
sans toutefois tre une surface (qui serait de dimension 2). On retrouve une
situation analogue la frontire de l'ensemble de Mandelbrot.
4.5 Mthodes itratives pour les systmes linaires
La rsolution numrique des grands systmes linaires peut parfois n-
cessiter l'emploi de mthodes autres que la dcomposition LU. La raison
principale est que la dcomposition LU requiert la mise en mmoire d'une
matrice de trs grande taille, avec peu de possibilits de comprimer toute
cette information. Les mthodes itratives, en revanche, permettent de ne
placer en mmoire que les coefficients non nuls d'une matrice. Cela est parti-
culirement important avec les matrices creuses, dont une grande partie des
coefficients sont nuls. La dcomposition LU ne permet pas cette possibilit
puisque le processus mme de dcomposition tend remplir la matrice.
206 Chapitre 4
0,180
x2
0,175
0,170
0,165
0,160
0,155
0,150
0,145
0,140
0,66 0,68 0,70 0,72 0,74 0,76 0,78 0,80 0,82
x 1
Figure 4.9: Attracteur d'Hnon: a= 1,4
0,171
o ~ o l
1 1
0
o o
x2
0 0
0 0
0,170
po
oO 0
0
oo
oo
0
0 0
0
6 > ~

0 oo
0
0,169
~ ~
0
o ~ ~ o
oo
0
0
~
<:o ~
0
o<:oo
0
0,168
0 00 -
0
0
oo
0
0
0
oo
0
0,167
0 0
oo
-
oo
0
0
0
0
0,166
1 1
1 oo
0,740 0,745 0,750 0,755 0,760
x 1
Figure 4.10: Attracteur d'Hnon: a= 1,4
Systmes dynamiques discrets 207
En effet, la plupart des coefficients nuls d'une matrice creuse deviennent non
nuls au terme de la dcomposition.
Les mthodes itratives possdent donc des avantages suffisamment im-
portants pour justifier une recherche active dans ce domaine. Cependant,
contrairement la dcomposition LU, le succs n'est pas assur quelle que
soit la matrice A pour laquelle on souhaite rsoudre un systme linaire de
la forme:
La convergence des mthodes itratives n'est ralise que dans certaines
conditions que nous prciserons. Une grande prudence est donc de mise. De
plus, les mthodes itratives, lorsqu'elles convergent, ne deviennent vraiment
avantageuses que pour les systmes linaires de trs grande taille.
4.5.1 Mthode de Jacobi
Considrons le systme linaire:
aux1 + a12X2 + a13X3 + + a1nXn
a21x1 + a22X2 + a23X3 + + a2nXn
a31X1 + a32X2 + a33X3 + + a3nXn
( 4.22)
On suppose pour l'instant que tous les lments de la diagonale sont non
nuls ( aii =/= 0, Vi). partir d'une approximation initiale de la solution que
nous noterons [ x ~ xg x ~ j (comme dans toute mthode itrative),
208 Chapitre 4
on construit l'algorithme:
(4.23)
1 ( n-1 )
- b -'""'a xk
n L...J nJ J
ann j=1
qui consiste isoler le coefficient de la diagonale de chaque ligne du systme.
C'est la mthode de Jacobi. Si l'un des coefficients diagonaux est nul, il est
parfois possible de permuter certaines lignes pour viter cette situation. Plus
gnralement, on crit:
Exemple 4.5
Soit le systme:
3xl + X2- X3 2
Xt + Sx2 + 2x3 17
2x
1
- x2- 6x3 -18
La mthode de Jacobi s'crit dans ce cas:
xk+l - .! (2- xk + xk)
1 - 3 2 3
xk+l - ..L (-18 - 2xk + xk)
3 - -6 1 2
( 4.24)
Systmes dynamiques discrets
partir de [0 0 OJT, on trouve d'abord:
xi = ! (2 - 0 + 0) =
x ~ = i (17- 0- 0) = 157
x= !
6
( -18- 0 + 0) = -_
1
6
8
= 3
La deuxime itration donne:
X
1 - ! (2 - 17 + 3) - ~
1 - 3 5 - 15
x ~ = i ( 17- ~ - 2(3)) = ~
x= !
6
( -18- 2 ~ ) +
1
5
7
) = 2,655556
On finit par remplir le tableau suivant.
k
x ~ x ~ x ~
0 0,000 000 0,000 000 0,000 000
1 0,666 667 3,400 000 3,000 000
2 0,533 333 2,066 667 2,655556
3 0,862 963 2,231111 2,833 333
4 0,867 407 2,094074 2,915 802
5 0,940 576 2,060 198 2,940123
6 0,959 975 2,035 835 2,970159
7 0,978108 2,019 941 2,980 686
8 0,986 915 2,012104 2,989 379
9 0,992425 2,006 865 2,993 621
10 0,995585 2,004 067 2,996 331
209
Les valeurs convergent vers la solution [1 2 3jT. La convergence est cepen-
dant assez lente.

210 Chapitre 4
Exemple 4.6
La mthode de Jacobi ne peut pas s'appliquer immdiatement au systme:
Ox1 + 3x2 + X3 7
5xt + x2 - 2x3 15
3xt - 4x2 + 8x3 9
puisque l'un des coefficients diagonaux est nul ( a
11
= 0). On remdie cette
situation en faisant pivoter les deux premires lignes, par exemple. On doit
donc rsoudre le systme:
5xl + x2 - 2x3 15
Ox1 + 3x2 + X3 7
3xl - 4x2 + 8x3 9
pour lequel la mthode de Jacobi donne l'algorithme:
On obtient ainsi, en partant de la solution initiale [0 0 of, les itrations
suivantes.
Systmes dynamiques discrets
211
k
~ ~ ~
1 3,000 000 2,333 333 1,125 000
2 2,983 333 1,958 333 1,166 667
3 3,075 000 1,944 444 0,985417
4 3,005 278 2,004861 0,944097
5 2,976 667 2,018 634 1,000 451
6 2,996454 1,999850 1,018 067
7 3,007 257 1,993 978 1,001255
8 3,001706 1,999 582 0,994268
9 2,997 791 2,001911 0,999151
10 2,999 278 2,000 283 1,001 784
11 3,000 657 1,999405 1,000 412
12 3,000 284 1,999863 0,999456
13 2,999810 2,000181 0,999825
14 2,999 894 2,000 058 1,000 162
15 3,000 053 1,999 946 1,000 069
il y a donc convergence vers [3 2 1 ]T .

n est facile de montrer que la mthode de Jacobi peut s'crire sous forme
matricielle. Cette forme matricielle servira uniquement pour l'analyse de
convergence de la mthode. Pour obtenir cette reprsentation matricielle, on
doit d'abord effectuer une dcomposition de la matrice A sous la forme:
A= D +Ti+ Ts
( 4.25)
o
an
0 0 0
0 a22
0 0
D=
0 0 a33
0
0 0 0 ann
0 0 0 0
a21
0 0 0
Ti=
a31 a32
0 0
anl an2 an3
0
212 Chapitre 4
0 a12 a13 aln
0 0 a23 a2n
Ts =
0 0 0
a3n
0 0 0 0
Ce procd consiste donc isoler de la matrice A la diagonale et les matrices
triangulaires infrieures et suprieures. Le systme linaire:
devient:
ou encore
et enfin
x= -D-
1
(Ti + Ts)x + n-
1
b = TJx + CJ
o on a pos TJ = -D-
1
(Ti + Ts) et .J = n-
1
b. il est alors clair que
l'algorithme 4.24 peut aussi s'crire:
-k+l T -k +-
X = JX CJ
et que la mthode de Jacobi n'est rien d'autre qu'un cas particulier de m-
thodes de points fixes en dimension n et de l'quation 4.10. n suffit en effet
de choisir:
(x)= TJx + CJ
Comme nous l'avons vu, la convergence des mthodes de points fixes en
dimension n dpend du rayon spectral de la matrice jacobienne associe
(x), qui est simplement (voir les exercices de fin de chapitre):
La mthode de Jacobi convergera donc si le rayon spectral de TJ (p(TJ)) est
infrieur 1. Comme nous l'avons dj mentionn, le calcul du rayon spectral
d'une matrice est un problme difficile, surtout si la matrice est de grande
taille. il existe cependant un type de matrices qui vrifie automatiquement
la condition de convergence de la mthode de Jacobi.
Systmes dynamiques discrets 213
Dfinition 4.10
Une matrice A est dite diagonale strictement dominante si:
n
!aiil > I: !aijl Vi
j=l,j:f:i
Cette dfinition signifie que le terme diagonal aii de la matrice A est
nettement dominant puisque sa valeur absolue est plus grande que la somme
des valeurs absolues de tous les autres termes de la ligne.
Pour dmontrer que les matrices diagonale dominante vrifient la condi-
tion p(T J) < 1, un rsultat intermdiaire est ncessaire.
Lemme 4.1
Le rayon spectral d'une matrice A vrifie:
p(A) ~ IIAII
( 4.26)
et ce quelle que soit la norme matricielle utilise.
Dmonstration:
Si >. est une valeur propre de la matrice A et x est un vecteur propre associ,
on a:
Ax= >.x
En prenant la norme de chaque ct (ce qui suppose l'utilisation d'une norme
vectorielle compatible avec la norme matricielle utilise), on obtient:
!>.lllxll = I!Axll ~ IIAIII!xll
ce qui entrane immdiatement que:
!>.1 ~ l i A I
Ceci tant vrai quelle que soit la valeur propre choisie, le rsultat est dmon-
tr. D
214 Chapitre 4
Thorme 4.5
Si A est une matrice diagonale strictement dominante, la mthode de
Jacobi est convergente.
Dmonstration:
ll suffit de montrer que p( -D-
1
(T; + Ts)) < 1. Si on utilise les normes
vectorielle et matricielle compatibles Il lloo, il est clair que:
et le lemme prcdent confirme que le rayon spectral de la matrice est aussi
infrieur 1. D
Exemple 4.7
n est facile de s'assurer que les matrices des deux exemples de cette sec-
tion sont diagonale strictement dominante. Nous avons pu constater la
convergence de la mthode de Jacobi dans ces deux cas, comme le prvoit
le thorme prcdent. Pour s'en convaincre davantage, on peut construire
explicitement les matrices -D-
1
(T; + Ts) de ces deux exemples et constater
que leur norme Ill loo est infrieure 1.

4.5.2 Mthode de Gauss-Seidel
La mthode de Gauss-Seidel est une variante amliore de la mthode
de Jacobi. Pour bien en comprendre le principe, il suffit de reconsidrer la
mthode de Jacobi et de voir comment on pourrait l'amliorer. On sait que
dans le cas gnral la mthode de Jacobi s'crit:
xf+
1
a:; (b;- . Y:: . a;jxj)
J=l,J:f:.t
qui peut aussi s'exprimer:
( 4.27)
Systmes dynamiques discrets 215
La mthode de Gauss-Seidel est fonde sur la simple constatation selon
laquelle le calcul de x ~ l ncessite l'utilisation de x ~ , x ~ , , x ~ provenant de
l'itration prcdente. Or, l'itration k + 1, au moment du calcul de xt\
on possde dj une meilleure approximation de x
1
que xf, savoir x
1
+1.
De mme, au moment du calcul de x;+l, on peut utiliser x ~ l et x ~ l . Plus
gnralement, pour le calcul de x7+
1
, on peut utiliser x ~ l , x ~ l , , x72'
1
1
dj calculs et les xf+l, xf+
2
, , x ~ de l'itration prcdente. Cela revient
crire:
1 ( i-1 n )
- b- ""a x ~ l - "" a xk
. . t L..t tJ J L..t tJ J
au j=l j=i+l
( 4.28)
Suivant la notation introduite pour la mthode de Jacobi, la mthode de
Gauss- Sei del s'crit sous forme matricielle:
-k+l v-l(b- T -k+l T .... k)
X = - iX -
8
X
ou encore
et enfin
Exemple 4.8
Soit le systme linaire:
3xl + X2 - X3 = 2
x1 + Sx2 + 2x3 = 17
2x1 - x2 - 6x3 = -18
La mthode de Gauss-Seidel s'crit dans ce cas:
x;+l = ~ (2- x ~ xg)
216 Chapitre 4
Notons la diffrence avec la mthode de Jacobi au niveau des indices. Partant
de [0 0 O]T, on trouve d'abord:
= (2- 0 + 0) =
1 _ 1 (
17
2 o) _ 49
X2 - 5 -:- 3 - - 15
x!= _!
6
( -18- + =


tandis qu' la deuxime itration on trouve:
(2- +

= 0,4703704
x
1
- l (17- 0 4703704- 2(
241
))- 2 234815
2-s ' 90 -'
x1 = !
6
(-18- 2(0,4703704) + 2,234815) = 2,784321
ainsi que les itrations suivantes.
k

1 0,666 6667 3,266 667 2,677 778
2 0,470 3704 2,234 815 2,784 321
3 0,849 8354 2,116 305 2,930 561
4 0,938 0855 2,040158 2,972 669
5 0,977 5034 2,015 432 2,989 929
6 0,9914991 2,005 729 2,996 212
7 0,996 8277 2,002150 2,998 584
8 0,9988115 2,000 804 2,999 470
9 0,999 5553 2,000 301 2,999 802
10 0,999 8335 2,000113 2,999 926
On constate que, pour un mme nombre d'itrations, la solution approxima-
tive obtenue par la mthode de Gauss-Seidel est plus prcise. La mthode
de Gauss-Seidel converge gnralement plus vite que la mthode de Jacobi,
mais pas toujours.

Remarque 4.13
Les mthodes itratives utilises pour rsoudre un systme linaire de la
forme:
Systmes dynamiques discrets 217
s'crivent souvent sous la forme:
o la matrice T et le vecteur c dpendent de la mthode en cause. Les
mthodes de Jacobi et de Gauss-Seidel ne sont que deux cas particuliers.
La convergence de la mthode retenue n'est possible que si p(T) < 1. Cette
condition porte sur la matrice T et non sur la matrice A. La convergence de
la mthode est d'autant plus rapide que le rayon spectral de Test petit. En
effet, on peut dmontrer que:
Cette expression s'apparente celle du taux de convergence g
1
(r) dans le cas
unidimensionnel. 0
Nous terminons cette section par un rsultat que nous ne dmontrons
pas, mais qui assure la convergence de la mthode de Gauss-Seidel dans le
cas de matrices diagonale strictement dominante.
Thorme 4.6
Si la matrice A est diagonale strictement dominante, le rayon spectral
de Tas est infrieur 1 et la mthode de Gauss-Seidel converge, et ce quelle
que soit la solution initiale XO. 0
Les matrices diagonale strictement dominante sont frquentes dans les
applications. Malheureusement, on rencontre galement en pratique beau-
coup de matrices qui ne vrifient pas cette proprit. Des recherches trs
actives sont en cours dans le but de dvelopper de nouvelles mthodes it-
ratives qui s'appliqueraient une vaste gamme de matrices.
218 Chapitre 4
4.6 Exercices
1. Montrer que tout point fixe de g(x) est un point fixe de g(g(x)). L'in-
verse est-il vrai?
2. Montrer que les points x
1
et x
2
de l'quation 4.4 satisfont x1 = g( x
2
)
et x2 = g(xl)
3. Dterminer le polynme caractristique, les valeurs propres et le rayon
spectral des matrices suivantes. Dterminer galement si ces matrices
sont convergentes.
4. La matrice:
2
-1
[
2 -1 l
-1 2
1
1
3
0
a un rayon spectral de 3, qui est donc supeneur 1. Or, on peut
dmontrer directement que la mthode de Jacobi converge quel que
soit le vecteur x
0
initial. Est-ce une contradiction?
5. a) Obtenir le ou les points fixes de l'application:
b) Vrifier si ce ou ces points fixes sont attractifs.
c) Effectuer 5 itrations de la mthode des points fixes partir de (0,0).
6. a) Montrer que l'ensemble {x
1
, x
2
} (attracteur de priode 2) est at-
tractif si:
b) En dduire une condition pour qu'un attracteur de priode n soit
attractif.
7. Trouver un attracteur de priode 2 pour la fonction g(x) = x
2
- 1.
Vrifier s'il est attractif.
Systmes dynamiques discrets 219
8. Montrer que la fonction:
{
2x pour 0 ~ x ~ 1/2
T(x)= 2-2x pour 1 2 ~ x ~ l
possde les attracteurs de priode 3 {2/7, 4/7, 6/7} ainsi que {2/9, 4/9,8/9:
Vrifier s'ils sont attractifs ou rpulsifs.
9. Montrer que la matrice jacobienne associe la mthode de points
fixes:
(x)= Tx +
o T est une matrice de dimension n, est tout simplement la matrice
T elle-mme. Que conclure quant la convergence de l'algorithme:
+t = Txk +
10. Construire une matrice de dimension 3 diagonale strictement domi-
nante. Pour cette matrice, construire explicitement la matrice TJ et
vrifier si IITJIIoo < 1.
11. Soit le systme linaire suivant:
E1 : 2x1 - x2 + lOx3 = -11
E2 : 3x2- X3 + 8x4 = -11
E3 : lOx1 - x2 + 2x3 = 6
E4 : -x1 + 11x2 - X3 + 3x4 = 25
a) Montrer que les mthodes de Jacobi et de Gauss-Seidel ne convergent
pas lorsqu'on isole simplement les Xi de l'quation Ei.
b) Rordonner les quations de faon assurer la convergence des deux
mthodes.
12. Rsoudre le systme:
9x1 - 2x2 + X3 = 13
-Xl + 5X2 - X3 = 9
x1 - 2x2 + 9x3 = -11
l'aide des mthodes de Jacobi et de Gauss-Seidel partir de
Xo = [0 0 o]T (faire les 5 premires itrations seulement).
Chapitre 5
Interpolation
5.1 Introduction
Ce chapitre ainsi que le chapitre suivant qui porte sur la drivation et
l'intgration numriques sont trs troitement relis puisqu'ils tendent r-
pondre diverses facettes d'un mme problme. Ce problme est le suivant:
partir d'une fonction f(x) connue seulement en (n + 1) points de la forme
((xi, f(xi)) pour i = 0, 1, 2, , n), peut-on construire une approximation de
f(x), et ce pour tout x? Les points ((xi,f(xi)) pour i = 0,1,2, .. ,n) sont
appels points de collocation ou points d'interpolation et peuvent provenir de
donnes exprimentales ou d'une table. En d'autres termes, si on ne connat
que les points de collocation (xi, f(xi)) d'une fonction, peut-on obtenir une
approximation de f(x) pour une valeur de x diffrente des Xi? La figure 5.1
rsume la situation.
Sur la base des mmes hypothses, nous verrons, au chapitre suivant,
comment valuer les drives J'( x), J"( x) de mme que:
rxn f(x)dx
lxo
n s'agit d'un problme d'interpolation, dont la solution est relativement
simple. Il suffit de construire un polynme de degr suffisamment lev dont
la courbe passe par les points de collocation. On parle alors du polynme
de collocation ou polynme d'interpolation. Pour obtenir une approximation
des drives ou de l'intgrale, il suffit de driver ou d'intgrer le polynme de
collocation. Il y a cependant des lments fondamentaux qu'il est important
d'tudier. En premier lieu, il convient de rappeler certains rsultats cruciaux
relatifs aux polynmes, que nous ne dmontrons pas.
222
0
0
Figure 5.1: Problme d'interpolation
Thorme 5.1
Un polynme de degr n dont la forme gnrale est:
Chapitre 5
0
x n-1
possde trs exactement n racines qui peuvent tre relles ou complexes
conjugues. (On sait que rest une racine de Pn(x) si Pn(r) = 0.) D
Corollaire 5.1
Par (n+ 1) points de collocation ((xi,f(xi)) pour i = 0,1,2,,n), on ne
peut faire correspondre qu'un et un seul polynme de degr n.
Dmonstration:
On procde par l'absurde et on suppose l'existence de 2 polynmes de degr
n, nots p( x) et q( x), et qui passent tous les deux par les ( n + 1) points de
collocation donns. On considre ensuite la diffrence:
P( x) = p( x) - q( x)
Interpolation 223
qui est galement un polynme de degr au plus n. Ce polynme vrifie:
et ce pour i allant de 0 n. Le polynme P( x) possderait donc ( n + 1)
racines, ce qui est impossible en vertu du thorme prcdent.D
Remarque 5.1
Le raisonnement prcdent tablit en fait l'unicit du polynme d'interpo-
lation passant par n + 1 points donns. ll reste en assurer l'existence, ce
que nous ferons tout simplement en le construisant au moyen de mthodes
diverses qui feront l'objet des prochaines sections.D
5.2 Matrice de Vandermonde
Le problme d'interpolation consiste donc dterminer l'unique polynme
de degr n passant par les ( n + 1) points de collocation ( (Xi, f( xi)) pour
i = 0, 1, 2, 3, , n). Selon le thorme prcdent, il ne saurait y en avoir
deux. n reste maintenant le construire de la manire la plus efficace et
la plus gnrale possible. Une premire tentative consiste dterminer les
inconnues ai du polynme 5.1 en vrifiant directement les ( n + 1) quations
de collocation:
Pn(xi) =!(xi) pour i = 0, 1, 2, , n
ou encore
ao + a1xi + a2xT + a3xy + + anxi = f(xi)
qui est un systme linaire de ( n + 1) quations en ( n + 1) inconnues. Ce
systme s'crit sous forme matricielle:
1 xo
x2
0
x3
0
xn
0
ao f(xo)
1 Xl
x2
1
x3
1
xn
1
al f(xl)
1 X2
x2
2
x3
2
xn
2
a2 f( x2)
(5.2)
1 Xn
x2
n
x3
n
xn
n
an f(xn)
224 Chapitre 5
Remarque 5.2
La matrice de ce systme linaire porte le nom de matrice de Vandermonde.
On peut montrer que le conditionnement de cette matrice augmente for-
tement avec la taille ( n + 1) du systme. De plus, comme le rvlent les
sections qui suivent, il n'est pas ncessaire de rsoudre un systme linaire
pour calculer un polynme d'interpolation. Cette mthode est donc rarement
utilise.D
Exemple 5.1
On doit calculer le polynme passant par les points (0, 1), (1, 2), (2, 9) et
(3, 28). tant donn ces 4 points, le polynme recherch est tout au plus de
degr 3. Ses coefficients ai sont solution de:
dont la solution (obtenue par dcomposition LU) est [1 0 0 1]T. Le polynme
recherch est donc:

Les sections qui suivent proposent des avenues diffrentes et plus efficaces
pour calculer le polynme de collocation.
5.3 Interpolation de Lagrange
L'interpolation de Lagrange est une faon simple et systmatique de cons-
truire un polynme de collocation. tant donn (n + 1) points ((xi, f(xi))
pour i = 0, 1, 2, , n), on suppose un instant que l'on sait construire (n + 1)
polynmes Li( x) de degr n et satisfaisant les conditions suivantes:
Li(Xi) = 1
Li(Xj) = 0
'Vi
'Vj :fi
(5.3)
Interpolation 225
Cela signifie que le polynme Li( x) de degr n prend la valeur 1 en Xi
et s'annule tous les autres points de collocation. Nous verrons comment
construire les Li( x) un peu plus loin. Dans ces conditions, la fonction L( x)
dfinie par:
n
L(x) = 'L,J(xi)Li(x)
i=O
est un polynme de degr n, car chacun des Li( x) est de degr n. De plus, ce
polynme passe par les ( n + 1) points de collocation et est donc le polynme
recherch. En effet, il est facile de montrer que selon les conditions 5.3:
n
L(xj) = f(xj)Lj(Xj) + 'L, f(xi)Li(xj)
i=O,i::j:.j
Le polynme L( x) passe donc par tous les points de collocation. Puisque
ce polynme est unique, L( x) est bien le polynme recherch. ll reste
construire les fonctions Li( x). Suivons une dmarche progressive.
Polynmes de degr 1
n s'agit de dterminer le polynme de degr 1 dont la courbe (une droite)
passe par les deux points (x
0
,J(x
0
)) et (xllf(xt)). On doit donc construire
deux polynmes L
0
(x) et L
1
(x) de degr 1 qui vrifient:
Lo(xo) = 1
Lo(xl)=O
Ll(xo) = 0
Ll(xo) = 1
Le polynme L
0
(x) doit s'annuler en x= x
1
. On pense immdiatement au
polynme:
(x- x1)
qui s'annule en x = x
1
, mais qui vaut (x
0
- x
1
) en x = x
0
Pour s'assurer
d'une valeur 1 en x = x
0
, il suffit d'effectuer la division approprie afin
d'obtenir:
Lo(x) = (x- xl)
(xo- x1)
226 Chapitre 5
L
0
(x)
1 ............. .
Figure 5.2: Polynmes de Lagrange de degr 1: L
0
(x) et L
1
(x)
Un raisonnement similaire pour L
1
(x) donne:
Lt(x) = (x- xo)
(x1- xo)
Ces deux fonctions sont illustres la figure 5.2. Le polynme de degr 1 est
donc:
Pt(x) = f(xo)Lo(x) + f(xt)Lt(x)
Exemple 5.2
L'quation de la droite passant par les points (2, 3) et (5, -6) est:
(x-5) (x-2)
3 (
2
_
5
) + ( -6) (
5
_
2
) = -(x- 5)- 2(x- 2) = -3x + 9

Interpolation 227
L
2
(x)
x
Figure 5.3: Polynmes de Lagrange de degr 2: Lo( x), L
1
( x) et L
2
( x)
Polynmes de degr 2
Si on cherche le polynme de degr 2 passant par les trois points
(xo, f(xo)), (xt, f(xl)) et (x2, j(x2)), on doit construire trois fonctions Li( x).
Le raisonnement est toujours le mme. La fonction L
0
( x) s'annule cette fois
en x= x
1
et en x= x
2
. On doit forcment avoir un coefficient de la forme:
qui vaut (xo-xl)(xo-x2) en x= xo. Pour satisfaire la condition Lo(xo) = 1,
il suffit alors de diviser le coefficient par cette valeur et de poser:
Cette fonction vaut bien 1 en xo et 0 en x1 et x2. De la mme manire, on
obtient les fonctions L
1
(x) et L
2
( x) dfinies par:
Ces trois fonctions sont leur tour illustres la figure 5.3.
228 Chapitre 5
Exemple 5.3
La parabole passant par les points (1, 2), (3, 7), ( 4, -1) est donne par:
2
(x- 3)(x- 4)
7
(x- 1)(x- 4) (-
1
)(x- 1)(x- 3)
p
2
(x) = (1-3)(1-4)+ (3-1)(3-4)+ (4-1)(4-3)
=
(x-3)(x-4)
3
7(x- 1)(x- 4)
2

(x- 1)(x- 3)
3
Polynmes de degr n
On analyse le cas gnral de la mme faon. La fonction L
0
( x) doit
s'annuler en X = Xt, X2, X3, , Xn. fl faut donc introduire la fonction:
qui vaut:
en x = x
0
On a alors, aprs division:
(x- x1)(x- x2)(x- X3) (x- Xn)
Lo (x) = ..,..( x...:.
0
---x 1...;;;)..:,..( x"-
0
---x ~ ) . . . : . . X-o------'x3:...,..)_ --'. '-:-( X-o------'-X-:-n)
On remarque qu'il y an facteurs de la forme (x- Xi) dans cette expression
et qu'il s'agit bien d'un polynme de degr n. Pour la fonction L
1
(x), on
pose:
(x- Xo)(x- x2)(x- x3) (x- Xn)
Ll(x) = (x1- x
0
)(x1- x2)(x1- X3) (Xl- Xn)
On note l'absence du terme (x - x1 ). L'expression gnrale pour la fonction
Li( x) est donc:
Li(x) = (x- xo) (x- Xi-1)(x- Xi+d (x- xn)
(Xi- Xo) (Xi- Xi-l)(xi- Xi+l) (Xi- Xn) (S.
4
)
o cette fois seul le facteur (x- Xi) est absent. Li(x) est donc un polynme
de degr n qui vaut 1 en x = Xi et qui s'annule tous les autres points de
collocation. On peut maintenant rsumer la situation.
Interpolation 229
Thorme 5.2
tant donn ( n+1) points d'interpolation ( (Xi, f( xi)) pour i = 0, 1, , n ),
l'unique polynme d'interpolation de degr n passant par tous ces points
peut s'crire:
n
Pn(x) = Lf(xi)Li(x) (5.5)
i=O
o les ( n+ 1) fonctions Li( x) sont dfinies par la relation 5.4. C'est la formule
de Lagrange. D
Exemple 5.4
Reprenons les points (0, 1), (1, 2), (2, 9) et (3, 28), pour lesquels nous
avons obtenu le polynme p
3
( x) = x
3
+ 1 l'aide de la matrice de Vander-
monde. L'interpolation de Lagrange donne dans ce cas:
(x- 1)(x- 2)(x- 3) (x- O)(x- 2)(x- 3)
P
3
(x) =
1
(0- 1)(0- 2)(0- 3) +
2
(1- 0)(1- 2)(1- 3)
(x- O)(x- 1)(x- 3) (x- O)(x- 1)(x- 2)
+
9
(2- 0)(2- 1)(2- 3) +
28
(3- 0)(3- 1)(3- 2)
c'est--dire:
(x-1)(x-2)(x-3) (
2
)(
3
)
-
6
+x x- x-
x(x- 1)(x- 3) x(x- 1)(x- 2)
-9 2 + 14 3
qui est l'expression du polynme de degr 3 passant par les 4 points donns.
Cette expression n'est autre que p
3
(x) = x
3
+ 1. ll n'y a qu' en faire le d-
veloppement pour s'en assurer. Cela n'est pas surprenant, puisque l'on sait
qu'il n'existe qu'un seul polynme de degr 3 passant par 4 points donns.
L'interpolation de Lagrange ne fait qu'exprimer le mme polynme diffrem-
ment.
230 Chapitre 5
Enfin, le polynme calcul permet d'obtenir une approximation de la
fonction inconnue f( x) partout dans l'intervalle contenant les points de col-
location, c'est--dire [0, 3]. Ainsi, on a:
f(2,5) P3(2,5) = 16,625
avec une preciSion qui sera discute plus loin lorsque nous aborderons la
question de l'erreur d'interpolation .

Remarque 5.3
La mthode d'interpolation de Lagrange prsente un inconvnient majeur:
elle n'est pas rcursive. En effet, si on souhaite passer d'un polynme de
degr n un polynme de degr (n + 1) (en ajoutant un point de colloca-
tion), on doit reprendre tout le processus zro. Dans l'exemple prcdent,
si on souhaite obtenir le polynme de degr 4 correspondant aux points
(0, 1), (1, 2), (2, 9), (3, 28) et (5, 54), on ne peut d'aucune faon rcu-
prer le polynme de degr 3 dj calcul et le modifier simplement pour
obtenir p
4
(x). C'est en revanche ce que permet la mthode d'interpolation
de Newton. D
5.4 Polynme de Newton
Lorsqu'on crit l'expression gnrale d'un polynme, on pense immdia-
tement la forme 5.1, qui est la plus utilise. Il en existe cependant d'autres
qui sont plus appropries au cas de l'interpolation, par exemple:
Pn(x) = ao
+ a1(x- xo)
+ a2(x- xo)(x- xt)
+ a3(x- xo)(x- xt)(x- x2)
+ an-t(X- xo)(x- Xt)(x- x2) (x- Xn-2)
+ an(X- Xo)(x- Xt)(x- x2) (x- Xn-1)
(5.6)
On remarque que le coefficient de an comporte n monmes de la forme (x-xi)
et qu'en consquence le polynme 5.6 est de degr n.
Interpolation 231
L'aspect intressant de cette formule apparat lorsqu'on essaie de dter-
miner les ( n + 1) coefficients ai de telle sorte que Pn (x) passe par les ( n + 1)
points de collocation (Xi, f( Xi)) pour i = 0, 1, 2, , n ). On doit donc s 'assu-
rer que:
Pn(xi) = f(xi) pour i = 0, 1, 2, , n
Les coefficients de la forme 5.6 s'annulent tous en x = x
0
, sauf le premier.
On peut ainsi montrer que:
Pn(xo) = ao = f(xo)
Le premier coefficient est donc:
ao = f(xo) (5.7)
On doit ensuite s'assurer que Pn(x
1
) = f(x
1
), c'est--dire:
ce qui permet d'isoler a
1
pour obtenir:
Dfinition 5.1
On dfinit les premires diffrences divises de la fonction f(x) par:
(5.8)
Ainsi, le coefficient a
1
peut s'crire:
(5.9)
Remarque 5.4
n est facile de dmontrer que le polynme de degr 1:
Pl(x) = f(xo) + f[xo, x1](x- xo)
232 Chapitre 5
qu'on obtient en ne considrant que les deux premiers coefficients de 5.6 et
les expressions 5.7 et 5.9, passe par les points (xo, f(xo)) et (xt, f(xt)). n
reprsente donc l'unique polynme de collocation de degr 1 passant par ces
deux points. 0
Le troisime coefficient ( a2) est son tour dtermin par:
ou encore
En isolant a2, on obtient:
On en arrive donc une expression qui fait intervenir une diffrence divise
de diffrences divises.
Interpolation 233
Dfinition 5.2
Les deuximes diffrences divises de la fonction f( x) sont dfinies partir
des premires diffrences divises par la relation:
(5.10)
De mme, les nes diffrences divises de la fonction f( x) sont dfinies
partir des ( n - l)es diffrences divises de la faon suivante:
![
l
f{xb X2, , Xn]- f[xo, X1, x2, , Xn-1]
Xo, XI, ~ 2 , Xn = ( )
Xn- Xo
(5.11)
Notons que les toutes premires diffrences divises de f(x) (soit les oes
diffrences) sont tout simplement dfinies par f(xi)
Suivant cette notation, on a:
(5.12)
Remarque 5.5
n est facile de dmontrer que le polynme:
passe par les trois premiers points de collocation. On remarque de plus que ce
polynme de degr 2 s'obtient simplement par l'ajout d'un terme de degr 2
au polynme p
1
(x) dj calcul. En raison de cette proprit, cette mthode
est dite rcursive. D
On peut souponner ce stade-ci que le coefficient a
3
est:
qui est une troisime diffrence divise de f( x). C'est effectivement le cas.
Le thorme suivant rsume la situation.
234 Chapitre 5
Thorme 5.3
L'unique polynme de degr n passant par les ( n + 1) points de col-
location ((xi,f(xi)) pour i = 0,1,2, .. ,n) peut s'crire selon la formule
d'interpolation de Newton 5.6 ou encore sous la forme rcursive:
Pn(x) = Pn-l(x) + an(x- xo)(x- x1) (x- Xn-1) (5.13)
Les coefficients de ce polynme sont les diffrences divises:
D
(5.14)
Dmonstration (facultative):
On dmontre le rsultat par induction. On a dj tabli le rsultat pour n = 1
et n = 2. On suppose que ce rsultat est vrai pour les polynmes de degr
(n- 1). ll s'agit de montrer qu'il est galement vrai pour les polynmes
de degr n. Pour ce faire, on introduit les polynmes Pn-l (x) et qn-l (x)
de degr ( n - 1) et passant respectivement par les points ( (Xi, f( Xi)) pour
i = 0,1,2,,n -1), et ((xi,f(xi)) pour i = 1,2,3,,n). On note imm-
diatement que ces deux polynmes passent respectivement par les n premiers
et les n derniers points d'interpolation. Les coefficients ai tant dfinis par
la relation 5.14, on pose galement:
bi= f[xl, x2, , Xi+I] pour 1::; i::; n- 1
Les ai et les bi sont les diffrences divises relatives aux n premiers et aux n
derniers points, respectivement. Suivant la dfinition des diffrences divises,
on observe que:
![
l
f[xb x2, , Xn]- f[xo, XI,, Xn-1]
an = Xo, X1, , Xn = ___;;_ ___ _..;_---''---...:.-.:-------=-
Xn- Xo
c'est--dire:
Xn- Xo
L'hypothse d'induction permet d 'affirmet que:
Pn-l(x) = Pn-2(x) + an-l(x- Xo)(x- xi) (x- Xn-d
et que:
(5.15)
(5.16)
(5.17)
Interpolation 235
La dmonstration du thorme requiert de plus l'utilisation du lemme sui-
vant.
Lemme 5.1
L'unique polynme Pn( x) passant par les points ( (Xi, f( Xi))
i=0,1,2,,n) s'crit:
( )
(xn- x)Pn-1(x) +(x- Xo)qn-1(x)
Pn X =
(xn- xo)
Preuve du lemme:
pour
(5.18)
n suffit de s'assurer que le polynme droite de l'quation 5.18, qui est
de degr n et not rn( x), passe galement par les points ((xi, f(xi)) pour
i = 0, 1, 2, , n ). Le rsultat suivra par unicit du polynme d'interpolation.
Suivant la dfinition des polynmes rn( x), Pn-
1
(x) et qn_
1
(x), on a:
rn(xo) = Pn-1(xo) = f(xo)
et l'autre extrmit:
Aux points intermdiaires, on a:
(xn- Xi)Pn-1(xi) +(xi- xo)qn-1(xi)
(xn- xo)
(xn- xi)!( xi)+ (xi- xo)f(xi) = f(xi)
(xn- Xo)
Les polynmes Pn(x) et rn( x) passent par les mmes (n + 1) points; ils sont
donc gaux, ce qui termine la dmonstration du lemme.
L'quation 5.18 peut galement s'crire:
( )
(xo- x+ Xn- xo)Pn-1(x) +(x- xo)qn-1(x)
Pn X = ...:...._--------',.---..:........:.--'---.:..__ _ _;__;_
(xn- xo)
ou encore
(x- xo)
Pn(x)- Pn-1(x) = ( )(qn-1(x)- Pn-1(x))
Xn- Xo
(5.19)
236 Chapitre 5
La dmonstration du thorme vient ensuite assez facilement. Les coefficients
de la puissance xn-l pour les polynmes Pn-l (x) et qn-l (x) sont respective-
ment an-I et bn-l en vertu des quations 5.16 et 5.17. Selon l'quation 5.19,
le coefficient de la puissance xn de Pn( x) est:
qui est an en vertu de la relation 5.15. La formule 5.19 permet aussi de trouver
les racines de Pn( x)- Pn-1 (x), qui sont xo, Xb , Xn-1 Ce polynme s'crit
donc:
Pn(x)- Pn-l(x) =an( x- Xo)(x- xl) (x- Xn-1)
ce qui termine la dmonstration du thorme. D
Remarque 5.6
Une fois les coefficients ai connus, on peut valuer le polynme de Newton au
moyen d'un algorithme similaire au schma d'Homer (voir la section 1.5.3).
On crit alors le polynme 5.6 sous la forme:
Pn(x)
(5.20)
+(x- Xn-2)(an-1 +an( X- Xn-1) )))
De cette faon, on rduit le nombre d'oprations ncessaires l'valuation
du polynme. De plus, cette forme est moins sensible aux effets des erreurs
d'arrondis. D
ll reste maintenant calculer efficacement la valeur de ce polynme. La
manire la plus simple consiste construire une table dite de diffrences
divises de la faon suivante.
Interpolation 237
Xi f(xi)
![xi, Xi+I] f[xi, Xi+b Xi+2] f[xi, Xi+!, Xi+2, Xi+3l
xo f(xo)
f[xo, x1]
X! !(xi) f[xo, x1, x2]
j[x1, x2] f[ Xo, X11 X2, X3]
X2 j(x2) f[ X11 X2, X3]
j[x2, x3]
X3 j(x3)
La construction de cette table est simple. Nous nous sommes arrts aux
troisimes diffrences divises, mais les autres s'obtiendraient de la mme
manire. Les premires diffrences divises dcoulent de la dfinition 5.8.
Pour obtenir par exemple f[xo, X1, x2], il suffit de soustraire les 2 termes
adjacents f[xb x2]- f[xo, x
1
] et de diviser le rsultat par (x2- xo). De mme,
pour obtenir f[xo, x11 x2, X3], on soustrait f[xo, X1, x2] de f[x
11
x2, x3] et on
divise le rsultat par (x
3
- x
0
). La formule de Newton utilise la diagonale
principale de cette table.
Exemple 5.5
La table de diffrences divises pour les points (0, 1), (1, 2), (2, 9) et
(3, 28) est:
238 Chapitre 5
Xi f(xi) ![xi,, Xi+I] ![xi,, Xi+2] ![xi,, Xi+3]
0 1
1
1 2 3
7 1
2 9 6
19
3 28
Suivant la formule de Newton 5.6, avec x
0
= 0, le polynme de collocation
est:
p3(x) = 1 + 1(x- 0) + 3(x- O)(x- 1) + 1(x- O)(x- 1)(x- 2) = x
3
+ 1
qui est le mme polynme (en vertu de l'unicit) que celui obtenu par la
mthode de Lagrange. On remarque de plus que le polynme:
P2(x) = 1 + 1(x- 0) + 3(x- O)(x- 1)
passe quant lui par les trois premiers points de collocation. Si on souhaite
ajouter un point de collocation et calculer un polynme de degr 4, il n'est
pas ncessaire de tout recommencer. Par exemple, si on veut inclure le point
(5, 54), on peut complter la table de diffrences divises dj utilise.
Interpolation 239
Xi !(xi) f[xi,, Xi+I] ![xi,, Xi+2] ![xi,, Xi+3] f[xi, , Xi+4]
0 1
1
1 2 3
7 1
2 9 6 -3/5
19 -2
3 28 -2
13
5 54
Ce polynme de degr 4 est alors:
P4(x) = p3(x) + ( -3/5)(x- O)(x- 1)(x- 2)(x- 3)
qui est tout simplement le polynme de degr 3 dj calcul auquel on a
ajout une correction de degr 4 .

Exemple 5.6
n est bon de remarquer que les points de collocation ne doivent pas forcment
tre placs par abscisses croissantes, bien que cela soit souvent prfrable.
Considrons par exemple la table suivante:
240 Chapitre 5
Xi f(xi) ![xi, Xi+I] ![xi,, Xi+2] ![xi,, Xi+3]
2 1
1
0 -1 0,4
2,2 1,2
5 10 1,6
7
3 -4
On note que les abscisses Xi ne sont pas par ordre croissant. Le polynme
passant par ces points est:
p3(x) = 1 + 1(x- 2) + 0,4(x- 2)(x- 0) + 1,2(x- 2)(x- O)(x- 5)
que l'on obtient de la relation 5.6 en prenant x
0
= 2. Si on souhaite valuer
ce polynme en x = 1, on peut se servir de la mthode de Horner. On rcrit
alors le polynme sous la forme:
P3(x) = 1 +(x- 2)(1 +(x- 0)(0,4 + 1,2(x- 5)))
La fonction inconnue f( x) peut alors tre estime par ce polynme. Ainsi:
f(1) P3(1) 1 + ( -1)(1 + (1)(0,4 + 1,2( -4)))
1 + ( -1)(1 4,4)
4,4
Pour l'instant, nous n'avons aucune indication quant la prcision de cette
approximation. Cette question est l'objet de la section suivante .

5.5 Erreur d'interpolation
L'interpolation permet, partir d'un certain nombre de donnes sur les
valeurs d'une fonction, de faire l'approximation de f( x) en tout point x.
Interpolation 241
Toutefois, cette opration entrane une erreur d'interpolation qu'il convient
d'tudier en dtail, d'autant plus que les rsultats nous serviront galement
dans l'analyse de l'intgration et de la drivation numriques.
On peut exprimer l'erreur d'interpolation de la faon suivante:
f(x) = Pn(x) + En(x)
ou encore
En(x) = f(x)- Pn(x)
Cela signifie que le polynme Pn( x) de degr n procure une approximation
de la fonction f(x) avec une erreur En( x). ll reste valuer cette erreur. On
constate immdiatement que:
En(xi)=O pouri=0,1,2,,n
et donc que l'erreur d'interpolation est nulle aux points de collocation puisque
le polynme passe exactement par ces points.
Remarque 5.7
On suppose que les donnes des points (xi, !(xi)) sont exactes, ce qui n'est
pas toujours le cas. En effet, si ces donnes proviennent de mesures expri-
mentales, elles peuvent tre entaches d'une erreur de mesure. Dans ce qui
suit, nous supposons que cette erreur est nulle. 0
Le rsultat suivant donne une expression analytique du terme d'erreur
(voir Fortin et Pierre, rf. [11], pour une dmonstration).
Thorme 5.4
Soit xo < Xt < x2 < < Xn, des points de collocation. On suppose que
la fonction f( x) est dfinie dans l'intervalle [x
0
, Xn] et qu'elle est ( n + 1) fois
drivable dans (xo, Xn) Alors, pour tout x compris dans [xo, Xn], il existe
( x) appartenant l'intervalle ( xo, xn) tel que:
j(n+l)((x))
En( x)= (n +
1
)! (x- xo)(x- Xt) (x- Xn)
(5.21)
La relation 5.21 est l'expression analytique de l'erreur d'interpolation. 0
Plusieurs commentaires sont ncessaires pour bien comprendre ce rsul-
tat.
242 Chapitre 5
On constate immdiatement que En( xi)= 0 quel que soit i choisi entre
0 et n. L'erreur d'interpolation est nulle aux points de collocation.
La fonction a priori inconnue f( x) apparat par l'entremise de sa d-
rive d'ordre (n + 1) value au point (x), galement inconnu et qui
varie avec x .
n existe une similarit entre l'erreur d'interpolation et l'erreur relie au
dveloppement de Taylor 1.25. Dans les deux cas, on montre l'existence
d'un point ( x) permettant d'valuer l'erreur mais que l'on ne peut
gnralement pas dterminer.
Puisque le terme d'erreur en un point x fait intervenir des coefficients
de la forme (x - Xi), il y a tout intrt choisir les points Xi qui sont
situs le plus prs possible de x. Ce choix est utile lorsqu 'un grand
nombre de points de collocation sont disponibles et qu'il n'est pas n-
cessaire de construire un polynme passant par tous les points. On
retient alors seulement les points de collocation les plus prs de x de
manire minimiser l'erreur.
La fonction (x xo)(x-xt) (x-xn) est un polynme de degr (n+1)
et possde donc les (n + 1) racines relles (xi pour i = 0, 1, , n).
Dans certaines conditions, cette fonction peut osciller avec de fortes
amplitudes, d'o le risque de grandes erreurs d'interpolation. Cette
proprit fait en sorte qu'il est dlicat d'effectuer des interpolations en
utilisant des polynmes de degr lev.
Exemple 5.7
Soit les valeurs exprimentales suivantes, que l'on a obtenues en mesurant
la vitesse (en km/h) d'un vhicule toutes les 5 secondes:
(0' 55) (5' 60) (10' 58) (15' 54) (20' 55)
(25' 60) (30' 54) (35' 57) ( 40' 52) ( 45' 49)
On constate que le vhicule se dplace une vitesse oscillant autour de
55 kmjh. On peut tablir l'quation d'un polynme de degr 9 passant par
ces dix points (voir la figure 5.4). On remarque de fortes oscillations de ce
polynme principalement au dbut et la fin de l'intervalle [0, 45]. Ainsi, si
Interpolation 243
75
Vitesse
70
(kmlh) 65
60
55
50
45
40
35
30
25
20
0 5 10 15 20 25 30 35 40 45
Temps (s)
Figure 5.4: Interpolation de la vitesse d'un vhicule
on interpole les valeurs en t = 2,5 s et en t = 42,5 s, on trouve des vitesses
respectives de 69,248 km/h et de 27,02 km/h, ce qui semble peu probable
puisque le vhicule se dplace une vitesse peu prs uniforme. Si on re-
garde les valeurs adjacentes au temps t = 42,5 s, le vhicule serait pass de
52 km/h 49 km/h en passant par un creux soudain de 27,02 km/h. Rien ne
laisse supposer un tel comportement. Pour remdier la situation, on doit
recourir des polynmes de degr plus faible. Ainsi, en prenant seulement
les trois premiers points de collocation qui dfinissent un polynme de degr
2, on trouve une vitesse de 58,375 km/h en t = 2,5 s. De mme, en ne consi-
drant que les trois derniers points de collocation, on trouve une vitesse de
50,25 km/h en t = 42,5 s. Ces rsultats sont beaucoup plus acceptables.
Profitons de l'occasion pour souligner les dangers de l'extrapolation, c'est-
-dire de l'utilisation du polynme d'interpolation l'extrieur de l'inter-
valle contenant les pointf) de collocation. Dans cet exemple o l'intervalle est
[0, 45], on trouverait une vitesse de 256 km/h en t = 47 set de 1635 km/h
en t = 50 s. Ces valeurs sont inutilisables .

244 Chapitre 5
Remarque 5.8
L'expression analytique du terme d'erreur nous impose de choisir les points
d'interpolation les plus prs du point x o l'on veut interpoler. Cela s'est
avr souhaitable dans l'exemple prcdent et est en fait une rgle gnrale.
0
Exemple 5.8
Soit les points (1, 1), (3, 1,732051), (7,5, 2,738 613), (9,1, 3,016 620) et
(12, 3,464102). Si on veut interpoler la fonction inconnue f( x) en x = 8, il
est utile de construire une table de diffrences divises.
Xi f(xi) ![xi, Xi+t] f[xi, , Xi+2] ![xi,, Xi+3] f[xi, , XiH)
7,5 2,738 613
0,173 755
9,1 3,016 621 -0,004 322 4 7
0,154 304 0,0004291
12 3,464102 -0,006 253 44 0,0001149
0,192450 0,0011761
3 1,732051 -0,015 779 54
0,366 025
1 1,0
On remarque que les abscisses Xi ont t ordonnes en fonction de leur dis-
tance par rapport x = 8. Cela permet d'effectuer d'abord l'interpolation
avec les valeurs les plus proches de x et galement de diminuer plus rapide-
ment l'erreur d'interpolation. En effet, en prenant des polynmes de degr
de plus en plus lev, la formule de Newton donne les rsultats suivants.
Degr n
Pn(8) 1Pn(8)- y8j
1 2,825490 0,29 x 10-
2
2 2,827 868 0,55 x 10-
3
3 2,828 812 0,38 x 10-
3
4 2,827 547 0,88 x 10-
3
Interpolation 245
La fonction interpole est f( x) = y'x, qui prend la valeur de 2,828 427125
en x = 8. On constate donc une prcision acceptable ds le polynme de
degr 1. Si les points d'interpolation avaient t classs par abscisse crois-
sante, on aurait obtenu le tableau suivant.
Degr n
Pn(8) 1Pn(8)- v81
1 3,562178 0,73xl0
2 2,795 705 0,32 x 10-
1
3 2,825 335 0,30 x 10-
2
4 2,827 547 0,88 x 10-
3
ll faut dans ce cas attendre le degr 3 avant d'avoir une prcision acceptable.
On obtient bien sr le mme rsultat dans les deux cas lorsque tous les points
d'interpolation sont utiliss, c'est--dire lorsqu'on recourt au polynme de
degr 4. On voit donc l'importance d'utiliser les points de collocation les plus
prs possible de l'abscisse autour de laquelle on veut effectuer l'interpolation .

L'expression analytique de l'erreur d'interpolation 5.21 ne permet pas
d'valuer la prcision de l'approximation. n est cependant souhaitable de
pouvoir valuer cette erreur, mme de faon grossire. Cela est possible avec
la formule de Newton. En effet, l'expression 5.21 fait intervenir la drive
d'ordre ( n+1) de la fonction f( x) en x = . C'est ce terme qu'il est ncessaire
d'estimer, puisque c'est le seul qui ne puisse tre valu exactement.
Considrons le cas particulier o les abscisses x; sont galement distantes,
c'est--dire o:
n faut tablir un lien entre les drives de la fonction f( x) et les diffrences
divises. On remarque dans un premier temps que f[x
0
, x
1
] est une approxi-
mation d'ordre 1 de la drive de f(x) en x= x
0
:
f[xo, Xt] = !'(xo) + O(h)
En effet, on a:
f[xo, xl]= f(xt)- f(xo) = f(xo + h)- f(xo)
(x1- xo) h
246 Chapitre 5
En utilisant le dveloppement de Taylor 1.24, on obtient:
f[xo, Xt] =
(f(xo) + f'(xo)h + J"(xo)h
2
/2 + O(h
3
))- f(xo)
h
f'(x
0
) + + O(h
2
) = f'(xo) + O(h)
De mme, on peut montrer qu' une constante prs la ne diffrence divise
de f(x) est une apprdtimation d'ordre 1 de la drive ne de f(x) en x= x
0

On peut en effet dmontrer que:
(5.22)
Nous reviendrons sur l'approximation 5.22 au chapitre 6 sur la drivation
numrique. Pour le moment, servons-nous de ce rsultat. On suppose que
la drive ( n + 1 )e de f( x) varie peu dans l'intervalle [ x
0
, xn] On a alors
l'approximation suivante:
On peut ainsi estimer le terme d'erreur 5.21 par:
(5.23)
Remarque 5.9
On remarque immdiatement que l'approximation 5.23 n'est rien d'autre
que le terme ncessaire au calcul du polynme de degr ( n + 1) dans la
formule de Newton 5.6. En d'autres termes, il est possible d'valuer l'erreur
d'interpolation lie un polynme de degr n en calculant le terme suivant
dans la formule de Newton.
L'approximation 5.23 n'est pas toujours d'une grande prcision, mais
c'est gnralement la seule disponible. D
Cela nous amne suggrer le critre d'arrt suivant dans le cas de l'inter-
polation l'aide de la formule de Newton. On considre que l'approximation
Pn (x) est suffisamment prcise si:
iPn+l(x)- Pn(x)i
< E
IPn+l (X )j
Interpolation 247
o E est une valeur de tolrance fixe l'avance. ll est gnralement recom-
mand de fixer galement le degr maximal N des polynmes utiliss.
Exemple 5.9
Soit une table de la fonction y'x. Puisqu'on connat la fonction (ce qui n'est
bien sr pas le cas en pratique), on est donc en mesure d'valuer l'erreur
exacte et de la comparer avec son approximation obtenue l'aide de la
relation 5.23.
7 2,645 751
0,177124
9 3,000000 -0,004 702 99
0,158 312 0,000 206 783
11 3,316 625 -0,003 462 29 0,9692 x 10-
5
0,144463 0,000 129 248
13 3,605 551 -0,002 686 80
0,133 716
15 3,872983
On tente d'obtenir une approximation de VS l'aide de cette table. En
se basant sur un polynme de degr 1 et en prenant x
0
= 7, on obtient
facilement:
Pt(X) = 2,645 751 + 0,177124( x- 7)
de telle sorte que:
Pt(8) = 2,822 875
L'erreur exacte en x = 8 est alors:
E1(8) = f(8)- Pt(8) =Vs- 2,822 875 = 0,005 552125
Selon l'expression 5.23, on peut estimer cette erreur par le terme suivant
dans la formule de Newton 5.6, c'est--dire:
E
1
(8) -0,004 702 99(8- 7)(8- 9) = 0,004 702 99
248 Chapitre 5
On constate donc que l'erreur approximative est assez prs de l'erreur exacte.
Considrons maintenant le polynme de degr 2:
P2(x) = Pt(x)- 0,004 70299(x- 7)(x- 9)
qui prend la valeur:
P2(8) = 2,822 875 + 0,004 702 99 = 2,827 577 990
soit une erreur exacte de 0,000 849135. Encore ici, cette erreur peut tre
approche l'aide du terme suivant dans la formule de Newton:
E
2
(8) 0,000 206 783(8- 7)(8- 9)(8- 11) = 0,000 620 349
Enfin, en passant au polynme de degr 3, on trouve:
p3(x) = P2(x) + 0,000 206 783(x- 7)(x- 9)(x- 11)
ce qui entrane que:
p3(8) = 2,827 578 301 + 0,000 620 349 = 2,828198 339
L'erreur exacte est alors 0,000 228 786, ce qui est prs de la valeur obtenue
au moyen de l'quation 5.23:
E
3
(8) 0,9692 x 10-
5
(8- 7)(8- 9)(8- 11)(8- 13) = 0,000145 380
qui montre que cette approximation possde 4 chiffres significatifs.
On remarque par ailleurs dans la table que les premires diffrences di-
vises sont ngatives et que le signe alterne d'une colonne une autre. Cela
s'explique par la relation 5.22, qui tablit un lien entre les diffrences divises
et les drives de la fonction f(x). Dans cet exemple, on a:
r::: 1 1 Il -1 Ill 3
f(x) = y;t;, f (x)=
2
ylx' f (x)=
4
x
312
, f (x)=
8
x
512
, etc.
Le signe des drives alterne, tout comme le signe des diffrentes colonnes
de la table de diffrences divises .

Nous terminerons cette section en cherchant dterminer l'ordre de
convergence de l'approximation polynomiale. Si on retient le cas o les abs-
cisses sont galement distantes, il suffit de poser:
x- x
0
s=
h
ou encore (x- xo) = sh (5.24)
Interpolation 249
On remarque alors que:
x- Xi= x- (x
0
+ ih) =(x- x
0
)- ih = sh- ih = (s- i)h
fl suffit maintenant de remplacer X - Xi par ( S - i)h dans l'expression ana-
lytique de l'erreur d'interpolation 5.21 pour obtenir le prochain rsultat.
Thorme 5.5
Dans le cas o les points de collocation Xi sont quidistants, l'expression
analytique de l'erreur d'interpolation s'crit:
j(n+l) ( )
En(x) = (n +
1
)! s(s- 1)(s- 2) (s- n)hn+l
(5.25)
pour un certain dans l'intervalle ( xo, xn) et pour s dfini par l'quation 5.24.
0
Remarque 5.10
On peut ds lors conclure que le polynme d'interpolation Pn(x) est une
approximation d'ordre (n + 1) de la fonction f(x). Encore une fois, si on
prend des points de collocation situs une distance h/2 les uns des autres,
l'erreur d'interpolation est diminue d'un facteur de 2n+1. 0
Exemple 5.10
Pour illustrer l'ordre de convergence d'un polynme de collocation, il est
ncessaire de regarder le comportement de l'erreur lorsque h tend vers O.
Par exemple, on peut utiliser un polynme de degr 2 (prcis l'ordre 3)
construit partir des points:
(xo- h/2, f(xo- h/2))
(xo + h/2, f(xo + h/2))
(xo + 3hj2, f(xo + 3h/2))
faire tendre h vers 0 et vrifier la dcroissance de l'erreur en x = x
0
Le
problme est illustr la figure 5.5, o on constate que le point x
0
est coinc
entre les 3 abscisses choisies, quel que soit h.
On a obtenu le tableau qui suit en utilisant la fonction f( x) = ex au
point xo = 2,6.
f(x
0
+ h/2) -----------------------------------------0
f(x o + 3h!2) -------------------------------------------i----------------------------0
f(x
0
- h/2) ------------Q
x 0 - h/2 x 0 x 0 + h/2 x
0
+3h!2 x
Figure 5.5: Trois points de collocation
h P2(2,6) IP2(2,6)- e ~
6
1 e(2h)/e(h)
0,500 0000 x 10 13,335 083 0,128 65 x 10
-
0,250 0000 x 10 13,449 248 0,144 90 x 10-
1
8, 878 61
0,125 0000 x 10 13,462 014 0,172 38 x 10-
2
8, 405 61
0,625 0000 x 10-
1
13,463 528 0,210 35 x 10-
3
8, 194 91
0,312 5000 x 10-
1
13,463 712 0,259 84 x 10-
4
8, 095 61
0,156 2500 x 10-
1
13,463 735 0,322 89 x 10-
5
8, 047 31
0,781 2500 x 10-
2
13,463 738 0,402 42 x 10-
6
8, 023 51
0,390 6250 x 10-
2
13,463 738 0,502 29 x 10-
7
8, 011 71
0,195 3125 x 10-
2
13,463 738 0,627 41 x 10-
8
8, 005 81
0,976 5625 x 10-
3
13,463 738 0,783 97 x 10-
9
8, 002 91
On remarque que la valeur de h est systmatiquement divise par 2 et que
l'erreur tend vers O. De plus, le ratio de l'erreur lie la valeur de h pr-
cdente (deux fois plus grande) et de l'erreur lie la valeur de h actuelle
fait apparatre la valeur de 8 (ou 2
3
), ce qui confirme l'ordre 3 de cette
approximation.

Interpolation 251
Remarque 5.11
L'expression analytique de l'erreur d'interpolation demeure la mme,
quelle que soit la faon dont on calcule le polynme d'interpolation.
Ainsi, l'expression 5.21 est valable si on utilise l'interpolation de La-
grange, la matrice de Vandermonde ou toute autre mthode. Cela s'ex-
plique par l'unicit de ce polynme.
L'approximation de l'erreur exprime par l'quation 5.23 est galement
valable quelle que soit la faon dont on calcule le polynme d'interpo-
lation. Cependant, si on utilise une autre mthode que l'interpolation
de Newton, il faut calculer la table de diffrences divises pour obtenir
l'approximation 5.23. Il est donc avantageux d'utiliser la formule de
Newton ds le dpart. D
5.6 Splines cubiques
Nous avons constat que l'utilisation de polynmes de degr lev est
parfois dlicate et peut mener des erreurs d'interpolation importantes. De
plus, il est parfois ncessaire d'obtenir des courbes trs rgulires passant par
un grand nombre de points. C'est le cas en conception assiste par ordinateur
(CAO), o l'on cherche reprsenter des objets aux formes rgulires. Les
polynmes de degr lev sont alors peu adquats.
On peut mesurer la rgularit d'une fonction par le biais de ses drives.
En effet, plus une fonction est diffrentiable, plus la courbe qui lui est associe
est lisse et plus la fonction est rgulire. Le problme, lorsqu'on utilise des
polynmes de faible degr, provient du fait qu'il faut en utiliser plusieurs pour
relier tous les points. C'est le cas de l'interpolation linaire par morceaux,
illustre la figure 5.6, qui consiste relier chaque paire de points par un
segment de droite. On utilise aussi l'appellation splines linaires. On imagine
assez mal comment une telle courbe pourrait permettre de faire le design
d'une carrosserie de voiture ou d'une aile d'avion.
Il faut donc tre plus prudent la jonction de ces diffrents segments
de courbe. Une voie trs populaire consiste utiliser dans chaque intervalle
[xi-I, xi] un polynme de degr 3 de la forme:
252
f(x
2
)
f(x
4
)
f(x
1
)
f(x 3)
Chapitre 5
x
Figure 5.6: Interpolation linaire par morceaux
et relier ces diffrents polynmes de faon ce que la courbe rsultante soit
deux fois diffrentiable. C'est l'interpolation par splines cubiques. Supposons
que l'on a ( n + 1) points d'interpolation et donc n intervalles [x i-ll Xi] Cela
indique qu'il y a 4n coefficients (ai, bi, c;, d; pour i = 1, 2, , n) dterminer.
La situation est dcrite la figure 5. 7 pour n = 4.
Ces 4n coefficients doivent tre dtermins le plus efficacement possible
pour que la mthode reste attrayante. Une rsolution astucieuse conduit un
systme linaire tridiagonal de dimension (n- 1). On sait que les systmes
tridiagonaux sont trs faciles rsoudre puisque la dcomposition LU se
rduit dans ce cas peu d'oprations (voir Chapra et Canale, rf. [4]).
Voyons combien de conditions ou d'quations nous pouvons imposer
ces 4n coefficients. Ces quations proviennent des conditions de rgularit
que l'on souhaite imposer la courbe rsultante. Pour faciliter la compr-
hension, il est prfrable de distinguer parmi les points d'interpolation les
deux extrmits et les ( n - 1) points intrieurs. Les deux extrmits sont les
points (xo,f(xo)) et (xn,f(xn)). Une attention particulire doit tre porte
aux points intrieurs, qui se trouvent la jonction de deux polynmes de
degr 3. Voici les contraintes imposes aux n polynmes de degr 3:
Interpolation 253
x
Figure 5.7: Splines cubiques: n polynmes de degr 3
Le polynme Pl(x) passe par la premire extrmit (xo,f(xo)), c'est-
-dire:
Pl(xo) = f(xo)
et de mme l'autre extrmit:
ce qui introduit 2 quations.
Par chaque point intrieur (Xi pour i = 1, 2, , n - 1) passent deux
polynmes, soit Pi( x) dfini dans l'intervalle [xi-b Xi] et Pi+I(x) d-
fini dans [xi, Xi+I] Ces deux polynmes doivent passer par le point
(xi, f(xi)), c'est--dire:
Pi( Xi)= !(xi) pour i = 1, 2, , n- 1
et
Pi+I(xi) = f(xi) pour i = 1, 2, , n- 1
Cela rsulte en 2( n- 1) = (2n - 2) quations supplmentaires.
254 Chapitre 5
Pour assurer la rgularit de la courbe, on doit imposer que les dri-
ves premires et secondes de ces deux polynmes soient continues aux
points intrieurs. On doit donc imposer:
(5.26)
et
(5.27)
ce qui donne (2n- 2) nouvelles quations. Nous avons introduit la
notation JI' pour dsigner la valeur de la drive seconde de la spline
au point intrieur Xi. De mme, nous dsignons Jb' et J ~ les valeurs de
la drive seconde aux deux extrmits.
Au total, on a ( 4n - 2) quations en 4n inconnues et il manque donc
2 quations pour pouvoir rsoudre ce systme linaire. Comme nous le ver-
rons plus loin, il existe plusieurs faons de rajouter ces 2 quations.
Voyons maintenant comment dterminer l'quation de la spline Pi( x)
dans chacun des intervalles [Xi-1, Xi] fl est fort heureusement possible de
ramener ce systme de ( 4n - 2) quations en 4n inconnues en un systme
beaucoup plus petit de ( n - 1) quations en ( n - 1) inconnues. Ces ( n - 1)
inconnues sont tout simplement les valeurs des drives secondes un de la
spline aux points d'interpolation.
La rsolution du systme est base sur la constatation suivante: puisque
la spline est constitue de polynmes de degr 3 dans chaque intervalle, la d-
rive seconde de la spline est un polynme de degr 1 dans chaque intervalle.
De plus, cette drive seconde tant continue en vertu de l'quation 5.27, on
a la situation de la figure 5.8 o la drive seconde est reprsente par des
segments de droite dont les sommets sont les points (xi, JI').
Ainsi, dans l'intervalle [xi_
1
, Xi], la drive seconde p ~ ( x ) est un poly-
nme de degr 1 dont les sommets sont (xi_
1
, Jf'_
1
) et (xi, J['). La formule
d'interpolation de Lagrange donne alors:
"( )-J" (x-xi) +f"(x-Xi-d
P x - 1 .
t t- (xi-1- Xi) t (xi- Xi-1)
En intgrant deux fois cette quation, on obtient d'abord:
Interpolation 255
!"
2
!"
3
!"
1
f'' f''
0 4
x
Figure 5.8: Drive seconde de la spline
et par la suite:
o les i et les f3i sont des constantes d'intgration. Dans une premire tape,
on exprime ces constantes d'intgration en fonction des inconnues ff'.
La courbe du polynme Pi(x) dfini dans [xi-1,xi] doit passer par les
points (xi-t, f(xi-1)) et (xi, f(xi)). On en dduit que:
( ) _ f( ) _ f ~ (Xi - Xi-d
3
a. _ f ~ (Xi - Xi_t)
2
a.
Pz Xz - Xz - z
6
( . _ . ) + fJt - z
6
+ fJt
Xz Xz-1
ce qui entrane que:
(5.28)
De mme, en x= Xi-1:
256 Chapitre 5
d'o l'on tire, d'aprs la relation 5.28:
ce qui permet d'isoler i pour obtenir:
(5.29)
On en dduit que l'quation de la spline dans l'intervalle [xi-I.' Xi] est:
ou encore
Pi( x)
f
" (x- Xi)
3
f" (x- Xi-1)
3
i-1 6( ) + i ( )
Xi-1 - Xi 6 Xi - Xi-1
(
f(xi) ff'(xi- Xi-d) ( )
+ - X- Xi
(xi- Xi-d 6
Un dernier effort est ncessaire pour obtenir une forme plus compacte. TI
suffit de remplacer dans le quatrime terme droite le monme (x - Xi) par
Interpolation 257
l'expression quivalente (x- x;_
1
) + (x;_
1
- x;). On obtient alors:
p;(x) = - f" (x- x;)3 +!"(x- Xi_I)3

Xi-1) 6(x;- x;_I)


(
f(xi-1) f" (x;- Xi-I)) ( )
- -
1
x-x
(x;- x;_I) 6
+ ( f(x;) - ff'(x;- Xi-1)) (x- Xi-1)
(x;- x;_I) 6
On peut simplifier quelque peu l'quation prcdente en posant:
h; = x; - Xi-1 pour i = 1, 2, , n
ce qui permet d'obtenir:
(
f
" (x- x;)
3
1
,(x- Xi-1)
3
Pi x) = - i-1 6h; + i 6h;
- ( (x- x;) (5.30)
+ (
f(xi) h;Jf') ( . )
-h- - -- X -
i 6
qui est l'quation de la spline dans l'intervalle [xi-1, x;].
ll reste dterminer les f['. Des ( 4n - 2) conditions retenues, seule la
continuit de la premire drive (voir l'quation 5.26) n'a pas encore t
impose. Pour ce faire, il faut driver p;(x) dans l'intervalle [xi-l,xi] et
Pi+l(x) dans [x;, Xi+I], puis valuer Pi(x;) et Pi+I(x;). On a d'une part:
'( -f'' (x- x;)
2
J''( x- Xi-1)
2
P; x) = 2h. + ' 2h.

_ (f(x;_I) _ h;J['_1)
h; 6
258 Chapitre 5
et d'autre part:
En galisant ces deux expressions values en x = x; et en les simplifiant, on
obtient les ( n - 1) quations suivantes:
pour i = 1, 2, , n- 1
Une dernire simplification est possible si on divise chaque terme de cette
dernire quation par:
h; + h;+l = Xi - Xi-1 + Xi+1 - X; = Xi+1 - Xi-1
ce qui donne:
h; !" 2f" hi+1 !"
(h; + hi+1) i-1 + i + (h; + h;+t) i+1
(5.31)
pour i=1,2,3,,n-1
On remarque que le terme de droite fait intervenir les deuximes diffrences
divises. Il y a au total ( n + 1) inconnues ff' et on n'a que ( n- 1) quations.
On doit donc fixer de faon arbitraire deux des inconnues. Il existe plusieurs
possibilits, mais la plus simple consiste imposer:
f ~ = ~ = 0
On qualifie de spline naturelle la courbe qui en rsulte. La spline naturelle
impose que la drive seconde est nulle aux deux extrmits et donc que la
courbe y est linaire. Un autre choix possible consiste imposer que:
~ ' = !" et f" = f"
JO 1 n n-1
Interpolation 259
ce qui revient imposer une courbure constante dans le premier et dans le
dernier intervalle.
Remarque 5.12
D'autres choix sont possibles. Tout dpend de l'information disponible pour
un problme donn. Par exemple, il est possible que la pente soit connue aux
extrmits ou que la fonction recherche soit priodique. On peut alors se
servir de cette information pour obtenir les deux quations manquantes. 0
Remarque 5.13
Pour effectuer une interpolation l'aide des splines cubiques, il faut en pre-
mier lieu rsoudre le systme 5.31. Par la suite, on doit dterminer l'intervalle
dans lequel se situe le point d'interpolation x et calculer le polynme dans
cet intervalle en utilisant la formule 5.30. 0
Remarque 5.14
Dans le cas o les abscisses sont quidistantes, c'est--dire:
la matrice du systme linaire 5.31 se trouve simplifie de beaucoup. En
effet, on obtient alors une matrice tridiagonale dont la diagonale principale
ne contient que des 2, tandis que les deux autres diagonales sont constitues
de coefficients valant 1/2. Cette matrice ne dpend donc pas de la valeur de
h, qui n'affecte que le terme de droite. 0
Exemple 5.11
Soit les 4 points suivants: (1, 1), (2, 4), ( 4, 9), (5, 11). On trouve toute l'in-
formation ncessaire au calcul de la spline cubique dans la table suivante.
260 Chapitre 5
z x
z
f(xi) f[xi, Xi+l] f[xi, Xi+I, Xi+2] hi
0 1 1
3 1
1 2 4 -1/6
5/2 2
2 4 9 -1/6
2 1
3 5 11
La premire quation ( i = 1) du systme 5.31 devient:
(1/3)fff + + = 6( -1/6)
et la deuxime quation (i = 2) s'crit:
+ + = 6( -1/6)
Pour obtenir la spline naturelle, on pose = = 0, et on obtient le
systme:
[
2 2/3] [ l = [ -1 l
2/3 2 -1
dont la solution est = -0,375 et = -0,375. L'quation de la spline
dans le premier intervalle est alors:
Pl(x) =


- 2)
+ (f _ (1)( (x_
1
)
que l'on peut simplifier en:
PI(x) = -0,0625(x- 1)
3
- (x- 2) + 4,0625(x- 1)
Ce polynme n'est dfini que dans l'intervalle [1, 2]. On peut par exemple
l'valuer en x = 1,5 pour obtenir 2,523 4375.
Interpolation 261
ll
9
4
x
Figure 5.9: Spline passant par 4 points
De mme, si on a besoin de la valeur de la spline en x = 3, qui est situ dans
le deuxime intervalle (soit [2, 4]), on peut obtenir l'quation de la spline
dans cet intervalle en posant i = 2 dans l'quation 5.30. On a alors:
P2(
x) = 0375(x-
4
? -0375(x-
2
?
' 12 ' 12
c'est--dire:
_ _ (x_
4
)
+ _ (2)( (x_
2
)
p
2
(x) = 0,03125(x- 4?- 0,03125(x- 2?- 2,125(x- 4) + 4,625(x- 2)
La valeur de la spline en x
illustre la figure 5.9.
3 est donc 6,6875. La spline complte est

262 Chapitre 5
75
70
Vitesse
65
(km/h)
60
55
50
45
40
35
30
25
Temps (s)
Figure 5.10: Spline cubique associe au problme du vhicule
Exemple 5.12
Si on reprend l'exemple o la vitesse d'un vhicule est mesure toutes les
5 secondes, on obtient la spline de la figure 5.10. On remarque immdiate-
ment que les fortes oscillations observes la figure 5.4 avec un polynme de
degr 9 ont maintenant disparu. On peut alors interpoler la valeur de la
vitesse du vhicule partout dans l'intervalle [0, 45] sans risque d'obtenir des
valeurs aberrantes.

5. 7 Krigeage
Le krigeage, dont l'origine remonte Krige (rf. [16]) au dbut des annes
cinquante, s'est avr une technique d'interpolation extrmement puissante
la suite des travaux de Matheron (rf. [19]). Le krigeage gnralise un
certain nombre de mthodes d'interpolation que nous avons vues, mais son
principal avantage est de s'tendre facilement aux cas bidimensionnels et
Interpolation 263
tridimensionnels. Nous verrons en fait que faire du krigeage en 1, 2, 3 ou
plus de 3 dimensions est tout aussi facile.
n est possible, par une approche simple, de mettre en vidence cer-
taines proprits du krigeage ou plus prcisment du krigeage dual. Nous
nous inspirerons cet gard de l'article de Trochu (rf. [23]), qui contient
de plus une excellente revue de la littrature ainsi que des applications en
ingnierie
1
.
Le krigeage a t introduit principalement pour rpondre aux besoins
de la prospection minire. n servait notamment reconstituer la position
d'un filon de minerai partir de concentrations obtenues par forage. n y a
donc un aspect statistique inhrent ce problme, mais nous ne l'abordons
pas ici. Nous nous limitons prsenter le krigeage comme une technique
d'interpolation.
Nous abordons en premier lieu l'interpolation d'une courbe plane de
forme y = f( x), un problme que nous connaissons bien. Soit les n points
((xi, f(xi) pour i = 1, 2, 3, , n). Considrons le systme linaire suivant:
Kn K12 K13 Kln
1 Xl al
K21 K22 K23 K2n
1 X2 a2
K31 K32 K33 K3n
1
X3 a3
Knl Kn2 Kn3 Knn
1
Xn an
1 1 1 1 0 0 al
Xl X2 X3 Xn 0 0 a2
qui peut tre reprsent sous forme matricielle:
[ K
AT
l [ l
[ {]
f(xn)
0
0
(5.32)
(5.33)
Les matrices K et A ainsi que les vecteurs a, f et a sont dfinis par la
comparaison des relations 5.32 et 5.33. La matrice A dpend des coordonnes
des points de collocation, tandis que les lments de la matrice K sont donns
typiquement par une relation de la forme:
(5.34)
1
M. F. Trochu est professeur au Dpartement de gnie mcanique de l'cole Polytech-
nique de Montral.
264 Chapitre 5
On obtient les coefficients Kij partir d'une fonction g qui varie selon la
distance entre les abscisses Xi et x j. Le choix de la fonction g dtermine les
proprits de la courbe de krigeage.
Considrons maintenant la fonction:
n
u(x) = L ajg(ix- X ji)+ a1 + a2x
j=l
(5.35)
Si a
1
, a2 et les aj sont solutions du systme 5.32, la fonction u( x) passe par
les n points d'interpolation donns. En effet, la ie quation du systme se
lit:
n
l:ajKij + a1 + a2xi = f(xi)
j=l
qui s'crit galement:
Cela signifie que:
n
L ajg(lxi- Xji) + a1 + a2xi =!(xi)
j=l
Les deux dernires quations du systme 5.32 sont tout simplement:
et
n
Lai= 0
j=l
n
l:ajXj = 0
j=l
(5.36)
(5.37)
qui traduisent des conditions de non-biais de la fonction u(x), faisant ici
rfrence l'aspect statistique du krigeage.
La fonction u( x) se dcompose en deux parties. On appelle drive la
partie:
(5.38)
qui peut galement tre un polynme de degr k. n faut alors modifier l-
grement le systme 5.32 en ajoutant les lignes et les colonnes contenant les
Interpolation 265
diffrentes puissances des points Xi. Le systme prend la forme:
Ku I<ln
1 Xl (x1?
( x1)k
al !(xl)
[{21 I<2n
1 X2 (x2)
2
(x2)k
a2 f(x2)
[{31 I<3n
1
X3 (x3)
2
(x3)k
a3 J(x3)
I<nl I<nn
1
Xn (xn)
2
(xn)k
an f(xn)
1 1 0 0 0 0 al 0
xl Xn 0 0 0 0 a2 0
(x1)
2
(xn)
2
0 0 0 0 a3 0
(xl)k (xn)k 0 0 0 0
ak+l
0
(5.39)
La fonction:
n
L ajg(lx- X ji) (5.40)
j=l
est appele fluctuation alatoire. La drive peut s'interprter comme une
premire approximation du comportement gnral de la fonction f( x) in-
terpoler. La fluctuation alatoire est une correction de la drive permettant
la courbe de passer par les points d'interpolation. Dans la figure 5.11, les
points sont plus ou moins dissmins autour d'une droite. Le choix d'une d-
rive linaire parat alors appropri. Dans d'autres circonstances, une drive
constante ou parabolique pourrait donner de meilleurs rsultats.
Les remarques suivantes sur la nature du systme 5.32 joueront un rle
important plus loin.
Remarque 5.15
Le choix de la fonction g( h) n'est pas totalement arbitraire; il est rgi par des
rgles que nous ne prcisons pas ici. De plus, si on remplace la fonction g par
cg, o c est une constante, la matrice K est multiplie par la mme constante.
ll est facile de voir que la solution du systme 5.32 est alors [a/c af. On
en conclut que lorsqu 'on multiplie la fonction g par une constante le vecteur
solution a est divis par la mme constante et le vecteur a reste inchang.
On constate en outre que la fonction u( x) de la formule 5.35 reste in-
change puisque la fonction g est multiplie par c et que les coefficients aj
sont diviss parc. On en conclut que la courbe de krigeage 5.35 est inchange
lorsque la fonction g est multiplie par une constante. 0
266 Chapitre 5
5 r------,-------.-------.------.-------,-------,
u(x)
4
Drive
3
2
.. r
0
-1
-2 L ~ L ~ ~ L ~
-1 0 2 3 4 5
x
Figure 5.11: Drive et courbe de krigeage
Remarque 5.16
Si on ajoute une constante c chaque coefficient de la matrice I< (ce qui
revient remplacer g(h) par g(h) + c), la solution du systme 5.32 reste
inchange. En effet, la ie quation du systme devient:
n n
L l<ij(Xj + cL O:j + a1 + a2xi
j=l j=l
n
L I<ijO:j + a1 + a2xi
j=l
en vertu de l'quation 5.36. 0
Le choix de la fonction g n'est pas tout fait arbitraire et certaines
fonctions g sont plus intressantes que d'autres. Commenons par le choix
le plus simple:
g(h) = h (5.41)
Interpola ti on 267
ce qui entrane que:
La fonction u(x) s'crit dans ce cas:
n
u(x) = Xjl + a1 + a2x
j=l
La fonction lx- x j 1 est linaire par morceaux et non drivable au point x j. La
drive tant galement linaire, on en dduit que u( x) est une interpolation
linaire par morceaux puisque, par construction, u( x) passe par tous les
points de collocation. On appelle galement cette courbe une spline linaire.
Exemple 5.13
Soit les 5 points suivants: (0, 0), (1, 1), (2, 1), (3, 2) et ( 4,2). Si on utilise la
fonction 5.41, le systme linaire 5.32 est de dimension (5 + 2) et s'crit:
0 1 2 3 4 1 0 al 0
1 0 1 2 3 1 1 a2 1
2 1 0 1 2 1 2 a3
1
3 2 1 0 1 1 3 a4
2
4 3 2 1 0 1 4 as 2
1 1 1 1 1 0 0 al
0
0 1 2 3 4 0 0 a2
0
dont la solution, obtenue par dcomposition LU, est le vecteur:
1
4 2 2
1 1 0
2 4 2
La fonction u (x) s'crit alors:
1 1 1 1 1 1
u(x) =-lx- Ol- -lx- li+ -lx- 21- -lx- 31 +-lx- 41 + 0 +-x
4 2 2 2 4 2
et est illustre la figure 5.12. On remarque que cette fonction est bien
linaire par morceaux et passe par tous les points de collocation, d'o cet
aspect en dents de scie. De plus, pour obtenir l'quation de cette spline
268 Chapitre 5
2,5
u(x)
2,0
1,5
1,0
0,5
0,0
-0,5
-1 0 2 3 4 5
x
Figure 5.12: Krigeage linaire
linaire l'aide des techniques classiques, il faudrait dfinir la courbe pour
chaque sous-intervalle. Ici, on profite d'une seule expression valide dans tout
le domaine. En outre, l'extrapolation est permise .

Le deuxime cas intressant correspond au choix:
g(h) = h
3
(5.42)
Les coefficients de la matrice K sont alors des fonctions du cube de la distance
entre les abscisses d'interpolation, c'est--dire:
et la fonction u( x) correspondante fait intervenir les fonctions:
Chaque fonction gj( x) est deux fois diffrentiable au point x j. En effet:
SI X < Xj
SI X > Xj
Interpolation 269
Les limites gauche et droite en x j tendent vers 0, ce qui signifie que cette
fonction est continue en x j. De mme:
SI X< Xj
SI X> Xj
et les limites gauche et droite tendent encore vers O. La fonction gj( x)
est donc drivable une premire fois. De plus:
et
gj"(x) = { ~
SI X < Xj
SI X > Xj
SI X< Xj
si x > Xj
On constate donc que la drive seconde est galement continue, mais
pas la drive troisime puisque les limites gauche et droite valent res-
pectivement -6 et 6. La fonction u( x) est donc deux fois diffrentiable et est
de degr 3 partout, ce qui dmontre qu'il s'agit d'une spline cubique. Cette
spline est implicitement naturelle puisque:
n
L O:jgj'(xl)
j=l
n
- l:o:j6(xl- Xj)
j=l
n n
-6x
1
L O:j + 6 L O:jXj
j=l j=l
0
en vertu des relations 5.36 et 5.37. On obtiendrait un rsultat similaire avec
u"(xn)
270 Chapitre 5
Exemple 5.14
Si on considre les mmes points que dans l'exemple prcdent mais avec
g( h) = h
3
, on obtient le systme:
0 1 8 27 64 1 0 al 0
1 0 1 8 27 1 1
a2
1
8 1 0 1 8 1 2
a3 1
27 8 1 0 1 1 3 a4 2
64 27 8 1 0 1 4
as 2
1 1 1 1 1 0 0
al 0
0 1 2 3 4 0 0 a2 0
La fonction u( x) correspondante est illustre la figure 5.13 et correspond
bien une spline cubique. L'quation de cette spline est:
u( x) = -0,178 75lx- 01
3
+ 0,57143lx- 11
3
- 0,785 7llx- 21
3
+ 0,57143lx- 31
3
- 0,178 57lx- 41
3
+ 1,7143 + 0,5x
On remarque que l'expression de la drive n'est pas la mme que dans le cas
de g(h) = h. De plus, l'extrapolation de part et d'autre de l'intervalle [0,4]
se fait de manire linaire, ce qui correspond bien une spline naturelle.
n est galement intressant de souligner qu'une seule quation exprime la
courbe complte, contrairement au systme d'quations par sous-intervalles
dcrit la section 5.6 (voir la formule 5.30) .

Remarque 5.17
Une autre diffrence importante marque cette nouvelle faon d'obtenir l'qua-
tion de la spline. la section 5.6, un systme linaire tridiagonal tait n-
cessaire au calcul de la spline. Si on recourt au krigeage, le systme linaire
correspondant n'est plus tridiagonal. D
Interpolation
271
2,5
u(x)
2,0
1,5
1,0
0,5
0,0
-0,5
-1,0
-1,5
-1 0 2 3 4 5
x
Figure 5.13: Krigeage cubique
Exemple 5.15
On a vu que la matrice K est pleine, c'est--dire que la majeure partie
des coefficients de cette matrice sont non nuls. Cela tient au fait que ces
coefficients sont dfinis par:
et que les diffrents choix de fonction g( h) faits jusqu' maintenant ne per-
mettent d'annuler les lments Kij que sur la diagonale.
n est intuitivement clair que l'interpolation d'une fonction en un point
x dpend plus fortement des points de collocation situs dans le voisinage
immdiat de x que des points plus loigns. Pour tenir compte de cette
observation, il est possible d'introduire une distance d'influence d au-del de
laquelle la fonction g( h) s'annule, ce qui permet de rduire l'influence des
points de collocation situs une distance suprieure d. Par exemple (voir
Trochu, rf. [23]), on peut obtenir une courbe similaire aux splines cubiques
en dfinissant:
si 0 :::; h :::; d
si h > d
272 Chapitre 5
u(x)
2,5
2,0
1,5
1,0
0,5
0,0
-0,5
-1,0
-1,5
-2,0
-2,5
-1 0 2 3 4 5
x
Figure 5.14: Krigeage cubique: distance d'influence d = 3
Cette dfinition assure la continuit de la fonction g. On pourrait galement
modifier lgrement cette fonction pour la rendre diffrentiable, sans changer
les proprits de la courbe. Si la distance d est trs grande, on retrouvera
une spline cubique comme prcdemment. Par contre, si on rduit la valeur
de d, la courbe aura tendance osciller plus fortement. Cela se voit sur
la figure 5.14, o on a utilis les mmes points de collocation que dans les
exemples prcdents mais en introduisant une distance d'influence d = 3.
Le rsultat est encore plus probant avec d = 0,5, comme en tmoigne la
figure 5.15 o la distance d'influence est nettement perceptible .

Remarque 5.18
Les systmes linaires de krigeage des exemples prcdents sont quelque peu
particuliers. En effet, la diagonale principale des matrices de krigeage est
a priori nulle. li faut donc se montrer prudent au moment de la rsolution par
dcomposition LU. La recherche d'un pivot non nul peut s'avrer ncessaire.
On peut galement faciliter le traitement numrique du systme en modifiant
la fonction g(h), par exemple en lui ajoutant une constante, sans modifier la
courbe de krigeage. 0
Interpolation 273
3,0
u(x)
2,5
2,0
1,5
1,0
0,5
0,0
-0,5
-1 0 2 3 4 5
x
Figure 5.15: Krigeage cubique: distance d'influence d = 0,5
5. 7.1 Effet ppite
Lorsqu'on fait de l'interpolation partir de mesures exprimentales, il
est quelquefois utile d'avoir la possibilit d'liminer une donne qui parat
aberrante. Cette donne peut provenir d'une erreur de mesure par exemple.
Initialement, dans la prospection minire, on a qualifi la prsence de ces don-
nes marginales d'effet ppite. Cette expression traduisait l'empressement de
certains analystes miniers conclure trop vite une forte concentration d'or
dans le voisinage immdiat d'une ppite d'or isole.
Une faon de contourner cette difficult est de pondrer les mesures exp-
rimentales en y attachant un poids variable suivant la fiabilit de la mesure.
Plus prcisment, on attache un poids d'autant plus grand que la variance
statistique de l'erreur lie cette mesure est petite. On voit encore ici poindre
l'aspect statistique du krigeage.
Sur le plan pratique, cela se fait en modifiant trs lgrement la matrice
K du systme de krigeage 5.32. li suffit en fait de modifier la diagonale de
274
la matrice K et de considrer le systme linaire:
Kn + w1 K12 Kln
1 X1
K21 Kzz + Wz Kzn
1 Xz
Knl Knz Knn + Wn
1 Xn
1 1 1 0 0
xl xz Xn 0 0
que l'on peut reprsenter sous forme matricielle:
[K+D
AT
l [ l
[ { l
La matrice diagonale:
wl 0 0 0
0 Wz 0
D=
0 0 0
0 0
0 0 Wn
al
<Yz
<Yn
al
az
Chapitre 5
f(xn)
0
0
(5.43)
(5.44)
exprime en quelque sorte le degr de fiabilit attach chaque mesure. Plus
Wi est grand, moins on tient compte de cette mesure dans le calcul de la
fonction de krigeage. Sur le plan statistique, Wi est proportionnel la variance
de l'erreur sur la ie mesure.
Remarque 5.19
Pour mettre en vidence un effet ppite, il n'est ncessaire de modifier que
la diagonale de la matrice K du systme de krigeage. Le choix de g( h) et
l'expression de u(x) restent inchangs. D
On remarque immdiatement que si Wi =/= 0:
ce qui entrane que la fonction de krigeage ne passe pas par le point (Xi, f( Xi)).
En effet, l'quation correspondante du systme 5.43 devient:
Interpolation
275
2,5
u(x)
2,0
1,5
1,0
0
0,5
0,0
-0,5
-1,0
-1 0 2 3 4 5
x
Figure 5.16: Krigeage cubique: effet ppite
qui devient:
ou encore
u(xi) + Wiai = f(xi)
Plus Wi est grand, plus l'cart entre u(xi) et f(xi) risque d'tre grand.
Exemple 5.16
Reprenons les 5 points de l'exemple prcdent avec g(h) = h
3
, mais en
introduisant cette fois un effet ppite au troisime point ( w
3
= 1, Wi = 0
Vi ::/= 3). On obtient la spline cubique de la figure 5.16. On remarque que la
spline ne passe plus par le troisime point .

On peut se demander ce qui arrive lorsque l'effet ppite devient trs
important. Pour rpondre cette question, il est ncessaire de remplacer
la matrice D par j3D et de faire tendre j3 vers l'infini. De cette manire,
l'importance relative des wi est la mme quelle que soit la valeur de j3.
276 Chapitre 5
Le systme 5.44 s'crit:
(K+,BD)a+Aa f
qui, lorsqu'on isole a dans la premire quation et qu'on remplace cette
variable dans la deuxime quation, devient:
ou encore
(5.45)
Thorme 5.6
Lorsque ,8 -+ oo, le systme 5.45 tend vers le systme:
ATD-
1
Aa= ATD-
1
{
(5.46)
qui correspond un problme de moindres carrs pondrs. En particulier,
si la matrice D est la matrice identit (ce qui correspond une pondration
gale pour tous les points), on trouve:
(5.47)
de telle sorte que la drive a
1
+a
2
x n'est rien d'autre que la droite de moindres
carrs (voir Burden et Faires, rf. [2]).
Dmonstration (facultative):
On considre en premier lieu la matrice (K +,BD), qui devient:
(K +,BD)= ,BD(I + liD-
1
K)
Si ,8 est suffisamment grand:
ce qui en:trane que le rayon spectral de cette matrice est infrieur 1 et que
la matrice est convergente. On a alors:
1 1 1 1
(I + -D-
1
K)-
1
= I- ( -D-
1
K) + ( -D-
1
K)
2
- ( -D-
1
K)
3
+
,8 ,8 ,8 ,8
Interpolation
ou plus prcisment:
(K + f3D)-
1
(I + bD-lK)-lbD-l
bU+ bD-l K)-l D-l
277
b [I- bD-lK + (bD-lK)z- (bD-lK)3+ ]D-l
b [D-l- bD-lKD-l + (bD-lK)zD-l + .. ]
Le systme de krigeage 5.45 devient alors:
o on peut simplifier un coefficient 1/ f3 de chaque ct. En faisant tendre f3
vers l'infini, on trouve immdiatement:
qui est le rsultat recherch. D
En pratique, il n'est pas ncessaire de faire tendre f3 vers l'infini. li suffit
en effet de prendre des poids Wi trs grands.
Exemple 5.17
En reprenant les points de l'exemple prcdent mais avec Wi = 10
5
Vi, on
trouve la droite de la figure 5.17. n s'agit bien de la droite de moindres
carrs.

5. 7.2 Courbes paramtres
li est parfois utile de construire des courbes paramtres. Cela permet, par
exemple, de construire des courbes fermes (comme un cercle ou une ellipse)
278 Chapitre 5
3,0 .------.----,-----.,.-----.------,------,
u(x)
2,5
2,0
0
1,5
1,0 0
0,5
0,0 - 4 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
-0,5 t__ __ __.J... ___ -L_ __ ____JL__ __ __L_ ___ .J.._ __ ---J
-1 0 2 3 4 5
x
Figure 5.17: Krigeage cubique: effet ppite avec Wi = 10
5
ou plus gnralement des courbes qui sont en intersection avec elles-mmes
(telle une boucle). On peut ainsi, l'aide de quelques points donns dans l'es-
pace, construire des trajectoires complexes. La paramtrisation d'une courbe
de l'espace s'obtient par une quation de la forme:
1(t) = (!I(t),/z(t),/3(t)), tE [a,b]
On dcrit la courbe en faisant varier le paramtre t entre a et b. La
stratgie de krigeage reste sensiblement la mme dans ce cas. En effet, pour
construire une courbe paramtre passant par les points ( (xi, x ~ , x ~ pour
i = 1, 2, , n ), il faut d'abord construire la suite ti des valeurs du paramtre
t de telle sorte que:
'?(ti)= (xL x ~ , x;)
Le choix le plus simple est bien sr:
mais il ne tient aucun compte des distances respectives entre les points
(xi, ~ , x ~ . Selon Trochu (rf. [23]), un choix plus judicieux consiste prendre
t1 = 0 et:
(5.48)
Interpolation
279
La distance entre les valeurs du paramtre t est ainsi variable et dpend
directement de la distance entre les points d'interpolation. Il suffit ensuite
de rsoudre les systmes linaires suivants:
Kn K12 K13 Kln
1
tl
al
1
xl
1
K21 K22 K23 K2n
1 t2 ~ xi
K31 K32 K33 K3n
1
t3
al
3
x3
1
(5.49)
Knl Kn2 Kn3 Knn
1 tn
al
n
xn
1
1 1 1 1 0 0
al
1
0
tl t2 t3 tn 0 0
al
2
0
Kn K12 K13 Kln
1 tl
a2
1
x ~
K21 K22 K23 K2n
1
t2
a2
2
x2
2
K31 K32 K33 K3n
1
t3 ~ x ~
(5.50)
Knl Kn2 Kn3 Knn
1 tn
a2
n
xn
2
1 1 1 1 0 0
a2
1
0
tl t2 t3 tn 0 0
a2
2
0
Kn K12 K13 Kln
1 tl
a3
1
x1
K21 K22 K23 K2n
1
t2 ~ x ~
K31 K32 K33 K3n
1 t3
a3
3
x3
3
(5.51)
Knl Kn2 Kn3 I<nn
1 tn
a3
n
x3
1 1 1 1 0 0
a3
1
0
tl t2 t3 tn 0 0
a3
2
0
La courbe paramtre est alors donne par:
n
"(l(t) = L a}g(lt- til)+ ai+ ~ t
(5.52)
j=l
n
"(2(t) = L a]g(lt- til)+ ai+ ~ t
(5.53)
j=l
n
'Y3(t) = L:: ajg(lt- tjl) +ar+ ~ t
(5.54)
j=l
280 Chapitre 5
Ici encore, on prouve facilement que:
Remarque 5.20
Les 3 systmes linaires requis pour le krigeage paramtr ont tous la mme
matrice. Seul le membre de droite change. li est alors important de n'ef-
fectuer qu'une seule dcomposition LU, suivie de 3 remontes et descentes
triangulaires. Cela fait considrablement diminuer le temps de calcul. D
Exemple 5.18
On donne les 12 points suivants de l'espace 3 dimensions.
x'
1
x'
2
x3
0,0 0,0 0,0
1,0 0,0 1,0
1,0 1,0 2,0
0,0 1,0 3,0
0,0 0,0 4,0
1,0 0,0 5,0
1,0 1,0 6,0
0,0 1,0 7,0
0,0 0,0 8,0
1,0 0,0 9,0
1,0 1,0 10,0
0,0 1,0 11,0
On veut construire la courbe paramtre passant par ces 12 points. Le choix
de la fonction g(h) est, comme toujours, primordial. En choisissant d'abord
une interpolation linaire (g( h) = h ), on obtient la courbe paramtre de
la figure 5.18, qui est peu satisfaisante sur le plan esthtique. En revanche,
avec g( h) = h3, on obtient la spirale de la figure 5.19, qui est une spline
paramtre.

1
1
1
281
1
1
1
Interpolation
1
1
1
1
1
1
1
1
1
x 3
x 1
Figure 5.18: J(rigeage paramtr: g(h) h
10
5
x 3
0
x 2
0
x 1
Figure 5.19: Krigeage paramtr: g(h) h
3
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
282 Chapitre 5
5.7.3 Cas multidimensionnel
Le krigeage dual s'tend facilement en plusieurs dimensions. Soit les
n points d'interpolation:
pour i = 1, 2, 3, , n
Le systme de krigeage dual devient dans ce cas:
Ku Kl2 Kln
1
xl
1
xl
2
xl
3
0:'1 !(xi, ~ , x)
K21 K22 K2n
1
x2
1
x2
2
x2
3
0:'2 f( xi, ~ , x5)
Knl Kn2 Knn
1
xn
1
xn
2
xn
3
O:'n f(x},x2,x3)
1 1 1 0 0 0 0 al 0
xl
1
x2
1
xn
1
0 0 0 0 a2 0
x ~
x2
2
xn
2
0 0 0 0 a3 0
xl
3
x2
3
xn
3
0 0 0 0 a4 0
(5.55)
et la fonction de krigeage devient:
n
u(x) = L O:'jg(llx- xjlle) +al+ a2Xl + a3X2 + a4X3 (5.56)
j=l
valable en tout point x= (x
11
x2, x3). Dans l'expression 5.56, on a remplac
la valeur absolue par la norme euclidienne. En fait, on peut utiliser toute
autre norme vectorielle. Il est encore une fois facile de dmontrer que:
pour i = 1, 2, , n
Remarque 5.21
Le systme 5.55 permet le calcul d'une fonction u(x
1
, x2, x3) de R
3
dans R.
On peut galement construire des fonctions de R
2
dans R en retirant une
dimension du systme et en rsolvant:
Ku Kl2 Kln
1
xl
1
xl
2
0:'1 f(xi,xD
K21 K22 K2n
1
x2
1
x2
2
0:'2 f x i , x ~ )
K31 K32 K3n
1
x3
1
x3
2
0:'3 f(xr, x ~ )
Knl Kn2 Knn
1
xn xn
f(x},x2)
(5.57)
1 2
O:'n
1 1 1 0 0 0 al 0
xl
1
x2
1
xn
1
0 0 0 a2 0
xl
2
x2
2
xn
2
0 0 0 a3 0
Interpolation
283
La fonction u( x1, x2) est alors dfinie par:
n
u(i) = L.:ajg(iix- ijlie) + a1 + a2x1 + a3x2 (5.58)
j=l
Cela montre bien que le krigeage demeure aussi simple en 1 dimension qu'en
2 ou 3 dimensions. 0
Remarque 5.22
On peut utiliser l'quation 5.58 pour obtenir des lignes de contour d'une
fonction f(xb x2), notamment en topographie. On peut consulter ce sujet
le texte de Trochu (rf. [23]). 0
TI reste le choix de la fonction g(h) = g(lii- ijlie) En dimension 1, on
a tabli que le choix g(h) = h
3
conduisait aux splines cubiques (pour une
drive linaire). On pourrait galement montrer que l'quivalent des splines
cubiques est obtenu en posant:
g(h) = h
en dimension 3 et:
en dimension 2.
Exemple 5.19
Soit les 9 points:
xz
1
xz
2
f(xi,x2))
0,0 0,0 0,0
0,0 0,5 1,0
1,0 0,0 1,0
0,0 1,0 1,5
1,0 0,5 2,0
2,0 0,0 0,25
1,0 1,0 1,0
2,0 0,5 1,0
2,0 1,0 0,0
284 Chapitre 5
Figure 5.20: Krigeage bidimensionnel: g( h) = h
2
ln h
qui dfinissent une surface et qui ncessitent un krigeage bidimensionnel. Le
systme linaire 5.57 est, dans ce cas, de dimension 12 et les coefficients de
la matrice I< sont donns par:
La fonction de krigeage u( x
11
x2) prend la forme de la surface de la fi-
gure 5.20. Cette surface correspond l'approximation dite de coque mince
et est l'quivalent bidimensionnel d'une spline cubique .

Cette section n'est qu'une courte introduction au krigeage. La thorie
sous-jacente est vaste et beaucoup de travaux d'applications du krigeage
sont actuellement en cours. L'article de Duchon (rf. [9]) traite plus en pro-
fondeur de la relation entre le krigeage et les splines cubiques. En ce qui
concerne l'aspect statistique, l'article de Matheron (rf. [19]) sur les fonc-
tions alatoires intrinsques est certes l'un des plus importants sur le sujet.
5.8 Application: courbe des puissances classes
La courbe des puissances classes d'un service d'lectricit (par exemple
Hydro-Qubec) reprsente la proportion de l'anne o la demande d'lectri-
cit atteint ou dpasse une puissance donne (en gigawatts ou GW). Plus la
puissance est grande, plus petite est la proportion de l'anne o la demande
Interpolation 285
35
Puissance
(GW)
30
25
20
15
10
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
Proportion de l'anne
Figure 5.21: Courbe des puissances classes: polynme de degr 6
dpasse cette valeur. Ainsi, la puissance maximale n'est atteinte que pen-
dant une infime portion de l'anne, gnralement durant les grands froids de
l'hiver. Cette courbe est par dfinition dcroissante.
Pour une certaine anne de rfrence, on dispose des donnes (fictives)
suivantes.
Proportion Puissance
de l'anne (GW)
0,0 30
0,1 29
0,2 24
0,5 19
0,8 18
0,9 15
1,0 0
La figure 5.21 reprsente la courbe obtenue par interpolation l'aide
d'un polynme de degr 6, tandis que la figure 5.22 reprsente la spline
obtenue partir des mmes donnes. Qualitativement, il est vident que la
286
Puissance
(GW) 30
25
20
15
10
0
Chapitre 5
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
Proportion de l'anne
Figure 5.22: Courbe des puissances classes: spline
spline donne de meilleurs rsultats puisque la courbe est bien dcroissante.
Ce n'est pas le cas du polynme de degr 6, qui est lgrement croissant au
dbut de l'intervalle. Si on interpole ces deux courbes en x = 0,3, on obtient
20,65 GW l'aide de l'interpolation de Newton et 20,537 GW au moyen de
la spline. On en conclut que pendant 30% de l'anne la puissance demande
dpasse 20,5 GW.
Interpolation
287
5.9 Exercices
1. n n'existe pas de polynme de degr n dont la courbe passe par ( n + 2)
points donns. Commenter.
2. Obtenir le polynme de degr 2 passant par les points suivants.
x
f(x)
1,0 2,0
2,0 6,0
3,0 12,0
Utiliser la matrice de Vandermonde.
3. Soit les points suivants.
x
f(x)
0,0 0,0
1,0 2,0
2,0 36,0
3,0 252,0
4,0 1040,0
a) Obtenir le polynme de Lagrange passant par les 3 premiers points.
b) Obtenir le polynme de Lagrange passant par les 4 premiers points.
Est-ce possible d'utiliser les calculs faits en a)?
c) Donner l'expression analytique de l'erreur pour les polynmes obte-
nus en a) et en b).
d) Obtenir des approximations de f(1,5) l'aide des 2 polynmes ob-
tenus en a) et en b).
4. Rpondre aux mmes questions qu' l'exercice prcdent, mais en uti-
lisant la mthode de Newton. Donner en plus des approximations des
erreurs commises en d).
5. Toujours partir des donnes de l'exercice 3:
a) Obtenir le systme linaire ncessaire pour calculer la spline natu-
relle dans l'intervalle [0, 4].
b) Rsoudre ce systme et obtenir la valeur des drives secondes de
la spline en c h q ~ e point d'interpolation.
c) Obtenir une approximation de !(1,5) l'aide de la spline.
288 Chapitre 5
6. Obtenir une approximation de f( 4,5) en utilisant un polynme de degr
2 ainsi que les donnes suivantes.
x f(x)
1,0 0,0000
2,0 0,6931
3,5 1,2528
5,0 1,6094
7,0 1,9459
a) Utiliser la mthode de Newton et un polynme de degr 2. Donner
l'expression analytique du terme d'erreur.
b) Rpondre la question pose en a), mais en utilisant cette fois la
mthode de Lagrange.
c) Obtenir une approximation de l'erreur commise en a).
d) Est-ce possible d'obtenir une approximation de l'erreur commise en
b )?
e) Quelles diffrences prsentent ces deux mthodes?
7. Soit une fonction alatoire X suivant une loi normale. La probabilit
que X soit infrieur ou gal x (note P( X :.:; x)) est donne par la
fonction:
P(X:.:; x))= - e-t 1
2
dt
1 jx 2
.j'ii -oo
Comme la fonction e-t
2
1
2
n'a pas de primitive, on calcule cette probabi-
lit pour diffrentes valeurs de x, (par des mthodes que nous verrons
au prochain chapitre) et on garde les rsultats dans des tables comme
celle-ci:
x P(X:.:; x)
1,0 0,84134
1,1 0,864 33
1,2 0,88493
1,3 0,903 20
1,4 0,91924
l'aide de cette table, obtenir P(X :.:; 1,05) avec une erreur absolue
infrieure 0,2 x 10-
5
.
Interpolation 289
8. Un cas particulier intressant de la formule d'interpolation de New-
ton se prsente lorsque les points d'interpolation Xi sont galement
distants, c'est--dire lorsque:
Xi+l- Xi= h
Obtenir l'expression des premires, deuximes et troisimes diffrences
divises dans ce cas prcis. Donner un aperu de ce que pourraient tre
les autres diffrences divises.
9. Soit les trois points (0, 0), (1, 1) et (2, 8) de la fonction f(x) = x
3

a) Obtenir le systme linaire (1 x 1) permettant de calculer la spline
cubique naturelle passant par ces trois points.
b) l'aide de la spline trouve en a), donner une approximation de
f(1/2) et comparer le rsultat avec la valeur exacte 1/8.
c) En interpolant une fonction cubique (!(x)= x
3
) par des polynmes
de degr 3 dans chaque intervalle, on obtient quand mme une erreur.
Expliquer.
10. Reprendre l'exercice prcdent, mais en utilisant cette fois une spline
qui vrifie ffi = 0 et g 12. Expliquer les rsultats.
11. On souhaite concevoir un virage d'une voie de chemin de fer entre les
points (0, 0) et (1 , 1 ). Le virage est dcrit par une courbe de la forme
y= f(x) qui satisfait:
f ( 0) = 0 et f ( 1) = 1
De plus, pour assurer une transition en douceur, la pente de la courbe
doit satisfaire:
f'(O) = 0 et j'(1) = 0,3
On reprsente la courbe l'aide d'un polynme dans l'intervalle [0, 1).
a) Quel est le degr minimal que ce polynme devra avoir pour remplir
toutes les conditions?
b) Calculer ce polynme.
290 Chapitre 5
12. Soit une fonction f( x) dont on connat la valeur en certains points.
x
f(x)
0 3
1 2
2 3
3 6
4 11
5 18
a) Calculer la table de diffrences divises. Montrer que les troisimes
diffrences divises sont nulles.
b) Que conclure au sujet de la fonction f( x)?
13. Soit les points de la table suivante.
x
!(x)
0 1
2 4
5 7
a) Construire le systme linaire de krigeage en utilisant la fonction
g( h) = h et une drive linaire.
b) Rsoudre ce systme par dcomposition LU et donner l'expression
de la fonction de krigeage u( x). valuer u(3).
c) Montrer qu'il s'agit bien d'une interpolation linaire par morceaux.
14. Rpondre aux questions a) et b) de l'exercice prcdent, mais en utili-
sant cette fois la fonction g( h) = h
3

15. En utilisant les mmes points que ceux des deux exercices prcdents,
montrer que le systme linaire de krigeage obtenu en prenant la fonc-
tion g( h) = h
2
est singulier (ce qui indique que le choix de g( h) n'est
pas arbitraire).
16. Obtenir le systme linaire de krigeage qui permette de construire une
surface passant par les points suivants.
Xl X2 f( x1. x2)
1 1 1
2 1 2
1 2 2
2 2 4
Interpolation 291
valuer la fonction de krigeage en (3/2, 3/2) et comparer le rsultat
avec la valeur exacte 9/4 (les points donns appartiennent la fonc-
tion f(x
11
x
2
) = x
1
x
2
). Utiliser pour ce faire une drive linaire et la
fonction g( h) = h
2
ln h.
17. l'aide de la mthode du krigeage, donner l'quation paramtrique
du carr [0, 1] x [0, 1].
Suggestion: Considrer les 5 points (0, 0), (1, 0), (1, 1), (0, 1) et (0, 0)
de mme que la fonction g( h) = h pour obtenir une approximation
linaire par morceaux.
Chapitre 6
Diffrentiation et intgration
, .
numeriques
6.1 Introduction
Le contenu de ce chapitre prolonge celui du chapitre 5 sur l'interpolation.
peu de choses prs, on y manie les mmes outils d'analyse. Dans le cas de
l'interpolation, on cherchait valuer une fonction f( x) connue seulement
en quelques points. Dans le prsent chapitre, le problme consiste obtenir
des approximations des diffrentes drives de cette fonction de mme que
de:
rn f(x)dx
lxo
On parle alors de drivation numrique et d'intgration numrique. On fait
face ce type de problmes lorsque, par exemple, on connat la position
d'une particule intervalles de temps rguliers et que l'on souhaite obtenir
sa vitesse. On doit alors effectuer la drive de la position connue seulement
en quelques points. De mme, l'acclration de cette particule ncessite le
calcul de la drive seconde.
Si, l'inverse, on connat la vitesse d'une particule certains intervalles
de temps, on obtient la distance parcourue en intgrant la vitesse dans l'in-
tervalle [xo, Xn]
Nous avons vu au chapitre prcdent que la fonction f( x) peut tre conve-
nablement estime l'aide d'un polynme de degr n avec une certaine er-
reur. En termes concis:
f(x) = Pn(x) +En( x) (6.1)
294 Chapitre 6
o En(x) est le terme d'erreur d'ordre (n + 1) donn par la relation 5.21.
L'expression 6.1 est la base des dveloppements de ce chapitre.
6.2 Diffrentiation numrique
On peut aborder la diffrentiation numrique d'au moins deux faons.
La premire approche consiste utiliser le dveloppement de Taylor et la
seconde est fonde sur l'galit 6.1. Nous utiliserons un mlange des deux
approches, ce qui nous permettra d'avoir un portrait assez complet de la
situation.
Commenons d'abord par l'quation 6.1. Si on drive de chaque ct de
l'galit, on obtient successivement:
!'(x)
J"( x)
!"'(x)
p ~ (x) + ~ (x)
p ~ ( x ) + ~ ( x )
p ~ (x) + ~ (x)
(6.2)
Ainsi, pour valuer la drive d'une fonction connue aux points ((xi, f(xi))
pour i = 0, 1, 2, , n ), il suffit de driver le polynme d'interpolation passant
par ces points. De plus, le terme d'erreur associ cette approximation de la
drive est tout simplement la drive de l'erreur d'interpolation. Ce rsultat
est vrai quel que soit l'ordre de la drive.
Remarque 6.1
Bien qu'en thorie on soit en mesure d'estimer les drives de tout ordre, sur
le plan pratique, on dpasse rarement l'ordre 4. Cela s'explique par le fait
que la diffrentiation numrique est un procd numriquement instable. 0
6.2.1 Drives d'ordre 1
Commenons par faire l'approximation des drives d'ordre 1, ce qui re-
vient valuer la pente de la fonction f( x). Tout comme pour l'interpolation,
nous avons le choix entre plusieurs polynmes de degr plus ou moins lev.
De ce choix dpendent l'ordre et la prcision de l'approximation. Nous avons
rencontr un problme semblable dans le cas de l'interpolation: si un poly-
nme de degr n est utilis, on obtient une approximation d'ordre (n + 1)
de la fonction f(x) (voir la relation 5.25).
Diffrentiation et intgration numriques 295
n est galement utile de se rappeler que l'erreur d'interpolation s'crit:
J(n+l)( ( X))
En(x)= ( )' [(x-xo)(x-xt)(x-xn)] (6.3)
n+ 1.
pour un certain compris dans l'intervalle [xo, Xn] En drivant cette expres-
sion, tout en tenant compte de la dpendance de envers x, on obtient:
=
j(n+2)((x))'(x)
(n+
1
)! [(x-xo)(x-xt)(x-xn)]
+ j(n+l)((x))[(x- xo)(x- Xt) (x- x )]'
(n+1)! n
La drive du produit apparaissant dans le deuxime terme de droite est
plus dlicate. Cette drive dbouche sur une somme de produits o, tour
tour, l'un des facteurs (x- Xi) est manquant. ll est facile de se convaincre,
en reprenant ce dveloppement avec n = 2 par exemple, que l'on obtient:
=
j(n+2)(( X) )'( X)

xo)(x- Xt) (x- Xn)]


j(n+l)((x)) ( n n )
+ ' L II (x-xj)
( n +
1
). k=O j=O(j#)
(6.4)
On peut simplifier cette expression quelque peu complexe en choisissant l'un
ou l'autre des points d'interpolation. En effet, en x = Xi, le premier terme de
droite s'annule, faisant disparatre la drive de ( x), qui est inconnue. De
la somme, il ne reste qu'un seul terme puisque tous les autres contiennent
un facteur (x- Xi) et s'annulent. fl reste:
Si on suppose de plus que les Xi sont galement distancs, c'est--dire:
ce qui signifie que Xi- Xj = (i- j)h, on obtient:
(6.5)
296
Chapitre 6
o i est simplement une notation diffrente de (xi) En particulier, si i = 0,
on trouve:

c'est--dire:
=
( -1)nhn j(n+l)(o)
(n + 1)
pour un certain o compris dans l'intervalle [xo, Xn]
Remarque 6.2
(6.6)
L'quation 6.5 montre que si on utilise un polynme d'interpolation de
degr n (c'est--dire d'ordre (n + 1)) la drive de ce polynme value en
x= Xi est une approximation d'ordre n de f'(xi) D
Dfinition 6.1
Aux points d'interpolation, on a:
(6.7)
Le terme dans l'quation 6.7 est une formule aux diffrences finies
ou plus simplement une formule aux diffrences. Nous proposons plus loin
plusieurs formules aux diffrences finies pour valuer les diffrentes dri-
ves de f( x). Elles se distinguent principalement par le degr du polynme
et par les points d'interpolation retenus.
Exemple 6.1
Si on choisit le polynme de degr 1 passant par les points ( x
0
, f( x
0
)) et
(xt, f(x
1
)), on a, grce la formule d'interpolation de Newton:
Pt(x) = f(xo) + f[xo, Xt](x- xo)
et donc:
J'( x)= + = f[xo, Xt] + (6.8)
Diffrentiation et intgration numriques 297
En vertu de la relation 6.6 avec n = 1 et puisque ( x
1
- x
0
) = h, on arrive :
qui peut encore s'crire:
!
'( ) f(xt)- f(xo) hf(
2
)(o) c E [ ]
xo = h -
2
pour x0, x1
(6.9)
qui est la diffrence avant d'ordre 1. On l'appelle diffrence avant car, pour
valuer la drive en x = x
0
, on cherche de l'information vers l'avant (en
X= Xt)
De la mme manire, si on value l'quation 6.8 en x = Xt, la relation 6.5
avec ( i = 1) donne:
f(xt)- f(xo) +
Xt- Xo
f(xt)-f(xo) + h
1
f(
2
:(6) ( TI (
1
-j))
h 2. j=O(#l)
ou encore:
f'(x
1
) = f(xt) f(xo) +

pour 6 E [xo, Xt]


qui est la diffrence arrire d'ordre 1 .

Remarque 6.3
(6.10)
L'exemple prcdent montre que la mme diffrence divise est une approxi-
mation de la drive la fois en x = x
0
et en x = x
1
. On remarque cependant
que le terme d'erreur est diffrent aux deux endroits. D
Exemple 6.2
Passons maintenant aux polynmes de degr 2. Soit les points ( x
0
, f( xo) ),
(xt, f(x
1
)) et (x
2
, j(x2)). Le polynme de degr 2 passant par ces trois points
est:
P2(x) = f(xo) + f[xo, Xt](x- xo) + f[xo, Xt, x2](x- xo)(x- xt)
298
Chapitre 6
dont la drive est:
Lorsque x prend successivement les valeurs x
0
, x
1
et x2, il est facile de
montrer que l'on obtient des approximations d'ordre 2 de la drive.
!'( xo)
-
- j(x2) + 4f(xt)- 3f(xo) h
2
f"'(o)
-
2h + 3
Diffrence avant d'ordre 2
J'( xt)
-
j(x2)- f(xo)
-
h
2
!"'(6)
-
2h 6
Diffrence centre d'ordre 2
J'( x2)
-
3f(x2)- 4f(xt) + f(xo) h
2
!"'(6)
-
2h + 3
Diffrence arrire d'ordre 2

Remarque 6.4
Les termes d'erreur de ces formules aux diffrences finies dcoulent tous de
la relation 6.5 lorsqu'on pose successivement i = 0, 1 et 2. Pour i = 0, on
peut utiliser directement l'quation 6.6. Les points o, 6 et 6 sont situs
quelque part dans l'intervalle [ x
0
, x
2
] et sont inconnus (voir les exercices de
fin de chapitre). D
Remarque 6.5
Toutes ces formules aux diffrences sont d'ordre 2. Les mentions avant, cen-
tre et arrire renvoient au point o on calcule la drive et aux points utiliss
pour la calculer. Ainsi, la diffrence avant est value en x
0
sur la base des
valeurs situes vers l'avant, soit en x
1
et en x
2
La diffrence arrire fixe la
drive en x = x
2
avec l'appui des valeurs de la fonction en xo et en x1. La
diffrence centre, quant elle, fait intervenir des valeurs situes de part et
d'autre de Xt
Diffrentiation et intgration numriques
Diffrence avant d'ordre 2
f'(x r)
Diffrence centre d'ordre 2
Jl(x) ',, ___ #J'lx,!
',
Diffrence arrire
d'ordre 1
f'(x 1)
---
'
'
'
Diffrence avant
d'ordre 1
f'(x 1)
299
Diffrence arrire d'ordre 2
f'(x z)
'
'
'
'
'
'
Figure 6.1: Interprtation gomtrique des formules aux diffrences
La figure 6.1 illustre les diffrentes possibilits. Pour les diffrences
d'ordre 1, on estime la drive par la pente du segment de droite joignant
les points (x
0
, f(x
0
)) et (x
11
f(x
1
)). Dans le cas des diffrences d'ordre 2, on
dtermine un polynme de degr 2 dont la pente en x
0
, en x
1
et en x2 donne
respectivement les diffrences avant, centre et arrire. D
On peut aussi convenir de toujours valuer la drive en x. Dans ce cas,
on utilise les valeurs de f( x + h) et de f( x + 2h) pour la diffrence avant et
les valeurs de f( x + h) et de f( x - h) pour la diffrence centre. En ce qui
concerne le terme d'erreur, on ne retient que son ordre. Le tableau suivant
rsume la situation.
300 Chapitre 6
f'(x)
-
f(x + ~ - f(x) + O(h)
-
Diffrence avant d'ordre 1
f'(x)
-
f(x)- ~ x - h) + O(h)
-
Diffrence arrire d'ordre 1
!'(x)
-
-f(x+2h)+4f(x+h)-3f(x) O(h2)
-
2h +
(6.11)
Diffrence avant d'ordre 2
f'(x)
-
f(x + h)- f(x- h) O(h
2
)
-
2h +
Diffrence centre d'ordre 2
J'(x)
-
3f(x)- 4f(x- h) + f(x- 2h) O(h2)
-
2h +
Diffrence arrire d'ordre 2
Exemple 6.3
On tente d'valuer la drive de f(x) =ex en x= O. La solution exacte est
dans ce cas f'(O) = e
0
= 1. On peut ds lors comparer ce rsultat avec ceux
que l'on obtient par les diffrentes formules aux diffrences. Par exemple, la
diffrence avant d'ordre 1 donne pour h = 0,1:
eO+h _ eo eo,t _
1
J'(O) ~ h = 0,
1
= 1,051 70918
Diffrentiation et intgration numriques 301
Une valeur plus petite de h conduit un rsultat plus prcis. Ainsi,
si h = 0,05:
eo,o5 _ 1
j'(O) = 1,025 4219
0,05
On obtient ainsi une erreur peu prs deux fois plus petite, ce qui confirme
que cette approximation est d'ordre 1. Si on utilise cette fois une diffrence
centre d'ordre 2, on obtient avec h = 0,05:
eo,o5 _ e-o,o5
!'(0) 2(0,05) = 1,000 4167
qui est un rsultat beaucoup plus prcis. Avec h = 0,025, on obtient:
e0,025 _ e-0,025
f'(O)
2
(
0
,
025
) = 1,000 10418
soit une erreur peu prs 4 fois plus petite qu'avec h = 0,05. On obtiendrait
des rsultats similaires avec les diffrences avant et arrire d'ordre 2 .

6.2.2 Drives d'ordre suprieur
Avec les drives d'ordre suprieur, on agit peu prs de la mme ma-
nire qu'avec les drives d'ordre 1, c'est--dire que l'on drive un polynme
d'interpolation aussi souvent que ncessaire. Les drives d'ordre suprieur
posent toutefois une difficult supplmentaire, qui provient principalement
de l'analyse d'erreur. En effet, driver plusieurs fois le terme d'erreur 5.21 est
long et fastidieux. Nous prfrons suivre une approche lgrement diffrente
base sur le dveloppement de Taylor.
Reprenons le polynme de degr 2 dj utilis pour calculer la drive
premire. Ce polynme s'crit:
et sa drive seconde est:
"( ) _
2
![ ]- f(x2)- 2f(xt) + f(xo)
p
2
x - xo, Xt, x2 - h
2
(6.12)
qui constitue une approximation de la drive seconde J"( x) partout dans
l'intervalle [xo, x
2
]. ll reste en dterminer l'ordre. Cet ordre dpend du
point retenu pour l'approximation.
302 Chapitre 6
Premier cas: On fait l'approximation de la drive en x
0

L'quation 6.12 peut alors s'crire:
!
"( ) "( ) f(xo+2h) 2f(xo+h)+f(xo)
xo ~ P2 xo = .:........::...----'-----'-::-h-;:-2----'----..:...-'----'-
On remarque immdiatement qu'il s'agit d'une formule aux diffrences
avant. Pour dterminer l'ordre de l'erreur lie cette approximation,
on utilise le dveloppement de Taylor 1.24. Dans un premier temps,
on a:
f(xo+2h)
!
"'( ) !""( )
+ ~ o (2h? + 4to (2h)4 + ...
et de mme:
f(xo + h)
f
111
(x ) f""(xo) 4
+ 0 h3 + h + ...
3! 4!
On parvient alors :
f(xo + 2h)- 2f(xo + h) + f(xo)
h2
f"(xo)h
2
+ !
111
(xo)h
3
+ O(h
4
)
h2
J"(xo) + f'"(xo)h + O(h
2
)
f"(xo) + O(h)
Cette diffrence avant est donc une approximation d'ordre 1 de la dri-
ve seconde. C'est cette approximation que l'on a utilise pour valuer
l'erreur d'interpolation 5.21 l'aide de la formule 5.22 au chapitre
prcdent.
Deuxime cas: On fait l'approximation de la drive en x
1

L'quation 6.12 peut alors s'crire:
!
"( ) ,...., "( ) _ !(xl+ h)- 2f(xl) + j(x1- h)
Xl - P2 Xl - h2
Diffrentiation et intgration numriques 303
qui est une diffrence centre. Pour en dterminer l'ordre, on fait appel,
comme dans le cas prcdent, aux dveloppements de Taylor, mais
cette fois autour de x
1
On a:
!
"'(x ) f""(x )
+ 1 h3 + 1 h4 + ...
3! 4!
En remplaant h par ( -h ), on obtient galement:
!
"'(x ) f""(x )
- 1 h3 + 1 h4 + ...
3! 4!
Une fois combines, ces deux relations deviennent:
j(x1 + h)- 2f(xl) + f(xl- h)
h2
J"(x
1
)h
2
+ h

+ O(h
6
)
h2
c'est--dire une approximation d'ordre 2 de la drive.
Troisime cas: On fait l'approximation de la drive en x
2

En reprenant un raisonnement similaire celui du premier cas, on
pourrait montrer que la relation 6.12 est une approximation d'ordre 1
de la drive seconde en x = x
2

Remarque 6.6
TI peut sembler surprenant de constater que la mme quation aux diff-
rences, obtenue partir d'un polynme de degr 2, soit d'ordre 1 en x= x
0
et en x= x2 et soit d'ordre 2 en x= x1. Cela s'explique par la symtrie des
diffrences centres, qui permet de gagner un ordre de prcision. D
304 Chapitre 6
On peut obtenir toute une srie de formules aux diffrences finies en
utilisant des polynmes de degr plus ou moins lev et en choisissant les
dveloppements de Taylor appropris pour en obtenir l'ordre de convergence.
Le tableau suivant prsente les principales d'entres elles.
J"( x)
-
f(x- 2h)- 2f(x- h) + f(x) O(h)
-
h2 +
Diffrence arrire d'ordre 1
J"(x)
-
f(x + 2h)- 2f(x + h) + f(x) O(h)
-
h2 +
Diffrence avant d'ordre 1
J"( x)
-
f(x + h)- 2f(x) + f(x- h) O(h2)
-
h2 + (6.13)
Diffrence centre d'ordre 2
J"(x)
-
- f(x-2h) + 0( h4)
-
Diffrence centre d'ordre 4
J''"(x) -
f(x+2h)-4f(x+h)+6{\x)-4f(x-h)+f(x-2h) + O(h4)
-
Diffrence centre d'ordre 4
Pour terminer, nous dmontrons que la diffrentiation est un procd
numriquement instable. Toutes les formules de diffrences finies dpendent
d'un paramtre h qui est la distance entre les points d'interpolation. On
pourrait croire, de faon intuitive, que la prcision du rsultat augmente
mesure que diminue la valeur de h. Dans le cas de la diffrentiation num-
rique, il y a une limite aux valeurs de h qui peuvent tre utilises. En effet,
si on prend, par exemple, une diffrence centre pour estimer la drive pre-
mire, c'est--dire:
!
'( )""f(xo+h)-f(xo-h)
xo - 2h
on constate que lorsque h tend vers 0 le numrateur contient la soustraction
de deux termes trs proches l'un de l'autre. Cela rsulte en l'limination par
Diffrentiation et intgration numriques 305
soustraction (voir la section 1.5.2) de plusieurs chiffres significatifs lorsque
h est trop petit. quoi s'ajoute une division par un nombre trs petit.
L'exemple suivant illustre ce phnomne.
Exemple 6.4
On considre les diffrences centres d'ordre 2 pour le calcul des drives
premire et deuxime de la fonction f( x) = ex en x = O. Ces deux calculs,
qui doivent normalement aboutir 1, permettent d'apprcier la prcision
des rsultats. Le tableau suivant rassemble les rsultats en simple prci-
sion (IEEE), ce qui correspond peu prs travailler avec une mantisse de
7 chiffres dcimaux.
h
J'(x) f(x+h)
2
hf{x-h) J"( X) f(x-h)
0 1 x 10+
1
'
1,175 201178 1,086161137
0,1 X 10+
0
1,001667 619 1,000 839 4 72
0,1 x 10-
2
1,000 016 928 1,000 165 939
0,1 x 10-
3
1,000 017 047 1,013 279 080
0,1 x 10-
4
1,000 166 059 0,000 000 000
0,1 x 10-
5
1,001358151 0,000 000 000
0,1 x 10-
6
0,983 4 76 758 -59 604,660 16
La valeur de h est successivement rduite d'un facteur de 10 partir de
h = 1,0. On constate que lorsque h diminue la prcision lie aux drives
augmente dans un premier temps, puis se dgrade brusquement pour les
valeurs de h plus faibles. Cela est particulirement vident pour la drive
seconde (troisime colonne). Si on passe en double prcision (l'quivalent
de 14 chiffres dcimaux dans la mantisse), on observe un comportement
306 Chapitre 6
similaire, mais qui se produit des valeurs de h plus faibles.
h
J'( ) ,... f{x+h)- f{x-h)
x - 2h
J" ( ) ,...., f{x+h}-2f(x}+ f{x-h}
x - h'2
0,1 X 10+UI
1,175 201193 643 80138 1,086 161 269 630 487 42
0 1 x 10-00
'
1,001 667 500 198 440 97 1,000 833 611160 722 78
0 1 x 10-
01
'
1,000 016 666 749 99212 1,000 008 333 360 558 05
0 1 x 10-
02
'
1,000 000 166 666 68134 1,000 000 083 406 504 81
0 1 x 10-
03
'
1,000 000 001666 889 74 1,000 000 005 024 759 28
0 1 x 10-
04
'
1,000 000 000 012102 32 0,999 998 972 517 346 26
0,1 x 10-
05
0,999 977 878 279 878 16
0 1 x 10-
06
'
0,999 999 999 473 643 93 0,999 200 722162 640 44
0 1 x 10-
07
'
0,000 000 000 000 000 00
0 1 x 10-
08
'
1,000 000 027 229 219 55 111,022 302 462 515 597
0,1 x 10-
09
1,000 000 082 740 370 78 0,000 000 000 000 000 00
0 1 x 10-
10
'
0,000 000 000 000 000 00
0,1 x 10-
11
1,000 033 389 431109 53 111 022 302,462 515 622
0 1 x 10-
12
'
0,999 755 833 67 4 953 35 -11102 230 246,2515621
0,1 x 10-
13
0,000 000 000 000 000 000
0 1 x 10-
14
'
1,054 711 873 393 898 71 111 022 302 462 515,641
0 1 x 10-
15
'
0,555111 512 312 57815 -11102 230 246 251564,0
0 1 x 10-
16
'
0,000 000 000 000 000 00
0,1 x 10-
17
0,000 000 000 000 000 00 0,000 000 000 000 000 00
0,1 x 10-
18
0,000 000 000 000 000 00 0,000 000 000 000 000 00
Lorsque h est trop petit, l'limination par soustraction des chiffres signi-
ficatifs a un impact dvastateur sur la prcision des rsultats. n est donc
recommand d'tre trs prudent dans le choix de h et d'viter des valeurs
trop petites.

6.3 Extrapolation de Richardson
La mthode d'extrapolation de Richardson est valable non seulement pour
la diffrentiation et l'intgration numriques, mais aussi pour l'interpolation,
la rsolution numrique des quations diffrentielles, etc. Cette technique
permet d'augmenter la prcision d'une mthode d'approximation par une
technique d'extrapolation que nous dcrivons dans cette section.
Diffrentiation et intgration numriques 307
Prenons comme point de dpart une approximation numenque, note
Qapp(h), d'une certaine quantit exacte Qexa inconnue. L'approximation nu-
mrique dpend d'un paramtre h, comme c'est souvent le cas. Gnrale-
ment, plus h est petit, plus l'approximation est prcise. On suppose de plus
que cette approximation est d'ordre n, c'est--dire:
La notation O(hn) signifie en fait que l'on a:
Qexa = Qapp(h) + Cnhn + Cn+lhn+l + Cn+2hn+
2
+ (6.14)
o les constantes Cn dpendent de la mthode numrique utilise. La tech-
nique d'extrapolation de Richardson consiste obtenir, partir de l'approxi-
mation 6.14 d'ordre n, une nouvelle approximation d'ordre au moins (n+1).
Pour ce faire, il suffit de remplacer h par h/2 dans l'quation 6.14, ce qui
conduit la relation:
Q
_ Q (h) (h)n (h)n+l (h)n+2
exa - app 2 + Cn 2 + Cn+l 2 + Cn+2 2 +
(6.15)
L'approximation Qapp(h/2) est gnralement plus prcise que Qapp(h). On
peut cependant se servir de ces deux approximations pour en obtenir une
nouvelle, encore plus prcise. L'ide consiste combiner les relations 6.14 et
6.15 de telle sorte que le terme d'ordre n ( cnhn) disparaisse. Cela est possible
si on multiplie l'quation 6.15 par 2n pour obtenir:
h hn+l hn+2
2nQexa = 2nQapp( 2) + Cnhn + Cn+l(-
2
-) + Cn+2( 22) +
En soustrayant l'nonc 6.14 de cette dernire relation, on obtient:
d'o:
qui s'crit plus simplement:
308 Chapitre 6
L'expression de droite est donc une approximation d'ordre au moins
( n + 1) de Qexa L'extrapolation de Richardson permet donc de gagner au
moins un ordre de convergence. En fait, on peut en gagner davantage si, par
exemple, on a Cn+l = 0 ds le dpart. Dans ce cas, la nouvelle approxima-
tion est d'ordre ( n + 2). Cette situation ~ ~ r o u i t frquemment, notamment
avec les diffrences centres et la mthode d'intgration dite des trapzes que
nous verrons plus loin.
Exemple 6.5
On a vu qu'en utilisant une diffrence avant d'ordre 1 pour calculer la drive
de ex en x = 0 on obtient:
pour h = 0,1 et:
eo,l- 1
--= 1,05170918 = Qapp(0,1)
0,1
e0,05 _
1
J'(O) ~ O
05
= 1,025 4219 = Qapp(0,05)
'
pour h = 0,05. On peut maintenant faire le calcul l'aide de l'quation 6.16
avec n = 1:
f'(O) ""
2
1
Qapp(0,05)- Qapp(0,1)
2
1
- 1
(2)(1,0254219)-1,05170918= 0,99913462
qui est une approximation d'ordre 2 et donc plus prcise de f'(O). De mme,
si on utilise une diffrence centre d'ordre 2, on obtient pour h = 0,05:
eo,o5 _ e-o,o5
f'(O) ~
2
(0,0
5
) = 1,000 4167
et avec h = 0,025:
eo,o25 _ e-0,025
f'(O) ~
2
(
0
,
025
) = 1,00010418
Dans ce cas, l'extrapolation de Richardson permet de gagner 2 ordres de
prcision puisque seules les puissances paires de h apparaissent dans le terme
Diffrentiation et intgration numriques 309
d'erreur (voir les exercices de fin de chapitre). Plus prcisment, on a:
f(x+h)-f(x-h) , f"'(x)h
2
j(
5
)(x)h
4
6
2h =f(x)+ 3! + 5! +O(h)
La diffrence centre tant d'ordre 2, l'extrapolation de Richardson avec
n = 2 donne:
f'(O) ""
2
2
Qapv(0,025)- Qapp(0,05)
2
2
- 1
(4)(1,00010418)-1,0004167 100 0
3 = ' 0 000 07
qui est une approximation d'ordre 4 de la solution exacte .

Remarque 6.7
Des exemples prcdents, on conclut qu'il vaut mieux viter d'utiliser des
valeurs de h trs petites pour calculer une drive l'aide d'une formule de
diffrences finies. TI est en effet prfrable de choisir une valeur de h pas trop
petite et de faire des extrapolations de Richardson. D
6.4 Intgration numrique
L'intgration numrique est base principalement sur la relation:
1
xn J(x)dx = lxn Pn(x)dx + 1xn En(x)dx
xo xo xo
(6.17)
o Pn(x) est un polynme d'interpolation et En(x) est l'erreur qui y est
associe. En faisant varier la valeur de n, on obtient les formules de Newton-
Cotes. En principe, plus n est lev et plus grande est la prcision lie
la valeur de l'intgrale recherche. En pratique cependant, les numriciens
emploient des valeurs de n infrieures ou gales 5.
Par ailleurs, l'extrapolation de Richardson, allie judicieusement l'une
des formules de Newton-Cotes, conduit la mthode de Romberg, l'une des
techniques d'intgration numrique les plus prcises. Enfin, nous traitons des
quadratures de Gauss, trs frquemment utilises dans les mthodes num-
riques plus avances comme celle des lments finis (voir Reddy, rf. [24]).
310 Chapitre 6
Figure 6.2: Mthode du trapze
6.4.1 Formules de Newton-Cotes simples et composes
Mthode des trapzes
Commenons par la mthode la plus simple. On souhaite valuer:
1
x
1
f(x)dx
xo
o f( x) est une fonction connue seulement en deux points ou encore une
fonction n'ayant pas de primitive. La solution qui vient tout de suite l'esprit
consiste remplacer f( x) par le polynme de degr 1 passant par les points
(xo,J(xo)) et (xb f(xi)) comme l'illustre la figure 6.2.
La valeur approximative de l'intgrale correspond l'aire sous la courbe
du polynme. Cette aire forme un trapze qui donne son nom la mthode
du trapze. videmment, l'approximation est grossire et on peut d'ores et
dj souponner que le rsultat sera peu prcis. Le polynme de Newton 5.6
Diffrentiation et intgration numriques 311
et la relation 5.21 conduisent :
1
Xl
f(x)dx =
xo
1
Xl 1Xl
Pl(x)dx + E1(x)dx
xo xo
1
Xl
{f(xo) + f[xo, x1](x- xo)}dx
xo
fx1 J"((x))
+ lxo
21
(x- xo)(x- x1)dx
ce qui peut galement s'crire, si on intgre le polynme:
1
Xl
f(x )dx =
xo
(6.18)
l
xl J"(( x))
+
1
(x- xo)(x- x1)dx
xo 2.
Le premier terme de droite n'est rien d'autre que l'aire du trapze de la
figure 6.2, tandis que le deuxime terme est l'erreur commise. Le changement
de variable 5.24 permet d'crire:
x- x
0
s=
h
d'o l'on tire que (x- Xi) = (s- i)h et que dx = hds. Le terme d'erreur
devient alors:
On peut encore simplifier cette expression en faisant appel au second
thorme de la moyenne.
Thorme 6.1
Soit JI(x), une fonction continue dans l'intervalle [a, b] et h(x), une
fonction intgrable qui ne change pas de signe dans l'intervalle [a, b]. n existe
alors rtE [a, b] tel que:
1b JI(x)h(x)dx = h(rt) lb h(x)dx
0 (6.19)
312 Chapitre 6
Comme la fonction ( s( s - 1)) ne change pas de signe dans [0, 1], on peut
mettre profit ce thorme, ce qui donne:
La mthode du trapze se rsume donc l'galit:
(6.20)
La mthode du trapze demeure peu prcise, comme en tmoigne l'exemple
suivant.
Exemple 6.6
n s'agit d'valuer numriquement:
f o ~ sinxdx
dont la valeur exacte est 1. La mthode du trapze donne dans ce cas:
f ~ sinxdx ~ ~ (sinO +sin
2
= ~ = 0,785 398164
Jo 2 4
qui est une pitre approximation de la valeur exacte 1.

Ce rsultat peu impressionnant vient du fait que l'on approche la fonc-
tion sin x dans l'intervalle [0, ~ ] au moyen d'un polynme de degr 1. Cette
approximation est assez mdiocre, comme en tmoigne la figure 6.3.
Une stratgie intressante consiste dcomposer l'intervalle o l'on doit
faire l'intgration, soit l'intervalle [a, b], en n sous-intervalles de longueur
(voir la figure 6.4):
b-a
h=--
n
( 6.21)
Les diffrents points engendrs sont nots Xi pour i = 0, 1, 2, , n. Les
valeurs aux extrmits sont a = x
0
et b = Xn. Dans chaque sous-intervalle
[xi, Xi+
1
], on peut utiliser la mthode du trapze. On a alors:
Diffrentiation et intgration numriques 313
TC/2
Figure 6.3: Mthode du trapze, f( x) = sin x
f(x)
x
Figure 6.4: Mthode des trapzes compose
314 Chapitre 6
1b f(x)dx
h
2 ([f(xo) + J(x1)] + [j(x1) + j(x2)] +
+ [f(xn-2) + f(xn-1)] + [f(xn-1) + f(xn)])
On remarque que tous les termes f( Xi) sont rpts deux fois, sauf le premier
et le dernier. On en conclut que:
l
b h
a f(x)dx 2 (f(xo) + 2 [f(xl) + j(x2) + + f(xn-d] + f(xn)) (6.22)
qui est la formule des trapzes compose. Qu'en est-il du terme d'erreur?
Dans chacun des n sous-intervalles [xi, Xi+
1
], on commet une erreur lie la
mthode du trapze. Puisque:
h = ( b - a) et donc n = ( b - a)
n h
l'erreur totale commise est:
(
- f"(1J) h3) =_(b-a) f"(1J\ 3 =_(b-a)!"( )h2
n 12 h 12 12 1J
Remarque 6.8
Le raisonnement prcdent n'est pas parfaitement rigoureux, mme si le
rsultat final est juste. En effet, dans chaque sous-intervalle [xi, Xi+
1
], l'erreur
lie la mthode du trapze simple devrait faire intervenir J"( 1Ji), c'est--dire
une valeur de 1J diffrente pour chaque sous-intervalle. Un autre thorme de
la moyenne est alors ncessaire pour conclure (voir Burden et Faires, rf. [2]).
L'erreur globale tant donne par:
(b-a)
-
12
f
11
(1J)h
2
pour 1J E [a, b] (6.23)
la mthode des trapzes compose est d'ordre 2. D
Diffrentiation et intgration numriques 315
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 1t/8 1t/4 3 1t/8 1t/2
Figure 6.5: Mthode des trapzes compose, f(x) =sin x (4 intervalles)
Exemple 6.7
On reprend le calcul de:
fo'i sin xdx
mais cette fois l'aide de la mthode des trapzes compose. Soit d'abord
4 intervalles de longueur:
(2I-O) 7r
h = 2 =-
4 8
tels que les montre la figure 6.5. On a alors:
{ 'i i ( . 0 2[ . 7r . 7r . 37r] . 7r)
Jo sin xdx ~
2
sm + sm S + sm
4
+ sm S + sm
2
0,9871158
soit une erreur b s o l ~ e d'environ 0,012 88 par rapport la solution exacte.
On constate une nette amlioration en comparaison du rsultat obtenu avec
316 Chapitre 6
un seul intervalle. ll est intressant de refaire ce calcul avec 8 intervalles (voir
la figure 6.6). La valeur de h est maintenant t
6
et on a:
fo"i sin xdx
" t6 (
0
0 2[
0
7r 1f 0 37r
2
sm + sm
16
+ sin S + sm l6
0 7r 0 57r 0 371" 0 77rl 0 7r)
+ sm - + sm - + sm + sm - + sm -
4 16 8 16 2
0,996 7852
L'erreur absolue a t rduite 0,0032. Cette erreur absolue est environ 4 fois
plus petite que l'erreur obtenue avec 4 intervalles, ce qui confirme que cette
mthode est d'ordre 2. On peut de plus utiliser l'extrapolation de Richardson
pour amliorer la prcision de ces deux rsultats. En utilisant l'quation 6.16
avec n = 2, on obtient l'approximation d'ordre au moins 3 suivante:
["i sin xdx 22(0,996 78522) 0,9871158 = 1,000 008 33
h 2 -
ce qui s'approche de plus en plus de la valeur exacte. Comme cela est d-
montr un peu plus loin, il s'agit en fait d'une approximation d'ordre 4 .

Remarque 6.9
La mthode du trapze avec un seul intervalle est galement connue sous le
nom de mthode des trapzes simple. 0
Remarque 6.10
La mthode des trapzes compose est d'ordre 2. La mthode des trapzes
simple, bien que d'ordre 3, est rarement utilise car elle est trop imprcise.
0
Remarque 6.11
La mthode des trapzes compose donne un rsultat exact si la fonction
f(x) est un polynme de degr infrieur ou gal 1. Cela s'explique par
la prsence de la drive seconde de f( x) dans le terme d'erreur: celle-ci
s'annule dans le cas de polynmes de degr 1. 0
Diffrentiation et intgration numriques 317
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 1t/16 1t/8 3 1t/16 1t/4 5 1t/16 3 1t/8 7 1t/16 1t/2
Figure 6.6: Mthode des trapzes compose, f(x) =sin x (8 intervalles)
Dfinition 6.2
Les formules d'intgration numrique sont galement appeles formules
de quadrature.
Dfinition 6.3
Le degr de prcision d'une formule de quadrature est la valeur maximale
de n pour laquelle cette formule de quadrature intgre exactement tout
polynme de degr infrieur ou gal n.
Remarque 6.12
Le degr de prcision de la formule des trapzes est 1. D
318 Chapitre 6
Formule de Simpson 1/3
Reprenons le raisonnement utilis avec la mthode des trapzes, mais
cette fois en utilisant un polynme de degr 2 dont la courbe passe par les
points (x
0
,J(xo)), (xb f(xt)) et (x2, j(x2)). Ce polynme est donn par la
formule de Newton:
On se sert ensuite de l'approximation:
1
X2 1X2
f(x)dx P2(x)dx
xo xo
1
X2
= {f(xo) + f[xo, x1](x- xo) + f[xo, X1, x2](x- xo)(x- x1)}dx
xo
On se place de nouveau dans le cas o les abscisses sont galement distan-
ces. On pose encore (x- x
0
)/h = s, ce qui entrane que (x- xi)= (s- i)h.
La dernire expression devient:
1
2
{(f(xo) + f[xo, x1]hs + f[xo, X1, x2]h
2
s(s- 1))}hds
h
= 3(f(xo) + 4f(xl) + j(x2))
o on a remplac les diffrences divises par leur valeur respective:
![
]
_ f(xl)- f(xo)
Xo, Xl - h
En rsum, on a:
qui est la formule de Simpson 1/3 simple. Cette terminologie est due au
facteur de 1/3 qui multiplie h.
L'analyse de l'erreur est plus dlicate dans ce cas. Les numriciens se sont
vite rendu compte que cette mthode tait plus prcise qu'ils ne l'escomp-
taient. Une analyse plus fine est donc ncessaire. Cette mthode est base
Diffrentiation et intgration numriques 319
sur l'utilisation d'un polynme de degr 2 et on devrait s'attendre ce que
l'erreur soit donne par:
On peut pousser plus loin l'analyse de l'erreur en introduisant un quatrime
point (x3, j(x3)) quelconque et le polynme de degr 3 correspondant:
qui n'est rien d'autre que le polynme de degr 2 dj utilis auquel on ajoute
une correction de degr 3 permettant au polynme de passer galement par
le point (x3, j(x3)). Or:
1
X2 12
(x- x
0
)(x- x
1
)(x- x
2
)dx = s(s- 1)(s- 2)h
4
ds = 0
xo 0
comme on peut le vrifier facilement. Il s'ensuit que:
En utilisant un polynme de degr 2, on obtient en fait la mme prcision
qu'avec un polynme de degr 3. Le terme d'erreur est donc de ce fait:
n n'est pas possible ce stade-ci d'appliquer le thorme de la moyenne,
comme nous l'avons fait pour la mthode du trapze. En effet, la fonction
(x-x
0
)(x-x
1
)(x-x2)(x-x
3
) peut changer de signe dans l'intervalle [xo, x
2
],
moins de choisir judicieusement x
3
Comme le choix de x
3
est arbitraire,
on peut poser x
3
= x
1
Le terme d'erreur devient alors:
1
X2 1X2 " " ( ~ )
E
3
(x)dx = --
1
-(x- xo)(x- x1)(x- x2)(x- x1)dx
xo xo 4.
{
2
" " ( ~ ) s(s- 1)
2
(s- 2)h
5
ds
Jo 4!
On remarque que la fonction s( s - 1 )
2
( s - 2) ne change pas de signe dans
l'intervalle [0, 2]. La figure 6.7 illustre cette fonction.
320 Chapitre 6
-0,05
-0,10
-0,15
-0,20
-0,25
0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0
Figure 6. 7: Fonction s( s - 1 )
2
( s 2)
On peut maintenant se servir du thorme de la moyenne pour obtenir:
1
X2 !""(1J) 12 f""(1J)
E3(x)dx =
1
h
5
s(s- 1)
2
(s- 2)ds =- h
5
xo 4. 0 90
La mthode de Simpson 1/3 simple se rsume donc :
o 1J E [xo, x2].
Remarque 6.13
(6.24)
La valeur de h exprime toujours la distance entre les points Xi, c'est--dire
qu'elle quivaut dans ce cas la longueur de l'intervalle divise par 2. D
La mthode de Simpson 1/3 simple est peu prcise, tout comme la m-
thode du trapze, comme en tmoigne l'exemple suivant.
Diffrentiation et intgration numriques 321
f(x)
X 4 X 2n-4 X 2n-3 X 2n-2 X 2n-! X 2n = b X
Figure 6.8: Mthode de Simpson 1/3 compose
Exemple 6.8
On reprend une fois de plus le calcul des exemples prcdents. Pour la fonc-
tion f( x) = sin x dans l'intervalle [0, ~ ] , on a:
2!: 1r
f
2
sin xdx ~
4
3
(sin 0 + 4 sin ~ + sin ~ = 1,002 2799
Jo 4 2
Ce rsultat est plus prcis que l'approximation obtenue par la mthode du
trapze simple, mais il demeure peu satisfaisant .

On peut encore une fois amliorer la prcision de la formule de Simpson
1/3 en la composant. Puisque la mthode simple requiert deux intervalles,
il semble souhaitable de diviser l'intervalle d'intgration [a, b] en 2n sous-
intervalles et d'utiliser la mthode de Simpson 1/3 simple dans chaque paire
de sous-intervalles. La figure 6.8 illustre cette approche. On a alors:
322 Chapitre 6
1b f(x )dx
h
3((/(xo) + 4/(xt) + f(x2)) + (!(x2) + 4f(x3) + f(x4)) +
+ (!(x2n-4) + 4f(x2n-3) + f(x2n-2))
+ (f(x2n-2) + 4f(x2n-l) + f(x2n)))
h
3(!( xo) + 4/( x1) + 2/( x2) + 4/( x3) + 2/( x4) +
+ 4f(x2n-3) + 2(f(x2n-2) + 4f(x2n-l) + f(x2n))
Tous les termes de rang impair sont multiplis par 4 tandis que ceux de rang
pair sont multiplis par 2, saufle premier (!(x
0
)) et le dernier (!(x
2
n)).
L'analyse de l'erreur lie la mthode de Simpson 1/3 compose est simi-
laire celle qui s'applique la mthode des trapzes compose. En divisant
[a, b] en 2n intervalles, on utilise n fois la mthode de Simpson 1/3 simple et
on commet donc n fois l'erreur lie cette mthode. On a alors:
b-a b-a
h = et donc n = ----v;:
et l'erreur totale est:
Remarque 6.14
Le terme d'erreur de la mthode de Simpson 1/3 compose est:
( b - a) "" 4 . [ ]
-
180
f ( 17 )h pour un certam 1J E a, b (6.25)
ce qui en fait une mthode d'ordre 4. De plus, en raison de la prsence
de la drive quatrime de f( x), cette mthode est exacte dans le cas des
polynmes de degr 3. Le degr de prcision de cette mthode est donc 3. D
Diffrentiation et intgration numriques
Exemple 6.9
On divise l'intervalle [0, Il en 4 sous-intervalles de longueur h
alors:
l a ~ sin xdx
~ ( . 0 4 . 7r 2 . 7r 4 .
3
7r
3
sm + sm
8
+ sm 4" + sm S
+sin i) = 1,000 1346
323
~ n a
Pour une quantit de travail similaire, on obtient une prcision suprieure
celle de la mthode des trapzes. Avec 8 sous-intervalles de longueur ;
6
, on
a:
{ ~ .
Jo smxdx c::::
;6 ( . . 7r 2 . 7r 4 . 37r
"3 sm 0 + 4 sm
16
+ sm
8
+ sm l6
+sin i) = 1,000 008 296
Cette plus grande prcision vient du fait que cette mthode est d'ordre 4. On
constate qu'en passant de 4 8 intervalles (c'est--dire en divisant h par 2)
on divise l'erreur par un facteur d'environ 16,22, ce qui confirme l'ordre 4 de
la mthode. On peut galement utiliser l'extrapolation de Richardson 6.16
avec n = 4 partir de ces deux valeurs. On obtient ainsi l'approximation:
2
4
(1,000 008 296)- 1,0001346 = 0 999 999 876
2
4
- 1 '
qui est d'ordre au moins 5. On verra plus loin qu'elle est en fait d'ordre 6 .
Exemple 6.10
On doit calculer:

rl 2
Jo e-x dx
324 Chapitre 6
l'aide de la mthode de Simpson 1/3 compose avec 8 intervalles de lon-
gueur:
I- 0 1
8 8
Comme la fonction e-x
2
n'a pas de primitive, il faut absolument utiliser une
mthode numrique. Dans ce cas:
rl 2
Jo e-x dx
0,746 8261205
n est intressant de poursuivre les calculs un peu plus loin et de comparer
une fois de plus les mthodes des trapzes et de Simpson 1/3 composes.
En prenant 64 intervalles et en travaillant en double prcision (IEEE), on
obtient les valeurs suivantes.
Mthode des trapzes compose
Mthode de Simpson 1/3 compose
Solution exacte 9 chiffres
0,746 809163
0,746 824133
0,746 824133
ce qui dmontre la supriorit de la mthode de Simpson .

On peut poursuivre dans la mme voie et dvelopper des formules de
Newton-Cotes bases sur des polynmes de degr de plus en plus lev.
Nous ne prsentons ci-dessous que les formules de Simpson 3/8 et de Boole
sans les dmontrer.
Formule de Simpson 3/8
Si on utilise un polynme de degr 3 dans l'intervalle [x
0
, x
3
] et passant par
les points ((xi, !(xi)) pour i = 0, 1, 2, 3), on obtient la formule de Simpson
3/8 simple qui s'crit:
1
X3 3h 3/'"'('q)
f(x)dx = -(f(xo) + 3f(xt) + 3f(x2) + f(x3))- h
5
xo 8 80
(6.26)
pour un certain 1J E [xo, x3].
Diffrentiation et intgration numriques 325
On peut galement composer cette mthode en divisant l'intervalle d'in-
tgration [a, b] en 3n sous-intervalles de longueur:
b-a
h=--
3n
et en utilisant la formule de Simpson 3/8 simple dans chaque triplet de
sous-intervalles. On obtient alors:
n-l 3h
?= -g(f(x3i) + 3f(x3i+t) + 3f(x3i+2) + f(x3i+3))
~ = 0
3h
-gU(xo) + 3f(xt) + 3f(x2) + 2f(x3) + 3f(x4) +
+ 2f(x3n-3) + 3f(x3n-2) + 3f(x3n-d + f(x3n))
et le terme d'erreur:
(
- 3f""("l)h
5
) __ (b-a) 3/""("7)
5
__ (b-a)!""( 'fi)
4
n 80 - 3h 80 h - 80 h
Remarque 6.15
La mthode de Simpson 3/8 compose a le mme ordre de convergence ( 4)
et le mme degr de prcision (3) que la mthode de Simpson 1/3 compose.
Pour cette raison, on lui prfre souvent la mthode de Simpson 1/3. 0
Formule de Boole
Si on a au dpart un polynme de degr 4 dans l'intervalle [x
0
, x
4
] dont
la courbe passe par les points ( (Xi, f( Xi)) pour i = 0, 1, 2, 3, 4 ), la formule de
Boole simple s'crit:
1:
4
f(x)dx = ~ [7 f(xo) + 32/(xt) + 12f(x2) + 32f(x3) + 7 f(x4)]
8/(6)("7) 7
- h
945
(6.27)
326 Chapitre 6
pour un certain 1J E [xo, x4].
On compose cette mthode en divisant cette fois l'intervalle d'intgration
[a, b] en 4n sous-intervalles de longueur:
b-a
h=--
4n
et en utilisant la formule de Boole simple dans chaque quadruplet de sous-
intervalles. On obtient alors:
n-l 2h
?=
45
(7 /( X4i) + 32/( X4i+l) + 12/( X4i+2)
~ =
+ 32/(X4i+3) + 7 /(X4i+4))
2h
45
(7 /( Xo) + 32/( Xt) + 12/( X2) + 32/( X3) + 14/( x4) +
+ 32f(x4n-5) + 14/(X4n-4) + 32f(x4n-3) + 12/(X4n-2)
+ 32f(x4n-1) + 7 f(x4n))
et le terme d'erreur:
Remarque 6.16
En ce qui concerne l'erreur, il se produit un phnomne dj observ avec
la formule de Simpson 1/3 en ce sens que la formule de Boole conduit une
approximation d'ordre 6 au lieu de 5. La mthode de Boole a de plus un
degr de prcision de 5 puisqu'elle est exacte pour tous les polynmes de
degr infrieur ou gal 5. 0
Diffrentiation et intgration numriques 327
6.4.2 Mthode de Romberg
La mthode de Romberg est une mthode d'intgration qui permet d'at-
teindre des rsultats trs prcis. Elle est base sur une utilisation trs astu-
cieuse de la mthode des trapzes compose (d'ordre 2) et de la technique
d'extrapolation de Richardson 6.16. On peut en effet dmontrer, sous des
hypothses de rgularit suffisante de la fonction f(x), que le terme d'erreur
de la mthode des trapzes compose s'crit:
( b - a) !"( ) h2 h2 h4 h6
-
12
1J = C2 + C4 + C6 +
o les Ci sont des constantes. L'information supplmentaire que l'on tire de
cette relation est que seuls les termes d'ordre pair sont prsents. L'absence
des puissances impaires de h permet, du point de vue de l'extrapolation de
Richardson, de gagner deux ordres de convergence chaque extrapolation.
De plus, les valeurs extrapoles, qui sont d'ordre 4, peuvent leur tour tre
extrapoles pour passer l'ordre 6, et ainsi de suite. Cette utilisation syst-
matique de l'extrapolation de Richardson permet d'obtenir successivement
des approximations de:
1b f(x)dx
d'ordre 2, 4, 6, 8 et plus. Sur le plan pratique, on obtient gnralement des
rsultats extrmement prcis.
Dans un premier temps, introduisons quelques notations. On note T
1
,i
le rsultat obtenu l'aide de la mthode des trapzes compose avec 2i-l
intervalles. Les T
1
,i sont des approximations d'ordre 2. Pour passer de T
1
,i
Tt,i+l, on doit doubler le nombre de sous-intervalles, ce qui revient diviser
la valeur de h par deux. Au moyen de l'extrapolation de Richardson 6.16
avec n = 2, on dfinit alors:
(6.28)
328 Chapitre 6
et les T
2
,i sont des approximations d'ordre 4. On pose ensuite successivement:
(6.29)
ce qui dfinit un triangle de la forme:
T1,1 T1,2 Tt,3 Tt,4 Tt,s Tt,6
(ordre 2)
T2,1 T2,2 T2,3 T2,4 T2,s
(ordre 4)
T3,l T3,2 T3,3 T3,4
(ordre 6)
T4,l T4,2 T4,3
(ordre 8)
Ts,l Ts,2
(ordre 10)
T6,l
(ordre 12)
Chaque ligne de ce triangle est de deux ordres de convergence plus prcis
que la ligne prcdente. La premire ligne est tout simplement constitue
des approximations obtenues l'aide de la mthode des trapzes compose
avec 1, 2, 4, 8,16 intervalles. Pour passer d'une ligne l'autre, on utilise
l'extrapolation de Richardson par le biais des relations 6.28 et 6.29.
Remarque 6.17
On peut montrer (voir les exercices de fin de chapitre) que la deuxime ligne
de ce tableau n'est autre que le rsultat de la mthode de Simpson 1/3 avec
respectivement 2, 4, 8 intervalles. On pourrait donc liminer la premire
ligne et commencer directement avec la mthode de Simpson. D
Diffrentiation et intgration numriques 329
Exemple 6.11
On a dj obtenu, lors de calculs prcdents, les valeurs T
1
,
1
= 0,785 3982,
T1,
3
= 0,9871158 et T1,
4
= 0,996 7852 correspondant la formule des tra-
pzes compose avec respectivement 1, 4 et 8 intervalles pour valuer:
fo?f sin xdx
ll est alors possible de remplir la premire ligne du tableau en calculant:
Z 7r 7r
T
1
,
2
= (sm 0 + 2 sm
4
+ sin
2
) = 0,948 0594
On peut ensuite effectuer les diffrentes extrapolations de Richardson.
0, 785 3982 0,948 0594 0,987 1158 0,996 7852 (ordre 2)
1,002 2799 1,000 1346 1,000 0083 (ordre 4)
0,999 9916 0,999 9999 (ordre 6)
1,0000000 (ordre 8)
La premire ligne du tableau tant d'ordre 2, la deuxime ligne est donne
par:
(2
2
)(0,948 0594)- 0,785 3982 = 1 002 2 99
22- 1 ' 7
(2
2
)(0,9871158)- 0,948 0594 = 1 000 '34
22- 1 ' 1 6
(2
2
)(0,996 7852)- 0,987 1158 = 1 000 0083
2
2
- 1 '
qui sont toutes des approximations d'ordre 4. La troisime ligne devient
alors:
(2
4
)(1,000 1346)- 1,002 2799 = 0 999 991
24- 1 ' 6
(2
4
)(1,000 0083)- 1,0001346 = 0 999 9999
2
4
- 1 '
330 Chapitre 6
d'ordre 6. Puis enfin:
(2
6
)(0,999 9999)- 0,999 9916 = 1 000 0000
2
6
-1 '
ll en rsulte une approximation d'ordre 8 ayant plus de 7 chiffres significatifs.
On remarque que la prcision augmente mesure que l'on se dplace vers
le bas (car l'ordre de l'approximation augmente) et vers la droite sur une
mme ligne (car h est divis par 2 entre chaque valeur). 0

Exemple 6.12
Soit une fonction f(x) connue seulement pour quelques valeurs de x.
x f(x)
0,00 0,3989
0,25 0,3867
0,50 0,3521
0,75 0,3011
1,00 0,2420
On tente d'valuer:
fol f( x )dx
selon la mthode de Romberg. Puisqu'il y a en tout 5 points, on peut utiliser
la mthode des trapzes compose avec 1, 2 et 4 intervalles seulement. On a
respectivement:
T1,1 = ~ 0 , 3 9 8 9 + 0,2420) = 0,320 45
1
T1,2 ~ 0 , 3 9 8 9 + 2(0,3521) + 0,2420) = 0,336 275
1
Tt,3 t(0,3989 + 2(0,3867 + 0,3521 + 0,3011) + 0,2420)
= 0,3400875
Diffrentiation et intgration numriques 331
On peut ds lors remplir la premire ligne du tableau de la mthode de
Romberg.
0,32045 0,336 275 0,340 0875 (ordre 2)
0,34155 0,341 3583 (ordre 4)
0,3413456 (ordre 6)
Les autres lignes du tableau sont tires elles aussi des relations 6.28 et 6.29:
(2
2
)(0,336 275)- 0,320 45
22 - 1 = 0,341 55
(2
2
)(0,340 0875)- 0,336 275 = 0 3413583
2
2
- 1 '
(2
4
)(0,3413583)- 0,34155 = 0 3413456
2
4
-1 '
On obtient ainsi une approximation d'ordre 6 de l'intgrale .

Remarque 6.18
Dans le cas d'une fonction connue seulement en certains points, comme dans
l'exemple prcdent, le nombre de points doit tre de la forme 2n + 1 pour que
la mthode de Romberg puisse s'appliquer. En effet, il faut que le nombre de
sous-intervalles soit une puissance de 2. Dans l'exemple prcdent, on avait
2
2
+ 1 points et 4 intervalles. 0
6.4.3 Quadratures de Gauss
Les quadratures de Gauss reposent sur un raisonnement diffrent de ce-
lui qui est la base des mthodes de Newton-Cotes. D'une certaine faon,
on cherche optimiser les schmas d'intgration numrique en choisissant
plus judicieusement les points o est value la fonction f( x). Dans le cas
o l'valuation de f( x) est coteuse en temps de calcul, ces quadratures
permettent d'atteindre une grande prcision avec relativement peu d'valua-
tions de /(x). Par exemple, la mthode du trapze requiert l'valuation de
332 Chapitre 6
la fonction f( x) aux deux extrmits de l'intervalle sous la forme:
l
b (b-a)
f(x)dx'::::. (f(a)+f(b))
a 2
Nous avons vu que le degr de prcision de cette mthode est 1, car cette
quadrature est exacte dans le cas de tout polynme de degr infrieur ou
gal 1. On peut se demander s'il est possible de trouver deux points situs
dans l'intervalle d'intgration ainsi que des coefficients appropris de telle
sorte que l'expression:
ait un degr de prcision suprieur celui de la mthode du trapze. Bien
sr, si:
(b-a)
w1 = w2 =
2
, t1 = a et t
2
= b
on retrouve la formule du trapze. Mais est-ce un choix optimal?
Pour rpondre cette question, nous allons dans un premier temps nous
restreindre l'intervalle [-1, 1], o nous ferons tout le dveloppement. Pour
un intervalle quelconque, il suffira d'effectuer le changement de variable:
x = ( b - a )t + (a + b) et dx = ( b - a) dt
2 2
(6.30)
qui envoie l'intervalle [ -1, 1] sur un intervalle quelconque [a, b]. En effet, le
changement de variable 6.30 permet d'crire que:
rb f(x)dx=Jl t((b-a)t+(a+b)) (b-a)dt= (b-a)Jl g(t)dt
la -1 2 2 2 -1
o:
g(t) = f ((b- a)t; (a+ b))
ll est donc toujours possible de revenir l'intervalle [-1, 1]. De manire
gnrale, on cherche des expressions de la forme:
(6.31)
dont le degr de prcision soit le plus lev possible.
Diffrentiation et intgration numriques 333
Dfinition 6.4
L'expression 6.31 est appele quadrature de Gauss n points. Les ti sont
appels points d'intgration, tandis que les coefficients Wi sont les poids
d'intgration.
On choisit les points et les poids d'intgration de faon ce que la qua-
drature 6.31 soit exacte dans le cas des polynmes de degr le plus lev
possible. Puisque tout polynme de degr n peut s'crire:
n
Pn(t) = }::::Cntn
i=O
il suffit que la relation 6.31 soit exacte successivement pour g( t) = tk, pour
k = 0, 1, 2, , n. On gagne accrotre le plus possible l'exposant k. Le degr
maximal atteint dpend du nombre de points n. Puisqu'il y a 2n coefficients
dterminer dans l'quation 6.31, il est raisonnable de penser que l'on peut
atteindre le degr (2n- 1). La valeur de k varie donc entre 0 et 2n- 1.
Quadrature de Gauss 1 point
Cherchons donc une expression de la forme:
j_ll g(t)dt = W1g(t1) (6.32)
qui soit exacte dans le cas des polynmes de degr le plus lev possible.
Commenons par les polynmes de degr O. La formule 6.32 doit tre exacte
pour g(t) = 1, ce qui donne une premire quation:
J
l 1dt = 2 = W1
-1
et l'unique poids d'intgration est dj dtermin. L'quation 6.31 doit de
plus tre exacte pour g(t) = t. On trouve donc:
J
l tdt = 0 = W1 t1 = 2tl
-1
ce qui entrane que t
1
= O. Ainsi, la quadrature de Gauss 1 point s'crit:
j_: g(t)dt 2g(O)
334 Chapitre 6
et est exacte pour tout polynme de degr 1.
Remarque 6.19
La quadrature de Gauss 1 point a le mme degr de prcision ( 1) que la
mthode du trapze, qui est une formule 2 points. La quadrature de Gauss
1 point est galement connue sous le nom de formule du point milieu. D
Quadrature de Gauss 2 points
On doit maintenant dterminer les 4 coefficients inconnus de l'expression:
(6.33)
On remarque immdiatement que t
1
doit tre diffrent de t
2
et que les deux
Wi doivent tre non nuls. Sinon, on se retrouve avec une formule 1 point. ll
nous faut alors 4 quations qui proviendront de la relation 6.33, o on choisit
successivement g(t) = 1, g(t) = t, g(t) = t
2
et g(t) = t
3
. Les 4 quations
rsultantes sont:
1
1
1dt = 2
w
1
+ w
2
(6.34)
-1
1
1
tdt = 0
w
1
t
1
+ w2t2 (6.35)
-1
11 2
-1 t2dt = 3
2 2
w
1
t
1
+ w2t
2
( 6.36)
1
1
t
3
dt = 0
3 3
(6.37)
=
w
1
t
1
+ w2t
2
-1
et forment un systme non linaire qu'il est heureusement possible de r-
soudre analytiquement. On multiplie l'quation 6.35 par ti et on soustrait
du rsultat l'quation 6.37 pour obtenir:
Pour que ce produit soit nul, il faut que l'un ou l'autre des facteurs
s'annule, c'est--dire:
Diffrentiation et intgration numriques 335
e W2 = 0.
Cette possibilit doit tre carte, car dans ce cas la formule de Gauss
2 points 6.33 dgnre en une formule 1 seul point .
t2 = o.
De l'quation 6.35, on tire que w
1
nouveau une formule 1 point .
ti = ~
0, ce qui conduit de
On en conclut que t
1
= -t
2
, puisque le cas t
1
= t2 conduit encore
une formule 1 point.
Cette conclusion permet d'obtenir les poids d'intgration. En effet, en vertu
de l'quation 6.35:
t1(w1- w2) = 0
et puisque t
1
ne peut tre nul, w1 = w2 et la relation 6.34 entrane que:
W1 = W2 = 1
Enfin, selon l'quation 6.36, on a:
ce qui entrane que:
t1 = -II et donc t2 = II
La formule de Gauss 2 points s'crit donc:
Ill g(t)dt ~ g (-II) + g (II)
et est exacte dans le cas des polynmes de degr infrieur ou gal 3.
Remarque 6.20
Pour un mme nombre de points d'intgration, la quadrature de Gauss
2 points a un degr de prcision de 3 par comparaison avec 1 pour la m-
thode du trapze. Pour un mme effort de calcul, on a ainsi une pfus grande
prcision. 0
336 Chapitre 6
Quadratures de Gauss n points
Sans entrer dans les dtails, il est possible de dterminer des quadratures
de Gauss avec un grand nombre de points. Ces quadratures sont particuli-
rement efficaces et sont utilises, par exemple, dans la mthode des lments
finis (voir Reddy, rf. [24]). On dtermine les 2n coefficients Wi et ti en r-
solvant un systme non linaire de 2n quations que l'on obtient en prenant
g(t) = tk pour k = 0,1,2,,(2n-1).
On peut galement dmontrer que les points d'intgration de Gauss sont
les racines des polynmes de Legendre dfinis par:
L
0
(x) = 1 et L
1
(x) =x
et par la formule de rcurrence:
(n + 1)Ln+1(x) = (2n + 1)xLn(x)- nLn-1(x)
Il est alors facile de dmontrer que:
1 2
L
2
(x) =
2
(3x - 1)
dont les racines sont VJ73. En rsum, on a le rsultat gnral suivant.
Thorme 6.2
La quadrature de Gauss n points 6.31 est exacte dans le cas des poly-
nmes de degr (2n- 1 ). Le degr de prcision de cette quadrature est donc
(2n- 1).
Le terme d'erreur est donn par:
22n+l(n1)4
...,------'--'-. -----,.j(Zn)(C) o cE [ 1 1] 0
(2n+1)((2n)!)3 "' "' -'
(6.38)
Le tableau suivant rsume les principales quadratures de Gauss (voir
Burden et Faires, rf. [2]; Chapra et Canale, rf. [4]; et Gerald et Wheatly,
rf. [12]).
Diffrentiation et intgration numriques
n Points d'intgration
ti
1 0
2 -0,577 350 2629
+0,577 350 2629
3 -0,774596669
0,0
+0,774 596 669
4 -0,861136 312
-0,339 981 044
+0,339 981 044
+0,861136 312
5 -0,906 179 846
-0,538 469 310
0,0
+0,538 469 310
+0,906 179 846
Exemple 6.13
On doit valuer:
Poids d'intgration
Wi
2
1
1
0,555 555 556
0,888 888 889
0,555 555 556
0,34 7 854 845
0,652 145 155
0,652 145 155
0,347 854 845
0,236 926 885
0,4 78 628 670
0,568 888 889
0,4 78 628 670
0,236 926 885
337
Degr de prcision
1
3
5
7
9
dont la valeur exacte est 4. n faut d'abord effectuer le changement de va-
riable 6.30 pour obtenir:
La formule de Gauss 1 point donne l'approximation:
fol ( 4x
3
+ 3x
2
+ 2)dx ( 4 (
0
;
1
)
3
+ 3 (
0
;
1
)
2
+ 2) = 3,25
338 Chapitre 6
Par contre, la quadrature 2 points donne:
fol (4x
3
+ 3x
2
+ 2)dx
+2
+4(vv;+1)" +3 (vv;+
1
)' +2]
r ( 1r H 1) +3
1
+2
+ ( vv;+1)' H vv;+ 1) +3l +
2
]
% [ ( 4/3-:vm) ( 5 _ 2ff3)
+ (
4
/
3
-:V73) (s- 2j73) + 4]
L'exactitude de ce rsultat tait prvisible, car la fonction intgre est de
degr 3 et la quadrature de Gauss 2 points est exacte (par construction)
pour tout polynme de degr infrieur ou gal 3 .

Exemple 6.14
Grce au changement de variable 6.30, on a:
sin xdx = 2 sin dt

11 (7r(t + 1))
0 2 -1 4
Diffrentiation et intgration numriques 339
La quadrature de Gauss 2 points donne l'approximation:
l a ~ sin xdx -:::::
1r (. (1r(t
1
+ 1)) . (1r(t
2
+ 1)))
- sm +sm
4 4 4
i (sin(0,331948 322) + sin(1,238 848 005))
= 0,998 4 72 614
Si on tient compte du fait que l'on a valu la fonction sin x en seulement
deux points, ce rsultat est d'une prcision remarquable. Par ailleurs, la
formule trois points donne:
[

~ sinxdx -::::: 7r (w sin (1r(t


1
+
1
)) + w sin (1r(tz +
1
))
Jo 4
1
4
2
4
. (7r(t3 + 1)))
+ W3Sm
4
i ( (0,555 555 556) sin(0,177 031362)
+ (0,888 888 889) sin(0,785 398164)
+ (0,555 555 556) sin(1,774 596 669))
1,000 008 1821
La formule de Gauss 3 points est donc plus prcise que la mthode de
Simpson 1/3 simple, qui ncessite en outre l'valuation de la fonction sin x
en trois points. Pour obtenir une prcision similaire avec la mthode de
Simpson 1/3, nous avons d utiliser 8 intervalles et donc 9 valuations de la
fonction sin x.
Exemple 6.15
Soit:

lo
l 1
-dx
ovfx
340 Chapitre 6
dont la valeur exacte est 2. On remarque immdiatement que, parmi les
mthodes proposes, seules les quadratures de Gauss peuvent s'appliquer.
En effet, toutes les autres mthodes ncessitent l'valuation de la fonction
x-
1
1
2
en x = 0, qui n'est pas dfinie cet endroit. On peut prvoir que le
calcul de cette intgrale sera difficile. Dans un premier temps, le changement
de variable 6.30 donne:
{1 1 1 Jl 1 v'2 !1 1
Jo yxdx = 2 -1 ~ t = 2 -1 v't+Idt
La formule 2 points donne:
f
1
_
1
-dx "' v'2 (
1
+
1
) = 1,650 680 13
lo yx - 2 v-Vf13 + 1 )Vf13 + 1
La formule 3 points est lgrement plus prcise. En se servant de la table
des quadratures de Gauss pour tablir la valeur des diffrents coefficients,
on obtient:
1
1 1 v'2 ( 1 1 1 )
r;;dX ::= -
2
W1 y't"TI + Wz fi":"l1 + w3 y't3TI = 1, 750 863166
o y x t1 + 1 y tz + 1 t3 + 1
La prcision demeure insatisfaisante, mais il faut admettre qu'il s'agit d'un
problme difficile. Les quadratures de Gauss 4 ou 5 points amlioreraient
encdre la qualit des rsultats.

Remarque 6.21
Les quadratures de Gauss permettent d'valuer des intgrales avec une grande
prcision. Toutefois, chaque fois que l'on change l'ordre de la quadrature, les
points ti et les poids Wi d'intgration changent eux aussi. ll devient alors
peu prs impossible d'utiliser une technique d'extrapolation comme la m-
thode de Romberg. D
6.4.4 Intgration 1 'aide des splines
Si la spline constitue une bonne approximation d'une fonction f(x) connue
seulement en quelques points, elle peut galement servir pour calculer l'in-
tgrale de cette fonction. On obtient ainsi une expression voisine de celle
Diffrentiation et intgration numriques
341
qui caractrise la mthode des trapzes compose, laquelle s'ajoute une
approximation du terme d'erreur de cette mthode. On pose:
lb f(x)dx :t lx; Pi(x)dx
a i=
1
Xi-l
o Pi(x) est le polynme de degr 3 de la spline dans l'intervalle [xi-b xi].
L'expression de ce polynme est bien sr (voir l'quation 5.30):
_ ( _ (x_ Xi)
+ hi{f') (x- Xi-1)
En intgrant ce polynme, on obtient:
{-!" (x- xi)
4
!,('(x- Xi_I)
4
,_
1
24h + ' 24h
i=1 ' '
(6.39)
342 Chapitre 6
Puisque hi = Xi - Xi-1, on a:
On obtient ainsi l'approximation suivante de l'intgrale de f( x) dans l'inter-
valle [a, b] = [xo, Xn]:
(6.40)
Dans le cas o les abscisses Xi sont quidistantes (hi = h ), on peut simplifier
davantage l'expression prcdente pour obtenir:
h3
- 24 (!/; +
2
(!{' + ~ ' + ... + ~ - d + ~ )
Puisque fff = J:: = 0 dans le cas de la spline naturelle, on a:
h3 (!" !" f," )
-
12
1 + 2 + + n-1
(6.41)
Ce rsultat mrite quelques commentaires. En effet, cette approximation
de l'intgrale comporte deux termes. Le premier terme n'est autre que l'ex-
pression de la mthode des trapzes compose. Le deuxime terme est une
approximation du terme d'erreur li cette mme mthode. En effet, l'erreur
d'approximation de la mthode du trapze simple est donne pour chaque
intervalle [xi-b Xi] par:
!" ( 1Ji) h3 ' [ ]
-12 OU 1Ji E Xi-b Xi
La position exacte du point 1Ji tant inconnue, on lui attribue la valeur de
Xi
Diffrentiation et intgration numriques 343
Remarque 6.22
La mthode du trapze utilise un polynme de degr 1 dans [xi-b Xi] On
peut interprter le deuxime terme de droite de l'quation 6.41 comme tant
une correction due la courbure de la fonction f( x) dans cet intervalle. 0
Remarque 6.23
Dans le cas gnral, on utilise l'expression 6.40 pour faire l'approximation
de l'intgrale l'aide de la spline. Si les abscisses Xi sont quidistantes, on
utilise de prfrence l'expression 6.41. 0
6.5 Applications
6.5.1 Courbe des puissances classes
Reprenons l'exemple de la section 5.8 portant sur la courbe des puissances
classes d'une entreprise d'lectricit. Cette courbe indique la proportion de
l'anne o la demande d'lectricit atteint ou dpasse un niveau de puissance
donn (en gigawatts ou GW). L'aire sous cette courbe est tout simplement
l'nergie totale E vendue au cours de l'anne. Cette donne est donc im-
portante pour l'entreprise en question. On a en main les donnes suivantes
relatives une certaine anne de rfrence.
Proportion Puissance
de l'anne (GW)
0,0 30
0,1 29
0,2 24
0,5 19
0,8 18
0,9 15
1,0 0
Pour obtenir l'aire sous la courbe et donc l'nergie, il suffit d'intgrer
dans l'intervalle [0, 1]. Comme les abscisses ne sont pas galement distan-
ces, il faut tre prudent quant au choix de la mthode d'intgration. Pour
obtenir la plus grande prcision possible, il est souhaitable de diviser l'inter-
valle d'intgration en 3 parties et d'utiliser la mthode de Simpson 1/3. Les
344 Chapitre 6
3 sous-intervalles sont [0, 0,2] o h = 0,1, (0,2, 0,8J o h = 0,3 et [0,8, 1,0)
o h = 0,1. On a alors:
E =
0
'
1
(40+4x29+24)
3
03 01
+ -tC24 + 4 x 19 + 18) + -j-(18 + 4 x 15 + o)
20,0666 gigawatts-annes = 175,784 gigawatts-heures
= 6,33 x 10
8
gigawatts-secondes
6,33 X 10
17
joules
633 ptajoules
6.5.2 Puissance lectrique d'un ordinateur
Un ordinateur personnel muni d'un processeur de type 486 est aliment
une tension e(t) de 120 V et une f de 60Hz. Plus prcisment:
e(t) = v'2120cos(2tr/t)
que reprsente la figure 6.9 (voir IEEE, rf. [14]). Le courant i(t) est ensuite
mesur par un analyseur de puissance qui prend typiquement 256 mesures
par priode T = 1/ f = 0,0166 s. La figure 6.10 illustre ces mesures. Malgr
les petites oscillations, qui sont dues aux erreurs de mesure, on a une assez
bonne reprsentation du signal.
La puissance P (en watts ou W) tire du rseau est alors dfinie par:
11T
P = - e(t)i(t)dt
T o
qui est une valeur trs importante connatre en pratique. Pour valuer P,
on utilise une mthode de Simpson 1/3 compose avec 256 sous-intervalles,
c'est--dire:
h = _I_ = 0 65 x 10-
4
256 '
On obtient ainsi P = 119,90 W. Dans ce cas particulier, il n'est pas ncessaire
de chercher obtenir une prcision extrme de la valeur de P, car les donnes
mesures sont elles-mmes imprcises.
Diffrentiation et intgration numriques 345
e(t) (V)
i(t) (A)
200
150
100
50
0
-50
-100
-150
-200
0 0,002 0,004 0,006 0,008 0,01 0,012 0,014 0,016 O,18
Temps (s)
Figure 6.9: Tension e(t)
4.-------------------------------------------,
3
2
~ r
\ f
0 g
0 0
0 0
0 0
0 ~ ~
0 0
-1
-2
-3
0 0
0 0
0
0
i
~ 0
0 0
v
4 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
0 0,002 0,004 0,006 0,008 0,01 0,012 0,014 0,016 0,018
Temps (s)
Figure 6.10: Courant mesur i(t)
6.6 Exercices
1. partir du polynme de degr 2 passant par les points (x
0
, f(x
0
)),
(x1, f(xl)) et (x2, j(x2)), obtenir les formules aux diffrences avant,
centre et arrire d'ordre 2 pour le calcul de J'( x). Dduire galement
les termes d'erreur.
2. partir de la relation 6.5, obtenir les termes d'erreur pour les diff-
rences d'ordre 2 obtenues l'exercice prcdent.
3. valuer la drive de f( x) = ex en x = 0 l'aide des diffrences avant
et arrire d'ordre 2. Prendre h = 0,05 et h = 0,025, et calculer le
rapport des erreurs commises. Obtenir une approximation encore plus
prcise de f'(O) l'aide de l'extrapolation de Richardson.
4. l'aide des dveloppements de Taylor appropris, obtenir l'expression
du terme d'erreur li la diffrence centre d'ordre 2 permettant de
faire l'approximation de J'(x) (voir l'quation 6.11). Montrer que ce
terme d'erreur ne fait intervenir que les puissances paires de h. Que
conclure au sujet de l'extrapolation de Richardson dans ce cas?
5. Obtenir la formule de diffrence centre d'ordre 4 (voir l'quation 6.13)
permettant de faire l'approximation de J"( x). Bien identifier le poly-
nme d'interpolation qui est ncessaire.
6. Intgrer les polynmes de degr 1, 2 et 3 respectivement permettant
d'obtenir les formules du trapze simple, de Simpson 1/3 simple et de
Simpson 3/8 simple. Bien prciser l'intervalle sur lequel porte l'int-
gration et utiliser le changement de variables= (x- x
0
)jh.
7. Intgrer la fonction f( x) = ex dans l'intervalle [0, 1] en utilisant la
mthode des trapzes compose avec 4 puis avec 8 intervalles. Utili-
ser l'extrapolation de Richardson avec les deux valeurs obtenues pour
obtenir une meilleure approximation. Quel est l'ordre de cette approxi-
mation? Comparer les rsultats avec la valeur exacte.
8. Refaire le mme exercice en utilisant cette fois la mthode de Simpson
1/3 compose.
9. Utiliser la mthode de Simpson 3/8 avec 6 intervalles pour valuer:
1
9
vfxdx
Diffrentiation et intgration numriques
Comparer le rsultat avec la valeur exacte.
10. Utiliser la mthode de Boole avec 8 intervalles pour valuer:
Comparer le rsultat avec la valeur exacte.
11. Soit la fonction suivante.
x f(x)
0,00 1,570 796 327
0,25 1,318 116 072
0,50 1,047197 551
0,75 0,722734248
1,00 0,000 000 000
valuer:
1
1
f(x)dx
l'aide de la mthode de Romberg.
347
12. Donner les expressions compltes de T
1
,
1
et de T
1
,
2
dans l'intervalle
[a, b]. Montrer que l'extrapolation de Richardson:
4Tl,2- T1,1
3
donne le mme rsultat que la mthode de Simpson 1/3 simple. (En
gnral, l'extrapolation de Richardson:
donne le mme rsultat que la mthode Simpson 1/3 avec 2i inter-
valles).
13. On considre l'intgrale:
[
1
dx
Jo 1 +x
a) Donner la valeur exacte de cette intgrale.
348 Chapitre 6
b) Calculer les valeurs de T
1
,i jusqu' ce que:
c) partir des rsultats obtenus en b ), dterminer la valeur de l'int-
grale l'aide de la mthode de Romberg.
d) Sans faire de calculs supplmentaires, donner le rsultat que l'on
obtiendrait l'aide de la mthode de Simpson 1/3 avec 8 intervalles.
14. Utiliser une mthode numrique pour valuer:
15. Quelle serait l'erreur d'approximation si on utilisait la quadrature de
Gauss 3 points pour valuer:
16. On dsire dvelopper une nouvelle formule d'intgration numrique
dans l'intervalle [0, 3h] de la forme:
rh
Jo f(x)dx af(h) + bf(2h)
a) Dterminer les valeurs des constantes a et b de telle sorte que cette
quadrature soit exacte dans le cas de tout polynme de degr infrieur
ou gal 1.
b) Calculer:
l'aide de cette quadrature.
r dx
Jo 1 +x
c) Calculer l'intgrale donne en b) l'aide de la formule de Simpson
1/3 simple.
d) Selon l'cart entre les rsultats et la valeur exacte, dterminer le
nombre de chiffres significatifs des valeurs obtenues en b) et en c ).
Conclure brivement.
Diffrentiation et intgration numriques 349
17. l'aide d'une certaine mthode d'intgration numrique, on a valu:
flj .
I =Jo sm xdx
en utilisant 3 valeurs de h diffrentes. On a obtenu les rsultats sui-
vants.
h I
0,1 1,001235
0,2 1,009 872
0,4 1,078 979
Compte tenu de la valeur exacte de J, dduire l'ordre de convergence
de la quadrature employe.
18. Soit l'approximation:
l
xo+h h ( ( 2h))
xo f(x )dx 4 f(xo) + 3 f(x0 +
3
a) Obtenir le dveloppement de Taylor de f ( x
0
+
2
3
h) jusqu' l'ordre
5 et proposer une nouvelle expression du terme de droite.
b) Obtenir un dveloppement de Taylor d'ordre 5 du terme de gauche.
Suggestion: Poser:
f(x) = f(xo +(x- xo))
pour effectuer le dveloppement de Taylor. Par la suite, intgrer les
premiers termes de ce dveloppement.
c) Soustraire les expressions obtenues en a) et en b) pour obtenir le
premier terme de l'erreur. En dduire l'ordre de la mthode propose.
d) Quel est le degr de prcision de cette mthode?
Chapitre 7
,
Equations diffrentielles
7.1 Introduction
La rsolution numrique des quations diffrentielles est probablement le
domaine de l'analyse numrique o les applications sont les plus nombreuses.
Que ce soit en mcanique des fluides, en transfert de chaleur ou en analyse
de structures, on aboutit souvent la rsolution d'quations diffrentielles,
de systmes d'quations diffrentielles ou plus gnralement d'quations aux
drives partielles.
Le problme du pendule abord au chapitre 1 trouvera ici une solution
numrique qui sera par la suite analyse et compare d'autres solutions
approximatives ou quasi analytiques. Parmi leurs avantages, les mthodes
numriques permettent d'tudier des problmes complexes pour lesquels on
ne connat pas de solution analytique, mais qui sont d im grand intrt pra-
tique.
Dans ce chapitre comme dans les prcdents, les diverses mthodes de
rsolution proposes sont d'autant plus prcises qu'elles sont d'ordre lev.
Nous amorons l'expos par des mthodes relativement simples ayant une
interprtation gomtrique. Elles nous conduiront progressivement des m-
thodes plus complexes telles les mthodes de Runge-Kutta d'ordre 4, qui
permettent d'obtenir des rsultats d'une grande prcision. Nous considrons
principalement les quations diffrentielles avec conditions initiales, mais
nous ferons une brve incursion du ct des quations diffrentielles avec
conditions aux limites par le biais des mthodes de tir et de diffrences
finies.
352 Chapitre 7
Nous prenons comme point de dpart la formulation gnrale d'une qua-
tion diffrentielle d'ordre 1 avec condition initiale. La tche consiste dter-
miner une fonction y(t) solution de:
y'(t) = f(t, y(t))
y(to) = Yo
(7.1)
La variable indpendante t reprsente trs souvent (mais pas toujours) le
temps. La variable dpendante est note y et dpend bien sr de t. La fonc-
tion f est pour le moment une fonction quelconque de deux variables que
nous supposons suffisamment diffrentiable. La condition y(t
0
) = y
0
est la
condition initiale et en quelque sorte l'tat de la solution au moment o on
commence s'y intresser. TI s'agit d'obtenir y(t) pour t 2:: t
0
, si on cherche
une solution analytique, ou une approximation de y(t), si on utilise une m-
thode numrique.
Dfinition 7.1
L'quation diffrentielle 7.1 est dite d'ordre 1, car seule la drive
d'ordre 1 de la variable dpendante y(t) est prsente. Si des drives de
y(t) d'ordre 2 apparaissaient dans l'quation diffrentielle 7.1, on aurait
une quation d'ordre 2, et ainsi de suite.
Commenons par prsenter quelques exemples d'quations diffrentielles
avec condition initiale.
Exemple 7.1
Soit l'quation diffrentielle du premier ordre:
y'(t)
y(O)
t
1
(7.2)
Voil certainement l'un des exemples les plus simples que l'on puisse imagi-
ner. En intgrant de chaque ct, on obtient:
J y'(t)dt = J tdt
c'est--dire:
t2
y(t) = 2 + c
quations diffrentielles 353
o C est une constante. Cette dernire expression est la solution gnrale de
l'quation diffrentielle en ce sens qu'elle satisfait y'(t) = t, quelle que soit la
constante C. Pour dterminer la constante C, il suffit d'imposer la condition
initiale:
y(O) = 1 = C
La solution particulire est alors:
qui vrifie la fois l'quation diffrentielle et la condition initiale .

Exemple 7.2
Soit l'quation diffrentielle:
y'(t) = ty(t)
y(l) 2
(7.3)
ll ne suffit pas dans ce cas d'intgrer les deux cts de l'quation pour obtenir
la solution. On doit d'abord sparer les variables en crivant par exemple:
dy
t y(t)
=
dt
qui devient:
dy
tdt
=
y
Les variables tant spares, on peut maintenant faire l'intgration:
ou encore
qui est la solution gnrale. On obtient la solution particulire en imposant
la condition initiale:
y(l) = 2 = Ce
1
1
2
354 Chapitre 7
ce qui signifie que:
C = 2e-
1
1
2
et donc que la solution particulire est:

Exemple 7.3
Cet exemple est tir de Gerald et Wheatly (rf. [12]). ll illustre un cas simple
d'quation diffrentielle n'ayant pas de solution analytique. On considre que
le taux de variation N'(t) d'une population N(t) de souris dpend:
du taux de natalit aN(t), qui dpend lui-mme du nombre de femelles
fertiles;
du facteur de dcs, qui dpend de la quantit de nourriture disponible
au temps t. Des tudes en laboratoire montrent que l'on peut modliser
ce phnomne par la fonction bN
1
,
7
(t).
On obtient ainsi l'quation diffrentielle:
N'(t) = aN(t)- bN
1
,
7
(t)
avec la condition initiale qui est dans ce cas la population initiale N(O) = N
0

On note que les variables ne sont pas sparables et que les techniques de r-
solution d'quations diffrentielles lmentaires ne permettent pas d'obtenir
une solution. La rsolution numrique est ici essentielle .

Les ouvrages de Simmons (rf. [20]) et de Derrick et Grossman (rf. [7])
contiennent d'autres exemples d'quations diffrentielles. Notre propos
concerne plutt les mthodes numriques de rsolution de ces quations diff-
rentielles. cet gard, nous suivons l'approche de Burden et Faires (rf. [2]),
notamment en ce qui concerne la notion d'erreur de troncature locale qui in-
dique l'ordre de prcision de la mthode utilise.
Avec les outils numriques de rsolution d'quations diffrentielles, il
n'est plus possible d'obtenir une solution pour toutes les valeurs de la va-
riable indpendante t. On obtient plutt une approximation de la solution
quations diffrentielles
355
analytique seulement certaines valeurs de t notes ti et distances d'une
valeur hi = ti+l- ti. Dans la plupart des mthodes prsentes, cette distance
est constante pour tout i et est note h. On appelle h le pas de temps.
Remarque 7.1
On note y( ti) la solution analytique de l'quation diffrentielle 7.1 en t = ti.
On note Yi la solution approximative en t = ti obtenue l'aide d'une mthode
numrique. D
7.2 Mthode d'Euler
La mthode d'Euler est de loin la mthode la plus simple de rsolution
numrique d'quations diffrentielles ordinaires. ~ i l e possde une belle inter-
prtation gomtrique et son emploi est facile. Toutefois, elle est relativement
peu utilise en raison de sa faible prcision.
Reprenons l'quation diffrentielle 7.1 et considrons plus attentivement
la condition initiale y(ta) = Ya Le but est maintenant d'obtenir une ap-
proximation de la solution en t = t
1
=ta+ h. Avant d'effectuer la premire
itration, il faut dterminer dans quelle direction on doit avancer partir
du point (ta, Ya) pour obtenir le point (tt, y
1
), qui est une approximation du
point (t
11
y(t
1
)). Nous n'avons pas l'quation de la courbe y(t), mais nous en
connaissons la pente y'(t) en t =ta. En effet, l'quation diffrentielle assure
que:
y'(ta) =!(ta, y( ta))= !(ta, Ya)
On peut donc suivre la droite passant par (ta, Ya) et de pente f(ta, Ya).
L'quation de cette droite, note da(t), est:
da(t) = Ya + f(ta, Ya)(t- ta)
et est illustre la figure 7.1.
En t = ft, on a:
da(tt) = Ya + f(ta, Ya)(tt- ta)= Ya +hf( ta, Ya) = Yt
En d'autres termes, da(t
1
) est proche de la solution analytique y(t
1
), c'est-
-dire:
y( t ~ Yt =da( tt) = Ya +hf( ta, Ya)
356 Chapitre 7
y( t) (inconnue)
d/t)
Figure 7.1: Mthode d'Euler
ll est important de noter que, le plus souvent, y
1
f:. y(t
1
). Cette ingalit
n'a rien pour tonner, mais elle a des consquences sur la suite du raison-
nement. En effet, si on souhaite faire une deuxime itration et obtenir une
approximation de y(t
2
), on peut refaire l'analyse prcdente partir du point
(tt, Yt) On remarque cependant que la pente de la solution analytique en
t = t1 est:
On ne connat pas exactement y(t
1
), mais nous possdons l'approximation
Yt de y(tt) On doit alors utiliser l'expression:
et construire la droite (voir la figure 7.1):
qui permettra d'estimer y(t
2
). On constate que l'erreur commise la pre-
mire itration est rintroduite dans les calculs de la deuxime itration. On
a alors:
y(tz) Yz = dt(tz) = Yt + hf(tt, Yt)
quations diffrentielles 357
Remarque 7.2
Le dveloppement qui prcde met en vidence une proprit importante des
mthodes numriques de rsolution des quations diffrentielles. En effet,
l'erreur introduite la premire itration a des rpercussions sur les calculs
de la deuxime itration, ce qui signifie que les erreurs se propagent d'une
itration l'autre. n en rsulte de faon gnrale que l'erreur:
augmente lgrement avec i. 0
On en arrive donc l'algorithme suivant.
Algorithme 7.1: Mthode d'Euler
1. tant donn un pas de temps h, une condition initiale (t
0
, y
0
) et un
nombre maximal d'itrations N
2. Pour 0:::::; n:::::; N:
Yn+I = Yn + hj(tn, Yn)
tn+I = tn + h
crire tn+I et Yn+l
3. Arrt o
Exemple 7.4
Soit l'quation diffrentielle (voir Fortin et Pierre, rf. [11]):
y'(t) = -y(t) + t + 1
et la condition initiale y(O) = 1. On a donc t
0
= 0 et y
0
= 1, et on prend un
pas de temps h = 0,1. De plus, on a:
f(t,y)=-y+t+1
358 Chapitre 7
On peut donc utiliser la mthode d'Euler et obtenir successivement des ap-
proximations de y(0,1 ), y(0,2), y(0,3) ,notes Yb yz, Y3 .La premire it-
ration produit:
Y1 = Yo + hf(to, Yo) = 1 + 0,1j(O, 1) = 1 + 0,1( -1 + 0 + 1) = 1
La deuxime itration fonctionne de manire similaire:
Yz = Y1 +hf( tt, YI)= 1 + 0,1j(0,1, 1) = 1 + 0,1( -1 + 0,1 + 1) = 1,01
On parvient :
Y3 Yz + hf(tz, Yz) = 1,01 + 0,1j(0,2, 1,01)
1,01 + 0,1( -1,01 + 0,2 + 1)
1,029
La tableau suivant rassemble les rsultats des dix premires itrations. On
peut montrer que la solution analytique de cette quation diffrentielle est:
y(t) =e-t+ t
ce qui permet de comparer les solutions numrique et analytique, et de cons-
tater la croissance de l'erreur. On peut aussi comparer les rsultats la
figute 7.2.
t
t
y(ti)
Yi ly(ti)- Yil
0,0 1,000000 1,000000 0,000000
0,1 1,004837 1,000000 0,004837
0,2 1,018 731 1,010000 0,008 731
0,3 1,040 818 1,029000 0,011818
0,4 1,070302 1,056100 0,014220
0,5 1,106531 1,090490 0,016 041
0,6 1,148812 1,131441 0,017 371
0,7 1,196 585 1,178 297 0,018 288
0,8 1,249329 1,230467 0,018862
0,9 1,306570 1,287 420 0,019150
1,0 1,367 879 1,348678 0,019201

quations diffrentielles 359
1,40
Solution analytique
1,35
Solution numrique (h = 0,1)
1,30
_.,!.
1,25
1,20
1,15
1,10
1,05
... :J
1,00
0 0,2 0,4 0,6 0,8 1,0
Figure 7.2: Mthode d'Euler: y'(t) = -y(t) + t + 1 pour y(O) = 1
Les rsultats prcdents nous amnent parler de prcision et donc d'er-
reur. La figure 7.2 montre une lgre diffrence entre la solution numrique
et la solution analytique. On peut se demander comment se comporte cette
erreur en fonction du pas de temps h. La dfinition qui suit aidera appor-
ter une rponse. Elle s'applique la plupart des mthodes tudies dans ce
chapitre.
Dfinition 7.2
Une mthode de rsolution d'quations diffrentielles est dite un pas si
elle est de la forme:
(7.4)
o </> est une fonction quelconque. Une telle relation est appele quation
aux diffrences. La mthode est un pas si, pour obtenir la solution en
t = tn+l, on doit utiliser la solution numrique au temps tn seulement.
On dsigne mthodes pas multiples les mthodes qui exigent galement
la solution numrique aux temps tn-1, tn-2, tn-3 .
360 Chapitre 7
La mthode d'Euler est bien sr une mthode un pas o:
<1>( t, y) = !( t, y)
Dans ce chapitre, l'attention est principalement porte sur les mthodes
un pas. Nous pouvons maintenant aborder la notion d'erreur de troncature
dans le cas de ces mthodes.
Dfinition 7.3
L'erreur de troncature locale au point t = tn est dfinie par:
(7.5)
L'erreur de troncature locale mesure la prcision avec laquelle la solution
analytique vrifie l'quation aux diffrences 7.4.
Remarque 7.3
il est trs important de noter que l'on utilise la solution exacte y( tn) (et non
Yn) dans la dfinition de l'erreur de troncature locale (voir l'quation 7.5).
Cela s'explique par le fait que l'on cherche mesurer l'erreur introduite par
l'quation aux diffrences un pas donn, en supposant que la mthode tait
exacte jusque-l. o
Examinons plus avant le cas de la mthode d'Euler (<l>(t, y) = f(t, y)).
Ici encore, l'outil de travail est le dveloppement de Taylor. En effectuant
un dveloppement autour du point t = tn, on trouve:
puisque y'(tn) = f(tn, y(tn)). L'erreur de troncature locale 7.5 devient donc:
ou plus simplement:
quations diffrentielles 361
Tn+t(h) = O(h)
On conclut que l'erreur est d'ordre 1 et qu'elle diminue d'un facteur 2 chaque
fois que le pas de temps h est diminu d'un facteur de 2.
Remarque 7.4
Il ne faut pas confondre l'ordre d'une quation diffrentielle avec l'ordre d'une
mthode numrique utilise pour rsoudre cette quation diffrentielle. D
Exemple 7.5
On tente de rsoudre l'quation diffrentielle:
y'(t) = f(t, y)= -y(t) + t + 1
en prenant successivement h = 0,1, 0,05 et 0,025. On compare les rsultats
numriques la solution analytique la figure 7.3. On voit nettement di-
minuer d'un facteur de 2 l'cart entre la solution analytique et la solution
numrique chaque fois que le pas de temps h est divis par 2. Ces rsultats
confirment que l'erreur de troncature locale de la mthode d'Euler est 1.

7.3 Mthodes de Taylor
Le dveloppement de Taylor autorise une gnralisation immdiate de
la mthode d'Euler, qui permet d'obtenir des algorithmes dont l'erreur de
troncature locale est d'ordre plus lev. Nous nous limitons cependant la
mthode de Taylor du second ordre.
On cherche, au temps t = tn, une approximation de la solution en
t = tn+l On a immdiatement:
362 Chapitre 7
1,35
1,30
1,25
1,20
1,15
1,10
1,05
1 L - - - ~ ~ - - - - - - ~ - - - - - - - L - - - - - - ~ - - - - ~
0 0,2 0,4 0,6 0,8 1,0
h = 0,025
1,24
1,22
1,20
1,18
1,16
1,14
1,12 .__ _____ ___._ ________ ___,__ _____ - - - - - - - - ~
0,60 0,65 0,70 0,75 0,8(
Figure 7.3: Mthode d'Euler: h = 0,1, h = 0,05 et h = 0,025
quations diffrentielles
En se servant de l'quation diffrentielle 7.1, on trouve:
y(tn+l) = y(tn) + J(tn, y(tn))h
+ J'(tn, y(tn))h
2
+ O(h3)
2
363
Dans la relation prcdente, on voit apparatre la drive de la fonction
f(t, y(t)) par rapport au temps. La rgle de drivation en chane (voir Tho-
mas et Finney, rf. [22]) assure que:
J
'( ( )) - j(t,y(t)) j(t,y(t)) '()
t, y t - t + y y t
c'est--dire:
J'(t y(t)) = j(t, y(t)) + j(t, y(t)) f(t y(t))
' t y '
On obtient donc:
y(tn+l) = y(tn) + hj(tn, y(tn))
+

(f(tnattn)) + f(tna:(tn)) f(tmy(tn))) (
7
.
6
)
+ O(h
3
)
En ngligeant les termes d'ordre suprieur ou gal 3, on en arrive poser:
y(tn+l) y(tn) + hj(tn, y(tn))
+

( !( tnB;( tn)) + !( tna:( tn)) !( tn, y( tn)))
qui sera la base de la mthode de Taylor.
Remarque 7.5
(7.7)
ll importe de prciser l'ordre de troncature locale de cette mthode. Dans ce
cas, suivant la notation 7.4, on a:
<P(t, y(t)) = f(t, y(t)) + ( + f(t, y(t)))
364 Chapitre 7
En vertu de la relation 7.6 et de la dfinition de l'erreur de troncature lo-
cale 7.5, il est facile de montrer que:
L'erreur de troncature locale de la mthode de Taylor est d'ordre 2. 0
On en arrive donc l'algorithme suivant.
Algorithme 7.2: Mthode de Taylor d'ordre 2
1. tant donn un pas de temps h, une condition initiale (to, y
0
) et un
nombre maximal d'itrations N
2. Pour 0 :S n:::; N:
tn+l tn + h
crire tn+l et Yn+l
3. Arrt o
Remarque 7.6
Dans cet algorithme, on a remplac la solution analytique y( tn) par son
approximation Yn dans la relation 7.7. On en conclut que les erreurs se
propagent d'une itration une autre. 0
Exemple 7.6
Soit l'quation diffrentielle dj rsolue par la mthode d'Euler:
y'(t) = -y(t) + t + 1
quations diffrentielles 365
et la condition initiale y(O) = 1. Dans ce cas:
J( t, y) = -y + t + 1
et
f = 1 et f = -1
t y
L'algorithme devient:
h2
Yn+l = Yn + h( -Yn + tn + 1) + 2(1 + ( -1)( -Yn + tn + 1))
La premire itration de la mthode de Taylor d'ordre 2 donne (avec h = 0,1 ):
(0 1)
2
'
Y1 = 1 + 0,1( -1 + 0 + 1) + ~ - 1 + ( -1)( -1 + 0 + 1)) = 1,005
Une deuxime itration donne:
Y2
(0 1)
2
1,005 + 0,1( -1,005 + 0,1 + 1) + ~ - 1 + ( -1)( -1,005 + 0,1 + 1))
1,019 025
Les rsultats sont compils dans le tableau qui suit.
t; y( t;)
Yi
ly(t;)- Yil
0,0 1,000 000 1,000 000 0,000 000
0,1 1,004837 1,005 000 0,000 163
0,2 1,018731 1,019 025 0,000 294
0,3 1,040 818 1,041218 0,000400
0,4 1,070 302 1,070 802 0,000482
0,5 1,106531 1,107075 0,000544
0,6 1,148812 1,149404 0,000592
0,7 1,196585 1,197210 0,000 625
0,8 1,249 329 1,249 975 0,000 646
0,9 1,306 570 1,307 228 0,000 658
1,0 1,367879 1,368 541 0,000662
366 Chapitre 7
On remarque que l'erreur est plus petite avec la mthode de Taylor
d'ordre 2 qu'avec la mthode d'Euler. Comme on le verra plus loin, cet avan-
tage des mthodes d'ordre plus lev vaut pour l'ensemble des mthodes de
rsolution d'quations diffrentielles .

Remarque 7.7
ll est possible d'obtenir des mthodes de Taylor encore plus precises en
poursuivant le dveloppement de Taylor 7.6 jusqu' des termes d'ordre lev.
On doit alors valuer les drives de la fonction f(t, y(t)) d'ordre de plus en
plus lev, ce qui ncessite le calcul supplmentaire de:

2
f
2
f
2
f
t
2
' y
2
' ty'
oi+j J
'tiyi
Pour cette raison, les mthodes obtenues sont difficiles utiliser. ll existe ce-
pendant un moyen de contourner cette difficult en dveloppant les mthodes
de Runge-Kutta. D
Terminons cette section avec un autre exemple.
Exemple 7.7
Soit l'quation diffrentielle:
y'( t)
y(l)
ty(t)
2
dont on connat la solution exacte:
On a dans ce cas t
0
= 1, Yo = 2 et:
f(t, y)= ty
d'o on tire que:
j et j = t
t =y y
(7.9)
quations diffrentielles
L'algorithme de la mthode de Taylor devient alors:
h2
Yn+l = Yn + htnYn + 2 (Yn + tn(tnYn))
Avec h = 0,5, la premire itration donne:
Y1 = 2 + 0,5((1)(2)) + 0,125 (2 + 1 ((1)(2))) = 3,5
367
La solution analytique est y(1,5) = 3,736 492. Une deuxime itration donne:
Y2 = 3,5 + 0,5 ((1,5)(3,5)) + 0,125 (3,5 + 1,5 ((1,5)(3,5))) = 7,546 875
qui son tour correspond la solution analytique y(2) = 8,963 378. On
constate une erreur assez importante, qui est attribuable la grande taille
du pas de temps h. En effet, si on rduit la taille de h, l'erreur devrait
diminuer en O(h
2
) car la mthode est d'ordre 2. Cela signifie que, si h est
suffisamment petit, la diminution de h par un facteur de 2 rduit l'erreur
selon un facteur approximatif de 4. Cependant, lorsqu'on diminue la valeur
de h, il faut faire davantage d'itrations pour atteindre le but.
Le tableau qui suit regroupe les approximations de y(2) pour diffrentes
valeurs de h. On y indique galement le nombre d'itrations i requis pour
obtenir ces approximations. Par exemple, si h = 0,5, il faut faire deux itra-
tions pour atteindre t = 2 partir de t = 1. De mme, si h = 0,25, il faut
4 itrations, et ainsi de suite. On remarque qu'entre chaque ligne du tableau
la valeur de h est diminue selon un facteur de 2, ce qui devrait abaisser
l'erreur selon un facteur de 4 puisque la mthode est d'ordre 2. Ce facteur
de 4 apparat lorsque h est suffisamment petit.
h 2
Yi
ly(2)- Yil
Ratio
0,5 2 7,546875 1,417
-
0,25 4 8,444292 0,519 2,72
0,125 8 8,804926 0,158 3,27
0,0625 16 8,919 646 0,0437 3,61
0,03125 32 8,951901 0,0114 3,80
0,015 625 64 8,960439 0,0029 3,87
0,007 812 5 128 8,962635 0,000 74 3,90
L'avant-dernire colonne du tableau donne l'erreur absolue commise, tandis
que la dernire colonne indique le rapport entre l'erreur lie la valeur de
h prcdente et celle lie sa valeur actuelle. On voit bien que l'erreur a
tendance diminuer selon un facteur de 4 .

368 Chapitre 7
7.4 Mthodes de Runge-Kutta
ll serait avantageux de disposer de mthodes d'ordre de plus en plus lev
tout en vitant les dsavantages des mthodes de Taylor, qui ncessitent
l'valuation des drives partielles de la fonction f(t, y). Une voie est trace
par les mthodes de Runge-Kutta, qui sont calques sur les mthodes de
Taylor du mme ordre.
7.4.1 Mthodes de Runge-Kutta d'ordre 2
On a vu que le dveloppement de la mthode de Taylor passe par la
relation 7.6:
y(tn) + hj(tn, y(tn))
+ ~

(f(tn
0
ttn)) + f(tnJ:(tn)) f(tn,y(tn)))
(7.10)
+ O(h
3
)
Le but est de remplacer cette dernire relation par une expression quivalente
possdant le mme ordre de prcision (O(h
3
)). On propose la forme:
(7.11)
o on doit dterminer les paramtres at, a2, a3 et a4 de telle sorte que les
expressions 7.10 et 7.11 aient toutes deux une erreur en O(h
3
). On ne trouve
par ailleurs aucune drive partielle dans cette expression. Pour y arriver,
on doit recourir au dveloppement de Taylor en deux variables (voir la sec-
tion 1.6.2) autour du point (tn, y(tn)). On a ainsi:
!( tn + a3h, y( tn) + a4h) = f( tn, y( tn)) + a3h {} f(tnD;(tn))
+ a4h f(tnfJ:(tn)) + O(h2)
quations diffrentielles 369
La relation 7.11 devient alors:
y(tn+d = y(tn) +(al+ a2)hj(tn, y(tn))
h
2f(tn,y(tn)) h2f(tn,y(tn))
+ a2a3 t + a2a4 y
(7.12)
On voit immdiatement que les expressions 7.10 et 7.12 sont du mme
ordre. Pour dterminer les coefficients ai, il suffit de comparer ces deux
expressions terme terme:
coefficients respectifs de f(tn, y( tn) ):
ffi
. "f d j(tn, y(tn))
coe Cients respect! s e t :
. . d f(tn, y(tn))
coefficients respectifs e y :
On obtient ainsi un systme non linaire de 3 quations comprenant 4 in-
connues:
1 (a1 + a2)
1
-
a2a3
(7.13)
2
f(tn, y(tn))
=
a2a4
2
Le systme 7.13 est sous-dtermin en ce sens qu'il y a moins d'quations
que d'inconnues et qu'il n'a donc pas de solution unique. Cela offre une
marge de manuvre qui favorise la mise au point de plusieurs variantes de
la mthode de Runge-Kutta. Voici le choix le plus couramment utilis.
370 Chapitre 7
Mthode d'Euler modifie
On tablit sans peine que ces coefficients satisfont aux trois quations du
systme non linaire. ll suffit ensuite de remplacer ces valeurs dans l'qua-
tion 7.11. Pour ce faire, on doit ngliger le terme en O(h
3
) et remplacer la
valeur exacte y(tn) par son approximation Yn On obtient alors l'algorithme
suivant.
Algorithme 7.3: Mthode d'Euler modifie
1. tant donn un pas de temps h, une condition initiale (t
0
, y
0
) et un
nombre maximal d'itrations N
2. Pour 0 n N:
Y Yn + hj(tn, Yn)
Yn + (f(tn, Yn) + f(tn+l, Y))
(7.14)
crire tn+l et Yn+l
3. Arrt 0
Remarque 7.8
Pour faciliter les calculs, l'valuation de Yn+l a t scinde en deux tapes.
La variable temporaire y correspond tout simplement une itration de la
mthode d'Euler. On fait ainsi une prdiction y de la solution en tn+l qui est
corrige (et amliore) la deuxime tape de l'algorithme. On parle alors
d'une mthode de prdiction-correction. 0
quations diffrentielles
Exemple 7.8
Soit:
y'(t) = -y(t) + t + 1
et la condition initiale y(O) = 1. On choisit le pas de temps h = 0,1.
Itration 1:
y= 1 + 0,1( -1 + 0 + 1) = 1
371
qui est le rsultat obtenu l'aide de la mthode d'Euler. La deuxime
tape donne:
Y1 = 1 + 0,05( ( -1 + 0 + 1) + ( -1 + 0,1 + 1)) = 1,005
Itration 2:
De mme, la premire tape de la deuxime itration donne:
y= 1,005 + 0,1(-1,005 + 0,1 + 1) = 1,0145
La correction conduit son tour :
Y2 1,005 + 0,05(( -1,005 + 0,1 + 1) + ( -1,0145 + 0,2 + 1))
1,019 025
On retrouve ainsi les mmes rsultats qu'avec la mthode de Taylor
d'ordre 2. Cette similitude est exceptionnelle et est due au fait que les d-
rives partielles d'ordre suprieur ou gal 2 de la fonction f(t, y) sont
nulles. On peut montrer dans ce cas particulier que les mthodes de Taylor
~ d'Euler modifie sont parfaitement quivalentes. Ce n'est pas toujours le
cas.

Une autre mthode de Runge-Kutta d'ordre 2 qui est trs utilise est la
mthode du point milieu, qui correspond au choix suivant des coefficients ai.
Mthode du point milieu
a
3
= et a
4
= f(tn, y(tn))
a1 = 0, a2 = 1,
2 2
372 Chapitre 7
En remplaant ces valeurs des coefficients ai dans l'quation 7.11, on obtient
l'algorithme suivant.
Algorithme 7.4: Mthode du point milieu
1. tant donn un pas de temps h, une condition initiale (t
0
, Yo) et un
nombre maximal d'itrations N
2. Pour 0:::; n:::; N:
Yn+l
(7.15)
crire tn+l et Yn+l
3. Arrt 0
Remarque 7.9
L'algorithme prcdent illustre bien pourquoi cette mthode est dite du point
milieu. On remarque en effet que la fonction J( t, y) est value au point
milieu de l'intervalle [tn, tn+l] 0
Remarque 7.10
Les mthodes d'Euler modifie et du point milieu tant du mme ordre de
troncature locale, leur prcision est semblable. D'autres choix sont possibles
pour les coefficients ai, mais nous nous limitons aux deux prcdents. 0
7.4.2 Mthode de Runge-Kutta d'ordre 4
En reprenant le dveloppement de Taylor de la fonction j, mais cette
fois jusqu' l'ordre 5, un raisonnement similaire celui qui a men aux
mthodes de Runge-Kutta d'ordre 2 aboutit un systme de 8 quations
quations diffrentielles 373
non linaires comprenant 10 inconnues (voir Scheid, rf. [25]). Le rsultat
final est la mthode de Runge-Kutta d'ordre 4, qui reprsente un outil d'une
grande utilit.
Algorithme 7.5: Mthode de Runge-Kutta d'ordre 4
1. tant donn un pas de temps h, une condition initiale (to, y
0
) et un
nombre maximal d'itrations N
2. Pour 0 n N:
3. Arrt 0
Remarque 7.11
kt hj(tn, Yn)
k2
h kt
hf(tn + 2'Yn + 2)
k3
h k2
hf(tn + 2' Yn + 2)
k4 hf(tn + h, Yn + k3)
1
Yn+l Yn + 6 (kt + 2k2 + 2k3 + k4)
tn+t = tn + h
crire tn+l et Yn+l .
(7.16)
La mthode de Runge-Kutta d'ordre 4 est trs frquemment utilise en raison
de sa grande prcision qui est mise en vidence dans l'exemple suivant. 0
374 Chapitre 7
Exemple 7.9
Soit de nouveau l'quation diffrentielle:
y'(t) = -y(t) + t + 1 (y(O) = 1)
li suffit maintenant d'valuer les diffrentes constantes ki. la premire
itration (h = 0,1), on a:
kt
=
kz
=
k3
=
k4
=
0,1/(0' 1) = 0,1( -1 + 0 + 1) = 0
0,1/(0 + 0,05' 1 + 0) = 0,1( -1 + 0,05 + 1) = 0,005
0,1/(0 + 0,05' 1 + 0,0025) = 0,1( -1,0025 + 0,05 + 1) = 0,004 75
0,1/(0 + 0,1' 1 + 0,004 75) = 0,1( -1,004 75 + 0,1 + 1) = 0,009 525
ce qui entrane que:
1
Yt = 1 +
6
(o + 2(0,005) + 2(0,0045) + 0,009 525) = 1,004 8375
Une deuxime itration produit:
kt 0,1/(0,1' 1,004 8375)
0,1( -1,004 8375 + 0,1 + 1) = 0,009 516 25
k
2
0,1/(0,15, 1,009 595 625)
0,1( -1,009 595 625 + 0,15 + 1) = 0,014 040 438
k3 0,1/(0,15' 1,011857 719)
0,1( -1,011857 719 + 0,15 + 1) = 0,013 814 2281
k4 0,1/(0,2' 1,018 651 728)
= 0,1( -1,018 651 728 + 0,2 + 1) = 0,018 134 8272
ce qui entrane que:
1
y
2
= 1,004 8375 +-(kt+ 2kz + 2k
3
+ k4) = 1,018 730 9014
6
Le tableau qui suit compare la solution numrique et la solution exacte, et
donne l'erreur absolue.
quations diffrentielles 375
ti y( ti)
Yi
iy(ti)- Yil
0,0 1,0 1,0 0,0
0,1 1,004 837 4180 1,004 837 5000 0,819 x 10-
7
0,2 1,018 730 7798 1,018 730 9014 0,148 x 10-
6
0,3 1,040 818 2207 1,040 818 4220 0,210 x 10-
6
0,4 1,070 320 0460 1,070 320 2889 0,242 x 10-
6
0,5 1,106 530 6597 1,106 530 9344 0,274 x 10-
6
0,6 1,148 811 6361 1,148 811 9343 0,298 x 10-
6
0,7 1,196 585 3034 1,196 585 6186 0,314 x 10-
6
0,8 1,249 328 9641 1,249 329 2897 0 325 x 10-
6
'
0,9 1,306 569 6598 1,306 579 9912 0,331 x 10-
6
1,0 1,3678794412 1,367 879 7744 0,333 x 10-
6
On constate que 1 'erreur se situe autour de 10-
6
, ce qui se compare avan-
tageusement avec les erreurs obtenues l'aide de mthodes d'ordre moins
lev. On remarque galement une lgre croissance de l'erreur au fil des
itrations, ce qui indique encore une fois une propagation de l'erreur d'une
itration une autre.

li est intressant de comparer sur une base aussi rigoureuse que possible
les diffrentes mthodes vues jusqu' maintenant. On a constat que plus
l'ordre d'une mthode est lev, plus cette mthode est prcise. Par contre,
plus l'ordre de la mthode est lev, plus elle est coteuse en temps de
calcul. Par exemple, la mthode d'Euler (d'ordre 1) ne ncessite qu'une seule
valuation de la fonction f(t,Jf chaque pas de temps, alors que la mthode
d'Euler modifie (d'ordre 2) en demande 2 et que la mthode de Runge-Kutta
d'ordre 4 exige 4 valuations de la mme fonction. En d'autres termes, la
mthode de Runge-Kutta demande peu prs deux fois plus de calculs que
la mthode d'Euler modifie et quatre fois plus que la mthode d'Euler.
li est raisonnable de se demander s'il n'est pas prfrable d'utiliser la
mthode d'Euler avec un pas de temps 4 fois plus petit ou la mthode d'Euler
modifie d'ordre 2 avec un pas de temps 2 fois plus petit, plutt que de se
servir de la mthode de Runge-Kutta d'ordre 4. L'exemple qui suit permet
de comparer les diffrentes mthodes sur une base plus quitable.
376 Chapitre 7
Exemple 7.10
On considre l'quation diffrentielle habituelle:
y'(t) = -y(t) + t + 1 (y(O) = 1)
On recourt 3 mthodes de rsolution: la mthode d'Euler avec un pas
h = 0,025, la mthode d'Euler modifie avec h = 0,05 et la mthode de
Runge-Kutta d'ordre 4 avec h = 0,1. Ces valeurs de h permettent de com-
parer ces 3 mthodes sur la base de cots de calculs peu prs quivalents.
Le tableau suivant prsente les rsultats obtenus en t = 1 pour ces diffrents
choix. La valeur exacte de la solution est y(1) = 1,367 879 4412.
Mthode h Nombre de pas Rsultat Erreur
Euler 0,025 40 1,363 232 37417 0,464 x 10-
2
Euler modifie 0,05 20 1,368 038 62167 0,159 x 10-
3
Runge-Kutta 0,1 10 1,36787977441 0,333 x 10-
6
Les rsultats sont loquents. Mme en prenant un pas de temps quatre fois
plus petit, la mthode d'Euler reste trs imprcise par rapport celle de
Runge-Kutta d'ordre 4. On peut porter le mme jugement la mthode
d'Euler modifie. Il est donc gnralement prfrable d'utiliser des mthodes
d'ordre aussi lev que possible .

7.5 Mthodes pas multiples
il existe une autre approche de rsolution des quations diffrentielles
qui a donn naissance une famille de mthodes dites pas multiples. Le
principe la base de ces mthodes consiste intgrer l'quation diffrentielle:
y'(t) = f(t, y(t))
dans l'intervalle [tn, tn+t], c'est--dire:
i
tn+l itn+l
y'(u)du = f(u,y(u))du
tn tn
quations diffrentielles 377
ou encore
Cela nous amne un algorithme de la forme:
l
tn+l
Yn+1 = Yn + 1( u, Y( U) )du
tn
(7.17)
n reste trouver une approximation de l'intgrale prsente dans le membre
de droite. Pour y arriver, on utilise une interpolation de la fonction 1( u, y( u))
partir des valeurs de y( u) calcules aux itrations prcdentes. On note
ln = l(tn, Yn) l'approximation de l(tn, y(tn)). li est alors possible de cons-
truire une table de diffrences divises pour cette fonction et d'effectuer l'in-
terpolation par la mthode de Newton (voir l'quation 5.6). Une premire
approche consiste utiliser la table de diffrences divises suivante.
tn
ln
~ l [ t n tn-1]
tn-1 ln-1
l[tn, tn-1, tn-2]
l[tn-1, tn-2] f[tn, tn-1, tn-2, tn-3]
tn-2 ln-2 l[tn-1, tn-2, tn-3]
l[tn-2, tn-3]
tn-3 ln-3
On peut au besoin prolonger cette table. Le polynme d'interpolation s'crit:
+ l[tn, tn-1, tn-2, tn-3](t- tn)(t- tn-1)(t- tn-2) +
(7.18)
On peut valuer la fonction l(t, y(t)) au moyen de ce polynme dans l'in-
tervalle [tn, tn+ll L'valuation de Pn(t) ne requiert que des valeurs connues
provenant des pas de temps antrieurs.
378 Chapitre 7
On peut aussi utiliser la table de diffrences divises suivante.
tn+1 ln+l
l[tn+l, tn]
tn
ln
l[tn+1, tn, tn-1]
l[tn, tn-1] l[tn+1, tn, tn-1, tn-2]
tn-1 ln-1 l[tn, tn-1, tn-2]
l[tn-1, tn-2]
tn-2 ln-2
Le polynme correspondant est:
(7.19)
On remarque immdiatement que l'valuation de p ~ t ) requiert la connais-
sance pralable de ln+l = l(tn+b Yn+1) Or, on ne connat pas encore Yn+1
Nous verrons plus loin comment contourner cette difficult.
Considrons d'abord le polynme Pn(t). En augmentant successivement le
degr du polynme, on obtient des approximations de plus en plus prcises
que l'on peut insrer dans la relation 7.17. Par exemple, si on utilise le
polynme de degr 0, on a l'approximation:
l(t, y(t)) ~ Po(t) =ln
et on trouve:
qui n'est rien d'autre que l'expression de la mthode d'Euler. En utilisant
maintenant un polynme de degr 1, on a l'approximation:
l(t, y(t)) ~ P1(t) =ln+ l[tn, tn-1](t tn)
quations diffrentielles 379
En insrant cette expression dans l'quation 7.17, on obtient:
ou encore
h
Yn+1 = Yn + 2(3/(tn, Yn) + J(tn-1, Yn-1))
Dans l'quation prcdente, on a pos h = tn - tn-1, ce qui suppose que le
pas de temps est constant.
On remarque qu'il s'agit d'une mthode deux pas en ce sens que pour ob-
tenir Yn+l on doit utiliser Yn et Yn-1 Les mthodes vues jusqu' maintenant
(Euler, Taylor, Runge-Kutta, etc.) taient un pas. On pourrait continuer
ainsi en utilisant des polynmes de degr 2, 3, etc. En substituant ces po-
lynmes dans l'quation 7.17, on obtient les formules d'Adams-Bashforth.
Formules d'Adams-Bashforth
Yn+1 Yn + hfn (ordre 1)
h
Yn+1 Yn + 2(3/n - fn-1) (ordre 2)
h
Yn+1 Yn +
12
(23/n- 16/n-1 + 5/n-2) (ordre 3)
h ..
Yn+1 Yn +
24
(55/n-S ~ / n 1 + 37 fn-2- 9fn-3) (ordre 4)
Remarque 7.12
On dfinit l'erreur de troncature locale lie aux mthodes pas multiples
d'une manire semblable ce que l'on fait dans le cas des mthodes un
380 Chapitre 7
pas. Dans ce qui suit, on indique sans dmonstration l'ordre de l'erreur de
troncature locale au fur et mesure des besoins. On constate qu'en utilisant
un polynme de degr n dans la relation 7.17 on obtient une mthode
(n + 1) pas dont l'erreur de troncature locale est d'ordre (n + 1). D
Passons maintenant au polynme p ~ t ) . On peut reprendre le raisonne-
ment prcdent, mais cette fois-ci en prenant l'approximation:
f(t, y(t)) ~ p ~ t )
En particulier, le polynme de degr 0 est:
Po(t) = fn+l
et celui de degr 1 est:
On peut ainsi passer des polynmes de degr de plus en plus lev dans
l'quation 7.17 et obtenir les formules d'Adams-Moulton, qui sont rsumes
dans le tableau suivant.
Formules d'Adams-Moulton
Yn+l Yn + hfn+l
(ordre 1)
h
Yn+l Yn + 2Un+1 + fn) (ordre 2)
h
Yn+l Yn +
12
(5fn+1 + 8/n - fn-d (ordre 3)
h
Yn+l Yn +
24
(9fn+1 + 19/n - 5fn-1 + fn-2) (ordre 4)
Les formules d'Adams-Moulton sont dites implicites en ce sens que les
relations qui permettent d'valuer Yn+l dpendent de Yn+l lui-mme. Pour
contourner cette difficult, on combine les formules d'Adams-Bashforth et
quations diffrentielles 381
d'Adams-Moulton en des schmas dits prdicteurs-correcteurs. li s'agit sim-
plement d'utiliser les schmas d'Adams-Bashforth pour obtenir une premire
approximation

de Yn+I, qui est l'tape de prdiction. On fait appel en-
suite aux formules d'Adams-Moulton pour corriger et ventuellement am-
liorer cette approximation. li est important de remarquer que, dans ce cas,
l'valuation de fn+I dans les formules d'Adams-Moulton repose sur l'emploi
d
p ' ' d"
e Yn+
1
, c est-a- Ire:
On obtient ainsi les schmas suivants.
Schmas de prdiction-correction
p
-
Yn + hfn
Yn+I
-
Yn+I
-
Yn +
(ordre 1) -
p
h
-
Yn + 2(3/n - fn-1)
Yn+1
-
Yn+1
-
Yn + + fn)
(ordre 2)
-
p
h
-
Yn +
12
(23/n- 16/n-1 + 5/n-2)
Yn+1
-
Yn+I
-
Yn +

+ 8/n- fn-1)
(ordre 3) -
p
h
-
Yn +
24
(55fn- 59/n-1 + 37 fn-2- 9fn-3)
Yn+I
-
Yn+1
-
Yn +

(9/!+1 + 19/n- 5fn-1 + fn-2)


(ordre 4)
-
382 Chapitre 7
Remarque 7.13
L'initialisation des mthodes de prdiction-correction ncessite l'usage d'une
mthode un pas. Si on prend par exemple le schma d'ordre 4, il est clair
que n doit tre plus grand ou gal 3, car autrement on aurait besoin de
Y-b Y-2, etc. Or, au dpart, seul y
0
est connu, provenant de la condition
initiale. Les valeurs de y
1
, de y
2
et de y
3
doivent tre calcules l'aide
d'une autre mthode. Le plus souvent, on recourt une mthode de Runge-
Kutta qui est au moins du mme ordre de convergence que la mthode de
prdiction-correction que l'on souhaite utiliser. D
Exemple 7.11
On reprend l'quation diffrentielle:
y'(t) = -y(t) + t + 1 (y(O) = 1)
On fait appel cette fois aux mthodes de prdiction-correction d'ordre 2 et
4. Les premiers pas de temps sont calculs par une mthode de Runge-Kutta
d'ordre 4 qui a dj servi rsoudre cette quation diffrentielle. La mthode
de prdiction-correction d'ordre 2 exige de connatre Yo, qui vaut 1, et y
1
,
qui a t calcul au pralable l'aide de la mthode de Runge-Kutta d'ordre
4 et qui vaut 1,0048375 (une mthode de Runge-Kutta d'ordre 2 aurait t
suffis an te).
La premire itration donne d'abord une prdiction:
h
Y1 + 2(3/(tt, Yt)- f(to, Yo))
0 1
1,004 8375 + -t-(3/(0,1, 1,004 8375)- f(O,O, 1,0))
1,0048375+ 0,05(3(-1,0048375+ 0,1 + 1)- (-1 + 0 + 1))
1,019111875
quations diffrentielles 383
et ensuite une correction:
Y2 = Yl + YD +/(tt, y1))
1,004 8375 +


(!(0,2' 1,019111875) + /(0,1' 1,004 8375))
1,004 8375 + 0,05( -1,019 111 875 + 0,2 + 1) + ( -1,004 8375 + 0,1 + 1))
1,018 640 031
Les autres itrations sont rsumes dans le tableau suivant.
t
Yh Yn
en
0,0
-
1,000 000 000 0
0,1 1,004 837 500 0,819 640 40 x 10-
7
0,2 1,019111875 1,018 640 031 0,907 218 28 x 10-
4
0,3 1,041 085 901 1,040 653 734 0,164 486 07 x 10-
3
0,4 1,070 487 675 1,070 096 664 0,223 381 96 x 10-
3
0,5 1,106 614 851 1,106 261 088 0,269 57140 x 10-
3
0,5 1,148 826 758 1,148 506 695 0,304 940 11 x 10-
3
0,7 1,196 543 746 1,196 254173 0,331129 90 x 10-
3
0,8 1,249 241382 1,248 979 396 0,361493 25 x 10-
3
0,9 1,306 445195 1,306 208166 0,367 978 57 x 10-
3
1,0 1,367 725 911 1,367 511462 0,367 978 57 x 10-
3
L'erreur t = 0,1 est beaucoup plus faible qu'aux autres valeurs de t puisque
la solution numrique cet endroit a t calcule l'aide d'une mthode
d'ordre 4. Cela explique galement l'absence de prdicteur pour cette valeur.
De manire similaire, la mthode de prdiction-correction d'ordre 4 requiert
le calcul de Yt. de y
2
et de y
3
l'aide de la mthode de Runge-Kutta
d'ordre 4. Par la suite, il suffit d'utiliser l'algorithme:
Y
p -
n+l -
Yn+l =
h
Yn +
24
(55/n- 59/n-l + 37 fn-2- 9/n-3)
h ( p
Yn +
24
9/n+l + 19/n- 5/n-l + fn-2)
pour n 2: 3. La premire itration s'effectue comme suit:
384 Chapitre 7
Y: = Y3 + ~ ~ (55f(t3, Y3)- 59f(t2, Y2) + 37 f(tt, Yt)- 9f(to, Yo))
0 1
= 1,0408184+ ~ (55/(0,3, 1,0408184)- 59/(0,2, 1,0187309)
+37/(0,1, 1,0048375)-9/(0, 1))
= 1,107 0323
Y4 Y3 + ~ ~ (9f(t4, YD + 19f(t3, Y3) 5f(t2, Y2) +!(tt, Yt))
1,040 8184 + ~ ~ (9/(0,4' 1,107 0323) + 19/(0,3' 1,040 8184)
- 5/(0,2' 1,018 7309) + /(0,1' 1,004 8375))
1,070 3199
On obtient enfin les rsultats suivants:
t
y ~ Yn
en
0,0
-
1,0000000 0
0,1
-
1,0048375 0,819 640 x 10-
7
0,2
-
1,018 7309 0,148 328 x 10-
6
0,3 1,040 8184 0,201319 x 10-
6
0,4 1,107 0323 1,070 3199 0,127 791 x 10-
6
0,5 1,106 5332 1,106 5303 0,391302 x 10-
6
0,6 1,148 8136 1,148 8110 0,603 539 x 10-
6
0,7 1,196 5869 1,196 5845 0,772 415 x 10-
6
0,8 1,249 3302 1,249 3281 0,903 669 x 10-
6
0,9 1,3065706 1,306 5687 0,100 294 x 10-
5
1,0 1,367 8801 1,367 8784 0,107 514 x 10-
5
L'erreur est ici beaucoup plus petite qu'avec la mthode d'ordre 2 .

Remarque 7.14
La prcision des mthodes de prdiction-correction est comparable celle des
mthodes un pas d'ordre quivalent. Si on considre, par exemple, le schma
quations diffrentielles 385
d'ordre 4, les rsultats sont comparables ceux de la mthode de Runge-
Kutta d'ordre 4. Par contre, si on calcule le cot li l'emploi d'une mthode
selon le nombre d'valuations de la fonction f(t, y) chaque itration, on
se rend compte que la mthode de prdiction-correction d'ordre 4 est moins
coteuse. En effet, chaque itration de la mthode de Runge-Kutta ncessite
4 valuations de la fonction f(t, y), alors que la mthode de prdiction-
correction n'exige que 2 nouvelles valuations, compte tenu de celles qui ont
dj t effectues aux itrations prcdentes. Cela est galement vrai dans
le cas des mthodes d'ordre 2 et 3. 0
7.6 Systmes d'quations diffrentielles
Cette section traite de la faon dont on peut utiliser les mthodes de r-
solution d'quations diffrentielles ordinaires dans le cas de systmes d'qua-
tions diffrentielles avec conditions initiales. Fort heureusement, il suffit
d'adapter lgrement les mthodes dj vues.
La forme gnrale d'un systme de m quations diffrentielles avec condi-
tions initiales s'crit:
y ~ t )
y ~ t )
YHt)
ft(t, Yt(t), Y2(t), , Ym(t))
h(t, Yt(t), Y2(t), , Ym(t))
h(t, Yt(t), Y2(t), , Ym(t))
y:n(t) = fm(t, Yt(t), Y2(t), , Ym(t))
(Yt(to) = Yt,o)
(Y2(to) Y2,o)
(Y3(to) = Y3,o)
(Ym(to) = Ym,o)
(7.20)
Ici encore, on note y;(tn), la valeur exacte de la ie variable dpendante en
t = tn et Yi,n, son approximation numrique.
Remarque 7.15
Ces m quations sont couples en ce sens que l'quation diffrentielle rgis-
sant la variable dpendante y;(t) peut dpendre de toutes les autres variables
dpendantes. On remarque de plus les m conditions initiales qui assurent
l'unicit de la solution sous diverses hypothses que nous ne prcisons pas.
0
Parmi les techniques de rsolution des systmes d'quations diffren-
tielles, nous ne prsentons que la mthode de Runge-Kutta d'ordre 4. ll
386 Chapitre 7
est possible d'utiliser galement les autres mthodes dj vues, mais leur
prcision s'avre souvent insuffisante.
Algorithme 7.6: Mthode de Runge-Kutta d'ordre 4
1. tant donn un pas de temps h, des conditions initiales ( to, Yt,o, Y2,o, , Ym,o
et un nombre maximal d'itrations N
2. Pour 0::::; n::::; N:
Yi,n+t
Pouri= 1,2,3,,m:
hfi(tn, Yt,n, Y2,n, , Ym,n)
Pour i = 1, 2, 3, , m:
h h kt t k2 1 km t
fi(tn + 2' Yl,n + 2 Y2,n + 2 ' Ym,n + 2)
Pour i = 1, 2, 3, , m:
h kt 2 k2 2 km 2
hfi(tn + 2' Yt,n + 2 Y2,n + 2 ' Ym,n + 2)
Pour i = 1, 2, 3, , m :
hfi(tn + h, Yt,n + kt,3, Y2,n + k2,3, , Ym,n + km,3)
Pour i = 1, 2, 3, , m :
1
Yi,n + 6 ( ki,t + 2ki,2 + 2ki,3 + ki,4)
= tn + h
(7.21)
crire tn+t et Yi,n+t pour i = 1, 2, 3, , m
3. Arrt 0
Remarque 7.16
Cet algorithme est complexe en apparence. Pour bien en comprendre le prin-
cipe, il suffit d'y voir une application de la mthode de Runge-Kutta cha-
cune des quations diffrentielles. De plus, il est ncessaire de calculer les m
constantes ki,t avant de passer au calcul des constantes ki,
2
et ainsi de suite.
0
quations diffrentielles
Exemple 7.12
Soit le systme de deux quations diffrentielles suivant:
y ~ (t) = Y2(t)
y ~ t ) = 2y2(t)- YI(t)
(YI (0) = 2)
(Y2(0) = 1)
dont la solution analytique est:
On a alors:
YI(t) = 2et- tet
Y2(t) = et- tet
ft(t, YI(t), Y2(t)) = Y2(t)
h(t, YI(t), Y2(t)) = 2y2(t)- Yl(t)
387
(7.22)
et la condition initiale (to, YI,o, Y2,o) = (0, 2, 1). Si on prend par exemple
h = 0,1, on trouve:
kl,l
=
0,1(ft(O, 2, 1)) = 0,1
k2,1
=
0,1(/2(0, 2, 1)) = 0
k1,2
=
0,1(ft(0,05, 2,05, 1,0)) = 0,1
k2,2
=
0,1(/2(0,05, 2,05, 1,0)) = -0,005
k1,3
=
0,1(ft(0,05, 2,05, 0,9975)) = 0,099 75
k2,3
=
0,1(/2(0,05, 2,05, 0,9975)) = -0,0055
k1,4
=
0,1(ft(0,1, 2,099 75, 0,9945)) = 0,09945
k2,4
=
0,1(/2(0,1, 2,099 75, 0,9945)) = -0,011075
1
Y1,1 =
Y1,o + 6(0,1 + 2(0,1) + 2(0,099 75) + 0,099 45)
2,099 825
1
Y2,1 = Y2,o + 6(0 + 2( -0,005) + 2( -0,0055) + ( -0,011 075))
0,994 651 667
388 Chapitre 7

0
-2
-4
-6
0
.. <). .... <). .. .(> ..0\A<>-Q. ..... ......
... '0"-.C:. v --
... .; .... .; ... .;f... . .. .. + .. , .... "T .. ,, Y,: 0
. +- ....;... Solution analytique
""'.
.,
0,2
Y
2
: + Solution numrique
- - Solution analytique
0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0
Figure 7.4: Yi(t) = Y2(t) (Yt(O) = 2) et = 2y2(t)- Yt(t) (y2(0) = 1)
La figure 7.4 illustre les solutions analytiques y
1
(t) et y
2
(t) de mme que
leurs approximations respectives. On peut y apprcier la grande prcision
des rsultats.

7. 7 quations d'ordre suprieur
Dans la section prcdente, nous nous sommes intresss la rsolution
d'un systme de m quations diffrentielles d'ordre 1. Passons maintenant
la rsolution numrique d'une quation diffrentielle d'ordre m avec condi-
tions initiales. Ici encore, nous n'avons pas besoin de dvelopper de nouvelles
mthodes numriques, car une quation diffrentielle d'ordre m avec condi-
tions initiales est parfaitement quivalente un systme de m quations
diffrentielles d'ordre 1.
La forme gnrale d'une quation diffrentielle d'ordre m avec conditions
initiales est:
(7.23)
o y(i)(t) dsigne laie drive de y(t). Pour assurer l'unicit de la solution,
quations diffrentielles 389
on ajoute les m conditions initiales:
y(to) c1
yl
1
l(to) c2
yl
2
l(to) c3
(7.24)
y(m-
2
l(to) Cm-1
y(m-l)(to) Cm
Ces conditions portent sur la fonction y( t) et ses ( m - 1) premires drives
t = to.
Remarque 7.17
La premire drive de la variable y(t) est note y'(t) ou y!
1
l(t) selon la
situation. On se doit galement de distinguer la drive seconde y(2l(t) du
carr de la fonction y(t), qui est not (y(t))
2
. D
Thorme 7.1
L'quation diffrentielle d'ordre m 7.23 avec les m conditions initiales 7.24
est quivalente au systme de m quations d'ordre 1 suivant:
y ~ t ) Y2(t) Yl ( to) cl
y ~ t ) Y3(t) Y2( to) C2
y ~ t ) Y4(t) Y3( to) C3
(7.25)
Y:n-l(t)
Ym(t) Ym-l(to) Cm-1
y:n( t) f(t, Yt(t), Y2(t), , Ym(t)) Ym(to) Cm
Dmonstration:
Pour voir l'quivalence, il suffit d'introduire les m variables suivantes:
Yt(t) y(t)
Y2(t)
y(ll(t)
Y3(t)
y(2l(t)
(7.26)
Ym-l(t)
y(m-2)(t)
Ym(t)
y(m-l)(t)
390
On a alors:
y ~ t )
y ~ t )
y ~ t )
y(m-l)(t)
y(m)( t)
Y2(t)
Y3(t)
Y4(t)
Ym(t)
f(t, Yt(t), Y2(t), , Ym(t))
Chapitre 7
(7.27)
Un raisonnement similaire permet de dterminer les conditions initiales as-
socies aux variables Yi(t):
Yt ( to) y(to) Ct
Y2( to)
y(ll(to)
c2
Y3(to)
y(
2
l(to)
C3
(7.28)
Ym-l (to)
y(m-2)(to)
Cm-1
Ym(to)
y(m-l)(to)
Cm
ll est alors clair que le systme 7.27 sous les conditions initiales 7.28 est un
cas particulier de systmes d'quations d'ordre 1 dont la forme gnrale est
donne par l'quation 7.20. D
Exemple 7.13
Soit l'quation diffrentielle d'ordre 2:
avec les conditions initiales y(O) = 1 et y(
1
)(0) = 2. Suivant la dmarche
dcrite, on pose:
Yt(t) = y(t)
Y2(t) = y(
1
l(t)
On obtient alors le systme de 2 quations diffrentielles du premier ordre
suivant:
y ~ ( t) Y2 ( t) ( Yt ( 0) = 1)
y ~ t ) - Y2(t) + (Yt(t))
2
+ t
2
- 5 (y2(0) = 2)

quations diffrentielles 391
Exemple 7.14
Soit l'quation diffrentielle du troisime ordre:
avec les conditions initiales y(1) = 1, y(
1
)(1) = 0 et y(
2
)(1) = 3. On pose:
YI(t) y(t)
Y2 ( t) y (
1
) ( t)
Y3(t) y(
2
)(t)
On obtient le systme de 3 quations diffrentielles du premier ordre suivant:
y ~ t )
y ~ t )
y ~ t )
Remarque 7.18
Y2(t)
Y3(t)
(Y3(t))
2
+ 2y2(t) + (YI(t)? + t
4
+ 1

(YI(1) = 1)
(Y2(1) = 0)
(y3(1) = 3)
Une fois l'quation d'ordre m transforme en un systme de m quations dif-
frentielles d'ordre 1, on peut recourir l'algorithme 7.21 pour sa rsolution.
0
7.8 Mthode de tir
Dans cette section, nous faisons l'tude des quations diffrentielles li-
naires d'ordre 2 avec conditions aux limites de la forme:
y"( x)= a2(x)y'(x) + a1(x)y(x) + ao(x)
y( a) = Y a et y( b) = Yb
(7.29)
On suppose les fonctions ai( x) suffisamment rgulires pour assurer l'exis-
tence et l'unicit des quations diffrentielles que nous rencontrerons. La
diffrence entre les quations diffrentielles avec conditions initiales et celles
avec conditions aux limites est illustre la figure 7 .5. Dans le premier cas,
t = t
0
, la fonction y(to) ainsi que sa pente y'(to) sont connues. Dans le
392 Chapitre 7
cas des quations avec conditions aux limites, on ne connat que les valeurs
de la fonction y(x) aux deux extrmits de l'intervalle, soit y( a) et y(b). On
remarque qu'il n'y a aucune condition initiale lie la drive de la fonction
y( x) en x = a. La condition initiale sur la drive est remplace par une
condition sur la fonction y( x) l'autre extrmit de l'intervalle [a, b]. On
note galement que la variable indpendante est maintenant note x, car,
contrairement au cas des quations diffrentielles avec conditions initiales,
la variable indpendante des quations diffrentielles avec conditions aux
limites est le plus souvent une variable d'espace, rarement de temps.
Cette incursion dans le domaine des quations diffrentielles est facilite
par le fait que nous pouvons rsoudre l'quation 7.29 avec les outils que
nous possdons dj. ll suffit en effet de remarquer que l'on peut remplacer
l'quation diffrentielle 7.29 par deux quations diffrentielles avec conditions
initiales (voir Burden et Faires, rf. [2]).
Thorme 7.2
La solution de l'quation diffrentielle avec conditions aux limites 7.29
est donne par:
(7.30)
o y
1
(x) et y
2
( x) sont les solutions des quations diffrentielles avec condi-
tions initiales suivantes:
et
Dmonstration:
yr(x) = + at(X)Yt(x) + ao(x)
Yl (a) = Y a et (a) = 0
x)= + a1(x)y2(x)
Y2 (a) = 0 et (a) = 1
(7.31)
(7.32)
On doit vrifier en premier lieu les conditions aux limites. Si les fonctions
y
1
(x) et y
2
(x) satisfont respectivement aux quations 7.31 et 7.32, en x= a
on a:
(
Yb - Yt ( b)) (Yb - Yt ( b))
y(a) = Yt(a) + y
2
(b) Y2(a) = Ya + y
2
(b) 0 = Ya
quations diffrentielles
t
0
(a, Y a )
0
a
y(t) (inconnue) :
~ / / . /
(A)
(b, YdJ
y ~ x ) (inconnue) /1
... :
.. / !
. .
. .
. .
. :
. .
. .
. .
. .
. .
b
(B)
Droite de pente
y '(to)
x
Figure 7.5: Conditions initiales (A) et aux limites (B)
393
394 Chapitre 7
Par ailleurs:
(
Yb- Yt(b))
y(b) = Y1(b) + y
2
(b) Y2(b) = Yt(b) +(Yb- Yt(b)) =Yb
ll reste montrer que l'expression 7.30 est bien la solution de l'quation 7.29.
On pose:
c = (Yb- Yl(b))
Y2(b)
pour simplifier la notation. On doit donc s'assurer que y
1
(x) + cy
2
(x) est
la solution de l'quation diffrentielle 7.29. La drive seconde de y(x) peut
alors s'crire:
y"( x)= (Yl(x) + cy2(x))" x)+
Les fonctions y
1
(x) et y
2
( x) sont respectivement les solutions des qua-
tions 7.31 et 7.32. On a alors:
y"( x) = + a1(x)y1(x) + ao(x))
+ + a1(x)y2(x))
a2(x)(yHx) + + at(x)(Yt(x) + cy2(x)) + ao(x)
a2(x)y'(x) + a1(x)y(x) + ao(x)
ce qui montre bien que y(x), dfinie par 7.30, est la solution de l'qua-
tion 7.29. 0
Remarque 7.19
On note l'absence du terme ao( x) de l'quation diffrentielle relative Y2( x).
0
La figure 7.6 illustre les fonctions Yl (x) et y
2
(x) ainsi que la solution
recherche. Si on regarde les conditions initiales relatives y
1
(x) et y
2
(x),
on constate entre autres choses que ni Y1 (x) ni y
2
(x) ne vrifie la bonne
condition aux limites en x = b. Par contre, en utilisant l'quation 7 .30, on
obtient la bonne solution.
On peut rsoudre les quations diffrentielles avec conditions initiales 7.31
et 7.32 l'aide de la mthode de Runge-Kutta d'ordre 4. On doit d'abord
quations diffrentielles 395
'
..
Y a
.
,.
,1
Figure 7.6: Mthode de tir
transformer chacune d'elles en un systme de 2 quations diffrentielles
d'ordre 1. En posant:
u1(x) = Yl(x) et
u2 (x) = (x) et
on obtient les deux systmes suivants:
u2(x)
v1 (x) = Y2 (x)
V2 (X) = (X)

a2(x)u2(x) + a1(x)u1(x) + ao(x)
(u1(a) = Ya)
(u2(a)=0)
(x)

v2(x)
a2(x)v2(x) + a1(x)v1(x)
La solution finale peut alors s'crire:
selon les nouvelles variables u1 (x) et v1 (x).
( v1( a) = 0)
(v2(a) = 1)
(7.33)
396 Chapitre 7
Exemple 7.15
Soit l'quation diffrentielle suivante:
"( ) 2 '( ) 1
y x =--y x +-
x x
2
avec les conditions aux limites y(l) 0 et y(2) = 0,693147. On a dans ce
cas:
1
a
1
(x) = 0 et ao( x) = 2
x
Le tableau qui suit prsente la solution de cette quation diffrentielle. On
peut dmontrer facilement que la solution analytique de cette quation est
y( x) = ln x, ce qui permet de calculer l'erreur absolue qui figure dans la
dernire colonne du tableau.
x Y1 (x) = u1 (x) Y2 (x) = Vl (x)
y( x) Erreur
1,0 0,000 000 00 0,000 000 00 0,000 000 00 0,0000 X 10 U
1,1 0,004 402 51 0,090 907 02 0,095 309 75 0,4299 x 10-
6
1,2 0,015 656 98 0,166 663 59 0,182 320 96 0,5997 x 10-
6
1,3 0,031597 42 0,230 765 68 0,262 363 63 0,6325 x 10-
6
1,4 0,050 76044 0,285 710 54 0,33647164 0,5924 x 10-
6
1,5 0,072134 27 0,333 329 55 0,405464 59 0,5143 x 10-
6
1,6 0,095006 09 0,374 996 26 0,470003 21 0,4173 x 10-
6
1,7 0,118 865 94 0,41176106 0,530627 94 0,3123 x 10-
6
1,8 0,143 344 54 0,444 440 91 0,587 78646 0,2057 x 10-
6
1,9 0,16817191 0,473 680 79 0,641853 79 0,1008 x 10-
6
2,0 0,193149 33 0,499 996 70 0,69314718 0,4400 x 10-
9
On a employ la mthode de Runge-Kutta d'ordre 4 pour le calcul de y
1
(x)
et de Y2( x). On note que:
Y1(b) = Y1(2,0) = 0,19314933 et Y2(b) = Y2(2,0) = 0,49999670
ce qui permet le calcul de y( x) l'aide de l'quation 7.30 .

quations diffrentielles 397
On rencontre frquemment un autre type d'quations diffrentielles avec
conditions aux limites de la forme:
y"( x)= a2(x)y'(x) + a1(x)y(x) + ao(x)
y(a) = Ya et y'(b) = y ~
(7.34)
La deuxime condition aux limites (c'est--dire en x = b) porte sur la drive.
Un raisonnement similaire au prcdent conduit au thorme suivant dont
la dmonstration est laisse en exercice.
Thorme 7.3
La solution de l'quation diffrentielle avec conditions aux limites 7.34
est donne par:
(
y' y' (b ))
y(x)=Yl(x)+ b ~ d Y2(x)
(7.35)
o y
1
(x) et y
2
(x) sont les solutions des quations diffrentielles avec condi-
tions initiales 7.31 et 7.32. 0
Remarque 7.20
Suivant la notation du systme 7.33, la solution 7.35 s'crit galement:
en fonction des variables des deux systmes linaires d'ordre 1. 0
Exemple 7.16
Une tige mtallique (voir Reddy, rf. [24]) de diamtre D = 0,02 rn et de
longueur L = 0,05 rn est expose l'air ambiant une temprature T
00
=
20 C. La premire extrmit de la tige est maintenue T
0
= 320 C, tandis
que l'autre extrmit est suppose parfaitement isole, c'est--dire qu'il n'y
a aucun flux de chaleur cette extrmit ou encore que:
T'(L) = 0
La figure 7. 7 rsume la situation. L'quation diffrentielle rgissant la tem-
398 Chapitre 7
Figure 7. 7: Transfert thermique dans une tige mtallique
prature T( x) dans la tige est de la forme:
o O(x) = T(x)- T
00
et:
Dans la dfinition de N, f3 est un coefficient de transfert de chaleur avec le
milieu ambiant (/3 = 100 W C-
1
m-
2
) et k = 50 W C-
1
m-
1
est la
conductivit thermique.
Les conditions aux limites relatives 0 sont donc:
0(0) = T(O)- 20 C = 300 C et 0'(0,05) = 0
ce qui correspond aux conditions du thorme prcdent. Les valeurs des
quations diffrentielles 399
T(x)
0 0,005 0,010 O,Ql5 O,o20 0,025 O,Q30 O,Q35 0,040 0,045 0,050
x
Figure 7.8: Temprature dans une tige mtallique: T( x) = 0( x) + T
00
diffrentes variables pour h = 0,005 sont les suivantes.
x Yl (x) = Ut (x) Y2 (x) = v1 (x) 0( x) Erreur
0,000 300,00000 0,000 000 000 300,00000 0,0000 X 10+
0
0,005 301,50125 0,005 008 333 278,615 36 0,2918 x 10-
4
0,010 306,020 02 0,010 066 792 260,01918 0,5371 x 10-
4
0,015 313,60154 0,015 226 002 244,02537 0,7417 x 10-
4
0,020 324,32168 0,020 537 599 230,473 83 0,9109 x 10-
4
0,025 338,287 74 0,026 054 7 43 219,228 95 0,1048 x 10-
3
0,030 355,639 48 0,031832 651 210,17819 0,1159 x 10-
3
0,035 . 376,550 59 0,037 929 150 203,230 95 0,1244 x 10-
3
0,040 401,23033 0,044 405 257 198,317 72 0,1307 x 10-
3
0,045 429,925 71 0,051 325 786 195,389 31 0,1350 x 10-
3
0,050 462,923 93 0,058 759 999 194,416 42 0,1373 x 10-
3
Bien qu'elles ne figurent pas dans ce tableau, les valeurs:
y ~ 0 , 0 5 ) = 7051,1999 et y ~ 0 , 0 5 ) = 1,543079
obtenues lors de la rsolution pour y
1
(x) et y
2
( x) sont ncessaires pour d-
terminer y( x) en vertu de l'quation 7 .35. Ici encore, une solution analytique
existe:
O( x) =
300
cosh( N ( L - x))
cosh(NL)
400 Chapitre 7
qui permet d'valuer l'erreur commise. La figure 7.8 prsente la solution
calcule. On remarque que les deux conditions aux limites sont bien vrifies
et en particulier que la pente de la temprature est nulle en x = 0,05, ce qui
confirme que le flux de chaleur est nul.

7.9 Mthodes des diffrences finies
Dans cette section, nous nous intressons uniquement aux quations dif-
frentielles avec conditions aux limites et nous proposons une solution de
remplacement la mthode de tir de la section prcdente. ll s'agit de la
mthode des diffrences finies, qui constitue la principale application des
techniques de diffrentiation numrique que nous avons vues. De plus, cette
mthode s'tend facilement aux quations aux drives partielles, ce qui n'est
pas le cas de la mthode de tir.
On considre l'quation diffrentielle avec conditions aux limites:
y"(x) = a2(x)y'(x) + a1(x)y(x) + ao(x)
y(a) = Ya et y(b) =Yb
que l'on rcrit sous la forme:
y"(x)- a2(x)y'(x)- a1(x)y(x) = ao(x)
y(a) = Ya et y(b) =Yb
L'objectif est toujours de trouver une approximation Yi de y( Xi) en certains
points Xi de l'intervalle [a, b]. On divise d'abord cet intervalle en n sous-
intervalles de longueur h = ( b- a)/ n et on note x
0
= a, Xi = a + ih et enfin
Xn = a + nh = b. Les conditions aux limites imposent immdiatement que
Yo = Ya et que Yn = Yb ll reste donc dterminer les ( n - 1) inconnues
Yl, Y2, , Yn-1 Pour ce faire, on construit un systme linaire de dimen-
sion ( n - 1 ). La stratgie de rsolution consiste remplacer dans l'quation
diffrentielle toutes les drives de la fonction y( x) par des formules aux dif-
frences finies, et ce en chaque point Xi pour i allant de 1 (n- 1). Plus
prcisment, au point Xi, l'quation diffrentielle s'crit:
On introduit ici les diffrences centres:
y"(xi) = Yi+1- ~ + Yi-1 + O(h2) et y'(xi) = Yi+l
2
h Yi-1 + O(h2)
quations diffrentielles
pour obtenir:
Yi+l - 2yi + Yi-1
h2
401
En ngligeant le terme d'erreur O(h
2
) et en multipliant par -2h
2
, on trouve:
- (2 + ha2(xi)) Yi-1 + ( 4 + 2h
2
a1 (xi))Yi + ( -2 + ha2(xi)) Yi+1 = -2h
2
ao( Xi)
Cette dernire relation est vrifie pour i = 1, 2, , ( n - 1 ). On note
de plus que, dans la premire quation ( i = 1), Yi-1 = Yo = Ya et est une
quantit connue. De mme, l'autre extrmit ( i = n- 1 ), on a Yi+1 = Yn =
Yb On est ainsi amen rsoudre le systme linaire:
4 + 2h
2
a1(x1) -2 + ha2(x1)
-2- ha2(x2) 4 + 2h
2
at(x2)
0
0 0
0 -2- ha2(Xn-2) 4 + 2h
2
a1(Xn-2) -2 + ha2(Xn-2)
0 -2- ha2(Xn-1) 4 + 2h
2
a1(Xn-1)
Y1 -2h
2
ao(x1) + (2 + ha2(x1))ya
Y2 -2h
2
ao(x2)
x (7.36)
Yn-2 -2h
2
ao(Xn-2)
Yn-1 -2h
2
ao(Xn-1) + (2- ha2(xn-d)Yb
Cette matrice est tridiagonale. Sa diagonale principale vaut 4 + 2h
2
a1(xi)
pour i = 1, 2, , ( n - 1 ), sa diagonale infrieure vaut -2 - ha2( Xi) pour
i = 2, 3, , ( n- 1) et enfin sa diagonale suprieure vaut -2 + ha2( Xi) pour
i = 1, 2, , ( n-2). Tous les autres termes sont nuls. La rsolution numrique
d'une telle matrice est trs rapide. On remarque de plus que les premire et
dernire lignes tiennent compte des conditions aux limites, par le biais du
terme de droite.
Exemple 7.17
On considre l'quation diffrentielle avec conditions aux limites:
Il 2 1 1
y (x)= --;;y (x)+ x2
y(O) = 0 et y(1) = 0,693147
402 Chapitre 7
dj rsolue l'aide de la mthode de tir. Dans ce cas, a
2
(x) = -2/x, a
1
(x) =
0 et a
0
(x) = 1jx
2
. Les conditions aux limites sont Ya = 0 et Yb= 0,693147.
Si on prend 10 interv:alles (h = 0,1), le systme 7.36 est de dimension 9 et
s'crit (les coefficients de la matrice ont t tronqus 3 chiffres):
4,0 -2,18 0,0 0,0 0,0 0,0 0,0 0,0 0,0
-1,83 4,00 -2,16 0,0 0,0 0,0 0,0 0,0 0,0
0,0 -1,84 4,0 -2,15 0,0 0,0 0,0 0,0 0,0
0,0 0,0 -1,85 4,0 -2,14 0,0 0,0 0,0 0,0
0,0 0,0 0,0 -1,86 4,0 -2,13 0,0 0,0 0,0
0,0 0,0 0,0 0,0 -1,87 4,0 -2,12 0,0 0,0
0,0 0,0 0,0 0,0 0,0 -1,88 4,0 -2,11 0,0
0,0 0,0 0,0 0,0 0,0 0,0 -1,88 4,0 -2,11
0,0 0,0 0,0 0,0 0,0 0,0 0,0 -1,89 4,0
Y1
-0,016 53
Y2
-0,013 89
Y3
-0,01183
Y4
-0,010 20
x
Ys
-0,008 89
Y6
-0,007 81
Y7
-0,006 92
Ys
-0,006 17
yg
+1,453 72
On obtient les rsultats suivants:
Xi y( xi)
Yi iy(xi)- Yil
1,0 0,000 0000 0,000 0000 0,000 00 X 10 -u
1,1 0,095 3101 0,095 3410 0,308 38 x 10-
4
1,2 0,182 3215 0,182 3676 0,460 66 x 10-
4
1,3 0,262 3642 0,262 4157 0,515 12 x 10-
4
1,4 0,336 4722 0,336 5229 0,507 48 x 10-
4
1,5 0,405 4651 0,405 5111 0,460 29 x 10-
4
1,6 0,470 0036 0,470 0424 0,388 08 x 10-
4
1,7 0,5306282 0,5306582 0,300 39 x 10-
4
1,8 0,587 7866 0,587 8070 0,203 57 x 10-
4
1,9 0,6418538 0,6418640 0,10188 x 10-
4
2,0 0,6931470 0,6931470 0,000 00 x 10-
0
On remarque immdiatement que l'erreur commise ici est plus grande que
l'erreur produite par la mthode de tir. Cette diffrence d'erreur provient de
quations diffrentielles 403
l'ordre de prcision des mthodes employes. En effet, la mthode de tir est
d'ordre 4 puisqu'elle s'appuie sur une mthode de Runge-Kutta d'ordre 4.
Dans le cas de la mthode de diffrences finies, l'erreur commise est d'ordre
2 puisqu'on a utilis des diffrences centres d'ordre 2. On pourrait amliorer
la prcision en insrant par exemple des diffrences centres d'ordre 4 .

Remarque 7.21
Le choix de diffrences centres, plutt que de diffrences avant ou arrire,
permet d'obtenir des rsultats davantage prcis, car d'ordre plus lev. Tou-
tefois, il peut s'avrer utile dans certaines situations d'utiliser des diff-
rences avant ou arrire lorsqu'on recherche des schmas aux diffrences finies
quelque peu diffrents. D
7.10 Applications
7.10.1 Problme du pendule
Comme nous l'avons vu au chapitre 1, si un pendule de masse m et de
longueur l fait un angle O(t) avec la verticale, O(t) est la solution de l'quation
diffrentielle:
O"(t)
0(0)
O' ( 0)
c JO' ( t) g sin ( 0( t))
m l
(7.37)
(7.38)
(7.39)
Le paramtre Cf est un coefficient de frottement qui est souvent nglig et
g = 9,8 m/s
2
. n s'agit bien sr d'une quation diffrentielle d'ordre 2 avec des
conditions relatives la position et la vitesse angulaire initiales. Suivant
les techniques de la section 7.7, on transforme cette quation d'ordre 2 en
un systme de 2 quations d'ordre 1. Ce systme s'crit, dans le cas d'un
pendule de masse et de longueur unitaires:
y ~ t ) = Y2(t) (Yt(O) = Oo)
y ~ t ) = -CJY2(t)- gsin(yt(t)) (y2(0) = Oti)
(7.40)
Dans cet exemple, la variable y
1
(t) est l'angle O(t) et la variable Y2(t) est
la vitesse angulaire O'(t). On rsout ce systme l'aide de la mthode de
404 Chapitre 7
0,15
9 (t)
0,10
0,05
0
-0,05
-0,10
-0,15
0 2 4 6 8 10
Temps (s)
Figure 7.9: Pendule: Cf = 0, sin(O(t)) ~ O(t) avec Oo = 0,1 et Ob= 0
Runge-Kutta d'ordre 4 et de l'algorithme 7.21. Dans un premier temps, on
nglige le terme de frottement en posant Cf = 0, qui est une approximation
frquemment utilise. De plus, on fait appel l'approximation sin(O(t)) ~
O(t), qui est valide dans le cas o l'angle O(t) reste petit en tout temps. Le
systme 7.40 devient alors:
y ~ ( t) Y2 ( t) ( Yt ( 0) = Oo)
y ~ t ) -gyt(t) (y2(0) =Ob)
Pour les conditions initiales 0
0
= 0,1 rad et Ob = 0, qui indiquent que la
position initiale du pendule fait un angle de 0,1 rad avec la verticale et que
sa vitesse angulaire initiale est nulle, on obtient les rsultats de la figure 7 .9.
Les conditions initiales choisies rsultent en des oscillations de faible am-
plitude. Si on retire l'approximation sin( 0( t)) ~ 0( t) tout en maintenant les
mmes conditions initiales, on doit rsoudre:
y ~ t ) Y2(t) (Yt(O) = Oo)
y ~ t ) -g sin(yt(t)) (y2(0) =Ob)
La figure 7.10 illustre la solution de ce nouveau systme. Les courbes des fi-
gures 7.9 et 7.10 sont parfaitement superposables, ce qui dmontre la validit
de l'approximation sin(O(t)) ~ O(t) pour ces conditions initiales.
Cette approximation n'est cependant plus valable dans le cas o les angles
0( t) deviennent grands. Ce cas est illustr la figure 7.11, o on a retenu les
quations diffrentielles 405
0,15
9 (t)
0,10
0,05
0
-0,05
-0,10
-0,15
0 2 4
Figure 7.10: Pendule: Cf
2,0
9(t)
1,5
sin( 9)= 9
1,0
0,5
0
-0,5
-1,0
-1,5
-2,0
0 2 4
Figure 7.11: Pendule: Cf
6
0 avec Oo
6
0 avec Oo
8 10
Temps (s)
0,1 e t ) ~ = 0
8 10
Temps (s)
1,5et Ob= 0
406 Chapitre 7
9 (t)
0,10
0,05
-0,05
-0,10
-0,15 L__ __ ___L ___ _J__ ___ __J_ ___ .J__ __ ___j
0 2 4 6 8 10
Temps (s)
Figure 7.12: Pendule: Cf = 0,1 avec Oo = 0,1 e t ) ~ = 0
conditions initiales ()
0
= 1,5 rad et ) ~ = 0 qui permettent des oscillations de
forte amplitude. On voit nettement la figure 7.11 que, bien que les deux
courbes demeurent priodiques, elles diffrent de manire importante.
Un dernier exemple permet de mettre en vidence l'influence de la force
de frottement et du coefficient CJ La figure 7.12 illustre le cas o Cf = 0,1.
On voit trs nettement l'amplitude des oscillations diminuer. Le pendule
finit par s'arrter compltement. Un coefficient Cf plus grand amortit plus
rapidement les oscillations.
7.10.2 Systmes de masses et de ressorts
Prenons comme seconde application un systme de deux masses et de trois
ressorts, tel que l'illustre la figure 7.13 (voir Strang, rf. [21]). La position
d'quilibre est atteinte lorsque les forces de tension dans les ressorts sont
quilibres par le poids des masses.
On note mi, les masses et ci, les coefficients de rigidit des ressorts. La
loi de Hooke tablit une relation linaire entre la force fi et l'longation ei
du ie ressort de la forme:
(7.41)
Si on perturbe l'quilibre en dplaant une ou plusieurs masses, le systme
se met vibrer suivant les quations:
az-
M__}!_ =-Kif
dt
2
quations diffrentielles 407
Figure 7.13: Systme de masses et de ressorts
ou encore
(7.42)
o le vecteur il(t) = [ut(t) u
2
(t)]Y exprime le dplacement de chacune des
masses par rapport la position d'quilibre. Le vecteur vitesse est bien sr
not ii' ( t). Les conditions initiales il( 0) = [Ut ,o u2,of et il' ( 0) = [ ~ ,o u ~ o f
compltent le systme. La matrice M est la matrice de masse dfinie par:
K est la matrice de rigidit dfinie par:
o A est la matrice d'incidence:
408
Chapitre 7
et C est la matrice:
La matrice d'incidence A est construite de telle sorte que:
En d'autres mots, pour des dplacements ii donns, Ail donne l'longation
de chaque ressort.
Le systme 7.42 est en fait le rsultat de l'application de la loi de
Hooke 7.41 et du second principe de Newton. Dans le cas o les masses
mi et les constantes de rigidit Ci sont unitaires, les matrices M et C de-
viennent des matrices identit et la matrice K est simplement gale AT A,
c'est--dire:
K=
[
2 -1 l
-1 2
Le systme 7.42 devient alors:
-2ut(t) + u2(t) (ut(O) = Ut,o et =
= Ut(t)- 2u2(t) (u2(0) = u2,o et u2(0) = u2,o)
o Ui,o et sont respectivement la position et la vitesse initiales de la
ie masse. ll faut maintenant ramener ce systme de 2 quations diffrentielles
d'ordre 2 un systme de 4 quations diffrentielles d'ordre 1. n suffit pour
ce faire de poser:
et le systme devient:
(t)
Y2(t)
yj(t)

Yt(t) Ut(t)
Y2(t)
Y3(t) u2(t)
Y4(t) u2(t)
Y2(t)
-2yt(t) + Y3(t)
Y4(t)
Yt(t)- 2y3(t)
(Yt(O) = Ut,o)
(y2(0) =
0
)
'
(Yt(O) = u2,o)
(y2(0) = u2,o)
La figure 7.14 illustre les dplacements de chacune des deux masses en
fonction du temps selon les conditions initiales ii(O) = [0,1 O,Of et '(O) =
[0,0 O,Of qui indiquent qu'une seule des masses est initialement dplace.
quations diffrentielles
0,15 ,.------------------------,
- Solution analytique Solution numrique
0,10
0,05
0
-0,05
-0,10
-0,15 L----'----'----'---'-----'----'----'-----'
0 10 20 30 40 50 60 70
t
Figure 7.14: Dplacement Ut(t) de la masse 1
80
0,15 ,.------------------------,
- Solution analytique Solution numrique
0,10
0,05
0
-0,05
-0,10
-0,15 '-----'----'----'----'-----'-----'----'-----'
0 10 20 30 40 50 60
t
70
Figure 7.15: Dplacement u
2
(t) de la masse 2
80
409
410 Chapitre 7
On remarque le caractre non priodique de chacun des dplacements.
On pourrait montrer que la solution analytique est de la forme:
Ut(t) = Yt(t)
u2(t) = Y3(t)
0,05( cos t +cos v'3t)
0,05( cos t - cos v'3t)
Cette solution est une combinaison de deux signaux dont les frquences res-
pectives sont 1 et v'3. Ces frquences sont dites incommensurables, ce qui
signifie que leur rapport est un nombre irrationnel. C'est ce qui explique la
non-priodicit de la solution.
7.10.3 Attracteur trange de Lorenz
On connat l'importance accorde aux prvisions mtorologiques dans la
vie de tous les jours. n importe en effet de pouvoir prdire les conditions
climatiques afin de planifier bon nombre d'activits. Ce besoin est encore
plus aigu lorsque se prparent des ouragans ou de simples temptes de neige.
Or, la prvision mtorologique est largement base sur les mthodes
numriques. Les travaux dans ce domaine remontent quelques dizaines
d'annes. Un des pionniers fut Lorenz (rf. [17]), qui mit au point un modle
trs simple de la forme:
y ~ t ) a(y2(t)- Yt(t))
(7.43)
Selon Gulick (rf. [13]), la variable y
1
(t) est proportionnelle l'intensit des
mouvements de convection, la variable y
2
(t) est proportionnelle la diff-
rence de temprature entre les courants ascendants et descendants, tandis
que la variable y
3
(t) est proportionnelle la distorsion du profil de temp-
rature vertical par rapport au profil linaire. Les paramtres sont a = 10,
r = 2,666 6667 et b = 28.
Lors de l'introduction de ce modle, Lorenz s'est livr malgr lui une
exprience numrique que nous allons tcher de reproduire ici. partir de
la condition initiale [Yt(O) Y2(0) y3(0)jT = [1 0 OjY (on obtiendrait des r-
sultats similaires avec toute autre condition initiale) et d'un pas de temps
h = 0,01, Lorenz entreprit une simulation numrique qui devait produire
une prvision mtorologique sur plusieurs jours. Cependant, comme cela
quations diffrentielles 411
z o . . . ~ . ~
15
10
5
0 j ___ _
1\
-5
-10
-15
-20 '-----------'---------....L..-----'---------J
80 85 90 95 100
t
Figure 7.16: Lorenz: premire simulation
arrive souvent dans ce type de calcul, une malheureuse panne d'lectricit
se produisit autour de t = 100. Plutt que de reprendre les calculs partir
du dbut - les ordinateurs de l'poque taient beaucoup plus lents que ceux
d'aujourd'hui -,Lorenz choisit de reprendre la simulation partir de t = 80
correspondant la dernire solution imprime par son programme. Cela lui
permettait de comparer les deux simulations sur une priode d'environ 2 000
pas de temps, c'est--dire entre t = 80 et t = 100, et de vrifier ainsi si tout
se passait bien. La nouvelle condition initiale tait [y
1
(80) y
2
(80) y
3
(80)jT =
[-2,4881 1,5045 26,865jT.
Lorenz constata sa grande surprise que les deux solutions n'taient pas
du tout identiques. La figure 7.16 montre les rsultats de la premire simu-
lation pour les 2 000 derniers pas de temps (les 8 000 premiers pas de temps
ne sont pas illustrs). De son ct, la figure 7.17 montre les 2 000 premiers
pas de temps partir de la condition initiale [-2,4881 1,5045 26,865jT. On
constate aisment que les deux courbes sont similaires au dbut mais qu'elles
diffrent totalement par la suite. La figure 7.18 prsente la superposition des
deux courbes.
ll fallait donner une explication ce curieux phnomne. Aprs plusieurs
jours, on comprit que le format suivant lequel le programme crivait la solu-
tion dans un fichier ne comptait que 5 chiffres significatifs, alors que les cal-
culs taient effectus avec l'quivalent de 7 ou 8 chiffres (en simple prcision).
La solution de la premire simulation t = 80 qu'aurait d imprimer l'ordi-
nateur tait [Yt (80) Y2(80) y3(80)jT = [ -2,4881258 1,504 5223 26,865 757]T.
412 Chapitre 7
20
Yt(t)
15
10
5
\1 v v v
0 Il_-
--
---------
-
-----1--r\
-\
~
-
f''
-5
-10
-15
-20
80 85 90 95 100
t
Figure 7.17: Lorenz: deuxime simulation
2 o r . . ~ ~
Yt(t)
15
10
-5
-10
-15
2 o L ~ ~ ~ ~
80 85 90 95 100
t
Figure 7.18: Lorenz: superposition des deux courbes
quations diffrentielles 413
n y avait donc une lgre imprcision dans la condition initiale de la deuxime
simulation. Ainsi, une petite erreur dans la connaissance de la condition ini-
tiale entrane une trs grande erreur dans la prvision numrique.
Une telle sensibilit par rapport aux conditions initiales est dramatique
en ce qui concerne la prvision mtorologique. En effet, les conditions ini-
tiales pour tous les modles numriques de prvision sont obtenues partir
d'observations et de mesures dont la prcision n'est pas parfaite. n y a donc
toujours une erreur dans les conditions initiales du modle. L'exprience de
Lorenz dmontre que, dans ces conditions, la prvision mtorologique
court terme est possible, mais qu'il en est tout autrement des prvisions
moyen et long terme. En effet, aprs un temps relativement court, l'impr-
cisioN. relative aux conditions initiales domine la simulation. C'est ce qu'on
appelle l'effet papillon. Le simple battement des ailes d'un papillon Tokyo
pourrait tre suffisant pour provoquer une tempte tropicale aux Antilles ...
Terminons ce cas d'application en prsentant le plan de phase que l'on
obtient en traant dans l'espace 3 dimensions les points (y
1
(t), Y2(t), y3(t)).
TI s'agit de l'attracteur trange de Lorenz. Les plans de phase sont souvent
utiliss pour visualiser l'interaction des diffrentes variables d'un systme
entre elles. TI s'agit de la trajectoire trace par la solution (Yl(t), Y2(t), y3(t))
partir de la condition initiale. On obtiendrait un rsultat semblable en
partant de toute autre condition initiale. C'est pourquoi on qualifie cet at-
tracteur d'trange. Quelle que soit la condition initiale, la figure finale sera
toujours celle de la figure 7.19. Les trajectoires sont donc invariablement
attires par cet objet que l'on nomme attracteur. Par ailleurs, si on
considre deux conditions initiales trs voisines, les deux trajectoires seront
attires par l'attracteur de Lorenz, mais elles suivront chacune un parcours
totalement diffrent. C'est pourquoi on dit que l'attracteur est trange. C'est
cette extrme sensibilit aux conditions initiales qui cre l'effet papillon et
qui rend ce type de problmes tout fait passionnant.
414
40
30
20
10
~ 5 -10
Chapitre 7
5 10 15
Figure 7.19: Attracteur de Lorenz
1
1
1
1
20
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
quations diffrentielles 415
7.11 Exercices
1. Faire trois itrations avec h = 0,1 des mthodes d'Euler, d'Euler mo-
difie, du point milieu et de Runge-Kutta d'ordre 4 pour les quations
diffrentielles suivantes:
a) y'(t) = tsin(y(t))
b) y'(t) = t
2
+ (y(t)? + 1
c) y'(t) = y(t)et
2. L'quation diffrentielle:
(y(O) = 2)
(y(1) = 0)
(y(O) = 2)
y'(t) = y(t) + e
2
t (y(O) = 2)
possde la solution analytique:
a) En prenant h = 0,1 , faire 3 itrations de la mthode d'Euler modi-
fie et calculer l'erreur commise sur y
3
en comparant les rsultats avec
la solution analytique y(0,3).
b) En prenant h = 0,05 , faire 6 itrations de la mthode d'Euler
modifie et calculer l'erreur commise sur y
6
en comparant les rsultats
avec la solution analytique y(0,3).
c) Faire le ratio des erreurs commises en a) et en b), et commenter le
rsultat en fonction de l'erreur de troncature locale lie la mthode
utilise.
d) Utiliser l'extrapolation de Richardson pour obtenir une meilleure
approximation de y(0,3).
3. Refaire l'exercice prcdent, mais cette fois l'aide de la mthode de
Runge-Kutta d'ordre 4.
4. Montrer que l'ordre de l'erreur de troncature locale de la mthode du
point milieu est 2. Identifier en premier lieu la fonction <P(t, y(t)).
5. Faire deux itrations de la mthode de Runge-Kutta d'ordre 4 (en
prenant h = 0,1) pour le systme d'quations diffrentielles suivant:
~ (t) = Y2 ( t) + Yl ( t) ( Yl ( 1) = 2)
y ~ (t) = Y1 ( t) + t ( Y2 ( 1) = 1)
416 Chapitre 7
6. Transformer les quations diffrentielles d'ordre suprieur suivantes en
systmes d'quations diffrentielles d'ordre 1.
a) y(
3
)(t) = y(
2
)(t) + y(
1
)(t)- y(t) + 1
y(O) = 2, y(
1
)(0) = 2 et y(
2
)(0) = 1
b) y(
2
)(t)=t
2
+(y(t)?+1
y(1) = 0 et y(l)(1) = 2
c) y(4)(t) = y(2)(t)et + (y(3)(t))3
y(O) = 2, y(l)(O) = 1, y(
2
)(0) = 0 et y(
3
)(0) = 4
7. On doit rsoudre l'quation diffrentielle d'ordre 2:
y(
2
)(x) + y(
1
)(x)- 2y(x) + 16 = 0
avec y(O) = -7 et y(3) = 12,0855, l'aide d'une mthode de tir.
a) Donner l'expression des deux quations diffrentielles d'ordre 2 avec
conditions initiales qui permettent de rsoudre cette quation diffren-
tielle.
b) Ramener chacune des quations diffrentielles avec conditions ini-
tiales obtenues en a) un systme de deux quations diffrentielles
d'ordre 1.
c) Dcrire brivement une stratgie de rsolution numrique.
8. Montrer que l'quation 7.35 est bien une solution de l'quation diff-
rentielle 7 .34.
9. Montrer que l'quation diffrentielle avec conditions aux limites:
y"(x) = a2(x)y'(x) + a1(x)y(x) + ao(x)
y'(a) = y ~ et y(b) =Yb
possde la solution:
Yb- Y1 (b)
y( x)= Yl(x) + y
2
(b) Y2(x)
o Y1 (x) et y
2
( x) sont les solutions de:
y ~ ( x)= a2(x)yHx) + a1(x)y1(x) + ao(x)
Yl (a) = 0 et y ~ (a) = ~
quations diffrentielles
et
y ~ x ) = 2 x ) y ~ x ) + a1(x)y2(x)
Y2(a) = 1 et y ~ a ) = 0
10. Rsoudre l'quation diffrentielle:
y'(t) = t sin(y(t)) (y(O) = 2)
417
l'aide des mthodes de prdiction-correction d'ordre 2 et 4 (prendre
h = 0,1 et utiliser les valeurs calcules l'exercice 1 a) l'aide de la
mthode de Runge-Kutta d'ordre 4 pour obtenir les premires valeurs
des Yi). Effectuer 3 itrations.
11. Donner le systme tridiagonal requis pour rsoudre l'quation diffren-
tielle: (
1
y"(x) = (1 + ) y(x)- (x+ 2)
y(O)=O et y(1)=2
l'aide de la mthode des diffrences finies centres (prendre 5 inter-
valles).
12. On veut rsoudre par la mthode des diffrences finies l'quation dif-
frentielle:
y"( x)- a2(x)y'(x)- a1(x)y(x) = ao(x)
avec les conditions aux limites y(a) = Ya et y(b) = Yb Dterminer
le systme tridiagonal rsultant lorsqu'on utilise une diffrence arrire
d'ordre 1 pour y'(x) et une diffrence centre d'ordre 2 pour y"(x).
Quel est l'ordre de prcision de cette mthode?
Rponses aux exercices
Rponses aux exercices du chapitre 1
1. a) LlX ~ 0,5 x 10-
4
, r ~ 0,405 x 10-
3
b) LlX ~ 0,5 x 10-
3
, Er ~ 0,570 x 10-
4
c) LlX ~ QyYx 10-
5
, Er ~ 0,159 x 10-
5
d) LlX ~ 0,5 x 10-
8
, Er ~ 0,445 x 10-
4
e) LlX :::; 0,5 x 10-
3
, Er ~ 0,625 x 10-
4
f) LlX ~ 0,5 x 10+
3
, Er ~ 0,223 x 10-
4
2. a) (32)
10
= (100 000)2
b) (125)10 = (1111101)2
c) (1231)
10
= (10011 001111)2
d) (876)10 = (1101101100)2
e) (999)
10
= (1111100 111)2
f) (12345)10= (11000000111001)2
3. a) Signe et grandeur: ( +125)10 = (01111101)2, ( -125)10 = (11111101)2,
( +0)10 = (00 000 000)2 ou ( -0)10 = (10 000 000)2, (175)10 ne peuvent
pas tre reprsents sur 8 bits, ( -100)
10
= (11100 100)2
b) Complment 2: ( +125)
10
= (01111101 )2, ( -125)10 = (10 000 011 )2,
(0)
10
= (00000000)2, (175)
10
ne peuvent pas tre reprsents sur
8 bits, ( -100)Io = (10 011100)2
c) Reprsentation par excs (d = 2
7
): ( +125)
10
= (11111101)2,
(-125)
10
= (00000011)2, (0)
10
= (10000000)2, (175)10 ne peuvent
pas tre reprsents sur 8 bits, ( -100)
10
= (00 011100)2
420 Rponses aux exercices
40 a) Binaire classique: (00 000 011)2 = (3)10, (10 000 001)2 = (129)10,
(11111111)2 = (255)10
b) Signe et grandeur: (00000011)2 = (+3)10, (10000001)2 = (-1)10,
(11111111)2 = ( -127)10
c) Complment 2: (00000011)2 = (+3)10, (10000001)2 = (-127)10,
(11111111)2 = ( -1)10
d) Reprsentation par excs (d = 2
7
): (00000011)2 = (-125)10,
(10000001)2 = (+1ho, (11111111)2 = (+127)10
5o a) Plus grand nombre: (0 011111111111111)2 = (32 736)100 Plus petit
nombre: (0 100 001 000 000 000)2 = (2-
17
)1o
b) E = 21-10 = 2-9
60 a) (0,5)
10
= (0,1)2
b) (0,2)10 = (0,001100 110 011
0
oh
c) (0,9)10 = (0,111 001100110011
0
oh
d) (1/3)10 = (0,010 101010
0
oh
e) (0,25)10 = (0,01)2
f) (3/8)10 = (0,011 )2
70 a) -1345,0
b) 21-24
c) 011111111000 0000 0000 0000 0000 0000 = 2-
64
80 a) 1100 0010 0101 0000 1111 0000 0000 0000
b) 0100 0101 1101 1110 0100 0000 0000 0000
c) 0100 0001 1000 0001 10011001 1001 1010 (valeur arrondie)
En retransformant ces rponses en dcimal, on trouve:
a)-52,234375, b) 7112,0 etc) 16,200000750
Les deux premires reprsentations sont exactes, mais la troisime com-
porte une erreur absolue de 0,75 x 10-
6
0
90 a) e -+ 0,2718 x 10
1
b) 1/6 -7 0,1667 x 10
c) 2/3 -7 0,6667 x 10
Rponses aux exercices 421
d) 12,487 x 10
5
--+ 0,1249 x 10
7
e) 213 456 --+ 0,2135 x 10
6
f) 2000,1 --+ 0,2000 x 10
4
10. (x+ y)+ z = 0,196 x 10
4
, alors que x+ (y+ z) = 0,195 x 10
4
11. a) 0,999 x 10
b) 0,214 x 10
8
c) 0,237 x 10
1
d) 0,105 x 10
5
e) 0,700 x 10
3
f) 0,316 x 10
4
12. 9 x 10 x 10 possibilits pour la mantisse, 19 exposants diffrents et
2 signes ( ) pour un total de 34 200 nombres.
13. Non (voir l'exercice 9a) pour un exemple)
14. Si x est prs de 1, cos x est galement prs de 1 et il y a risque d'limina-
tion des chiffres significatifs. Une solution de rechange
est:
1
( 1 + cos x) sin
2
x
( - cos x) ( 1 + cos x) = ( 1 + cos x)
15. a) cos 20
b) Horner: p(x) = 1 +x( -2 + x(3- 4x))
c) On effectue la somme rebours.
16. Si n est assez grand, la reprsentation en notation flottante de 1/ n
devient nulle et la srie s'arrte.
1 A{.!Y) _ IX lAY +IYIAX _ AX + AY
7
lXVI - IXYI - TXT TYT
_ h
2
h
4
h
6
cos((h))h
8
18.a)cos(O+h)-1-2f+4!-
6
!+
8
!
b) sin(O + h) - h- h
3
+ h
5
- h
7
+ cos((h))h
9
avec 0 < C(h) < h
- 3! 5! 7! 9! - ., -
c) arctan(O + h) = h-
2
;!
3
+ O(h
5
) avec 0 (h) h
d) cos(7!"/2+h) = -h+ +

avec 1rj2 (h) 7r/2+h
e) sin(1r /2+h) = 1- + + avec 1r /2 (h) 1r /2+h
422 Rponses aux exercices
19. a) b..f = 0,248 x 10-
2
,/(x*) = 0,69813 (2 chiffres significatifs)
b) b..f = 0,24 7 x 10-
4
, f( x*) = 0, 790 37 ( 4 chiffres significatifs)
c) b..f = 0,9 x 10-
2
, J( x*) = 2,529 519 (2 chiffres significatifs)
d) b..f = 0,109 x 10-
2
,/(x*) = 0,012 0512 (1 chiffre significatif)
20. a) b..f = 0,6538 x 10
2
, f(x*, y*)= 7 543,098 (1 chiffre significatif)
b) b..f = 0,82 x 10-
3
, f(x*, y*)= -0,0081459 (0 chiffre significatif)
21. a) Respectivement 5 (25,312) et 6 (25,3125) chiffres significatifs
b) ede2 = 16 = 2n, ordre 4
) 1 ( h) h
h2 h3 h4 h5
22. a n 1 + = - 2 + 3 - 4 +
5
s
b) ln(1,1) 0,095308333 avec 4 chiffres significatifs
c) On divise h par 4, ce qui revient diviser l'erreur par 4
5
.
23. C'est un dveloppement d'ordre 7.
24. a) f(x) = 1 +x+ x
2
+ x
3
+ x
4
+ ...
b) g( t) = 1 - t
2
+ t
4
- t
6
+ tB -
c) arctan(t) = t- t
3
/3 + t
5
/5- t1 /7-
d) ln(1 +x)= x- x
2
/2 + x
3
/3- x
4
j4-
25. a) e-x = 1- x+ x
2
/2!- x
3
/3! + x
4
/4!- x
5
/5! +
b) e-t = 1 - t
2
+ t
4
/2! - t
6
/3! + tB j 4! - t
10
j 5! +
c) f( x) = (2/ y'Ji)( x - x
3
/3 + x
5
/10- x
7
j 42 + x
9
/216 + )
d) /(1) (2/y'Ji) = (1- 1/3 + 1/10- 1/42) = 0,838 224 524
e) C'est une approximation d'ordre 9.
f) 2 chiffres significatifs
Rponses aux exercices du chapitre 2
1. a) Xm = 2,9, 2,85, 2,875 (9 itrations)
b) Xm = 1,75, 1,625, 1,6875 (10 itrations)
c) Xm = 2,0, 3,0, 3,5 (13 itrations)
d) Xm = 1,5, 1,25, 1,125 (11 itrations)
Rponses aux exercices 423
3. a) 2,85795, 2,86003, 2,86010
b) 1,67, 1,64195, 1,639 57
c) 1,354 38, 1,946 33, 2,084 07
d) 1,01613, 1,030 67, 1,043 72
4. a) /(1) = /'(1) = 0, /"(1) = 2, racine de multiplicit 2
b) f(O) = 0, f'(O) = 1, racine de multiplicit 1
c) f(O) = f'(O) = 0, /"(0) = 2, racine de multiplicit 2
d) /(0) = 1, 0 n'est pas une racine
5. a) r = 0, g'(O) = 4 (rpulsif), r = 3, g'(3) = -2 (rpulsif)
b) r = 0, g'(O) = oo (rpulsif), r = 1, g'(1) = 1/2 (attractif)
c) r = 0, g'(O) = 1 (indtermin)
d) r =VS, g'(VS) = 1 =f 2VS (rpulsifs)
6. a) L'algorithme de points fixes ne converge pas et oscille entre les
valeurs 2,236 067.
b) Xn--+ 1,6180339, lenl--+ 0, lenfen-11--+ 0,3090, convergence linaire
7. a) Xn --+ 2,690647, lenl --+ , lenfen-11 --+ , lenf(en-1)
2
1 --+ 0,5528,
convergence quadratique
b) Xn --+ 1,872322, lenl --+ 0, lenfen-11 --+ 0, lenf(en-1)
2
1 --+ 0,5968,
convergence quadratique
c) Xn --+ 1,134 724, lenl --+ 0, lenfen-11 --+ 0, len/( en-1)
2
1 --+ 2,44,
convergence quadratique
d) Xn --+ 1,0, lenl --+ 0, lenfen-11 ne tend pas vers 0, convergence linaire
8. a) x
0
= 3,0, x
1
= 4,0: 2,826 086, 2,752 249, 2,694 940,2,690 790, 2,690 64 7
b) Xo = 2,0, x
1
= 3,0: 1,913 390, 1,886 169, 1,872 646, 1,872 324, 1,872 322
c) x
0
= 1,5, x
1
= 2,5: 1,461637, 1,429 202, 1,263 943, 1,193 273, 1,149 644
d) Xo = 1,2, x
1
= 2,2: 1,198 062, 1,196 180, 1,135 400, 1,108 143, 1,081331
9. On pose g( x) = x- mf( x)/ J'( x) et /(x) = (x- r rh( x) avec h(r) f. 0
et on montre que g'(r) =O.
424 Rponses aux exercices
10. = = 0 = -0,099
(attractif)
b) La fonction 92( x) converge quadratiquement
c) Oui, car il y a changement de signe
d) Convergence quadratique vers 3, 733 079
11. ll suffit de remarquer que s
3
= 3 +s. La mthode de Newton converge
vers 1,671699 88.
12. a) lg'(x)l =Il- 2pxl < 1 pour 0 < p < V2/2
b) g'(V2/4) = 0, convergence quadratique
c) g'L3V2) > 1, divergence
13. a) g'(r) 0,51 < 1
b) g'(1,365 23) = 0,51196
c) g'(1,365 23) # 0, convergence linaire
14. a) La pente est fixe une fois pour toutes f'(x
0
). Par consquent, les
droites sont toutes parallles.
b) On pose:
f( x) x
2
- 2
g(x)=x---=x---
f'(xo) 2xo
La condition de convergence est alors lg'(r)l = g'( V2)1 < 1. On obtient
V2/2 < xo < oo.
Rponses aux exercices du chapitre 3
1. a)
[
1 0 0 l
T = -3 1 0 , dt T = 1
0 0 1
b)
[
1 0 0 l
p = 0 0 1 ' dt p = -1
0 1 0
Rponses aux exercices
c)
d)
0 0 l
1 0 , dt T = 1
5 1
2. a) x= [3 2 1jT,dt A= 90 b)x=[2 2 -2jT,dtA=-9
3. a) Matrice augmente triangularise:
[
1 2 1
0 -2 1
0 0 1/2
dont la solution est x= [1 - 1 1jT. Le dterminant est -1.
b) Matrice augmente triangularise:
[
1 2 1
0 -4 2
0 0 -5
0 0 0
4
-5
-15/2
-9
13 ]
~ 5
-18
dont la solution est x= [3 - 1 4 2]T. Le dterminant est -180.
425
4. ll suffit de construire les matrices correspondant chacune des opra-
tions lmentaires effectues et de les multiplier par leur inverse pour
obtenir une dcomposition LU.
5. a) Matrice augmente triangularise (sans recherche de pivot):
[
0,7290 0,8100 0,9000 0,6867 l
0,0000 -0,1110 -0,2350 -0,1084
0,0000 0,0000 0,02640 0,008 700
dont la solution est x= [0,2251 0,2790 0,3295]T
426 Rponses aux exercices
b) Matrice augmente triangularise (avec recherche de pivot):
[
1,331 1,210 1,100 1,000 l
0,0000 0,1473 0,2975 0,1390
0,0000 0,0000 -0,010 00 -0,003 280
dont la solution est x= [0,2246 0,2812 0,3280f
c) La solution en b) est plus prcise.
6. a) Matrice augmente triangularise:
[
1 1 0
0 1 1
0 0 0
Le dterminant de la :rrlatrice est dt A= (1)(1)(0) = 0 et A est donc
singulire.
b) La dernire quation signifie que 0 = 2; il n'y a donc pas de solution.
7. a) Matrice augmente triangularise:
[

1 1 J3 -
b) Le dterminant de la matrice est dt A= (2)(9a
2
- 1) = 18a
2
- 2.
c) a= 1/3
d) Si a = 1/3, la matrice est singulire. Si J3 = 1, la dernire quation
n'a pas de solution.
8. a) Dcomposition LU sous forme compacte:
[
_:/2]
-1 -1 1/2
On obtient fi= [0 - 3/2 1f et x= [1 - 1 1]T.
b) Dcomposition LU sous forme compacte:
[
_:/2 5;4]
4 -6 -5 3/2
-3 7 19/2 -9
On obtient fi= [13 - 1/2 7 2f et x= [3 - 1 4 2f.
Rponses aux exercices 427
9. Dcomposition LU sous forme compacte:
[
~ ~ ~ ; : : l '0 = [ ~ l
1 0 25/4 1
On obtient if= [17 /4 37/14 3]T et x= [1 2 3jT.
10. a) dt A= (1)(3)(6) = 18
b) IIAIIoo = max(6, 27, 55)= 55
c) Ces deux vecteurs sont les deux premires colonnes de A-l. En
rsolvant Ax = [0 0 1 V, on obtient la dernire colonne, qui est
[5/6 - 2/3 1/6f.
d) IIA-
1
IIoo = max(4,66653,2,33329,0,55555) = 4,66653et donc
condA =55 x 4,666 53= 256,659
11. a) dt A= (2)(1)(2) = 4
b) if= [ -1 18 12]Y et x = [ -4 - 6 12]T
c) On doit rsoudre A(Ax) = b. ll suffit de rsoudre A = b et par la
suite Ax = . Ces deux systmes sont ensuite rsolus au moyen de la
dcomposition LU de A. On trouve (voir a)) = [-4 - 6 12]Y et
ensuite x= [-2 0 1f.
12. Dcomposition LU sous forme compacte:
13.
[
0,500 2,00 4,00 l [ 3]
0,333 -0,416 2,72 '0 = 2
0,250 -0,300 -0,0170 1
On obtient if= [16,0 - 6,42 - 181]T et i* = [-232 486 - 181]T.
!lx- X*lloo = max( -4,92, 9,08, -3,30) = 9,08 et l'erreur relative est
donc 9,08/476,92 = 0,019.
[
-83,077 64,615 0,46154]
A-
1
= 156,92 -115,38 -1,5384
-57,692 41,538 1,1538
On a liAI loo= max(0,6166, 0,7833, 3,5) = 3,5 et
IIA-
1
IIoo = max(148,15, 273,83, 100,38) = 273,83. Enfin, condA =
3,5 x 273,83 = 958,4.
428 Rponses aux exercices
14. a) C'est le cercle de rayon 1 centr en l'origine.
b) C'est le carr [-1, 1]2.
15. Non, puisque le dterminant peut s'annuler (si la matrice est singulire)
sans que la matrice soit nulle.
16. Non, puisque A-
1
n'existe pas.
17.
18.
A_
1
= [ -100 100 l
50,5 -50
IIIAIIoo = 3,01 et IIA-
1
IIoo = 200. On a alors condA = 602.
- [ 10-100 0 l
A- O
10
-1oo
dont le dterminant est trs petit (10-
200
), mais dont le conditionne-
ment est 1.
19. Le dterminant de cette matrice est 3,66 x 10-
12
et plusieurs logiciels
la considrent comme singulire. Elle est cependant inversible et son
inverse est:
52 -300 1050 -1400 630
-300 4800 -18 900 26880 -12 600
1050 -18 900 79 380 -117 600 56 700
-1400 26 880 -117 600 179 200 -88 200
630 -12 600 56 700 -88 200 44100
20. La matrice est singulire et le systme linaire possde dans ce cas une
infinit de solutions. Il est possible d'obtenir les 2 solutions proposes
car numriquement, un systme singulier devient souvent un systme
dont le dterminant est trs petit et qui est donc mal conditionn.
21. a) r1 = b- Ax1 = [ -0,6 - 0,600 o1]Y, r2 = b- Ax2 = [o,o o,ooo4]Y,
ce qui signifie que lif1lloo = 0,600 01 et llf2lloo = 0,0004. De plus,
!lx- x1lloo = 0,1 alors que IIi- x2lloo = 4,0. On en conclut que la
solution approximative x2 est bien plus loigne de la solution exacte,
Rponses aux exercices 429
22.
23.
mais donne un rsidu beaucoup plus petit. Cela montre que la norme
du rsidu n'est pas toujours un bon indice de la qualit d'une solution.
b) La nouvelle solution est [0 1,2jT. Une petite perturbation du second
membre entrane une forte perturbation de la solution.
c) La matrice est mal conditionne (con dA = 120 002).
Itration 1: 8-; = [0,8 0,88jT, x= [0,8 0,88]T
X3 sin( x2x3)
-162(x2 + 0,1)
-x
1
e-x1x2
X2 sin( X2X3) l
COS X3
20
Itration 1: x
1
= [0,499 8697 0,019 4669 - 0,5215205]T
Itration 2: x
2
= [0,500 0142 0,0015886 - 0,523 5569]T
Les itrations convergent vers [0,5 0 - 0,523 5987jY.
24. La matrice jacobienne est singulire en [0 -0,2jY. Il faut alors amorcer
la mthode de Newton partir d'un autre point.
Rponses aux exercices du chapitre 4
1. Si x est un point fixe, alors x= g(x) et g(g(x)) = g(x) =x. L'inverse
est cependant faux.
2. Il suffit de calculer par exemple g( x
1
) = .Xx
1
( 1 - x
1
) et de montrer que
l'on obtient x
2
(aprs simplification).
3. a) Le polynme caractristique est .X
2
- 4-X + 3. Les valeurs propres
sont 1 et 3, et le rayon spectral est donc 3. La matrice est divergente.
b) Le polynme caractristique est (.X- 1/2)(-X- 1/3)(-X- 1/4). Les
valeurs propres sont 1/4, 1/3 et 1/2, et le rayon spectral est donc 1/2.
La matrice est convergente.
430 Rponses aux exercices
4. La convergence de la mthode de Jacobi dpend du rayon spectral de
la matrice TJ = -D-
1
(Ti + Ts) et non du rayon spectral de la matrice
A elle-mme. Dans ce cas: -
[
0 1/2]
Tj = 1/2 0
et son rayon spectral est 1/2.
5. a) Seul (1, 1) est un point fixe.
b) n est attractif car p(J(1, 1)) = V'i/2 < 1.
c) Les 5 premires itrations donnent: (1,4142, 0), (1,4142, 1,1892),
(0,7653, 1,1892), (0,7654, 0,8749) et (1,1111, 0,8749).
6. a) ll faut dmontrer que lgi(xl)l < 1, o g1(x) = g(g(x)). Le rsultat
vient immdiatement de la rgle de drivation en chane.
b) Si { x1, x2, x3, , Xn} est un n-cycle, alors il est attractif si:
n
II lg'(xi)l < 1
i=l
7. { -1, 0} est un 2-cycle attractif.
8. ll suffit de montrer que T(2/7) = 4/7, T( 4/7) = 6/7 et T(6/7) =
2/7, et que T(2/9) = 4/9, T( 4/9) = 8/9 et T(8/9) = 2/9. Ces
3-cycles sont tous deux rpulsifs, car IT'(2/7)T'( 4/7)T'(6/7)1 = 8 et
IT'(2/9)T'( 4/9)T'(8/9)1 = 8.
9. ll suffit d'expliciter le terme Tx + et de constater que la matrice
jacobienne est T. Cette mthode de points fixes convergera si p(T) < 1.
On remarque de plus que les mthodes de Jacobi et de Gauss-Seidel
sont de cette forme.
10. On peut prendre par exemple la matrice:
Rponses aux exercices 431
pour laquelle la matrice TJ est:
[
0 -1/3
-1/3 0
-1/3 -1/3
-1/3]
-1/3
0
On a alors IITJIIco = 2/3, qui est infrieur 1.
11. a) Ds la premire quation, a
11
= 0 et la mthode de Jacobi s'arrte.
b) On rordonne les quations de telle sorte que la nouvelle matrice
soit diagonale strictement dominante: E3, E4, E1, E2.
12. Les itrations de la mthode de Jacobi donnent:
n
xn
1
xn
2
xn
3
1 1,444 444 1,800 000 -1,222 222
2 1,980 247 1,844444 -0,982 7160
3 1,963 512 1,999 506 -1,032 373
4 2,003487 1,986 228 -0,996 0555
5 1,996 501 2,001486 -1,003448
Avec la mthode de Gauss-Seidel, on obtient:
n
xn
1
xn
2
xn
3
1 1,444444 2,088 889E + 01 -0,918 5185
2 2,010 700 2,018 436E + 01 -0,9970919
3 2,003 774 2,001 336E + 01 -1,000 122
4 2,000 311 2,000 038E + 01 -1,000 026
5 2,000 011 1,999 997 E + 01 -1,000 002
La mthode de Gauss-Seidel converge plus rapidement vers [2 2 - 1]Y.
Rponses aux exercices du chapitre 5
1. Cette affirmation est vraie en gnral. Cependant, dans certains cas,
il est possible de construire ce polynme. Par exemple, si on choisit
3 points sur une droite, on peut construire le polynme de degr 1 (la
droite) passant par ces 3 points.
432 Rponses aux exercices
2. On doit rsoudre le systme:
dont la solution est [0 1 1 f. Le polynme est donc p
2
( x) = x + x
2
.
3.
a) P2(x)
(x- 1)(x -- 2) (x- O)(x- 2) (x- O)(x- 1)
=
0
(0- 1)(0- 2) +
2
(1- 0)(1- 2) +
36
(2- 0)(2- 1)
b) P3(x)
(x- 1)(x- 2)(x 3) (x- O)(x- 2)(x- 3)
=
0
(0- 1)(0- 2)(0- 3) +
2
(1- 0)(1- 2)(1- 3)
(x- O)(x- 1)(x- 3)
52
(x- O)(x- 1)(x- 2)
+
36
(2- 0)(2- 1)(2- 3) +
2
(3- 0)(3- 1)(3- 2)
f(
3
)()(x)(x- 1)(x- 2)
=
3
! , E [0, 2]
j(
4
)()(x)(x- 1)(x- 2)(x- 3)
=
4
! , E [0, 3]
d) P2(1,5) = 15,0, P3(1,5) = 5,625
4. a) P2(x) = 2x + 16x(x- 1)
b) P3(x) = P2(x) + 25x(x- 1)(x- 2)
c) Les expressions analytiques des erreurs sont les mmes qu' l'exercice
prcdent. Cependant, on peut estimer la valeur de ces erreurs:
E2(x) 25x(x- 1)(x- 2), E3(x) 10x(x- 1)(x- 2)(x- 3)
d) Mmes rponses qu'au numro prcdent. De plus, E
2
(1,5) -9,375
et E3(1,5) 5,625.
5. a) Le systme linaire est:
[
2 1/2
1/2 2
0 1/2
0 l [ !" l [ 96 l 112 A, = 546
2 g 1716
b) La solution est [34,7143 53,1428 844,714f.
Rponses aux exercices 433
c) L'abscisse 1,5 est dans le deuxime intervalle (i = 2). L'quation de
la spline est:
p(x) = -34,7143(x- 2?/6 + 53,1428(x -1)
3
/6
- (2- 34,7143/6)(x- 2) + (36- 53,1428/6)(x- 1)
ce qui signifie que p(1,5) = 13,5089.
6. a) On prend les points dont les abscisses sont les plus rapproches de
4,5 (il y a deux possibilits). En prenant les points d'abscisse 5, 3,5 et
7,0, on trouve:
P2(x) = 1,6094 + 0,237 733(x- 5)- 0,019 8523(x- 5)(x- 3,5)
qui prend la valeur 1,500 459 65 en x = 4,5. L'expression analytique du
terme d'erreur est:
j
3
) ~ ) x -5)(x- 3,5)(x- 7)
E2(x) =
3
! avec ~ E [3,5, 7]
b)
P
2(x) 1 6094 (x-
3
'
5
)(x-
7
) 1 2528 (x-
5
)(x-
7
)
' (5- 3,5)(5- 7) + ' (3,5- 5)(3,5- 7)
1 9459 (x- 5)(x- 3,5)
+ ' (7- 5)(7- 3,5)
c) E2(x) ~ 0,005(x- 5)(x- 3,5)(x- 7), de telle sorte que E2(4,5) ~
0,006 25
d) Non. ll faut utiliser la mthode de Newton.
e) Les deux mthodes donnent le mme polynme, mais exprim diff-
remment. Elles ont le mme terme d'erreur, mais seule la mthode de
Newton peut fournir une approximation de l'erreur.
7. On donne le tableau des valeurs des diffrents polynmes en fonction
du degr ainsi que l'approximation de l'erreur commise.
n
Pn(1,05) = En(1,05) ~
1 0,852 835 0,298 75 x 10 -
3
2 0,853133 75 o,375 x w-
5
3 0,8531375 -0,1562 x w-
5
434
8.
Rponses aux exercices
On constate que l'erreur absolue est infrieure 0,2 x 10-
5
pour le
polynme de degr 3.
f(xi+I)- f(xi)
h
f(xi+2)- 2/(xi+I) +!(xi)
2h
2
f(xi+3)- 3f(xi+2) + 3f(xi+1)- f(xi)
3!h
3
9. a) 2/{' = 18, d'o f{' = 9
b) p
1
(x) = (1/2)(3x
3
- x), d'o p
1
(1/2) = -0,0625
c) Pour la spline naturelle, on utilise l'approximation fff = f ~ ' = O.
Cependant, la fonction f( x) = x
3
a comme drive seconde J"( x) = 6x
qui ne s'annule pas en x = 2, d'o l'erreur.
10. a) La nouvelle quation s'crit:
~ ' /2 + 2/{' + ~ ' /2 = 18
ce qui devient 2/{' = 18- 6 = 12, d'o f{' = 6.
b) L'quation de la spline est alors p
2
(x) = x
3

c) L'approximation est exacte.
11. a) n y a 4 conditions. n faut donc un polynme de degr 3.
b) P3(x) = x
2
(2,7- 1,7x)
12. a) n suffit de calculer la table de diffrences divises.
b) La fonction f( x) inconnue est un polynme de degr 2 dont l'qua-
tion est p2(x) = x
2
- 2x + 3.
13. a)
0 2 5 1 0 0:'} 1
2 0 3 1 2 0:'2 4
5 3 0 1 5 0:'3
7
1 1 1 0 0 al 0
0 2 5 0 0 a2 0
Rponses aux exercices
435
b) u( x) = 0,15lx- Ol- 0,25lx- 21 + 0,1lx- 51+ 1,0 + 1,2x et u(3) = 5
c) n suffit d'effectuer une interpolation linaire entre les deux derniers
points de la table et on obtient le mme rsultat en x = 3.
14. a)
15.
16.
0 8 125 1 0 al i
8 0 27 1 2 0:'2
4
125 27 0 1 5 0:'3 7
1 1 1 0 0 al 0
0 2 5 0 0 a2 0
b) u( x) = -0,0125lx - 01
3
+ 0,020 833lx - 21
3
- 0,008 333lx - 51
3
+
1,875 + 1,225x et u(3) = 5,1667
0 4 25 1 0 0:'1
1
4 0 9 1 2 0:'2
4
25 9 0 1 5 0:'3
7
1 1 1 0 0 al 0
0 2 5 0 0 a2 0
Le dterminant de cette matrice est nul.
0 0 0 0,693 147 1 1 1 0:'1
0 0 0,693 147 0 1 2 1 0:'2
0 0,693147 0 0 1 1 2 0:'3
0,6931479 0 0 0 1 2 2 0:'4
1 1 1 1 0 0 0 al
1 2 1 2 0 0 0 a2
1 1 2 2 0 0 0 a3
En rsolvant le systme, on trouve a
1
= 0,360 674, a2 = -0,360 674,
0:'3 = -0,360 674, a4 = 0,360 674, a
1
= -2,25, a2 = 1,5 et a3 = 1,5. La
fonction:
4
u(x1, x2) = L ail li- x ~ ln IIi- xiiie+ a1 + a2x1 + a3x2
j=l
value en (3/2, 3/2), vaut prcisment 9/4.
1
2
2
4
0
0
0
436 Rponses aux exercices
17. Suivant la formule 5.48, on obtient t
1
= 0, t
2
= 1, t
3
= 2, t
4
= 3 et
t
5
= 4. Les systmes rsoudre sont:
0 1 2 3 4 1 0
1 0 1 2 3 1 1
2 1 0 1 2 1 2
3 2 1 0 1 1 3
4 3 2 1 0 1 4
1 1 1 1 1 0 0
0 1 2 3 4 0 0
0 0
1 0
1 1
0 1
0 0
0 0
0 0
En rsolvant ces systmes, on trouve [1/2 - 1/2 - 1/2 1/2 0 0 OjT
et [0 1/2 - 1/2 - 1/2 1/2 0 o]T' ce qui signifie que:
1 1 1 1
/l(t) = 21tl- 21t- 11- 21t- 21 + 21t 31
et
1 1 1 1
/2(t) = 21t- 11- 21t- 21- 21t- 31 + 21t 41
qui est l'quation paramtrique du carr.
Rponses aux exercices du chapitre 6
1. Voir page 298
2. Voir page 298
3. Diffrences avant: f'(O) 0,999135 pour h = 0,05, f'(O) 0,999 788
pour h = 0,025. Richardson: ( 4x0,999 788-0,999135)/3 = 1,000 005 667
4.
Diffrences arrire: f'(O) 0,9991972pour h = 0,05, f'(O) 0,999 7955
pour h = 0,025. Richardson: ( 4x0,999 7955-0,9991972)/3 = 0,999 994 96
f(x+h)-f(x-h)
1
h
2
f"'(x) h
4
f(
5
)(x) h
6
f(
7
)(x)
2h = f (x)+ 3! + 5! + 7! + ...
L'extrapolation de Richardson permet de gagner 2 ordres de prcision.
5. n faut calculer le polynme de degr 4 passant par les points
(x- 2h,J(x- 2h)), (x- h,J(x- h)), (x,J(x)), (x+ h,f(x + h)),
(x+ 2h, f(x + 2h)), et le driver 2 fois.
Rponses aux exercices 437
6. ll suffit d'intgrer respectivement p
1
(x) sur l'intervalle [x
0
,x
1
], p
2
(x)
sur l'intervalle [xo, x2] et p3(x) sur l'intervalle [x
0
, x
3
].
7. Trapzes: 1,727 221905 pour 4 intervalles (h = 0,25) et 1,720 518 592
pour 8 intervalles (h = 0,125). Richardson: ( 4 x 1,720 518 592 -
1,727 221905)/3 = 1,718 284154 (ordre 4). Les erreurs respectives sont
0,894 x 10-
2
, 0,223 x 10-
2
et 0,2326 x 10-
5

8. Simpson 1/8: 1,718318843pour4intervalles (h = 0,25)et 1,718284154
pour 8 intervalles (h = 0,125). Richardson: (2
4
x 1,718 284154 -
1,718318843)/15 = 1,718281843 (ordre 6). Les erreurs respectives
sont 0,37 x 10-4, 0,2326 x 10-
5
et 0,15 x 10-
7
.
9. Simpson 3/8 (h = 4/3): 17,327 866 29 avec une erreur absolue de 0,54 x
10-2
10. Boole (h = rr/32): 0,88137432 avec une erreur absolue de 0,733 x 10-
6
11.
0,785 398 164 0,916 297 857 0,968 361509 (ordre 2)
0,959 931 089 0,985 716 059 (ordre 4)
0,987 435 057 (ordre 6)
12. Il suffit de dvelopper l'expression.
13. a) ln 2
b) ll faut se rendre jusqu' T
1
,
4
, pour lequel le rapport est 0,004.
c)
0,75 0,708 333 33 0,697 023 809 0,69412185 (ordre 2)
0,694 444 444 0,693 253 968 0,693 154 53 (ordre 4)
0,693174603 0,693147901 (ordre 6)
0,693147 901 (ordre 8)
d) La deuxime ligne du tableau correspond la mthode de Simpson
1/3 avec 2, 4 et 8 intervalles.
438 Rponses aux exercices
14. il faut utiliser les mthodes de Gauss, car la fonction ln x n'est pas
dfinie en x = O. Les formules 2, 3 et 5 points donnent respective-
ment les approximations -0,405 465, -0,509 050 405 et -0,571 707 615.
La valeur exacte est -0,613 705 639.
15. La formule 3 points est exacte pour les polynmes de degr 5.
16. a) a= b = 3h/2
b) 1,25
c) 1,425
d) Respectivement 1 et 2 chiffres significatifs
17.
Erreur(h = 0,2) = 0,009 872 =
7
,
99

23
Erreur(h = 0,1) 0,001234
La mthode est donc d'ordre 3.
18. a) Le terme de droite devient:
h
2
f'(x ) h
3
J"(x ) h
4
f"'(x ) h
5
f"''(x )
hf(x)+ o + o + o + o +0(h6)
0
2 6 27 162
b) Le terme de gauche devient, aprs intgration:
h
2
f'(x ) h
3
f"(x ) h
4
f"'(x ) h
5
f""(x )
hf( x ) + o + o + o + o + O(h6)
0
2 6 24 120
c) Le premier terme de l'erreur est:
h
4
J"'(x )( ..!__- ..!__)
0
24 27
et la mthode est d'ordre 4.
d) Degr 2
Rponses aux exercices du chapitre 7
1. a) Euler: YI = 2, Y2 = 2,009 0929, Y3 = 2,027 202 49
Euler modifie: YI = 2,004 546 487, Y2 = 2,018118 919, y
3
= 2,040 539 939
Rponses aux exercices
Runge-Kutta d'ordre 4: YI = 2,004 541 741, Y2
Y3 = 2,040 526 45
b) Euler: Y1 = 0,2, Y2 = 0,425, Y3 = 0,687 0625
439
2,018 109 4 7'
Euler modifie: Y1 = 0,2125, Y2 = 0,45685069, Y3 = 0,74983045
Runge-Kutta d'ordre 4: YI = 0,211 7831, Y2 = 0,455 52718,
Y3 = 0,748199
c) Euler: Y1 = 2,2, Y2 = 2,4431376, y
3
= 2,741543
Euler modifie: y
1
= 2,2215688, Y2 = 2,494 994, Y3 = 2,836 326
Runge-Kutta d'ordre 4: YI = 2,2218007, Y2 = 2,495 651, Y3 = 2,837 7328
2. a) Pour h = 0,1, y(0,3) ~ y
3
= 3,170 000 1557 avec une erreur absolue
de 0,001977
b) Pour h = 0,05, y(0,3) ~ y
6
= 3,171450 217 avec une erreur absolue
de 0,000 527
c) Le ratio des erreurs est de 3,75 ~ 2
2
, ce qui confirme que la mthode
est d'ordre 2.
d) Richardson: (2
2
x 3,171450 217- 3,170 000 1557)/3 = 3,171933 572
3. a) Pour h = 0,1, y(0,3) ~ y
3
= 3,171976 0094 avec une erreur absolue
de 0,1599 x 10-
5
b) Pour h = 0,05, y(0,3) ~ y
6
= 3,171977 5025 avec une erreur absolue
de 0,83 x 10-
7
c) Le ratio des erreurs est de 19,26 ~ 24, ce qui confirme que la mthode
est d'ordre 4.
d) Richardson: (2
4
x3,171977 5025-3,171976 0094)/15 = 3,171977 601
4. n suffit d'utiliser la dfinition de l'erreur de troncature locale et de
faire les dveloppements de Taylor appropris.
5. Yt = 2,331 733, y ~ = 1,321041, Yf = 2,734 468, y ~ = 1,688 708
6. a)
y ~ t ) Y2(t) (YI(O) = 2)
y ~ t ) Y3(t) (y2(0) = 2)
y ~ t ) Y3(t) + Y2(t)- YI(t) + 1 (y3(0) = 1)
440
b)
c)
Rponses aux exercices
Yi(t) = Y2(t) (YI(1) = 0)
= (YI(t))
2
+ t
2
+ 1 (Y2(1) = 2)
Yi (t) =
=
=
=
Y2(t)
Y3(t)
Y4(t)
ety3(t) + (y4(t))3
(YI(0)=2)
(y2(0) = 1)
(y3(0) = 0)
(Y4(0) = 4)
7. a)
b)
Yr(x) =
-yi(x) + 2yl(x)- 16
YI(O) =
-7
Yi (0) =
0
x)
=
+ 2y2(x)
Y2(0) =
0

=
1
ui(t) = u2(t) (u1(0) -7)
= -u
2
(t) + 2u
1
(t)- 16 ( u
2
(0) = 0)
vi ( t) = v2 ( t)
= -v2(t) + 2v1(t)
( V1 (0) = 0)
( v2(0) = 1)
c) On rsout les 2 systmes et on pose:
( ) ( )
12,0855- y1(3) ( ) ( ) 12,0855- u1(3) ( )
y x = Yl x + Y2 ( 3) Y2 x = UJ x + V} ( 3) V} x
8. ll suffit de prouver que y( x) est bien une solution de l'quation diff-
rentielle et que y(a) = Ya et y'(b) =Yb
9. ll suffit de prouver que y( x) est bien une solution de l'quation diff-
rentielle et que y'(a) et y(b) =Yb
Rponses aux exercices 441
10. Prdiction-correction d'ordre 2: la premire valeur a t obtenue
l'exercice la) l'aide de la mthode de Runge-Kutta d'ordre 4.
t
~ Yn
0,1 2,004 5417
0,2 2,0181527 2,018 0947
0,3 2,040 6062 2,0404857
0,4 2,0715964 2,0714053
Prdiction-correction d'ordre 4: les 3 premires valeurs ont t obtenues
l'exercice la) l'aide de la mthode de Runge-Kutta d'ordre 4.
t
~ Yn
0,1 2,004 5417
0,2 2,0181095
0,3 2,040 5264
0,4 2,0714899 2,0714842
0,5 2,110 5338 2,110 5267
0,6 2,157 0371 2,157 0304
11. Le systme est de dimension 4 et prend la forme:
[
4,88 -2,0
-2,0 4,48
0,0 -2,0
0,0 0,0
0,0 0,0 J [ Y1 J [ 0,176 J
-2,0 0,0 Y2 0,192
4,336 67 -2,0 Y3 - 0,208
-2,0 4,28 Y4 4,224
dont la solution est [0,290 236 0,620 176 1,002 959 1,455 588]T.
12. On pose a
0
(x) = -(x+2), a
1
(x) = 1 +2/x et a
2
(x) = 0, et on obtient
le systme:
pour i = 1, 2, 3, ... , ( n -1 ). La premire quation ( i = 1) fait intervenir
Yo = Ya et le terme correspondant est envoy droite. De mme, la
dernire quation ( i = n- 1) utilise Yn = Yb L'ordre de cette mthode
de diffrences finies est 1.
Bibliographie
1. Bourdeau, M. et Glinas, J ., Analyse numrique lmentaire, Chicou-
timi, Gatan Morin diteur, 1982.
2. Burden, R.L. et Faires, J.D., Numerical Analysis, 5e dition, Boston,
PWS Kent, 1993.
3. Carreau, P.J., De Kee, D. et Chhabra, R.P., Rheology of Polymerie
Systems: Principles and Applications. paratre.
4. Chapra, C.S. et Canale, R.P., Numerical Methods for Engineers,
2e dition, New York, McGraw-Hill, 1985.
5. Cheney, W. et Kincaid, D., Numerical Mathematics and Computing,
3e dition, Pacifie Grave, Brooks/Cole, 1994.
6. Conte, S.D. et de Boor, C., Elementary Numerical Analysis, An Algo-
rithmic Approach, 3e dition, New York, McGraw-Hill, 1980.
7. Derrick, W.R. et Grossman, S.I., Introduction to Differentiai Equa-
tions, 3e dition, St-Paul, West Publishing Company, 1987.
8. Derrida, B., Gervais, A. et Pomeau, Y., <t:Universal Metric Properties
of Bifurcations and Endomorphisms , Journal of Physics A, vol. 12,
n3, p. 269-296, 1979.
9. Duchon, J., <t,:lnterpolation des fonctions de deux variables suivant le
principe de la flexion des plaques minces , RAIRO, Analyse num-
rique, vol. 10, p. 5-12, 1976.
10. Feigenbaum, M., <t:Universal Behavior in Nonlinear Systems , Phy-
sica 5D, p.16-39, 1983.
444
Bibliographie
11. Fortin, M. et Pierre, R., Analyse numrique MAT-10427, Qubec, Uni-
versit Laval, 1993.
12. Gerald, C.F. et Wheatly, P.O., Applied Numerical Analysis, 4e dition,
Reading, Addison- Wesley, 1989.
13. Gulick, D., Encounters with Chaos, New York, McGraw-Hill, 1992.
14. Institute for Electric and Electronic Engineers, IEEE Recommended
Practices and Requirements for Harmonie Control in Electrical Power
Systems, Norme Std 519-1992, New York, IEEE, 1993.
15. Kreyszig, E., Advanced Engineering Mathematics, 6e dition, New York,
Wiley, 1988.
16. Krige, D.G., <t:A Statistical Method for Mine Variation Problems in the
Witwatersrand, Journal of Chemistry and Metallurgy of the Mining
Society of South Africa, vol. 52, p. 119-139, 1951.
17. Lorenz, E.N., <t:Deterministic Nonperiodic Flow, Journal of Atmos-
pheric Sciences, vol. 20, p. 130-141, 1963.
18. Mandelbrot, B., The Fractal Geometry of Nature, San Francisco, W.H.
Freeman and Co., 1982.
19. Matheron, G., <t:The Intrinsec Ramdam Functions and their Applica-
tions , Advances in Applied Probability, vol. 5, p. 439-468, 1973.
20. Simmons, G.S., Differentiai Equations with Applications and Historical
Notes, New York, McGraw-Hill, 1972.
21. Strang, G., Introduction to Applied Mathematics, Wellesley, Wellesley-
Cambridge Press, 1986.
22. Thomas, B.T. Jr. et Finney, R.L., Calculus and Analytic Geometry,
se dition, Reading, Addison- Wesley, 1992.
23. Trochu, F., <t:A Contouring Program Based on Dual Kriging Interpo-
lation , Engineering with Computers, vol. 9, p. 160-177, 1993.
24. Reddy, J.N., An Introduction to the Finite Element Method, 2e dition,
New York, McGraw-Hill, 1993.
Bibliographie
445
25. Scheid, F., Numerical Analysis, Schaum's Outline Series, New York,
McGraw-Hill, 1968.
26. Varga, R., Matrix Iterative Analysis, Englewood Cliffs, Prentice-Hall,
1962.
Index
A
algorithme( s)
de Horn er, 32
de la bissection, 56
de la mthode d'Euler, 357
de la mthode d'Euler modi-
fie, 370
de la mthode de Newton, 76,
158
de la mthode de Runge-Kutta
d'ordre 4, 373, 386
de la mthode de Taylor
d'ordre 2, 364
de la mthode du point milieu,
372
de la prcision machine, 21
de la scante, 85
de Steffenson, 73
des points fixes, 62, 194
application quadratique, 177
arrondi, 24
attracteur, 182
B
2-cycle, 185
de Hnon, 204
de Lorenz, 413
trange, 204
bassin d'attraction, 67
bit, 9
c
chiffres significatifs, 4
condition initiale, 352
conditionnement d'une matrice, 149
consistance, 92
constante de Feigenbaum, 187
coque mince, 284
D
dbordement, 11
dcomposition de Crout, 119, 122
ddoublement de priode, 186
degr de prcision, 317
drivation numrique, 293
drive, 264
descente triangulaire , 105
diagramme de bifurcation, 187
diffrence avant d'ordre 1, 297
distance d'influence, 271
double prcision, 17
E
effet ppite, 273
limination par soustraction, 29
ensemble de Mandelbrot, 191, 205
erreur(s)
absolue, 2
d'interpolation, 241
de troncature, 2, 33, 37
de troncature locale, 360, 379
relative, 3
relative en pourcentage, 3
quation
quation aux diffrences, 359
quation diffrentielle, 352
Index
extrapolation, 243
d'Aitken, 73
de Richardson, 306
F
ferme, 162
fluctuation alatoire, 265
formule(s)
aux diffrences, 296
d'Adams-Bashforth, 379
d'Adams-Moulton, 380
de Lagrange, 228, 229
de Newton, 234
de Newton-Cotes, 309
de quadrature, 317
de Simpson 1/3 simple, 318
des trapzes compose, 314
fractale, 205
frquences incommensurables, 410
G-1
grand ordre, 39
indice de pseudoplasticit, 92
ingalit( s)
de Cauchy, 145
triangulaire, 143, 146
intgration numrique, 293
K-L
krigeage, 262
dual, 263
loi puissance, 92
M
mantisse normalise, 14
matrice
diagonale strictement domi-
nante, 213
convergente, 196
creuse, 205
de Vandermonde, 224
inverse, 103
jacobienne, 157, 198
mal conditionne, 135
membrure, 162
mthode( s),
un pas, 359
pas multiples, 359, 376
d'Horner, 236
de Jacobi, 208
447
de la fausse position, 59, 95
de Newton, 155, 188
de Newton modifie, 162
de tir, 392
de Gauss-Seidel, 214
directe, 131
des diffrences finies, 400
du point milieu, 371
du trapze, 310
ferme, 59
ouverte, 59
mise l'chelle, 140, 141
modle de Carreau, 166
module complexe, 190
moindres carrs, 92, 167
mot, 9
multiplicit d'une racine, 80, 81
N
norme
complexe, 190
de Frobenius, 14 7
IEEE, 17, 24
matricielle, 146
vectorielle, 143, 145
notation compacte, 124
0
O(hn), 39
oprations lmentaires, 109
ordre
d'une approximation, 40
de convergence, 66
448
p
pas de temps, 355
pendule, 6
permutation de lignes, 110
pivot, 114, 123
poids d'intgration, 333
polynme
d'interpolation, 221
de collocation, 221
de Newton, 230
de Taylor, 35
point( s)
d'intgration, 333
d'interpolation, 221
de collocation, 221
fixe, 61
fixe attractif, 67
fixe en dimension n, 193
prcision machine, 19, 153
problme d'interpolation, 221
produit scalaire, 144
Q
quadratures de Gauss, 331
R
racine, 53
multiple, 80
rayon spectral, 196
remonte triangulaire, 105
reprsentation
binaire, 9
en complment 2, 11
par excs, 12
signe et grandeur, 10
rotule, 162
s
schma prdicteur-correcteur, 381
simple prcision, 17
sous-dpassement, 18
spline
cubique, 251
linaire, 251, 267
naturelle, 258
solution
gnrale, 353
particulire, 353
substitution successive, 103
systme diagonal, 104
T
taux de convergence, 66, 82
thorme de la moyenne, 311
troncature, 24, 33
U-Z
vecteur
de permutation, 127
rsidu, 157
zro d'une fonction, 53
Index

You might also like