Professional Documents
Culture Documents
Convention (Cohen):
o petit r = .10
o moyen r = .30
o grand r = .50
r = Mesure standardisé d’association
r et r2 sont des mesures standardisés !!
Équation de Régression
Équation de régression: y = a + bX + e Æ
^y = a + bX
^y = valeur prédite de Y
b = slope ( = la pente de la droite de régression)
a = intercept (= l’ordonnée à l’origine = la valeur de Y
lorsque X = 0)
X = la valeur de X
La droite de régression
^
Y
a b
Calcul de Régression
Équation de régression:
Y = a + bX (+ e)
a = Y – bX
b = cov xy / s2x
Æ ^y = -19.14 + 1.03X
b = Mesure non standardisé
d’association
Ex.: b = 1.03 pour la prédiction de l’agressivité de l’enfant
à partir de l’agressivité de la mère dans notre étude
t = r√ N-2 / √ 1-r2
Ex.:
t = .96*√ 2 / √ 1-.92 = 1.36 / .283 = 4.8
df = N-2 = 2
p=?
Test de signification de b
Hypothèses: H0: b* = 0 (b dans la population = 0)
H1: b* = 0
t = b / seb
Ex.:
t = 1.03 / 0.21 = 4.9
df = N-2 = 2
p=?
Correspondance entre régression
linéaire et ANOVA:
F = 24.92 ; √F = t
√ 24.92 = 4.9 = t
Corrélation et régression: Postulats
Échantillon appariés ou mesures reliées (i.e., le
même sujet
Indépendance des scores: score du sujet 1 non
corrélé avec score du sujet 2, et ainsi de suite
Distribution normale des scores d’au moins une
des deux variables
Linéarité de la relation
Homoscédasticité (i.e. variance constante de la VI
1 à chaque niveau de la VI 2)
Homoscédasticité
Utilisation du graphe des valeurs prédites vs.
résiduelles pour le diagnostic Linéarité,
Normalité, Homoscédasticité (LNH)
LNH Non normal
Résiduels
Résiduels
0 0
Prédits Prédits
Résiduels
Résiduels
0 0
Prédits Prédits
Hétéroscédasticité Non linéaire
V1
a
V3 d
b
c
V2
Simple: R2 V3 - V1 (a+b)/(a+b+c+d)
V1
a
V3 d
b
c
V2
Simple: R2 V3 - V1 (a+b)/(a+b+c+d)
R2 V3 - V2 ???
Rappel: Corrélation simple, partielle et
semi-partielle
V1
a
V3 d
b
c
V2
V1
a
V3 d
b
c
V2
Si b est significatif Î
a
Coefficients
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Mode B Std. Error Beta t Sig.
1 (Constant) 32,870 1,023 32,138 ,000
sexe du sujet 1,397 ,656 ,107 2,130 ,034
preference sociale
-,997 ,203 -,248 -4,918 ,000
selon le sexe (soci
a.Dependent Variable: echelle de depression kovac t6
Exemple 2: VI avec 4 niveaux (statut
familial)
1 = célibataire
2 = séparée ou divorcée
3 = conjoint de fait ou mariée
4 = veuve
Standard
zed
UnstandardizedCoefficien
Coefficients ts
Mode B Std. Error Beta t Sig.
1 (Constant) 4,495 ,192 23,377 ,000
hostility 62E-02 ,094 ,064 1,065 ,288
VB1 1,068 ,320 ,205 3,342 ,001
VB2 ,698 ,488 ,087 1,431 ,154
VB3 2,773 ,547 ,311 5,070 ,000
a.Dependent Variable: depression
Types de régression multiple ou Le choix
du modèle d’analyse
Standard, sans sélection: Toutes les VI sont
inclues et le degré de significativité ainsi que la
grandeur de l’effet de chacune sont examinés
Hiérarchique: L’entrée des blocs subséquents de
variables est prédéfini sur la base d’un modèle
théorique ou de priorité basé sur une logique appuyée.
La significativité et la grandeur du changement de R2
associé à chaque nouveau bloc sont évaluées
!! À utiliser avec prudence et très rarement: Les
méthodes de sélection du modèle ‘optimale’:
Plusieurs méthodes (forward/ backward/ stepwise/ best subset)
pour sélectionner une combinaison des VIs dans laquelle
chaque VI contribue significativement à la prédiction de la VD