Statistiques
Statistiques
descriptives
Échantillonage Éstimation
Statistiques inférentielles
Statistiques Calculateurs
© The scientific sentence. 2010
|
Mathématiques 2: Statistiques:
Statistiques à deux variables
Régression linéaire et correlation linéaire
Mesure du coefficient de corrélation
1. Mesure graphique du coefficient de corrélation
• Dans un plan cartésien, on représente le nuage de points
de la série statistique,
• On trace la droite de corrélation le long et
au milieu du nuage de points,
• Sans tenir compte des données éloignées dites
aberrantes, on rassemble les données du nuage de points
dans un rectangle,
• On mesure la longeur L et la largeur l du rectangle;
• On place ses valeurs dans la formule suivante:
+ si la pente est positive et – si la pente est négative.
2. Exemple
Dans ce shéma, i carreau = 1 cm x 1cm.
l = √(22 + 32) = 3.6 cm
L = √(72 + 82) = 10.6 cm
La pente est positive. Donc, la corrélation est positive.
r = + (1 - 3.6/10.6) = + 0.66
La corrélation est moyenne et positive.
2. Théorie du coefficient de corrélation
2.1. Coefficient de corrélation par la covariance
Le coefficient de corrélation r entre les variables
statistiques x ey y est défini par l'expression:
où cov(x,y) désigne la covariance de x et y,
E (X) désigne l'espérance mathématique de la variable
aléatoire X, et V(x) et V(y) désignent la variance des
variables x et y respesctivement.
La covariance évalue la variation de deux séries et
renseigne sur la dépendance entre ces variables.
Si deux variables aléatoires sont indépendantes alors leur
covariance est nulle, mais la réciproque n'est pas vraie.
L'espérance mathématique est l'équivalent en probabilité de
la moyenne d'une série statistique. Elle évalue le résultat moyen
d'une expérience aléatoire.
xi sont les valeurs de la variable aléatoire discrète , et
pi les probabilités correspondantes,
2.2. Coefficient de corrélation par la somme des carrés
Le coéfficient de corrélation r mesures combien
une équation de régression représente bien les
données statistiques.
La somme des carrés des écarts dûs à la régression est la somme
des carrées de la différence entre les observations est la
fonction de régression.
C'est aussi la somme des carrés de chacune
des distances entre les points du nuage et la courbe de régression.
Cette somme s’appelle somme des carrés résiduels (SCR), ou
square sum errors (SSE).
La somme totale des carrés des écarts est la somme des carrés de la
différence entre les observations et la moyenne. On note cette
somme SCT (ou SST).
On défini le coefficient de corrélation en fonction
du rapport de la SSE et de la SST.
f(xi) est la fonction de régression.
|
|