2.5 ΓΡΑΜΜΙΚΗ ΣΥΣΧΕΤΙΣΗ Εισαγωγή Έχουμε δει μέχρι τώρα ότι ένα σύνολο παρατηρήσεων μιας μεταβλητής περιγράφεται με τα μέτρα θέσης και διασποράς, όπως για παράδειγμα, η μέση τιμή και η τυπική απόκλιση, αντιστοίχως. Επιπλέον, με τη γραμμική παλινδρόμηση που εξετάσαμε στην προηγούμενη παράγραφο είδαμε πώς βρίσκουμε την ευθεία γραμμικής παλινδρόμησης η οποία προσαρμόζεται καλύτερα στο “σμήνος” των σημείων όπως αυτά παριστάνονται σε ένα διάγραμμα διασποράς.
από τα οποία βρίσκουμε:
|
| Στα δύο αυτά διαγράμματα διασποράς βλέπουμε ότι προσαρμόζεται η ίδια ευθεία γραμμικής παλινδρόμησης. Όμως τα σημεία του σμήνους στο διάγραμμα (α) είναι περισσότερο συγκεντρωμένα γύρω από την ευθεία ενώ στο διάγραμμα (β) έχουμε ένα πιο χαλαρό σμήνος σημείων γύρω από την αντίστοιχη ευθεία παλινδρόμησης. Δηλαδή στην πρώτη περίπτωση η γραμμική σχέση μεταξύ τωνμεταβλητών είναι ισχυρότερη παρά στη δεύτερη περίπτωση. Ένα μέτρο που μας δίνει το μέγεθος της γραμμικής σχέσης ή το βαθμό συγκέντρωσης των σημείων του διαγράμματος διασποράς γύρω από την ευθεία παλινδρόμησης είναι ο λεγόμενος συντελεστής γραμμικής συσχέτισης (linear correlation coefficient). Συντελεστής Γραμμικής Συσχέτισης Ο συντελεστής γραμμικής συσχέτισης δύο μεταβλητών Χ και Υ ορίζεται με βάση ένα δείγμα ν ζευγών παρατηρήσεων (xi, yi) i=1,2,...,ν, συμβολίζεται με r(X,Y) ή απλά με r και δίνεται από τον τύπο:
αναφέρεται δε και ως συντελεστής συσχέτισης του Pearson.
γραμμικής συσχέτισης για τα δεδομένα του πρώτου παραδείγματος
|
| Με ανάλογο τρόπο υπολογίζουμε και το συντελεστή γραμμικής συσχέτισης για τα δεδομένα του δεύτερου παραδείγματος όπου βρίσκουμε r' ≈ 0,41.
Πιο συγκεκριμένα όταν:
|
Αποδεικνύεται ότι ο συντελεστής γραμμικής συσχέτισης r δίνεται ισοδύναμα και από τον παρακάτω τύπο, η χρήση του οποίου διευκολύνει συχνά τους υπολογισμούς κυρίως στην περίπτωση που οι
Συσχέτιση και Παλινδρόμηση Η παλινδρόμηση και η συσχέτιση, όπως τις εξετάσαμε έως τώρα, είναι δύο διαδικασίες μελέτης διμεταβλητών πληθυσμών. Η παλινδρόμηση προσδιορίζει τη σχέση εξάρτησης μεταξύ δύο μεταβλητών, ενώ ο συντελεστής γραμμικής συσχέτισης δίνει ένα μέτρο του μεγέθους της γραμμικής συσχέτισης μεταξύ δύο μεταβλητών. Επομένως, οι δύο διαδικασίες δεν είναι άσχετες μεταξύ τους. |
ΕΦΑΡΜΟΓΗ Να υπολογιστεί και να ερμηνευτεί ο συντελεστής συσχέτισης r μεταξύ των μεταβλητών Χ και Υ με βάση τις παρακάτω τιμές:
ΛΥΣΗ Για τον υπολογισμό του συντελεστή συσχέτισης μεταξύ των Χ και Υ διευκολύνει ο παρακάτω πίνακας:
ν = 7 Ο συντελεστής συσχέτισης υπολογίζεται από τη σχέση:
Η υψηλή τιμή του r μας δείχνει ότι υπάρχει πολύ έντονη θετική γραμμική συσχέτιση μεταξύ των μεταβλητών Χ και Υ, όπως εξάλλου μπορούμε να το διαπιστώσουμε και από το αντίστοιχο διάγραμμα διασποράς. |
Ασκήσεις
| ||||||||||||||||
| ||||||||||||||||||
ΓΕΝΙΚΕΣ ΑΣΚΗΣΕΙΣ
|
|
| ||||||||||||||||||||||||
ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ Στις ερωτήσεις 1-10 να βάλετε σε κύκλο το Σ (Σωστό) ή το Λ (Λάθος).
|
Στις ερωτήσεις 15-24 να βάλετε σε κύκλο τη σωστή απάντηση.
|
|
Στις ερωτήσεις 25-35 να γίνει αντιστοίχιση των (α), (β)… μετα (i), (ii), … ,
|
|