Στα δύο αυτά διαγράμματα διασποράς βλέπουμε ότι προσαρμόζεται η ίδια ευθεία γραμμικής παλινδρόμησης. Όμως τα σημεία του σμήνους στο διάγραμμα (α) είναι περισσότερο συγκεντρωμένα γύρω από την ευθεία ενώ στο διάγραμμα (β) έχουμε ένα πιο χαλαρό σμήνος σημείων γύρω από την αντίστοιχη ευθεία παλινδρόμησης. Δηλαδή στην πρώτη περίπτωση η γραμμική σχέση μεταξύ τωνμεταβλητών είναι ισχυρότερη παρά στη δεύτερη περίπτωση. Ένα μέτρο που μας δίνει το μέγεθος της γραμμικής σχέσης ή το βαθμό συγκέντρωσης των σημείων του διαγράμματος διασποράς γύρω από την ευθεία παλινδρόμησης είναι ο λεγόμενος συντελεστής γραμμικής συσχέτισης (linear correlation coefficient). Συντελεστής Γραμμικής Συσχέτισης Ο συντελεστής γραμμικής συσχέτισης δύο μεταβλητών Χ και Υ ορίζεται με βάση ένα δείγμα ν ζευγών παρατηρήσεων (xi, yi) i=1,2,...,ν, συμβολίζεται με r(X,Y) ή απλά με r και δίνεται από τον τύπο: αναφέρεται δε και ως συντελεστής συσχέτισης του Pearson. Από τον ορισμό του r παρατηρούμε ότι για μεγάλες τιμές xi της X και yi της Y (μεγαλύτερες από τη μέση τιμή τους) οι διαφορές και είναι θετικές, οπότε το γινόμενό τους είναι θετικό. Όμοια για μικρές τιμές xi και yi, οι διαφορές και είναι αρνητικές, οπότε το γινόμενό τους είναι πάλι θετικό. Επομένως, όταν σε μεγάλες τιμές της μεταβλητής Χ αντιστοιχούν και μεγάλες τιμές της Υ, ή σε μικρές τιμές της Χ αντιστοιχούν μικρές τιμές της Υ τότε ο συντελεστής συσχέτισης είναι θετικός και λέμε ότι οι Χ, Υ είναι θετικά συσχετισμένες. Ανάλογα μπορούμε να δούμε ότι ο r παίρνει αρνητικές τιμές όταν σε μεγάλες τιμές της μιας μεταβλητής αντιστοιχούν μικρές τιμές της άλλης, οπότε λέμε ότι οι μεταβλητές αυτές είναι αρνητικά συσχετισμένες. Με βάση τον παρακάτω πίνακα και τον τύπο (1) υπολογίζουμε το συντελεστή xi | yi | | | | | | 1 1 2 3 3 4 5 5 | 2,5 4,0 3,0 4,5 4,0 3,5 5,5 5,0 | -2 -2 -1 0 0 1 2 2 | -1,5 0 -1 0,5 0 -0,5 1,5 1 | 4 4 1 0 0 1 4 4 | 2,25 0 1 0,25 0 0,25 0,25 1 | 3 0 1 0 0 -0,5 3 2 | 24 | 32 | 0 | 0 | 18 | 7 | 8,5 | γραμμικής συσχέτισης για τα δεδομένα του πρώτου παραδείγματος |