2.4 ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Εισαγωγή Στα διάφορα προβλήματα που εξετάσαμε έως τώρα στη Στατιστική ασχοληθήκαμε κάθε φορά με μία μόνο μεταβλητή (ξεχωριστά), π.χ. με το βάρος, με το ύψος, με την επίδοση μαθητών κτλ. Για καθεμιά μεμονωμένη μεταβλητή αρκεστήκαμε στη μελέτη της κατανομής συχνοτήτων, στον υπολογισμό διάφορων μέτρων όπως μέση τιμή, διάμεσος, διακύμανση κτλ. Σε αρκετές όμως περιπτώσεις εξίσου ενδιαφέρουσα είναι και η ταυτόχρονη μελέτη δύο ή περισσότερων μεταβλητών, για να προσδιορίσουμε με ποιο τρόπο οι μεταβλητές αυτές σχετίζονται μεταξύ τους. Για παράδειγμα: |
Απλή Γραμμική Παλινδρόμηση Η απλούστερη περίπτωση παλινδρόμησης είναι η απλή γραμμική παλινδρόμηση (simple linear regression), κατά την οποία υπάρχει μόνο μια ανεξάρτητη μεταβλητή X (independent or input variable), και η εξαρτημένη μεταβλητή Y (dependent or response variable), η οποία μπορεί να προσεγγιστεί ικανοποιητικά από μία γραμμική συνάρτηση του X. Η περίπτωση αυτή εμφανίζεται τόσο σε πειραματικές όσο και σε μη πειραματικές μελέτες. Στις πειραματικές μελέτες ο ερευνητής καθορίζει, για παράδειγμα, από πριν τις δόσεις ενός φαρμάκου (ανεξάρτητη μεταβλητή) που δίνει στα πειραματόζωα και μετρά τις αντιδράσεις τους (εξαρτημένη μεταβλητή). Με την παλινδρόμηση ενδιαφέρεται να προσδιορίσει μία σχέση δόσης-αντίδρασης για το συγκεκριμένο φάρμακο. Στις μη πειραματικές μελέτες ή δειγματοληψίες, γίνονται μετρήσεις σε δύο χαρακτηριστικά (μεταβλητές) για κάθε άτομο (μονάδα) του δείγματος. Σε ένα δείγμα 10 μαθητών μετράμε, για παράδειγμα, το βάρος και το ύψος τους. Η διάκριση εδώ μεταξύ ανεξάρτητης και εξαρτημένης μεταβλητής είναι δύσκολη. Αν αυτό που μας ενδιαφέρει είναι το “τι συμβαίνει με το βάρος των παιδιών όταν αλλάζει το ύψος τους”, τότε θεωρούμε ως ανεξάρτητη μεταβλητή X το ύψος και ως εξαρτημένη μεταβλητή Y το βάρος. Οπότε, ενδιαφερόμαστε για την παλινδρόμηση του βάρους (Y) πάνω στο ύψος (X). Αντίθετα, αν μας ενδιαφέρει το “τι συμβαίνει με το ύψος των παιδιών όταν αλλάζει το βάρος τους”, τότε θεωρούμε ως ανεξάρτητη μεταβλητή Χ το βάρος και ως εξαρτημένη μεταβλητή Υ το ύψος. Τότε έχουμε παλινδρόμηση του ύψους (Υ) πάνω στο βάρος (Χ). Διάγραμμα Διασποράς Ο παρακάτω πίνακας 10 δίνει τα ύψη X (σε cm) και τα βάρη Y (σε kg) των 18 αγοριών της Γ΄ Λυκείου του πίνακα 4. Οι τιμές του ύψους δίνονται σε αύξουσα σειρά. Πίνακας 10 Λίστα υψών (σε cm) και βαρών (σε kg) των 18 αγοριών του πίνακα 4.
Στο παράδειγμα αυτό έχουμε την περίπτωση όπου σε κάθε άτομο (μαθητή) γίνονται δύο μετρήσεις. Δηλαδή το δείγμα αποτελείται από τα ζεύγη τιμών των συνεχών μεταβλητών X (ύψος) και Y (βάρος). |
Διάγραμμα διασποράς και ευθεία προσαρμοσμένη “με το μάτι” Η προσεκτική παρατήρηση ενός διαγράμματος διασποράς μπορεί να μας δώσει σημαντικές πληροφορίες για τη σχέση εξάρτησης που ενδεχομένως υπάρχει μεταξύ των μεταβλητών τις οποίες εξετάζουμε. Η πείρα μας λέει ότι υπάρχει κάποια σχέση μεταξύ του ύψους και του βάρους κάθε μαθητή. Στο παράδειγμα αυτό το διάγραμμα διασποράς δείχνει, γενικά, ότι οι ψηλοί μαθητές είναι συνήθως και πιο βαρείς. Για παράδειγμα, ο Ν είναι ψηλότερος και βαρύτερος από τον Κ, ο Π είναι ψηλότερος και βαρύτερος από τον Κ, αλλά υπάρχουν και εξαιρέσεις, όπως ο Π είναι ψηλότερος από τον Ν αλλά ο Ν είναι βαρύτερος από τον Π. Ευθεία Παλινδρόμησης Από το διάγραμμα διασποράς του προηγούμενου παραδείγματος φαίνεται καθαρά ότι υπάρχει μία σχέση ανάμεσα στο ύψος Χ και το βάρος Υ των 18 αγοριών της Γ'Λυκείου. Τα σημεία (x, y) είναι συγκεντρωμένα περίπου γύρω από μία ευθεία, δηλαδή η σχέση μεταξύ των X και Y είναι κατά προσέγγιση γραμμική. Όπως έχουμε ήδη αναφέρει, μπορούμε να θεωρήσουμε τη μία μεταβλητή ως ανεξάρτητη μεταβλητή και την άλλη ως εξαρτημένη. Εδώ θεωρούμε ως ανεξάρτητη μεταβλητή το ύψος X και ως εξαρτημένη μεταβλητή το βάρος Y, οπότε η ευθεία που θα προσαρμόζεται καλύτερα στα σημεία αυτά καλείται ευθεία παλινδρόμησης της Y πάνω στη X. y = α + βx (1) όπου α και β είναι παράμετροι τις οποίες θέλουμε να υπολογίσουμε ή, όπως λέμε, να “εκτιμήσουμε”, έτσι ώστε η ευθεία που θα προκύψει να μας δίνει όσο το δυνατόν την καλύτερη περιγραφή της σχέσης (εξάρτησης) που υπάρχει μεταξύ των μεταβλητών X και Y. |
Η παράμετρος α μας δίνει το σημείο (0,α), όπου η ευθεία αυτή τέμνει τον άξονα y'y, ενώ η παράμετρος β παριστάνει το συντελεστή διεύθυνσης της ευθείας.
Επομένως, η ευθεία που κατά τη γνώμη μας προσαρμόζεται καλύτερα στα σημεία του διαγράμματος διασποράς διέρχεται από το σημείο (0 , -115,6) και έχει συντελεστή διεύθυνσης 1,06. Μέθοδος των Ελαχίστων Τετραγώνων Είδαμε ότι η πιο απλή διαδικασία προσαρμογής μιας ευθείας γραμμής σε ένα διάγραμμα διασποράς είναι “με το μάτι”. Αυτή όμως έχει πολλά μειονεκτήματα παρά την απλότητά της. Το κυριότερο είναι η έλλειψη αντικειμενικότητας, αφού διάφορα άτομα μπορούν να χαράξουν διαφορετικές μεταξύ τους ευθείες. Ακόμα και το ίδιο άτομο μπορεί να χαράζει διαφορετικές ευθείες κάθε φορά. Χρειαζόμαστε λοιπόν μια ακριβέστερη μέθοδο για την προσαρμογή μιας ευθείας γραμμής σε τέτοιου είδους δεδομένα. |
Μάλιστα εδώ ο Gauss αναφέρει ότι χρησιμοποίησε την αρχή των ελαχίστων τετραγώνων πριν από το 1794 (σε ηλικία μόλις 17 ετών), έτσι ώστε να προηγείται του Legendre ως προς την ανακάλυψη αυτής της μεθόδου. Ας δούμε ξανά το διάγραμμα διασποράς στο σχήμα 17 του προηγούμενου παραδείγματος για τα ύψη Χ και τα βάρη Υ των 18 μαθητών του πίνακα 10. Στο διάγραμμα αυτό έχουμε φέρει και μία ευθεία y = α + βx, που πιστεύουμε ότι προσαρμόζεται καλύτερα στα σημεία (xi , yi) για τις v = 18 συνολικά μετρήσεις των μεταβλητών Χ και Υ. Προσαρμογή ευθείας ελαχίστων τετραγώνων στο διάγραμμα διασποράς Έτσι, για παράδειγμα, για το μαθητή Β, σημείο B(172,60), με ύψος x2 = 172 cm έχουμε βρει, όπως φαίνεται στον πίνακα 10, βάρος y2 = 60kg, ενώ, σύμφωνα με την ευθεία που φέραμε, το βάρος του αναμένεται να είναι (περίπου) 64kg, έχουμε δηλαδή ένα σφάλμα ε2 = 60 - 64 = -4, δηλαδή βάρος 4kg λιγότερο από το αναμενόμενο. Ομοίως για το μαθητή Ζ, σημείο Z(177,81), το βάρος του που μετρήθηκε ήταν y6 = 81kg, ενώ το αναμενόμενο βάρος του σύμφωνα με την ευθεία που φέραμε είναι 71kg, έχουμε δηλαδή ένα σφάλμα ε6 = 81- 71 = 10, δηλαδή βάρος 10kg περισσότερο από το αναμενόμενο. Ανάλογα σφάλματα υπολογίζονται και για τους άλλους μαθητές. Θα θέλαμε λοιπόν να βρούμε με κάποια μέθοδο εκείνη την ευθεία y = α + βx, έτσι ώστε τα σφάλματα που προκύπτουν να είναι όσο το δυνατόν μικρότερα. να γίνεται ελάχιστο. |
Οι τιμές των παραμέτρων α και β, που ελαχιστοποιούν την (4), καλούνται εκτιμήτριες ελαχίστων τετραγώνων (least square estimators), συμβολίζονται με (“α καπέλο”) και (“β καπέλο”), αντιστοίχως, και αποδεικνύεται (η απόδειξη εδώ παραλείπεται) ότι δίνονται από τις σχέσεις: όπου Η ευθεία καλείται ευθεία ελαχίστων τετραγώνων ή ευθεία παλινδρόμησης της Υ (πάνω) στη Χ. Αντικαθιστώντας το στη σχέση (6) βρίσκουμε την η οποία φανερώνει ότι η ευθεία ελαχίστων τετραγώνων διέρχεται από το σημείο με συντεταγμένες και έχει συντελεστή διεύθυνσης το Αντικαθιστώντας τις τιμές xi και yi από τον πίνακα 10 στις σχέσεις (5) βρίσκουμε: οπότε η ευθεία ελαχίστων τετραγώνων που προσαρμόζεται καλύτερα στα δεδομένα είναι από τη σχέση (6), η Παρατηρούμε ότι υπάρχει σημαντική διαφορά από την ευθεία y = -115,6 + 1,06x που προσαρμόσαμε “με το μάτι” στο σχήμα 16. Ερμηνεία των Στην εξίσωση ελαχίστων τετραγώνων η τιμή της εκτιμήτριας της παραμέτρου α παριστάνει την τεταγμένη του σημείου στο οποίο η ευθεία τέμνει τον άξονα y'y, δηλαδή την τιμή της εξαρτημένης μεταβλητής Υ όταν x = 0. Όταν το τότε η ευθεία διέρχεται από την αρχή των αξόνων. δηλαδή Συνεπώς ο συντελεστής διεύθυνσης της ευθείας παριστά τη μεταβολή της εξαρτημένης μεταβλητής Υ όταν το Χ μεταβληθεί κατά μια μονάδα. Έτσι, όταν το x αυξηθεί κατά μια μονάδα τότε το αυξάνεται κατά μονάδες όταν ή ελαττώνεται κατά μονάδες όταν |
ΕΦΑΡΜΟΓΕΣ 1. Ένας ερευνητής, για να εξετάσει την επίδραση ενός αναισθητικού, εμβολίασε 10 ποντίκια με διαφορετική δόση κάθε φορά. Οι χρόνοι που μεσολάβησαν ώσπου τα ποντίκια να χάσουν τις αισθήσεις τους (λιποθυμήσουν) καταγράφονται στον παρακάτω πίνακα. α) Να γίνει το διάγραμμα διασποράς
ΛΥΣΗ α) Η περίπτωση που εξετάζεται εδώ αναφέρεται σε μια πειραματική κατάσταση, κατά την οποία ο ερευνητής καθορίζει εκ των προτέρων τη δόση του αναισθητικού που θα δώσει στα πειραματόζωα και μετρά τις αντιδράσεις τους. Ενδιαφέρεται δηλαδή να προσδιορίσει μια σχέση δόσης αναισθητικού και χρόνου λιποθυμίας. Έτσι, η δόση αναισθητικού παριστάνει την ανεξάρτητη μεταβλητή (X) και ο χρόνος λιποθυμίας την εξαρτημένη μεταβλητή (Y). Επομένως, το διάγραμμα διασποράς παριστάνεται παρακάτω: β) Δύο σημεία από τα οποία εκτιμάται “με το μάτι” ότι θα διέρχεται η καλύτερη ευθεία παλινδρόμησης είναι τα A(0,3 , 12,3) και B(0,8 , 1,9) . Αντικαθιστώντας στην εξίσωση της ευθείας y = α + βx έχουμε το σύστημα: από την επίλυση του οποίου βρίσκουμε α = 18,5 και β = -20,8, οπότε η ευθεία παλινδρόμησης έχει εξίσωση y = 18,5 - 20,8x. |
Παρατηρούμε, όπως άλλωστε αναμενόταν και από το διάγραμμα διασποράς, ότι ο συντελεστής διεύθυνσης είναι αρνητικός, δηλαδή έχουμε αρνητική εξάρτηση του χρόνου λιποθυμίας ως προς τη δόση αναισθητικού. Μεγαλύτερη δόση επιφέρει γρηγορότερη (σε μικρότερο χρόνο) λιποθυμία. ΣΧΟΛΙΟ Παρατηρούμε ότι εμφανίζονται εδώ δυο παράδοξα:
2. Ο παρακάτω πίνακας δίνει τις πωλήσεις (ζήτηση) ενός προϊόντος (π.χ. των κερασιών) Υ (σε κιλά) από το μανάβικο μιας περιοχής και τις αντίστοιχες τιμές Χ του προϊόντος σε εκατοντάδες δρχ. ανά κιλό για μια ορισμένη χρονική περίοδο α) Να βρεθεί η ευθεία ελαχίστων τετραγώνων (των πωλήσεων σε συνάρτηση με την τιμή) και να χαραχτεί στο αντίστοιχο διάγραμμα διασποράς.
ΛΥΣΗ
α) Για τον προσδιορισμό της εξίσωσης της ευθείας ελάχιστων τετραγώνων διευκολύνει ο διπλανός πίνακας με τις απαραίτητες πράξεις. Επομένως, έχουμε: |
Άρα, η εξίσωση της ζήτησης (των κερασιών) σε συνάρτηση με την τιμή τους είναι Επειδή γνωρίζουμε ότι η ευθεία που διέρχεται από τα σημεία (0,α) και είναι εύκολο να χαραχτεί στο διάγραμμα διασποράς, όπως φαίνεται δίπλα. |
Ασκήσεις
|
|