Μαθηματικά και Στοιχεία Στατιστικής - Βιβλίο Μαθητή
2.4 ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 3.1 ΔΕΙΓΜΑΤΙΚΟΣ ΧΩΡΟΣ -ΕΝΔΕΧΟΜΕΝΑ Επιστροφή στην αρχική σελίδα του μαθήματος

2.5 ΓΡΑΜΜΙΚΗ ΣΥΣΧΕΤΙΣΗ

Εισαγωγή

Έχουμε δει μέχρι τώρα ότι ένα σύνολο παρατηρήσεων μιας μεταβλητής περιγράφεται με τα μέτρα θέσης και διασποράς, όπως για παράδειγμα, η μέση τιμή και η τυπική απόκλιση, αντιστοίχως. Επιπλέον, με τη γραμμική παλινδρόμηση που εξετάσαμε στην προηγούμενη παράγραφο είδαμε πώς βρίσκουμε την ευθεία γραμμικής παλινδρόμησης η οποία προσαρμόζεται καλύτερα στο “σμήνος” των σημείων όπως αυτά παριστάνονται σε ένα διάγραμμα διασποράς.
Ας δούμε, για παράδειγμα, τα παρακάτω ζεύγη τιμών (xi , yi) για τις μεταβλητές Χ, Υ και (x'i , y'i) για τις μεταβλητές X', Y':

Εικόνα

από τα οποία βρίσκουμε:

  • Εικόνα
  • Εικόνα
  • το διάγραμμα διασποράς στο σχήμα 18(α) των σημείων (xi, yi) και την αντίστοιχη ευθεία ελαχίστων τετραγώνων Εικόνα
  • το διάγραμμα διασποράς στο σχήμα 18(β) των σημείων (x'i, y'i) και την αντίστοιχη ευθεία ελαχίστων τετραγώνωνΕικόνα
Εικόνα Εικόνα

(α)

(β)

Στα δύο αυτά διαγράμματα διασποράς βλέπουμε ότι προσαρμόζεται η ίδια ευθεία γραμμικής παλινδρόμησης. Όμως τα σημεία του σμήνους στο διάγραμμα (α) είναι περισσότερο συγκεντρωμένα γύρω από την ευθεία ενώ στο διάγραμμα (β) έχουμε ένα πιο χαλαρό σμήνος σημείων γύρω από την αντίστοιχη ευθεία παλινδρόμησης. Δηλαδή στην πρώτη περίπτωση η γραμμική σχέση μεταξύ τωνμεταβλητών είναι ισχυρότερη παρά στη δεύτερη περίπτωση. Ένα μέτρο που μας δίνει το μέγεθος της γραμμικής σχέσης ή το βαθμό συγκέντρωσης των σημείων του διαγράμματος διασποράς γύρω από την ευθεία παλινδρόμησης είναι ο λεγόμενος συντελεστής γραμμικής συσχέτισης (linear correlation coefficient).

Συντελεστής Γραμμικής Συσχέτισης

Ο συντελεστής γραμμικής συσχέτισης δύο μεταβλητών Χ και Υ ορίζεται με βάση ένα δείγμα ν ζευγών παρατηρήσεων (xi, yi) i=1,2,...,ν, συμβολίζεται με r(X,Y) ή απλά με r και δίνεται από τον τύπο:

Εικόνα

αναφέρεται δε και ως συντελεστής συσχέτισης του Pearson.
Από τον ορισμό του r παρατηρούμε ότι για μεγάλες τιμές xi της X και yi της Y (μεγαλύτερες από τη μέση τιμή τους) οι διαφορές Εικόνα και Εικόναείναι θετικές, οπότε το γινόμενό τους είναι θετικό. Όμοια για μικρές τιμές xi και yi, οι διαφορές Εικόνα και Εικόνα είναι αρνητικές, οπότε το γινόμενό τους είναι πάλι θετικό. Επομένως, όταν σε μεγάλες τιμές της μεταβλητής Χ αντιστοιχούν και μεγάλες τιμές της Υ, ή σε μικρές τιμές της Χ αντιστοιχούν μικρές τιμές της Υ τότε ο συντελεστής συσχέτισης είναι θετικός και λέμε ότι οι Χ, Υ είναι θετικά συσχετισμένες. Ανάλογα μπορούμε να δούμε ότι ο r παίρνει αρνητικές τιμές όταν σε μεγάλες τιμές της μιας μεταβλητής αντιστοιχούν μικρές τιμές της άλλης, οπότε λέμε ότι οι μεταβλητές αυτές είναι αρνητικά συσχετισμένες. Με βάση τον παρακάτω πίνακα και τον τύπο (1) υπολογίζουμε το συντελεστή

xi yi Εικόνα Εικόνα Εικόνα Εικόνα Εικόνα
1
1
2
3
3
4
5
5
2,5
4,0
3,0
4,5
4,0
3,5
5,5
5,0
-2
-2
-1
0
0
1
2
2
-1,5
0
-1
0,5
0
-0,5
1,5
1
4
4
1
0
0
1
4
4
2,25
0
1
0,25
0
0,25
0,25
1
3
0
1
0
0
-0,5
3
2
24 32 0 0 18 7 8,5

γραμμικής συσχέτισης για τα δεδομένα του πρώτου παραδείγματος

Εικόνα

Με ανάλογο τρόπο υπολογίζουμε και το συντελεστή γραμμικής συσχέτισης για τα δεδομένα του δεύτερου παραδείγματος όπου βρίσκουμε r' ≈ 0,41.
Συγκρίνοντας τους δύο συντελεστές συσχέτισης βλέπουμε ότι r > r'. Αυτό δηλώνει ότι οι μεταβλητές Χ, Υ του πρώτου παραδείγματος είναι περισσότερο γραμμικά συσχετισμένες παρά οι μεταβλητές X', Y' του δεύτερου παραδείγματος.
Ο συντελεστής συσχέτισης είναι καθαρός αριθμός, δηλαδή δεν εκφράζεται σε συγκεκριμένες μονάδες μέτρησης, επομένως είναι ανεξάρτητος των χρησιμοποιούμενων μονάδων μέτρησης των μεταβλητών Χ και Υ. Επί πλέον ισχύει πάντοτε ότι:

Εικόνα

Πιο συγκεκριμένα όταν:

Εικόνα 0 < r < +1, τότε οι Χ, Υ είναι θετικά γραμμικά συσχετισμένες (σχήμα 19(γ), (ε))
Εικόνα -1 < r <0, τότε οι Χ, Υ είναι αρνητικά γραμμικά συσχετισμένες (σχήμα 19(δ), (στ))
Εικόνα r = +1, τότε έχουμε τέλεια θετική γραμμική συσχέτιση και όλα τα σημεία βρίσκονται πάνω σε μια ευθεία με θετική κλίση (σχήμα 19(α)), δηλαδή y = α + βx, β > 0
Εικόνα r = -1, τότε έχουμε τέλεια αρνητική γραμμική συσχέτιση και όλα τα σημεία βρίσκονται πάνω σε μια ευθεία με αρνητική κλίση (σχήμα 19(β)), δηλαδή y = α + βx, β < 0
Εικόνα r = 0, τότε δεν υπάρχει γραμμική συσχέτιση μεταξύ των μεταβλητών. Οι μεταβλητές δηλαδή Χ, Υ είναι γραμμικά ασυσχέτιστες (σχήμα 19(ζ)).
Εικόνα Εικόνα Εικόνα
Εικόνα Εικόνα Εικόνα
Εικόνα

Διαγράμματα διασποράς και συντελεστές συσχέτισης για διάφορα ζεύγη παρατηρήσεων (xi, yi).

Αποδεικνύεται ότι ο συντελεστής γραμμικής συσχέτισης r δίνεται ισοδύναμα και από τον παρακάτω τύπο, η χρήση του οποίου διευκολύνει συχνά τους υπολογισμούς κυρίως στην περίπτωση που οι Εικόνα δεν είναι ακέραιοι:

Εικόνα

Συσχέτιση και Παλινδρόμηση

Η παλινδρόμηση και η συσχέτιση, όπως τις εξετάσαμε έως τώρα, είναι δύο διαδικασίες μελέτης διμεταβλητών πληθυσμών. Η παλινδρόμηση προσδιορίζει τη σχέση εξάρτησης μεταξύ δύο μεταβλητών, ενώ ο συντελεστής γραμμικής συσχέτισης δίνει ένα μέτρο του μεγέθους της γραμμικής συσχέτισης μεταξύ δύο μεταβλητών. Επομένως, οι δύο διαδικασίες δεν είναι άσχετες μεταξύ τους.
Όταν δεν έχουμε πειραματικά δεδομένα, να προκαθορίζονται δηλαδή οι τιμές της μιας μεταβλητής, τότε μπορεί να μελετηθεί είτε η εξάρτηση της Υ από τη Χ είτε η εξάρτηση της Χ από την Υ. Το πόσο έντονη είναι η σχέση εξάρτησης μεταξύ των δύο μεταβλητών μας το δίνει ο συντελεστής συσχέτισης. Όσο το r πλησιάζει στο +1 τόσο τα σημεία του διαγράμματος διασποράς τείνουν να βρίσκονται σε μια ευθεία με συντελεστή διεύθυνσης β > 0. Όσο το r πλησιάζει στο -1 τόσο τα σημεία τείνουν να βρίσκονται σε μια ευθεία με β < 0. Όταν r ≈ 0, τότε β ≈ 0. Συνήθως στις εφαρμογές εξετάζεται η συσχέτιση και η παλινδρόμηση μαζί, οπότε έχουμε πληρέστερη και πιο ολοκληρωμένη εξέταση των δύο μεταβλητών.

ΕΦΑΡΜΟΓΗ

Να υπολογιστεί και να ερμηνευτεί ο συντελεστής συσχέτισης r μεταξύ των μεταβλητών Χ και Υ με βάση τις παρακάτω τιμές:

Εικόνα

 

ΛΥΣΗ

Για τον υπολογισμό του συντελεστή συσχέτισης μεταξύ των Χ και Υ διευκολύνει ο παρακάτω πίνακας:

x y x2 y2 xy
10
13
17
21
25
28
30
21
24
29
25
36
33
40
100
169
289
441
625
784
900
441
576
841
625
1296
1089
1600
210
312
493
525
900
924
1200
Σx = 144 Σy = 208 Σx2 = 3308 Σy2 = 6468 Σxy = 4564

ν = 7

Ο συντελεστής συσχέτισης υπολογίζεται από τη σχέση:

Εικόνα

Εικόνα

Η υψηλή τιμή του r μας δείχνει ότι υπάρχει πολύ έντονη θετική γραμμική συσχέτιση μεταξύ των μεταβλητών Χ και Υ, όπως εξάλλου μπορούμε να το διαπιστώσουμε και από το αντίστοιχο διάγραμμα διασποράς.

Ασκήσεις

Α' ΟΜΑΔΑΣ
1.

Να διατάξετε τις παρακάτω τιμές του r σε αύξουσα τάξη του βαθμού γραμμικής συσχέτισης δύο μεταβλητών: -0,6, 0,9, -0,7, 0,2, 0, -1.

2.

Από τα διαγράμματα διασποράς των παρακάτω ζευγών (xi, yi) να εκτιμήσετε (χωρίς πράξεις) εάν η γραμμική συσχέτιση μεταξύ των μεταβλητών X και Y είναι θετική ή αρνητική και επιπλέον αν είναι μικρή, μέτρια ή μεγάλη:

α) Εικόνα
β) Εικόνα
γ) Εικόνα
δ)Εικόνα
ε) Εικόνα
3.

Να υπολογίσετε τους συντελεστές γραμμικής συσχέτισης για τα ζεύγη τιμών (xi, yi) της προηγούμενης άσκησης και να τους συγκρίνετε με τις αντίστοιχες εκτιμήσεις σας.

4.

Να βρείτε τους συντελεστές γραμμικής συσχέτισης για τα παρακάτω ζεύγη τιμών και να σχολιάσετε τα αποτελέσματα.

α) Εικόνα β) Εικόνα
5.

Για τέσσερα ζεύγη παρατηρήσεων (xi, yi) έχουμε:

Εικόνα

Να υπολογίσετε το συντελεστή συσχέτισης.

6.

Να συμπληρώσετε τον παρακάτω πίνακα και να υπολογίσετε το συντελεστή συσχέτισης (x,y > 0):

Εικόνα

7.

α) Να δείξετε ότι Εικόνα
β) Για εφτά ζεύγη παρατηρήσεων (xi, yi) έχουμε
Εικόνα

Να υπολογίσετε το συντελεστή συσχέτισης.

Β' ΟΜΑΔΑΣ
1.

Η κατά άτομο κατανάλωση (σε γαλόνια) άπαχου (Υ) και πλήρους (Χ) γάλακτος για τα έτη 1982-87 στις ΗΠΑ δίνεται στον παρακάτω πίνακα:

Εικόνα

α) Να υπολογίσετε και να ερμηνεύσετε το συντελεστή συσχέτισης.
β) Αν μετατραπούν οι ποσότητες γάλακτος σε λίτρα, ποια θα είναι η τιμή του συντελεστή συσχέτισης; (1 γαλόνι ≈ 3,8 λίτρα)

2.

Τα παρακάτω δεδομένα παριστάνουν τους δείκτες ευφυΐας (I.Q.) 10 μητέρων (Χ) και των θυγατέρων τους (Υ):

I.Q. μητέρας I.Q. θυγατέρας I.Q. μητέρας I.Q. θυγατέρας
85
90
95
100
110
90
100
90
105
120
115
120
120
130
135
110
125
110
130
120
α) Να κατασκευάσετε το διάγραμμα διασποράς
β) Από το διάγραμμα διασποράς να εκτιμήσετε το συντελεστή συσχέτισης
γ) Να υπολογίσετε και να ερμηνεύσετε το συντελεστή συσχέτισης
3.

Ένας ερευνητής πιστεύει ότι υπάρχει συσχέτιση μεταξύ καπνιστών (του αριθμού τσιγάρων που καπνίζουν κάθε μέρα) και της εξυπνάδας (δείκτης I.Q.). Με βάση τα παρακάτω δεδομένα για 15 καπνιστές, να σχολιάσετε τον ισχυρισμό του ερευνητή.

Εικόνα


Δίνονται: ν =15,   Σx = 376,   Σy = 161,   Σx2 = 12714,   Σy2 = 2213,   Σxy = 4317

4.

Σε μια εξέταση στα Μαθηματικά οκτώ μαθητών η βαθμολογία δύο εξεταστών Α, Β ήταν ως ακολούθως:

Εικόνα

Να εξετάσετε εάν υπάρχει γραμμική συσχέτιση μεταξύ της βαθμολογίας των δύο εξεταστών.

ΓΕΝΙΚΕΣ ΑΣΚΗΣΕΙΣ

1.

Ο αριθμός των παιδιών σε ένα δείγμα 80 οικογενειών μιας πόλης δίνεται στον παρακάτω πίνακα:

Αριθμός Παιδιών 0 1 2 3 4 5 6
Οικογένειες 10 25 20 12 6 5 2

α) Να βρείτε τη μέση τιμή, τη διάμεση τιμή, την επικρατούσα τιμή και την τυπική απόκλιση του αριθμού των παιδιών.
β) Να κατασκευάσετε το διάγραμμα σχετικών συχνοτήτων και το πολύγωνο αθροιστικών σχετικών συχνοτήτων.
γ) Από το πολύγωνο αθροιστικών σχετικών συχνοτήτων να εκτιμήσετετα τρία τεταρτημόρια.

2.

Ο αριθμός των τυπογραφικών λαθών που βρέθηκαν στις 60 σελίδες ενός κειμένου στην πρώτη του διόρθωση ήταν:

Εικόνα


α) Να ομαδοποιήσετε τα δεδομένα σε πέντε ισοπλατείς κλάσεις πλάτους δύο και να κατασκευάσετε τον πίνακα συχνοτήτων.
β) Να κατασκευάσετε τα ιστογράμματα συχνοτήτων και αθροιστικών συχνοτήτων και τα αντίστοιχα πολύγωνα συχνοτήτων.
γ) Να υπολογίσετε τη μέση τιμή, τη διάμεσο, την κορυφή και την τυπική απόκλιση.

3.

Εικόνα

Σε μια εταιρεία συνολικά εργάζονται 200 άτομα. Όπως προέκυψε από ένα τυχαίο δείγμα υπαλλήλων, ο συνολικός χρόνος υπηρεσίας τους δίνεται στο διπλανό κυκλικό διάγραμμα.
α )Να κατασκευάσετε τον πίνακα συχνοτήτων.
β) Να υπολογίσετε τη μέση τιμή και την τυπική απόκλιση.
γ) Πόσοι συνολικά υπάλληλοι αναμένονται να συνταξιοδοτηθούν (συμπληρώνοντας 35-ετία) μέσα στα επόμενα i) 5 χρόνια, ii) 10 χρόνια;
δ) Να κατασκευάσετε το ιστόγραμμα σχετικών συχνοτήτων.

4.
Μήνες 1990 1994
Ιαν.-Φεβρ.
Μαρ.-Απρ.
Μάιος-Ιούν.
Ιουλ.-Αυγ.
Σεπ.-Οκτ.
Νοεμ.-Δεκ.
1057
927
1114
1020
941
775
692
716
829
783
809
636
Σύνολο 5834 4465

Τα εργατικά ατυχήματα που συνέβησαν το 1990 και το 1994 δίνονται στο διπλανό πίνακα (Στοιχεία Υπουργείου Εργασίας).
α) Να απεικονίσετε τα δεδομένα σε ένα ραβδόγραμμα συχνοτήτων.
β) Πόσα ατυχήματα συνέβησαν κατά μέσο όρο για τα έτη 1990 και 1994;
γ) Το 1,4% των ατυχημάτων του 1990 και το 2,1% του 1994 ήταν θανατηφόρα. Πόσα ατυχήματα ήταν θανατηφόρα για τα αντίστοιχα έτη; Ποιο είναι το συμπερασμά σας;

5.
Α Β
12 12
14 13
23 16
30 22
36 32

Ο παρακάτω πίνακας δίνει τη διάρκεια ζωής δύο τύπων λυχνιών Α και Β σε χιλιάδες ώρες. Μια λυχνία τύπου Α στοιχίζει 23.000 δρχ.
α) Ποιον τύπου λυχνία θα προτιμήσετε, αν η μία λυχνία τύπου Β στοιχίζει:
i) 18.000 δρχ. ii) 19.000 δρχ. iii) 20.000 δρχ.
Να αιτιολογήσετε σε κάθε περίπτωση την απάντησή σας.
β) Ποιου τύπου οι λυχνίες παρουσιάζουν μεγαλύτερη ομοιογένεια ως προς τη διάρκεια λειτουργίας τους;

6.

Σε δειγματοληπτική έρευνα που έγινε στις 15 χώρες της Ευρωπαϊκής Ένωσης (Ε.Ε.) μία βδομάδα πριν και μία βδομάδα μετά το Συμβούλιο Κορυφής, (Σ.Κ.) που έγινε το Μάιο του 1998, τα ποσοστά των ατόμων που αισθάνονταν πολύ καλά πληροφορημένα για το ενιαίο νόμισμα (ευρώ) δίνονται στον παρακάτω πίνακα:

Χώρα Πριν το
Σ. Κ.
Μετά το
Σ. Κ.
Χώρα Πριν το
Σ. Κ.
Μετά το
Σ. Κ.
Αυστρία
Βέλγιο
Βρετανία
Γαλλία
Γερμανία
Δανία
Ελλάδα
Ιρλανδία
50
55
40
61
44
51
26
41
47
55
35
72
48
53
22
29
Ισπανία
Ιταλία
Λουξεμβούργο
Ολλανδία
Πορτογαλία
Σουηδία
Φινλανδία
30
49
56
56
18
40
45
39
39
62
55
20
38
45

α) Να παραστήσετε τα δεδομένα σε μορφή ραβδογράμματος.
β) Μα βρεθεί το μέσο ποσοστό των πολύ καλά ενημερωμένων για τις 15 χώρες της Ε.Ε. πριν και μετά το Σ.Κ., υπολογίζοντας i) τον αριθμητικό μέσο και ii) το σταθμικό μέσο ποσοστό με βάρη τους πληθυσμούς των 15 χωρών μελών της Ε.Ε. Ποιος από τους δύο μέσους είναι ο αντιπροσωπευτικότερος;

7.

Στον παρακάτω πίνακα παριστάνονται οι χρόνοι (σε λεπτά και δευτερόλεπτα) των νικητών των Ολυμπιακών αγώνων στην κολύμβηση στα 400 μέτρα ελευθέρας (freestyle) ανδρών και γυναικών. Να δώσετε (για κάθε φύλο χωριστά) το χρονόγραμμα των δεδομένων αυτών. Τι συμπεράσματα βγάζετε;

Έτος Χρόνος
Ανδρών
Χρόνος
Γυναικών
Έτος Χρόνος
Ανδρών
Χρόνος
Γυναικών
1904
1908
1912
1920
1924
1928
1932
1936
1948
1952
6:16.2
5:36.8
5:24.4
5:26.8
5:04.2
5:01.6
4:48.4
4:44.5
4:41.0
4:30.7




6:02.2
5:42.8
5:28.5
5:26.4
5:17.8
5:12.1
1956
1960
1964
1968
1972
1976
1980
1984
1988
1992
4:27.3
4:18.3
4:12.2
4:09.0
4:00.3
3:51.9
3:51.3
3:51.2
3:47.0
3:45.0
4:54.6
4:50.6
4:43.3
4:31.8
4:19.4
4:09.9
4:08.8
4:07.1
4:03.9
4:07.2

Πηγή: The World Almanac and Book of Facts, 1994.

8.

Οι κάτοικοι ανά km2 από το 1960 έως και το 1974 στην Ελλάδα ήταν:

Εικόνα


α)Να εκτιμήσετε την ευθεία γραμμικής παλινδρόμησης της Υ στη Χ, και να την παραστήσετε στο διάγραμμα διασποράς.
β) Το 1976 είχαμε 69,5 κατοίκους/km2. Είναι αυτό αναμενόμενο;
(Υπόδειξη: Θεωρούμε ως έτος αναφοράς το 1960 με τιμή x = 1).

9. Ο συντελεστής γενικής θνησιμότητας (Σ.Γ.Θ.) της Ελλάδας για τα χρόνια 1931-1964 παρουσίασε την παρακάτω πορεία.

Εικόνα

α) Να χαράξετε “με το μάτι” την ευθεία γραμμικής παλινδρόμησης y = α + βx στο διάγραμμα διασποράς και από την ευθεία αυτή να εκτιμήσετε το Σ.Γ.Θ. για το έτος 1965.
β) Χρησιμοποιώντας τη μέθοδο των δύο σημείων να υπολογίσετε την εξίσωση της ευθείας παλινδρόμησης και στη συνέχεια να εκτιμήσετε πάλι το Σ.Γ.Θ. για το έτος 1965. Συγκρίνετε με το προηγούμενο αποτέλεσμα.
γ) Να επαναλάβετε το ίδιο χρησιμοποιώντας τη μέθοδο ελαχίστων τετραγώνων.
Σημ. Για την ανεξάρτητη μεταβλητή Χ να θέσετε για το έτος 1931 ως τιμή το 1, οπότε για το 1936 το x = 6 και για το 1965 το 35.

10.

Ο παρακάτω πίνακας δίνει το μηνιαίο εισόδημα Χ και τις αντίστοιχες δαπάνες διατροφής Υ πέντε νοικοκυριών, που πάρθηκαν τυχαία από μια πολυκατοικία.

Εικόνα

α) Με τη μέθοδο των “ελαχίστων τετραγώνων” να βρείτε την εξίσωση της ευθείας γραμμικής παλινδρόμησης των εξόδων διατροφής (πάνω) στο εισόδημα.
β) Μια οικογένεια της πολυκατοικίας έχει μηνιαίο εισόδημα 500.000 δρχ. Πόσο εκτιμάτε εσείς ότι θα ξοδεύει για διατροφή το μήνα;
γ) Αν γνωρίζετε ότι μια οικογένεια ξοδεύει 300.000 δρχ. για διατροφή μπορείτε, με βάση τα παραπάνω, να προβλέψετε το μηνιαίο εισόδημά της;

11.

Η ποσότητα Εικόνα καλείται συνδιακύμανση των μεταβλητών Χ και Υ. Αν καλέσουμε με sx2, sx2 τις διακυμάνσεις των Χ και Υ αντίστοιχα, να δείξετε ότι ισχύουν οι σχέσεις:
α) Εικόνα β) Εικόνα

12.

Ένας μαθητής γνώριζε ότι η σχέση που συνδέει τους βαθμούς Φαρενάιτ (°F) με τους βαθμούς Κελσίου (°C) είναι γραμμική, δηλαδή F = α + βC. Επειδή όμως δε θυμότανε τις σταθερές α, β, μέτρησε τη θερμοκρασία του δωματίου του σε πέντε διαφορετικές ώρες με δύο θερμόμετρα με κλίμακα σε °F και °C, αντίστοιχα, και πήρε τα παρακάτω ζεύγη τιμών:

Εικόνα

Να βρείτε τη σχέση Εικόνα που συνδέει τις δύο κλίμακες θερμοκρασίας.

13.

Δίνεται δείγμα ν ζευγών (x1, y1),(x2, y2),...,(xν, yν) δύο μεταβλητών Χ και Υ και έστω r(X,Y) ο συντελεστής συσχέτισης. Εάν Z = λY όπου λ θετική σταθερά, να δείξετε ότι ισχύει:

Εικόνα

Τι γίνεται, εάν λ < 0;

14. Ο αριθμός των διαζυγίων που εκδόθηκαν στην Κύπρο από το 1974 έως το 1994 δίνεταιπαρακάτω (Πηγή: Τμήμα Στατιστικής και Ερευνών Κύπρου).
Έτος x Αριθμός Διαζυγίων
y
Έτος x Αριθμός Διαζυγίων
y
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1
2
3
4
5
6
7
8
9
10
11
140
121
110
136
158
161
164
175
216
262
250
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
12
13
14
15
16
17
18
19
20
21
258
276
326
312
335
348
304
433
504
555
  Δίνονται: ν = 21   Σx2 = 3.311   Σx = 231   Σy2 = 17.726.800   Σ= 5.544   Σxy = 75.512

Να βρείτε την ευθεία “ελαχίστων τετραγώνων” και να εκτιμήσετε τον αριθμό των διαζυγίων για τα έτη 1995, 2000.

ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ

Στις ερωτήσεις 1-10 να βάλετε σε κύκλο το Σ (Σωστό) ή το Λ (Λάθος).

1.

Πάντοτε ένα μεγάλύτερο δείγμα δίνει πιο αξιόπιστα αποτελέσματα από ένα μικρότερο δείγμα.

Σ Λ
2.

Όταν έχουμε συμμετρική κατανομή, η μέση τιμή συμπίπτει με τη διάμεσο.

Σ Λ
3.

Όταν έχουμε ακραίες παρατηρήσεις, είναι προτιμότερο να χρησιμοποιούμε τη μέση τιμή αντί της διαμέσου.

Σ Λ
4.

Ο λόγος της μέσης τιμής προς την τυπική απόκλιση καλείται συντελεστής μεταβολής και είναι καθαρός αριθμός.

Σ Λ
5.

Όταν προσθέσουμε μια σταθερά στις παρατηρήσεις μιας μεταβλητής τότε η μέση τιμή και η τυπική απόκλιση αυξάνουν κατά τη σταθερά αυτή.

Σ Λ
6.

Όταν πολλαπλασιάσουμε τις τιμές μιας μεταβλητής επί μια σταθερά, τότε η μέση τιμή πολλαπλασιάζεται επί την ίδια σταθερά.

Σ Λ
7.

Όταν πολλαπλασιάσουμε τις τιμές μιας μεταβλητής επί μια σταθερά, τότε η τυπική απόκλιση πολλαπλασιάζεται επί την ίδια σταθερά.

Σ Λ
8.

Η διάμεσος και το δεύτερο τεταρτημόριο έχουν πάντα την ίδια τιμή.

Σ Λ
9.

Το βάρος της ζάχαρης που βάζουμε στους καφέδες είναι ποιοτική μεταβλητή, γιατί χαρακτηρίζει τον καφέ σκέτο, μέτριο ή γλυκύ.

Σ Λ
10.

Η σχετική συχνότητα μπορεί να πάρει και αρνητικές τιμές.

Σ Λ
11.

Για την ανεξάρτητη μεταβλητή οι παρατηρήσεις είτε προκαθορίζονται είτε λαμβάνονται χωρίς να υπεισέρχεται σφάλμα μέτρησης.

Σ Λ
12.

Η β παριστάνει την αύξηση της εξαρτημένης μεταβλητής, όταν η ανεξάρτητη μεταβλητή αυξηθεί κατά μία μονάδα.

Σ Λ
13.

Ένας συντελεστής συσχέτισης r = +0,6 δείχνει μεγαλύτερη γραμμική συσχέτιση μεταξύ δύο μεταβλητών παρά ο r = -0,9.

Σ Λ
14.

Όταν r(X,Y) > 0, τότε συνεπάγεται ότι οι μεταβλητές Χ, Υ είναι θετικά συσχετισμένες.

Σ Λ

Στις ερωτήσεις 15-24 να βάλετε σε κύκλο τη σωστή απάντηση.

15.

Ένα μέτρο που χρησιμοποιείται τόσο για ποιοτικά όσο και για ποσοτικά δεδομένα είναι:
Α. η μέση τιμή                    Γ. η τυπική απόκλιση
Β. η επικρατούσα τιμή         Δ. κανένα από τα παραπάνω.

16.

Η διακύμανση των παρατηρήσεων x1, x2,..., xν δίνεται από τον τύπο:
Α. Εικόνα            Γ. Εικόνα
Β. Εικόνα         Δ. Εικόνα

17.

Εάν οι συντελεστές μεταβολής δύο συνόλων δεδομένων Α και Β είναι 15% και 20% αντιστοίχως, τότε:
Α: τα δεδομένα Α παρουσιάζουν μεταλύτερη ομοιογένεια από τα Β
Β: τα δεδομένα Α παρουσιάζουν μικρότερη ομοιογένεια από τα Β
Γ: ταδεδομένα Α παρουσιάζουν μεταλύτερη διασπορά από τα Β
Δ: ταδεδομένα Α παρουσιάζουν μικρότερη διασπορά από τα Β

18.

Με βάση την ευθεία παλινδρόμησης y = -10 + 3,25x η προβλεπόμενη τιμή y για x = 10 είναι:
Α. 3,25       Γ. 22,5
Β. -10         Δ. Δεν μπορούμε να ξέρουμε.

19.

Με βάση την ευθεία παλινδρόμησης y = 2 - 3x ο συντελεστής γραμμικής συσχέτισης των Χ, Υ είναι:
Α. -3                 Γ. Αρνητικός
Β. Θετικός         Δ. -3/2

20.

Εάν ο συντελεστής γραμμικής συσχέτισης δύο μεταβλητών Χ, Υ είναι r = +1, τότε η ευθεία γραμμικής παλινδρόμησης της Υ στη Χ μπορεί να διέρχεται από τα σημεία:
Α. (0,0) και (1,-1)         Γ. (-1,-1) και (1,1)
Β. (-1,1) και (1,0)         Δ. (0,1) και (1,0).

21.

Ο συντελεστής γραμμικής συσχέτισης r και ο συντελεστής β στην ευθεία γραμμικής παλινδρόμησης y = α + βx έχουν:
Α. πάντα το ίδιο πρόσημο
Β. πάντα διαφορετικό πρόσημο
Γ. άλλοτε το ίδιο πρόσημο και άλλοτε διαφορετικό
Δ. δεν έχουν καμιά σχέση ως προς το πρόσημό τους.

22.

Εάν r(X,Y) = 0, τότε οι Χ, Υ είναι:
Α. ασυσχέτιστες                    Γ. τέλεια θετικά συσχετισμένες
Β. γραμμικά ασυσχέτιστες     Δ. τέλεια αρνητικά συσχετισμένες.

23.

Στην παλινδρόμηση με y συμβολίζουμε:
Α. τις πραγματικές τιμές της εξαρτημένης μεταβλητής
Β. τις τιμές της ανεξάρτητης μεταβλητής
Γ. τις προβλεπόμενες τιμές της εξαρτημένης μεταβλητής, που προκύπτουν από την εξίσωση γραμμικής παλινδρόμησης
Δ. κανένα από τα παραπάνω.

24.

Οι μεταβλητές Χ, Υ έχουν συντελεστή συσχέτισης r1 = +0,9, ενώ οι Z, W έχουν συντελεστή συσχέτισης r2 = +0,3.
Α. Οι Χ, Υ είναι τριπλάσια συσχετισμένες από τις Z, W
Β. Οι Χ, Υ είναι περισσότερο (σε μεγαλύτερο βαθμό) συσχετισμένες από τις Ζ, W
Γ. Δεν μπορούμε να συγκρίνουμε διαφορετικές μεταβλητές.

Στις ερωτήσεις 25-35 να γίνει αντιστοίχιση των (α), (β)… μετα (i), (ii), … ,
όπου αυτή είναι δυνατή.

25.

Εικόνα

26.

α) Εικόνα
β) Εικόνα
γ) Εικόνα

27.

α) διάμεσος Εικόνα
β) επικρατούσα τιμή Εικόνα       Εικόνα i) μέτρο θέσης
γ) τυπική απόκλιση Εικόνα
δ) εύρος Εικόνα                        Εικόνα ii) μέτρο διασποράς
ε) διακύμανση Εικόνα
στ) μέση τιμή Εικόνα

28.

α) Εικόνα
β) Εικόνα
γ) Εικόνα

29.

α) 10 11 12 13 14 Εικόνα       Εικόνα
β) 10 11 12 13 24 Εικόνα
γ) 1 11 12 13 14   Εικόνα         Εικόνα
δ) 20 21 22 23 24 Εικόνα
ε) 30 33 36 39 42 Εικόνα       Εικόνα

30.

Παρακάτω δίνονται οι καμπύλες συχνοτήτων (α) έως (δ) τεσσάρων μεταβλητών (i) έως (iv) από μια μελέτη που έγινε σε κάποια πόλη.

Εικόνα

i) Ύψος των μελών των νοικοκυριών στα οποία οι γονείς είναι και οι δύο κάτω των 24 ετών.
ii) Ύψος των παντρεμένων ζευγαριών.
iii) Ύψος όλων των ατόμων.
iv) Ύψος όλων των αυτοκινήτων.

Εικόνα

31.

Παρακάτω δίνονται οι καμπύλες σχετικών συχνοτήτων ((i) έως (iii)) της βαθμολογίας τριών τμημάτων σε ένα διαγώνισμα, κατά το οποίο
α) στο πρώτο τμήμα πέρασε το 50%
β) Στο δεύτερο τμήμα πέρασε ποσοστό άνω του 50%
γ) Στο τρίτο τμήμα πέρασε ποσοστό κάτω του 50%.

Εικόνα

32.

Παρακάτω δίνονται κατά προσέγγιση οι καμπύλες συχνοτήτων (α) έως (γ) τριών διαφορετικών συνόλων δεδομένων και διάφορες τιμές (i) έως (iv) της μέσης τιμής και της τυπικής απόκλισης:

Εικόνα

33.

Εικόνα

34.

Εικόνα
Εικόνα

35.

Για την ευθεία γραμμικής παλινδρόμησης y = 2x ισχύει:
α = 0 Εικόνα
r > 0 Εικόνα      Εικόνα Σωστό
β = 2 Εικόνα      Εικόνα Λάθος
r = β Εικόνα      Εικόνα Δεν μπορούμε να ξέρουμε.