Τις τελευταίες δεκαετίες, λόγω της πολυπλοκότητας προβλημάτων της καθημερινότητας έχει παρουσιαστεί επιτακτικά η ανάγκη ταυτόχρονης επεξεργασίας μεγάλου όγκου (πολυμεταβλητών) δεδομένων. Η (Στατιστική) επεξεργασία των δεδομένων γίνεται συνήθως με τη βοήθεια Η.Υ. και τη χρήση εξειδικευμένου κάθε φορά λογισμικού όπως το στατιστικό πακέτο S.P.S.S. (Statistical Package for Social Sciences).
Σκοπός των ασκήσεων του βιβλίου, εκτός από την εξοικείωση του αναγνώστη στη χρήση του στατιστικού πακέτου SPSS, είναι και η εισαγωγή στη στατιστική ανάλυση δεδομένων. Στόχος του είναι να αποτελέσει:
- χρήσιμο εργαλείο εκμάθησης, εφαρμογής και κατανόησης των βασικών στατιστικών διαδικασιών, σε άτομα με λίγες γνώσεις Στατιστικής, αλλά και
- χρήσιμο και απαραίτητο βοήθημα, ακόμη και σε άτομα με μεγαλύτερη εξοικείωση και εμπειρία.
Οι ενότητές του ακολουθούν συγκεκριμένη δομή, η οποία περιλαμβάνει:
- σύντομη περιγραφή στατιστικών δοκιμασιών, μαζί με χρήσιμες πληροφορίες που αφορούν στις προϋποθέσεις για την εφαρμογή τους.
- απλά παραδείγματα για τις δοκιμασίες που χρησιμοποιούνται, τα βήματα που πρέπει να ακολουθηθούν για την εφαρμογή τους (μαζί με τις αντίστοιχες οθόνες του πακέτου SPSS, για να υπάρχει πλήρης και αναλυτική καθοδήγηση σχετικά με κάθε μια από αυτές), καθώς σύντομη επεξήγηση και σχολιασμό των αποτελεσμάτων τους.
Τα παραδείγματα, αν και προέρχονται από το χώρο της υγείας, είναι εύκολα κατανοητά (χωρίς να απαιτείται εξειδικευμένη γνώση Ιατρικής), οι δε στατιστικές διαδικασίες που περιγράφονται μπορούν να εύκολα εφαρμοστούν σε όλα σχεδόν τα επιστημονικά πεδία.
Οι οθόνες που ενσωματώνονται παρήχθησαν με την έκδοση 26.0 του SPSS.
Οι ενότητες που συμπεριλαμβάνονται στο βιβλίο αυτό είναι οι ακόλουθες:
Η 1η ενότητα καλύπτει: (i) τη δημιουργία αρχείου δεδομένων (ii) την ανάλυση δεδομένων τα οποία έχουν δημιουργηθεί με άλλες, εκτός του SPSS, εφαρμογές (iii) το πως διεξάγονται πράξεις στο SPSS, το πως πραγματοποιούνται μετασχηματισμοί στα δεδομένα/μεταβλητές, (iv) τη συγχώνευση, τροποπίηση αρχείων κ.ά. Ο τρόπος με τον οποίο πραγματοποιείται η διαχείριση των αποτελεσμάτων των διαδικασιών αυτών περιγράφεται επίσης στην ενότητα.
Στη 2η ενότητα, αναλύονται διαδικασίες για: (i) την παραγωγή περιγραφικών στατιστικών στοιχείων (ii) τη δημιουργία πινάκων συχνότητας και διαγραμμάτων και ερμηνεύονται τα στοιχεία που παράγονται σε αυτές. Τέλος περιγράφονται τα διαγράμματα Normal P-P Plots και Normal Q-Q Plots, με τη βοήθεια των οποίων γίνεται ο έλεγχος κανονικότητας δεδομένων, έλεγχος απαραίτητος σε σχεδόν όλες τις διαδικασίες της Παραμετρικής Στατιστικής.
Στην 3η ενότητα αναλύονται: οι πίνακες συνάφειας, δοκιμασίες για τον έλεγχο της ανεξαρτησίας και της συσχέτισης δύο μεταβλητών και η χρήση του χ2 τεστ για τον έλεγχο της ομοιογένειας της αναλογίας των κατηγοριών μιας μεταβλητής, με συγκεκριμένη υποθετική αναλογία τιμών.
Οι στατιστικοί παραμετρικοί έλεγχοι (t test) με τους οποίους γίνονται συγκρίσεις για το έλεγχο διαφορών (π.χ ανάμεσα στις μέσες τιμές δύο ομάδων), περιγράφονται στην 4η ενότητα. Εάν οι προϋποθέσεις για την εφαρμογή τους δεν ικανοποιούνται, γίνεται χρήση μη παραμετρικών ελέγχων (Wilcoxon signed-rank για ένα δείγμα, Mann-Whitney U, Wilcoxon W και Sign, Wilcoxon signed-rank για δύο δείγματα).
Στην 5η ενότητα, δίνεται ο συντελεστής συσχέτισης του Pearson (διερεύνηση της γραμμικής συσχέτισης ανάμεσα σε δύο ποσοτικές μεταβλητές) καθώς και ο μη παραμετρικός έλεγχος του Spearman. Τέλος, επειδή μια γραμμική σχέση ανάμεσα σε δύο ποσοτικές μεταβλητές, περιγράφεται συνήθως μέσω ενός μοντέλου απλής γραμμικής παλινδρόμησης (simple linear regression), αναλύεται η κατασκευή του μοντέλου, μαζί με τις προϋποθέσεις για την κατασκευή του.
Σε αρκετές αναλύσεις δεδομένων εξετάζουμε αν υπάρχουν διαφορές στους μέσους όρους περισσοτέρων των δύο ομάδων, αναφορικά με έναν ή περισσότερους παράγοντες (π.χ. ανάλυση διακύμανσης κατά έναν παράγοντα, ανάλυση διακύμανσης κατά δύο παράγοντες με αλληλεπίδραση, ανάλυση διακύμανσης κατά ένα παράγοντα με επαναλαμβανόμενες μετρήσεις, πολυμεταβλητή ανάλυση διακύμανσης/ MANOVA). Η 6η ενότητα μελετά τις τέσσερες αυτές περιπτώσεις. Εάν δεν πληρείται κάποια από τις προϋποθέσεις εφαρμογής της, χρησιμοποιείται ο μη παραμετρικός έλεγχος Kruskal‑Wallis.
Πολλές φορές, θέλουμε να προβλέψουμε την τιμή μιας μεταβλητής με τη βοήθεια των τιμών δυο ή περισσοτέρων άλλων μεταβλητών. Για την πρόβλεψη αυτή κατασκευάζουμε ένα μοντέλο, το οποίο ονομάζουμε μοντέλο πολλαπλής γραμμικής παλινδρόμησης. Η ανάλυση αυτή είναι το αντικείμενο της 7ης ενότητας.
Σε αρκετές περιπτώσεις ερευνών μελετούμε την εμφάνιση ή όχι μιας νόσου (επιβίωση μη επιβίωση), την απουσία ή την παρουσία ενός χαρακτηριστικού κ.λ.π. Η στατιστκή τεχνική, με την οποία αντιμετωπίζεται το πρόβλημα, και η οποία είναι το αντικείμενο της 8ης ενότητας καλείται λογιστική ή λογαριθμική παλινδρόμηση (logistic regression).
Η Ανάλυση Συστάδων/Ομάδων (Cluster Analysis) παρουσιάζεται στην 9η ενότητα και έχει σαν σκοπό το διαχωρισμό ενός συνόλου παρατηρήσεων σε “φυσικές ομάδες” με τέτοιο τρόπο ώστε τα μέλη κάθε ομάδας να είναι όσο το δυνατόν περισσότερο “όμοια” μεταξύ τους, ενώ τα μέλη διαφορετικών ομάδων να είναι όσο το δυνατόν περισσότερο “ανόμοια”.
Η παραγοντική ανάλυση (Factor Analysis), παρουσιάζεται στην 10η ενότητα, διερευνά τον πλεονασμό σε πολυμεταβλητά δεδομένα, επιτρέπει την εξαγωγή χαρακτηριστικών τους και μειώνει το μέγεθος του συνόλου των δεδομένων (διάσταση) χωρίς ύπαρξη σημαντικής απώλειας στην πληροφορία.
Ένας τρόπος συλλογής δεδομένων σε έρευνα είναι με τη χρήση ερωτηματολογίου. Η καταγραφή τους όμως σε αυτό, αρκετές φορές παρουσιάζει σφάλματα και θα πρέπει να γίνεται προσπάθεια ελαχίστοποίησης τους. Δυό ιδιότητες ενός ερωτηματολογίου που αναφέρονται στον έλεγχο των σφαλμάτων είναι η εγκυρότητα (validity) και η αξιοπιστία του (reliability), και οι οποίες εξετάζονται αναλυτικά στη 11η ενότητα. Η αξιοπιστία αναφέρεται στην ικανότητα που έχει το ε.μ. να παράγει συνεπή αποτελέσματα ενώ η εγκυρότητα αναφέρεται στην ακρίβεια των μετρήσεων.
Οι συγγραφείς
Ι. Αποστολάκης, μέλος Ε.ΔΙ.Π., στην Ιατρική Σχολή του Πανεπιστημίου Αθηνών.
Τ. Δάρας, αναπληρωτής καθηγητής στη Σχολή Χημικών Μηχανικών και Μηχανικών Περιβάλλοντος του Πολυτεχνείου Κρήτης
Μ.Α. Σταμούλη, μέλος Ε.ΔΙ.Π. στο Tμήμα Διοίκησης Επιχειρήσεων (Τομέας Κοινωνικής Πολιτικής), του Πανεπιστημίου Δυτικής Αττικής
Το βιβλίο κυκλοφορεί από τις εκδόσεις Παπαζήση (www.papazisi.gr), (2022).