Από τον Φεβρουάριου του 2020 όταν η πανδημία του κορονοϊού εμφανίστηκε στην Ελλάδα, οι κυβερνητικοί μηχανισμοί της χώρας έχουν αφιερωθεί στην διαχείριση της υγειονομικής κρίσης. Ανάμεσα τους πρωτοστατεί η Γενική Γραμματεία Πολιτικής Προστασίας, αποστολή της οποίας είναι μεταξύ άλλων: «ο σχεδιασμός, η οργάνωση και ο συντονισμός της δράσης για την πρόληψη και αντιμετώπιση των φυσικών, τεχνολογικών και λοιπών καταστροφών ή καταστάσεων έκτακτης ανάγκης, καθώς και την ενημέρωση του κοινού για τα ζητήματα αυτά». Πέρα από την κατάσταση της υγειονομικής κρίσης, ο φορέας από τις αρχές του προηγούμενου έτους κλήθηκε να διαχειριστεί έκτακτες καιρικές συνθήκες, πυρκαγιές, καθώς και σεισμούς και να αναλάβει την ενημέρωση του κοινού με στόχο την προστασία του.
Έχοντας αυτά υπόψιν κρίθηκε σκόπιμο να μελετηθεί ο πολιτικός λόγος που χρησιμοποίησε η Γενική Γραμματεία Πολιτικής Προστασίας, στα δελτία τύπου και τις ανακοινώσεις που εξέδωσε από το 2020 μέχρι σήμερα, μέσα από τεχνικές ανάλυσης μεγάλων δεδομένων και τεχνικές ανάλυσης λόγου (επεξεργασία φυσικής γλώσσας).
Αρχικά μέσα από την επίσημη ιστοσελίδα της ΓΓΠΠ, www.civilprotection.gr, αντλήθηκαν, χρησιμοποιώντας τεχνικές scraping, 549 δελτία τύπου και ανακοινώσεις, τα οποία δημοσιεύτηκαν από 4 Ιανουαρίου 2020 μέχρι 15 Ιουνίου 2021. Για κάθε ένα δημοσίευμα συλλέχθηκαν, ο τίτλος, η ημερομηνία δημοσίευσης, το σώμα του κειμένου και το αντίστοιχο URL. Στην συνέχεια έγινε η κατάλληλη επεξεργασία των δεδομένων αυτών, ώστε να είναι διαχειρίσιμα και έτοιμα προς ανάλυση (καθάρισμα, διόρθωση της ημερομηνίας των άρθρων, lemmatization, vectorization, φόρτωση των κατάλληλων λεξικών). Παρακάτω αναλύονται αξιοσημείωτα σημεία της έρευνας.
Γενικές Αναλύσεις
Σε ένα πρώτο επίπεδο έχει ενδιαφέρον να εξεταστεί η συχνότητα των δημοσιεύσεων ανά μήνα και έτος. Οι δημοσιεύσεις για το 2020 είναι περισσότερες (279 έναντι 139), ωστόσο για το 2021 αντλήθηκαν δεδομένα μέχρι τον Ιούνιο και όχι για όλο το έτος. Όσον αφορά την συχνότητα δημοσίευσης ανά μήνα, στο διάγραμμα διασποράς που ακολουθεί απεικονίζεται η συχνότητα δημοσίευσης για κάθε μήνα. Οι μπλε τελείες αντιστοιχούν στο 2021 και οι κίτρινες στο 2020. Για τον μήνα Ιανουάριο έγιναν περισσότερες δημοσιεύσεις το 2021, ενώ τον μήνα Μάρτιο κυριαρχούν οι δημοσιεύσεις του 2020.
Στη συνέχεια μια πρώτη ανάλυση κειμένου που εφαρμόστηκε στα σώματα κειμένων είναι η οπτικοποίηση των συχνότερων λέξεων μέσα από ένα word cloud.
Στο παραπάνω σύννεφο λέξεων βλέπουμε να ξεχωρίζουν λέξεις όπως: διαχείριση κρίσεων, μέτρα, ενεργά κρούσματα, περιφερειακή ενότητα, καιρικών συνθηκών, σύστημα υγείας, δημόσια υγεία, ασθενείς, τεστ, νοσοκομεία, χρήση μάσκας. Το γεγονός αυτό καταδεικνύει πώς το δημοσιευμένο περιεχόμενο της ΓΓΠΠ αφορούσε κατα κύριο λόγο της υγειονομική κρίση που προκάλεσε η πανδημία του κορονοϊού. Την ίδια εικόνα δίνει και το σύννεφο λέξεων που εφαρμόστηκε στους τίτλους των δημοσιευμάτων, όπου ωστόσο ξεχωρίζουν και τα ονόματα των προσώπων που συμμετείχαν στις δράσεις της ΓΓΠΠ.
Επιπρόσθετα στα σώματα των κειμένων εφαρμόστηκε μετά από αφαίρεση των συνδετικών λέξεων (stop words), η καταμέτρηση των 16 συχνότερων λέξεων και των 16 συχνότερων εκφράσεων με δύο λέξεις (bigrams).
Όπως φαίνεται στο πρώτο γράφημα, ξεχωρίζουν οι λέξεις: μέτρο, προστασία, χώρα, πολιτικός, υγεία και περιοχή (να επισημανθεί πως στην ανάλυση αυτή έγινε η επεξεργασία lemmatization, ώστε οι όροι να μετατραπούν σε ονομαστική πτώση και να καταμετρηθούν έτσι). Αντίστοιχα στο δεύτερο γράφημα ξεχωρίζουν οι φράσεις: πολιτικής προστασίας, διαχείρισης κρίσεων, δημόσιας υγείας, σύστημα υγείας, covid 19 και χρήση μάσκας.
Όσον αφορά την ανάλυση κειμένου στα δημοσιεύματα ήταν σημαντικό να αναδειχθούν τα επιμέρους ζητήματα που απασχόλησαν την ΓΓΠΠ κατά το υπό μελέτη χρονικό διάστημα. Χρησιμοποιώντας την τεχνική των «κανονικών εκφράσεων» (regular expressions) αναζητήθηκαν όροι σχετικοί με τις πυρκαγιές, τα καιρικά φαινόμενα, τους σεισμούς και τέλος την πανδημία του κορονοϊού. Αυτοί οι όροι αναζητήθηκαν στους τίτλους των δημοσιευμάτων, έτσι ώστε να είναι εμφανές πόσα δημοσιεύματα σχετίζονταν με ένα συγκεκριμένο ζήτημα.
Στα δημοσιευμένα δελτία τύπου και ανακοινώσεις οι συχνότεροι όροι που σχετίζονται με τον όρο πυρκαγιά είχαν 86 εμφανίσεις στους τίτλους των δημοσιευμάτων. Αναλυτικά οι όροι και η συχνότητα εμφάνισης τους φαίνονται στο παρακάτω γράφημα.
Οι συχνότεροι όροι που σχετίζονται με τον καιρό, την βροχή και το χιόνι εντοπίστηκαν 168 φορές στους τίτλους των δημοσιευμάτων. Το 2020 και το 2021 ήταν χρονιές με πολύ έντονα καιρικά φαινόμενα, όπως ο κυκλώνας “Ιανός” και η κακοκαιρία “Μήδεια” και αυτές οι έκτακτες καιρικές συνθήκες απασχόλησαν ιδιαίτερα την ΓΓΠΠ.
Επιπρόσθετα οι όροι που αφορούν τον σεισμό εντοπίστηκαν 7 φορές στους τίτλους τον δημοσιευμάτων.
Τέλος όροι σχετικοί με την πανδημία, τον covid-19 και τα εμβόλια εμφανίστηκαν 109 φορές στους τίτλους. Ενδιαφέρον παρουσιάζει ο διαφορετικός τρόπος που είναι κάθε φορά γραμμένη η λέξη κορονοϊός.
Επίσημες Ενημερώσεις ΓΓΠΠ
Ανάμεσα στα 549 δελτία τύπου που αναλύθηκαν, υπήρχαν και οι επίσημες ενημερώσεις από τον υφυπουργό Πολιτικής Προστασίας και Διαχείρισης Κρίσεων, Νίκο Χαρδαλιά και την επιτροπή λοιμωξιολόγων προς τους διαπιστευμένους συντάκτες και δημοσιογράφους σχετικά με την πανδημία του κορονοϊού. Οι συγκεκριμένες συνεντεύξεις τύπου ήταν το κυριότερο επίσημο μέσο διάχυσης πληροφοριών σχετικών με τα νέα μέτρα και τις εξελίξεις της πανδημίας και η πλειονότητα των πολιτών τις παρακολουθούσε σε συστηματική βάση. Γι αυτό κρίθηκε χρήσιμο τα συγκεκριμένα δημοσιεύματα να αναλυθούν ως ξεχωριστή υποκατηγορία δημοσιευμάτων.
Στο σύνολο των 549 δελτίων τύπου, τα 68 ήταν οι επίσημες ενημερώσεις από τον υφυπουργό. Η πρώτη επίσημη ενημέρωση δημοσιεύτηκε στον ιστοχώρο της ΓΓΠΠ στις 16 Μαρτίου 2020 και αποτελεί, όπως και οι υπόλοιπες, την απομαγνητοφώνηση της ενημέρωσης που μεταδόθηκε και ζωντανά.
Σε πρώτο επίπεδο αναλύθηκε η συχνότητα τον ενημερώσεων ανά έτος. Στο παραπάνω διάγραμμα διασποράς φαίνεται η συχνότητα επίσημης ενημέρωσης ανά μήνα για το 2020 (με κίτρινες τελείες) και για το 2021 (με μπλε τελείες). Είναι αξιοσημείωτο πως για τον μήνα Μάρτιο οι ενημερώσεις ήταν σχεδόν ισάριθμες για τα δύο έτη, ενώ αντίθετα τον Μάϊο έγιναν ενημερώσεις μόνο το 2020 και μάλιστα περισσότερες από κάθε άλλον μήνα (11 ενημερώσεις για τον Μαίο). Το γεγονός αυτό πιθανότατα σχετίζεται με την εφαρμογή των νέων μέτρων κυκλοφορίας και περιορισμού και τις αναλυτικές οδηγίες που έπρεπε να δίνονται εκείνη την εποχή.
Επιπρόσθετα και σε αυτήν την υποενότητα των δημοσιευμάτων αναζητήθηκαν οι 16 συχνότερες λέξεις και οι 16 συχνότερες εκφράσεις των κειμένων, όπως φαίνονται στα παρακάτω γραφήματα.
Ανάμεσα τους ξεχωρίζουν οι λέξεις περιοχή, εβδομάδα, επίπεδο, τεστ και οι εκφράσεις περιφερειακή ενότητα, ενεργά κρούσματα και σύστημα υγείας.
Ιδιαίτερο ενδιαφέρον παρουσιάζει η συχνότητα συμμετοχής πολιτικών προσώπων και ειδικών επιστημόνων στις επίσημες ενημερώσεις. Τα ονόματα αναζητήθηκαν στους τίτλους των δημοσιευμάτων, αφού εφαρμόστηκαν οι τεχνικές lemmatization και vectorization.
Όπως φαίνεται στο αντίστοιχο διάγραμμα, την πρωτοκαθεδρία στις συμμετοχές την έχει ο υφυπουργός Πολιτικής Προστασίας και Διαχείρισης Κρίσεων Νίκος Χαρδαλιάς, ο οποίες έλαβε μέρος σε 68 ενημερώσεις, σε όλες δηλαδή. Στη δεύτερη θέση βρίσκεται ο Επίκουρος Καθηγητής Επιδημιολογίας και μέλος της Επιτροπής Εμπειρογνωμόνων, Γκίκας Μαγιορκίνης, με 41 συμμετοχές. Ακολουθούν η Καθηγήτρια Παιδιατρικής Λοιμωξιολογίας και μέλος της Επιτροπής εμπειρογνωμόνων, Βάνα Παπαευαγγέλου με 29 συμμετοχές και ο καθηγητής Σωτήρης Τσιόδρας με 18 συμμετοχές. Ο Υπουργός Υγείας Βασίλης Κικίλιας συμμετείχε σε 3 επίσημες ενημερώσεις, ενώ η Υπουργός Παιδείας και Θρησκευμάτων Νίκη Κεραμέως συμμετείχε σε 2.
Μια επιπρόσθετη διάσταση που αναλύθηκε στην υποενότητα αυτή των δεδομένων ήταν η ομοιότητα των κειμένων μέσω της συνάρτησης cosine similarity. Κατά την ανάλυση αυτή ένα από τα κείμενα συγκρίνεται με τα υπόλοιπα όσον αφορά την ομοιότητα των όρων τους. Στο παρακάτω γράφημα συγκρίνεται το τρίτο κατα σειρά κείμενο της επίσημης ενημέρωσης με τα υπόλοιπα.
Όπως φαίνεται με 40 από τα κείμενα υπάρχει ομοιότητα πάνω από 50%, ενώ με το δεύτερο κατά σειρά κείμενο, η ομοιότητα αγγίζει το 70%. Το γεγονός αυτό πιθανότατα οφείλεται στην δομημένη και επαναλαμβανόμενη μορφή που έχει η επίσημη ενημέρωση των συντακτών. Προς σύγκριση παρατίθενται αποσπάσματα από το δεύτερο και το τρίτο κείμενο, τα οποία εμφάνισαν μεγάλη ομοιότητα.
Ακόμα η συνάρτηση cosine similarity εφαρμόστηκε στο σύνολο το κειμένων. Στο παρακάτω heatmap απεικονίζεται η ομοιότητα κάθε κειμένου με όλα τα υπόλοιπα. Στην διαγώνιο συγκρίνεται κάθε κείμενο με τον εαυτό του, γι αυτό και η ομοιότητα είναι στο 1. Οσό πιο κοντά στο λευκό είναι το χρώμα, τόσο μεγαλύτερη είναι η ομοιότητα των κειμένων. Από το διάγραμμα αναδεικνύεται πως υπάρχουν αρκετά σώματα κειμένων που μοιάζουν μεταξύ τους.
Συναισθηματική Ανάλυση
Τέλος όσον αφορά τα δελτία τύπου και τις ανακοινώσεις που δημοσιεύτηκαν το 2021, σε αυτά εφαρμόστηκε ανάλυση συναισθήματος με την χρήση κατάλληλων λεξικών.
Κάποιες αξιόλογες παρατηρήσεις είναι οι εξής:
Στα δύο γραφήματα που ακολουθούν βλέπουμε πως κυμάνθηκε η θετική και αρνητική πολικότητα των κειμένων ανά ημέρα για το 2021. Με την χρήση ελληνικού λεξικού εντοπίστηκαν θετικές και αρνητικές λέξεις μέσα στα κείμενα.
Στη συνέχεια μελετήθηκε το συναίσθημα του θυμού σε σύγκριση με αυτό της χαράς, όπως κυμάνθηκαν ανά ημέρα για το 2021. Ο θυμός συμβολίζεται με κόκκινο και η χαρά με πράσινο.
Αντίστοιχη συγκριτική ανάλυση έγινε για τα συναισθήματα του φόβου και της εμπιστοσύνης. Ο φόβος συμβολίζεται με σκούρο κόκκινο και η εμπιστοσύνη με μπλε. Βλέπουμε πως σχεδόν σε όλες τις ημέρες κυριαρχεί το συναίσθημα της εμπιστοσύνης.
Τέλος πραγματοποιήθηκε συναισθηματική ανάλυση σε επίπεδο μήνα. Παρακάτω απεικονίζονται η θετικότητα και αρνητικότητα από τον Ιανουάριο μέχρι τον Ιούνιο. Επίσης συγκρίνονται το συναίσθημα της λύπης, του φόβου και της εμπιστοσύνης, όπως εμφανίστηκαν κατά μέσο όρο ανά μήνα.
Ειρήνη Κωνσταντά
Κώδικας στο GitHub
Ιστοσελίδα ΓΓΠΠ