8 Δεκεμβρίου 2019. Μια μέρα που θα θυμόμαστε όχι ως Έλληνες, αλλά ως άνθρωποι. Ο κορονοϊός μπαίνει «ήσυχος» σε χιλιάδες σπίτια στην πόλη Ουχάν, την πρωτεύουσα της επαρχίας Χουπέϊ της Κίνας. Έπειτα «μεταναστεύει» φτάνοντας και στην χώρα μας στις 26 Φεβρουαρίου του 2020. Εκ τοτε, η βασικότερη και καθημερινή ανησυχία ολόκληρου του ελληνικού πληθυσμού αποτελούν τα κρούσματα, οι θάνατοι και οι διασωληνωμένοι, σημειώνοντας αριθμούς αποκαρδιωτικούς.
Η τελευταία έρευνα του ΕΒΕΑ που πραγματοποίησε η εταιρία PULSE-RC κατά το χρονικό διάστημα 15 έως 17 Μαρτίου 2020, έδειξε πως το 83% των ερωτηθέντων ανησυχεί αρκετά έως πολύ, ενώ σχεδόν όλοι (94%) εκτιμούν ότι η πανδημία και οι συνέπειες που απορρέουν από αυτήν θα επηρεάσει αρνητικά τη δραστηριότητα των επιχειρήσεων στη χώρα μας.
Ταυτόχρονα με το ξέσπασμα της πανδημίας, σημαντική είναι και η αύξηση της επισκεψιμότητας των ενημερωτικών ιστότοπων από το κοινό προκειμένου να έχουν μία όσο το δυνατόν πιο ξεκάθαρη και αληθινή εικόνα της υφιστάμενης κατάστασης.
Δεδομένα για ανάλυση από «Πρώτο Θέμα»
Σε αυτό το άρθρο, πραγματοποιήθηκε ανάλυση δεδομένων από τον ειδησεογραφικό ιστότοπο «Πρώτο Θέμα», όσον αφορά τη συχνότητα δημοσίευσης ειδήσεων σχετικά με το νέο κορονοϊό.
Στο πρώτο διάγραμμα, φαίνεται το σύνολο των ειδήσεων που δημοσιεύτηκαν για τους μήνες Μάϊο, Ιούνιο και Ιούλιο το έτος 2021, με εμφανή τη δημοσίευση περισσότερων ειδήσεων το μήνα Ιούνιο. Συγκεκριμένα, το Μάϊο «ανέβηκαν» 131 ειδήσεις, τον Ιούνιο 372 ενώ τον Ιούλιο 127. Ένα πρώτο συμπέρασμα που μπορούμε να βγάλουμε λοιπόν, είναι πως ο φετινός Ιούνιος ήταν ένας μήνας ιδιαίτερα δύσκολος, αφού η ανάγκη ενημέρωσης των χρηστών για την εξέλιξη της πανδημίας, όπως φαίνεται και από τον μεγάλο αριθμό των ειδήσεων, ήταν έντονη.
Έπειτα, πραγματοποιήθηκε μία ανάλυση για κάθε ημέρα του μήνα, δίνοντας ένα μέσο όρο των ειδήσεων. Αναλυτικότερα, όπως φαίνεται και στο διάγραμμα, την 1η μέρα και για τους 3b μήνες γράφτηκαν και οι περισσότερες ειδήσεις, όσον αφορά τον κορονοϊό, κατά μέσο όρο, 63 ειδήσεις, ενώ αμέσως μετά, οι περισσότερες ειδήσεις γράφτηκαν την 8η μέρα, κατά μέσα όρο, των τριών αυτών μηνών, δηλαδή 48 ειδήσεις. Έπειτα, οι περισσότερες ειδήσεις δόθηκαν στο κοινό τη 14η μέρα των τριών μηνών, σημειώνοντας κατά μέσο όρο 43 ειδήσεις.
Δεδομένα για ανάλυση από Twitter
Παράλληλα, αξιοποιήθηκε μία ακόμα πηγή δεδομένων, το Twitter, απ’ όπου εξορύχθηκαν και αναλύθηκαν δεδομένα από το λογαριασμό του Εθνικού Οργανισμού Δημόσιας Υγείας (ΕΟΔΥ) αναφορικά με την πανδημία.
Στο πρώτο διάγραμμα που δημιουργήθηκε, απεικονίζεται ο αριθμός των αναρτήσεων που έγιναν ανά μήνα, κατά μέσα όρο, για τις χρονιές 2019-2021, προκειμένου να βγάλουμε ορισμένα συμπεράσματα αναφορικά με το ποιες μέρες φαίνεται να ήταν οι πιο κρίσιμες, ανάλογα με το πόσες ειδήσεις δημοσιεύτηκαν.
Πιο συγκεκριμένα, φαίνεται πως οι μήνες Μάρτιος, Μάιος και Ιούνιος έχουν τις περισσότερες ειδήσεις, επομένως μπορούμε να καταλάβουμε πως αυτοί οι 3 μήνες ήταν και οι πιο καθοριστικοί μετά το ξέσπασμα της πανδημίας.
Στη συνέχεια, αναζητήθηκαν οι 15 συχνότερες λέξεις που χρησιμοποιούνται στους τίτλους των δημοσιεύσεων με εμφανή τη διαφορά της λέξης «covid» (96 φορές), ενώ αμέσως μετά βρίσκονται οι λέξεις «μητσοτάκη» (34 φορές) και «ελλάδα» (32 φορές).
‘Επειτα δημιουργήθηκαν διγράμματα, δηλαδή ζευγάρια λέξεων ανάλογα με τους τίτλους των δημοσιεύσεων.
Στο επόμενο γράφημα, παρουσιάζονται οι συχνότερες λέξεις που χρησιμοποιούνται στις αναρτήσεις του ΕΟΔΥ στο Twitter, μέσω του Wordcloud, με πιο διακριτές τις φράσεις «Ημερήσια έκθεση», «ΕΟΔΥ», «έκθεση επιτήρησης» και «COVID19», φράσεις που απασχολούν ιδιαίτερα τους χρήστες.
Έπειτα, πραγματοποιήθηκε ανάλυση των συναισθημάτων που προκύπτουν από τα κείμενα, με τη χρήση του ελληνικού λεξικού για sentiment anaysis του NRC. Στα 3 επόμενα γραφήματα παρουσιάζονται 3 συναισθήματα: της θετικότητας, της αρνητικότητας και του θυμού, για τις χρονιές 2019-2020-2021.
Όσον αφορά τη θετικότητα παρατηρείται μία διακύμανση ανάλογα με τους μήνες, καθώς, από τον Ιανουάριο του 2020 έως και τον Ιούλιο του 2020 υπάρχει μία σχετική σταθεροποίηση του συναισθήματος σε υψηλά επίπεδα, ωστόσο από το Σεπτέμβρη του 2020 έως και τον Οκτώβρη υπάρχει μία πτώση αυτού του συναισθήματος. Ακόμα, όπως φαίνεται και τον Ιανουάριο του 2021 σημειώνεται αύξηση της θετικότητας απέναντι στα κείμενα.
Συναίσθημα θετικότητας
Αναφορικά με την αρνητικότητα, ενώ παρατηρείται μία εκτόξευση του συναισθήματος από τον Ιανουάριο έως τον Μάιο του 2020, περίοδος που μόλις είχε ξεσπάσει η πανδημία και στη χώρα μας, από τον Ιούνιο του 2020 έως και τον Ιούλιο του 2021, σημειώνεται μία σχετική περιοδικότητα του συναισθήματος.
Συναίσθημα αρνητικότητας
Για το συναίσθημα του θυμού, επίσης παρατηρείται μία εκτόξευση από τον Ιανουάριο του 2020 έως και τον Μάιο του 2020, ενώ τους επόμενους μήνες παρατηρείται μία σταθεροποίηση αυτού του συναισθήματος σε σχετικά χαμηλά επίπεδα.
Συναίσθημα θυμού
Ακόμα, αναλύθηκαν συνδυαστικά 2 βασικά συναισθήματα, της χαράς και του θυμού, σε αντιστοιχία με τους μήνες των ίδιων ετών. Μπορούμε να παρατηρήσουμε λοιπόν, ότι το χρονικό διάστημα μεταξύ Ιανουάριου του 2020 – Μάιου του 2020, υπάρχει μία εκτόξευση και των δύο συναισθημάτων στα κείμενα, αν και κάνουμε λόγο για δύο συναισθήματα αντίθετα μεταξύ τους.
Συναισθήματα χαράς – θυμού
Στη συνέχεια, δημιουργήθηκε ένα γράφημα με το συνδυασμό τριών συναισθημάτων: της θετικότητας, της αποστροφής και της εμπιστοσύνης. Με κόκκινο χρώμα απεικονίζεται η θετικότητα, με το μπλε η εμπιστοσύνη και με το πράσινο η αποστροφή.
Ένα συμπέρασμα που μπορούμε να βγάλουμε και για τα 3 αυτά συναισθήματα, είναι πως, αν και υπάρχει μία σταθερότητα αγγίζοντας υψηλά επίπεδα, από το Φεβρουάριο του 2020 έως το Μάιο του ίδιου έτους, από το Δεκέμβρη του 2020 έως τον Απρίλιο του 2021, η θετικότητα βρίσκεται σε πολύ υψηλά επίπεδα ενώ η αποστροφή και η εμπιστοσύνη βρίσκονται σε χαμηλότερη κλίμακα πλέον.
Συναισθήματα θετικότητας – αποστροφής – εμπιστοσύνης
Τέλος, έγινε ανάλυση και της ομοιότητας των κειμένων, ανάλογα με τους τίτλους των ειδήσεων, όπως αυτές αναρτήθηκαν από τον ΕΟΔΥ στο Twitter μέσω του Heatmap.
Ομοιότητα κειμένων
Βάσει της παραπάνω ανάλυσης, μπορούμε να πούμε πως οι ειδήσεις με τους τίτλους 25,5,82,9,19,51,73,31,59,33,61 παρουσιάζουν πολλές ομοιότητες μεταξύ τους, σε σύγκριση με τις υπόλοιπες, κάτι που επιβεβαιώνεται και για τις ειδήσεις με τους τίτλους 63 και 93, 11 και 35.
Τίτλος είδησης 61: «Εστίαση: Τι ισχύει με τα νέα μέτρα και το Covid Pass»
Τίτλος είδησης 79: «Σκέρτσος: Με Covid Pass στους χώρους διασκέδασης – Πώς θα λειτουργεί
Έλενα Λιόγα
Τα δεδομένα για την ανάλυση εξορύχθηκαν από τον ενημερωτικό ιστότοπο «Πρώτο Θέμα» και τον λογαριασμό του Εθνικού Οργανισμού Δημόσιας Υγείας (ΕΟΔΥ) στο Twitter.
Πληροφορίες για την έρευνα: https://www.cnn.gr/oikonomia/story/212599/evea-xtypa-kokkino-i-anisyxia-ton-ellinon-gia-ton-koronoio
Η ανάλυση πραγματοποιήθηκε μέσω της γλώσσας προγραμματισμού Python.
Τα περισσότερα γραφήματα επεξεργάστηκαν στο Flourish.
Φωτογραφίες: Unsplash
Κώδικας Python στο GitHub εδώ.
Δεδομένα που εξορύχθηκαν: Πρώτο θέμα – ΕΟΔΥ