Στην πόλη Wuhan, επαρχία Hubei, στην Κίνα, εμφανίστηκε συρροή κρουσμάτων πνευμονίας. Στις 9 Ιανουαρίου 2020 οι υγειονομικές αρχές της Κίνας ανακοίνωσαν ότι πρόκειται για νέο στέλεχος κορωνοϊού (2019-nCoV). Οι κορωνοϊοί είναι μία ομάδα ιών που συνήθως προκαλούν αναπνευστικές λοιμώξεις με ποικίλη σοβαρότητα στον άνθρωπο και στα ζώα. Εκτιμάται ότι περίπου το ένα τρίτο των λοιμώξεων ανώτερου αναπνευστικού στον άνθρωπο μπορεί να προκαλείται από κορωνοϊούς.

Στη χώρα μας ο ιός αυτός ήρθε στις 26 Φλεβάρη 2020, όπου εμφανίστηκε το πρώτο κρούσμα κι από τότε κι έπειτα σήμανε συναγερμός, εξαιτίας της υψηλής μεταδοτικότητας του ιού και η Ελλάδα αλλά και σχεδόν όλες οι χώρες του κόσμου μπήκαν σε πρωτοφανή καραντίνα(lockdown) για αρκετά μεγάλο χρονικό διάστημα. Στα γραφήματα παρακάτω, θα δούμε μια πορεία της πανδημίας στη χώρα, με τα ημερήσια κρούσματα από το Φλεβάρη του 2020 μέχρι πριν λίγες μέρες(τέλη Ιούνη), αλλά και τους θανάτους που δυστυχώς προήλθαν από τον ιό αυτό.

Παρατηρούμε ότι η μεγαλύτερη έξαρση σημειώθηκε τέλη Μαρτίου με μέσα Απριλίου 2021 με τα περισσότερα κρούσματα στη χώρα μας (απόρροια ίσως και του αυξημένου αριθμού που διενεργούνταν), ενώ οι περισσότεροι θάνατοι σε μία μέρα (134) συνέβησαν αρχές Μαΐου, όπου από τότε και μέχρι σήμερα ο ιός εξασθενεί, αφού και τα εμβόλια δείχνουν την αποτελεσματικότητά τους.

Στο παρόν άρθρο θα προσπαθήσουμε να αναλύσουμε δεδομένα σχετικά με την ειδησεογραφία για τον covid-19, αλλά και τις αναρτήσεις των χρηστών στο κοινωνικό δίκτυο twitter.

Ιστοσελίδα Newsit

Μια ιστοσελίδα ενημέρωσης, που όλο το δύσκολο αυτό διάστημα που διανύσαμε κι ακόμα διανύουμε βρέθηκε στο επίκεντρο των εξελίξεων και μετέφερε όλη την ειδησεογραφία σχετικά με τον covid-19 ήταν το newsit.

Τη φετινή χρονιά πραγματοποιήθηκαν 514 αναρτήσεις με θέμα τον κορονοϊό, ενώ ακόμα βρισκόμαστε στη μέση περίπου της χρονιάς. Ταυτόχρονα, όπως βλέπουμε και στο γράφημα παρακάτω συνολικά ο μήνας με τις περισσότερες αναρτήσεις για τον κορονοϊό είναι ο Ιούνιος. Αυτό είναι λογικό, ειδικά αν αναλογιστούμε την περσινή χρονιά με τις άρσεις των περιορισμών να αρχίζουν και μέτρα για το καλοκαίρι να ανακοινώνονται το συγκεκριμένο μήνα.

Προχωράμε με τη δημιουργία του σύννεφου λέξεων (wordcloud), το οποίο μας δίνει καλύτερη εικόνα για το περιεχόμενο των άρθρων της ιστοσελίδας. Το συγκεκριμένο σύννεφο λέξεων δημιουργήθηκε από τον τίτλο και το περιεχόμενο των άρθρων.

Όπως εύκολα γίνεται αντιληπτό, η λέξη κορονoϊός έχει τη μεγαλύτερη συχνότητα στα άρθρα, ενώ παρατηρούμε κι άλλες λέξεις με αρκετά μεγάλη συχνότητα όπως κρούσματα, νέος, εμβόλιο, Ελλάδα, 24ωρο, νοσοκομείο. Λέξεις με λιγότερη εμφάνιση στα άρθρα είναι: self test, lockdown, θάνατοι, εμβόλιο, νοσηλευόμενοι.

Στα επόμενα διαγράμματα θα δούμε τις συχνότερες λέξεις που εμφανίζοταν στα άρθρα της ιστοσελίδας NewsIt. Στο πρώτο παρατηρούμε τα συχνότερα διγράμματα (bigrams) με το δίγραμμα νέα κρούσματα να προηγείται με 84 εμφανίσεις στους τίτλους των άρθρων τη φετινή χρονιά, ακολουθούν τα κρούσματα κορονοϊού και τα κρούσματα ελλάδα με 39 και 24 αντίστοιχα.

Στο δεύτερο πραγματοποιήθηκε αναζήτηση μέσα στο κείμενο των άρθρων των παρακάτω λέξεων που βρισκόταν στο wordcloud και χρησιμοποιούνται αρκετά στις μέρες μας σε όλη την ειδησεογραφία. Το εμβόλιο εμφανίστηκε 300 φορές στα κείμενα των άρθρων, ενώ ακολουθούν οι λέξεις μέτρα, κυβέρνηση, κορονοϊός, πανδημία.

Ταυτόχρονα, πραγματοποιήθηκε αναζήτηση στο περιεχόμενο των άρθρων σχετικά με τις αναφορές στον ιό αυτό, με τις αγγλικές του ονομασίες. Όπως είναι λογικό, η συχνότερη με 1025 εμφανίσεις ήταν η covid-19, ακολουθεί covid, ενώ λίγες αναφορές έχουν covid19vaccine και covid_19.

Τέλος, σημαντικό μέρος στην ανάλυση των άρθρων που αφορούν το νέο φονικό ιό είναι η συγκέντρωση και οπτικοποίηση της ομοιότητας του κειμένου των άρθρων, προκειμένου να αντιληφθούμε την ομοιότητα στον τρόπο γραφής και δημοσίευσης της ιστοσελίδας. Η παραπάνω ανάλυση προβάλλεται σε μορφή γραφήματος heatmap, δείχνοντας τα 20 πιο όμοια μεταξύ τους άρθρα αλλά και με τη μορφή γραφήματος που φαίνεται η ομοιότητα πιο ξεκάθαρα.

Στο παραπάνω γράφημα για τα περισσότερο όμοια άρθρα του newsit οι δύο αριθμοί με το μεγαλύτερο ποσοστό ομοιότητας είναι το 21 και το 60. Οι τίτλοι τους είναι:

  1. Κορονοϊός: 791 νέα κρούσματα στην Ελλάδα σήμερα 11/06.
  2. Κορονοϊός: 1339 νέα κρούσματα στην Ελλάδα σήμερα (08/06).

Αυτό είναι λογικό γιατί στα άρθρα αυτά, αναλύονται τα ημερήσια κρούσματα δύο διαφορετικών ημερομηνιών του φετινού Ιουνίου.

Twitter

Το Twitter είναι ένα Κοινωνικό Δίκτυο το οποίο ανήκει στην ευρύτερη κατηγορία των Social Media και θεωρείται το δεύτερο δημοφιλέστερο αυτή τη στιγμή πίσω από το Facebook. Σύμφωνα με τα τελευταία οικονομικά αποτελέσματα, το Twitter έχει 271 εκατ. ενεργούς μηνιαία χρήστες. Αυτό που χαρακτηρίζει το συγκεκριμένο Κοινωνικό Δίκτυο από τα υπόλοιπα, είναι οι δημοσιεύσεις με όριο τους 140 χαρακτήρες, καθώς επίσης και η προώθηση του δημόσιου διαλόγου. Η χρήση του έχει να κάνει κυρίως με την ενημέρωση και στην Ελλάδα χαρακτηρίζεται ως το μέσο της ατάκας.

Θέλοντας να παρατηρήσουμε ποιες είναι οι τάσεις(trends) των χρηστών, είδαμε πως πολύ ψηλά στη σχετική λίστα βρισκόταν η λέξη κορονοϊός. Για το λόγο αυτό, συλλέξαμε δεδομένα που αφορούσαν τη συγκεκριμένη λέξη κλειδί στην αναζήτηση για τις τελευταίες μέρες του Ιουνίου και τις πρώτες του Ιουλίου (μέχρι 8/7 τελευταία ενημέρωση).

Στο σύννεφο λέξεων που οπτικοποιήθηκε, κυρίαρχη θέση κατέχουν οι λέξεις κορονοϊός, φταίμε εμείς, νέα κρούσματα, Μετάλλαξη Δέλτα κι ακολουθούν φάρμακο, ιός, κρούσματα, θάνατοι.

Παρακάτω προχωρούμε στην ανάλυση διαγραμμάτων με βάση το περιέχομενο των tweets που χρησιμοποιούσαν ως hashtag τη λέξη κορονοϊός.

Όπως διαπιστώνουμε, κυριαρχούν τα κρούσματα και στις συχνότερες λέξεις αλλά και στα διγράμματα, ενώ και η μετάλλαξη δέλτα χρησιμοποιείται πολύ στους χρήστες του Twitter.

Στη συνέχεια, πραγματοποιήθηκε συναισθηματική ανάλυση με το λεξικό EmoLex και σε συνάρτηση με το χρόνο, διαπιστώθηκαν τα εξής:

Ο μέσος αριθμός χαρακτήρων των tweets ανέρχεται στα 102, ενώ στο πρώτο γράφημα απεικονίζονται η μέση τιμή των χαρακτήρων στο πέρασμα των ημερών. Στα tweets επικρατούν συναισθήματα όπως χαρά, λύπη, θυμός κλπ. Στο δεύτερο γράφημα βλέπουμε τις αρνητικές αντιδράσεις να κορυφώνονται  στην αρχή του μήνα και μετά να μειώνονται αισθητά. Στο τελευταίο γράφημα μπορούμε να δούμε την διακύμανση των θετικών και αρνητικών συναισθημάτων στα tweets, με το πέρασμα του χρόνου, όπως και το κατά πόσο εκφράζουν εμπιστοσύνη. Κυριαρχούν τα αρνητικά συναισθήματα, κάτι το οποίο δείχνει και την ψυχολογία των ανθρώπων και την κούραση που έχει επέλθει από την πανδημία.

Αθανάσιος Πετρόπουλος

Τα περισσότερα διαγράμματα έγιναν με τη βοήθεια του Flourish.

Το Wordcloud οπτικοποιήθηκε μέσω του Wordclouds.

Η ανάλυση δεδομένων πραγματοποιήθηκε μέσω της γλώσσας προγραμματισμού Python και μέσω του προγράμματος Workbench.

Κώδικας στο GitHub εδώ.

Πηγές: NewsIt, Twitter, iMed Lab

Author

Αναδημοσιεύστε τις ιστορίες μας: Αυτές οι ιστορίες δεδομένων έχουν δημιουργηθεί από προπτυχιακούς και μεταπτυχιακούς φοιτητές/φοιτήτριες του τμήματος Επικοινωνίας και Μέσων Μαζικής Ενημέρωσης (ΕΜΜΕ) του ΕΚΠΑ. Τα άρθρα είναι διαθέσιμα προς αναδημοσίευση από ειδησεογραφικούς οργανισμούς, εφόσον τηρούνται οι Όροι και Προϋποθέσεις που αναγράφονται σε αυτή τη σελίδα.