Η “Ανάλυση αρθρογραφίας ειδησεογραφικών sites” αποτελεί ένα πειραματικό on-going project του Εργαστηρίου Νέων Τεχνολογιών. Αρχίζοντας από τις 4/1/2023, συγκεντρώνονται και αναλύονται αυτόματα τα άρθρα που δημοσιεύονται καθημερινά σε 18 ελληνικά ειδησεογραφικά sites υψηλής επισκεψιμότητας.

Καθώς συγκεντρώνονται περισσότερα δεδομένα, τα αποτελέσματα της καθημερινής ανάλυσης αποτυπώνονται σε γραφήματα τα οποία ανανεώνονται αυτόματα.

Περιεχόμενα


Ποια ήταν τα σημαντικότερα θέματα της χθεσινής ειδησεογραφίας

Όπως φαίνεται παρακάτω, στην αρθρογραφία ανά θεματική κατηγορία, τα sites διαφοροποιούνται μεταξύ τους ως προς τον αριθμό των ειδήσεων που δημοσιεύουν σε κάθε κατηγορία. Ωστόσο, όταν υπάρχουν σημαντικά γεγονότα (ακόμα και σε κατηγορίες που δεν καλύπτονται ενδελεχώς), συνήθως υπάρχει καταγραφή τους σε όλα τα sites και μάλιστα με αρκετή ακολουθία ενημερώσεων. Το αποτέλεσμα είναι να αυξάνεται το πλήθος των λέξεων για τα συγκεκριμένα σημαντικά γεγονότα και αυτό αποτυπώνεται στα wordclouds που δημιουργούνται από τις συχνότητες εμφάνισης των λέξεων.

Επιλέξτε το site που σας ενδιαφέρει για να δείτε ποια ήταν τα θέματα που κατέγραψε περισσότερο εχθές.

Σημείωση: ανανεώστε τη σελίδα στον browser (Shift + refresh button) για να δείτε τα νεώτερα αποτελέσματα.


Πώς κατανέμεται η αρθρογραφία σε θεματικές κατηγορίες

Στα παρακάτω γραφήματα αποτυπώνεται η συνολική εικόνα της αρθρογραφίας (πλήθος άρθρων ανά θεματική κατηγορία). Το αριστερό γράφημα αναφέρεται στη χθεσινή ημέρα, ενώ το δεξί στο σύνολο των δεδομένων (από 4/1/2023 έως και χθες).


Σε ποιες θεματικές εστιάζονται τα διάφορα sites

Στα αριστερά διαδραστικά γραφήματα μπορούμε να δούμε ποιο site υπερτερεί σε κάλυψη ειδήσεων σε κάθε θεματική κατηγορία. Στα δεξιά γραφήματα μπορούμε να δούμε ποια κατηγορία υπερτερεί σε κάλυψη σε κάθε site.

Χθες
Διαχρονικά (4/1/2023 - χθες)

Πώς διαφοροποιείται η αρθρογραφία στις θεματικές κατηγορίες μέρα τη μέρα

Παρότι τα διάφορα sites έχουν εκ των προτέρω αποφασίσει σε ποιες θεματικές κατηγορίες εστιάζονται, ο στόχος τους να καλύπτουν την τρέχουσα επικαιρότητα αποτελεί πάντα την μεγαλύτερη προτεραιότητα.

Ακόμα και sites που δημοσιεύουν λιγότερες διεθνείς ειδήσεις (π.χ. newsbeast.gr, in.gr, newsbomb.gr, dikaiologitika.gr), αύξησαν αρκετά τη δημοσίευση ειδήσεων στην κατηγορία "Διεθνή" μετά το σεισμό στην Τουρκία και τη Συρία στις 6/2/2023.

Στο παρακάτω διαδραστικό γράφημα αποτυπώνεται η διαφοροποίηση της αρθρογραφίας στις θεματικές κατηγορίες στο πέρασμα του χρόνου. Επιλέξτε κάποιο site για να δείτε τη χρονοσειρά της αρθρογραφίας του στις διάφορες κατηγορίες.

Σημείωση: Στα γραφήματα αποτυπώνεται το πλήθος των άρθρων ανά κατηγορία και όχι το ποσοστό της κάθε κατηγορίας στο σύνολο των άρθρων. Με αυτό τον τρόπο έχουμε καλύτερη εικόνα της σημαντικότητας των ειδήσεων σε κάθε κατηγορία. Οι περιοδικές πτώσεις στις καμπύλες επιβεβαιώνουν τον κανόνα ότι τα Σαββατοκύριακα και τις αργίες δεν υπάρχουν ειδήσεις!


Πώς είναι φορτισμένα συναισθηματικά τα κείμενα

Η συναισθηματική ανάλυση των κειμένων που δημοσιεύονται στα ειδησεογραφικά websites που μελετάμε, βασίζεται στο πολικό ζεύγος θετικότητα/αρνητικότητα και στα 4 διπολικά ζεύγη των 8 βασικών συναισθημάτων όπως καταγράφονται στον τροχό του Plutchik: χαρά/λύπη, εμπιστοσύνη/αποστροφή, φόβος/θυμός και έκπληξη/προσμονή.

Με τη χρήση συναισθηματικών λεξικών μπορούμε να εκτιμήσουμε υπολογιστικά τη συναισθηματική φόρτιση κειμένων.

Στους διαδραστικούς πίνακες που ακολουθούν μπορούμε να δούμε ποιος ήταν -χθές (πρώτος πίνακας) και τις τελευταίες 7 ημέρες (δεύτερος πίνακας)- ο συναισθηματικός τόνος των δημοσιευμάτων σε κάθε website σε κάθε θεματική κατηγορία και να απαντήσουμε ερωτήματα όπως: ποιο site παρουσιάζει τα θέματα μιας συγκεκριμένης κατηγορίας με θετικότερο τρόπο; σε ποια θεματική κατηγορία θα βρούμε κείμενα που εκφράζουν περισσότερο φόβο; κ.ο.κ.

Βασικά συναισθηματικά δίπολα

Σύνθετα συναισθηματικά δίπολα

Σύμφωνα με τον τροχό του Plutchik, συγκεκριμένοι συνδυασμοί των 8 βασικών συναισθημάτων δημιουργούν 4 νέα δίπολα σύνθετων συναισθημάτων: αγάπη/ενοχή, περιφρόνηση/παθητικότητα, δέος/επιθετικότητα και αισιοδοξία/αποδοκιμασία.

Στα παρακάτω διαδραστικά γραφήματα αποτυπώνονται τα σύνθετα συναισθηματικά δίπολα σε 5 βασικές θεματικές κατηγορίες ανά website.

Χθες

Ελλάδα/Κοινωνία

Διεθνή

Πολιτική

Οικονομία

Life

Τελευταίες 7 ημέρες

Ελλάδα/Κοινωνία

Διεθνή

Πολιτική

Οικονομία

Life

Συναισθηματικά δίπολα στα κείμενα γνώμης

Η συναισθηματική φόρτιση των κειμένων στις θεματικές κατηγορίες των ειδήσεων είναι σημαντικός δείκτης του τρόπου παρουσίασης των γεγονότων από τα ειδησεογραφικά sites, ωστόσο ίσως είναι ιδιαίτερα ενδιαφέρον να δούμε πώς διαφοροποιούνται συναισθηματικά τα κείμενα όταν αφορούν απόψεις πάνω σε θέματα που επιλέγει να αναδείξει το κάθε site.

Η κατηγορία "Απόψεις / Θέματα" συνιστά την ταυτότητα του μέσου, επομένως εκεί είναι πολύ πιθανότερο να εντοπιστούν οι μεγαλύτερες διαφοροποιήσεις. Δείτε τις διαφορές στα παρακάτω διαδραστικά γραφήματα.

Χθες
Τελευταίες 7 ημέρες

Πόσο μοιάζουν/διαφέρουν μεταξύ τους τα κείμενα των διαφoρετικών sites

Γενικά, καθώς όλα τα κείμενα είναι δημοσιογραφικά, είναι αναμενώμενο να μοιάζουν αρκετά μεταξύ τους και πράγματι, όπως φαίνεται στα παρακάτω γραφήματα, η ομοιότητα των κειμένων σε όλα τα sites ξεπερνάει το 70%. Ωστόσο κάποια sites φαίνεται πως μοιάζουν πάρα πολύ (πάνω από 96%), ενώ κάποια άλλα, όπως για παράδειγμα το skai.gr, φαίνεται πως εμφανίζουν μια μικρή διαφοροποίηση από τα υπόλοιπα!

Σημ.: Το πράσινο χρώμα υποδεικνύει μεγάλη ομοιότητα, ενώ το ροζ μικρότερη - μπορείτε να μεγενθύνετε τα γραφήματα κάνοντας κλικ επάνω τους.

Χθες
Ομοιότητα κειμένων στα διαφορετικά websites χθες
Τελευταίες 7 ημέρες
Ομοιότητα κειμένων στα διαφορετικά websites τις τελευταίες 7 ημέρες

Ταυτότητα του project

Για την Ανάλυση της αρθρογραφίας ειδησεογραφικών sites, συγκεντρώνονται και αναλύονται καθημερινά (από 4/1/2023) τα άρθρα που δημοσιεύονται σε 18 ελληνικά sites. Η επιλογή των sites βασίστηκε στις λίστες που δημοσιεύει το reuters.

Οι δημοφιλέστερες ελληνικές ενημερωτικές ιστοσελίδες για το 2022, σύμφωνα με το Reuters
Οι δημοφιλέστερες ελληνικές ενημερωτικές ιστοσελίδες για το 2022, σύμφωνα με το Reuters

Η συλλογή και επεξεργασία των δεδομένων καθώς και η καθημερινή ανανέωση των γραφημάτων στο παρόν άρθρο γίνονται αυτόματα με τη χρήση κώδικα που αναπτύχθηκε στη γλώσσα προγραμματισμού python. Τα wordclouds και τα heatmaps δημιουργούνται με τη βιβλιοθήκη pyplot της python. Όλα τα υπόλοιπα διαδραστικά γραφήματα δημιουργούνται στο datawrapper.

Η υλοποίηση αυτού του project ήταν εφικτή χάρη στην πολύτιμη βοήθεια του καθηγητή Πληροφορικής και Διευθυντή του Εργαστηρίου Νέων Τεχνολογιών στην Επικοινωνία, την Εκπαίδευση και τα ΜΜΕ Κωνσταντίνου Μουρλά και την ένθερμη υποστήριξη του καθηγητή Γλωσσολογίας και Φιλοσοφίας της Γλώσσας Σπύρου Μοσχονά.

Author

  • Θοδωρής Παρασκευάς

    Ο Θοδωρής Παρασκευάς έχει σπουδάσει Μηχανολογία, Γραφιστική και Επικοινωνία/Δημοσιογραφία. Είναι μεταπτυχιακός φοιτητής στο ΠΜΣ "Ψηφιακά Μέσα Επικοινωνίας και Περιβάλλοντα Αλληλεπίδρασης" του τμήματος ΕΜΜΕ του ΕΚΠΑ και συνεργαζόμενος ερευνητής στο Εργαστήριο Νέων Τεχνολογιών.

    View all posts

Αναδημοσιεύστε τις ιστορίες μας: Αυτές οι ιστορίες δεδομένων έχουν δημιουργηθεί από προπτυχιακούς και μεταπτυχιακούς φοιτητές/φοιτήτριες του τμήματος Επικοινωνίας και Μέσων Μαζικής Ενημέρωσης (ΕΜΜΕ) του ΕΚΠΑ. Τα άρθρα είναι διαθέσιμα προς αναδημοσίευση από ειδησεογραφικούς οργανισμούς, εφόσον τηρούνται οι Όροι και Προϋποθέσεις που αναγράφονται σε αυτή τη σελίδα.