Overview:
Διαβάζοντας την στήλη "Πολιτισμός", περιμένουμε να ενημερωθούμε σχετικά με πολιτισμικά δρώμενα της πόλης ή της χώρας μας και να νιώσουμε ότι υπάρχει τροφή για σκέψη και ανάπτυξη του πνεύματός μας. Συχνά όμως η στήλη αυτή πολιτικοποιείται και καταλήγει ένα "προϊόν" πολιτικής προπαγάνδας.
Πραγματοποιήσαμε ανάλυση δεδομένων, με την βοήθεια της γλώσσας προγραμματισμού Python, αναλύοντας και συγκρίνοντας το περιεχόμενο 280 άρθρων της στήλης “Πολιτισμός”, από την ειδησεογραφική σελίδα Newsit.
Το κεντρικό ερευνητικό μας ερώτημα και γενικότερος προβληματισμος ήταν το εάν η συγκεκριμένη στήλη πραγματικά και ουσιαστικά συμβάλει στην ενημέρωση των πολιτών και αναγνωστών για τα πολιτιστικά δρώμενα ή ε΄αν τελικά λειτουργεί ως ένας πόλος έλξης και πεδίο πολιτικής προπαγάνδας και χειραγώγισης, με καμουφλαζ λέξεις και εκφράσεις που διεγείρουν συναισθήματα και σχετίζονται με κάποιο πολιτισμικό γεγονός. Τα αποτελέσματα της έρευνάς μας καταιγιστικά, ειδικότερα λαμβάνοντας υπόψιν ότι η χρονιά του 2023 στιγματίστηκε με πολιτικές εκλογές και αδιαμφισβήτητο προβάδισμα του κυβερνούντος κόμματος.
Ξεκινήσαμε την ανάλυση μας, με την διαδικασία scraping, όπου καταφέραμε να δημιουργήσουμε ένα dataframe με όλες τις απαραίτητες πληροφορίες για κάθε ένα από τα 280 άρθρα μας δηλαδή ποιος είναι ο τίτλος, ο συγγραφέας, η ώρα και η μέρα δημοσίευσης και η σύντομη περιγραφή του. Σημειώνουμε ότι το σύνολο των άρθρων που μελετήσαμε, αφορά μία μεγάλη περίοδο που ξεκινά τον Μάϊο του 2023 και συγκριτικά φτάνει έως και τον Δεκέμβριο του 2009. Εξάγοντας τα πρώτα μας ευρήματα, μάθαμε ότι o παραγωγικός μήνας αρθρογραφίας ΄ήταν ο Απρίλιος του 2023, ως μήνας καθοριστικός της προεκλογικής μεθόδου και μάλιστα η ώρα κατά την οποία σημειώθηκαν οι περισσότερες δημοσιεύσεις ήταν μεταξύ 11.00 π.μ. και 12.00 μ.μ.
Με την μέθοδο καθορισμού stopwords και κατ’επέκταση τη δημιουργία “wordclouds”, είδαμε ποιες είναι οι επικρατέστερες έννοιες, εκφράσεις και λέξεις του περιεχομένου των άρθρων μας, οι οποίες επιβεβαίωσαν τις αρχικές μας υποθέσεις και ερευνητικούς προβληματισμούς.
Στη συνέχεια αξιοποιήσαμε την μέθοδο διανυσματοποίησης του ερευνητικού μας αντικειμένου (CountVectorizer), αναλύοντας την ομοιότητας των κειμένων μέσω της συνάρτησης cosine_similarity, ώστε να βρούμε ποια από τα άρθρα έχουν μεγάλη ομοιότητα, αλλά και ποιες είναι οι επικρατέστερες λέξεις μέσα στο σώμα κειμένων. Τα αποτελέσματα επιβεβαίωσαν για μία ακόμη φορά τις αρχικές μας υποθέσεις και ανέδειξαν ότι στην συντριπτική πλειοψηφία τα άρθρα, προάγουν τις πολιτικές της κυβέρνησης, με πρωταρχικό βέβαια στόχο την προβολή του site “newsit”.
Ολοκληρώνοντας την ανάλυσή μας, χρησιμοποιήσαμε τα λεξικά ανάλυσης πολικότητας (emolex) , ανάμεσα σε θετικές και αρνητικές εκφράσεις, προκειμένου να διαπιστώσουμε το πρόσιμο της συναισθηματικής γλώσσας που χαρακτηρίζει την γλώσσα γραφής του περιεχομένου που εξετάζουμε. Τα δεδομένα που επικράτησαν, αφορούν και πάλι στην χρονική περίοδο Απρίλιος – Μάϊος 2023, καθώς όπως εξηγήσαμε λόγω προεκλογικής περιόδου, σημειώνεται ο μεγαλύτερος όγκος ειδησεογραφικού περιεχομένου.
Με οδηγό τα διαγράμματά μας, παρατηρήσαμε ότι επικρατεί η αρνητικότητα στο περιεχόμενο των κειμένων που διαβάζουμε, με τον εντοπισμό “δραματικών”, ίσως και βαρύγδουπων εκφράσεων, κατά την προεκλογική περίοδο, που σκοπό έχουν να κεντρίσουν τους αναγνώστες, διεκδικώντας την προσοχή τους έναντι άλλων ειδησεογραφικών καναλιών ή άλλων στηλών.Την θέση αυτή μπορεί να επιβεβαιώσει και η πράσινη σήμανση (υψηλότερη μπάρα για τον μήνα Ιούλιο), όπου σε περίοδο ραστώνης, οι αναγνώστες προτιμούν πιο “ανάλαφρο” περιεχόμενο, συνεπώς κείμενο με θετικό πρόσημο.