Ricerca scientifica in ambito sociale/Stigma verso la malattia mentale nei social network
Su Zenodo al seguente link: https://zenodo.org/records/11202766 è presente il progetto "Mental Health in Social Networks with Machine Learning Algorihtms" dove si trovano due set di dati in formato Excel incentrati sull'analisi della salute mentale nei social network, specificamente commenti su Instagram relativi a dichiarazioni di celebrità. Il primo set di dati (DatasetMH.xlsx) è etichettato per polarità (positiva, negativa, neutra) e stigma (Si,No), mentre il secondo (DatasetMH_Emotions.xlsx) è classificato in base a sei emozioni (amore/ammirazione, gratitudine, comprensione/empatia/identificazione, tristezza, rabbia/disprezzo/derisione, neutro). La raccolta e l'etichettatura dei commenti sono state effettuate da esperti dell'Università di Valladolid, con un processo che prevedeva una fase pilota, un'etichettatura indipendente e una revisione per risolvere le discrepanze, con l'obiettivo di creare modelli di machine learning per valutare le risposte emotive nei social network.
NOEMI, M., Alba, A., & Clara, G.-S. (2024). Mental Health in Social Networks with Machine Learning Algorihtms [Data set]. Zenodo. https://doi.org/10.5281/zenodo.11202766
Unisco i 2 dataset in R con il seguente codice:
df <- merge(DatasetMH[,c(1,3,4)],DatasetMH_Emotions[,c(1,3)], by="Text", all.x = TRUE)
df <- df[-which(duplicated(df)),]
Frequenza stigma
[modifica | modifica sorgente]E' possibile calcolare le frequenze della variabile stigma, per cui nel campione i messaggi con stigma sono 558 su 2277 e la percentuale è del 24,51%
library(dplyr)
n=nrow(df)
df %>%
group_by(Stigma) %>%
summarise(totale_messaggi=n(), percentuale=paste(round(totale_messaggi*100/n,2),"%",sep = ""))
Stigma totale_messaggi percentuale 1 NO 1719 75.49% 2 Sì 558 24.51%
E' possibile calcolare l'inferenza della percentuale infatti il campione è costituito da messaggi indipendenti essendo n*p=1719>10 ed n*(1-p)=558>10 per cui siamo fiduciosi al 95% che la percentuale vera di messaggi con stigma verso la malattia mentale su Instagram si trova nell'intervallo di confidenza [22,74% , 26,27%]
library(statsr)
inference(y = Stigma, data = df,
statistic = "proportion", type = "ci",
method = "theoretical", success = "Sì",
conf_level = 0.95)
Single categorical variable, success: Sì n = 2277, p-hat = 0.2451 95% CI: (0.2274 , 0.2627)
Frequenza polarità ed emozioni
[modifica | modifica sorgente]Analogamente per le variabili polarità ed emozioni nel campione si ha:
Polarità totale_messaggi percentuale 1 Indeterminato 173 7.6% 2 Negativo 580 25.47% 3 Positivo 1524 66.93%
Emozioni totale_messaggi percentuale 1 Amore/Ammirazione 640 28.11% 2 Comprensione/Empatia/Identificazione 658 28.9% 3 Gratitudine 226 9.93% 4 Indeterminato 173 7.6% 5 Rabbia/Disprezzo/Scherno 462 20.29% 6 Tristezza/Dolore 118 5.18%
Dipendenza tra le variabili stigma e polarità
[modifica | modifica sorgente]Tramite il test chi-quadrato si vuole evidenziare che c'è una relazione di dipendenza tra le variabili in questione :
inference(y = Stigma, x=Polarità, data = df,
statistic = "proportion", type = "ht",
method = "theoretical", alternative = "greater",
conf_level = 0.95)
Response variable: categorical (2 levels)
Explanatory variable: categorical (3 levels)
Observed:
y
x NO Sì
Indeterminato 164 9
Negativo 31 549
Positivo 1524 0
Expected:
y
x NO Sì
Indeterminato 130.6047 42.39526
Negativo 437.8656 142.13439
Positivo 1150.5296 373.47036
H0: Polarità and Stigma are independent HA: Polarità and Stigma are dependent chi_sq = 2072.2766, df = 2, p_value = 0
Essendo p_value<0,05 rifiutiamo l'ipotesi nulla H0 per cui Polarità e Stigma sono dipendenti.
Si può verificare che anche tra Stigma ed Emozioni e tra Emozioni e Polarità c'è una relazione di dipendenza.