Vai al contenuto

Ricerca scientifica in ambito sociale/Stigma verso la malattia mentale nei social network

Wikibooks, manuali e libri di testo liberi.
Indice del libro

Su Zenodo al seguente link: https://zenodo.org/records/11202766 è presente il progetto "Mental Health in Social Networks with Machine Learning Algorihtms" dove si trovano due set di dati in formato Excel incentrati sull'analisi della salute mentale nei social network, specificamente commenti su Instagram relativi a dichiarazioni di celebrità. Il primo set di dati (DatasetMH.xlsx) è etichettato per polarità (positiva, negativa, neutra) e stigma (Si,No), mentre il secondo (DatasetMH_Emotions.xlsx) è classificato in base a sei emozioni (amore/ammirazione, gratitudine, comprensione/empatia/identificazione, tristezza, rabbia/disprezzo/derisione, neutro). La raccolta e l'etichettatura dei commenti sono state effettuate da esperti dell'Università di Valladolid, con un processo che prevedeva una fase pilota, un'etichettatura indipendente e una revisione per risolvere le discrepanze, con l'obiettivo di creare modelli di machine learning per valutare le risposte emotive nei social network.

NOEMI, M., Alba, A., & Clara, G.-S. (2024). Mental Health in Social Networks with Machine Learning Algorihtms [Data set]. Zenodo. https://doi.org/10.5281/zenodo.11202766

Unisco i 2 dataset in R con il seguente codice:

 df <- merge(DatasetMH[,c(1,3,4)],DatasetMH_Emotions[,c(1,3)], by="Text", all.x = TRUE)
 df <- df[-which(duplicated(df)),]

Frequenza stigma

[modifica | modifica sorgente]

E' possibile calcolare le frequenze della variabile stigma, per cui nel campione i messaggi con stigma sono 558 su 2277 e la percentuale è del 24,51%

 library(dplyr)

 n=nrow(df)
 df %>%
  group_by(Stigma) %>%
  summarise(totale_messaggi=n(), percentuale=paste(round(totale_messaggi*100/n,2),"%",sep = ""))
Stigma   totale_messaggi percentuale
1 NO                1719 75.49%
2 Sì                 558 24.51%

E' possibile calcolare l'inferenza della percentuale infatti il campione è costituito da messaggi indipendenti essendo n*p=1719>10 ed n*(1-p)=558>10 per cui siamo fiduciosi al 95% che la percentuale vera di messaggi con stigma verso la malattia mentale su Instagram si trova nell'intervallo di confidenza [22,74% , 26,27%]

 library(statsr)

 inference(y = Stigma, data = df,
                statistic = "proportion", type = "ci",
                method = "theoretical", success = "Sì",
                conf_level = 0.95)
Single categorical variable, success: Sì
n = 2277, p-hat = 0.2451
95% CI: (0.2274 , 0.2627)

Frequenza polarità ed emozioni

[modifica | modifica sorgente]

Analogamente per le variabili polarità ed emozioni nel campione si ha:

Polarità        totale_messaggi percentuale
1 Indeterminato             173 7.6%
2 Negativo                  580 25.47%
3 Positivo                 1524 66.93%


Emozioni                               totale_messaggi percentuale
1 Amore/Ammirazione                                640 28.11%
2 Comprensione/Empatia/Identificazione             658 28.9%
3 Gratitudine                                      226 9.93%
4 Indeterminato                                    173 7.6%
5 Rabbia/Disprezzo/Scherno                         462 20.29%
6 Tristezza/Dolore                                 118 5.18%

Dipendenza tra le variabili stigma e polarità

[modifica | modifica sorgente]

Tramite il test chi-quadrato si vuole evidenziare che c'è una relazione di dipendenza tra le variabili in questione :

 inference(y = Stigma, x=Polarità, data = df,
                statistic = "proportion", type = "ht",
                method = "theoretical", alternative = "greater",
                conf_level = 0.95)
Response variable: categorical (2 levels)
Explanatory variable: categorical (3 levels)
Observed:
               y
x                 NO   Sì
  Indeterminato  164    9
  Negativo        31  549
  Positivo      1524    0
Expected:
              y
x                      NO        Sì
  Indeterminato  130.6047  42.39526
  Negativo       437.8656 142.13439
  Positivo      1150.5296 373.47036
H0: Polarità and Stigma are independent
HA: Polarità and Stigma are dependent
chi_sq = 2072.2766, df = 2, p_value = 0

Essendo p_value<0,05 rifiutiamo l'ipotesi nulla H0 per cui Polarità e Stigma sono dipendenti.

Si può verificare che anche tra Stigma ed Emozioni e tra Emozioni e Polarità c'è una relazione di dipendenza.