Ricerca scientifica in ambito sociale/Benessere nelle città
La pubblicazione https://pmc.ncbi.nlm.nih.gov/articles/PMC10039331 dal titolo "Healthy Cities, A comprehensive dataset for environmental determinants of health in England cities" introduce Healthy Cities, un set di dati completo che esplora i fattori ambientali che influenzano la salute nelle città inglesi. L'obiettivo è fornire uno strumento unificato e dettagliato per ricercatori e urbanisti, al fine di scoprire correlazioni tra ambiente urbano e salute pubblica e promuovere città più sane e sostenibili. Il dataset, accessibile pubblicamente si trova si Github qui : https://github.com/0oshowero0/HealthyCitiesDataset
Descrizione del dataset
[modifica | modifica sorgente]Il dataset "Healthy Cities" all_data.csv include un'ampia gamma di dati ambientali e sanitari per le città inglesi, raccolti e aggregati a livello di MSOA (Middle Layer Super Output Area) simili ai nostri quartieri e di città.
Per quanto riguarda i dati sanitari (Health Outcomes), il dataset copre tre aspetti principali:
- Aspettativa di vita (Life Expectancy): Sono inclusi dati sull'aspettativa di vita generale e sull'aspettativa di vita in buona salute, specifici per genere e a livello di MSOA .
- Salute fisica (Physical Health): Il dataset comprende i costi (spese) per cittadino relativi a diverse malattie non trasmissibili comuni nelle città:
- Asma (Asthma)
- Cancro (Cancer)
- Demenza (Dementia)
- Diabete (Diabetes)
- Iperlipidemia (Hyperlipidemia)
- Ipertensione (Hypertension)
- Obesità (Obesity)
- Salute mentale (Mental Health): Sono inclusi i costi (spese) per cittadino relativi a disturbi mentali generali (general mental disorders)
I dati ambientali (Environmental Determinants) sono organizzati in quattro prospettive:
- Statistiche di base (Basic Statistics): Forniscono informazioni essenziali sulla composizione degli spazi urbani :
- Popolazione (Population) a livello di MSOA e città.
- Area (Area) in km² a livello di MSOA e città.
- Densità di popolazione (Population Density) calcolata per MSOA e città.
- Centroidi geografici (Geographical Centroid) in formato WGS84 per città e MSOA.
- Confini geografici (Boundary) come poligoni in formato GeoJSON con codici MSOA e città, anch'essi in WGS84.
- Ambiente comportamentale (Behaviour Environment): Si concentra sulla disponibilità di luoghi che influenzano i comportamenti legati alla salute
- Disponibilità di tabacco (Tobacco Availability), calcolata come la frazione tra il numero di punti vendita di tabacco (tabaccherie e negozi di alimentari) e la popolazione della regione.
- Disponibilità di alcol (Alcohol Availability), calcolata considerando luoghi come bar, negozi di alcolici e negozi di alimentari, in rapporto alla popolazione.
- Disponibilità di servizi sanitari (Health Service Availability), considerando farmacie, servizi sanitari ambulatoriali, ospedali e strutture di cura residenziale, in rapporto alla popolazione.
- Disponibilità di opportunità per l'esercizio fisico (Physical Exercise Availability), considerando centri fitness, parchi naturali e istituzioni simili, in rapporto alla popolazione.
- Ambiente costruito (Built Environment): Descrive le caratteristiche fisiche delle aree urbane :
- Densità degli edifici (Building Density), numero di edifici per km².
- Prezzo medio e mediano delle case (Median/Mean House Price) a livello di MSOA, disponibile trimestralmente.
- Densità delle strade (Driving/Cycling/Walking Road Density), rapporto tra la lunghezza totale delle strade (per auto, biciclette e pedoni) e l'area.
- Caratteristiche delle immagini di Street View (Street View Features), percentuale a livello di pixel di 19 oggetti riconosciuti nelle immagini di Street View (es. strade, marciapiedi, edifici, vegetazione) .
- Caratteristiche delle immagini satellitari (Satellite View Features), percentuale a livello di pixel di 7 oggetti etichettati estratti da immagini satellitari (es. edifici, strade, acqua, vegetazione) .
- Punteggio di camminabilità (Walkability), una media standardizzata della densità di popolazione, della densità di incroci stradali e di un punteggio relativo alla disponibilità di servizi quotidiani.
- Ambiente naturale (Natural Environment): Include dati relativi alla qualità dell'aria e alle condizioni meteorologiche :
- Indici di qualità dell'aria (NOx/PM2.5/PM10) in µg/m³, disponibili su base giornaliera.
- Temperatura minima e massima (°C), disponibile giornalmente.
- Precipitazioni (Rainfall) in mm, disponibili giornalmente.
- Umidità relativa (Relative Humidity) in %, disponibile mensilmente.
- Giorni di neve al suolo (Snow Lying Days), disponibile mensilmente.
- Ore di sole (Sunshine Hours), disponibile mensilmente.
- Velocità del vento (Wind Speed) in nodi, disponibile mensilmente. I dati sulla qualità dell'aria possono contenere più registrazioni per città a causa di diverse stazioni di monitoraggio.
Correlazioni tra le variabili
[modifica | modifica sorgente]Disponibilità di tabacco e spesa per l'asma
[modifica | modifica sorgente]La fonte indica che il comportamento del fumo è positivamente correlato all'incidenza dell'asma . Inoltre una maggiore disponibilità di punti vendita di tabacco (Tobacco Availability ) è correlata a una maggiore spesa per farmaci per l'asma (Asthma), essendo l'indice di correlazione di Pearson pari al 10,43% , utilizzando come raggruppamento i MSOA (quartieri) delle città inglesi.
library(dplyr)
all_data <- read.csv("all_data.csv")
df1<-all_data %>%
filter(ThirdCategory=="TobaccoAvailability") %>%
group_by(MSOAName) %>%
summarise(var1=mean(Value))
df2<-all_data %>%
filter(ThirdCategory=="AsthmaExpenditure", Key=="PerCitizenCost") %>%
group_by(MSOAName) %>%
summarise(var2=mean(Value))
df1 <- merge(df1,df2, by="MSOAName")
cor(df1$var1,df1$var2)
0.1043
Camminabilità e spesa per demenza
[modifica | modifica sorgente]La fonte suggerisce che il comportamento di camminare è negativamente correlato alla demenza infatti analizzando la correlazione tra il punteggio di camminabilità (Walkability ) e la spesa per farmaci per la demenza (Dementia) si ottiene -55,65% utilizzando come raggruppamento direttamente le città inglesi.
df1<-all_data %>%
filter(ThirdCategory=="Walkability") %>%
group_by(CityName) %>%
summarise(var1=mean(Value))
df2<-all_data %>%
filter(ThirdCategory=="DementiaExpenditure", Key=="PerCitizenCost") %>%
group_by(CityName) %>%
summarise(var2=mean(Value))
df1 <- merge(df1,df2, by="CityName")
cor(df1$var1,df1$var2)
-0.5565231
Densità degli edifici e delle strade e spesa per demenza
[modifica | modifica sorgente]La fonte suggerisce di convalidare l'influenza della densità degli edifici e delle strade (Building Density e Walking Road Density ) sulla funzione cognitiva, potenzialmente misurata dalla spesa per la demenza (DementiaExpenditure). Calcolando l'indice di correlazione di Pearson si ottiene pe la Building Density 13,89% e per la Road Density 19,51% , utilizzando come raggruppamento direttamente le città inglesi.
Disponibilità di servizi sanitari e aspettativa di vita in salute
[modifica | modifica sorgente]Una maggiore disponibilità di servizi sanitari (HealthAvailability) è correlata a una maggiore aspettativa di vita in salute (60,62%).
Disponibilità di alcol e spesa per problemi di salute
[modifica | modifica sorgente]La fonte menziona che la disponibilità di bar è legata ai danni correlati all'alcol. La correlazione tra la disponibilità di punti vendita di alcol (AlcoholAvailability) e le spese per il cancro è del 13,21% .