Applicazioni pratiche di deep learning/Profilazione delle persone

Wikibooks, manuali e libri di testo liberi.
Indice del libro

Scenario 1: Identificazione degli oppositori politici[modifica]

Supponiamo di trovarci in un regime totalitario fascista e di volere identificare gli oppositori politici, si può procedere in tal modo :

Prima modalità[modifica]

  • 1) Fare lo scraping o raschiamento dei social quali Facebook, Instagram, Twitter ecc. utilizzando uno dei numerosi pacchetti che si trovano in rete , prelevando non solo informazioni sensibili fornite dagli utenti ma anche i loro commenti, post, tweets ecc. Bisogna tenere conto però che in Italia lo scraping è illegale se i dati ottenuti vengono pubblicati o rivenduti senza il consenso degli interessati.
  • 2) Ottenuti questi dati in formato csv o foglio di calcolo , procedere con la classificazione dei testi del deep learning, cercando in caso di dittatura fascista argomenti quali comunismo, marxismo ecc. Un esempio di classificazione di testi si trova nella pagina classificazione dei tweets .
  • 3) Dopo avere identificato i testi in cui si parla di comunismo, marxismo ecc. procedere col sentiment analysis, cioè valutare se la polarità dei testi è positiva o negativa. Un esempio di sentiment analysis si trova nella pagina riconoscimento recensioni positive Amazon . Se la polarità di un testo con argomento comunismo è positiva, l'utente che l'ha scritto potrebbe essere un oppositore politico dell'attuale regime fascista, quindi potrebbe essere utile evidenziare i dati sensibili che l'utente ha fornito nel proprio profilo social tra cui la foto, la città dove vive, il lavoro che svolge. Analogamente se l'argomento ricercato è fascismo e la polarità è negativa. Lo scraping non può ottenere l'indirizzo IP dell'utente, per cui soltanto i proprietari dei social possono avere accesso all'indirizzo di casa degli utenti.
  • 4) Per quanto riguarda le immagini postate dagli utenti e ottenute tramite scraping si può applicare ad esse la segmentazione delle immagini di cui un esempio si trova qui : segmentazione delle immagini cercando nelle immagini oggetti simboli del comunismo . Se si trovano, l'utente potrebbe essere un oppositore del regime.

Seconda modalità[modifica]

Si possono scattare fotografie durante le manifestazioni di protesta e tramite la segmentazione delle immagini si possono identificare i volti nelle immagini, mentre con la classificazione delle immagini che nel caso specifico si chiama riconoscimento facciale si può risalire ai profili delle persone nei social. Questa modalità in questo momento è alla portata soltanto dei proprietari dei social e delle forze dell'ordine.

Scenario 2: Trovare nuovi clienti sui social[modifica]

Un pasticcere siciliano desidera identificare nuovi clienti sui social. Può procedere in tal modo :

  • 1) Fare lo scraping o raschiamento dei social quali Facebook, Instagram, Twitter ecc. utilizzando uno dei numerosi pacchetti che si trovano in rete , prelevando non solo informazioni sensibili fornite dagli utenti ma anche i loro commenti, post, tweets ecc. Bisogna tenere conto però che in Italia lo scraping è illegale se i dati ottenuti vengono pubblicati o rivenduti senza il consenso degli interessati.
  • 2) Ottenuti questi dati in formato csv o foglio di calcolo , procedere con la classificazione dei testi del deep learning, cercando argomenti quali pasticceria, dolci, Sicilia ecc.
  • 3) Dopo avere identificato i testi in cui si parla di pasticceria, dolci, Sicilia ecc. procedere col sentiment analysis, cioè valutare se la polarità dei testi è positiva o negativa. Se la polarità di un testo con argomenti pasticceria, Sicilia è positiva, l'utente che l'ha scritto potrebbe essere un potenziale cliente, quindi potrebbe essere utile evidenziare i dati sensibili che l'utente ha fornito nel proprio profilo social tra cui la foto, la città dove vive, il lavoro che svolge. Lo scraping non può ottenere l'indirizzo IP dell'utente, per cui soltanto i proprietari dei social possono avere accesso all'indirizzo di casa degli utenti.
  • 4) Per quanto riguarda le immagini postate dagli utenti e ottenute tramite scraping si può applicare ad esse la segmentazione delle immagini cercando nelle immagini foto di pasticceria siciliana . Se si trovano, l'utente potrebbe essere un potenziale cliente.