Applicazioni pratiche di deep learning/Segmentazione delle immagini

Wikibooks, manuali e libri di testo liberi.
Indice del libro

Nell'elaborazione di immagini digitali e nella visione artificiale , la segmentazione dell'immagine è il processo di partizione di un'immagine digitale in più segmenti di immagine , noti anche come regioni dell'immagine o oggetti immagine ( set di pixel ). In pratica attraverso il deep learning è possibile identificare le varie parti di un'immagine . Alcune delle applicazioni pratiche della segmentazione delle immagini sono:

  • Imaging medico , comprese le immagini di rendering volumetrico da tomografia computerizzata e risonanza magnetica , ad esempio nella localizzazione dei tumori e in altre patologie
  • Rilevamento di oggetti
  • Rilevamento pedoni
  • Riconoscimento facciale
  • Riconoscimento delle impronte digitali
  • Riconoscimento dell'iride
  • Sistemi di controllo del traffico
  • Video sorveglianza

Per procedere alla segmentazione della foto a destra

tramite Hugging Face , utilizzando il modello di default facebook/detr-resnet-50-panoptic, si procede cosi su Colab:

!pip install -q transformers
!pip install timm
from transformers import pipeline
model = pipeline("image-segmentation")
model("https://live.staticflickr.com/65535/52204191055_04e952292f_4k.jpg")

che dà il seguente risultato :

No model was supplied, defaulted to facebook/detr-resnet-50-panoptic (https://huggingface.co/facebook/detr-resnet-50-panoptic)
[{'label': 'person',
 'mask': <PIL.Image.Image image mode=L size=2731x4096 at 0x7FF14AF8AB90>,
 'score': 0.9985314607620239},
{'label': 'playingfield',
 'mask': <PIL.Image.Image image mode=L size=2731x4096 at 0x7FF14AF8A990>,
 'score': 0.9412941336631775},
{'label': 'person',
 'mask': <PIL.Image.Image image mode=L size=2731x4096 at 0x7FF14AF8AED0>,
 'score': 0.9996600151062012},
{'label': 'bicycle',
 'mask': <PIL.Image.Image image mode=L size=2731x4096 at 0x7FF14AF8A3D0>,
 'score': 0.9092055559158325}]
 

Quindi il modello con un'accuratezza superiore al 90% ha individuato nella foto 2 persone, una bicicletta e un campo da gioco.

Link esterni[modifica]