Applicazioni pratiche di machine learning: differenze tra le versioni

Wikibooks, manuali e libri di testo liberi.
Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica
Nessun oggetto della modifica
Riga 17: Riga 17:
*[[w:Gradient boosting|Gradient boosting]]
*[[w:Gradient boosting|Gradient boosting]]




==Voci correlate==
*[[Installazione di R]]
*[[Creare reports con RStudio]]





Versione delle 06:54, 16 feb 2020

Indice del libro

Questo libro contiene alcuni reports, dove si utilizzano algoritmi di machine learning nel linguaggio di programmazione R, utilizzando l'IDE RStudio, per fare previsioni esemplificative su argomenti di utilità generale.

Le principali librerie utilizzate nei reports del libro sono le seguenti:

  • base: contiene le funzioni di base di R: aritmetiche,input/output, programmazione di base ecc. Questa libreria viene caricata automaticamente all'avvio di R.
  • stats: contiene funzioni per calcoli statistici e generazione di numeri casuali. Anche questa libreria viene caricata automaticamente all'avvio di R .
  • dplyr: fornisce una grammatica flessibile per manipolare e interrogare i data frames e quindi i dataset. In sostanza è l'equivalente di SQL per realizzare delle query direttamente nei dataset.
  • ggplot2: da la possibilità di ottenere eleganti visualizzazioni dei dati, spesso ottenuti tramite dplyr, con grafici di qualunque tipo (istogrammi,boxplot, scatterplot, grafici a barre, serie storiche ecc.)
  • caret: contiene funzioni per creare modelli di machine learning relativi a problemi complessi di regressione o classificazione. Le principali funzioni sono train che crea proprio il modello, createDataPartition che suddivide i dati in un training ed in un testing set, confusionMatrix che crea la matrice di confusione e fornisce fondamentali informazioni nei problemi di classificazione quali Accuracy, Sensitivity, Specificity ecc.
  • h2o: l' H2OAutoML-class di questa libreria è in grado di trovare il migliore algoritmo di machine learning per minimizzare gli errori nei problemi di regressione e ottenere l'Accuracy,l'AUC ecc maggiori nei problemi di classificazione.

I principali algoritmi di machine learning utilizzati nei reports sono :