Applicazioni pratiche di machine learning: differenze tra le versioni

Jump to navigation Jump to search
nessun oggetto della modifica
Nessun oggetto della modifica
Nessun oggetto della modifica
{{Applicazioni pratiche di machine learning}}
Questo libro contiene alcuni reports, dove si utilizzano algoritmi di [[w:Apprendimento_automatico|machine learning]] nel linguaggio di programmazione [[w:R (software)|R]], utilizzando l'IDE [[:en:RStudio|RStudio]], per fare previsioni esemplificative su argomenti di utilità generale.
 
Le principali librerie utilizzate nei reports del libro sono le seguenti:
*'''base''': contiene le funzioni di base di R: aritmetiche,input/output, programmazione di base ecc. Questa libreria viene caricata automaticamente all'avvio di R.
*'''stats''': contiene funzioni per calcoli statistici e generazione di numeri casuali. Anche questa libreria viene caricata automaticamente all'avvio di R .
*'''dplyr''': fornisce una grammatica flessibile per manipolare e interrogare i data frames e quindi i dataset. In sostanza è l'equivalente di SQL per realizzare delle query direttamente nei dataset.
*'''ggplot2''': da la possibilità di ottenere eleganti visualizzazioni dei dati, spesso ottenuti tramite dplyr, con grafici di qualunque tipo (istogrammi,boxplot, scatterplot, grafici a barre, serie storiche ecc.)
*'''caret''': contiene funzioni per creare modelli di machine learning relativi a problemi complessi di regressione o classificazione. Le principali funzioni sono ''train'' che crea proprio il modello, ''createDataPartition'' che suddivide i dati in un training ed in un testing set, ''confusionMatrix'' che crea la matrice di confusione e fornisce fondamentali informazioni nei problemi di classificazione quali Accuracy, Sensitivity, Specificity ecc.
*'''h2o''': l' ''H2OAutoML-class'' di questa libreria è in grado di trovare il migliore algoritmo di machine learning per minimizzare gli errori nei problemi di regressione e ottenere l'Accuracy,l'AUC ecc maggiori nei problemi di classificazione.
 
I principali algoritmi di machine learning utilizzati nei reports sono :
*[[w:Foresta casuale|Random Forest]]
*[[w:Regressione lineare|Regressione lineare]]
*[[w:en:Multivariate adaptive regression spline|Bagged Mars]]
*[[w:en:Generalized linear model|Generalized linear model]]
*[[w:Gradient boosting|Gradient boosting]]
 
 
{{Applicazioni pratiche di machine learning}}
 
==Voci correlate==

Menu di navigazione