Intelligenza artificiale/Apprendimento supervisionato

L'Apprendimento supervisionato è una tecnica di apprendimento automatico che mira a istruire un sistema informatico in modo da consentirgli di risolvere dei compiti in automatico.

Si definiscono i dati in ingresso come insieme I, (tipicamente vettori)
Si definisce l'insieme dei dati in uscita come insieme O (gli output possono essere valori continui (regressione), o una etichetta numerica
Si definisce una funzione h che associa ad ogni dato in ingresso (I) la sua risposta corretta (O)

Tutti gli algoritmi di apprendimento supervisionato partono dal presupposto che se forniamo all'algoritmo un numero adeguato di esempi l'algoritmo sarà in grado di creare una funzione h1 che approssimerà la funzione h. Se l'approssimazione di h risulterà adeguata quando proporremo ad h1 dei dati in ingresso mai analizzati la funzione dovrebbe essere in grado di fornire delle risposte in uscita simili a quelle fornite da h e quindi corrette o quasi. Molti di questi algoritmi in sostanza lavorano in un mondo lineare, presupponendo che a ingressi simili necessitino di uscite simili. Nel nostro mondo questo in generale non è vero, basta vedere le dinamiche caotiche legate al tempo, ma esistono molte condizioni in cui questa semplificazione è accettabile. Si può facilmente intuire che il buon funzionamento di questi algoritmi dipende in modo significativo dai dati in ingresso; se si forniscono pochi ingressi l'algoritmo potrebbe non aver abbastanza esperienza, mentre molti dati in ingresso potrebbero rendere eccessivamente lento l'algoritmo, dato che la funzione h1 generata dagli ingressi potrebbe essere molto complicata. Questi algoritmi sono molto sensibili al rumore, anche pochi dati errati potrebbero rendere l'intero sistema non affidabile e condurlo a decisioni errate. Tradizionalmente i principali algoritmi sono stati: