Il corso ha l’obiettivo di introdurre i principi fondamentali dello statistical learning per l’analisi dei dati, con particolare attenzione ai problemi di regressione e classificazione in contesti supervisionati. Al termine del corso, lo studente sarà in grado di comprendere i principali modelli statistici per l’analisi predittiva; valutare e selezionare modelli attraverso criteri statistici e metodi di validazione; interpretare i risultati dei modelli e valutarne le prestazioni; utilizzare il software R (e RStudio) per implementare analisi di base di statistical learning. Il corso privilegia un approccio applicativo, con esempi pratici su dati reali.
scheda docente materiale didattico
• Introduzione ai principali modelli di statistical learning (apprendimento statistico);
• problemi di previsione e classificazione: richiami su regressione lineare e sui principali metodi di classificazione non supervisionata;
• Supervised classification: K-Nearest-Neighbours;
• Errore di misclassificazione;
• Metodi di ricampionamento: cross validation e bootstrap;
• Metodi basati su alberi decisionali: regression trees, classification trees, bagging, random forests, boosting.
• Introduzione ai metodi di classificazione Semi-supervisionata;
• Uso dell’ambiente statistico R
Programma
Il corso affronterà le seguenti tematiche:• Introduzione ai principali modelli di statistical learning (apprendimento statistico);
• problemi di previsione e classificazione: richiami su regressione lineare e sui principali metodi di classificazione non supervisionata;
• Supervised classification: K-Nearest-Neighbours;
• Errore di misclassificazione;
• Metodi di ricampionamento: cross validation e bootstrap;
• Metodi basati su alberi decisionali: regression trees, classification trees, bagging, random forests, boosting.
• Introduzione ai metodi di classificazione Semi-supervisionata;
• Uso dell’ambiente statistico R
Testi Adottati
James, G., Witten, D., Hastie, T., Tibshirani, R. (2021). Introduzione all'apprendimento statistico. Con applicazioni in R. Springer.Modalità Valutazione
Esame orale. Durante il corso si svolgeranno due prove intermedie.