21230041-1 - Elementi di Statistical learning - modulo I

Il corso ha l’obiettivo di introdurre i principi fondamentali dello statistical learning per l’analisi dei dati, con particolare attenzione ai problemi di regressione e classificazione in contesti supervisionati. Al termine del corso, lo studente sarà in grado di comprendere i principali modelli statistici per l’analisi predittiva; valutare e selezionare modelli attraverso criteri statistici e metodi di validazione; interpretare i risultati dei modelli e valutarne le prestazioni; utilizzare il software R (e RStudio) per implementare analisi di base di statistical learning. Il corso privilegia un approccio applicativo, con esempi pratici su dati reali.
scheda docente | materiale didattico

Programma

Il corso affronterà le seguenti tematiche:
• Introduzione ai principali modelli di statistical learning (apprendimento statistico);
• problemi di previsione e classificazione: richiami su regressione lineare e sui principali metodi di classificazione non supervisionata;
• Supervised classification: K-Nearest-Neighbours;
• Errore di misclassificazione;
• Metodi di ricampionamento: cross validation e bootstrap;
• Metodi basati su alberi decisionali: regression trees, classification trees, bagging, random forests, boosting.
• Introduzione ai metodi di classificazione Semi-supervisionata;
• Uso dell’ambiente statistico R


Testi Adottati

James, G., Witten, D., Hastie, T., Tibshirani, R. (2021). Introduzione all'apprendimento statistico. Con applicazioni in R. Springer.




Modalità Valutazione

Esame orale. Durante il corso si svolgeranno due prove intermedie.