Il corso intende fornire gli strumenti per l'analisi di grandi moli di dati (audio, video, testo) generati dagli odierni sistemi di informazione e comunicazione, e dai relativi servizi offerti.
Competenze derivanti da settori di computer science, statistica e ottimizzazione saranno introdotti per fornire i mezzi atti a comprendere, disegnare e implementare metodi che consentano di gestire complesse moli di dati, e trasformarle in informazione utile e semanticamente rilevante.
A tale scopo sono introdotti principi avanzati di teoria dell'informazione (sparse coding, compressive sensing, random matrices) principi di inferenza statistica, metodologie di clusterizzazione dei dati osservati, predizione analitica, e principi di ottimizzazione vincolata tramite elementi di teoria dei giochi.
Competenze derivanti da settori di computer science, statistica e ottimizzazione saranno introdotti per fornire i mezzi atti a comprendere, disegnare e implementare metodi che consentano di gestire complesse moli di dati, e trasformarle in informazione utile e semanticamente rilevante.
A tale scopo sono introdotti principi avanzati di teoria dell'informazione (sparse coding, compressive sensing, random matrices) principi di inferenza statistica, metodologie di clusterizzazione dei dati osservati, predizione analitica, e principi di ottimizzazione vincolata tramite elementi di teoria dei giochi.
scheda docente materiale didattico
inference and statistical hypothesis testing
regression
Machine Learning
classification (supervised learning)
decision trees, random forests, naïve Bayes, linear discriminant analysis, k-nearest neighbor, support vector machines
clustering (unsupervised learning)
k-means clustering
hierarchical clustering
data modeling
principal component analysis, indipendent component analysis, outlier detection and data cleansing, hidden Markov models
deep learning & CNN
Processing
parallel processing
examples in Matlab & Python
Data analytics in business applications
Students' presentations
G. James, D. Witten, T. Hastie, R. Tibshirani, "An Introduction to Statistical Learning"
K. P. Murphy, "Machine Learning - A Probabilistic Perspective"
S. Theodoridis and K. Koutroumbas, "Pattern Recognition"
T. A. Runkler, "Data Analytics - Models and Algorithms for Intelligent Data Analysis"
I. Goodfellow, Y. Bengio, A. Courville, "Deep Learning"
Materiale didattico ulteriore fornito dal docente
Programma
Statisticsinference and statistical hypothesis testing
regression
Machine Learning
classification (supervised learning)
decision trees, random forests, naïve Bayes, linear discriminant analysis, k-nearest neighbor, support vector machines
clustering (unsupervised learning)
k-means clustering
hierarchical clustering
data modeling
principal component analysis, indipendent component analysis, outlier detection and data cleansing, hidden Markov models
deep learning & CNN
Processing
parallel processing
examples in Matlab & Python
Data analytics in business applications
Students' presentations
Testi Adottati
S. Nolan and T. Heinzen, "Statistics for the Behavioral Sciences"G. James, D. Witten, T. Hastie, R. Tibshirani, "An Introduction to Statistical Learning"
K. P. Murphy, "Machine Learning - A Probabilistic Perspective"
S. Theodoridis and K. Koutroumbas, "Pattern Recognition"
T. A. Runkler, "Data Analytics - Models and Algorithms for Intelligent Data Analysis"
I. Goodfellow, Y. Bengio, A. Courville, "Deep Learning"
Materiale didattico ulteriore fornito dal docente
Bibliografia Di Riferimento
Choudhary, K., DeCost, B., Chen, C. et al. Recent advances and applications of deep learning methods in materials science. npj Comput Mater 8, 59 (2022). Malhotra, R., Singh, P. Recent advances in deep learning models: a systematic literature review. Multimed Tools Appl (2023).Modalità Erogazione
Lezioni in aula, esercitazioni, presentazioni assegnateModalità Frequenza
Frequenza non obbligatoria ma caldamente consigliataModalità Valutazione
Discussione orale, presentazione tematica assegnata dal docente