20810341 - SIGNAL PROCESSING FOR BIG DATA ANALYTICS

Il corso intende fornire gli strumenti per l'analisi di grandi moli di dati (audio, video, testo) generati dagli odierni sistemi di informazione e comunicazione, e dai relativi servizi offerti.
Competenze derivanti da settori di computer science, statistica e ottimizzazione saranno introdotti per fornire i mezzi atti a comprendere, disegnare e implementare metodi che consentano di gestire complesse moli di dati, e trasformarle in informazione utile e semanticamente rilevante.
A tale scopo sono introdotti principi avanzati di teoria dell'informazione (sparse coding, compressive sensing, random matrices) principi di inferenza statistica, metodologie di clusterizzazione dei dati osservati, predizione analitica, e principi di ottimizzazione vincolata tramite elementi di teoria dei giochi.
scheda docente | materiale didattico

Programma

Statistics
inference and statistical hypothesis testing
regression
Machine Learning
classification (supervised learning)
decision trees, random forests, naïve Bayes, linear discriminant analysis, k-nearest neighbor, support vector machines
clustering (unsupervised learning)
k-means clustering
hierarchical clustering
data modeling
principal component analysis, indipendent component analysis, outlier detection and data cleansing, hidden Markov models
deep learning & CNN
Processing
parallel processing
examples in Matlab & Python
Data analytics in business applications
Students' presentations


Testi Adottati

S. Nolan and T. Heinzen, "Statistics for the Behavioral Sciences"
G. James, D. Witten, T. Hastie, R. Tibshirani, "An Introduction to Statistical Learning"
K. P. Murphy, "Machine Learning - A Probabilistic Perspective"
S. Theodoridis and K. Koutroumbas, "Pattern Recognition"
T. A. Runkler, "Data Analytics - Models and Algorithms for Intelligent Data Analysis"
I. Goodfellow, Y. Bengio, A. Courville, "Deep Learning"

Materiale didattico ulteriore fornito dal docente


Bibliografia Di Riferimento

Choudhary, K., DeCost, B., Chen, C. et al. Recent advances and applications of deep learning methods in materials science. npj Comput Mater 8, 59 (2022). Malhotra, R., Singh, P. Recent advances in deep learning models: a systematic literature review. Multimed Tools Appl (2023).

Modalità Erogazione

Lezioni in aula, esercitazioni, presentazioni assegnate

Modalità Frequenza

Frequenza non obbligatoria ma caldamente consigliata

Modalità Valutazione

Discussione orale, presentazione tematica assegnata dal docente