20410237 - LABORATORIO DI ANALISI DATI PER SCIENZE BIOLOGICHE

Scopo del corso è fornire agli studenti gli strumenti statistici, matematici e informatici necessari per raccogliere e analizzare dati sperimentali, sintetizzare le informazioni che essi contengono, effettuare confronti e previsioni (inferenza) valutando il rischio di errore.
Le esercitazioni prendono in esame fenomeni di interesse biologico anche prendendo spunto dalla realtà quotidiana.
Le lezioni teoriche (6 cfu) e le esercitazioni pratiche (3 cfu) descrivono:
- i principali strumenti di sintesi statistica: indici, tabelle di frequenza, istogrammi, grafici a disersione (x,y).
- i principi statistici che governano le osservazioni sperimentali e che determinano le incertezze associate alle misure e al trattamento dei dati.
- le nozioni di base sul calcolo delle probabilità e sulle funzioni di distribuzione modello: binomiale, poisson, uniforme, gauss.
- l’impiego dei "test di reiezione delle ipotesi" come strumento per l'interpretazione e il confronto di risultati sperimentali.
- l’impiego del teorema di bayes, in particolare nei test diagnostici.
Obiettivo del corso e’ fornire le seguenti abilita’:
- utilizzare i metodi della sintesi statistica per sintetizzare le informazioni quantitative contenute in un set di dati sperimentali;
- valutare l’incertezza nelle misure dirette e indirette e stimare un intervallo di confidenza;
- valutare i risultati ottenuti usando test statistici appropriati;
- effettuare previsioni sulle cause di un fenomeno (teorema di bayes) valutandone la probabilità
Le attività prevedono l’uso approfondito di programmi di base (fogli elettronici) per il calcolo statistico e l'elaborazione di dati sperimentali.
scheda docente | materiale didattico

Programma

Programma dell'insegnamento
Il corso si propone di fornire allo studente le conoscenze di base (Competenze culturali) e gli strumenti (competenze metodologiche) statistici, matematici e informatici necessari per:
- condurre un esperimento,
- trattare, elaborare e sintetizzare dati sperimentali,
- valutare l'incertezza e intervalli di confidenza dei risultati di un'osservazione,
- valutare i parametri statistici di una popolazione a partire da un campione (inferenza),
- confrontare quantitativamente dati e modelli mediante test di reiezione delle ipotesi.

Programma dettagliato
1. Strumenti di un foglio elettronico (EXCEL, CALC) per la sintesi e la presentazione di dati sperimentali e il calcolo statistico.
a. costruzione di tabelle,
b. funzioni, funzioni in forma di matrice,
c. istogrammi e diagrammi a Barre,
d. grafici a dispersione.
2. Sintesi statistica:
a. i principali indici statistici per un set di dati anche in forma aggregata,
b. distribuzioni di frequenza per un set di dati,
c. istogrammi di frequenze,
d. presentare la relazione tra grandezze usando grafici a dispersione,
e. valutare la relazione lineare tra grandezze valutandone la correlazione e/o i parametri della regressione lineare.
3. Calcolo delle probabilità:
a. definizioni di probabilità di un evento e simbolismo per il calcolo delle probabilità,
b. eventi dipendenti/indipendenti, compatibili/incompatibili,
c. probabilità di eventi: and, or e probabilità condizionate,
d. teorema di Bayes,
e. distribuzioni di probabilità modello (binomiale, uniforme, Gauss).
4. Valutazione delle incertezze sperimentali
a. l’incertezza su grandezze sperimentali (dati, frequenze degli istogrammi, etc..)
b. incertezze sui parametri di rette di regressione,
c. l’incertezza sulla correlazione lineare
d. valutare le incertezze di misura su grandezze derivate
5. Inferenza statistica
a. Calcolare e interpretare gli intervalli di confidenza per: valori medi, distribuzioni, correlazione lineare, parametri della regressione lineare,
b. test di reiezione delle ipotesi (Z, T, e chi^2),
c. test chi^2 per tabelle di contingenza o distribuzioni,
d. Calcolare un p-value per un test di ipotesi,
e. Costruire e/o interpretare correttamente un test di screening (teorema di Bayes)


Testi Adottati

M. C. WHITLOCK, D. SCHLUTER - ANALISI STATISTICA DEI DATI BIOLOGICI, ZANICHELLI.

IL TESTO È INTEGRATO CON LE NOTE E GLI ESERCIZI DISPONIBILI SULLA PIATTAFORMA MOODLE e SUI SITI WEB:

https://sites.google.com/a/personale.uniroma3.it/meneghini-did/statistica

Bibliografia Di Riferimento

.

Modalità Erogazione

Il corso si svolgerà con lezioni frontali e con esercitazioni pratiche con l'ausilio di PC e di programmi specifici per la sintesi e l'analisi dei dati sperimentali (Excel, Calc, Gnuplot) Le lezioni potranno essere svolte in modalità remota sulle piattaforme TEAMS e MOODLE.

Modalità Frequenza

Fatti savo i casi previsti dai regolamenti di Ateneo, la frequenza al corso è obbligatoria in presenza per gli studenti in corso. Alcune attività sono disponibili solo a che frequenta con regolarità il Corso. Alcune prove di valutazione e appelli potranno essere disponibili solo per gli studenti frequentanti con regolarità. A seguito dell'autorizzazione del Collegio Didattico il docente mete a disposizione lezioni in streaming e registrate per quegli argomenti e procedure più difficili da memorizzare e da seguire (algoritmi, procedure etc...).

Modalità Valutazione

La prova pratica consiste in un test a risposta multipla e in una prova di elaborazione e interpretazione di dati sperimentali. La prova di elaborazione dei dati può essere presentata in forma di Tesina (solo la sessione Estiva) Le prove potranno essere svolte in presenza e/o a distanza Non sono effettuate prove in itinere.