DATA ANALYSIS TECHNIQUES FOR NUCLEAR AND PARTICLE PHYSICS

Anno accademico 2023/2024 - Docente: Gioacchino ANASTASI

Risultati di apprendimento attesi

Il corso si propone di introdurre alla materia dell’analisi dati per un esperimento di fisica nucleare e delle particelle elementari, sia dal punto di vista della programmazione che dal punto di vista dei metodi statistici da utilizzare. Lo/La studente/essa acquisirà la capacità di sviluppare dei codici per l’analisi dei dati, utilizzando la programmazione orientata agli oggetti e i principali strumenti del software ROOT.  Inoltre imparerà ad interpretare in modo critico le problematiche di analisi e programmazione grazie alle esercitazioni svolte in aula. Sarà sviluppata la capacità di comunicare quanto appreso grazie alla risoluzione della prova pratica d'esame di programmazione e analisi nonché alla discussione deli argomenti appresi durante le lezioni frontali. Verrà infine stimolata la capacità di proseguire autonomamente lo studio incoraggiando gli studenti e le studentesse a sviluppare codici di analisi da utilizzare successivamente durante il lavoro di preparazione della tesi di laurea.

In riferimento in particolare ai Descrittori di Dublino, questo corso intende potenziare:
- Conoscenza e capacità di comprensione:
Comprensione della programmazione orientata agli oggetti. Conoscenza dei principali strumenti e applicazioni del software di analisi ROOT. Conoscenza delle principali tecniche di analisi statistica dei dati e dei relativi test d'ipotesi.
Capacità di applicare conoscenza e comprensione:
Capacità di sviluppare una analisi dati, sia dal punto di vista degli strumenti di statistica che dal punto di vista della programmazione del codice. Capacità di interpretare e risolvere problematiche ed errori più comuni nella programmazione di un codice di analisi dati in ambiente UNIX.
- Autonomia di giudizio:
Capacità di identificare gli elementi chiave per l’analisi dei dati in un esperimento di fisica nucleare e particellare. Argomentare le scelte per lo sviluppo di un framework di analisi.
Abilità comunicative:
Capacità di descrivere le principali funzionalità di un codice per l'analisi dati e i relativi metodi di implementazione. Uso della corretta terminologia nella presentazione dei risultati di una analisi statistica.
Capacità di apprendimento:
Capacità di approfondire autonomamente lo studio di metodi statistici avanzati per l'analisi dati. Capacità di comprendere autonomamente gli elementi principali di una analisi dati in ricerche all'avanguardia nella fisica nucleare e/o particellare.
----------


Modalità di svolgimento dell'insegnamento

Lezioni frontali di teoria (28 ore) con relative sessioni di esercitazione (30 ore).
----------

Prerequisiti richiesti

(Utili) Conoscenza delle principali tecniche di rivelazione e acquisizione dati utilizzate nella fisica nucleare e delle particelle. Conoscenza della teoria delle interazioni fondamentali nella fisica nucleare e delle particelle, e delle interazioni radiazione-materia.

In riferimento alle materie del corso di laurea, sono utili le conoscenze acquisite durante i corsi di “Nuclear and particle physics laboratory” e “Experimental methods for particle physics” / “Experimental methods for nuclear physics”.

----------

Frequenza lezioni

La frequenza sia delle lezioni frontali che delle sessioni di esercitazione nella loro interezza è fortemente consigliata.
----------

Contenuti del corso

Introduzione all'analisi dati in Fisica Nucleare e delle Particelle
Programmazione orientata ad oggetti
Software ROOT
Funzioni di distribuzione di probabilità e metodo Monte Carlo
Metodi statistici di analisi dati
Sviluppo e analisi dati di un caso fisico reale di interesse in Fisica Nucleare/Fisica delle Particelle
-----
-----

Testi di riferimento

G. Cowan, Statistical data analysis, O.U.P. (1998)
Dispense e appunti forniti durante le lezioni e su Teams.

Programmazione del corso

 ArgomentiRiferimenti testi
1Introduzione all’analisi dati in fisica nucleare e delle alte energie
2Introduzione a sistemi operativi UNIX-based
(Comandi di base. Convenzioni. Input/Output. Permessi. Processi e jobs.)
3Introduzione al C++ (parte I : Variabili e operatori. Input/Output. Array, puntatori e riferimenti. Funzioni.)
4Introduzione al C++ (parte II : Programmazione a oggetti. Ereditarietà. Overloading di operatori. Template class.)
5Il pacchetto di analisi ROOT (parte I
: Introduzione e GUI. Istogrammi. TGraph e TProfile.)
6Il pacchetto di analisi ROOT (parte II : Script e ACLiC. TFile e TTree. Fit di grafici e distribuzioni.)
7Statistica : approccio frequentista e Bayesiana. Variabili casuali. Densità di probabilità e funzioni di distribuzione. Distribuzioni notevoli.
8Introduzione al Metodo Monte Carlo.
9Test d’ipotesi. Goodness-of-fit. Test del chi2. Estimatori. Metodo della massima verosimiglianza. Metodo dei minimi quadrati.
10Intervalli di confidenza. Applicazioni ad estimatori Gaussiani e al metodo della Maximum Likelihood. Limite su un segnale, con e senza fondo, nell’approccio frequentista e Bayesiano.
11Analisi delle componenti principali. Introduzione ed esempi di applicazioni.
12Sviluppo e analisi dati di un caso fisico reale

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

L'esame si divide in:
-) 
una parte pratica, in cui vengono assegnati dei dati sperimentali da analizzare tramite un programma che il/la candidato/a realizza usando le conoscenze maturate durante il corso;
-) una parte orale, in cui si discutono i metodi utilizzati nella prova pratica e i risultati ottenuti, più alcune domande relative agli argomenti trattati a lezione per accertare il livello di conoscenza complessiva acquisita dal/la candidato/a.

Nella valutazione saranno tenute in conto la pertinenza delle risposte, il livello di approfondimento dei contenuti esposti, la capacità di riportare esempi, la proprietà di linguaggio e la chiarezza espositiva.

Le date saranno disponibili sul sito del DFA e sul portale esami.

Esempi di domande e/o esercizi frequenti

Il concetto di ereditarietà in C++
Costruire e usare ROOT TTree & TFile
Fit di una distribuzione usando gli strumenti disponibili in ROOT 
Funzioni di distribuzione di probabilità (di Poisson, binomiale, multinomiale, …)
Metodo Monte Carlo e campionamento di numeri casuali
Estimatori per media e varianza nel metodo di massima verosimiglianza