Il corso fornirà agli studenti una panoramica sulle principali tecniche di bioinformatica per l’analisi proteomica, genomica e trascrittomica. Allo studente saranno altresì trasmesse le competenze per l’utilizzo consapevole dei principali strumenti di analisi.
Modulo e/o Codocenza | Docente | CFU |
---|---|---|
BIG DATA | Pietro Hiram Guzzi | 5 |
BIG DATA | Chiara Zucco | 1 |
Scuola di Farmacia e Nutraceutica - Data stampa: 08/11/2024
Lo studente a fine corso saprà impostare un esperimento in silico di analisi di dati proteomici, genomici, trascrittomici, etc., discernendo, in modalità problem solving, il giusto approccio a seconda del problema e del contesto. Come side-effects si auspica che lo studente possa realizzare delle pipeline di analisi autonome a partire dalle competenze acquisite.
1) Elementi di Informatica e statistica essenziale (8 ore):
a) Elementi di architettura dei calcolatori, hw, sw di base e sw applicativo (anche reti e cloud)
b) Algoritmi; potenza di calcolo e efficienza degli algoritmi
c) Elementi di probabilità e statistica (Media, Mediana, Probabilità a priori e a posteriori, Teorema di Bayes, Verosimiglianza)
2) Organizzazione e gestione dei dati (8 ore):
a) Data base e DBMS: (Struttura dei DB, DB relazionali, progettazione e inserimento dati, metodologie di accesso e interrogazione)
b) Banche dati genomiche e proteomiche i) GenBank - ENA – DDBJ ((INSDC)): formato entry file, inserimento sequenze, ricerca sequenze
ii) Genome browsers: ENSEMBL, UCSC iii) UniprotKB (Swiss-Prot, TrEMBL)
iv) Esercitazioni: accesso e ricerca incrociata di sequenze e dati
3) L’analisi dei dati (20 ore): a) Confronto di sequenze (10 ore)
i) Allineamento (locale o globale): definizioni; allineamento ottimo, punteggi di allineamento, Matrici di sostituzione ii) Algoritmi di allineamento: programmazione dinamica, algoritmi euristici (BLAST, FASTA)
iii) Esercitazioni: ricerche per similarità in banche dati
b) Filogenie e predizioni di patterns (10 ore)
4) La bioinformatica strutturale (12 ore):
a) Predizione di strutture secondarie
i) Metodi statistico-probabilistici (Chou e Fasman, GOR) ii) Metodi basati su intelligenza artificiale (reti neurali, HMM)
b) Predizione di strutture terziarie: i) Approcci template-based
ii) Approcci template-free
c) Interazioni proteina-ligandi:
i) Docking
ii) Computer-assisted drug design
Il tempo stimato è di 150 ore ore, di cui 48 di attività frontali e 102 di studio individuale.
Il corso sarà organizzato in Lezioni frontali, simulazione casi, problem solving, esercitazioni.
Libri di testo
Pascarella Paiardini, Bioinformatica, Zanichelli
Ulteriori letture consigliate per approfondimento
Siti web delle societa’ di bioinformatica.
Altro materiale didattico
(es. diapositive o dispense scaricabili dal sito)
Saranno fornite agli studenti le slide del corso sulla piattaforma di e learning.
Ricevimento studenti.
Le modalità sono indicate dal Regolamento didattico d’Ateneo.
Le modalità generali sono indicate nel regolamento didattico di Ateneo all’art.22 consultabile al link http://www.unicz.it/pdf/regolamento_didattico_ateneo_dr681.pdf
Durante il corso sarà svolto un esame in itinere in forma scritta
L’esame finale sarà svolto in forma scritta, con un test a risposta multipla composto da 15 domande, 2 punti a risposta corretta, l’esame sarà superato con un voto maggiore uguale a 18 (9 domande corrette).