Automazione dei processi di analisi dati
Descrizione Gruppo di lavoro
Referente: P. Romano, IST, Genova (paolo.romano@istge.it)
Partecipanti: A. Facchiano, CNR, Avellino; E. Rossi, CINECA, Bologna, S. Giuliani, CINECA, Bologna
L'informazione biologica è contraddistinta dall’eterogeneità e distribuzione in rete dei sistemi informativi, nonché dalla notevole quantità di dati prodotti da metodologie e strumentazione highthroughput e gestibili solo tramite software. È quindi necessario sviluppare strumenti software per l’automazione della procedura di recupero e analisi dei dati.
Questi software devono basarsi su modelli dati condivisi e interfacce programmatiche, accessibili cioè direttamente dal software, anziché dai ricercatori.
Si tratta quindi di sviluppare modelli dati basati su XML Schema, archiviare e scambiare i dati utilizzando i linguaggi XML relativi, implementare Web Services per l'accesso alle informazioni e agli strumenti d'analisi, creare e rendere disponibili workflow scientifici in grado di automatizzare le analisi di interesse dei singoli ricercatori.
L’attività del gruppo comprenderà una survey sugli strumenti già disponibili (modelli dati, linguaggi XML, ontologie, Web Services, workflow management systems), lo sviluppo di workflow dimostrativi in ambito oncologico, la redazione di un rapporto sulle potenzialità dell'automazione e sui relativi strumenti e, infine, l’organizzazione di un corso di formazione sulla buona programmazione in bioinformatica.

