BIOINFORMATICA

Il focus principale del gruppo di bioinformatici è lo studio, l’applicazione, lo sviluppo e l’ottimizzazione di strumenti per l’analisi dei dati biologici e genomici prodotti dagli scienziati di INGM e dai loro collaboratori. La facility lavora in stretto contatto con i ricercatori dell’Istituto e fornisce accesso ad analisi ed elaborazioni di dati biologici a tutti i gruppi di ricerca. Essa supporta la ricerca di base e traslazionale con analisi di routine per esigenze standard o su misura; inoltre fornisce e facilita l’accesso a metodi analitici nuovi e sempre aggiornati.

Il gruppo lavora in un open space dedicato in stretto contatto con altri bioinformatici, studenti e dottorandi che afferiscono ai vari gruppi di ricerca. Ogni singolo membro del gruppo si dedica completamente a uno specifico progetto e/o lavora in collaborazione su più di un progetto, a seconda delle esigenze di Istituto, del carico di lavoro e delle richieste dei capi laboratorio.

Le nostre conoscenze sono ampie e abbracciano la biologia, la biologia dei sistemi, l’informatica, la biostatistica; la natura trasversale del gruppo ci permette di avere una visione dei dati e del loro contesto biomedico e clinico sempre nuova e di insieme.
Il personale dei Sistemi Informativi assicura al gruppo di bioinformatici l’accesso costante all’infrastruttura di calcolo ad alte prestazioni (HPC) e alla connettività di Istituto.

Attività

  • Supporto per il disegno sperimentale di progetti che prevedono l’utilizzo e/o la genesi di dati, esplorazione di dati, pulizia dei dati.
  • Profilazione a medio ed elevato processamento per l’espressione genica: RTqPCR arrays e microarrays.
  • Analisi NGS (Next generation sequencing): sequenziamenti di RNA, esoma (DNA), panneli genici, ChIPseq.
  • Analisi di RNA non codificanti, microRNA cellulari e circolanti.
  • Analisi multivariatadi dati di trascrittomica, proteomica; selezione e prioritizzazione di biomarcatori; statistica descrittiva e inferenziale.
  • Analisi funzionali per la contestualizzazione biologica, ontologie, metodi per l’analisi dei pathway molecolari ed entità biologiche.
  • Analisi funzionali avanzate: analisi di impatto su pathways, utilizzo delle metriche di network, determinazione di moduli funzionali.
  • Disegno, progettazione e programmazione di applicazioni per la soluzione di problemi computazionali applicati alla biologia e alla genomica.

Team

Unit Coordinator

Prof. Beatrice Bodega, PhD

Staffing

Nome / NameRuolo / RoleEmail
Riccardo L. Rossi, PhDFacility Manager, Research Scientistrossi@ingm.org
Valeria Ranzani, PhDResearch Scientistranzani@ingm.org
Eugenia Galeota, PhDResearch Scientistgaleota@ingm.org
Jole Costanza, PhDResearch Scientistcostanza@ingm.org
Alen StambolliuMaster Studentstambolliu@ingm.org
Isidora BijelovićMaster Studentbijelovic@ingm.org

Affiliated members

Nome / NameRuolo / RoleAff.ted Labemail
Vittoria BocchiPostDocCattaneobocchi@ingm.org
Andrea GobbiniResearcherGrifantinigobbini@ingm.org
Ivan FerrariResearcherBiffoferrari@ingm.org
Benedetto PolimeniPhD studentBodegapolimeni@ingm.org
Lorenzo SalviatiPhD studentBodegasalviati@ingm.org
Emanuele Di Patrizio SoldateschiPhD studentLanzuolosoldateschi@ingm.org
Giulia ProttiPhD studentGranucciprotti@ingm.org
Francesca VincentiResearch fellowAbrignanivincenti@ingm.org
Mattia BattistellaResearch fellowAbrignanibattistella@ingm.org
Francesca ClementeResearch fellowGeginatclemente@ingm.org
Maria NuceraResearch fellowCattaneonucera@ingm.org
Alessio MurgiaResearch fellowCattaneomurgia@ingm.org
Michele PanepucciaResearch fellowBodegapanepuccia@ingm.org
Ilaria Marie Teresa LooserMaster studentBodegalooser@ingm.org
Hadi Eidgah TorghabeheiMaster studentBodegaeidgah@ingm.org
Flavio PassanteMaster studentCattaneopassante@ingm.org

Strumenti

I bioinformatici di INGM possono contare su un cluster ad alte prestazioni (HPC) con più di 300 cpu, 1.5 TB di memoria RAM e circa 100 TB di spazio disco. La struttura è stata organizzata e viene manutenuta dal personale dei Sistemi Informativi in collaborazione con i bioinformatici. L’infrastruttura è collegata da connettività ad altissima velocità ed è equipaggiata con sistemi di sicurezza e di backup per la protezione dei dati prodotti.

Tutti i calcoli e le analisi computazionalmente intensive vengono lanciati sul cluster e gestiti tramite il sistema di code Torque/PBS e una serie di macchine virtuali. Sia il cluster che le macchine virtuali utilizzano come sitema operativo Ubuntu Linux. I task computazionali minori e meno intensivi vengono eseguite anche su workstation (Xeon PCs, Windows OS) e/o laptops (iOS), che sono utilizzati anche come terminali per il cluster.

Applicazioni / Software

  • combiroc (R-package) (GitHub) (CRAN)
    Il pacchetto combiroc è la nuova implementazione del metodo CombiROC. Introduce funzioni di selezione automatica e ottimizzazione delle gene signatures anche in un contesto di single-cell RNA sequencing.
  • CombiROC (http://www.combiroc.eu)
    CombiROC  è una applicazione web per la generazione e l’analisi interattiva di curve ROC di pannelli di marcatori multipli.
  • myVCF (http://myvcf.readthedocs.io/en/latest/)
    myVCF  è una applicazione desktop per la gestione delle mutazione da profili high-throughput da progetti di sequenziamento che generino file VCF. Essa permette all’utente privo di conoscenze bioinformatiche di esplorare, interrogare, visualizzare ed esportare dati mutazionali in modo semplice e diretto.
  • miRiadne (applicazione non più disponibile)
    miRiadne è una applicazione web per la ri-annotazione di liste o datasets di microRNA. Annotazioni obsolete (dovute a versione non aggiornate del miRbase o delle piattaforme di profiling) possono essere convertite in annotazioni aggiornate. L’applicazione web è stata dismessa e il progetto non è attualmente manutenuto (per ogni richiesta si prega di contattare gli autori originali della pubblicazione)

Pubblicazioni

INGM RESEARCH IS SUPPORTED BY