BIOINFORMATICA

Il focus principale del gruppo di bioinformatici è lo studio, l’applicazione, lo sviluppo e l’ottimizzazione di strumenti per l’analisi dei dati biologici e genomici prodotti dagli scienziati di INGM e dai loro collaboratori. La facility lavora in stretto contatto con i ricercatori dell’Istituto e fornisce accesso ad analisi ed elaborazioni di dati biologici a tutti i gruppi di ricerca. Essa supporta la ricerca di base e traslazionale con analisi di routine per esigenze standard o su misura; inoltre fornisce e facilita l’accesso a metodi analitici nuovi e sempre aggiornati.

Il gruppo lavora in un open space dedicato in stretto contatto con altri bioinformatici, studenti e dottorandi che afferiscono ai vari gruppi di ricerca. Ogni singolo membro del gruppo si dedica completamente a uno specifico progetto e/o lavora in collaborazione su più di un progetto, a seconda delle esigenze di Istituto, del carico di lavoro e delle richieste dei capi laboratorio.

Le nostre conoscenze sono ampie e abbracciano la biologia, la biologia dei sistemi, l’informatica, la biostatistica; la natura trasversale del gruppo ci permette di avere una visione dei dati e del loro contesto biomedico e clinico sempre nuova e di insieme.
Il personale dei Sistemi Informativi assicura al gruppo di bioinformatici l’accesso costante all’infrastruttura di calcolo ad alte prestazioni (HPC) e alla connettività di Istituto.

Attività

  • Supporto per il disegno sperimentale di progetti che prevedono l’utilizzo e/o la genesi di dati, esplorazione di dati, pulizia dei dati.
  • Profilazione a medio ed elevato processamento per l’espressione genica: RTqPCR arrays e microarrays.
  • Analisi NGS (Next generation sequencing): sequenziamenti di RNA, esoma (DNA), panneli genici, ChIPseq.
  • Analisi di RNA non codificanti, microRNA cellulari e circolanti.
  • Analisi multivariatadi dati di trascrittomica, proteomica; selezione e prioritizzazione di biomarcatori; statistica descrittiva e inferenziale.
  • Analisi funzionali per la contestualizzazione biologica, ontologie, metodi per l’analisi dei pathway molecolari ed entità biologiche.
  • Analisi funzionali avanzate: analisi di impatto su pathways, utilizzo delle metriche di network, determinazione di moduli funzionali.
  • Disegno, progettazione e programmazione di applicazioni per la soluzione di problemi computazionali applicati alla biologia e alla genomica.
  • Formazione interna dei nuovi tesisti, borsisti e tirocinanti destinati alle attività analitiche di bioinformatica
  • Formazione interna in “data literacy” generale e principi di scripting rivolta ai ricercatori dell’istituto

Team

Unit Coordinator

Prof. Beatrice Bodega, PhD

Staffing

Nome / NameRuolo / RoleEmail
Valeria Ranzani, PhDResearch Scientistranzani@ingm.org
Eugenia Galeota, PhDResearch Scientistgaleota@ingm.org

Affiliated members

Nome / NameRuolo / RoleAff.ted Labemail
Andrea GobbiniResearcherGrifantinigobbini@ingm.org
Ivan FerrariResearcherBiffoferrari@ingm.org
Riccardo NodariResearcherDe Francesconodari@ingm.org
Benedetto PolimeniPhD studentBodegapolimeni@ingm.org
Lorenzo SalviatiPhD studentBodegasalviati@ingm.org
Emanuele Di Patrizio SoldateschiPhD studentLanzuolosoldateschi@ingm.org
Mattia BattistellaPhD studentCattaneobattistella@ingm.org
Francesca VincentiResearch fellowAbrignanivincenti@ingm.org
Gialuca DamaggioResearch fellowCattaneogianluca.damaggio@unimi.it
Michele PanepucciaResearch fellowBodegapanepuccia@ingm.org
Isidora BijelovićMaster studentBodegabijelovic@ingm.org
Alen StambolliuMaster studentBodegastambolliu@ingm.org
Carola MiuccioII level Master internManganaromiuccio@ingm.org

Past members

For past members of the bioinformatics unit and their current affiliation (if available) see at the bottom of the page.

Strumenti

I bioinformatici di INGM possono contare su un cluster ad alte prestazioni (HPC) con più di 300 cpu, 1.5 TB di memoria RAM e circa 100 TB di spazio disco. La struttura è stata organizzata e viene manutenuta dal personale dei Sistemi Informativi in collaborazione con i bioinformatici. L’infrastruttura è collegata da connettività ad altissima velocità ed è equipaggiata con sistemi di sicurezza e di backup per la protezione dei dati prodotti.

Tutti i calcoli e le analisi computazionalmente intensive vengono lanciati sul cluster e gestiti tramite il sistema di code Torque/PBS e una serie di macchine virtuali. Sia il cluster che le macchine virtuali utilizzano come sitema operativo Ubuntu Linux. I task computazionali minori e meno intensivi vengono eseguite anche su workstation (Xeon PCs, Windows OS) e/o laptops (iOS), che sono utilizzati anche come terminali per il cluster.

Applicazioni / Software

  • combiroc (R-package) (GitHub) (CRAN)
    Il pacchetto combiroc è la nuova implementazione del metodo CombiROC. Introduce funzioni di selezione automatica e ottimizzazione delle gene signatures anche in un contesto di single-cell RNA sequencing.
  • CombiROC (http://www.combiroc.eu)
    CombiROC  è una applicazione web per la generazione e l’analisi interattiva di curve ROC di pannelli di marcatori multipli.
  • myVCF (http://myvcf.readthedocs.io/en/latest/)
    myVCF  è una applicazione desktop per la gestione delle mutazione da profili high-throughput da progetti di sequenziamento che generino file VCF. Essa permette all’utente privo di conoscenze bioinformatiche di esplorare, interrogare, visualizzare ed esportare dati mutazionali in modo semplice e diretto.
  • miRiadne (applicazione non più disponibile)
    miRiadne è una applicazione web per la ri-annotazione di liste o datasets di microRNA. Annotazioni obsolete (dovute a versione non aggiornate del miRbase o delle piattaforme di profiling) possono essere convertite in annotazioni aggiornate. L’applicazione web è stata dismessa e il progetto non è attualmente manutenuto (per ogni richiesta si prega di contattare gli autori originali della pubblicazione)

Pubblicazioni

Past members

Nome / NameCurrent address (if available)
Francesca Clemente, PhDCAAD, Univ. Piemonte Orientale, Novara
Jole Costanza, PhDNerviano Medical Sciences
Maria Rosaria NuceraMurdoch Children's Research Institute (MCRI), Parkville
Alessio Murgia, PhDInstitute for Research in Biomedicine (IRB), Bellinzona
Ilaria Looser
Jessica OngaroOspedale Policlinico di Milano
Vittoria Bocchi, PhD
Tiziana Lischetti, PhdEuropean Commission, Ispra
Saveria Mazzara, PhDBocconi University, Milan
Cristina Cheroni, PhDHuman Technopole, Milan
Alessandro Pietrelli, PhDNovartis, Milan
Raoul J.P. BonnalIFOM, Milan
Donatella Carpi, PhDEuropean Commission - JRC, Ispra

INGM RESEARCH IS SUPPORTED BY