BIOINFORMATICA

Il gruppo di bioinformatica dell’INGM si concentra sull’analisi, lo sviluppo, l’ottimizzazione e l’applicazione di strumenti per l’elaborazione di dati biologici e genomici generati dai ricercatori dell’Istituto e dai loro collaboratori. La facility opera a stretto contatto con i gruppi di ricerca, offrendo supporto per analisi bioinformatiche standard e personalizzate, contribuendo così alla ricerca di base e traslazionale. Il gruppo garantisce inoltre l’accesso a metodologie analitiche sempre aggiornate, favorendo l’adozione di approcci innovativi.
Il team lavora in un open space condiviso con bioinformatici, studenti e dottorandi afferenti ai vari laboratori, favorendo lo scambio di competenze e la collaborazione interdisciplinare.
Le competenze del gruppo spaziano dalla biologia alla biologia dei sistemi, dall’informatica alla biostatistica. Questa trasversalità consente una visione integrata e contestualizzata dei dati biologici, con un’attenzione costante alle loro implicazioni biomediche e cliniche.
Il supporto del personale dei Sistemi Informativi garantisce un accesso continuo alle infrastrutture di calcolo ad alte prestazioni (HPC) e alla connettività dell’Istituto, fondamentali per le attività del gruppo.

Attività, tecnologie e metodologie

Analisi dati NGS (Next generation sequencing): analisi di RNA-seq, ChIP-seq, ATAC-seq, RADICL-seq, SAMMY-seq e tecniche basate su conformazione della cromatina (C-technologies, 4C-seq, HiC). L’intero workflow di analisi, dalla gestione dei dati grezzi all’interpretazione biologica, è coperto in modo completo.
Analisi di dati a singola cellula: Utilizzo delle tecnologie 10X Genomics e Smart-seq-based in una varietà di applicazioni. Integrazione di approcci multi-omici come VDJ-seq, feature barcoding, ATAC-seq, studio degli elementi trasponibili e LIBRA-seq. Ricostruzione trascrittomica e integrazione dei dati mediante gli ecosistemi Seurat e Scanpy.
Analisi di dati long-read sequencing (Oxford Nanopore Technologies): trascrittomica bulk e single cell, metilazione del DNA. Gestione completa, dal basecalling all’allineamento genomico e alle analisi successive. Sviluppo di pipeline personalizzate per analisi bulk e single-cell, inclusa la quantificazione di geni/trascritti, ricostruzione del trascrittoma e chiamata di modifiche.
Analisi di dati multiplexed tissue imaging (MACSima Technology): quantificazione precisa dell’intensità di fluorescenza (MFI) ad etichettatura automatica delle popolazioni cellulari. Segmentazione in modo efficiente di regioni istologiche, identificazione di strutture e contesti tissutali complessi. Analisi delle vicinanze cellulari e valutazione topologica per permettere una caratterizzazione spaziale dettagliata del microambiente.
Analisi funzionali per la contestualizzazione biologica: comprendono test di arricchimento per Gene Ontology (GO), Gene Set Enrichment Analysis (GSEA), analisi di co-espressione (WGCNA), Gene Regulatory Network (GRN). Integrazione con database di interazione o previsione (es. GRID, MINT, miRBase, TargetScan) per un’analisi funzionale approfondita.
Collaborazione e soluzioni personalizzate: Collaborazione attiva con i gruppi di ricerca per lo sviluppo di soluzioni su misura, adattando pipeline esistenti o creando nuovi flussi analitici per affrontare specifiche esigenze progettuali.
Formazione interna dei nuovi tesisti, borsisti e tirocinanti destinati alle attività analitiche di bioinformatica

Team

Unit Coordinator

Prof. Beatrice Bodega, PhD

Staffing

Nome / Name	Ruolo / Role	Email
Valeria Ranzani, PhD	Researcher	ranzani@ingm.org
Eugenia Galeota, PhD	Researcher	galeota@ingm.org
Andrea Gobbini	Researcher	gobbini@ingm.org
Alberto Carignano	Researcher	carignano@ingm.org

Affiliated members

Nome / Name	Ruolo / Role	Aff.ted Lab	email
Riccardo Nodari	Researcher	De Francesco	nodari@ingm.org
Francesco Panariello	Post Doc	Bodega	panariello@ingm.org
Mattia Battistella	Post Doc	Cattaneo	battistella@ingm.org
Simone Maestri	Post Doc	Cattaneo	maestri@ingm.org
Ivan Ferrari	Post Doc	Biffo	ferrari@ingm.org
Michele Panepuccia	PhD student	Bodega	panepuccia@ingm.org
Alen Stambolliu	PhDstudent	Bodega	stambolliu@ingm.org
Camilla Righetti	PhD student	Geginat	righetti@ingm.org
Marinicla Pascale	Predoctoral Fellow	Lanzuolo	pascale@ingm.org
Amanda Bianchi	Predoctoral Fellow	Bodega	abianchi@ingm.org
Marco Cominelli	Predoctoral Fellow	Bodega	cominelli@ingm.org
Francesca Conti	Predoctoral Fellow	Bodega	conti@ingm.org
Elisa Arsuffi	Predoctoral Fellow	Biffo	arsuffi@ingm.org
Christian dall'Ava	Predoctoral Fellow	Cattaneo	dallava@ingm.org
Francesco Giuseppe Tagliabue	Master Student	Cattaneo	tagliabue@ingm.org
Andrine Risoy	Master Student	Cattaneo	risoy@ingm.org
Davide Sandrelli	Master Student	Bodega	sandrelli@ingm.org
John Villis	Master Student	Bodega	villis@ingm.org
Behrad Kashefi	Master Student	Biffo	kashefi@ingm.org

Past members

For past members of the bioinformatics unit and their current affiliation (if available) see at the bottom of the page.

Tools e Software sviluppati internamente

CIA (Cluster Independent Annotation) è uno strumento computazionale per l’analisi di dati single-cell RNA-seq (scRNA-seq) che consente l’identificazione accurata delle popolazioni cellulari in base a firme trascrizionali predefinite. CIA offre un approccio intuitivo, veloce e riproducibile per l’annotazione funzionale delle cellule singole PyPI | GitHub
IRescue è un tool che permette di quantificare l’espressione delle subfamiglie di elementi trasponibili (TE) nei dati di RNA sequencing a singola cellula (scRNA-seq), eseguendo la deduplicazione degli UMI con correzione degli errori di sequenziamento (per librerie 10X o UMI-based) oppure la quantificazione delle read (per librerie senza UMI, ad esempio SMART-seq), seguita dall’assegnazione probabilistica delle letture multi-mapping tramite una procedura di Expectation-Maximization (EM). GitHub
TEcount TEcount è un pacchetto che permette di quantificare gli elementi trasponibili (TE) in esperimenti di RNA-seq bulk a livello di sottofamiglie, famiglie e classi. GitHub
OligoMiner è una webapp per il design di oligo-probe contro qualsiasi target genomico e adatatte all’impiego basate su ibridazione (i.e. FISH). Website
CombiROC è una applicazione web per la generazione e l’analisi interattiva di curve ROC di pannelli di marcatori multipli. Website
combiroc (R-package) è un pacchetto R che rappresenta una nuova implementazione del metodo CombiROC. Introduce funzioni di selezione automatica e ottimizzazione delle gene signatures anche in un contesto di single-cell RNA sequencing. (GitHub) (CRAN)
myVCF è una applicazione desktop per la gestione delle mutazione da profili high-throughput da progetti di sequenziamento che generino file VCF. Essa permette all’utente privo di conoscenze bioinformatiche di esplorare, interrogare, visualizzare ed esportare dati mutazionali in modo semplice e diretto. Documentation
miRiadne (applicazione non più disponibile) è una applicazione web per la ri-annotazione di liste o datasets di microRNA. Annotazioni obsolete (dovute a versione non aggiornate del miRbase o delle piattaforme di profiling) possono essere convertite in annotazioni aggiornate. L’applicazione web è stata dismessa e il progetto non è attualmente manutenuto (per ogni richiesta si prega di contattare gli autori originali della pubblicazione)

I bioinformatici di INGM possono contare su un cluster ad alte prestazioni (HPC) con più di 400 cpu (AMD Opteron), 1.5 TB di memoria RAM e circa 100 TB di spazio disco. La struttura è stata organizzata e viene manutenuta dal personale dei Sistemi Informativi in collaborazione con i bioinformatici. L’infrastruttura è collegata da connettività ad altissima velocità ed è equipaggiata con sistemi di sicurezza e di backup per la protezione dei dati prodotti

Pubblicazioni

IRescue: uncertainty-aware quantification of transposable elements expression at single cell level
Polimeni B, Marasca F, Ranzani V, Bodega B
Nucleic Acids Research, (2024)
[preprint] CIA: Unveiling Cellular Identities with Cluster-Independent Annotation in Single-Cell RNA Sequencing Data for Comprehensive Cell Type Characterization and Exploration
Ferrari, Battistella, Vincenti, Gobbini, Marini, Notarbartolo, Costanza, Biffo, Grifantini, Abrigani, Galeota
bioRxiv 2023.11.30.569382 (2023)
[preprint] Combinatorial selection of biomarkers to optimize gene signatures in diagnostics and single cell applications
Ferrari I, Mazzara S, Abrignani S, Grifantini R, Bombaci M, Rossi R.L.
bioRxiv 2022.01.17.476603 (2022)
Novel interferon-sensitive genes unveiled by correlation-driven gene selection and systems biology
Cheroni C, Manganaro L, Donnici L, Bevilacqua V, Bonnal RJP, Rossi RL, De Francesco R.
Scientific Reports 11, 18043 (2021)
OligoMinerApp: a web-server application for the design of genome-scale oligonucleotide in situ hybridization probes through the flexible OligoMiner environment
Passaro M, Martinovic M, Bevilacqua V, Hershberg EA, Rossetti G, Beliveau BJ, Bonnal RJP, Pagani M.
Nucleic Acids Research, Volume 48, Issue W1, 02 July 2020, Pages W332–W339
Computation and Selection of Optimal Biomarker Combinations by Integrative ROC Analysis Using CombiROC
Bombaci M, Rossi RL.
In: Brun V., Couté Y. (eds) Proteomics for Biomarker Discovery. Methods in Molecular Biology, vol 1959. Humana Press, New York, NY. (2019)
Big Data: Challenge and Opportunity for Translational and Industrial Research
Rossi RL, Grifantini RM.
Front. Digit. Humanit. 5:13 (2018)
myVCF: a desktop application for high-throughput mutations data management
Pietrelli A, Valenti L.
Bioinformatics btx475 (2017)
CombiROC: an interactive web tool for selecting accurate marker combinations of omics data
Mazzara S, Rossi RL, Grifantini R, Donizetti S, Abrignani S, Bombaci M.
Sci Rep (2017) 7:45477
Normalization of circulating microRNA expression data obtained by quantitative real-time RT-PCR
Marabita F, de Candia P, Torri A, Tegnér J, Abrignani S, Rossi RL.
Brief Bioinform (2016) 17:204-12
miRiadne: a web tool for consistent integration of miRNA nomenclature
Bonnal RJ., Rossi RL., Carpi D., Ranzani V., Abrignani S., Pagani M.
Nucleic Acids Res (2015) 43:W487-92

Past members

Nome / Name	Current address (if available)
Vittoria Bocchi, PhD	Memorial Sloan Kettering Cancer Center, NY
Raoul J.P. Bonnal	IFOM, Milan
Donatella Carpi, PhD	European Commission - JRC, Ispra
Cristina Cheroni, PhD	Human Technopole, Milan
Francesca Clemente, PhD	CAAD, Univ. Piemonte Orientale, Novara
Jole Costanza, PhD	Nerviano Medical Sciences
Gianluca Damaggio	Humanitas, Milano
Emanuele Di Patrizio Soldateschi	IFOM, Milano
Raffaele Ianuzzi	Human Technopole, Milano
Tiziana Lischetti, Phd	European Commission, Ispra
Saveria Mazzara, PhD	Bocconi University, Milan
Alessio Murgia, PhD	Institute for Research in Biomedicine (IRB), Bellinzona
Maria Rosaria Nucera	Murdoch Children's Research Institute (MCRI), Parkville
Ilaria Looser
Jessica Ongaro	Ospedale Policlinico di Milano
Alessandro Pietrelli, PhD	Novartis, Milan
Annarita Putignano	Humanitas, Milano
Giulia Protti	Genentech, Los Angeles
Marco Ricercato
Riccardo Rossi	IFOM, Milano
Ilaria Rossoni	Istituto di Ricerche Farmacologiche Mario Negri, Milano
Lorenzo Salviati	Human Technopole, Milano
Shruti Sinha	Al Jalila Children's Specialty Hospital, Dubai

BIOINFORMATICA

Attività, tecnologie e metodologie

Team

Unit Coordinator

Staffing

Affiliated members

Past members

Tools e Software sviluppati internamente

Pubblicazioni

Past members

INGM RESEARCH IS SUPPORTED BY

NEWS

CONTATTI

AMMINISTRAZIONE TRASPARENTE

BANDI DI GARA