BIOINFORMATICA
Il gruppo di bioinformatica dell’INGM si concentra sull’analisi, lo sviluppo, l’ottimizzazione e l’applicazione di strumenti per l’elaborazione di dati biologici e genomici generati dai ricercatori dell’Istituto e dai loro collaboratori. La facility opera a stretto contatto con i gruppi di ricerca, offrendo supporto per analisi bioinformatiche standard e personalizzate, contribuendo così alla ricerca di base e traslazionale. Il gruppo garantisce inoltre l’accesso a metodologie analitiche sempre aggiornate, favorendo l’adozione di approcci innovativi.
Il team lavora in un open space condiviso con bioinformatici, studenti e dottorandi afferenti ai vari laboratori, favorendo lo scambio di competenze e la collaborazione interdisciplinare.
Le competenze del gruppo spaziano dalla biologia alla biologia dei sistemi, dall’informatica alla biostatistica. Questa trasversalità consente una visione integrata e contestualizzata dei dati biologici, con un’attenzione costante alle loro implicazioni biomediche e cliniche.
Il supporto del personale dei Sistemi Informativi garantisce un accesso continuo alle infrastrutture di calcolo ad alte prestazioni (HPC) e alla connettività dell’Istituto, fondamentali per le attività del gruppo.
Attività
- Analisi dati NGS (Next generation sequencing): analisi di RNA-seq, ChIP-seq, ATAC-seq, RADICL-seq, SAMMY-seq e tecniche basate su conformazione della cromatina (C-technologies, 4C-seq, HiC). L’intero workflow di analisi, dalla gestione dei dati grezzi all’interpretazione biologica, è coperto in modo completo.
- Analisi di dati a singola cellula: Utilizzo delle tecnologie 10X Genomics e Smart-seq-based in una varietà di applicazioni. Integrazione di approcci multi-omici come VDJ-seq, feature barcoding, ATAC-seq, studio degli elementi trasponibili e LIBRA-seq. Ricostruzione trascrittomica e integrazione dei dati mediante gli ecosistemi Seurat e Scanpy.
- Analisi di dati long-read sequencing (Oxford Nanopore Technologies): trascrittomica bulk e single cell, metilazione del DNA. Gestione completa, dal basecalling all’allineamento genomico e alle analisi successive. Sviluppo di pipeline personalizzate per analisi bulk e single-cell, inclusa la quantificazione di geni/trascritti, ricostruzione del trascrittoma e chiamata di modifiche.
- Analisi di dati multiplexed tissue imaging (MACSima Technology): quantificazione precisa dell’intensità di fluorescenza (MFI) ad etichettatura automatica delle popolazioni cellulari. Segmentazione in modo efficiente di regioni istologiche, identificazione di strutture e contesti tissutali complessi. Analisi delle vicinanze cellulari e valutazione topologica per permettere una caratterizzazione spaziale dettagliata del microambiente.
- Analisi funzionali per la contestualizzazione biologica: comprendono test di arricchimento per Gene Ontology (GO), Gene Set Enrichment Analysis (GSEA), analisi di co-espressione (WGCNA), Gene Regulatory Network (GRN). Integrazione con database di interazione o previsione (es. GRID, MINT, miRBase, TargetScan) per un’analisi funzionale approfondita.
- Collaborazione e soluzioni personalizzate: Collaborazione attiva con i gruppi di ricerca per lo sviluppo di soluzioni su misura, adattando pipeline esistenti o creando nuovi flussi analitici per affrontare specifiche esigenze progettuali.
- Formazione interna dei nuovi tesisti, borsisti e tirocinanti destinati alle attività analitiche di bioinformatica
Team
Unit Coordinator
Prof. Beatrice Bodega, PhD
Staffing
Nome / Name | Ruolo / Role | |
---|---|---|
Valeria Ranzani, PhD | Researcher | ranzani@ingm.org |
Eugenia Galeota, PhD | Researcher | galeota@ingm.org |
Andrea Gobbini | Researcher | gobbini@ingm.org |
Alberto Carignano | Researcher | carignano@ingm.org |
Affiliated members
Nome / Name | Ruolo / Role | Aff.ted Lab | |
---|---|---|---|
Riccardo Nodari | Researcher | De Francesco | nodari@ingm.org |
Benedetto Polimeni | Post Doc | Bodega | polimeni@ingm.org |
Francesco Panariello | Post Doc | Bodega | panariello@ingm.org |
Ivan Ferrari | PhD student | Biffo | ferrari@ingm.org |
Mattia Battistella | PhD student | Cattaneo | battistella@ingm.org |
Michele Panepuccia | PhD student | Bodega | panepuccia@ingm.org |
Alen Stambolliu | PhDstudent | Bodega | stambolliu@ingm.org |
Camilla Righetti | PhD student | Geginat | righetti@ingm.org |
Carmen Faggiano | Research Fellow | Geginat | faggiano@ingm.org |
Mariachiara Palma | Research Fellow | Bodega | palma@ingm.org |
Marinicla Pascale | Research Fellow | Bodega | pascale@ingm.org |
Carola Miuccio | Research Fellow | Manganaro | miuccio@ingm.org |
Marta Morrocchi | Junior Research Fellow | Cattaneo | morrocchi@ingm.org |
Davide Iafolla | Junior Research Fellow | Cattaneo | iafolla@ingm.org |
Amanda Bianchi | Master student | Bodega | abianchi@ingm.org |
Marco Cominelli | Master student | Biffo | cominelli@ingm.org |
Elisa Arsuffi | Master student | Biffo | arsuffi@ingm.org |
Christian dall'Ava | Master student | Cattaneo | dallava@ingm.org |
Past members
For past members of the bioinformatics unit and their current affiliation (if available) see at the bottom of the page.
Tools e Software sviluppati internamente
- CIA (Cluster Independent Annotation) è uno strumento computazionale per l’analisi di dati single-cell RNA-seq (scRNA-seq) che consente l’identificazione accurata delle popolazioni cellulari in base a firme trascrizionali predefinite. CIA offre un approccio intuitivo, veloce e riproducibile per l’annotazione funzionale delle cellule singole PyPI | GitHub
- IRescue è un tool che permette di quantificare l’espressione delle subfamiglie di elementi trasponibili (TE) nei dati di RNA sequencing a singola cellula (scRNA-seq), eseguendo la deduplicazione degli UMI con correzione degli errori di sequenziamento (per librerie 10X o UMI-based) oppure la quantificazione delle read (per librerie senza UMI, ad esempio SMART-seq), seguita dall’assegnazione probabilistica delle letture multi-mapping tramite una procedura di Expectation-Maximization (EM). GitHub
- TEcount TEcount è un pacchetto che permette di quantificare gli elementi trasponibili (TE) in esperimenti di RNA-seq bulk a livello di sottofamiglie, famiglie e classi. GitHub
- OligoMiner è una webapp per il design di oligo-probe contro qualsiasi target genomico e adatatte all’impiego basate su ibridazione (i.e. FISH). Website
- CombiROC è una applicazione web per la generazione e l’analisi interattiva di curve ROC di pannelli di marcatori multipli. Website
- combiroc (R-package) è un pacchetto R che rappresenta una nuova implementazione del metodo CombiROC. Introduce funzioni di selezione automatica e ottimizzazione delle gene signatures anche in un contesto di single-cell RNA sequencing. (GitHub) (CRAN)
- myVCF è una applicazione desktop per la gestione delle mutazione da profili high-throughput da progetti di sequenziamento che generino file VCF. Essa permette all’utente privo di conoscenze bioinformatiche di esplorare, interrogare, visualizzare ed esportare dati mutazionali in modo semplice e diretto. Documentation
- miRiadne (applicazione non più disponibile) è una applicazione web per la ri-annotazione di liste o datasets di microRNA. Annotazioni obsolete (dovute a versione non aggiornate del miRbase o delle piattaforme di profiling) possono essere convertite in annotazioni aggiornate. L’applicazione web è stata dismessa e il progetto non è attualmente manutenuto (per ogni richiesta si prega di contattare gli autori originali della pubblicazione)
I bioinformatici di INGM possono contare su un cluster ad alte prestazioni (HPC) con più di 400 cpu (AMD Opteron), 1.5 TB di memoria RAM e circa 100 TB di spazio disco. La struttura è stata organizzata e viene manutenuta dal personale dei Sistemi Informativi in collaborazione con i bioinformatici. L’infrastruttura è collegata da connettività ad altissima velocità ed è equipaggiata con sistemi di sicurezza e di backup per la protezione dei dati prodotti
Pubblicazioni
-
IRescue: uncertainty-aware quantification of transposable elements expression at single cell level
Polimeni B, Marasca F, Ranzani V, Bodega B
Nucleic Acids Research, (2024) -
[preprint] CIA: Unveiling Cellular Identities with Cluster-Independent Annotation in Single-Cell RNA Sequencing Data for Comprehensive Cell Type Characterization and Exploration
Ferrari, Battistella, Vincenti, Gobbini, Marini, Notarbartolo, Costanza, Biffo, Grifantini, Abrigani, Galeota
bioRxiv 2023.11.30.569382 (2023) -
[preprint] Combinatorial selection of biomarkers to optimize gene signatures in diagnostics and single cell applications
Ferrari I, Mazzara S, Abrignani S, Grifantini R, Bombaci M, Rossi R.L.
bioRxiv 2022.01.17.476603 (2022) -
Novel interferon-sensitive genes unveiled by correlation-driven gene selection and systems biology
Cheroni C, Manganaro L, Donnici L, Bevilacqua V, Bonnal RJP, Rossi RL, De Francesco R.
Scientific Reports 11, 18043 (2021) -
OligoMinerApp: a web-server application for the design of genome-scale oligonucleotide in situ hybridization probes through the flexible OligoMiner environment
Passaro M, Martinovic M, Bevilacqua V, Hershberg EA, Rossetti G, Beliveau BJ, Bonnal RJP, Pagani M.
Nucleic Acids Research, Volume 48, Issue W1, 02 July 2020, Pages W332–W339 -
Computation and Selection of Optimal Biomarker Combinations by Integrative ROC Analysis Using CombiROC
Bombaci M, Rossi RL.
In: Brun V., Couté Y. (eds) Proteomics for Biomarker Discovery. Methods in Molecular Biology, vol 1959. Humana Press, New York, NY. (2019) -
Big Data: Challenge and Opportunity for Translational and Industrial Research
Rossi RL, Grifantini RM.
Front. Digit. Humanit. 5:13 (2018) -
myVCF: a desktop application for high-throughput mutations data management
Pietrelli A, Valenti L.
Bioinformatics btx475 (2017) -
CombiROC: an interactive web tool for selecting accurate marker combinations of omics data
Mazzara S, Rossi RL, Grifantini R, Donizetti S, Abrignani S, Bombaci M.
Sci Rep (2017) 7:45477 -
Normalization of circulating microRNA expression data obtained by quantitative real-time RT-PCR
Marabita F, de Candia P, Torri A, Tegnér J, Abrignani S, Rossi RL.
Brief Bioinform (2016) 17:204-12 -
miRiadne: a web tool for consistent integration of miRNA nomenclature
Bonnal RJ., Rossi RL., Carpi D., Ranzani V., Abrignani S., Pagani M.
Nucleic Acids Res (2015) 43:W487-92
Past members
Nome / Name | Current address (if available) |
---|---|
Vittoria Bocchi, PhD | Memorial Sloan Kettering Cancer Center, NY |
Raoul J.P. Bonnal | IFOM, Milan |
Donatella Carpi, PhD | European Commission - JRC, Ispra |
Cristina Cheroni, PhD | Human Technopole, Milan |
Francesca Clemente, PhD | CAAD, Univ. Piemonte Orientale, Novara |
Jole Costanza, PhD | Nerviano Medical Sciences |
Gianluca Damaggio | Humanitas, Milano |
Emanuele Di Patrizio Soldateschi | IFOM, Milano |
Raffaele Ianuzzi |
Human Technopole, Milano |
Tiziana Lischetti, Phd | European Commission, Ispra |
Saveria Mazzara, PhD | Bocconi University, Milan |
Alessio Murgia, PhD | Institute for Research in Biomedicine (IRB), Bellinzona |
Maria Rosaria Nucera | Murdoch Children's Research Institute (MCRI), Parkville |
Ilaria Looser | |
Jessica Ongaro | Ospedale Policlinico di Milano |
Alessandro Pietrelli, PhD | Novartis, Milan |
Annarita Putignano | Humanitas, Milano |
Giulia Protti | Genentech, Los Angeles |
Marco Ricercato | |
Riccardo Rossi | IFOM, Milano |
Ilaria Rossoni | Istituto di Ricerche Farmacologiche Mario Negri, Milano |
Lorenzo Salviati | Human Technopole, Milano |
Shruti Sinha | Al Jalila Children's Specialty Hospital, Dubai |