BIOINFORMATICA

Il gruppo di bioinformatica dell’INGM si concentra sull’analisi, lo sviluppo, l’ottimizzazione e l’applicazione di strumenti per l’elaborazione di dati biologici e genomici generati dai ricercatori dell’Istituto e dai loro collaboratori. La facility opera a stretto contatto con i gruppi di ricerca, offrendo supporto per analisi bioinformatiche standard e personalizzate, contribuendo così alla ricerca di base e traslazionale. Il gruppo garantisce inoltre l’accesso a metodologie analitiche sempre aggiornate, favorendo l’adozione di approcci innovativi.
Il team lavora in un open space condiviso con bioinformatici, studenti e dottorandi afferenti ai vari laboratori, favorendo lo scambio di competenze e la collaborazione interdisciplinare.
Le competenze del gruppo spaziano dalla biologia alla biologia dei sistemi, dall’informatica alla biostatistica. Questa trasversalità consente una visione integrata e contestualizzata dei dati biologici, con un’attenzione costante alle loro implicazioni biomediche e cliniche.
Il supporto del personale dei Sistemi Informativi garantisce un accesso continuo alle infrastrutture di calcolo ad alte prestazioni (HPC) e alla connettività dell’Istituto, fondamentali per le attività del gruppo.

Attività

  • Analisi dati NGS (Next generation sequencing): analisi di RNA-seq, ChIP-seq, ATAC-seq, RADICL-seq, SAMMY-seq e tecniche basate su conformazione della cromatina (C-technologies, 4C-seq, HiC). L’intero workflow di analisi, dalla gestione dei dati grezzi all’interpretazione biologica, è coperto in modo completo.
  • Analisi di dati a singola cellula: Utilizzo delle tecnologie 10X Genomics e Smart-seq-based in una varietà di applicazioni. Integrazione di approcci multi-omici come VDJ-seq, feature barcoding, ATAC-seq, studio degli elementi trasponibili e LIBRA-seq. Ricostruzione trascrittomica e integrazione dei dati mediante gli ecosistemi Seurat e Scanpy.
  • Analisi di dati long-read sequencing (Oxford Nanopore Technologies): trascrittomica bulk e single cell, metilazione del DNA. Gestione completa, dal basecalling all’allineamento genomico e alle analisi successive. Sviluppo di pipeline personalizzate per analisi bulk e single-cell, inclusa la quantificazione di geni/trascritti, ricostruzione del trascrittoma e chiamata di modifiche.
  • Analisi di dati multiplexed tissue imaging (MACSima Technology): quantificazione precisa dell’intensità di fluorescenza (MFI) ad etichettatura automatica delle popolazioni cellulari. Segmentazione in modo efficiente di regioni istologiche, identificazione di strutture e contesti tissutali complessi. Analisi delle vicinanze cellulari e valutazione topologica per permettere una caratterizzazione spaziale dettagliata del microambiente.
  • Analisi funzionali per la contestualizzazione biologica: comprendono test di arricchimento per Gene Ontology (GO), Gene Set Enrichment Analysis (GSEA), analisi di co-espressione (WGCNA), Gene Regulatory Network (GRN). Integrazione con database di interazione o previsione (es. GRID, MINT, miRBase, TargetScan) per un’analisi funzionale approfondita.
  • Collaborazione e soluzioni personalizzate: Collaborazione attiva con i gruppi di ricerca per lo sviluppo di soluzioni su misura, adattando pipeline esistenti o creando nuovi flussi analitici per affrontare specifiche esigenze progettuali.
  • Formazione interna dei nuovi tesisti, borsisti e tirocinanti destinati alle attività analitiche di bioinformatica

Team

Unit Coordinator

Prof. Beatrice Bodega, PhD

Staffing

Nome / Name Ruolo / Role Email
Valeria Ranzani, PhD Researcher ranzani@ingm.org
Eugenia Galeota, PhD Researcher galeota@ingm.org
Andrea Gobbini Researcher gobbini@ingm.org
Alberto Carignano Researcher carignano@ingm.org

Affiliated members

Nome / Name Ruolo / Role Aff.ted Lab email
Riccardo Nodari Researcher De Francesco nodari@ingm.org
Benedetto Polimeni Post Doc Bodega polimeni@ingm.org
Francesco Panariello Post Doc Bodega panariello@ingm.org
Ivan Ferrari PhD student Biffo ferrari@ingm.org
Mattia Battistella PhD student Cattaneo battistella@ingm.org
Michele Panepuccia PhD student Bodega panepuccia@ingm.org
Alen Stambolliu PhDstudent Bodega stambolliu@ingm.org
Camilla Righetti PhD student Geginat righetti@ingm.org
Carmen Faggiano Research Fellow Geginat faggiano@ingm.org
Mariachiara Palma Research Fellow Bodega palma@ingm.org
Marinicla Pascale Research Fellow Bodega pascale@ingm.org
Carola Miuccio Research Fellow Manganaro miuccio@ingm.org
Marta Morrocchi Junior Research Fellow Cattaneo morrocchi@ingm.org
Davide Iafolla Junior Research Fellow Cattaneo iafolla@ingm.org
Amanda Bianchi Master student Bodega abianchi@ingm.org
Marco Cominelli Master student Biffo cominelli@ingm.org
Elisa Arsuffi Master student Biffo arsuffi@ingm.org
Christian dall'Ava Master student Cattaneo dallava@ingm.org

Past members

For past members of the bioinformatics unit and their current affiliation (if available) see at the bottom of the page.

Tools e Software sviluppati internamente

  • CIA (Cluster Independent Annotation) è uno strumento computazionale per l’analisi di dati single-cell RNA-seq (scRNA-seq) che consente l’identificazione accurata delle popolazioni cellulari in base a firme trascrizionali predefinite. CIA offre un approccio intuitivo, veloce e riproducibile per l’annotazione funzionale delle cellule singole PyPI | GitHub
  • IRescue è un tool che permette di quantificare l’espressione delle subfamiglie di elementi trasponibili (TE) nei dati di RNA sequencing a singola cellula (scRNA-seq), eseguendo la deduplicazione degli UMI con correzione degli errori di sequenziamento (per librerie 10X o UMI-based) oppure la quantificazione delle read (per librerie senza UMI, ad esempio SMART-seq), seguita dall’assegnazione probabilistica delle letture multi-mapping tramite una procedura di Expectation-Maximization (EM). GitHub
  • TEcount TEcount è un pacchetto che permette di quantificare gli elementi trasponibili (TE) in esperimenti di RNA-seq bulk a livello di sottofamiglie, famiglie e classi. GitHub
  • OligoMiner è una webapp per il design di oligo-probe contro qualsiasi target genomico e adatatte all’impiego basate su ibridazione (i.e. FISH). Website
  • CombiROC è una applicazione web per la generazione e l’analisi interattiva di curve ROC di pannelli di marcatori multipli. Website
  • combiroc (R-package) è un pacchetto R che rappresenta una nuova implementazione del metodo CombiROC. Introduce funzioni di selezione automatica e ottimizzazione delle gene signatures anche in un contesto di single-cell RNA sequencing. (GitHub) (CRAN)
  • myVCF è una applicazione desktop per la gestione delle mutazione da profili high-throughput da progetti di sequenziamento che generino file VCF. Essa permette all’utente privo di conoscenze bioinformatiche di esplorare, interrogare, visualizzare ed esportare dati mutazionali in modo semplice e diretto. Documentation
  • miRiadne (applicazione non più disponibile) è una applicazione web per la ri-annotazione di liste o datasets di microRNA. Annotazioni obsolete (dovute a versione non aggiornate del miRbase o delle piattaforme di profiling) possono essere convertite in annotazioni aggiornate. L’applicazione web è stata dismessa e il progetto non è attualmente manutenuto (per ogni richiesta si prega di contattare gli autori originali della pubblicazione)

I bioinformatici di INGM possono contare su un cluster ad alte prestazioni (HPC) con più di 400 cpu (AMD Opteron), 1.5 TB di memoria RAM e circa 100 TB di spazio disco. La struttura è stata organizzata e viene manutenuta dal personale dei Sistemi Informativi in collaborazione con i bioinformatici. L’infrastruttura è collegata da connettività ad altissima velocità ed è equipaggiata con sistemi di sicurezza e di backup per la protezione dei dati prodotti

Pubblicazioni

Past members

Nome / Name Current address (if available)
Vittoria Bocchi, PhD Memorial Sloan Kettering Cancer Center, NY
Raoul J.P. Bonnal IFOM, Milan
Donatella Carpi, PhD European Commission - JRC, Ispra
Cristina Cheroni, PhD Human Technopole, Milan
Francesca Clemente, PhD CAAD, Univ. Piemonte Orientale, Novara
Jole Costanza, PhD Nerviano Medical Sciences
Gianluca Damaggio Humanitas, Milano
Emanuele Di Patrizio Soldateschi IFOM, Milano
Raffaele Ianuzzi
Human Technopole, Milano
Tiziana Lischetti, Phd European Commission, Ispra
Saveria Mazzara, PhD Bocconi University, Milan
Alessio Murgia, PhD Institute for Research in Biomedicine (IRB), Bellinzona
Maria Rosaria Nucera Murdoch Children's Research Institute (MCRI), Parkville
Ilaria Looser
Jessica Ongaro Ospedale Policlinico di Milano
Alessandro Pietrelli, PhD Novartis, Milan
Annarita Putignano Humanitas, Milano
Giulia Protti Genentech, Los Angeles
Marco Ricercato
Riccardo Rossi IFOM, Milano
Ilaria Rossoni Istituto di Ricerche Farmacologiche Mario Negri, Milano
Lorenzo Salviati Human Technopole, Milano
Shruti Sinha Al Jalila Children's Specialty Hospital, Dubai

INGM RESEARCH IS SUPPORTED BY