Edoardo Ponti

Assistant Professor, University of Edinburgh

4 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systems

#4004 · Yinsicheng Jiang, Yao Fu, Yeqi Huang, Ping Nie, Zhan Lu, Leyang Xue, Congjie He, Man-Kit Sit, Jilong Xue, Li Dong, Ziming Miao, DaYou Du, Tairan Xu, Kai Zou, Edoardo Ponti, Luo Mai

Poster Session 3

2 papers

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Neurosymbolic Diffusion Models

#610 · Emile van Krieken, Pasquale Minervini, Edoardo Ponti, Antonio Vergari

We integrate discrete diffusion models with neurosymbolic predictors for scalable and calibrated learning and reasoning

Inference-Time Hyper-Scaling with KV Cache Compression

#3418 · Adrian Łańcucki, Konrad Staniszewski, Piotr Nawrot, Edoardo Ponti

Inference-time hyper-scaling uses key–value cache compression with Delayed Memory Sparsification (DMS) to boost Transformer LLM reasoning accuracy for equivalent compute or memory costs.

Poster Session 4

1 paper

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Universal Cross-Tokenizer Distillation via Approximate Likelihood Matching

#3406 · Benjamin Minixhofer, Ivan Vulić, Edoardo Ponti

We introduce a new method for principled, effective distillation across tokenizers, enabling a number of new applications.