today local_bar

Alexandra Souly

Researcher, uk aisi

1 paper at NeurIPS 2025

OpenReview· Semantic Scholar· Google Scholar

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Fundamental Limitations in Pointwise Defences of LLM Finetuning APIs

#5401 · Xander Davies, Eric Winsor, Alexandra Souly, Tomek Korbak, Robert Kirk, Christian Schroeder de Witt, Yarin Gal

Defences against LLM misuse fine-tuning attacks that aim to detect individual malicious or suspicious samples are insufficient.