AI Security - NeurIPS 2025

today local_bar

AI Security

4 papers across 3 sessions

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Taught Well Learned Ill: Towards Distillation-conditional Backdoor Attack

#1103 · Yukun Chen, Boheng Li, Yu Yuan, Leyi Qi, Yiming Li, Tianwei Zhang, Zhan Qin, Kui Ren

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

BackdoorDM: A Comprehensive Benchmark for Backdoor Learning on Diffusion Model

#1309 · Weilin Lin, Nanjun Zhou, Yanyun Wang, Jianze Li, Hui Xiong, Li Liu

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Fundamental Limitations in Pointwise Defences of LLM Finetuning APIs

#5401 · Xander Davies, Eric Winsor, Alexandra Souly, Tomek Korbak, Robert Kirk, Christian Schroeder de Witt, Yarin Gal

Defences against LLM misuse fine-tuning attacks that aim to detect individual malicious or suspicious samples are insufficient.

SECODEPLT: A Unified Benchmark for Evaluating the Security Risks and Capabilities of Code GenAI

#108 · Yuzhou Nie, Zhun Wang, Yu Yang, Ruizhe Jiang, Yuheng Tang, Xander Davies, Yarin Gal, Bo Li, Wenbo Guo, Dawn Song

We create a unified benchmark for evaluating secure code generation, vulnerability detection and poc generation