prompt injections - NeurIPS 2025

today local_bar

prompt injections

2 papers across 2 sessions

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

WASP: Benchmarking Web Agent Security Against Prompt Injection Attacks

#1311 · Ivan Evtimov, Arman Zharmagambetov, Aaron Grattafiori, Chuan Guo, Kamalika Chaudhuri

A benchmark with realistic security scenarios for web agents based on LLMs

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Security Challenges in AI Agent Deployment: Insights from a Large Scale Public Competition

#4915 · Andy Zou, Maxwell Lin, Eliot Jones, Micha Nowak, Mateusz Dziemian, Nick Winter, Valent Nathanael, Ayla Croft, Xander Davies, Jai Patel, Robert Kirk, Yarin Gal, Dan Hendrycks, Zico Kolter, Matt Fredrikson