today local_bar

Bin Xu

Full Professor, Department of Computer Science, Tsinghua University

1 paper at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

AGENTIF: Benchmarking Large Language Models Instruction Following Ability in Agentic Scenarios

#114 Spotlight · Yunjia Qi, Hao Peng, Xiaozhi Wang, Amy Xin, Youfeng Liu, Bin Xu, Lei Hou, Juanzi Li

We propose a benchmark to evaluate the large language models' instruction following ability in agentic scenarios.