Zhipu AI - NeurIPS 2025

today local_bar

🏛 Zhipu AI

2 papers across 2 sessions

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Can Large Language Models Master Complex Card Games?

#101 · Wei Wang, Fuqing Bie, Junzhe Chen, Dan Zhang, Shiyu Huang, Evgeny Kharlamov, Jie Tang

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

AGENTIF: Benchmarking Large Language Models Instruction Following Ability in Agentic Scenarios

#114 Spotlight · Yunjia Qi, Hao Peng, Xiaozhi Wang, Amy Xin, Youfeng Liu, Bin Xu, Lei Hou, Juanzi Li

We propose a benchmark to evaluate the large language models' instruction following ability in agentic scenarios.