today local_bar

Tong Wu

Researcher, Beijing Institute for General Artificial Intelligence

1 paper at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

#1908 Spotlight · Andrew Zhao, Yiran Wu, Yang Yue, Tong Wu, Quentin Xu, Yang Yue, Matthieu Lin, Shenzhi Wang, Qingyun Wu, Zilong Zheng, Gao Huang

self-play reasoning RL with no data can achieve SOTA against RL models trained with human data