Baichuan Inc. - NeurIPS 2025

today local_bar

🏛 Baichuan Inc.

1 paper across 1 session

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning

#1900 · Mingyang Chen, Linzhuang Sun, Tianpeng Li, Haoze Sun, ZhouYijie, Chenzheng Zhu, Haofen Wang, Jeff Pan, Wen Zhang, Huajun Chen, Fan Yang, Zenan Zhou, weipeng chen

Training LLMs to combine reasoning with external knowledge retrieval via RL without any supervised data on reasoning steps.