today local_bar

Lifan Yuan

PhD student, University of Illinois at Urbana-Champaign

3 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

TTRL: Test-Time Reinforcement Learning

#5419 · Yuxin Zuo, Kaiyan Zhang, Li Sheng, Shang Qu, Ganqu Cui, Xuekai Zhu, Haozhan Li, Yuchen Zhang, Xinwei Long, Ermo Hua, Biqing Qi, Youbang Sun, Zhiyuan Ma, Lifan Yuan, Ning Ding, Bowen Zhou

The Unreasonable Effectiveness of Entropy Minimization in LLM Reasoning

#1814 · Shivam Agarwal, Zimin Zhang, Lifan Yuan, Jiawei Han, Hao Peng

Reinforcement Learning Finetunes Small Subnetworks in Large Language Models

#3300 · Sagnik Mukherjee, Lifan Yuan, Dilek Hakkani-Tür, Hao Peng

RL fine-tuning in LLMs updates a small subnetwork containing 20–30% of parameters leaving rest of the parameters unchanged.