today local_bar

Hao Peng

Assistant Professor, University of Illinois Urbana-Champaign

3 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

The Unreasonable Effectiveness of Entropy Minimization in LLM Reasoning

#1814 · Shivam Agarwal, Zimin Zhang, Lifan Yuan, Jiawei Han, Hao Peng

Reinforcement Learning Finetunes Small Subnetworks in Large Language Models

#3300 · Sagnik Mukherjee, Lifan Yuan, Dilek Hakkani-Tür, Hao Peng

RL fine-tuning in LLMs updates a small subnetwork containing 20–30% of parameters leaving rest of the parameters unchanged.

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

The Best Instruction-Tuning Data are Those That Fit

#107 Spotlight · Dylan Zhang, Qirun Dai, Hao Peng