Reinforcement Fine-Tuning - NeurIPS 2025

today local_bar

Reinforcement Fine-Tuning

5 papers across 3 sessions

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Reason-RFT: Reinforcement Fine-Tuning for Visual Reasoning of Vision Language Models

#1508 · Huajie Tan, Yuheng Ji, Xiaoshuai Hao, Xiansheng Chen, Pengwei Wang, Zhongyuan Wang, Shanghang Zhang

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Understanding Data Influence in Reinforcement Finetuning

#302 · Haoru Tan, Xiuzhe Wu, Sitong Wu, Shaofeng Zhang, Yanfeng Chen, Xingwu Sun, Jeanne Shen, Xiaojuan Qi

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Angles Don’t Lie: Unlocking Training‑Efficient RL Through the Model’s Own Signals

#310 Spotlight · Qinsi Wang, Jinghan Ke, Hancheng Ye, Yueqian Lin, Yuzhe Fu, Jianyi Zhang, Kurt Keutzer, Chenfeng Xu, Yiran Chen

We present a model-aware approach that leverages the model’s own signals to dynamically choose training data, markedly boosting both training and data efficiency in RL fine-tuning.

BTL-UI: Blink-Think-Link Reasoning Model for GUI Agent

#4510 · Shaojie Zhang, Ruoceng Zhang, Pei Fu, Shaokang Wang, Jiahui Yang, Xin Du, ShiqiCui, Bin Qin, Ying Huang, Zhenbo Luo, Jian Luan

Learning to Think: Information-Theoretic Reinforcement Fine-Tuning for LLMs

#214 · Jingyao Wang, Wenwen Qiang, Zeen Song, Changwen Zheng, Hui Xiong