supervised fine-tuning

4 papers across 2 sessions

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Advancing Expert Specialization for Better MoE

#5416 · Hongcan Guo, Haolang Lu, Guoshun Nan, Bolun Chu, Jialin Zhuang, Yuan Yang, Wenhao Che, Xinye Cao, Sicong Leng, Qimei Cui, Xudong Jiang

Our proposed orthogonality and variance losses improve performance in downstream fine-tuning of Mixture-of-Experts models by enhancing expert specificity, addressing expert homogenization caused by load balancing, while maintaining load balance.

Skrull: Towards Efficient Long Context Fine-tuning through Dynamic Data Scheduling

#2002 · Hongtao Xu, Wenting Shen, Yuanxin Wei, Ang Wang, Guo Runfan, Tianxing Wang, Yong Li, Mingzhen Li, Weile Jia

Efficient Long Context Fine-tuning through Dynamic Data Scheduling

Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning

#3608 Spotlight · Jiaru Zou, Yikun Ban, Zihao Li, Yunzhe Qi, Ruizhong Qiu, Ling Yang, Jingrui He

A new learning framework that improves LLM inference by learning from a Mistake Log collected during fine-tuning.

Poster Session 5

1 paper

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Alchemist: Turning Public Text-to-Image Data into Generative Gold

#4203 · Valerii Startsev, Alexander Ustyuzhanin, Alexey Kirillov, Dmitry Baranchuk, Sergey Kastryulin

Alchemist: a compact (3.3k) SFT dataset via diffusion-model filtering. Boosts T2I aesthetics/complexity in 5 SD models (weights released) while keeping diversity.