Instruction tuning

6 papers across 3 sessions

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

#3902 · Changdae Oh, Jiatong Li, Shawn Im, Sharon Li

We propose Vittle, a new visual instruction tuning framework that improves robustnessof MLLMs to data distribution shifts by pursuing the minimal sufficient representation.

MedMax: Mixed-Modal Instruction Tuning for Training Biomedical Assistants

#1703 · Hritik Bansal, Daniel Israel, Siyan Zhao, Shufan Li, Tung Nguyen, Aditya Grover

We present MedMax, a large-scale multimodal biomedical instruction-tuning dataset for mixed-modal foundation models, and show that our data achieves superior performance than GPT-4o on diverse biomedical tasks.

Poster Session 2

3 papers

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

T-SHIRT: Token-Selective Hierarchical Data Selection for Instruction Tuning

#200 · Yanjun Fu, Faisal Hamman, Sanghamitra Dutta

We introduce T-SHIRT, a new data selection method for instruction tuning LLMs that scores data at the token level and emphasizes robustness.

INST-IT: Boosting Instance Understanding via Explicit Visual Prompt Instruction Tuning

#4618 · Wujian Peng, Lingchen Meng, Yitong Chen, Yiweng Xie, Yang Liu, Tao Gui, Hang Xu, Xipeng Qiu, Zuxuan Wu, Yu-Gang Jiang

The Best Instruction-Tuning Data are Those That Fit

#107 Spotlight · Dylan Zhang, Qirun Dai, Hao Peng

Poster Session 5

1 paper

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Task-Specific Data Selection for Instruction Tuning via Monosemantic Neuronal Activations

#2301 · Da Ma, Gonghu Shang, Zhi Chen, Libo Qin, Yijie LUO, Hongshen Xu, Lei Pan, Shuai Fan, Kai Yu, Lu Chen

We propose a data selection method that leverages sparse, monosemantic neuronal activations learned via a sparse autoencoder to improve task-specific instruction tuning for large language models.