Temporal Grounding; Multimodal Large Language Model; Reinforcement Fine-Tuning

1 paper across 1 session

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

TempSamp-R1: Effective Temporal Sampling with Reinforcement Fine-Tuning for Video LLMs

#4808 · Yunheng Li, Jing Cheng, Shaoyong Jia, Hangyi Kuang, Shaohui Jiao, Qibin Hou, Ming-Ming Cheng

TempSamp-R1 is a reinforcement fine-tuning framework that integrates off-policy supervision, soft advantage shaping, and hybrid Chain-of-Thought training to enhance the temporal grounding capabilities of MLLMs.