Adaptive video tokenizer

1 paper across 1 session

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

VaporTok: RL-Driven Adaptive Video Tokenizer with Prior & Task Awareness

#5408 · Minghao Yang, Zechen Bai, Jing Lin, Haoqian Wang, Alex Jinpeng Wang

To train an adaptive video tokenizer, we introduce probabilistic taildrop to inject visual complexity prior to the tokenizer and incorporate GRPO for post-training, which further boosts efficiency in a task-aware adaptive manner.