activation steering

4 papers across 3 sessions

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

LayerNavigator: Finding Promising Intervention Layers for Efficient Activation Steering in Large Language Models

#3701 · Hao Sun, Huailiang Peng, Qiong Dai, Xu Bai, Yanan Cao

LayerNavigator is a low-overhead method that scores each LLM layer's steerability to guide multi-layer activation steering, significantly outperforming baselines while offering clear interpretability.

Steering When Necessary: Flexible Steering Large Language Models with Backtracking

#1912 · Zifeng Cheng, Jinwei Gan, Zhiwei Jiang, Cong Wang, Yafeng Yin, Xiang Luo, Yuchen Fu, Qing Gu

Poster Session 3

1 paper

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Angular Steering: Behavior Control via Rotation in Activation Space

#1105 Spotlight · Minh Hieu Vu, Tan Nguyen

This paper introduces Angular Steering, a robust and generalized method for fine-grained behavior control in language models, unifying and extending existing steering techniques through rotation in a feature-isolating subspace.

Poster Session 5

1 paper

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

On Reasoning Strength Planning in Large Reasoning Models

#5313 · Leheng Sheng, An Zhang, Zijian Wu, Weixiang Zhao, Changshuo Shen, zhang yi, Xiang Wang, Tat-Seng Chua