Tohoku University & RIKEN - NeurIPS 2025

today local_bar

🏛 Tohoku University & RIKEN

1 paper across 1 session

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Transformer Key-Value Memories Are Nearly as Interpretable as Sparse Autoencoders

#900 · Mengyu Ye, Jun Suzuki, Tatsuro Inaba, Tatsuki Kuribayashi

We find that transformer key-value memories are nearly as interpretable as SAE features