Ben Bergen

Full Professor, University of California, San Diego

3 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 3

2 papers

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Language Model Behavioral Phases are Consistent Across Architecture, Training Data, and Scale

#5109 · James A. Michaelov, Roger P. Levy, Ben Bergen

Transformer, Mamba, and RWKV language models show consistent patterns of change in behavior over the course of training

Explaining and Mitigating Crosslingual Tokenizer Inequities

#1909 · Catherine Arnett, Tyler A. Chang, Stella Biderman, Ben Bergen

We identify several factors that lead to token premium effects in monolingual tokenizers and provide two interventions which significantly reduce tokenizer inequities.

Poster Session 6

1 paper

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Bigram Subnetworks: Mapping to Next Tokens in Transformer Language Models

#1801 Spotlight · Tyler A. Chang, Ben Bergen

We find bigram subnetworks in Transformer language models that are critical to model performance.