Wei Hu

Assistant Professor, University of Michigan - Ann Arbor

2 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

1 paper

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

What Happens During the Loss Plateau? Understanding Abrupt Learning in Transformers

#4206 · Pulkit Gopalani, Wei Hu

Early phase training of Transformers on algorithmic tasks shows a plateau in loss, repetition bias and representation collapse before sudden drop in loss.

Poster Session 3

1 paper

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Benign Overfitting in Single-Head Attention

#3203 · Roey Magen, Shuning Shang, Zhiwei Xu, Spencer Frei, Wei Hu, Gal Vardi

We prove that under appropriate conditions, a single-head softmax attention mechanism exhibits benign overfitting