Surya Ganguli

Assistant Professor, Stanford University

2 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Alternating Gradient Flows: A Theory of Feature Learning in Two-layer Neural Networks

#4111 · Daniel Kunin, Giovanni Luca Marchetti, Feng Chen, Dhruva Karkada, James B Simon, Michael R DeWeese, Surya Ganguli, Nina Miolane

We introduce Alternating Gradient Flows, a framework modeling feature learning in two-layer networks with small initialization as utility maximization and cost minimization—unifying saddle-to-saddle analyses and explaining Fourier feature emergence

Poster Session 6

1 paper

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Rethinking Fine-Tuning when Scaling Test-Time Compute: Limiting Confidence Improves Mathematical Reasoning

#3719 · Feng Chen, Allan Raventos, Nan Cheng, Surya Ganguli, Shaul Druckmann

We show that limiting a model's confidence during training can improve test-time scaling in mathematical reasoning.