Alireza Mousavi-Hosseini

PhD student, Department of Computer Science, University of Toronto

2 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

2 papers

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

From Information to Generative Exponent: Learning Rate Induces Phase Transitions in SGD

#3004 · Konstantinos Christopher Tsiolis, Alireza Mousavi-Hosseini, Murat A Erdogdu

When Do Transformers Outperform Feedforward and Recurrent Networks? A Statistical Perspective

#4000 · Alireza Mousavi-Hosseini, Clayton Sanford, Denny Wu, Murat A Erdogdu

We prove a purely statistical separation between Transformers and other architectures such as feedforward and recurrent networks, where Transformers are more sample-efficient at learning sparse sequence models.