Clayton Sanford

Researcher, Google

3 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

1 paper

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

When Do Transformers Outperform Feedforward and Recurrent Networks? A Statistical Perspective

#4000 · Alireza Mousavi-Hosseini, Clayton Sanford, Denny Wu, Murat A Erdogdu

We prove a purely statistical separation between Transformers and other architectures such as feedforward and recurrent networks, where Transformers are more sample-efficient at learning sparse sequence models.

Poster Session 5

1 paper

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Depth-Width Tradeoffs for Transformers on Graph Tasks

#3907 Spotlight · Gilad Yehudai, Clayton Sanford, Maya Bechler-Speicher, Orr Fischer, Ran Gilad-Bachrach, Amir Globerson

We show that transformers with linear width can solve many graph problems using constant depth, revealing a trade-off where increasing width enables shallower, faster models—though some tasks still demand quadratic width.

Poster Session 6

1 paper

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Fast attention mechanisms: a tale of parallelism

#3504 · Jingwen Liu, Hantao Yu, Clayton Sanford, Alexandr Andoni, Daniel Hsu