LLM pre-training - NeurIPS 2025

today local_bar

LLM pre-training

2 papers across 1 session

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Functional Scaling Laws in Kernel Regression: Loss Dynamics and Learning Rate Schedules

#5108 Spotlight · Binghui Li, Fengling Chen, Zixun Huang, Lean Wang, Lei Wu

We introduce a Functional Scaling Law that predicts full SGD loss dynamics under arbitrary learning rate schedules.

The Automated LLM Speedrunning Benchmark: Reproducing NanoGPT Improvements

#3313 · Bingchen Zhao, Despoina Magka, Minqi Jiang, Xian Li, Roberta Raileanu, Tatiana Shavrina, Jean-Christophe Gagnon-Audet, Kelvin Niu, Shagun Sodhani, Michael Shvartsman, Andrei Lupu, Alisia Lupidi, Karen Hambardzumyan, Martin Josifoski, Edan Toledo, Thomas Foster, Lucia Cipolina Kun, Derek Dunfield, Abhishek Charnalia, Alexander Miller, Oisin Mac Aodha, Jakob Foerster, Yoram Bachrach

We introduce the Automated LLM Speedrunning benchmark to assess the capabilities of AI agents to reproduce LLM research