Michael A Osborne

Full Professor, University of Oxford

2 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 4

2 papers

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Scalable Valuation of Human Feedback through Provably Robust Model Alignment

#3816 · Masahiro Fujisawa, Masaki Adachi, Michael A Osborne

We propose Hölder-DPO, the first alignment method with a provable redescending property, which enables robust learning from noisy human feedback by identifying and correcting mislabeled data, improving alignment and model performance.

Just One Layer Norm Guarantees Stable Extrapolation

#3911 · Juliusz Ziomek, George Whittle, Michael A Osborne