today local_bar

Max Weltevrede

PhD student, Delft University of Technology

1 paper at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

How Ensembles of Distilled Policies Improve Generalisation in Reinforcement Learning

#211 · Max Weltevrede, Moritz Akiya Zanger, Matthijs T. J. Spaan, Wendelin Boehmer

We prove an ensemble of policies distilled on a diverse dataset improves generalisation in reinforcement learning.