Zero-shot RL - NeurIPS 2025

today local_bar

Zero-shot RL

2 papers across 1 session

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Learning from Reward-Free Offline Data: A Case for Planning with Latent Dynamics Models

#212 · Uladzislau Sobal, Wancong Zhang, Kyunghyun Cho, Randall Balestriero, Tim G. J. Rudner, Yann LeCun

In this paper, we systematically evaluate RL and control-based methods on a suite of navigation tasks, using offline datasets of varying quality.

RLZero: Direct Policy Inference from Language Without In-Domain Supervision

#302 · Harshit Sushil Sikchi, Siddhant Agarwal, Pranaya Jajoo, Samyak Parajuli, Caleb Chuck, Max Rudolph, Peter Stone, Amy Zhang, Scott Niekum

A method to produce policies directly from language instructions without in-domain supervision