IID data - NeurIPS 2025

IID data

1 paper across 1 session

Poster Session 6

We characterize sample complexities for average-reward offline RL with function approximation for weakly communicating MDPs.