today local_bar

Tianpai Luo

PhD student, Tsinghua University

1 paper at NeurIPS 2025

OpenReview· Semantic Scholar· Google Scholar

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Simultaneous Statistical Inference for Off-Policy Evaluation in Reinforcement Learning

#204 · Tianpai Luo, Xinyuan Fan, Weichi Wu

This work presents the first asymptotically correct simultaneous confidence region for off-policy evaluation in reinforcement learning.