policy gradient methods

2 papers across 1 session

Poster Session 4

2 papers

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

On the Global Optimality of Policy Gradient Methods in General Utility Reinforcement Learning

#3312 · Anas Barakat, Souradip Chakraborty, Peihong Yu, Pratap Tokekar, Amrit Singh Bedi

Policy Gradient Methods Converge Globally in Imperfect-Information Extensive-Form Games

#304 · Fivos Kalogiannis, Gabriele Farina

We contribute provable guarantees that regularized policy gradient methods converge in approximate Nash equilibria in imperfect-information extensive-form zero-sum games.