Kishan Panaganti

Researcher, Tencent AI Lab

3 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

2 papers

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Risk-Averse Total-Reward Reinforcement Learning

#209 · Xihong Su, Jia Lin Hau, Gersi Doko, Kishan Panaganti, Marek Petrik

Efficient Policy Optimization in Robust Constrained MDPs with Iteration Complexity Guarantees

#406 · Sourav Ganguly, Kishan Panaganti, Arnob Ghosh, Adam Wierman

We provide O(\epsilon^{-4}) iteration complexity policy optimization algorithm for robust constrained Markov Decision Processing

Poster Session 3

1 paper

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Robust LLM Alignment via Distributionally Robust Direct Preference Optimization

#3910 · Zaiyan Xu, Sushil Vemuri, Kishan Panaganti, Dileep Kalathil, Rahul Jain, Deepak Ramachandran

We address distributional shift among diverse preferences with robust DPO: Wasserstein DPO (WDPO) and Kullback–Leibler DPO (KLDPO). Finite-sample guarantees, tractable gradient-based algorithms for hard DRO objectives, strong empirical robustness.