today local_bar

Nguyen Minh Phuc

Researcher, VinUni

1 paper at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Mitigating Reward Over-optimization in Direct Alignment Algorithms with Importance Sampling

#5508 · Nguyen Minh Phuc, Ngoc-Hieu Nguyen, Duy Minh Ho Nguyen, Anji Liu, An Mai, Binh T. Nguyen, Daniel Sonntag, Khoa D Doan

an importance-sampling-based method to mitigate over-optimization in Direct Alignment Algorithms for language model alignment