today local_bar

Jiapeng Sun

PhD student, The Hong Kong University of Science and Technology

1 paper at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Generative RLHF-V: Learning Principles from Multi-modal Human Preference

#5308 · Jiayi Zhou, Jiaming Ji, Boyuan Chen, Jiapeng Sun, Wenqi Chen, Donghai Hong, Sirui Han, Yike Guo, Yaodong Yang

A novel alignment framework that integrates generative reward models with multi-modal RLHF.