Wei Wei

Full Professor, shanxi university

2 papers at NeurIPS 2025

OpenReview· Semantic Scholar· Google Scholar

Poster Session 3

1 paper

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

FANS: A Flatness-Aware Network Structure for Generalization in Offline Reinforcement Learning

#211 · Da Wang, Yi Ma, Ting Guo, Hongyao Tang, Wei Wei, Jiye Liang

Poster Session 5

1 paper

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Risk-aware Direct Preference Optimization under Nested Risk Measure

#5300 · Lijun Zhang, Lin Li, Yajie Qi, Huizhong Song, Yaodong Yang, Jun Wang, Wei Wei

We introduce Risk-aware Direct Preference Optimization (Ra-DPO), a novel approach that incorporates risk-awareness by employing a class of nested risk measures.