today local_bar

Pinjia He

Assistant Professor, The Chinese University of Hong Kong, Shenzhen

2 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Trust, But Verify: A Self-Verification Approach to Reinforcement Learning with Verifiable Rewards

#306 · Xiaoyuan Liu, Tian Liang, Zhiwei He, Jiahao Xu, Wenxuan Wang, Pinjia He, Zhaopeng Tu, Haitao Mi, Dong Yu

We introduce a RL framework to train LLM's reasoning and self-verification ability simultaneously.

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Towards Evaluating Proactive Risk Awareness of Multimodal Language Models

#1710 · Youliang Yuan, Wenxiang Jiao, Yuejin Xie, Chihao Shen, Menghan Tian, Wenxuan Wang, Jen-tse Huang, Pinjia He

We created a dataset to evaluate current models' ability to actively detect and alert risks based on the observations of user behaviors.