Jibin Wu

Assistant Professor, Hong Kong Polytechnic University

3 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 3

2 papers

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

ZeCO: Zero-Communication Overhead Sequence Parallelism for Linear Attention

#3507 · Yuhong Chou, Zehao Liu, Rui-Jie Zhu, Xinyi Wan, Tianjian Li, Congying Chu, Qian Liu, Jibin Wu, Zejun MA

A SoTA sequence parallelism for linear attention with a brand new collective communication.

HM3: Hierarchical Multi-Objective Model Merging for Pretrained Models

#4101 Spotlight · Yu Zhou, Xingyu Wu, Jibin Wu, Liang Feng, KC Tan

Poster Session 4

1 paper

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Diversity-Aware Policy Optimization for Large Language Model Reasoning

#4002 Spotlight · Jian Yao, Ran Cheng, Xingyu Wu, Jibin Wu, KC Tan

We propose a diversity-aware policy optimization method for LLM reasoning that introduces token-level diversity focusing on positive samples, achieving higher performance improvement on mathematical benchmarks while generating more diverse solutions.