Pengxiang Li

PhD student, Hong Kong Polytechnic University

3 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

GPAS: Accelerating Convergence of LLM Pretraining via Gradient-Preserving Activation Scaling

#4102 · Tianhao Chen, Xin Xu, Zijing Liu, Pengxiang Li, Xinyuan Song, AJAY KUMAR JAISWAL, Fan Zhang, Jishan Hu, Yang Wang, Hao Chen, Shizhe Diao, Shiwei Liu, Yu Li, Lu Yin, Can Yang

We propose GPAS, a simple method that scales activations without scaling gradients to accelerate pretraining convergence of LLMs.

The Curse of Depth in Large Language Models

#4014 · Wenfang Sun, Xinyuan Song, Pengxiang Li, Lu Yin, Yefeng Zheng, Shiwei Liu

In this paper, we introduce the Curse of Depth, a concept that re-introduces, explains, and addresses the recent observation in modern Large Language Models (LLMs) where deeper layers are much less effective than expected.

Poster Session 6

1 paper

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Adaptive Classifier-Free Guidance via Dynamic Low-Confidence Masking

#3312 · Pengxiang Li, Shilin Yan, Jiayin Cai, Renrui Zhang, Ruichuan An, Ziyu Guo, Xiaowei Gao

We propose Adaptive Classifier-Free Guidance (A-CFG), which dynamically re-masks low-confidence tokens for a more targeted unconditional input in iterative models.