Zhijiang Guo

Assistant Professor, The Hong Kong University of Science and Technology (Guangzhou)

5 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

2 papers

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Atom of Thoughts for Markov LLM Test-Time Scaling

#1907 · Fengwei Teng, Quan Shi, Zhaoyang Yu, Jiayi Zhang, Yuyu Luo, Chenglin Wu, Zhijiang Guo

The Atom of Thoughts leverages a Markovian reasoning process to enhance test-time scaling efficiency in LLMs, decomposing reasoning into low-complexity atomic units for scalable, high-performance inference.

TimE: A Multi-level Benchmark for Temporal Reasoning of LLMs in Real-World Scenarios

#1806 Spotlight · Shaohang Wei, Wei Li, Feifan Song, Wen Luo, Tianyi Zhuang, Haochen Tan, Zhijiang Guo, Houfeng Wang

Poster Session 3

1 paper

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

AVerImaTeC: A Dataset for Automatic Verification of Image-Text Claims with Evidence from the Web

#1914 · RUI CAO, Zifeng Ding, Zhijiang Guo, Michael Sejr Schlichtkrull, Andreas Vlachos

Poster Session 4

2 papers

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Activation-Guided Consensus Merging for Large Language Models

#1603 · Yuxuan Yao, Shuqi LIU, Zehua Liu, Qintong Li, Mingyang LIU, Xiongwei Han, Zhijiang Guo, Han Wu, Linqi Song

We introduce ACM, a framework that enhances model merging by incorporating layer-specific merging coefficients based on activation mutual information.

EffiBench-X: A Multi-Language Benchmark for Measuring Efficiency of LLM-Generated Code

#110 · Yuhao QING, Boyu Zhu, Mingzhe Du, Zhijiang Guo, Terry Yue Zhuo, Qianru Zhang, Jie M. Zhang, Heming Cui, Siu Ming Yiu, Dong HUANG, See-Kiong Ng, Anh Tuan Luu

We propose EffiBench-X, a multi-language code efficiency benchmark, to address the gap in existing benchmarks primarily focusing on a single programming language (e.g., Python).