Daoyuan Chen

Staff, Alibaba Group

4 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 2

1 paper

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Diversity as a Reward: Fine-Tuning LLMs on a Mixture of Domain-Undetermined Data

#106 · Zhenqing Ling, Daoyuan Chen, Liuyi Yao, Qianli Shen, Yaliang Li, Ying Shen

Our empirically and theoretically informed method, which treats diversity as a reward, achieves new SOTA average performance across 7 benchmarks on SOTA LLMs with domain-undetermined data.

Poster Session 4

2 papers

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

FlowerTune: A Cross-Domain Benchmark for Federated Fine-Tuning of Large Language Models

#800 · Yan Gao, Massimo Roberto Scamarcia, Javier Fernandez-Marques, Mohammad Naseri, Chong Shen Ng, Dimitris Stripelis, Zexi Li, Tao Shen, Jiamu Bai, Daoyuan Chen, Zikai Zhang, Rui Hu, InSeo Song, Lee KangYoon, Hong Jia, Ting Dang, Junyan Wang, Zheyuan Liu, Daniel Janes Beutel, Lingjuan Lyu, Nicholas D. Lane

Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models

#113 Spotlight · Daoyuan Chen, Yilun Huang, Xuchen Pan, Jiang Nana, Haibin Wang, Yilei Zhang, Ce Ge, Yushuo Chen, Wenhao Zhang, Zhijian Ma, Jun Huang, Wei Lin, Yaliang Li, Bolin Ding, Jingren Zhou

A scalable system for foundation model data processing, offering 150+ multimodal OPs, cloud-native efficiency (TB-scale on 10k+ cores), and diverse interfaces (Python/APIs/chat), widely adopted in research and industry (e.g., Alibaba Cloud).

Poster Session 6

1 paper

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning?

#113 · Zhe Xu, Daoyuan Chen, Zhenqing Ling, Yaliang Li, Ying Shen

We propose MindGYM, a thinking-centric data synthesis framework that injects cognitive traits into QA generation, enabling language and vision-language models to self-synthesize high-quality, low-variance data for efficient fine-tuning.