Bias Mitigation - NeurIPS 2025

today local_bar

Bias Mitigation

4 papers across 3 sessions

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Guiding LLM Decision-Making with Fairness Reward Models

#1113 · Zara Hall, Melanie Subbiah, Thomas Zollo, Kathleen McKeown, Richard Zemel

We train reward models to encourage fairer step-by-step reasoning in LLMs, reducing bias on high-stakes decision-making tasks

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

FairNet: Dynamic Fairness Correction without Performance Loss via Contrastive Conditional LoRA

#1212 · Songqi Zhou, Zeyuan Liu, Benben Jiang

FairNet introduces a dynamic, instance-level fairness correction method for machine learning models.

Auto-Search and Refinement: An Automated Framework for Gender Bias Mitigation in Large Language Models

#1101 · Yue Xu, Chengyan Fu, Li Xiong, Sibei Yang, Wenjie Wang

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Any Large Language Model Can Be a Reliable Judge: Debiasing with a Reasoning-based Bias Detector

#3712 · Haoyan Yang, Runxue Bao, Cao (Danica) Xiao, Jun Ma, Parminder Bhatia, Shangqian Gao, Taha Kass-Hout

We propose RBD, a plug-in module that detects and corrects biased LLM evaluations through structured reasoning, significantly improving accuracy, consistency, and scalability across multiple bias types and evaluator models.