Influence Functions

9 papers across 3 sessions

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Final-Model-Only Data Attribution with a Unifying View of Gradient-Based Methods

#202 · Dennis Wei, Inkit Padhi, Soumya Ghosh, Amit Dhurandhar, Karthikeyan Natesan Ramamurthy, Maria Chang

We draw attention to the final-model-only setting for training data attribution, propose a further training gold standard for it, and show how various gradient-based methods approximate further training.

IF-Guide: Influence Function-Guided Detoxification of LLMs

#1400 · Zachary Coalson, Juhan Bae, Nicholas Carlini, Sanghyun Hong

We use influence functions to attribute and suppress training examples that promote toxic behaviors in LLMs.

LayerIF: Estimating Layer Quality for Large Language Models using Influence Functions

#105 · Hadi Askari, Shivanshu Gupta, Fei Wang, Anshuman Chhabra, Muhao Chen

We propose LayerIF, a framework that employs Influence Functions for LLM layer quality estimation. Our method captures task-specific layer importance and improves both expert allocation in LoRA-MoE and layer-wise sparsity distribution in LLM pruning.

Rescaled Influence Functions: Accurate Data Attribution in High Dimension

#2907 · Ittai Rubinstein, Samuel Hopkins

We evaluate Rescaled Influence Functions (RIF), a fast and accurate alternative to traditional influence functions for data attribution, particularly effective in high-dimensional settings where standard influence methods fail.

Poster Session 5

3 papers

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

What is Your Data Worth to GPT? LLM-Scale Data Valuation with Influence Functions

#103 · Sang Choe, Hwijeen Ahn, Juhan Bae, Kewen Zhao, Youngseog Chung, Adithya Pratapa, Willie Neiswanger, Emma Strubell, Teruko Mitamura, Jeff Schneider, Eduard Hovy, Roger Grosse, Eric Xing

We scale the influence-function-based data valuation method to recent LLMs and their massive training datasets.

Which Data Attributes Stimulate Math and Code Reasoning? An Investigation via Influence Functions

#5404 · Siqi Kou, Qingyuan Tian, Hanwen Xu, Zihao Zeng, Zhijie Deng

In this paper, we propose a fine-grained influence function framework to trace how training data on SFT phase shapes LLM reasoning in math and code tasks.

Distributional Training Data Attribution: What do Influence Functions Sample?

#3901 Spotlight · Bruno Mlodozeniec, Isaac Reid, Sam Power, David Krueger, Murat Erdogdu, Richard Turner, Roger Grosse

This paper introduces distributional training data attribution, a data attribution framework that accounts for stochasticity in deep learning training, enabling a mathematical justification for why influence functions work in this setting.

Poster Session 6

2 papers

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Understanding Fairness and Prediction Error through Subspace Decomposition and Influence Analysis

#1104 · Enze Shi, Pankaj Bhagwat, Zhixian Yang, Linglong Kong, Bei Jiang

We balance fairness and predictive accuracy by decomposing feature representations and analyzing their impact using influence functions.

Better Training Data Attribution via Better Inverse Hessian-Vector Products

#3907 · Andrew Wang, Elisa Nguyen, Runshi Yang, Juhan Bae, Sheila McIlraith, Roger Grosse

We apply the EKFAC-preconditioner on Neumann series iterations to arrive at an unbiased iHVP approximation for TDA that improves influence function and unrolled differentiation performance.