Training Data Attribution

3 papers across 3 sessions

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Final-Model-Only Data Attribution with a Unifying View of Gradient-Based Methods

#202 · Dennis Wei, Inkit Padhi, Soumya Ghosh, Amit Dhurandhar, Karthikeyan Natesan Ramamurthy, Maria Chang

We draw attention to the final-model-only setting for training data attribution, propose a further training gold standard for it, and show how various gradient-based methods approximate further training.

Poster Session 5

1 paper

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Distributional Training Data Attribution: What do Influence Functions Sample?

#3901 Spotlight · Bruno Mlodozeniec, Isaac Reid, Sam Power, David Krueger, Murat Erdogdu, Richard Turner, Roger Grosse

This paper introduces distributional training data attribution, a data attribution framework that accounts for stochasticity in deep learning training, enabling a mathematical justification for why influence functions work in this setting.

Poster Session 6

1 paper

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Enhancing Training Data Attribution with Representational Optimization

#107 Spotlight · Weiwei Sun, Haokun Liu, Nikhil Kandpal, Colin Raffel, Yiming Yang

AirRep is a text representation model optimized for TDA, offering performance comparable to gradient-based methods while being significantly more efficient.