Membership Inference — Was X in Training?

Loss-based

Model has lower loss on training data. Compute loss on candidate → below threshold → member. Simple but effective on undertrained models.

Advertisement

Train shadow models with known membership. Learn classifier on loss patterns. Apply to target model. Shokri et al 2017.

Advertisement

Test perplexity on candidate. Compare to same-length random text. Lower relative → likely in training.

Determine if medical records, private conversations, copyrighted books were in training. Regulatory + legal implications.