Roy Rinberg

We Built a Tool to Protect Your Dataset From Simple Scrapers

by TurnTrout, Edward Turner, Roy Rinberg, and Dipika Khullar

Author: Alex Turner. Contributors: Dipika Khullar, Ed Turner, and Roy Rinberg. Dataset contamination is bad for several reasons. Most obviously, when benchmarks are included in AI training data, those benchmarks no longer measure generalization -- the AI may have been directly taught the answers. Even more concerningly, if your data...

Jul 25, 202565

Roy Rinberg

Roy Rinberg

Defending Against Model Weight Exfiltration Through Inference Verification

Reflections on TA-ing Harvard’s first AI safety course

We Built a Tool to Protect Your Dataset From Simple Scrapers

Text Compression Can Help Secure Model Weights

Roy Rinberg

Text Compression Can Help Secure Model Weights

Reflections on TA-ing Harvard’s first AI safety course

Defending Against Model Weight Exfiltration Through Inference Verification

We Built a Tool to Protect Your Dataset From Simple Scrapers

Defending Against Model Weight Exfiltration Through Inference Verification

Reflections on TA-ing Harvard’s first AI safety course

We Built a Tool to Protect Your Dataset From Simple Scrapers

Text Compression Can Help Secure Model Weights