x

LESSWRONG

LW

Олександр Хворост — LessWrong

Олександр Хворост

Олександр Хворост

Message

1

3mo

Олександр Хворост

3mo

Untitled Draft

Do Four LLMs Think Independently? Measuring Epistemic Independence via Evidence Atoms TL;DR: We ran a structured protocol across Claude, GPT-4, Gemini, and Grok on 6 claims. Verdict-level agreement: n_eff = 1.00 (identical). Evidence-level independence: n_eff = 2.83. The models are one witness when you ask what, but nearly three independent...