Non-record: SLOT eval-time delta optimization + QK-Gain (val_bpb=1.1179) by ibarrajo · Pull Request #1236 · openai/parameter-golf

ibarrajo · 2026-04-01T23:54:36Z

Summary

SLOT (Stochastic Logit Offset Tuning): eval-time delta optimization that adjusts logit biases per-token, achieving -0.009 BPB improvement over base sliding window eval
QK-Gain: scaling Q/K projections by 4.0x — hurt slightly, included for documentation
Based on Approach B architecture (d=576, 11L, int5 GPTQ)
TTT disabled; improvement comes entirely from SLOT

Results

Metric	Value
val_bpb (SLOT)	1.1179
val_bpb (base sliding window)	1.1267
SLOT improvement	-0.009 BPB
Artifact size	15.2 MB (762 KB headroom)
Eval time	419s
Current SOTA	1.1147

Key Findings

SLOT works: eval-time logit delta optimization gives a reliable -0.009 BPB without any training changes
QK-Gain 4.0 hurts slightly: scaling Q/K projections didn't improve quality
Non-record: 1.1179 does not beat SOTA of 1.1147

Rule Compliance

🤖 Generated with Claude Code

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

Non-record: SLOT eval-time delta optimization + QK-Gain (val_bpb=1.1179)

e1e32e0

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Non-record: SLOT eval-time delta optimization + QK-Gain (val_bpb=1.1179)#1236

Non-record: SLOT eval-time delta optimization + QK-Gain (val_bpb=1.1179)#1236
ibarrajo wants to merge 1 commit intoopenai:mainfrom
ibarrajo:approach-e

ibarrajo commented Apr 1, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

ibarrajo commented Apr 1, 2026

Summary

Results

Key Findings

Rule Compliance

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant