From 99b080be7ee758616038526f297e9e4f8680734c Mon Sep 17 00:00:00 2001
From: "Dixing (Dex) Xu" <dex@weco.ai>
Date: Tue, 31 Mar 2026 06:20:48 +0000
Subject: [PATCH] =?UTF-8?q?Record:=20SLOT=20+=20Split-LR=20+=20Full=20GPTQ?=
 =?UTF-8?q?=20+=20XSA-all=20=E2=80=94=20val=5Fbpb=201.1015=20(3-seed=20mea?=
 =?UTF-8?q?n)?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

SLOT eval-time delta optimization + split early/late Muon LR +
Full Hessian GPTQ int6 + sigmoid-gated skip connections +
soft-round QAT + Brotli-11 + BigramHash(2816x160) + code minification.

3-seed mean: 1.1015 (std 0.0011), delta -0.0132 BPP / -0.0224 nats vs PR #1019.
---
 .../README.md                                 | 143 +++++++++++
 .../submission.json                           |   9 +
 .../train_gpt.py                              | 228 ++++++++++++++++++
 .../train_seed1337.log                        | 109 +++++++++
 .../train_seed2025.log                        | 109 +++++++++
 .../train_seed42.log                          | 109 +++++++++
 6 files changed, 707 insertions(+)
 create mode 100644 records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/README.md
 create mode 100644 records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/submission.json
 create mode 100644 records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_gpt.py
 create mode 100644 records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed1337.log
 create mode 100644 records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed2025.log
 create mode 100644 records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed42.log

diff --git a/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/README.md b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/README.md
new file mode 100644
index 0000000000..003d0d2d85
--- /dev/null
+++ b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/README.md
@@ -0,0 +1,143 @@
+# Record: SLOT + Split-LR + Full GPTQ + XSA-all (val_bpb: 1.1015)
+
+**val_bpb: 1.1015** (3-seed mean, std 0.0011) | **1.8598 nats** | **~15.65 MB** | 8xH100 SXM, 600s train + 177s eval
+
+Built on [PR #1019](https://github.com/openai/parameter-golf/pull/1019) by @abaybektursun.
+Previous: [PR #549](https://github.com/openai/parameter-golf/pull/549) (1.1194) -> [PR #1019](https://github.com/openai/parameter-golf/pull/1019) (1.1147) -> this.
+
+## Results (8xH100 SXM)
+
+| Seed | Steps | ms/step | Post-EMA BPB | **Sliding+SLOT BPB** | val_loss (nats) | Artifact |
+|------|-------|---------|-------------|---------------------|-----------------|----------|
+| 1337 | 6704 | 88.2 | 1.1309 | **1.10213** | 1.8609 | 15,647,124 |
+| 42 | 6706 | 88.2 | 1.1289 | **1.10019** | 1.8576 | 15,658,061 |
+| 2025 | 6684 | 88.4 | 1.1310 | **1.10216** | 1.8609 | 15,650,266 |
+| **Mean** | **6698** | **88.3** | **1.1303** | **1.10149** | **1.8598** | **15,651,817** |
+
+### Improvement vs SOTA
+
+| Metric | Merged SOTA (PR #1019) | This submission | Delta |
+|--------|----------------------|-----------------|-------|
+| val_bpb (3-seed mean) | 1.1147 | **1.1015** | **-0.0132** |
+| val_loss (nats) | 1.88218 | **1.85982** | **-0.02236** |
+
+Clears the 0.005 nats threshold by 4.5x.
+
+## Changes vs Baseline (PR #1019)
+
+### 1. SLOT: Sample-specific LM Optimization at Test-time
+
+At eval time, for each sliding-window batch, we optimize a single additive delta vector (R^512) between the frozen hidden states and the logit projection. The model forward is split into `forward_hidden()` (frozen, no grad) and `compute_logits()` (carries grad for delta optimization).
+
+- **Delta shape**: `[1, 1, 512]` — broadcasts across batch and sequence
+- **Optimizer**: AdamW (lr=0.005, weight_decay=1e-8, eps=1e-5)
+- **Steps**: 8 per batch
+- **Eval time overhead**: ~90s (well within 600s eval budget)
+
+SLOT is score-first: hidden states are computed under `torch.no_grad()`, the delta adapts through `compute_logits()` only, and final scoring uses the adapted logits. The model weights are never modified.
+
+Reference: Hu et al., arXiv:2505.12392v2. Also used in PR #1128, PR #1105.
+
+### 2. Sigmoid-Gated Skip Connections
+
+U-Net skip connections use learned sigmoid gates instead of simple addition:
+```python
+g = sigmoid(skip_gates[i])
+x = lerp(skip_weights[i] * skip, x, g)
+```
+Gate starts at sigmoid(0) = 0.5 (balanced blend). Adds 2,560 params (5 gates x 512 dims).
+
+### 3. Soft-Round QAT with Alpha Ramp
+
+Late QAT uses differentiable sigmoid rounding instead of hard STE:
+```python
+soft_rounded = floor(scaled) + sigmoid(alpha * (frac - 0.5))
+```
+Alpha ramps from 1 (smooth) to 16 (near-hard) over 500 steps. Provides real gradients through rounding, letting weights adapt to quantization grid.
+
+### 4. Split Early/Late Muon Learning Rate
+
+Bank gradients are scaled per-layer before the Muon reduce-scatter:
+- Early layers (0-4): Muon LR = 0.025
+- Late layers (5-10): Muon LR = 0.030
+
+Late layers benefit from higher LR (weaker gradient signal further from loss).
+
+### 5. Warmdown = 4000 Steps
+
+Extended warmdown from 3500 to 4000 estimated steps. Holds LR higher for longer, giving the model more time at productive learning rates.
+
+### 6. BigramHash(2816x160)
+
+Enlarged bigram embedding dimension from 112 to 160. Same 2816 buckets. Richer per-bucket representation at minimal artifact cost.
+
+### 7. Code Minification
+
+`pyminify` + LZMA2 + base85 self-extracting wrapper reduces code from 101KB to 23KB, freeing ~78KB of artifact budget for model weights.
+
+### 8. Brotli-11 Compression with Byte-Shuffle
+
+Replaces LZMA-6 with Brotli quality=11 + stride-2 byte-shuffle preprocessing. Saves ~400KB vs LZMA.
+
+### 9. GPTQ Reserve 9s (was 14s)
+
+Reduced GPTQ calibration time reservation from 14s to 9s, gaining ~55 extra training steps.
+
+## Negative Results (tested, did not help)
+
+| Technique | Result | Notes |
+|-----------|--------|-------|
+| Turbo-Muon (AOL + Polar Express) | +2MB artifact bloat | Weight distribution changes break compression |
+| No-GPTQ (PR #1120 style) | -0.005 BPP worse | GPTQ essential for our stack |
+| Pure EngramLite swap | -0.003 worse | Same-budget multi-head too diluted |
+| ResidLambdas | -0.003 worse | Quant error compounds through lambda scaling |
+| LeakyReLU slope=0.3 | Neutral | |
+| Partial key offset | Neutral | |
+| BIGRAM_DIM=192 | -0.001 worse | Diminishing returns past 160 |
+| TTT (score-first SGD) | Neutral on Full GPTQ stack | Post-quant weights too well-optimized |
+| Mixed int5/int6 GPTQ | Broken or worse | Needs full PR #1089-style pipeline |
+
+## Architecture Summary
+
+| Component | Setting | Source |
+|-----------|---------|--------|
+| Layers | 11 | PR #549 |
+| Model dim | 512 | PR #549 |
+| Heads / KV heads | 8 / 4 (GQA) | PR #549 |
+| MLP mult | 3.0x (LeakyReLU(0.5)^2) | PR #549 |
+| XSA | All 11 layers | PR #1019 |
+| BigramHash | 2816 x 160 | **This submission** (dim=160) |
+| ValueEmbedding | dim=128, layers 9,10 | PR #549 |
+| SmearGate | F.pad causal shift | PR #549, optimized |
+| Skip connections | Sigmoid-gated lerp | **This submission** |
+| Quantization | Full Hessian GPTQ int6 | PR #1019 |
+| Compression | Brotli-11 + byte-shuffle | **This submission** |
+| Optimizer | Parallel Muon + Split-LR | **This submission** (split-LR) |
+| QAT | Soft-round alpha ramp 1->16 | **This submission** |
+| Eval | Sliding window stride=64 + SLOT | **This submission** (SLOT) |
+| Code | LZMA2 self-extracting wrapper | **This submission** |
+| Warmdown | 4000 steps | **This submission** |
+| Params | 27.2M | |
+
+## Setup & Reproduction
+
+```bash
+# Environment: 8xH100 SXM, PyTorch 2.9.1+cu128, flash-attn 2.8.3
+export NCCL_NET=Socket  # Required on GCP H100
+export SLOT_ENABLED=1
+export BIGRAM_DIM=160
+export WARMDOWN_ITERS=4000
+export SLOT_LR=0.005
+export SLOT_STEPS=8
+
+# Run with torchrun (evaluate.py handles this)
+SEED=1337 torchrun --standalone --nproc_per_node=8 train_gpt.py
+SEED=42 torchrun --standalone --nproc_per_node=8 train_gpt.py
+SEED=2025 torchrun --standalone --nproc_per_node=8 train_gpt.py
+```
+
+## Acknowledgements
+
+Thanks to **@0hq** and **@valerio-oai** for organizing and maintaining an excellent competition.
+
+This submission builds directly on @abaybektursun's PR #549 and PR #1019, which established the LeakyReLU^2 + Parallel Muon + XSA + Full GPTQ stack. The SLOT technique follows Hu et al. (arXiv:2505.12392v2) and was independently validated by @AnubhavBharadwaaj (PR #1128) and @abaybektursun (PR #1105). The sigmoid-gated skip connection idea draws from @mikeapedia's PR #1089. Code minification approach adapted from PR #1089's shrink pipeline.
diff --git a/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/submission.json b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/submission.json
new file mode 100644
index 0000000000..61440cf21f
--- /dev/null
+++ b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/submission.json
@@ -0,0 +1,9 @@
+{
+  "name": "SLOT + Split-LR + Full GPTQ + Sigmoid-Gated Skips + Soft-Round QAT + XSA-all",
+  "val_bpb": 1.1015,
+  "bytes_total": 15658061,
+  "blurb": "SLOT eval-time delta optimization (lr=0.005, 8 AdamW steps per batch) + split early/late Muon LR (0.025/0.030) + Full Hessian GPTQ int6 + sigmoid-gated U-Net skip connections + soft-round QAT with alpha ramp + Brotli-11 byte-shuffle compression + BigramHash(2816x160) + code minification (23KB wrapper). 3-seed mean: 1.1015 (std 0.0011). Built on PR #1019 by @abaybektursun.",
+  "author": "dexhunter",
+  "github_id": "dexhunter",
+  "date": "2026-03-31"
+}
diff --git a/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_gpt.py b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_gpt.py
new file mode 100644
index 0000000000..4225f207c5
--- /dev/null
+++ b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_gpt.py
@@ -0,0 +1,228 @@
+import lzma as L,base64 as B
+__wrapper_size__=23349
+exec(L.decompress(B.b85decode(";TBUyW?cX?9Eu`uszf$Krci>25I-HuUNjF`N?9VI&1P%41Wt3M0HcnGi85w-CJ8_DYWqCUhZ{>g4nvkJcgHT-RDPNuEud#fAnQaL"
+"SNvkmp$G^X{d(AZjRFxFy>2wf?R)sc9i|_R`TJuej!(A6t?t2t=+vR+ec}DB7#mA!0U3ZPbPd!4VG0zt<mgm>IP9Y`Qh|Y5(~*gP"
+"Uu|L4Sm$iKcMKwI^Xm?&;!d4_(?pkoFq&`({X<p6<RxlkcxQ0&2;cwx6?hk3*)Ee5h(;!E+O#eeSyMhFD~;;=)_um7J#?>;YasmK"
+"ijVu_E?FVOr018tgy@qyX@~WH+K-{#(pQ3sorfjje*Nqq`A<W-k}*tDPN5<hE}}4ru_E7Yy03%?Ks=<eKAD<M-B{5Bq+(Cxey#zk"
+"H%r@S`e-aNv9Gefe2K_1S0;XdLh1O={-?Jat0WgbolQlCIqmPOz^9qH^8L~67x-RTVrp)Am)r(;c56{?AX)h|()WPH&xdh{O~vLC"
+"LYWiD?Q#`mKK3*uV@)6J%HBuT&?(D04`{M?hH98rb7(fxYl@GgASafVr!=N4$v;L~mUvG60r7IppV)ozz}9hMZo|bWQ<sdk(0L<)"
+"=Z2TR?s83^2$B*i2Nm&1k7l<JAfjpQTTJ=W7A9?5bereX2R7il_hPJPyYq^FQoFd)4Ek^i1Y#&nxuLBw@p(&LWR`PfYpzI+nR1t&"
+"258@776@j#3s&ntg(uhWUVX5V{AL3H6@W33*&%i~0I`KO)F2Ic&nFebOP=7+HF0RR<oA1Pg{#^|5<I9j9d;_}Co;Ugo*f!=FR1b#"
+"<d+Xk$f1)F49KV;cdpUr(5})5j}0;O<hnJv0C6eaJx~$uInhw(GtGPz7x|n1dOzqL;H#5jVFs3+jyb~s;H44A|GzixXLcbO>jnAH"
+"#2oqxm<dtbD~f+>Y=ERi&#v}WlLw)|zW>xaD0R(Xii$i~3lIJSNYhuO;!r(0jIG}Mj)~w>w<o>{F9*RCJ?e-N=g~oga2Dww6Q(2Z"
+"Qnkf1d)+V-e+yFgmA)BGt=5*Ym<40o?9<_oU}`tCF`w=UrX(o<_#FV!AcE#rhRFf|eRF~3Cjq5wZ=`#2v$GndICM8;50c{)-(6Pv"
+"m6W1aAqaI7KfqNozgRm8V*(YZGw*&-o><sNY9q`y<{wM2soQB(GqmuSDu%DFRWPiZ<g}BEo`W^cYIxp%x!}L`nwITX!-|Osx$JfT"
+"1L>D$c<FiS)28DYQRSsl&=}rfm-S--L>r~1a(o`+us6bu$Dk<nk8KTpQ!I87!e|JGj81vMrSN`_{yforiZtrK$3|!*>pQd1Cn&2q"
+"85g02HR^skp|5m`b5?2gKu-HF<A;Gc!r-|<2Aqs%FIY9e1WZyBb&V88a4EC2QFC-+9?LH$#9_8~+n~yjds5$PCr|5gjNwi3fqD`~"
+"KY#_Qepg>d2ygiroiK(k`X~d1yS3C?oyQLL1J10OdE=d958oL1P4tcVKW;f)cF^7gQ=Zv3e0GnxN);;yWTj_Ge0G+07^HQcg%}14"
+"d>ww#&%HCEtU6^UkHU;t50#Z0tB+=G)x1HK>6(Jj%9FHqpGhOK2oqlkrCXFz!3w+ibOxHCTcmP%5-b*AErx0=^6N=n_ol^4;hQ1="
+"*Gz_l_2ve;*DDCf+=6B><yn1R1*qT?MYQcstgreH#Jn>^c3YU@<~&j$lrD#^=|V!JNXSbQ18=nd-7u8c<FyC4B4NDCA79q70T#R-"
+"Uucw}=5<kcxbteBFHTfM%kz%hfXJXN$${e87K`8Ok0d$gzHv^WF-bbKV+^b98aMTPo0+zm%s5l&rr+3~K+XXGX6prP!MmvX3a~63"
+"n#de`0i9-m76~li$Q@g<CEB|L@h{}`1=5{d2QX;9)$}@?6>ifrEg=&ND-sSl<HuwX@xO+Gww?1Q0z|sRPe;@s@dXRgQ#2$<_%iPh"
+"H2KB0LVq3(;<o8sa;-6yfw|aoMLg4M^C*NxnU5rep*{k_RU5XJ&>YV>x0vL!1n8$Ei^xW%QH+<dN;eG7ApeGt;CEcZ+jMJba=zX("
+"cJ{v9O{vu){9eU}U2=Y($R)B+3e#32YqlrIMiJo`1k);iwk<8Hwtpa?rRxOW0)qRp<2(XSCp0FEc)X}XE&F6M+|2vVEr@hdtRI`O"
+"?`Ra7G;=qgXj1b}S7fH3vS*{;A^Mg+qxx>hEvsZvJllS3yr>snOw+lTjIj`{z@UxNNTtQ1Ck^prKdoM{F`;>LPCyV`#dJwgp^Vav"
+"9}&kM$~E6Ty}O1uyAK+sUr{ggHgmN>FZ-KhFbAhPeQRwh4_S;KPThZo(3UZc<#VkCL5XBbg#JSsWw?CMeEp;zh<XB-wXaGm3R<jp"
+"<jmUn+O1Xiey8{;(gM|3Tnpp*V|?U@snvP7Dnv^YFt{_O%!ee(cy)G%oli@O?u7;5vr>hSxe|Q=J%YQz>mobcRCy$IC32LAHtkys"
+"%;npjvY!O(1W#l8lkn(p2*}i=k8yNF{k2UVOC%ALD^`AKo|R*-u&V82Y1gjHL$+&r1tVk?Lm!3mJ&rm`xN`V$!?8G|^7ez8HN-fH"
+"N(y6hHy=V{1YbD^D7-F(`(Q`{M5DbR4|TUozLQwV=_tXYi-M^C1G7pNbohKEjpf{gf`6li`WV`&pW@-&G2$ti)*@Q3Djks|%AaZX"
+")t5r7o{cAHk@dIIMhY!%oreu6!J&o@0)WfPJF*xa8Q@>%BIVl%EB2{90cxcM>aHc)ZN>Y;RC|4d5qv0B2d!07YzFIA{$eU1?E+aY"
+"l97Ik$AfzqoQ<Yw%nVh#<EF&1*R_L4HOwIxv`dq`!80sa?!*O2vf!F<>pzKzx!6cHIQGPkIbkK09lOwS*vY3O>An2+w-2Yo#@Eg$"
+"IXV{ga_?#)Al9FNu!7}K+U)`k`t;E@;V>C8luA%?`fg@M;??|;eaM{|Rjt{cr8Jp<y=5j%_+Pt{+GVK0YB=*f9=REb{;p|eSs@FT"
+"WxkEscBF81HROmT%<*{BIfw(5)Qc&@_7X?qr)crcHL^xq{SovaWK#AOivoh)7<-{OxKTqj?Hp`TC_FACb=9xRJVXtwwp_jCdBQxA"
+"9f*_K@g2BSX|-F`5aKJq1j10?RI>zn757f65;B0+T8y1kgRCb=Dv?ThR`heT)a*j+3<`vp9LW454gEbcL3sQ`iR4Vf@TUGw5N7Qf"
+"mAP!g16qGeV6$x4;&sPhii)s!63xnl{XZ&&Plk*-^6M`);d47O3kfCzr_%<SFqllW$R0mxxG0@dhdDdmzJoUeO&KM(UV6)nLZtbi"
+"$O&b^S*BLOL54JKj3d55{6A^xjk?yc^7e-jmPq$hq@{Mp_x;DocngI#CufDOY%)W?Lr4}Av#UJ;1h~p2)`q8ieBcAt(aw)sy*)tv"
+";p&~cw6EI8V@wy}{Sw>UpH<zi^|Zv6VM&${dY3w4gyYW#G!vi^YYC`g4&IfH!lvrL5p!F+%^|?-CMG1}P8lLjP8*O)m*g?3qpq(*"
+"Np`lws{rXANLndlaGtCSdu**@qEe14XY7u8DE=Y*Z}3@+Z$SajZcxKuZZ5nRf?O*ZZabgaiwaV;AClad-wlTABApLN|3S+^vlg}+"
+"mCi+c$wPuomPmD12V573?zG=HU=p4ceZq?jh5q@}c1|Z8Q1cg@=U5lCYWuTGVtz3-keyH;N$t1tg%-V*pxSeS;gJ@pOl-4hI&JkD"
+"Mn1RU@*bHi0Ge3jz$k`sWaYETqsB^EZ=59dbeq6CWm860_IHT>YgY;IAsShVCt4eR>U^A+Am|j~{8P9cQ61!x&9_B}sBL!ksV*ep"
+"(8sn?fhPQ~WZ1vB2r;S0lgp$^E%9Lk=ro>FEk<j*hf&K74Ty5H``Pg%U^d_B$7FYJNL1DKBJ@}?8i^TN!r=$@F1`n*&%0F+eK_RN"
+"6GH)fQmeHM;c}1n;VL9x9as5r>_jK;7aP@cW+@bey=GxtHz%a(K8R)}&gg}(pe-YASvw4eZEaR1r5(J&oPQjLRQG?M({8T5$M(J4"
+"ZI_`=-+-x-jUjXU-Qlixn$6YtBH}csW##=W4Zf40N=XFestH-y{@y=cYqXq$Lww(HRQS4;;OO@&$IE6Jef8ZGn@*jO8B$9x=1VCz"
+"tiAR9`S2Kx?&|SSLY6c?*$4rh8R$x*_y|7`2}c9n-JDpJoj*kMv{sg_vyIW+QC72@==xH+9q%v*kPl@bi(A+_F}AovA%xSPOupBM"
+"X!<GtDoVwUOgAy+gE5HMMP_E=-|otFq=ZGQfpu-M6dc4w@<zQ?I?$(#Q%Z-?0V#1>bF+m!BP!Db(EUJsTb_HfJKUv?xJ-~qKo1Z}"
+"{Ua7HHuI5ECE=itzw^AXvLn38AJ9OGczhOby<avOr;LeBhhzPb&QhkQQPa*idVrsG<N3lJ7R)}Yo0?t0!o5CQ%AJ}eR0F_d@pzee"
+"n_s@ZCBCF9-2)A)PV9E5ew_}G7*5K!C)qrq`JZXV2}3!5q_ua>UYhaD92BP$#>(CT0NM!t01RAryQkWrQpnI?X;k~?UO_4B1im%z"
+"<&rNuz|VW@XyLB>g6O0wHdE+D8Er}L+$U|BQq8W}v%x`K!caZgf(^Di##VDW_PqR<*aAz30x{8_pIKi{c-J>+^`IXLZp@4a!>;7S"
+"D-*4#drki2ued3nKJ`-`Z^he$JBvRnxs;&*vp|^l4apU2$OQ#l-buz0XeZZJn!bO>k8@84bjD@oWP5FE7<&RNH4k#;_(U+w==9Ma"
+"b4T=lc4D4BLU8$Bb{f1)`%nps(`PHWO!IRZut`f6;$tKZ+%YufXhL|GAufo-9R$HD{lnMq8g2^;&qC6YsILKP$3wRep|ycyOqF%="
+"!P^t3U6vVAX)zlQ+7<Q-Vhg0L9BsYoMWNIrRn=19eKzSez>1=Fv+M>m^;TRU5inPd|8+p*!^)k59O)VAp|&PMzwS*ToaxiF5dOI4"
+"=}$~qcu@Cv$UJTyA{HOrLdY(`sez6e;-7SLGo<*YEH>~^#_Y{_v<WGYd<3y6y6))wvxr>h?tKCPRzY_mHR%}FXFxG;XaVprh5-~-"
+"S+P6REJOkDQ_ZraWdCEGDO^-5_}C~xZ*$0kvO=w_6hGU{!di*QV-riw`nkgET<owecinL~%6kwt<P8@1Zcy!xUS$W_nw=aguUDaT"
+"fYS`d6QyoO{fv}qIEWGyF1s1z5=LEpX6bdTJPfEP(3H+uDtLYU)IP;|vW8YNu-YT=;T4vAFdGWW(RVb47ZY5qmCg6PlN;l7yCmA}"
+"<XJcE!pSPXsApv_LZ`v7rx=eY(ty}r_KzRWGai<ZD#PGt2L$Ckepf0GWUzQeh6fY@z;g=REo=u>rg`;1XQ?SCDDbxCmMU6}S67>_"
+"8iGt)i7aoo9kB`KmuFnChdf!#E??K+SC@#<M{js;i^XJ?nZa<a(zOm}niVUoRt?W?AdcORie7>2gl_FoS*%<BqHut*<kjG$+Lm->"
+"*Ad@F9XSV15jh+rTWy@SqaO|fiE5I7-CrCENCr20l0qK5of&9m3V>}YjEUwjDz%SDrnT+`UdE})m&QRB(2IZyKas`kBma#b{7t?0"
+"1X?u%=W%nE;7C9(qtS<zY1qi!M((G$K=k^3wqz$Clr1=j?f1}Y4x*m(1wTvrR_kTTiyZs3fs7MEOKLfFx0=~#pM2NY=)I(sD+XZX"
+"swrp9f`jz@pt|O`Cpw=MIzgZO!+vG}atWT%Eio_IUb&wQCKq0j9n`uTfaldaY3q=)521YGEa-~R00N6r<*`If-Rg$IXUZ9GhkNoI"
+"Sx_RM7`o+(>I7s%PM=0N;$PKKb7Cn4CumeooMtF)=5jjY8&NlI0*rUFIZjf}-&~;$_a2>|`T-}c$NgrMbjZUOOwOs@^A=JRRW8U7"
+"XbY?z7!uu^b>+ro;+VneU$S~?b~&CBhm`$&GQ4k&vm0yN{hIVrt7~rLmUo3wtIJ`!^H=r-m*2+a?eFUoUoTGGkWs<Z#XMJ0a54=*"
+"RUx?0@@*ro9i|YVc$4&*AEWP-e!MP_WExfj;=~0OiL7<St8cPc82g_5$_;?$NJ;Uf67rQ%CBc^_aQAPXHyE?hv{xp-p-4d^SGNh3"
+"b-0A=RXVqocM1W>eMbQQIloTLrJTbE3($ZDz=%u4@poGjg(}7icWu9~cEsB>7T7D@6p3Ybd=KXv?+sc>yW?4ALD&Px9)c-EvJ)dB"
+"+=xNZ@WflGMyQ*a(c98NI^{aO&DAlZljm6U9CD;i6!cE1_gJGF+$+2T;nxvS`VD7%JbbNp0SN2ot+&ul89B$ze&P%<<KZ}l5Lfw$"
+"jdXOq0wcS)GNm{bR`g)W<%Mm@pETqA0&EM=t`}Ufkc8Ef%h$r`GY`>;Jb&8~h*Y;hHiZa_UWv9AM4vEq^%`^?#sl(F=l|iksTqtn"
+")dRo=N+4(i5v{)%bU%UAZ0`Av{+g?)2VqR+&IZ_@rN9|dNr(VlDxOz+C|#WYmr_&y^aj%dp`n^XO%ZY{0oEzZP!2vJi(nl-%K;?D"
+"4y`5n{Z89?l`GHIQ;>7VccD=gl!ZFI&Wz;f1$U>XJL8~2VwL)`8n+G4f7!y3<~3!}k#1aNgugmS3uTa#!`AqH<_bFQUN;DGn(no~"
+"c^Mqn%pCuiKt#swOscwCly&ummdMj|e*?vEIdrIm0xblKBF4-nCEo6U=^THik{+HkQ=*)a9ZNAjnjJvo%N!)JqKXbO3kICY@SjmP"
+"B*n-+ZxH@`<}j;26A<BDsEK9ca<%Ihev92s&SgEanwzDPgM(R8UD4WIhl@a)%7~ANt81z~<l+h@okbPkrB_7mdATw(8A5SuNh2h0"
+"c5(y&<unKA>qX)K2gVor1P9&I77!`H5ws*eL+|nBN3XanDen;VmIwftJahG7%ux9uyM)`POxYA$>1YAxvL)D4Gkz6@jZV!6j1YUr"
+"%#JaQ@S;O1haVVqsN&>iVW^-mtl7;FjLuM7QJvTl*(_vuBayARqRgQC(x7wF3MG3A6@+=j6H5Kmq0}<v9$lhnM_(|lyPdEnDv3Wz"
+"JOckiaSO`P5{JM+MGtbk5MKSR3&7>FzqZ{27_mjPy~@4^+EF!i6+=5*vE#UrJdY4x5$<E|vl^fkDX2jzPBWWiQFra(BooW7!&|?&"
+"np&&LUnOVWE&+rYUasIW!Q5}hKd$5==`H5QjUg!2ari!FkfGR@fTkgdv`&i531sr0$5#n}9~*k$Unif<H+xDDMrfCcFXc6<B4Q-Q"
+">!R%gy>n!!J<*eb%jGvghVfi;9@1%ez%LCSE*rEO;<Td@HHr*&k;PS<e}%uDqFs5MqLpe|^S9P^slakOo6|mRV${!ail<iqK;XlM"
+"cbpwiLW6RcC=&nC_*ezt@*Rn<dt}=?HeLATj2g)MzN8H+TsG2}>7s!%9xYCd>LY}q8C6m7PabZ8>;G2YN1&U(5mGRQhUtGnAq-9I"
+"B-WI>6UB!Lnx5Hr$CU|z8CJr3oWNRu)H^ZX*EniR4iZMpPqHT@eRG4`g)3F3=SUz;9uw#^F9+Q+yg1N?hSfFP4@jZn#v2|^8WXUn"
+"P9U&h)AjK~unzZtnDC*k!NV{@Vfy}6k_vg+#gV{N$LNRbwwjntVXYx(XEz~Hiqo#u%I!G5lI(z(iMz_~V%7o%v+Y+t?Q;=uztF_R"
+"{{0Tlq?sdi4U){T2Pes@=kN<GAm(8}t%h92VmyGBd4|?i%yhA~LJ!$FBUU7QOK|8`9SrWmlFl8JH6TwsPTi%dCixT1QY<9fJvmtv"
+"i``|pgp8XcAK^K}r)Ku0`Fk~lIjuHEtxDbgD03K$07)l=p$YlFLRSrKI^x(76pwoaLd1!4fInEBqmT=JoMxsRC?%63t<ze##4lUN"
+"4xI0|B?%h}Ej}9{7wu};?Q;~u>U?#&+PGEXQlSpvb6$%{JS`ukp#`puv*3sSnGFqTGbchN4(kb3T?ckBu{tiboBgQFoCIN0*D3P6"
+"Cs`aHdI)px41S!j>X){3;8@Zq<|WH$)Sy<n;=FWP4+oclH9sk-_rg8`$|E2+&85nK9NqJ~#4iZ46y2hSF84hx2>S#d?fufl2ASw7"
+"C_z}j)<*$210aI-Z$YlQyaevpS%@m|38DEU($3+)Mn9)jX&;7;O7=h(;-zzRfUZWe@tK;ay$sNeM5hXBSz(Y*=j8p8C4F?=Ou02~"
+"@@2)S?^4@4@WxkzQ^#ySrTY7q=~K%3k#DL+a3#>y*IA72JI;hGEqQDV!(Jmp9-i0COafprb;}q0bMA$b2U|+l(-8Zy?gf9WP!kB|"
+"Tvl1m^%gwOx-WAYx!~=&i`=*2Q<-uy_QjX~wf5b87$h?d!v#`s*%6k;x<C%!5Lz|FEnm&TVvzMg1c;k(Ma0ymTbCUy?%gaBJReUN"
+"BU(`hw9i{qNtLm5fton5X>5LY#X0NcbX6zK@`&mbZy;u_#QFi9XLTA_7$`D4Z&JSMVycX_2|{%7%jltA{b)2uh?&gh3+3#`^U-TH"
+"=X_%AyigC=>oh?{jFw#0H@gJZTEmcrCvB|BXM)>f+450ODew(IP44u>D^s-0+pWUSZHcGzzs{W8ut1`}%I#kE7VkBPKC(i&+I|6~"
+"X;*mEiiZ2SXig7cYL2Tr0;d$HtN|Y&N%jbT;t)+s6-xZy;SQ}U&^`t|l>uZpC8R^pPrgI*RYC)de0#seOXB^l4nXb}3XhlMiRj}K"
+"{CoCK){>^HrPE9ZF_oq9q64@9x$80PNo!|IMbbS?3y=e;I7T^JYf4@lYdy`V>+0#w*dgo3&j3y>^e>jkf(6y7oIvs~;#RrIMkqg#"
+"0aD2yn+KGLY;|{jH-xHzCm~?;za<`T5+rqc+R}0)B-GzkMc;6zCEVY>z(z<e1JnTzK3?$gvd-;E%dUQajJ5WxsH3?p7-@p^ic(Jk"
+"2zc`bDt--`s+2d64N@3B7jEF5u;<@?eljNF7R1zw{pCI)#HN0$=Y|o%o*>=r>H?w6qge`)F`&RDMA=CMe5;#*-wQ>q`G|AJ`5~sy"
+"6&4=;$f=dJ!7vxfHF8xT!jIAPBVKoYQD?;~@Hdj_z_E+sa9~X;$qOXSu-SNmf&CkWrWIOfk{eQ(<i)EFQ;2<pg?CSf%M09o!bD*T"
+"bD|(Z(RN9c<R<<tbiI@F9L#tR2~RdL$sbx2JYs^sHsjIuOX?d0(P$>+2n5&pHf6ltuj2#pVQ3UQPM5^i6Ks#&UAm2{@LnrXdzB+v"
+"jM*^!j4rf6M8&!eXj1a&bI@n{mKHB{v0Na*>OTP$$Et<BgzD`GL3YZ%1byUVfFl_yvZjM6XAti$uIu*@EU<}|5~lF=t8Sh0=bUGz"
+"rg!JK-EzWU6ME39z53ORRa%oxm%3MEQb3nDC49FrnTP7$lQT;YZjkI%aFTl?Eg^jxxMbYHfVkRNP1#@4a;Q6x+P=gl>b|h4s;XN9"
+"_KSt8;I8eGm!X}O&M@4joN_uuR%brPghuz>ko*<}dg$Yb31gKL1^M!vQe0I%sN6JQ$US%dsW11Rn**z!{M;!SaKuA1FUxtipBY)x"
+"q@%!t*w*P)0EAX|)pS{E=!$xaseA8DOUFsa1m(x+*UAJ(?<*H|fOeqiHmiY=&e+6i_dbI~%UOZ9)nC9|r0z<g`{sqT1Ls~A@rN-@"
+"Ga%jhui&aHu7G|bR9x8z)3#8{G?&E6Kn@^1VvC_eub)affXMeA@FrdIU?N0%6(L?LowG$km7Rz?QgMD$NL(NmzpC%nMO=TmMy*Hl"
+"2~Hu8;0_nqqvT2*VV1RX#wZGOiYAG>NtN^FzNPCx&R!Drm&fMs{A+tX-Z^UcLj6io|IWgPPcQ1UCZSDrp;C;w>;gAC?uDi2o+5k}"
+"8XI=UVNL^iz6$%g&r&ZJFYpsfL8GmEoF#*OLH^Acx->N+qKC4YlqcG-n5RJ^7yf`Wf5=oRSEn^21;PqAzd$UN+Hp@h;JQJk9*%k)"
+"ly6<m!FW*l0|G)u177L_=g2=G;lF}j0y6z_D3vHC9xw!qRF_FuBH{xhBeh-AEUkVOSd}I8s2fb9nr_I<CS2)YQN;Iu9C=uw@l)ca"
+"+VIHlQ^%Iw1G}{O)|qNkJ?AQvyG{<B)kKi|SQzR~u_W(kh8ZZWlhOVGB1ek?<DZ(9E@GeT^;m%!>LVD;`qfPHPTEBEa&y}!#C)>e"
+"Ic=MSbaiUKe<RA~N04ZjrV|*pfp6ID<h!qBIY6|*q0~JAiW0!B($j=mvM+^@*&7Fxxn&1O%pJ&`NOjE-3~{r<%kT(-lVONcs?XW6"
+")*i0~BgS9Wsld!x(eM;;$|rdW&4FXpn`6c~3hk`rAy~fe2aSvWv(1nd{#nU})o$5FhvbMl^DKQE^*m$F?}h?#JjIo7tbMt8h!oQn"
+"Zot0O8LDPWc)(YRZ0u2G$Ang^__+qED3WKFjR{y%+qf9DHB{-#sf_ZEX_rcaGQgphqqlLC4oy~>E<T0Gf`&f7NpnM<09(22yF6Gm"
+"fpG6&E&6sNVb^of0Hm?JFx%7|$;yM^ooGe0U3Btu&Os~4nec*<AWt?$t;W#8&p4P2#k5~=VG&QP(Bo;Fj{6W38IGNgf9kV-cunQP"
+"h}Pqyeq<iP>m9Oe*CG^-Z92xkN!7ZncfC$}ALj<L$3bT|qth|@gdtG~I2vHJ^)-0g9p`Lw78{p+1EzAvqlAI|C|%ZD1<+{a+)+vW"
+"twI%epU~p$JxsF3M;~qUi@X;mE%ID9pq$^q4ghgf`UmenZgUsam87Wt^_pop0+D%<1Y4Q{EAw8L3fNe>AEA<aaRI$WA(v-yYZIej"
+"bldU3zut7HXpv$W=+-Z-Lkp_ZG^)yfI4MNyPcGe}>u?<RYwW~#BeLjT+O@`LT>|=5>~i38+b1F|W(*Z(xr@>xTgm_zz+RAd*wqEM"
+"Q2#BvwLD%>sl5>PEbiJAvUQ4&o&W(Sgn{?5ARs504)6Z#f^<!Z3xuaoH^f3%ET+)doggNif0SR$pG6>V1*n*s@Yu-*O!^{=lKrPI"
+"1@9L#{Dc<ko@g%?J5eMSYuNfUwgx9{StFK2hf5Bcth_1PKAI3nU!es+^(B?o(9Ilea&f=v2r#?W$LLOInmf71rz!jT6r4BU0c}S("
+"$nctK24ohhZz8oLsriq1`CjyY({YY>A4?C&X$&{Xw0<1%2A$+#`>izZh{$ssx4UUQ`BR})FuYekT$KREU#T)yjl-<@a_@TIAFMUx"
+"YOqcpd6%0$PSor|8Iqgrv0XTWg~)iFlJ%X4Q?Rv9R+5U{|J8H?qYL5FuhKp8BsOCYdj`UbV9N9iR(+WUgebb&7yD1ypp7H}SfF=!"
+"Qs_iM-g3Wp-Hfr15S;xn$B(#ph~&+`Qq}>ur}~qmst9$qr}WSAinMP)pn-trpttU+wXr(*KvfULWB5|n{Tbqa>G&tI&or#ck4@Um"
+"A#5lhI^*QfxyqTCYf2+26*iO579JlQ>9l445>OA&>K|CfN(jtJtobV@=KY23wdk^-r}|8;x!D~V+Q1#RQ3j>ekgA5yr)_uINuMC}"
+"{_B8V7{zymRVtYV7ll!3G~Eg+QX&7mL`r?a+`G*bVF9(tB%B*~WYL4iV+e=Orln`muAQ0zFB|ya9NE1Spe~YW9U!n;EKDz(9c5Z%"
+"@*b_#UTaDlz8u={1OH9ru$C=QgIi{G)LsaNxEi2MkX3>ALKJt<V0bZN9D$||sC0265$oPtV=XQ;WB@;tg%%zyS|MLBHF?}u8IdR}"
+")@2!ify%!BvkpP2C;X(Q2Z2?niy|EAp^Z&h*OA?xEmGThei|Oy^pzr&%qh0hP%o!c;1RhwTwe{wAxr%X2A#NNC7pnWP-O*`eCdY8"
+"iAi+UGHL(i+ZO5wc7{`?EPZhJKE~VRo31DACB)WIlawRK!aWJTM`coQCvM^=WTdc>OFjTJf=Dd>#h}_bVhiJnNt!vF`~KsZY?V=J"
+"cb;GXQ7_5tLwyxkluhH~%SqjPZeU5c*Gwbw)YB$y4cNterJt5`ySSW7jm>WqF-PRf^jFnbeUc|;!wZaZC%=xpGH;Pz4cAEol6<Un"
+"{9Gam3#tOSUazbvk|4+QRG+QUVKB<?f;x1R>DZ&Y>Uv7NssS_#yOqy9>TXqrFHN$KvT}(URY=F#A3y4~F;QUU9$Iw#s@1fLxpt{Q"
+"5aHpA<MX-!tPw`$TYRvSnEzmmwl>}!CifNozfI&5;bh9ALQ89hJHiOTEZZq!dVrMfLgm#HlybUPkwkFYR~gKw5+w}WB>`dS6tZ1E"
+"t_b8^HYWMKDWC-z^1KEN#Z$;UO17y@{)sPmngTSGZ^#4^t-fT_2>lT>xJ3qrb=?{Z=*-JHiPW%J^+TdmkmIvhcK%LvwNnJP6}}7<"
+"%g^Gm0uj5OLFa{ydE={oP&N@BX<NYOfrQn|@W>rW3VIU1O!u7gGVnrM^`cE^8i5Mjc6m`kCK)e%86A2{2O^?lEa<F%La;xq^zNw|"
+"bvGkxMc8dSvOoU0*L3y^MOTLjpu4^pPXv4or0x-2s5-+}h?=4xg`)kcT#W_IQXyFZTQqw?Y{lV9T8t4GrO@RSd{Rr$oD`LGXODCT"
+"4>qiK+rD;q)s5SU9#?K9z{uMwSFDnwH5(W;Lg%?Cexe92hR_E+F|_L})reRtxR8o7E@(*b)dD)T328K-P<{VjL!eTq&L+JqjJ8B}"
+"0@}iduhXM~x2GRWkfWRuW?^pK$hMq)`N%i?71kKYWR@7zqOY|~o}5ujNYppEq_L8)J_zLPTC3njjSkkD2W0^1<J|&gw79|pZr!4F"
+"a==K)XDpgg6cZ_qkQ0&0B)2Hr>>^EHzRJ42fuS>5)TiiEkR+G|g<=)EHaz$ur?BOzXtO5lA>r<ml)p+T_z8P)-EwV+S=81jAsot5"
+")O@-_XOESfm7|~&OP$0Y=sOlidn}8Pe)r#fGRinH0a%H5#lAv^UVgv=NYN_Cb(N|Nw8j(fHd%Ly;UJ?2yE-JK$UnPoFH)$i9Xlt^"
+"dh|JKP~HJC+}Rqpt%P$ezV3eZbR2ZLZenhPWk36DndaoXJN7P6+Mw4rXfIS>b9RSvbYfxXEe;ogsm^4j*s=^hJSUgN+ec#NsvPt`"
+"(FfZ!-RfV1k*m+uaC)9HS9}QUjRd(K8H(sLbGN{e{tTK+1xc_NZ_-<)<jQ^s0If$*kGM1&HZqo=z#Oe(q&bOuX{b4JDO-#W1JK5n"
+"eYYlPKN$E1KEzVf<#IQjJXl);Lcy-Wq4w5I2v%<oRAE2bll1{XNs}i~K*t1eiuYEPR@~8+_L|hxsZOy?@C#*$q2WhY6-!Ovk(KJ~"
+"+ii1gyM~Ej#{SR9z}dSIL)R-vpA}GII%kT_cfB<*j5V=Sj*AmgV18HT*~tjs!OW?kpn5Snfz`X*8tu~}Ihl|Mw3m+V%?3W)88KYO"
+"1pxF&@BoPyOX#-fty25OJyD5gL?V_&ceq58yWH)^LT`a%Fa_+?g$*2oBheacmR+WxV$MK$!){;}3rWj!&Y1@`I21dn+{ZWsiqW!u"
+"+~n5$B9zr2qDZd3;omMBCtunb#&DgdLhsgksA03Bajvn5R?A(Z2d4Kf!UVzaHXoIgpfhR`lHvp1;f@}@MC7+;EN}2hCL{oH^2nD("
+"BNa*4Dh_xW31)=@02NRy3#!T{1YPZ|wREai5Ap<iKQsu)80MvPsj{d*@56wcH*__n0{b)2NUSe2V6-*lH8NHzvg`R<Zf;WRf44CC"
+">}qG0QF3oEdBS))LL}bFDg9xUWn$SNv&qC&DW|<ZQ9)zJOsAS6*C%D?kJ3!7yQ+s~apCpzAkALLNPd?nJvg~#5U>M{gB)ED?hxb?"
+"7C^u<5ZAX!A>5_4X<ecnKPFuje-wYgHhAUeeOy!>T-@P?u{5Lz$$B?hhZjgh<X;NyXie_Uj5fzAFYGC%*ss6|M{sGg|DlVdtzbps"
+"@|nb&x*#++=X(HzE0U5j3m#kG8+Sg!WC=&zD&r=Dy?aSEpL;$2R=Jl3Q!+E6$P%Ux_X`!3R%L?`l0?8fJ6?oE2sr<>ado|s9iRcW"
+"ss-5RR&|(0ld534%J$Q0709V?lN%f&*xC&Nl+_sxTB`Je$#{-5D1K^CTYkxp1a~@bK;1fdd0>Isu8_1`h8AkMgC!f#vvMFnRdx`G"
+"Uws7kUg;j#@Vv))dllE4i20<3AE(#`W9Y*QL=#4BMU7ScP?boIPW|*_IjK*vTqylnfH-Lk5=fP1mX#GnhT2xUju;v7#I;2uzWSFp"
+"qE2((YH}MhJ`j1Z%vxzNC&r*n{f+Z%dg;QqE?dSWunraqi!;77Kp5d{JAJt-j){X}Eb!_=*!f+z6Nam%c$7{W<~R|Qz8`<7I*DVy"
+"B-5w$lZrr^A&ddHbX(ogvAcyNdXdkptBOhOK#BCN>1M~#LuSwp(Q=W7(eBU%P=IX-1h(7gQMi+w9bdF=PTYq<O<=i}!!nX5PRCFj"
+"S+7T@VTryc@CH4vLpEB@yocSR20nLT1(sB6l4+&PI#D|<*m5+U=QXab2}e2iVOwUYS~f#50?_yTfaFF^og>lV`wQqiaEnL?KBd0T"
+"4^O=O4i<1Br?|bhAoaWA>O<H;X&LPY&J_dEEwatVI2tvl3$iD-r30RJ)3Q9+{*~MbFtvXg2`^`ft3TPVCWq;YJ*@#zU^04PnLPoA"
+"ngc2zXA_7CmRw_gFn$B8J@)5z<XQr-&g($$IG9=+5yihu<*S<xbN{%!fg&c44yRDgd*A3;H)k=`VPc{Mp0)vocL+~P>O%2Yf0!$N"
+"MGvtpPveu35NpK33r;_y)YW=m>VeYE1GmMc4TLpg6VL)nx{B}O71u2LOK*=h@y_vbMHoOLg~~K*PW~Dc;o$)nBBJMG_8kGUp5U+T"
+"_l{0y%warcWQH<y{2jy!no89Bw~l{?gb^9zl*6C__@>xMfji@vhc9b&s>33DfS^U1)f{W1cGOw<xKFV==MJqrb2~|BUjR2@*B`B~"
+"ahl_KG6HtNO)r!@Ne>=IK7jHW6$k90mBtVY<5D0%?)&3{d>2<UPun2R?TD4<qZ5{uOLRA;oBBLn4+oH);3Yw%lOp`gJ3GxA0GR?Q"
+"0Q@t52J!yRajMS^?ojex%^|>V%kD#qd02ChhrHx1ffl<HBZQe-nmn{7(NkgCz;90R`8@km`O2bk8=DR<7ZWko$cV`@V@F$OG5(y?"
+"-(u{HirJviJ?r4Mpe*O_xyryp`S}G4`u*K)So#4%5>hC&hR}Awsxx+y@o}#6wefyU<+NMORPFB%P2W0nWiUQSA!jq@!@0{f)A@+d"
+"eckOifyWJt!W=bFlBU9nKST6(IM~k&5|kMbqfvO<{_u;N6QfmWsgJ4s<5C}KTszka)YIg*iL)Y`HyrDInzOmLEDlicDl-cne#ez+"
+"mu!jz{BZX@OjPuKV1WnFdr=|=#-9n(UkiNFh$X&X4kX@|4K@g>N0|hgs*j*Bv-)VSiR2gC0)k$E_^hE`lx(oL6~K*y1^PfLmmSn_"
+"=V1ymF@vwnM$=S#zAX@@NwUZbS1h1Pw3X#^%YsWC&tDNqU;<o<E2r@Q6qlYQ^dAmvd+q~8R4=ZkS$^0wu`Y@1vk>ytjynoZZ$A#A"
+"6s+Dhq?OpC++2*;qqHZS5P{gb)s4bVSz$zy*y*a3Q<NX){IDTLBXg|7z0slT>S2^`l*ED>BwXC!CzIEiEOk~PMv87f#t~2*!LphK"
+"F_BlB5+q<3Ue?Ia*Q{q`BLXLJLm(-NpnRP5gBlCwCOoYRGI>GGQwxYkf9%*3MC+%)@aV*h^y-XmtMRy)x(~;g1&1?3SKlijPpaRX"
+"h?t@mxnq?so&)SE6)9O<rH6MJJ3;^*oUr{9m`opm2%i545J}d+_UfG12Oob#U_;~_*tk<SjeCb{$nKC{#V1s`(nmSF`{LOl&i1!C"
+"J>=L=)i(qnR;pvHarmN-ig3Wzy7X~26$m@QIi+&B^0ruC6d)9$r(y3<a21AKc}NWboxiSU0)}aT>oHKfb*oNS27r1zu>kp+vu7Jx"
+";fL@$eHYADw+4(>JFaK52vPQsV!XgqVXY5znoULX*2=dG5l6c3&bo|#Y(d`WOh`}csMz!zzvWUW8B^=M*&J(c@jcp6Icfj_+J2Z+"
+"!U9{+3r6Cdosfzqu)9)Uuk!wRbJoV%6q7F}MW6@{_CajN6rb4f7D_r(uwa}vg?lYfShJI3%bS%NoF~?Uh{kQ3BB_9~6|5<jhrXqh"
+"XVp9`fw(hU1E$2dGnv8zZxqK&2&NLJ8BR}Z?cZDb-QGwx<q}=?Mg+O$?<%bVdxWK>&NZvPLtS{Ymrkey!Royo6>4NenrKGqzfIy>"
+"1M3nbyE|}@;t=x?XIU-sZ~|;jB^Qek6oH@(+H7M+%CY`;#y&~6%i$i^o!DV<M~9K6HIG{ruQ_uFlJso<j(^b;mSpIMm{yNT?~{q8"
+"e(aRKccELD&{VnrhCnMU6x}=mJ4?X}lPj{O5F&Q}=g}@Rm=}i)7Pm0Q>G*9S#qzduW;Lg}UG=ayN4y2RknMGYD$)ce0P}uoV4d)^"
+"4-&FSxY;LYVK-;by<mKIPGvE^CP05w-R0h@!tU|@a8N&O(XEc@(jozES$aQV_cib;NG-n*n$<)+NtwX_;JmUfxf7#5KihittZH-_"
+"@TZd2WuuLjJJARax8^u_Qv(+C)uXa|h!K|d*ld}7XbaL>(yrHUp0`9I=r8#m35A7K(qA7b2w&nT{zY<>r@(&=j*0=Z;)GX@Bh#jO"
+"|F)%T!F1??sUcW9I(MOlv2bf-Lt>p-YmIIW^8MY-(<rHM#?di^*{>f6_F61Uo~{nlpdXe6bEp-Ih(Vbv$i{3XiYYs-Xgm`i*w|}="
+"Dg!U0ZRWf|XF|Qbq2AVe$h8Pzyc@K%ykkh6df@UOTif~Kj;71*cZw7<>uFo()heQ79#4}W+j(!!7E{XD4w~n2YeXRX38}r+cbl3{"
+"^K6WLPkL<p2-mZSUb*0sOsR3`t%hHEAdCoXF<CTUS?OcLO=55bP0!5Y!|S-ezpabP&ubue>i8eVtN1&w9$&GzRPke(EGcwYw7q|q"
+"1_?_i-WpCEwk*3ciQ{>(ku@q{OY_p6bD1EQt$K1K>UEfX8kVv3#A)o~BfU>?oHmn{fe^lZ1xgsEW5yD)WeZUA)uw$AM$!%I;5*)J"
+">Ynq1P}G(UhCZ(2k(YEe6OGV-Zgfzp>A86>e_4r~+)33TEqno5GQQ)}Qtay^qF&ium}t8JG0csqT(Y^W1kp^qr7x;6Xg{vBWMCO6"
+"5WVfjAt5T)mFe5h$u2}ltlH&2h=|m7IL2{o<lP!i?y9Yq0>a;#oNpB)mjwBLZ;vnkIoDIT<D$QDuiU#gdoQ)tW0mfNHY-0M0UGDN"
+"m+<+CmAX0~2iY`jRFv|cVk1JIrKUqJ*v|)|pC1Lq7Z}F{>WBM+F+z*EDHpMbym4R?^1#5ly$#w?<iU@Y&&U1Pev^1QLR>YPMMe-5"
+"L!-fq`$Ul!3lW9kvMRa4f25V^@QmlV#98xWlquCPm*Zdh6+D7^gmU_<xP|(I=gNibHqtot8ZgNkPw@$fj%Oy_+#$|z^ny?5p#NXR"
+"*K7Ag^6r{GIsjgvNZ)U@?lgKBb=(=_8LcF3S4zGN(`Tl;gCZ0{0HyUxnu4NhpP+e9ee1YJt30YlCojQ}bc_;&>L>MBE>$FqVxmr)"
+"2v7URgzZt9uznvzj-Hv?y!C<h$m7{w<Us-Np&t`yR#?y}XFunfJ9+Y)eu|noj4NcE4|F(=`JZjBp^va-TPdF`Utx}MP}h&%qk5%!"
+"{q6@vR-}DLvkIBX9A0KaOQ)?G?q;bEgZG$xVr-l2t@rpVQ8!W+axB@{t}0rXMvSzV&5*sYA=M+uYM_o2g0>S$klQJe*n?RyqCY%I"
+"HMsfYgbzqL-d1;l@*o$Kb#7Yl#K{f}(BezN65ez30C#P)>e=<;x2(sRLC?f1Y(*sZoHY$B=BWddxk_dCK^Ud3qk?ZWVO@zDOwZ#K"
+"JfNHiMgTHdXEf3cIwqLKv2geD9%nVidX@OzAhx)EEAUmM1fg_{`iky)miVO0>wUQLo-wsbNUn89bw#TNIyxFR5?Q~h_$4`vIw`Bb"
+"wiHv%M9n&&%7h=p*+#8){8dU7y^0dlnp}Mkta>7$0U9x&hQv}ZUpwdzC2;Po)?F&>-&i$bl!%D!!)ob-U@Q@Ygp7nr{WLKN!SgTq"
+"GYA|h)jO{#kmnum5J8X-=nX0aA{;X>CPUl$r?R|N5ogPWBoMNvi?3EeyEst4Nn#4z+~bZKvQEjQo6dWh)(Y|Ixao80IKidPgy6Nt"
+"29Vdtm^TwP{>Z-5Z*P|V7<RK_RP1ZKDuf=OlW+@vGxOe~x|kl@KVCK?yN8i|*Vr0bwe-7QC<?ND5?1V)mN$*5;k#GkR{v{(uK0&1"
+"IR^om)!6h|h(%^v+AZh~cSCm}<cHrRyBo6FZg4by94OTb0amLLwlrO&`Jf5YpudY*1Ez-`ZH-1nK2B?8f5=={N?n!51f;*eAi<&("
+"wN#12J1<Nkr2X6ZF{N9>nRd|#Fy%0&{&6C`@Z3zK{ZxFBX<r+q!O92!)S)vs9oVJ)-9E3a_Wh~~2^tJ2OIi=l3D;Mn4Pp|)<#f@}"
+"u5a*W_>x1WdiRx3;YMMU!;MP6C<4nKYM`51)x!++<B%F__vzEgGGr>8`n#3Gh@~u}nB|!GTr2i)RKp5?6Gq^fqLdO70~e=EmKc77"
+"ynX~0?cIUs`(o-&#{~P`G1%`h9;{$LNEIf8kXE-Xj>+Ngrky|gaA9XD9I6zkB>BN~<rP!~9Qo8xPIVV!K#cJkW)GV}>i8YpoL-gA"
+"Fg}~;4x4x&TC!!Mq?zNSO;yn%z6;|hHZLu_AiejypqhwuC?6~_K5zl9g+V3n^@joz(a^L`W6CMH)04(vFthv{P9@Fy=cVUbLIXYe"
+"u{Q*x2fc|XblZP=J$PItrs%&83t;jJ<CU#roIeDe9Pn?Ae3Rizei~wB3?IsV$a4NvK@4xO;%`+-(fr1JTvt5|unz|RJ@@dB%Y@l`"
+"*ILXE9S}|hs$esi%po{UBj-x^kcr9J_nmc|K_TW+01ibUe`vB(HiE5km7agqLhHky$9YWo@6nXH4!b~4wT$Lni-2|YN5uHp)be&_"
+"POkOsbc`rR{nz0U{xzz7E7CMQdU+o#6pDhMwAe5<Y=JXG{ZeB1<SN|L%~C1%q&$@n_H{Y6Y&|_Va1>o5+?DaG%qb@bvb;OcSWToY"
+"rR!(KIA_9@%|2sKo^;}&vziU0AMk$tC>u2+e&2w9HQH~6B|}9vt@q%FH`QV_GD*Lb%Q6R;SAJmyqs`45@mgmICFRLGK#1k5!@o`{"
+"%Xp;wYG<fr7lbhHZKv|-Kz+<%dNQSGPtoFPhXZb^M=Wqu3B|T*#*k95!u8RnhSoZGb;mkJ@LrjN{vp9N%x+nG7#Bn>6;)@92=(@5"
+"ggvy6do&eKX1LT7W`Sm)f7ZIL*Rh&TaQYUm`zv1gAJw>#u-?=IiOcMw9ZT{1R|bEQ=~%`m2NiwRcN`?mBX4i}HQRyd_oTJ9_KI={"
+"ATaZ(<|_V&k%zb_nXH4JqK98DUS(lrZU4c^L%u2h`--}7oxOsl1yGYux!*)sve`n>@QrG&VAt*Fl&R{Oa44F3znW_(K%RG&;W;j+"
+"f*AzTAMA%TK#gS9G%nw0(%M-9R?*q|eDsDrd}}F`dVtE9kvIG$?B-(Lc>{u`Y8;!hiF14+3xBm=voJ)Olo3YDqxsXB$J!-r6P~4~"
+"jBp5nz#A<Lh7i6-X)w;9KE>oTF%ursXGoE%_Jg55y>&fyg^|m7XBhK4@2X1mTU`<GJcc@bQyL`b#7gNgtdcw*#G3WNwb>26sEW`_"
+"8#QD>&L-sqt9E@A_ci|eTKK%Jo2J4n4_~a0nVc!wf<b3|cR}CvR%zUll(U^OlM-DngT$^mFtVdG=?`l{xzjg$t3*=>s0u*%>~)?0"
+"s7XrNSSUog(~;4ua7xU|^>D2+tZd!Tr)%Wy3cfYbdpVPh)8c@Xi9A!Ej_wGSbqxuCt=>XtMCVWfLLR=!qBL{y!1T?(=qFgnDB#(U"
+"jpqv}SDprQgt@r7WPv2;XZb`UFsdVVE)aI;911a{w^z7B$9#fGwcYt3|C?)ks}Y&xItD>Bp*T8U3Sk!rT@}qn3Z%*1iIb1$J(eZ2"
+"0ucIiV%;>N;9hvW8SCB*_QjAE{LOrN)odJ0-l~vUsYkR2LdCFppR8?G;1Gik!cMpgSRR#yx4NnMbg_{0)QdVTRg)U|zY7EjWA<mo"
+"T(5Z<khswZL_&%vQ{`@vgI=_dA+^fRVq!+>p}hhsp@U<4L;h;MAr?S^bUep_<))8qZ`blj@@Fe3EH3|_$QfAprKjDx+H%qfZmJNp"
+"wl{b2ZDcSZKPR0g=*>l`bsj=?iR#Yqsw1pGo)DIAEh4pCt}7f0qBtRw3oS7KeW6o_gtoxBu|R!fSa?Njy>RftK5Hd45I~;PIr{VV"
+"xh2AUxlH&wG<Cs)q@}0Nd}X)5I!>;sE)h_28aT@r56dLC`uksCc7>DJO(0q8AS0N`PBHHUEueqbgt9Dmlt;JA5G%h8Ma2^w*LF^-"
+">cv(Yq`8QkHT>^JGqN~tzVoN*9f)ws#sSB(i{otxquW|DD+4)5_jnd{XwxWcC=E?Op({t1r!#wUAL6I$?gG0<xp%<1&XZVoG-k~Z"
+"FDvvTROD{p?aT$AH8`#Q5}&Q(PtapVrBBZP9Q^?Usx2;R66h24nPjj;tr6^A5QD+LvJ8tiW6aVCdJSM$b}^LX6*Wa+YuBZWNRr1m"
+"s?y{WjJ7Yd<zl_OT<x$aeKl0_--<t3ASAp#gE<Y|QoFFcZ+lxC#hpoeW;x>>jXO8;(Dw(a%C0a6bdru+ir1fpW!T~s5;#PAb29Pt"
+"FRLBi*r35iT@-~Qf?yecqZ&!v-kip4X_h+A%t|EO0lG`=2uZBIiF%25y}*pO0FnoU0LfnIxA!r5q+i&837DW*)RH-nJ}r*bkI7kJ"
+"8L7gXQbcHnEQ`;^zfVFOGm%^ft^o6!a2~}5H0HM?aY9rCmkjdPa1d6E+i#{@->-GQb)p!$;|qlT=ICf;pVaHCn`1Wj=u<5Y4PK#3"
+"FAkKs1C|4BLZixvAX(E_I+*8$c~8XrXU<L76i$-|G{OL6@__afw>9F=s?bxZ=-6KxA<c`1Qw@v+@I|IgCkH}SRt+Z{SMTgN)g|Re"
+"Yr?8_Gdu#Rvzyt2ZA6QCH+exU{5^71xc`)Z?YWkdoG9Rmjc<0HQ&*Z+6*p@Ik<2^*BTG2bSiAnBHgjd+7Scf<?K*lIQX2Tf#K<1e"
+"W^9`br`{FXs4Fdgj8XiQ1pB(t)u6ca@dFZ1$3^ok1SEgWF<5YyE&-u|s@>^Ev-m4vAARbdcD-i1@G=InWl_q5g&o6pv`-H?KjG9;"
+"oOPmRcJ(M63vCE53_Z&>Q4r_F?#@)g<dyY^tBeEH&xEB8XlUyDq4PDMRVQ8OuUhEcT#8>Dxl)<t^c|NMD+IO)9R#r1!3ycNOPBvl"
+"`XA+B{BcZ$%1m+!nA|8vyK{~Uv#`r5m%;2_8XxAoyNTat!63bt___-U>A0sfH*Efz5sF$W{3#3)L&8Mn0OZJQtA|z!%OX%<OkZ7%"
+"FVglfN6bJC3llPVLeILF1YkaF+<TnY>qMT7!4S2%#eCp=YYMk+V4}4$OgfQhvI;k`jFnNai&C-wP~NPNd$Pz9_Az?*?~jH>jI<Af"
+"+8${_Y})2h9;CTY1h6mKa>QdPy%B}uu-ozUh*GC^)x6CDhjP8bVu7uj>P0&|*sB0WQ4|M`+g}C*69Y@;5X$(VhPDvQofkb`a|`Sw"
+">;K|~-GHeKvERay+FTsKLGO9;c$*y;F&`mDS2b?-41r-;yDMeMm;BnBouC`gz-k#e1stI<M{X%NNL4K@ib(89f>C=Vm;(9N0Nm;$"
+"7bJ6CQ4n6j;NT>_aa|1~D*J}M7xVtm_9V8OhP&U<21&@UIMDxFREVvR({a^g>arbxO4US>4Z@$k5j(K>>_$M#(|VrmD;+87c^*%;"
+"h_oc(Pp{G$%i&SzYnyMpsAT4Co!^4#D0?pqg}(w+Y218c|5)O+2a9YusEbOanuRXc;}(?H@u44L=$`R)sM*AYy8B?I{UR~87j3Ot"
+"-BX4dW{iK^*Z6Q9?E*qHA$)&y=c#nw*tuyMI^G?d<?zT~{|tqJmh>&+UyY?zcDov-Ada47e06rkdT<;mZBV)u3)K^utBrKZ?Jcc%"
+"#JVlwB@(>99<|siu46&%n%#Or7!V~pO?jZufD$hR?|3BMZuzQ*3&#0f!wp_G-CX6)mi4i<*dp#WwVOn{v*9g9H7AOqyCSGJ{$MqF"
+"3(W(#9>e;i<z+I1V>@oca&>*c&kIFoe>&>B@e)4+n04BUB03hwKw3QrG(R^;`ysWMRlmT#HsEM7xSO?}sSI>gb?Azai%?2Wpxg+o"
+"x@!l*-grP7-8CccZlD%Tc*cZa?U0K;QwfRj)1B{osj%35op4&^DtKI$$68AprfN>}=}|(@`awd*=_b>uO-UiipEd#~|NKt2p+moy"
+"D!*$={w&a4nas$P^epK3y!p6FKw_`j&h>yv7y(WP|I^aeqcc7n{#%ssU-E-`Z9x%AI|Mj=v8uFJroPK7sEuBbR6&{ysHbm<>50RM"
+"-m&XMS7I$X%>HcKUTaGYFMLumm@|<9(ud2?7>dV7wWjuV=!@t=S%}fXF*TXiyDTp~(TJC#79?<Ws*wxvq{H9FYm;vVWbD%-6>gA("
+"3wa@!H1Wp7VzGIPQ8v*OTVhB!z>$rcjz<OuvO-Zr1Xdfo^gtBhFF^K=@#TW^-&o<cImI^W!$c6k$#wK|N(7m9#FYrIZ8RG-#hkYg"
+"W6iSc4&S=8D1lg~XvDhHmh=h;?rh*#$`6t5Zy(shn&g5BZLt9z8_wVt7;Ur}&A?{LI~N<dO8U~mjf$+f&LC{btfvtLEmS1@(5`Eq"
+"Y^Bke=x)6?MtV6H%M8kTJB=kINP`Aqk>=S74wdZU_}3Pjd$lR7-2^=XRr~*}CKeT$sy6bp<a<~K0}f|{{<|*;q9jw*ExV(XL?X1!"
+"Jw;vW4Ag!DY=&>sckmDtTKHp_LOM|cx?3-yK$kVkZ}0t{Wb5O1eE9xP|I2>DJ8D&xi+35qM9mjIXp>4x*xsjG7i6djGnI*BGUo*y"
+"Qlo%Bb$o{8?u?Y_^}m(-qkcz`ePd`%bOJm=$K%L^i!LE0iJ)k3+WG*@^-1|#Kh|<Z;VnmKQr(35<oUj=$c&xFeTin)K<p70h$sgT"
+"Apu*-M*pejHS}z7K4pqm8)C4rGF5(P9gubAwU7?1J?@}!Z`$|J%gjR!QS0I}=oE;#_jH~Gl(c(b;mBq1#+Iuy+p2Z8Alm<UJj95X"
+"&4HjD=Barx7JDb;dO}d!12WgkA&@oYmxMuf7yt"),format=L.FORMAT_RAW,filters=[{"id":L.FILTER_LZMA2}]))
diff --git a/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed1337.log b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed1337.log
new file mode 100644
index 0000000000..97a06613c2
--- /dev/null
+++ b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed1337.log
@@ -0,0 +1,109 @@
+=== evaluate.py: Starting training ===
+optimize.py: 23353 bytes
+NPROC: 8
+timeout: 1200s
+cwd: /home/dex/parameter-golf-with-cc
+
+
+*****************************************
+Setting OMP_NUM_THREADS environment variable for each process to be 1 in default, to avoid your system being overloaded, please further tune the variable for optimal performance in your application as needed. 
+*****************************************
+logs/9bd2fcd1-d98e-4368-8b01-37ce38dd5d94.txt
+val_bpb:enabled tokenizer_kind=sentencepiece tokenizer_path=/home/dex/parameter-golf-with-cc/data/tokenizers/fineweb_1024_bpe.model
+train_loader:dataset:fineweb10B_sp1024 train_shards:80
+val_loader:shards pattern=/home/dex/parameter-golf-with-cc/data/datasets/fineweb10B_sp1024/fineweb_val_*.bin tokens:62021632
+model_params:27201116
+XSA:last_11 active_layers:[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
+world_size:8 grad_accum_steps:1
+sdp_backends:cudnn=False flash=True mem_efficient=False math=False
+attention_mode:gqa num_heads:8 num_kv_heads:4
+tie_embeddings:True embed_lr:0.035 head_lr:0.0 matrix_lr:0.03 scalar_lr:0.025
+train_batch_tokens:786432 train_seq_len:2048 iterations:20000 warmup_steps:20 max_wallclock_seconds:600.000
+seed:1337
+gptq:reserving 9000ms from training budget, effective=591000ms
+warmup_step:1/20
+warmup_step:2/20
+warmup_step:3/20
+warmup_step:4/20
+warmup_step:5/20
+warmup_step:6/20
+warmup_step:7/20
+warmup_step:8/20
+warmup_step:9/20
+warmup_step:10/20
+warmup_step:11/20
+warmup_step:12/20
+warmup_step:13/20
+warmup_step:14/20
+warmup_step:15/20
+warmup_step:16/20
+warmup_step:17/20
+warmup_step:18/20
+warmup_step:19/20
+warmup_step:20/20
+step:0/20000 val_loss:6.9306 val_bpb:4.1047 train_time:0ms step_avg:0.01ms
+step:1/20000 train_loss:6.9271 train_time:134ms step_avg:134.06ms
+step:2/20000 train_loss:8.6671 train_time:170ms step_avg:84.95ms
+step:3/20000 train_loss:7.4821 train_time:256ms step_avg:85.33ms
+step:4/20000 train_loss:7.3623 train_time:343ms step_avg:85.64ms
+step:5/20000 train_loss:7.0854 train_time:429ms step_avg:85.86ms
+step:6/20000 train_loss:7.0377 train_time:516ms step_avg:85.93ms
+step:7/20000 train_loss:6.8507 train_time:602ms step_avg:85.98ms
+step:8/20000 train_loss:6.6317 train_time:689ms step_avg:86.07ms
+step:9/20000 train_loss:6.2805 train_time:774ms step_avg:86.05ms
+step:10/20000 train_loss:5.9572 train_time:861ms step_avg:86.09ms
+step:500/20000 train_loss:2.3082 train_time:43858ms step_avg:87.72ms
+step:1000/20000 train_loss:2.2273 train_time:87779ms step_avg:87.78ms
+step:1500/20000 train_loss:2.1421 train_time:131755ms step_avg:87.84ms
+step:2000/20000 train_loss:2.1851 train_time:175799ms step_avg:87.90ms
+step:2500/20000 train_loss:2.0432 train_time:219846ms step_avg:87.94ms
+step:3000/20000 train_loss:2.1001 train_time:263871ms step_avg:87.96ms
+step:3500/20000 train_loss:2.0542 train_time:307894ms step_avg:87.97ms
+step:4000/20000 train_loss:2.0298 train_time:351912ms step_avg:87.98ms
+step:4000/20000 val_loss:2.0219 val_bpb:1.1975 train_time:351966ms step_avg:87.99ms
+step:4500/20000 train_loss:2.0415 train_time:395933ms step_avg:87.99ms
+step:5000/20000 train_loss:1.9664 train_time:439947ms step_avg:87.99ms
+step:5500/20000 train_loss:1.9531 train_time:483967ms step_avg:87.99ms
+swa:start step:5950
+step:6000/20000 train_loss:1.9554 train_time:528080ms step_avg:88.01ms
+late_qat:enabled step:6113 scale:0.1499
+step:6500/20000 train_loss:1.9063 train_time:572758ms step_avg:88.12ms
+step:6704/20000 val_loss:1.9111 val_bpb:1.1319 train_time:591097ms step_avg:88.17ms
+stopping_early: wallclock_cap train_time:591097ms step:6704/20000
+peak memory allocated: 23337 MiB reserved: 23386 MiB
+ema:applying EMA weights
+DIAGNOSTIC post_ema val_loss:1.9095 val_bpb:1.1309 eval_time:2077ms
+Serialized model: 106609335 bytes
+Code size: 23349 bytes
+gptq:calibrating with 64 batches (training data)...
+gptq:calibrated 66 layers in 6.8s
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+Serialized model int6+brotli: 15623775 bytes
+Total submission size int6+brotli: 15647124 bytes
+final_int6_roundtrip val_loss:1.9154 val_bpb:1.1344 eval_time:6618ms
+final_int6_roundtrip_exact val_loss:1.91538987 val_bpb:1.13440177
+final_int6_sliding_window val_loss:1.8609 val_bpb:1.1021 stride:64 eval_time:168497ms
+final_int6_sliding_window_exact val_loss:1.86088769 val_bpb:1.10212542
+final_int8_zlib_roundtrip_exact val_loss:1.86088769 val_bpb:1.10212542
+
+=== evaluate.py: Finished in 896.4s (exit code: 0) ===
+
+=== EVALUATE.PY TRAINING ANALYSIS ===
+total_steps: 6704
+avg_step_ms: 88.2
+train_loss: 6.9271 -> 1.9063 (drop: 5.0208)
+convergence_rate: 0.7489 per 1000 steps
+swa_checkpoints: 0
+WARNING: step_avg 88.2ms > 70ms threshold. Possible torch.compile issue.
+WARNING: artifact 15647124 bytes close to 16MB limit (352876 headroom)
+=== END TRAINING ANALYSIS ===
+
+FINAL_METRIC val_bpb: 1.10212542
+EVAL_RESULT_JSON {"candidate": "/home/dex/parameter-golf-with-cc/optimize.py", "seed": 1337, "val_bpb": 1.10212542, "val_loss": 1.86088769, "method": "sliding_window", "metric_name": "final_int6_sliding_window_exact", "metric_source": "legacy_exact_log", "artifact_size_bytes": 15647124, "artifact_limit_bytes": 16000000, "artifact_headroom_bytes": 352876, "total_steps": 6704, "avg_step_ms": 88.17, "elapsed_seconds": 896.3570425510406, "eval_time_ms": 177192, "eval_budget_ms": 600000, "eval_budget_exceeded": false, "status": "pass"}
diff --git a/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed2025.log b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed2025.log
new file mode 100644
index 0000000000..646610b93e
--- /dev/null
+++ b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed2025.log
@@ -0,0 +1,109 @@
+=== evaluate.py: Starting training ===
+optimize.py: 23353 bytes
+NPROC: 8
+timeout: 1200s
+cwd: /home/dex/parameter-golf-with-cc
+
+
+*****************************************
+Setting OMP_NUM_THREADS environment variable for each process to be 1 in default, to avoid your system being overloaded, please further tune the variable for optimal performance in your application as needed. 
+*****************************************
+logs/30016209-9484-49d0-85c0-55ad4b735cd2.txt
+val_bpb:enabled tokenizer_kind=sentencepiece tokenizer_path=/home/dex/parameter-golf-with-cc/data/tokenizers/fineweb_1024_bpe.model
+train_loader:dataset:fineweb10B_sp1024 train_shards:80
+val_loader:shards pattern=/home/dex/parameter-golf-with-cc/data/datasets/fineweb10B_sp1024/fineweb_val_*.bin tokens:62021632
+model_params:27201116
+XSA:last_11 active_layers:[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
+world_size:8 grad_accum_steps:1
+sdp_backends:cudnn=False flash=True mem_efficient=False math=False
+attention_mode:gqa num_heads:8 num_kv_heads:4
+tie_embeddings:True embed_lr:0.035 head_lr:0.0 matrix_lr:0.03 scalar_lr:0.025
+train_batch_tokens:786432 train_seq_len:2048 iterations:20000 warmup_steps:20 max_wallclock_seconds:600.000
+seed:2025
+gptq:reserving 9000ms from training budget, effective=591000ms
+warmup_step:1/20
+warmup_step:2/20
+warmup_step:3/20
+warmup_step:4/20
+warmup_step:5/20
+warmup_step:6/20
+warmup_step:7/20
+warmup_step:8/20
+warmup_step:9/20
+warmup_step:10/20
+warmup_step:11/20
+warmup_step:12/20
+warmup_step:13/20
+warmup_step:14/20
+warmup_step:15/20
+warmup_step:16/20
+warmup_step:17/20
+warmup_step:18/20
+warmup_step:19/20
+warmup_step:20/20
+step:0/20000 val_loss:6.9295 val_bpb:4.1040 train_time:0ms step_avg:0.02ms
+step:1/20000 train_loss:6.9263 train_time:132ms step_avg:132.03ms
+step:2/20000 train_loss:8.7514 train_time:168ms step_avg:84.20ms
+step:3/20000 train_loss:7.5457 train_time:255ms step_avg:84.98ms
+step:4/20000 train_loss:7.2889 train_time:342ms step_avg:85.61ms
+step:5/20000 train_loss:7.0991 train_time:429ms step_avg:85.89ms
+step:6/20000 train_loss:7.1450 train_time:516ms step_avg:85.98ms
+step:7/20000 train_loss:6.9402 train_time:603ms step_avg:86.13ms
+step:8/20000 train_loss:6.7033 train_time:690ms step_avg:86.21ms
+step:9/20000 train_loss:6.2786 train_time:776ms step_avg:86.22ms
+step:10/20000 train_loss:5.9484 train_time:863ms step_avg:86.29ms
+step:500/20000 train_loss:2.3011 train_time:43928ms step_avg:87.86ms
+step:1000/20000 train_loss:2.2242 train_time:87928ms step_avg:87.93ms
+step:1500/20000 train_loss:2.1392 train_time:131973ms step_avg:87.98ms
+step:2000/20000 train_loss:2.1811 train_time:176082ms step_avg:88.04ms
+step:2500/20000 train_loss:2.0431 train_time:220196ms step_avg:88.08ms
+step:3000/20000 train_loss:2.1009 train_time:264395ms step_avg:88.13ms
+step:3500/20000 train_loss:2.0559 train_time:308556ms step_avg:88.16ms
+step:4000/20000 train_loss:2.0253 train_time:352718ms step_avg:88.18ms
+step:4000/20000 val_loss:2.0213 val_bpb:1.1972 train_time:352773ms step_avg:88.19ms
+step:4500/20000 train_loss:2.0418 train_time:396893ms step_avg:88.20ms
+step:5000/20000 train_loss:1.9680 train_time:440996ms step_avg:88.20ms
+step:5500/20000 train_loss:1.9548 train_time:485144ms step_avg:88.21ms
+swa:start step:5900
+step:6000/20000 train_loss:1.9507 train_time:529503ms step_avg:88.25ms
+late_qat:enabled step:6096 scale:0.1498
+step:6500/20000 train_loss:1.9056 train_time:574456ms step_avg:88.38ms
+step:6684/20000 val_loss:1.9113 val_bpb:1.1320 train_time:591115ms step_avg:88.44ms
+stopping_early: wallclock_cap train_time:591115ms step:6684/20000
+peak memory allocated: 23337 MiB reserved: 23386 MiB
+ema:applying EMA weights
+DIAGNOSTIC post_ema val_loss:1.9097 val_bpb:1.1310 eval_time:2073ms
+Serialized model: 106609335 bytes
+Code size: 23349 bytes
+gptq:calibrating with 64 batches (training data)...
+gptq:calibrated 66 layers in 6.8s
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+Serialized model int6+brotli: 15626917 bytes
+Total submission size int6+brotli: 15650266 bytes
+final_int6_roundtrip val_loss:1.9155 val_bpb:1.1345 eval_time:6691ms
+final_int6_roundtrip_exact val_loss:1.91554389 val_bpb:1.13449299
+final_int6_sliding_window val_loss:1.8609 val_bpb:1.1022 stride:64 eval_time:168622ms
+final_int6_sliding_window_exact val_loss:1.86094674 val_bpb:1.10216040
+final_int8_zlib_roundtrip_exact val_loss:1.86094674 val_bpb:1.10216040
+
+=== evaluate.py: Finished in 902.3s (exit code: 0) ===
+
+=== EVALUATE.PY TRAINING ANALYSIS ===
+total_steps: 6684
+avg_step_ms: 88.4
+train_loss: 6.9263 -> 1.9056 (drop: 5.0207)
+convergence_rate: 0.7512 per 1000 steps
+swa_checkpoints: 0
+WARNING: step_avg 88.4ms > 70ms threshold. Possible torch.compile issue.
+WARNING: artifact 15650266 bytes close to 16MB limit (349734 headroom)
+=== END TRAINING ANALYSIS ===
+
+FINAL_METRIC val_bpb: 1.10216040
+EVAL_RESULT_JSON {"candidate": "/home/dex/parameter-golf-with-cc/optimize.py", "seed": 2025, "val_bpb": 1.1021604, "val_loss": 1.86094674, "method": "sliding_window", "metric_name": "final_int6_sliding_window_exact", "metric_source": "legacy_exact_log", "artifact_size_bytes": 15650266, "artifact_limit_bytes": 16000000, "artifact_headroom_bytes": 349734, "total_steps": 6684, "avg_step_ms": 88.44, "elapsed_seconds": 902.3265001773834, "eval_time_ms": 177386, "eval_budget_ms": 600000, "eval_budget_exceeded": false, "status": "pass"}
diff --git a/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed42.log b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed42.log
new file mode 100644
index 0000000000..32a369181a
--- /dev/null
+++ b/records/track_10min_16mb/2026-03-31_SLOT_SplitLR_GPTQ_XSA_1.1015/train_seed42.log
@@ -0,0 +1,109 @@
+=== evaluate.py: Starting training ===
+optimize.py: 23353 bytes
+NPROC: 8
+timeout: 1200s
+cwd: /home/dex/parameter-golf-with-cc
+
+
+*****************************************
+Setting OMP_NUM_THREADS environment variable for each process to be 1 in default, to avoid your system being overloaded, please further tune the variable for optimal performance in your application as needed. 
+*****************************************
+logs/7d9ea09b-8fa0-4233-a75f-3b26f7232a33.txt
+val_bpb:enabled tokenizer_kind=sentencepiece tokenizer_path=/home/dex/parameter-golf-with-cc/data/tokenizers/fineweb_1024_bpe.model
+train_loader:dataset:fineweb10B_sp1024 train_shards:80
+val_loader:shards pattern=/home/dex/parameter-golf-with-cc/data/datasets/fineweb10B_sp1024/fineweb_val_*.bin tokens:62021632
+model_params:27201116
+XSA:last_11 active_layers:[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
+world_size:8 grad_accum_steps:1
+sdp_backends:cudnn=False flash=True mem_efficient=False math=False
+attention_mode:gqa num_heads:8 num_kv_heads:4
+tie_embeddings:True embed_lr:0.035 head_lr:0.0 matrix_lr:0.03 scalar_lr:0.025
+train_batch_tokens:786432 train_seq_len:2048 iterations:20000 warmup_steps:20 max_wallclock_seconds:600.000
+seed:42
+gptq:reserving 9000ms from training budget, effective=591000ms
+warmup_step:1/20
+warmup_step:2/20
+warmup_step:3/20
+warmup_step:4/20
+warmup_step:5/20
+warmup_step:6/20
+warmup_step:7/20
+warmup_step:8/20
+warmup_step:9/20
+warmup_step:10/20
+warmup_step:11/20
+warmup_step:12/20
+warmup_step:13/20
+warmup_step:14/20
+warmup_step:15/20
+warmup_step:16/20
+warmup_step:17/20
+warmup_step:18/20
+warmup_step:19/20
+warmup_step:20/20
+step:0/20000 val_loss:6.9299 val_bpb:4.1043 train_time:0ms step_avg:0.01ms
+step:1/20000 train_loss:6.9263 train_time:133ms step_avg:133.50ms
+step:2/20000 train_loss:8.7688 train_time:170ms step_avg:84.91ms
+step:3/20000 train_loss:7.5948 train_time:256ms step_avg:85.24ms
+step:4/20000 train_loss:7.3235 train_time:342ms step_avg:85.50ms
+step:5/20000 train_loss:7.1037 train_time:429ms step_avg:85.73ms
+step:6/20000 train_loss:7.1014 train_time:515ms step_avg:85.81ms
+step:7/20000 train_loss:6.9497 train_time:601ms step_avg:85.92ms
+step:8/20000 train_loss:6.7012 train_time:688ms step_avg:86.04ms
+step:9/20000 train_loss:6.2772 train_time:775ms step_avg:86.07ms
+step:10/20000 train_loss:5.9729 train_time:861ms step_avg:86.14ms
+step:500/20000 train_loss:2.3044 train_time:43865ms step_avg:87.73ms
+step:1000/20000 train_loss:2.2291 train_time:87809ms step_avg:87.81ms
+step:1500/20000 train_loss:2.1380 train_time:131797ms step_avg:87.86ms
+step:2000/20000 train_loss:2.1848 train_time:175909ms step_avg:87.95ms
+step:2500/20000 train_loss:2.0413 train_time:219944ms step_avg:87.98ms
+step:3000/20000 train_loss:2.0994 train_time:263953ms step_avg:87.98ms
+step:3500/20000 train_loss:2.0549 train_time:307946ms step_avg:87.98ms
+step:4000/20000 train_loss:2.0263 train_time:351939ms step_avg:87.98ms
+step:4000/20000 val_loss:2.0188 val_bpb:1.1957 train_time:351994ms step_avg:88.00ms
+step:4500/20000 train_loss:2.0385 train_time:395916ms step_avg:87.98ms
+step:5000/20000 train_loss:1.9656 train_time:439897ms step_avg:87.98ms
+step:5500/20000 train_loss:1.9540 train_time:483877ms step_avg:87.98ms
+swa:start step:5950
+step:6000/20000 train_loss:1.9498 train_time:527972ms step_avg:88.00ms
+late_qat:enabled step:6115 scale:0.1498
+step:6500/20000 train_loss:1.9033 train_time:572637ms step_avg:88.10ms
+step:6706/20000 val_loss:1.9078 val_bpb:1.1299 train_time:591128ms step_avg:88.15ms
+stopping_early: wallclock_cap train_time:591128ms step:6706/20000
+peak memory allocated: 23337 MiB reserved: 23386 MiB
+ema:applying EMA weights
+DIAGNOSTIC post_ema val_loss:1.9062 val_bpb:1.1289 eval_time:2076ms
+Serialized model: 106609335 bytes
+Code size: 23349 bytes
+gptq:calibrating with 64 batches (training data)...
+gptq:calibrated 66 layers in 6.8s
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+gptq_quantize: 66 GPTQ layers, 1 naive layers
+Serialized model int6+brotli: 15634712 bytes
+Total submission size int6+brotli: 15658061 bytes
+final_int6_roundtrip val_loss:1.9120 val_bpb:1.1324 eval_time:6840ms
+final_int6_roundtrip_exact val_loss:1.91202666 val_bpb:1.13240989
+final_int6_sliding_window val_loss:1.8576 val_bpb:1.1002 stride:64 eval_time:168407ms
+final_int6_sliding_window_exact val_loss:1.85761751 val_bpb:1.10018864
+final_int8_zlib_roundtrip_exact val_loss:1.85761751 val_bpb:1.10018864
+
+=== evaluate.py: Finished in 896.6s (exit code: 0) ===
+
+=== EVALUATE.PY TRAINING ANALYSIS ===
+total_steps: 6706
+avg_step_ms: 88.2
+train_loss: 6.9263 -> 1.9033 (drop: 5.0230)
+convergence_rate: 0.7490 per 1000 steps
+swa_checkpoints: 0
+WARNING: step_avg 88.2ms > 70ms threshold. Possible torch.compile issue.
+WARNING: artifact 15658061 bytes close to 16MB limit (341939 headroom)
+=== END TRAINING ANALYSIS ===
+
+FINAL_METRIC val_bpb: 1.10018864
+EVAL_RESULT_JSON {"candidate": "/home/dex/parameter-golf-with-cc/optimize.py", "seed": 42, "val_bpb": 1.10018864, "val_loss": 1.85761751, "method": "sliding_window", "metric_name": "final_int6_sliding_window_exact", "metric_source": "legacy_exact_log", "artifact_size_bytes": 15658061, "artifact_limit_bytes": 16000000, "artifact_headroom_bytes": 341939, "total_steps": 6706, "avg_step_ms": 88.15, "elapsed_seconds": 896.6127007007599, "eval_time_ms": 177323, "eval_budget_ms": 600000, "eval_budget_exceeded": false, "status": "pass"}