
Whitepaper· v2.1
Asymmetric-Knowledge Zero-Knowledge for Autoregressive LLM Inference (v2.1): Bootstrap CIs, Tightened Proofs, GPU-Scale Validation on Qwen 3.5, and Concurrent-Work Citation Patch
v2.1: full proofs (Claims 1, 2), N=500 bootstrap-CI experiments on RTX 5070 Ti, embedded figures, tightened limitations, and Chong et al. 2025 citation patch
Forfattere
- Einar Holt · tenki
Publisert 6. mai 2026
Sammendrag
v2.1 of the May 2026 release on verifiable autoregressive LLM inference. v1 introduced PSI-LM, AKZK, AsymVZK, and VEWC at proof-of-concept scale. v2 reran the empirical sweep at N=500 trials per cell on RTX 5070 Ti with 95% bootstrap confidence intervals, replaced three proof sketches with full hybrid arguments (Claims 1 and 2; Claim 3 stays as a sketch with the formal AKZK/ZK separation explicitly deferred), tightened the abstract (the ~32x speedup figure compares against the naive autoregressive zkLLM baseline, not against PSI-LM), added embedded matplotlib figures, and explicitly deferred the real per-position SNARK integration and threshold-committed accept-pattern privacy to a follow-up paper. v2.1 adds a single citation patch: Chong, Ohsaki and Ng (2025, arXiv:2509.11068) on tractable asymmetric verification of LLM outputs via deterministic replicability is now positioned as a concurrent, complementary, non-cryptographic thread in §3.4. No construction, proof, or empirical number changes between v2 and v2.1. All v1 claims that survive scrutiny are reproduced or strengthened by the larger benchmark; the headline VEWC-vs-AsymVZK gap on Qwen 3.5 is over 10x at low k (e.g. 74.6% vs 7.4% at k=4 with N=500 and 95% bootstrap CIs).
Funn
Vi konstruerte tre protokoller for verifiserbar autoregressiv LLM-inferens (PSI-LM, AsymVZK, VEWC) og en ny trusselmodell (AKZK). v2 reproduserte v1-tallene på GPU med statistisk troverdige intervaller; v2.1 la til én sitering (Chong, Ohsaki & Ng 2025) uten å endre tall eller bevis.
Hovedfunn
- VEWC slår AsymVZK-uniform med over en størrelsesorden mot semantisk-innholds-motstander ved lav . Ved og én løgn på et høy-entropi-token: VEWC fanger 74,6 % [70,8; 78,4] mot AsymVZK-uniforms 7,4 % [5,0; 9,8] — en faktor 10,1×. Ved er forholdet 12,7×. Gapet smalner naturlig når vokser, fordi begge protokoller saturerer mot 100 %.
- VEWC har en målbar blindsone på lav-entropi-motstandere. Ved tre løgner plassert på de laveste-entropi-posisjonene fanger VEWC kun 0,6 % [0,0; 1,4] selv ved , mens AsymVZK-uniform fanger 89,2 % [86,4; 91,8]. Dette er ikke en feil — det er en ærlig konsekvens av at VEWC vekter utfordringer mot høy-entropi-posisjoner. §9.7.3 i artikkelen anbefaler en hybrid konfigurasjon for produksjonsbruk.
- Mot uniform-tilfeldig motstander vinner AsymVZK-uniform med en moderat margin. Ved , tre løgner: VEWC 37,6 % vs. AsymVZK 86,2 %. Dette er forventet — AsymVZK-uniform deprioriterer ingen posisjonsklasse.
- Speculative-akseptraten ligger mellom 70 % og 86 % på fem prompt-domener (Qwen 2.5-1.5B + 0,5B). Det betyr at AsymVZK kun trenger kryptografiske bevis ved omtrent en fjerdedel av posisjonene.
- Hastighetsgevinst. PSI-LM og AsymVZK oppnår begge bevistidsgevinst over naiv autoregressiv zkLLM-baseline ved , . AsymVZK gir ikke ytterligere bevis-tidsgevinst over PSI-LM; merverdien ligger på verifikator-siden (gratis utkast-modell-replay) og i AKZK-trusselmodellen.
Hva som er og hva som ikke er løst
Løst eller styrket i v2:
- Tre bevisskisser erstattet med fulle hybrid-argumenter (Krav 1 og 2).
- Empiriske CI-er på alle hovedtall.
- Hastighetspåstanden i sammendraget ble strammet og ærliggjort.
Eksplisitt utsatt til oppfølger:
- Ekte per-posisjons-SNARK i stedet for konsistens-stubben (§9.9).
- Formell sort-boks-separasjon mellom AKZK og standard ZK (§5.6).
- Threshold-forpliktet aksept-mønster-personvern.
- Krav 3 forblir en skisse.
Bunnlinje
Konstruksjonene står seg under et større og statistisk anstendigere benchmark. Ingen tall fra v1 ble svekket; de fleste ble strammet med smalere CI-er. Hovedbidragene — AKZK-rammen, AsymVZK-protokollen, og VEWC-varianten med entropi-vektede utfordringer — er klare for ekstern fagfellevurdering.
Detaljer, figurer og bevis: paper/paper-en.md (engelsk, kanonisk) og paper/paper.md (norsk). Reproduserbar pakke: zk-llm-asymvzk-vewc-v2-reproduction.zip. Forskningsdokument: c0d9f520-0bfc-41eb-b77a-8ddf444ee41b på api.tenki.no/forskning.
Vedlegg (11)
Figurer (7)