Whitepaper· v2.1

Asymmetric-Knowledge Zero-Knowledge for Autoregressive LLM Inference (v2.1): Bootstrap CIs, Tightened Proofs, GPU-Scale Validation on Qwen 3.5, and Concurrent-Work Citation Patch

v2.1: full proofs (Claims 1, 2), N=500 bootstrap-CI experiments on RTX 5070 Ti, embedded figures, tightened limitations, and Chong et al. 2025 citation patch

Forfattere

Einar Holt · tenki

Publisert 6. mai 2026

Sammendrag

v2.1 of the May 2026 release on verifiable autoregressive LLM inference. v1 introduced PSI-LM, AKZK, AsymVZK, and VEWC at proof-of-concept scale. v2 reran the empirical sweep at N=500 trials per cell on RTX 5070 Ti with 95% bootstrap confidence intervals, replaced three proof sketches with full hybrid arguments (Claims 1 and 2; Claim 3 stays as a sketch with the formal AKZK/ZK separation explicitly deferred), tightened the abstract (the ~32x speedup figure compares against the naive autoregressive zkLLM baseline, not against PSI-LM), added embedded matplotlib figures, and explicitly deferred the real per-position SNARK integration and threshold-committed accept-pattern privacy to a follow-up paper. v2.1 adds a single citation patch: Chong, Ohsaki and Ng (2025, arXiv:2509.11068) on tractable asymmetric verification of LLM outputs via deterministic replicability is now positioned as a concurrent, complementary, non-cryptographic thread in §3.4. No construction, proof, or empirical number changes between v2 and v2.1. All v1 claims that survive scrutiny are reproduced or strengthened by the larger benchmark; the headline VEWC-vs-AsymVZK gap on Qwen 3.5 is over 10x at low k (e.g. 74.6% vs 7.4% at k=4 with N=500 and 95% bootstrap CIs).

Funn

Vi konstruerte tre protokoller for verifiserbar autoregressiv LLM-inferens (PSI-LM, AsymVZK, VEWC) og en ny trusselmodell (AKZK). v2 reproduserte v1-tallene på GPU med statistisk troverdige intervaller; v2.1 la til én sitering (Chong, Ohsaki & Ng 2025) uten å endre tall eller bevis.

Hovedfunn

VEWC slår AsymVZK-uniform med over en størrelsesorden mot semantisk-innholds-motstander ved lav $k$ . Ved $k = 4$ og én løgn på et høy-entropi-token: VEWC fanger 74,6 % [70,8; 78,4] mot AsymVZK-uniforms 7,4 % [5,0; 9,8] — en faktor 10,1×. Ved $k = 2$ er forholdet 12,7×. Gapet smalner naturlig når $k$ vokser, fordi begge protokoller saturerer mot 100 %.

VEWC har en målbar blindsone på lav-entropi-motstandere. Ved tre løgner plassert på de laveste-entropi-posisjonene fanger VEWC kun 0,6 % [0,0; 1,4] selv ved $k = 32$ , mens AsymVZK-uniform fanger 89,2 % [86,4; 91,8]. Dette er ikke en feil — det er en ærlig konsekvens av at VEWC vekter utfordringer mot høy-entropi-posisjoner. §9.7.3 i artikkelen anbefaler en hybrid konfigurasjon for produksjonsbruk.

Mot uniform-tilfeldig motstander vinner AsymVZK-uniform med en moderat margin. Ved $k = 32$ , tre løgner: VEWC 37,6 % vs. AsymVZK 86,2 %. Dette er forventet — AsymVZK-uniform deprioriterer ingen posisjonsklasse.

Speculative-akseptraten ligger mellom 70 % og 86 % på fem prompt-domener (Qwen 2.5-1.5B + 0,5B). Det betyr at AsymVZK kun trenger kryptografiske bevis ved omtrent en fjerdedel av posisjonene.

Hastighetsgevinst. PSI-LM og AsymVZK oppnår begge $\sim 32 \times$ bevistidsgevinst over naiv autoregressiv zkLLM-baseline ved $L = 1024$ , $k = 32$ . AsymVZK gir ikke ytterligere bevis-tidsgevinst over PSI-LM; merverdien ligger på verifikator-siden (gratis utkast-modell-replay) og i AKZK-trusselmodellen.

Hva som er og hva som ikke er løst

Løst eller styrket i v2:

- Tre bevisskisser erstattet med fulle hybrid-argumenter (Krav 1 og 2).

- Empiriske CI-er på alle hovedtall.

- Hastighetspåstanden i sammendraget ble strammet og ærliggjort.

Eksplisitt utsatt til oppfølger:

- Ekte per-posisjons-SNARK i stedet for konsistens-stubben (§9.9).

- Formell sort-boks-separasjon mellom AKZK og standard ZK (§5.6).

- Threshold-forpliktet aksept-mønster-personvern.

- Krav 3 forblir en skisse.

Bunnlinje

Konstruksjonene står seg under et større og statistisk anstendigere benchmark. Ingen tall fra v1 ble svekket; de fleste ble strammet med smalere CI-er. Hovedbidragene — AKZK-rammen, AsymVZK-protokollen, og VEWC-varianten med entropi-vektede utfordringer — er klare for ekstern fagfellevurdering.

Detaljer, figurer og bevis: paper/paper-en.md (engelsk, kanonisk) og paper/paper.md (norsk). Reproduserbar pakke: zk-llm-asymvzk-vewc-v2-reproduction.zip. Forskningsdokument: c0d9f520-0bfc-41eb-b77a-8ddf444ee41b på api.tenki.no/forskning.

→ Se papiret ↓ Last ned PDF

Vedlegg (11)

Figurer (7)

acceptance_per_prompt.png44.4 kBLast ned
cost_scaling_L.png38.9 kBLast ned
detection_vs_k_lowentropy.png31.6 kBLast ned
detection_vs_k_semantic_1lie.png35.9 kBLast ned
detection_vs_k_semantic_2lies.png30.3 kBLast ned
detection_vs_k_uniform.png33.0 kBLast ned
psilm_empirical_vs_theory.png59.0 kBLast ned

Filer (4)

paper.md89.7 kBLast ned
summary.md5.1 kBLast ned
REPRODUCE.md3.4 kBLast ned
zk-llm-asymvzk-vewc-v2-reproduction.zip447.2 kBLast ned

zkmlzero-knowledge-proofslanguage-modelsspeculative-decodingqwenv2-1tenki-researchAKZKVEWCPSI-LMAsymVZKbootstrap-CIsasymmetric-verification

← Tilbake til forskning