Rongchai Wang
24 jan 2026 00:07
EigenAI behaalt 100% reproduceerbare LLM-outputs op GPU's met minder dan 2% overhead, waardoor verifieerbare autonome AI-agents mogelijk worden voor handel en voorspellingsmarkten.
EigenCloud heeft zijn EigenAI-platform op het mainnet uitgebracht en claimt daarmee een fundamenteel probleem op te lossen dat autonome AI-systemen teistert: je kunt niet verifiëren wat je niet kunt reproduceren.
De technische prestatie hier is significant. EigenAI levert bit-exacte deterministische inferentie op productie-GPU's—wat betekent dat identieke inputs identieke outputs produceren over 10.000 testruns—met slechts 1,8% extra latentie. Voor iedereen die AI-agents bouwt die echt geld beheren, is dit van belang.
Waarom LLM-willekeur financiële toepassingen breekt
Voer dezelfde prompt twee keer door ChatGPT uit. Verschillende antwoorden. Dat is geen bug—het is hoe floating-point wiskunde op GPU's werkt. Kernel scheduling, variabele batching en niet-associatieve accumulatie introduceren allemaal kleine variaties die zich opstapelen tot verschillende outputs.
Voor chatbots merkt niemand het op. Voor een AI-handelsagent die met jouw kapitaal uitvoert? Voor een voorspellingsmarkt-orakel dat beslist wie $200 miljoen aan weddenschappen wint? De inconsistentie wordt een risico.
EigenCloud wijst naar Polymarket's beruchte "Droeg Zelenskyy een pak?"-markt als casestudy. Meer dan $200 miljoen aan volume, beschuldigingen van willekeurige besluitvorming, en uiteindelijk moest menselijk bestuur ingrijpen. Naarmate markten opschalen, doet menselijke arbitrage dat niet. Een AI-rechter wordt onvermijdelijk—maar alleen als die rechter elke keer hetzelfde verdict produceert.
De technische stack
Het bereiken van determinisme op GPU's vereiste controle over elke laag. A100- en H100-chips produceren verschillende resultaten voor identieke operaties vanwege architecturale verschillen in afronding. EigenAI's oplossing: operators en verificateurs moeten identieke GPU-SKU's gebruiken. Hun tests toonden een 100% match rate bij runs op dezelfde architectuur, 0% cross-architectuur.
Het team verving standaard cuBLAS-kernels door aangepaste implementaties met warp-synchrone reducties en vaste thread-ordening. Geen floating-point atomics. Ze bouwden voort op llama.cpp vanwege de kleine, controleerbare codebase, waarbij dynamische grafiekfusie en andere optimalisaties die variabiliteit introduceren werden uitgeschakeld.
De prestatiekosten liggen op 95-98% van de standaard cuBLAS-doorvoer. Cross-host tests op onafhankelijke H100-nodes produceerden identieke SHA256-hashes. Stresstests met achtergrond-GPU-werklasten die scheduling jitter veroorzaken? Nog steeds identiek.
Verificatie door economie
EigenAI gebruikt een optimistisch verificatiemodel ontleend aan blockchain rollups. Operators publiceren versleutelde resultaten naar EigenDA, de data availability layer van het project. Resultaten worden standaard geaccepteerd, maar kunnen tijdens een geschillenperiode worden aangevochten.
Bij aanvechting voeren verificateurs opnieuw uit binnen trusted execution environments. Omdat uitvoering deterministisch is, wordt verificatie binair: komen de bytes overeen? Niet-overeenkomsten triggeren slashing van gebonden stake. De operator verliest geld; aanvechtende partijen en verificateurs worden betaald.
Het economische ontwerp is erop gericht om vals spelen een negatieve verwachte waarde te geven zodra de uitdagingskans een bepaalde drempel overschrijdt.
Wat er nu wordt gebouwd
De directe toepassingen zijn eenvoudig: voorspellingsmarkt-arbiters wiens vonnissen kunnen worden gereproduceerd en gecontroleerd, handelsagents waarbij elke beslissing wordt gelogd en aanvechtbaar is, en onderzoekstools waarbij resultaten peer-reviewed kunnen worden door heruitvoering in plaats van vertrouwen.
De bredere trend hier sluit aan bij de groeiende interesse van ondernemingen in deterministisch AI voor compliance-zware sectoren. Gezondheidszorg, financiën en juridische toepassingen eisen steeds meer het soort reproduceerbaarheid dat probabilistische systemen niet kunnen garanderen.
Of EigenAI's 2% overhead acceptabel blijkt voor high-frequency toepassingen moet nog blijken. Maar voor autonome agents die aanzienlijk kapitaal beheren, kan het vermogen om uitvoeringsintegriteit te bewijzen de prestatieheffing waard zijn.
Het volledige whitepaper beschrijft formele beveiligingsanalyse, kernel-ontwerpspecificaties en slashing-mechanica voor degenen die op de infrastructuur bouwen.
Afbeeldingsbron: Shutterstock
Bron: https://blockchain.news/news/eigenai-deterministic-inference-mainnet-launch


