PANews melaporkan pada 5 Januari bahwa dengan dimulainya tahun 2026, bidang keamanan AI menyambut uji tolok ukur besar pertamanya. LISABench hari ini mengumumkan peluncuran evaluasi Q1 2026, yang bertujuan untuk menentukan model AI terdepan berkinerja terbaik dalam deteksi kerentanan smart contract Web3 melalui pengujian dunia nyata. Selain itu, LISABench secara bersamaan meluncurkan program hadiah prediksi voting komunitas.
Evaluasi ini memiliki jajaran yang mengesankan, mengumpulkan tujuh model terdepan terbaik dunia—KIMI K2 (Moonshot AI), DeepSeek V3.2, QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhipu AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google), dan Claude 4.5 Sonnet (Anthropic)—untuk berkompetisi di panggung yang sama.
Saat ini, voting untuk prediksi pemenang Q1 telah dibuka. Sementara itu, basis kode tolok ukur LISABench telah dirilis sebagai open-source di GitHub untuk ditinjau dan direproduksi oleh pengembang.


