OpenAI zaprezentowało framework benchmarkingowy mający na celu pomiar skuteczności agentów AI w wykrywaniu, łagodzeniu, a nawet wykorzystywaniu luk bezpieczeństwa w kryptowalutowych smart kontraktach. Projekt zatytułowany "EVMbench: Evaluating AI Agents on Smart Contract Security" został wydany we współpracy z Paradigm i OtterSec, dwoma organizacjami z głębokim doświadczeniem w bezpieczeństwie blockchain i inwestycjach. Badanie ocenia agentów AI względem wyselekcjonowanego zestawu 120 potencjalnych słabości pochodzących z 40 audytów smart kontraktów, dążąc do kwantyfikacji nie tylko zdolności wykrywania i łatania, ale także teoretycznego potencjału exploitów tych agentów w kontrolowanym środowisku.
Nagrody za wykrycie dla agentów AI są szczegółowo opisane w PDF OpenAI towarzyszącym badaniu, który również opisuje metodologię ewaluacji i scenariusze użyte do symulacji rzeczywistego ryzyka smart kontraktów. Autorzy podkreślają, że chociaż agenci AI ewoluowali w celu automatyzacji szerokiego zakresu rutynowych zadań, ocena ich wydajności w "ekonomicznie znaczących środowiskach" jest niezbędna do zrozumienia, jak będą działać pod presją w systemach produkcyjnych.
OpenAI zauważa, że spodziewa się, iż technologie agentowe poszerzą zakres płatności i rozliczeń, w tym stablecoiny używane w zautomatyzowanych przepływach pracy. Dyskusja wokół płatności opartych na AI wykracza poza testowanie bezpieczeństwa do szerszego pytania o to, jak autonomiczne systemy będą uczestniczyć w codziennej działalności finansowej. Własne prognozy firmy sugerują, że płatności agentowe mogą stać się bardziej powszechne, osadzając możliwości AI w praktycznych przypadkach użycia, które dotykają codziennych transakcji konsumenckich.
Jednocześnie z wynikami benchmarku, CEO Circle Jeremy Allaire publicznie przewidział, że miliardy agentów AI mogą przeprowadzać transakcje ze stablecoinami w codziennych płatnościach w ciągu najbliższych pięciu lat. Ten pogląd przecina się z powracającym tematem w kręgach kryptowalutowych: potencjałem kryptowalut do stania się rodzimą walutą agentów AI, narracją, która zyskała znaczną uwagę ze strony liderów branży i inwestorów. Chociaż takie przewidywania pozostają spekulatywne, podstawowy trend jest jasny—automatyzacja AI przechodzi z laboratorium do warstwy transakcyjnej, gdzie może przekształcić sposób, w jaki wartość przemieszcza się w sieciach.
Badanie pojawia się w momencie, gdy bezpieczeństwo kryptowalut nadal stanowi znaczący czynnik ryzyka dla inwestorów. Punkt danych o ataku na fundusze kryptowalutowe w 2025 roku—gdzie atakujący wyciągnęli około 3,4 miliarda dolarów—podkreśla pilność ulepszonego oprzyrządowania oraz szybszych i bardziej niezawodnych mechanizmów łatania. Framework EVMbench jest pozycjonowany, po części, jako sposób pomiaru, czy agenci AI mogą znacząco przyczynić się do zdolności defensywnych na dużą skalę, zmniejszając możliwości exploitów i przyspieszając łagodzenie zagrożeń.
Aby zbudować benchmark, badacze czerpali z 120 wyselekcjonowanych luk obejmujących 40 audytów smart kontraktów, przy czym wiele słabości można prześledzić do otwartych wyzwań audytowych. OpenAI twierdzi, że benchmark pomoże śledzić postęp AI w rozpoznawaniu i łagodzeniu słabości na poziomie kontraktów na dużą skalę, oferując ustandaryzowany sposób porównywania przyszłych modeli AI w miarę ich ewolucji. Badanie dostarcza również spojrzenia na to, jak AI może być zastosowana do normalizacji oceny ryzyka w szerokiej gamie architektur smart kontraktów, zamiast skupiania się wyłącznie na izolowanych przypadkach.
W równoległym wątku na X, Haseeb Qureshi, partner w Dragonfly, argumentował, że obietnica kryptowalut o zastąpieniu praw własności i tradycyjnych kontraktów nigdy się nie zmaterializowała nie dlatego, że technologia zawiodła, ale ponieważ nigdy nie została zaprojektowana z myślą o ludzkiej intuicji. Podkreślił on utrzymujący się strach związany z podpisywaniem dużych transakcji w środowisku, gdzie portfele drenujące i inne wektory ataków pozostają stałym zagrożeniem, w wyraźnym kontراście do stosunkowo płynniejszego doświadczenia tradycyjnych przelewów bankowych.
Qureshi twierdzi, że następna faza transakcji kryptowalutowych może być umożliwiona przez portfele samojeżdżące z pośrednictwem AI. Takie portfele monitorowałyby ryzyko, zarządzały złożonymi operacjami i autonomicznie reagowały na zagrożenia w imieniu użytkowników, potencjalnie zmniejszając tarcia i strach charakteryzujące obecnie duże transfery.
Szerszy wniosek z tego wątku jest taki, że agenci AI mogą odgrywać kluczową rolę w przekształcaniu sposobu, w jaki ludzie wchodzą w interakcję z kryptowalutami—przechodząc od ręcznych, podatnych na błędy transakcji do zautomatyzowanych, świadomych ryzyka procesów, które mogą skalować się wraz z adopcją. Gdy agenci AI zaczynają wykazywać większą kompetencję w obsłudze kwestii bezpieczeństwa, użytkownicy mogą zobaczyć poprawioną niezawodność i odporność w przepływach pracy zdecentralizowanych finansów, nawet gdy podstawowe technologie nadal dojrzewają.
Badanie EVMbench pokazuje, że duże modele językowe i powiązani agenci AI zaczynają wykonywać znaczącą pracę bezpieczeństwa w przestrzeni smart kontraktów, z wyraźnie wymiernymi różnicami między modelami. Prowadzenie Claude Opus 4.6 w średnich nagrodach za wykrycie sygnalizuje, że niektóre architektury mogą być bardziej sprawne w wykrywaniu i łagodzeniu luk w złożonej logice kontraktów, podczas gdy inne pozostają w tyle, oferując spektrum możliwości, które badacze prawdopodobnie będą chcieli udoskonalić. Włączenie wielu partnerstw branżowych do projektu podkreśla rosnący konsensus, że bezpieczeństwo oparte na AI i zautomatyzowane zarządzanie ryzykiem mogą stać się niezbędne do skalowania w zdecentralizowanych środowiskach.
W miarę ewolucji dziedziny, obserwatorzy będą obserwować, jak szybko agenci AI mogą przejść od wykrywania do naprawy i czy ci agenci mogą działać niezawodnie w systemach live bez wprowadzania nowych zagrożeń. Rozmowa o portfelach kierowanych przez AI i autonomicznych płatnościach dotyka szerszego zestawu pytań dotyczących zarządzania bezpieczeństwem, zgody użytkownika i dostosowania regulacyjnego. Jeśli trajektoria sugerowana przez OpenAI i jego partnerów będzie kontynuowana, narzędzia wspomagane przez AI mogą stać się podstawowym komponentem przyszłej infrastruktury kryptowalutowej, zmieniając zarówno kalkulację ryzyka, jak i doświadczenie użytkownika w znaczący sposób. Kolejna runda benchmarków, wraz z wdrożeniami w rzeczywistych warunkach, pomoże określić, jak szybko ta wizja się zmaterializuje i jakie zabezpieczenia muszą jej towarzyszyć.
Ten artykuł został pierwotnie opublikowany jako OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts na Crypto Breaking News – twoim zaufanym źródle wiadomości kryptowalutowych, wiadomości Bitcoin i aktualizacji blockchain.


