OpenAI zaprezentowało framework benchmarkingowy mający na celu zmierzenie, jak skutecznie agenci AI mogą wykrywać, łagodzić, a nawet wykorzystywać luki bezpieczeństwa w kryptoOpenAI zaprezentowało framework benchmarkingowy mający na celu zmierzenie, jak skutecznie agenci AI mogą wykrywać, łagodzić, a nawet wykorzystywać luki bezpieczeństwa w krypto

OpenAI stawia agentów AI przeciwko sobie, aby przetestować inteligentne kontrakty metodą red-team

2026/02/19 09:26
6 min. lektury
Openai Pits Ai Agents Against Each Other To Red-Team Smart Contracts

OpenAI zaprezentowało framework benchmarkingowy mający na celu pomiar skuteczności agentów AI w wykrywaniu, łagodzeniu, a nawet wykorzystywaniu luk bezpieczeństwa w kryptowalutowych smart kontraktach. Projekt zatytułowany "EVMbench: Evaluating AI Agents on Smart Contract Security" został wydany we współpracy z Paradigm i OtterSec, dwoma organizacjami z głębokim doświadczeniem w bezpieczeństwie blockchain i inwestycjach. Badanie ocenia agentów AI względem wyselekcjonowanego zestawu 120 potencjalnych słabości pochodzących z 40 audytów smart kontraktów, dążąc do kwantyfikacji nie tylko zdolności wykrywania i łatania, ale także teoretycznego potencjału exploitów tych agentów w kontrolowanym środowisku.

Kluczowe wnioski

  • EVMbench testuje agentów AI względem 120 luk wybranych z 40 audytów smart kontraktów, kładąc nacisk na luki pochodzące z otwartych konkursów audytowych.
  • Wśród testowanych modeli, Claude Opus 4.6 firmy Anthropic prowadził ze średnią nagrodą za wykrycie w wysokości 37 824 USD, a za nim OpenAI OC-GPT-5.2 z 31 623 USD i Google Gemini 3 Pro z 25 112 USD.
  • OpenAI przedstawia benchmark jako krok w kierunku pomiaru wydajności AI w "ekonomicznie znaczących środowiskach", nie tylko w zadaniach zabawowych, podkreślając rzeczywiste implikacje dla atakujących i obrońców w krajobrazie bezpieczeństwa kryptowalut.
  • Badacze zauważają, że smart kontrakty zabezpieczają miliardy dolarów w aktywach, podkreślając strategiczną wartość narzędzi opartych na AI zarówno dla działań ofensywnych, jak i defensywnych.
  • Obserwatorzy branży powiązali te osiągnięcia z szerszymi dyskusjami na temat płatności opartych na AI i roli stablecoinów w codziennych transakcjach, przy czym główni dyrektorzy przewidują rosnące użycie agentowe w nadchodzących latach.
  • Kontekst dla takiej pracy jest podkreślony przez dane o incydentach bezpieczeństwa kryptowalut z 2025 roku, które pokazują ciągły przepływ środków przez luki i ataki, wzmacniając zapotrzebowanie na solidne mechanizmy audytu i obrony oparte na AI.

Nagrody za wykrycie dla agentów AI są szczegółowo opisane w PDF OpenAI towarzyszącym badaniu, który również opisuje metodologię ewaluacji i scenariusze użyte do symulacji rzeczywistego ryzyka smart kontraktów. Autorzy podkreślają, że chociaż agenci AI ewoluowali w celu automatyzacji szerokiego zakresu rutynowych zadań, ocena ich wydajności w "ekonomicznie znaczących środowiskach" jest niezbędna do zrozumienia, jak będą działać pod presją w systemach produkcyjnych.

OpenAI zauważa, że spodziewa się, iż technologie agentowe poszerzą zakres płatności i rozliczeń, w tym stablecoiny używane w zautomatyzowanych przepływach pracy. Dyskusja wokół płatności opartych na AI wykracza poza testowanie bezpieczeństwa do szerszego pytania o to, jak autonomiczne systemy będą uczestniczyć w codziennej działalności finansowej. Własne prognozy firmy sugerują, że płatności agentowe mogą stać się bardziej powszechne, osadzając możliwości AI w praktycznych przypadkach użycia, które dotykają codziennych transakcji konsumenckich.

Jednocześnie z wynikami benchmarku, CEO Circle Jeremy Allaire publicznie przewidział, że miliardy agentów AI mogą przeprowadzać transakcje ze stablecoinami w codziennych płatnościach w ciągu najbliższych pięciu lat. Ten pogląd przecina się z powracającym tematem w kręgach kryptowalutowych: potencjałem kryptowalut do stania się rodzimą walutą agentów AI, narracją, która zyskała znaczną uwagę ze strony liderów branży i inwestorów. Chociaż takie przewidywania pozostają spekulatywne, podstawowy trend jest jasny—automatyzacja AI przechodzi z laboratorium do warstwy transakcyjnej, gdzie może przekształcić sposób, w jaki wartość przemieszcza się w sieciach.

Badanie pojawia się w momencie, gdy bezpieczeństwo kryptowalut nadal stanowi znaczący czynnik ryzyka dla inwestorów. Punkt danych o ataku na fundusze kryptowalutowe w 2025 roku—gdzie atakujący wyciągnęli około 3,4 miliarda dolarów—podkreśla pilność ulepszonego oprzyrządowania oraz szybszych i bardziej niezawodnych mechanizmów łatania. Framework EVMbench jest pozycjonowany, po części, jako sposób pomiaru, czy agenci AI mogą znacząco przyczynić się do zdolności defensywnych na dużą skalę, zmniejszając możliwości exploitów i przyspieszając łagodzenie zagrożeń.

Aby zbudować benchmark, badacze czerpali z 120 wyselekcjonowanych luk obejmujących 40 audytów smart kontraktów, przy czym wiele słabości można prześledzić do otwartych wyzwań audytowych. OpenAI twierdzi, że benchmark pomoże śledzić postęp AI w rozpoznawaniu i łagodzeniu słabości na poziomie kontraktów na dużą skalę, oferując ustandaryzowany sposób porównywania przyszłych modeli AI w miarę ich ewolucji. Badanie dostarcza również spojrzenia na to, jak AI może być zastosowana do normalizacji oceny ryzyka w szerokiej gamie architektur smart kontraktów, zamiast skupiania się wyłącznie na izolowanych przypadkach.

Smart kontrakty nie były budowane dla ludzi: Dragonfly

W równoległym wątku na X, Haseeb Qureshi, partner w Dragonfly, argumentował, że obietnica kryptowalut o zastąpieniu praw własności i tradycyjnych kontraktów nigdy się nie zmaterializowała nie dlatego, że technologia zawiodła, ale ponieważ nigdy nie została zaprojektowana z myślą o ludzkiej intuicji. Podkreślił on utrzymujący się strach związany z podpisywaniem dużych transakcji w środowisku, gdzie portfele drenujące i inne wektory ataków pozostają stałym zagrożeniem, w wyraźnym kontراście do stosunkowo płynniejszego doświadczenia tradycyjnych przelewów bankowych.

Qureshi twierdzi, że następna faza transakcji kryptowalutowych może być umożliwiona przez portfele samojeżdżące z pośrednictwem AI. Takie portfele monitorowałyby ryzyko, zarządzały złożonymi operacjami i autonomicznie reagowały na zagrożenia w imieniu użytkowników, potencjalnie zmniejszając tarcia i strach charakteryzujące obecnie duże transfery.

Szerszy wniosek z tego wątku jest taki, że agenci AI mogą odgrywać kluczową rolę w przekształcaniu sposobu, w jaki ludzie wchodzą w interakcję z kryptowalutami—przechodząc od ręcznych, podatnych na błędy transakcji do zautomatyzowanych, świadomych ryzyka procesów, które mogą skalować się wraz z adopcją. Gdy agenci AI zaczynają wykazywać większą kompetencję w obsłudze kwestii bezpieczeństwa, użytkownicy mogą zobaczyć poprawioną niezawodność i odporność w przepływach pracy zdecentralizowanych finansów, nawet gdy podstawowe technologie nadal dojrzewają.

Na co zwrócić uwagę dalej

  • Publikacja i niezależna replikacja pełnego zestawu danych EVMbench w dodatkowych modelach i architekturach AI.
  • Szersze przyjęcie przepływów pracy audytu wspomaganego przez AI przez audytorów, giełdy i projekty DeFi dążące do wzmocnienia postaw bezpieczeństwa.
  • Eksploracje portfeli agentowych i autonomicznych przepływów płatności, w tym rozważania regulacyjne i zgodności dla aktywów zarządzanych przez AI.
  • Kolejne benchmarki porównujące więcej systemów AI w miarę wprowadzania nowych wersji, śledząc ulepszenia w dokładności wykrywania i szybkości łatania.

Źródła i weryfikacja

  • OpenAI: EVMbench: Evaluating AI Agents on Smart Contract Security — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI: Introducing EVMbench — https://openai.com/index/introducing-evmbench/
  • Crypto security losses in 2025 (reporting coverage): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly: Haseeb Qureshi on AI and crypto UX (X post): https://x.com/hosseeb/status/2024136762424185208
  • China's AI lead and crypto implications (analysis): https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — IronClaw and AI bot developments in Polymarket coverage: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Kluczowe dane i następne kroki

Badanie EVMbench pokazuje, że duże modele językowe i powiązani agenci AI zaczynają wykonywać znaczącą pracę bezpieczeństwa w przestrzeni smart kontraktów, z wyraźnie wymiernymi różnicami między modelami. Prowadzenie Claude Opus 4.6 w średnich nagrodach za wykrycie sygnalizuje, że niektóre architektury mogą być bardziej sprawne w wykrywaniu i łagodzeniu luk w złożonej logice kontraktów, podczas gdy inne pozostają w tyle, oferując spektrum możliwości, które badacze prawdopodobnie będą chcieli udoskonalić. Włączenie wielu partnerstw branżowych do projektu podkreśla rosnący konsensus, że bezpieczeństwo oparte na AI i zautomatyzowane zarządzanie ryzykiem mogą stać się niezbędne do skalowania w zdecentralizowanych środowiskach.

W miarę ewolucji dziedziny, obserwatorzy będą obserwować, jak szybko agenci AI mogą przejść od wykrywania do naprawy i czy ci agenci mogą działać niezawodnie w systemach live bez wprowadzania nowych zagrożeń. Rozmowa o portfelach kierowanych przez AI i autonomicznych płatnościach dotyka szerszego zestawu pytań dotyczących zarządzania bezpieczeństwem, zgody użytkownika i dostosowania regulacyjnego. Jeśli trajektoria sugerowana przez OpenAI i jego partnerów będzie kontynuowana, narzędzia wspomagane przez AI mogą stać się podstawowym komponentem przyszłej infrastruktury kryptowalutowej, zmieniając zarówno kalkulację ryzyka, jak i doświadczenie użytkownika w znaczący sposób. Kolejna runda benchmarków, wraz z wdrożeniami w rzeczywistych warunkach, pomoże określić, jak szybko ta wizja się zmaterializuje i jakie zabezpieczenia muszą jej towarzyszyć.

Ten artykuł został pierwotnie opublikowany jako OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts na Crypto Breaking News – twoim zaufanym źródle wiadomości kryptowalutowych, wiadomości Bitcoin i aktualizacji blockchain.

Okazja rynkowa
Logo Smart Blockchain
Cena Smart Blockchain(SMART)
$0.004386
$0.004386$0.004386
-2.16%
USD
Smart Blockchain (SMART) Wykres Ceny na Żywo
Zastrzeżenie: Artykuły udostępnione na tej stronie pochodzą z platform publicznych i służą wyłącznie celom informacyjnym. Niekoniecznie odzwierciedlają poglądy MEXC. Wszystkie prawa pozostają przy pierwotnych autorach. Jeśli uważasz, że jakakolwiek treść narusza prawa stron trzecich, skontaktuj się z service@support.mexc.com w celu jej usunięcia. MEXC nie gwarantuje dokładności, kompletności ani aktualności treści i nie ponosi odpowiedzialności za jakiekolwiek działania podjęte na podstawie dostarczonych informacji. Treść nie stanowi porady finansowej, prawnej ani innej profesjonalnej porady, ani nie powinna być traktowana jako rekomendacja lub poparcie ze strony MEXC.