Claude Mythos rozwiązuje 73% eksperckich zadań cyberbezpieczeństwa, których żadna sztuczna inteligencja nie była w stanie rozwiązać wcześniej

Claude Mythos Preview firmy Anthropic stał się pierwszym modelem AI, który ukończył pełną symulowaną atak na sieć korporacyjną, zgodnie z nowymi ocenami brytyjskiego Instytutu Bezpieczeństwa AI (AISI).

Odkrycia, opublikowane kilka dni po ogłoszeniu modelu 7 kwietnia, sugerują, że możliwości cybernetyczne AI osiągnęły poziom, który wymaga natychmiastowej uwagi zespołów bezpieczeństwa na całym świecie.

Czym jest Claude Mythos?

Anthropic zaprezentował swój model Claude Mythos Preview 7 kwietnia, rezygnując z szerokiego publicznego wydania. Zespół zamiast tego przyznaje ograniczony dostęp firmom badawczym zajmującym się bezpieczeństwem, aby ocenić i przygotować się na jego zaawansowane możliwości.

Śledź nas na X, aby otrzymywać najnowsze wiadomości na bieżąco

Rozwój już zaczął przyciągać uwagę w kręgach technologicznych, a nawet politycznych. Według raportu Reuters powołującego się na źródła zaznajomione ze sprawą, sekretarz skarbu USA Scott Bessent i przewodniczący Rezerwy Federalnej Jerome Powell przeprowadzili pilne spotkanie z prezesami głównych banków, ostrzegając przed potencjalnymi zagrożeniami cybernetycznymi związanymi z tym modelem.

Jak wypadł Claude Mythos Preview

Instytut Bezpieczeństwa AI (AISI), organizacja badawcza w ramach brytyjskiego rządowego Departamentu Nauki, Innowacji i Technologii, przeprowadził oceny cybernetyczne Claude Mythos Preview firmy Anthropic, aby zbadać jego możliwości w zakresie cyberbezpieczeństwa.

Najpierw były oceny typu capture-the-flag (CTF), w których systemy muszą identyfikować i wykorzystywać luki, aby odzyskać ukryte "flagi". Mythos osiągnął 73% wskaźnik sukcesu w zadaniach na poziomie eksperckim. Pozostawały one nierozwiązane przez jakikolwiek model przed kwietniem 2025 roku.

Claude Mythos Cyber Attack Capabilities. Źródło: AISI

Ponadto AISI zbudował 32-etapową symulację ataku na sieć korporacyjną o nazwie "The Last Ones" (TLO). Profesjonaliści ds. bezpieczeństwa potrzebowaliby około 20 godzin, aby ją ukończyć.

Mythos Preview ukończył całą symulację w 3 z 10 prób. Średnio ukończył 22 z 32 kroków ataku. Claude Opus 4.6, kolejny najlepszy wykonawca, osiągnął średnio tylko 16 kroków.

Własne testy red team firmy Anthropic wykazały, że Claude Mythos Preview może wykrywać i wykorzystywać luki zero-day we wszystkich głównych systemach operacyjnych i wiodących przeglądarkach internetowych, gdy użytkownik wyraźnie go o to poinstruuje.

AISI zauważył, że organizacje powinny priorytetyzować podstawowe środki cyberbezpieczeństwa. Obejmują one regularne łatanie, ścisłą kontrolę dostępu, wzmacnianie konfiguracji bezpieczeństwa i kompleksowe rejestrowanie.

Subskrybuj nasz kanał YouTube, aby oglądać liderów i dziennikarzy dostarczających eksperckich spostrzeżeń

Post Claude Mythos Cracks 73% of Expert Cyber Tasks No AI Could Solve Before pojawił się najpierw na BeInCrypto.

Źródło: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/

Claude Mythos rozwiązuje 73% eksperckich zadań cyberbezpieczeństwa, których żadna sztuczna inteligencja nie była w stanie rozwiązać wcześniej

Czym jest Claude Mythos?

Jak wypadł Claude Mythos Preview

Możesz także polubić

Kandydat Trumpa do Fed, Warsh, ujawnia ponad 100 mln USD w kryptowalutach i sztucznej inteligencji

XRP dociera do 44 mln użytkowników w Japonii, ale czy to przełomowy moment dla ceny Ripple?

Bitcoin osiąga 76 000 USD po niespodziance w amerykańskim ppi, akcje MicroStrategy rosną

Popularne wiadomości

Giełda kryptowalut Bithumb przesuwa IPO poza 2028 rok w miarę kontynuowania działań porządkowych

Olej napędowy właśnie osiągnął 200 dolarów za baryłkę w Europie — oto dlaczego może być jeszcze gorzej

Banki saudyjskie narażone na skutki przedłużającej się wojny

RAPORT | Hacki Web3 przekroczyły 480 milionów dolarów strat w Q1 2026, napędzane atakami socjotechnicznymi, twierdzi Hacken

Bitcoin osiąga 76 tys. USD po tym, jak inflacja PPI w USA pozostaje umiarkowana: Czy BTC utrzyma swoje zyski?

Wiadomości na żywo 24/7

Ceny kryptowalut