Claude Mythos Preview firmy Anthropic stał się pierwszym modelem AI, który ukończył pełną symulowaną atak na sieć korporacyjną, zgodnie z nowymi ocenami brytyjskiego Instytutu Bezpieczeństwa AI (AISI).
Odkrycia, opublikowane kilka dni po ogłoszeniu modelu 7 kwietnia, sugerują, że możliwości cybernetyczne AI osiągnęły poziom, który wymaga natychmiastowej uwagi zespołów bezpieczeństwa na całym świecie.
Czym jest Claude Mythos?
Anthropic zaprezentował swój model Claude Mythos Preview 7 kwietnia, rezygnując z szerokiego publicznego wydania. Zespół zamiast tego przyznaje ograniczony dostęp firmom badawczym zajmującym się bezpieczeństwem, aby ocenić i przygotować się na jego zaawansowane możliwości.
Śledź nas na X, aby otrzymywać najnowsze wiadomości na bieżąco
Rozwój już zaczął przyciągać uwagę w kręgach technologicznych, a nawet politycznych. Według raportu Reuters powołującego się na źródła zaznajomione ze sprawą, sekretarz skarbu USA Scott Bessent i przewodniczący Rezerwy Federalnej Jerome Powell przeprowadzili pilne spotkanie z prezesami głównych banków, ostrzegając przed potencjalnymi zagrożeniami cybernetycznymi związanymi z tym modelem.
Jak wypadł Claude Mythos Preview
Instytut Bezpieczeństwa AI (AISI), organizacja badawcza w ramach brytyjskiego rządowego Departamentu Nauki, Innowacji i Technologii, przeprowadził oceny cybernetyczne Claude Mythos Preview firmy Anthropic, aby zbadać jego możliwości w zakresie cyberbezpieczeństwa.
Najpierw były oceny typu capture-the-flag (CTF), w których systemy muszą identyfikować i wykorzystywać luki, aby odzyskać ukryte "flagi". Mythos osiągnął 73% wskaźnik sukcesu w zadaniach na poziomie eksperckim. Pozostawały one nierozwiązane przez jakikolwiek model przed kwietniem 2025 roku.
Claude Mythos Cyber Attack Capabilities. Źródło: AISIPonadto AISI zbudował 32-etapową symulację ataku na sieć korporacyjną o nazwie "The Last Ones" (TLO). Profesjonaliści ds. bezpieczeństwa potrzebowaliby około 20 godzin, aby ją ukończyć.
Mythos Preview ukończył całą symulację w 3 z 10 prób. Średnio ukończył 22 z 32 kroków ataku. Claude Opus 4.6, kolejny najlepszy wykonawca, osiągnął średnio tylko 16 kroków.
Własne testy red team firmy Anthropic wykazały, że Claude Mythos Preview może wykrywać i wykorzystywać luki zero-day we wszystkich głównych systemach operacyjnych i wiodących przeglądarkach internetowych, gdy użytkownik wyraźnie go o to poinstruuje.
AISI zauważył, że organizacje powinny priorytetyzować podstawowe środki cyberbezpieczeństwa. Obejmują one regularne łatanie, ścisłą kontrolę dostępu, wzmacnianie konfiguracji bezpieczeństwa i kompleksowe rejestrowanie.
Subskrybuj nasz kanał YouTube, aby oglądać liderów i dziennikarzy dostarczających eksperckich spostrzeżeń
Post Claude Mythos Cracks 73% of Expert Cyber Tasks No AI Could Solve Before pojawił się najpierw na BeInCrypto.
Źródło: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/





