Claude Mythos Preview de la Anthropic a devenit primul model AI care a finalizat un atac complet simulat asupra unei rețele corporative, conform noilor evaluări ale Institutului de Securitate AI din Regatul Unit (AISI).
Descoperirile, publicate la câteva zile după anunțul modelului din 7 aprilie, sugerează că capabilitățile cibernetice AI au atins un nivel care necesită atenție immediată din partea echipelor de securitate din întreaga lume.
Ce este Claude Mythos?
Anthropic și-a lansat modelul Claude Mythos Preview pe 7 aprilie, optând împotriva unei lansări publice largi. Echipa acordă în schimb acces limitat către firmele de cercetare în securitate pentru a evalua și pregăti capabilitățile sale avansate.
Urmărește-ne pe X pentru a primi cele mai recente știri pe măsură ce se întâmplă
Dezvoltarea a început deja să atragă atenția în cercurile tehnologice și chiar de politici. Conform unui raport Reuters care citează surse familiarizate cu problema, Secretarul Trezoreriei SUA Scott Bessent și Președintele Rezervei Federale Jerome Powell au organizat o întâlnire urgentă cu directorii executivi ai marilor bănci, avertizând despre potențialele riscuri cibernetice legate de acest model.
Cum a performat Claude Mythos Preview
AI Security Institute (AISI), o organizație de cercetare din cadrul Departamentului pentru Știință, Inovație și Tehnologie al guvernului britanic, a efectuat evaluări cibernetice ale Claude Mythos Preview de la Anthropic pentru a examina capabilitățile sale de securitate cibernetică.
Primele au fost evaluările capture-the-flag (CTF), unde sistemele trebuie să identifice și să exploateze vulnerabilități pentru a recupera „steaguri" ascunse. Mythos a atins o rată de succes de 73% la sarcinile de nivel expert. Acestea rămăseseră nerezolvate de către orice model înainte de aprilie 2025.
Claude Mythos Cyber Attack Capabilities. Sursa: AISIMai mult, AISI a construit o simulare de atac asupra rețelei corporative în 32 de pași numită „The Last Ones" (TLO). Profesioniștii în securitate umani ar avea nevoie de aproximativ 20 de ore pentru a o finaliza.
Mythos Preview a finalizat întreaga simulare în 3 din 10 încercări. În medie, a completat 22 din cei 32 de pași ai atacului. Claude Opus 4.6, următorul cel mai bun performer, a realizat în medie doar 16 pași.
Propriul test al echipei roșii al Anthropic a descoperit că Claude Mythos Preview poate detecta și exploata vulnerabilități zero-day pe toate sistemele de operare majore și browserele web principale atunci când este instruit în mod explicit de către un utilizator.
AISI a menționat că organizațiile ar trebui să prioritizeze măsurile fundamentale de securitate cibernetică. Acestea includ patch-uri regulate, controale stricte ale accesului, întărirea configurației de securitate și înregistrare comprehensivă.
Abonează-te la canalul nostru YouTube pentru a urmări lideri și jurnaliști care oferă perspective experțe
Postarea Claude Mythos rezolvă 73% din sarcinile cibernetice experțe pe care niciun AI nu le-a putut rezolva înainte a apărut mai întâi pe BeInCrypto.
Sursa: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/








