Claude Mythos Preview от Anthropic стала первой моделью ИИ-агента, которая завершила полную симулированную атаку на корпоративную сеть, согласно новым оценкам Института безопасности ИИ Великобритании (AISI).
Результаты, опубликованные через несколько дней после анонса модели 7 апреля, свидетельствуют о том, что киберспособности ИИ достигли уровня, требующего немедленного внимания команд безопасности по всему миру.
Что такое Claude Mythos?
Anthropic представила свою модель Claude Mythos Preview 7 апреля, отказавшись от широкого публичного релиза. Вместо этого команда предоставляет ограниченный доступ исследовательским фирмам по безопасности для оценки и подготовки к её продвинутым возможностям.
Подписаться на нас в X, чтобы получать последние новости по мере их появления
Разработка уже начала привлекать внимание технологических и даже политических кругов. Согласно отчету Reuters со ссылкой на источники, знакомые с ситуацией, министр финансов США Скотт Бессент и председатель ФРС Джером Пауэлл провели срочную встречу с генеральными директорами крупных банков, предупредив о потенциальных киберрисках, связанных с этой моделью.
Как показал себя Claude Mythos Preview
Институт безопасности ИИ (AISI), исследовательская организация в рамках Департамента науки, инноваций и технологий правительства Великобритании, провела киберэкспертизу Claude Mythos Preview от Anthropic для изучения её возможностей в области кибербезопасности.
Сначала были проведены оценки capture-the-flag (CTF), где системы должны выявлять и эксплуатировать уязвимости для извлечения скрытых «флагов». Mythos достиг 73% успеха в задачах экспертного уровня. Это оставалось нерешенным ни одной моделью до апреля 2025 года.
Claude Mythos Возможности кибератак. Источник: AISIБолее того, AISI создал 32-шаговую симуляцию атаки на корпоративную сеть под названием «The Last Ones» (TLO). Специалистам по безопасности потребовалось бы примерно 20 часов, чтобы завершить её.
Mythos Preview завершил всю симуляцию в 3 из 10 попыток. В среднем он выполнил 22 из 32 шагов атаки. Claude Opus 4.6, следующий лучший исполнитель, выполнил в среднем только 16 шагов.
Собственное тестирование команды безопасности Anthropic показало, что Claude Mythos Preview может обнаруживать и эксплуатировать уязвимости нулевого дня во всех основных операционных системах и ведущих веб-браузерах при явном указании пользователя.
AISI отметил, что организации должны отдавать приоритет базовым мерам кибербезопасности. К ним относятся регулярное исправление уязвимостей, строгий контроль доступа, усиление конфигурации безопасности и комплексное ведение журналов.
Подпишитесь на наш канал YouTube, чтобы смотреть, как лидеры и журналисты предоставляют экспертные мнения
Пост Claude Mythos справляется с 73% экспертных киберзадач, которые ни один ИИ-агент не мог решить раньше, впервые появился на BeInCrypto.
Источник: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/








