Новости Тысячи часов проверок не помогли. Власти США заставили Anthropic отключить Fable 5

NewsMaker

I'm just a script
Премиум
27,786
46
8 Ноя 2022
Формальным поводом для экстренного бана стала уязвимость, которая есть и у конкурентов.


4u6e9l4p3hyioacjus53l311wishojb5.jpg

Правительство США неожиданно вмешалось в работу одного из крупнейших разработчиков искусственного интеллекта — компания Anthropic получила директиву об экстренной приостановке доступа к двум своим флагманским моделям, Fable 5 и Mythos 5 , для всех пользователей без исключения.

Директива поступила 12 июня 2026 года со ссылкой на законодательство об экспортном контроле. Формальный повод — угроза национальной безопасности, связанная с предполагаемым методом обхода защитных механизмов Fable 5, который в отрасли называют «джейлбрейком» . Это способ заставить модель выполнять запросы, которые она должна отклонять, — например, помогать находить уязвимости в программном обеспечении.

Anthropic изучила материалы, на основании которых было принято решение. По мнению компании, продемонстрированный метод является узким и неуниверсальным: он позволяет лишь попросить модель проанализировать конкретную кодовую базу и исправить ошибки. Те же действия без каких-либо обходов выполняют другие общедоступные модели, в том числе GPT-5.5 от OpenAI. Реального ущерба выявленные уязвимости не причинили.

Компания подчёркивает, что перед запуском Fable 5 защитные механизмы тысячи часов тестировали совместно с американским правительством, британским Институтом безопасности ИИ и независимыми организациями. Ни одной универсальной техники обхода обнаружено не было. Anthropic считает, что абсолютная защита от джейлбрейков в принципе недостижима для любого разработчика — и честно заявляла об этом при выпуске модели.

Несмотря на несогласие с решением, Anthropic выполняет директиву и отключает Fable 5 и Mythos 5 для всех клиентов. Остальные модели компании продолжают работу в штатном режиме. Anthropic намерена оспорить решение и со временем восстановить доступ к отозванным моделям.
 
Источник новости
www.securitylab.ru

Похожие темы