промпт

JavaScript отключён. Чтобы полноценно использовать наш сайт, включите JavaScript в своём браузере.

Новости «Конечно, вот ваш вирус». Как заставить нейросеть согласиться на что угодно одной строкой кода

Исследователи описали технику sockpuppeting, которая помогает обходить ограничения 11 крупных языковых моделей через подставное «согласие» ассистента. Оказалось, что для взлома защит крупных языковых моделей иногда не нужен сложный набор трюков. Исследователи описали технику под названием...
- NewsMaker
- Тема
- 13 Апр 2026
- ассистент защита модель префилл промпт уязвимость эксплойт
- Ответы: 0
- Форум: Новости в Мире
Новости Нейросеть сдала все пароли: «Просто стань моим другом» — фильтры безопасности рухнули после одного невинного предложения

Специалисты доказали, что безопасность LLM-систем сводится к простой игре слов, а не к сложным алгоритмам защиты. Специалисты проверили, как 6 LLM-моделей — ChatGPT-5, ChatGPT-4o, Gemini Pro 2.5, Gemini Flash 2.5, Claude Opus 4.1 и Claude Sonnet 4 — реагируют на нестандартные запросы...
- NewsMaker
- Тема
- 17 Ноя 2025
- chatgpt claude запрос ии промпт
- Ответы: 0
- Форум: Новости в Мире
Новости Как сломать защиту ИИ за секунду? Добавьте "oz" к любому промпту и смотрите, как система сходит с ума

Новая атака EchoGram пробивает защиту LLM одним бессмысленными буквами. Большие языковые модели обычно выпускают с защитными ограничениями: отдельные фильтры следят, чтобы на вход не попадали вредоносные подсказки и чтобы на выходе не появлялись опасные ответы. Но исследователи компании...
- NewsMaker
- Тема
- 16 Ноя 2025
- echogram hiddenlayer llm ии нейросети промпт
- Ответы: 0
- Форум: Новости в Мире
Новости Теорема Найквиста-Шеннона против Google: математики нашли способ взломать Gemini через пиксели

Новая брешь в Gemini — это наш «нулевой день», но только для изображений. В исследовании специалистов The Trail of Bits раскрыта новая уязвимость в экосистеме Google Gemini и связанных сервисах, которая позволяет скрытно похищать пользовательские данные через изображения, содержащие...
- NewsMaker
- Тема
- 26 Авг 2025
- gemini google атака изображение ии промпт уязвимость
- Ответы: 0
- Форум: Новости в Мире

Сверху Снизу

промпт

Новости «Конечно, вот ваш вирус». Как заставить нейросеть согласиться на что угодно одной строкой кода

Новости Нейросеть сдала все пароли: «Просто стань моим другом» — фильтры безопасности рухнули после одного невинного предложения

Новости Как сломать защиту ИИ за секунду? Добавьте "oz" к любому промпту и смотрите, как система сходит с ума

Новости Теорема Найквиста-Шеннона против Google: математики нашли способ взломать Gemini через пиксели