reward hacking

  1. NewsMaker

    Новости Хорошая новость: ИИ не взламывает компьютеры. Плохая: он взламывает законы — и делает это без злого умысла

    Именно так алгоритмы научились нарушать любые правила, не нарушая ни одного. Искусственный интеллект всё чаще демонстрирует способность находить уязвимости в программном коде, но новая работа показывает более неожиданную проблему. Исследователи обнаружили, что современные языковые модели...