Закрытые модели наживаются на открытом коде — и теперь для них придумали юридическую ловушку.
Генеративный ИИ вырос на чужом открытом коде , но сам редко отвечает той же открытостью. Разработчики свободного и открытого ПО годами публиковали библиотеки, инструменты, базы данных, браузеры, серверные компоненты и инфраструктурный код, который можно изучать, менять и распространять. Теперь крупные ИИ-компании используют такие материалы при обучении моделей, но не раскрывают, какие данные попали в обучение, как устроена модель и какие правила определяют её работу.
Исследователи предложили применить к ИИ логику "копилефта" (это такая игра слов - противоположность термину "copyright"). В мире свободного ПО копилефт работает как особый вариант авторского права: если кто-то создаёт производную работу на основе открытого кода, результат тоже должен остаться свободным и открытым. Такой подход лежит в основе лицензий, которые не дают взять общую разработку, закрыть её внутри проприетарного продукта и лишить сообщество доступа к улучшениям.
Авторы работы предлагают Contextual Copyleft AI License, или CCAI, контекстную копилефт-лицензию для ИИ. Идея здесь строится вокруг одного вопроса: можно ли считать генеративную модель производной работой, если разработчик обучил её на открытом коде. Если да, то на модель должны переходить обязанности из лицензии исходных материалов.
По замыслу авторов, CCAI заставила бы разработчиков ИИ раскрывать архитектуру модели и обучающие данные, если при обучении использовался открытый код под такой лицензией. Тогда компания не смогла бы взять материалы сообщества, обучить на них закрытую систему и оставить разработчиков без понимания, как их работа повлияла на итоговый продукт. Для FOSS-сообщества это способ вернуть контроль над тем, как код используется в ИИ-индустрии.
Свободное и открытое ПО давно перестало быть нишей для энтузиастов. На нём держатся операционные системы, веб-браузеры, базы данных, научные инструменты, средства разработки, облачные платформы, мобильные устройства и значительная часть интернет-инфраструктуры. ИИ-разработчики тоже зависят от этого слоя: открытые библиотеки, фреймворки и репозитории помогают собирать модели, обучать их, тестировать код и разворачивать сервисы.
Проблема возникает там, где открытость обрывается. Компания может использовать открытые материалы, но затем назвать модель открытой только потому, что публикует веса, демонстрационный доступ или часть документации. При этом обучающие данные, точная архитектура, фильтры, настройки и процедуры дообучения остаются закрытыми. Снаружи продукт выглядит дружелюбным к open source, но проверить его происхождение и ограничения почти невозможно.
Авторы называют это open washing, то есть псевдооткрытостью. В таких случаях компания получает репутационные плюсы от связи с открытым сообществом, но не даёт пользователям и разработчикам тех прав, которые обычно связаны со свободным ПО: изучать систему, воспроизводить результат, менять компоненты и распространять улучшения. CCAI должна снизить этот разрыв между маркетинговым словом open и реальной проверяемостью модели.
Юридическая часть исследования строится вокруг доктрины fair use - добросовестного использования в американском праве. Если обучение ИИ на защищённых авторским правом материалах признают fair use, лицензиям будет сложнее навязать дополнительные обязанности разработчикам моделей. Если суды не признают обучение таким свободным использованием, копилефт-подход получает больше оснований: владелец кода сможет заранее указать условия, на которых его материалы разрешено включать в обучающие наборы.
Исследователи считают CCAI юридически возможной при нынешнем авторском праве, но только при этой оговорке. Лицензия не решает спор о fair use сама по себе. Она скорее предлагает механизм на случай, если право подтвердит: использование открытого кода для обучения может создавать обязанности перед авторами исходных материалов.
Отдельный аргумент касается безопасности . Генеративный ИИ отличается от обычного ПО тем, что может напрямую создавать текст, код, изображения и инструкции. Открытая модель способна помогать исследователям, ускорять проверку программ и поддерживать разработку, но та же система может генерировать убедительные фишинговые письма , вредный контент или материалы для мошенничества. Поэтому полная открытость в ИИ вызывает больше вопросов, чем публикация обычной библиотеки.
Авторы не предлагают игнорировать эти риски. В исследовании упоминаются регуляторные меры вроде правил Евросоюза, которые запрещают ИИ-системам использовать скрытые, манипулятивные или обманные техники, влияющие на поведение и решения человека. По логике авторов, лицензия CCAI должна работать наравне с такими нормами: право ограничивает опасные способы применения, а копилефт-лицензия отвечает за прозрачность происхождения и устройства модели.
Конечно, у предложенной схемы есть несколько практических последствий. Разработчики открытого ПО получают больше рычагов, когда их код попадает в обучающие наборы. Появляется стимул создавать действительно открытые генеративные модели, потому что закрытые компании не смогут без условий использовать код под CCAI. Сообщество получает доступ к обучающим данным и техническим деталям, а не только к готовому интерфейсу или рекламному описанию.
Подход может изменить отношения между ИИ-компаниями и FOSS-разработчиками. Сейчас открытый код часто превращается в сырьё: его берут для обучения, но результат не возвращается в виде понятной, проверяемой и воспроизводимой системы. Контекстный копилефт пытается перенести старое правило свободного ПО в новую область: если модель обучается на общем ресурсе, то и сама модель должна оставаться достаточно открытой для сообщества.
Авторы работы - Грант Шэнклин, Клаудио Новелли, Эмми Хайн, Лучано Флориди и Тайлер Шрёдер - не утверждают, что CCAI автоматически решит конфликт вокруг генеративного ИИ. Но их предложение даёт FOSS-сообществу юридический язык для спора с компаниями, которые пользуются открытым кодом, а затем закрывают самые важные части модели. Дальше вопрос будет решаться уже не только в университетских статьях, но и в лицензиях, судах, регуляторных документах и практических правилах публикации ИИ-систем.
Генеративный ИИ вырос на чужом открытом коде , но сам редко отвечает той же открытостью. Разработчики свободного и открытого ПО годами публиковали библиотеки, инструменты, базы данных, браузеры, серверные компоненты и инфраструктурный код, который можно изучать, менять и распространять. Теперь крупные ИИ-компании используют такие материалы при обучении моделей, но не раскрывают, какие данные попали в обучение, как устроена модель и какие правила определяют её работу.
Исследователи предложили применить к ИИ логику "копилефта" (это такая игра слов - противоположность термину "copyright"). В мире свободного ПО копилефт работает как особый вариант авторского права: если кто-то создаёт производную работу на основе открытого кода, результат тоже должен остаться свободным и открытым. Такой подход лежит в основе лицензий, которые не дают взять общую разработку, закрыть её внутри проприетарного продукта и лишить сообщество доступа к улучшениям.
Авторы работы предлагают Contextual Copyleft AI License, или CCAI, контекстную копилефт-лицензию для ИИ. Идея здесь строится вокруг одного вопроса: можно ли считать генеративную модель производной работой, если разработчик обучил её на открытом коде. Если да, то на модель должны переходить обязанности из лицензии исходных материалов.
По замыслу авторов, CCAI заставила бы разработчиков ИИ раскрывать архитектуру модели и обучающие данные, если при обучении использовался открытый код под такой лицензией. Тогда компания не смогла бы взять материалы сообщества, обучить на них закрытую систему и оставить разработчиков без понимания, как их работа повлияла на итоговый продукт. Для FOSS-сообщества это способ вернуть контроль над тем, как код используется в ИИ-индустрии.
Свободное и открытое ПО давно перестало быть нишей для энтузиастов. На нём держатся операционные системы, веб-браузеры, базы данных, научные инструменты, средства разработки, облачные платформы, мобильные устройства и значительная часть интернет-инфраструктуры. ИИ-разработчики тоже зависят от этого слоя: открытые библиотеки, фреймворки и репозитории помогают собирать модели, обучать их, тестировать код и разворачивать сервисы.
Проблема возникает там, где открытость обрывается. Компания может использовать открытые материалы, но затем назвать модель открытой только потому, что публикует веса, демонстрационный доступ или часть документации. При этом обучающие данные, точная архитектура, фильтры, настройки и процедуры дообучения остаются закрытыми. Снаружи продукт выглядит дружелюбным к open source, но проверить его происхождение и ограничения почти невозможно.
Авторы называют это open washing, то есть псевдооткрытостью. В таких случаях компания получает репутационные плюсы от связи с открытым сообществом, но не даёт пользователям и разработчикам тех прав, которые обычно связаны со свободным ПО: изучать систему, воспроизводить результат, менять компоненты и распространять улучшения. CCAI должна снизить этот разрыв между маркетинговым словом open и реальной проверяемостью модели.
Юридическая часть исследования строится вокруг доктрины fair use - добросовестного использования в американском праве. Если обучение ИИ на защищённых авторским правом материалах признают fair use, лицензиям будет сложнее навязать дополнительные обязанности разработчикам моделей. Если суды не признают обучение таким свободным использованием, копилефт-подход получает больше оснований: владелец кода сможет заранее указать условия, на которых его материалы разрешено включать в обучающие наборы.
Исследователи считают CCAI юридически возможной при нынешнем авторском праве, но только при этой оговорке. Лицензия не решает спор о fair use сама по себе. Она скорее предлагает механизм на случай, если право подтвердит: использование открытого кода для обучения может создавать обязанности перед авторами исходных материалов.
Отдельный аргумент касается безопасности . Генеративный ИИ отличается от обычного ПО тем, что может напрямую создавать текст, код, изображения и инструкции. Открытая модель способна помогать исследователям, ускорять проверку программ и поддерживать разработку, но та же система может генерировать убедительные фишинговые письма , вредный контент или материалы для мошенничества. Поэтому полная открытость в ИИ вызывает больше вопросов, чем публикация обычной библиотеки.
Авторы не предлагают игнорировать эти риски. В исследовании упоминаются регуляторные меры вроде правил Евросоюза, которые запрещают ИИ-системам использовать скрытые, манипулятивные или обманные техники, влияющие на поведение и решения человека. По логике авторов, лицензия CCAI должна работать наравне с такими нормами: право ограничивает опасные способы применения, а копилефт-лицензия отвечает за прозрачность происхождения и устройства модели.
Конечно, у предложенной схемы есть несколько практических последствий. Разработчики открытого ПО получают больше рычагов, когда их код попадает в обучающие наборы. Появляется стимул создавать действительно открытые генеративные модели, потому что закрытые компании не смогут без условий использовать код под CCAI. Сообщество получает доступ к обучающим данным и техническим деталям, а не только к готовому интерфейсу или рекламному описанию.
Подход может изменить отношения между ИИ-компаниями и FOSS-разработчиками. Сейчас открытый код часто превращается в сырьё: его берут для обучения, но результат не возвращается в виде понятной, проверяемой и воспроизводимой системы. Контекстный копилефт пытается перенести старое правило свободного ПО в новую область: если модель обучается на общем ресурсе, то и сама модель должна оставаться достаточно открытой для сообщества.
Авторы работы - Грант Шэнклин, Клаудио Новелли, Эмми Хайн, Лучано Флориди и Тайлер Шрёдер - не утверждают, что CCAI автоматически решит конфликт вокруг генеративного ИИ. Но их предложение даёт FOSS-сообществу юридический язык для спора с компаниями, которые пользуются открытым кодом, а затем закрывают самые важные части модели. Дальше вопрос будет решаться уже не только в университетских статьях, но и в лицензиях, судах, регуляторных документах и практических правилах публикации ИИ-систем.
- Источник новости
- www.securitylab.ru