Copilot пойман за копированием сторонних исходников

Пока юристы пишут внутренние регламенты компании касающиеся политики использования Open Source библиотек/компонентов/исходников, запрещая бездумное использование и копирование всего подряд (или хотя бы из разрешенного списка!), беда приходит с другой стороны – от вполне себе легального инструмента помощи программистам Copilot, который "копирует" чужие исходники.

Вчера @DocSparse опубликовал пост, в котором указывает, что инструмент в новом проекте сгенерировал идентичный фрагмент исходного кода из другого проекта (с установленной опцией «не использовать публичный код»), опубликованного под лицензией LGPL.

@github copilot, with "public code" blocked, emits large chunks of my copyrighted code, with no attribution, no LGPL license. For example, the simple prompt "sparse matrix transpose, cs_" produces my cs_transpose in CSparse. My code on left, github on right. Not OK.

Copilot пойман за копированием сторонних исходников

Такое поведение создает системную правовую проблему, так как может нарушать действующие политики компании (многие запрещают лицензии GPL, CDDL, MPL) и создать коллизии совместимости используемых лицензий в проекте (некоторые лицензии не совместимы в одном проекте), которые могут быть в дальнейшем выявлены слишком поздно (например, при due diligence перед новым раундом). Использовать же BlackDuck для проверки репозитория проекта на предмет фрагментов из Open Source проектов по каждому чиху не будешь (слишком дорого), что создает эффект бомбы замедленного действия.

Оценив проблему и не согласившись с таким подходом Github & Copilot, активисты из НКО Software Freedom Conservancy призвали разработчиков открытого ПО отказаться от его использования и бойкотировать GitHub. Движение, конечно, интересное, но сколько еще таких инструментов появится и кто будет отслеживать, что они генерируют?

Шансы, что кто-то обнаружит такой фрагмент, не очень большие. Да и мы, конечно, живем сейчас немного в иных правовых реалиях, но тем компаниям, которые имеют продажи на западе и предполагают получение инвестиций я бы рекомендовал дополнительно прописать запреты/ограничения на использование таких инструментов во внутренних политиках организации.

***

UPD Copilot может и утащить метаданные (а с ними и ваши данные об учетках?)

***

Основная моя специализация - интеллектуальная собственность в IT. Мы много занимаемся патентованием IT, due dilligence, судебной и досудебной экспертизой - itpatent.ru

22
2 комментария

насколько можно понять из ветки обсуждения под исходным постом, все не так просто. не исключено, что кто-то скопировал этот код себе в проект и сделал его полностью открытым в обход лицензии. в пользу этого говорит тот факт, что код слегка модифицирован.

1
Ответить

Да, будем ждать что в итоге официально ответят, а дальше все равно вопрос юридических рисков. Как писали на хабре - он еще умеет и метаданные "копировать" https://habr.com/ru/news/t/674574/#comment_24489088

Ответить