Что касается камер, то это была целая история, такое редко бывает, потому что здесь заказчик сам на протяжении почти года собирал данные, которые правильно разметил и подготовил, нам оставалось только обучить нейросеть.
К сожалению, в большинстве случаев основная проблема это подготовка данных, тут Вы правы.
Честно говоря, это было уже почти 2 года назад, так что конкретные соотношения надо уже вспоминать. Естественно, что "плохих" изображений было мало относительно общего числа, порядка 1-2%. Заказчик сразу определил, что его больше волнует снижение ошибок 2 рода, так что речь, конечно, идет о точности распознавания "плохих" изображений.
Остаток false negative на самом деле в большинстве случаев просто демонстрирует зарождающееся загрязнение, которое человек ещё не видит.