Господа авторы статьи, смутно могу оценить ваш успех, тк вы не указали долю аномалий в датасете в обучающей и тестовой выборке. Тк понятие точность есть метрика смещенная относительно маленьких классов, а аномалии и поломки оборудования это редкое событие в технологическом процессе. Поэтому получается, что авторы статьи ловят "хайп", пожалуйста, дайте другую метрику, например F1Macro score, полноту и точность вместе или, на худой конец, ROC AUC. Accuracy в 97.7% может означать, что в ваших данных было 97.7 нормальных данных и остальные 2. 3% аномалий, вот ваша модель могла считать все 100% данных хорошими, и при этом угадать 97.7% из них, а на ВСЕХ аномалиях ошибаться.
Что касается камер, то это была целая история, такое редко бывает, потому что здесь заказчик сам на протяжении почти года собирал данные, которые правильно разметил и подготовил, нам оставалось только обучить нейросеть. К сожалению, в большинстве случаев основная проблема это подготовка данных, тут Вы правы.
Господа авторы статьи, смутно могу оценить ваш успех, тк вы не указали долю аномалий в датасете в обучающей и тестовой выборке. Тк понятие точность есть метрика смещенная относительно маленьких классов, а аномалии и поломки оборудования это редкое событие в технологическом процессе. Поэтому получается, что авторы статьи ловят "хайп", пожалуйста, дайте другую метрику, например F1Macro score, полноту и точность вместе или, на худой конец, ROC AUC. Accuracy в 97.7% может означать, что в ваших данных было 97.7 нормальных данных и остальные 2. 3% аномалий, вот ваша модель могла считать все 100% данных хорошими, и при этом угадать 97.7% из них, а на ВСЕХ аномалиях ошибаться.
Что касается камер, то это была целая история, такое редко бывает, потому что здесь заказчик сам на протяжении почти года собирал данные, которые правильно разметил и подготовил, нам оставалось только обучить нейросеть.
К сожалению, в большинстве случаев основная проблема это подготовка данных, тут Вы правы.