Разработчик российских бизнес-приложений
1. Пользователю не нужно самостоятельно искать и извлекать необходимые данные после распознавания, так как IDP выдает сразу нужный результат, за счет этого и повышается скорость обработки. А если настроить взаимодействие IDP с системой компании, то информация будет попадать в нее автоматически. Изредка нужна лишь валидация готовых данных. Умной технологию называют из-за того, что она умеет анализировать распознанные данные и выдает только требуемую пользователю информацию.
2. Задачу по обучению моделей может взять на себя вендор, у которого и приобретена технология; партнеры вендора, имеющие право на проведение таких работ; различные интеграторы или фрилансер. Но с последним вариантом надо быть осторожнее: необходимо понимать, какие данные будут обрабатываться таким специалистом. Иногда спасает NDA.
3. Для начала необходимо определить, какие документы и сущности будут обрабатываться. Далее:
– Если в материалах нет коммерческой тайны или персональных данных, то можно обратиться к бесплатным сервисам и библиотекам. Их много, поэтому нужно отталкиваться от задачи и объемов, проводить тесты на собственных документах. Постепенно можно переводить на IDP все больше и больше типов материалов.
– Если в документах есть чувствительные данные и систему можно использовать только в закрытом контуре, то советуем поискать, какие вендоры предлагают такую технологию, и обратиться к ним за демолицензией или провести пилотный запуск. На этом этапе можно оценить, насколько затраты на эту технологию оправданы именно в вашей организации. Но сразу стоит обратить внимание на то, что, если объемы распознаваемых документов небольшие, продукты будут стоить дороже. К примеру, маленьким можно считать все, что составляет менее 10 000-15 000 страниц для распознавания.
Здравствуйте!
Есть, в качестве примера – проект с городским департаментом транспорта: оцифровка архивных документов и создание единой системы хранения с обеспечением семантического поиска.
Выполнена ретроконверсия имеющегося бумажного архивного фонда (форматов от А0 до А4), полученные электронные образы атрибутированы и загружены в единую систему хранения архивных документов.
Разработана единая система хранения архивных документов, в т.ч. вновь поступающих из оперативных систем, обеспечен интеллектуальный семантический поиск по всему массиву архивных данных
В итоге:
- Создана единая точка хранения документов с учетом прав доступа;
- Повышены скорость и гибкость поиска документов по запросам;
- Упрощены доступ к документам архивного фонда и получение копий для использования в работе;
- Сократились сроки приема-передачи документов на архивное хранение от подразделений.
Если у вас будут еще вопросы – пишите, постараемся на все ответить!
Нерегламентированную рутинную работу не получится отдать роботу, задачи с творческой составляющей робот тоже не сможет решить — здесь все же придется отдуваться самим.
Это классический вопрос, каким способом автоматизировать задачу: дорабатывать систему, интегрировать системы по API или настроить робота. В каждом конкретном случае клиенты принимают решение самостоятельно, исходя из ситуации. Привели ниже несколько примеров, когда роботы — правильный выбор:
— Отсутствует возможность интеграции по API (у имеющихся систем либо нет API, либо любые интеграции запрещены, либо длительные согласования). Роботы же работают без API и не меняют ИТ-ландшафт.
— Недостаточно ресурсов на интеграцию по API . Не всегда есть бюджет на развитие и доработку всех систем, участвующих в процессе. У разных владельцев систем отличаются приоритеты по задачам, цели и бюджет. Для интеграции между системами требуются согласования и доработки с каждой из сторон. Роботы же могут быть использованы на системах "как они есть”.
— Автоматизация выполняется своими силами. Доработки системы зачастую производятся подрядчиками, договор и перечь работ уже могут быть согласованы. А если есть внутренняя экспертиза по роботизации, можно своими силами автоматизировать задачи без привлечения подрядчиков, проведения конкурсов и ожидания итогов.
— Бизнесу нужен быстрый результат. С помощью роботов задачи можно решить быстро, а интеграцию необходимо согласовывать с владельцами систем и архитекторами, что затягивает сроки выполнения.
— Бизнесу важна окупаемость. Интеграция на порядок дороже применения роботов, так как требует привлечения кадров, цена которых высока: разработчиков, архитекторов, DevOps-инженеров. Робот же настраивается аналитиком, который и собирает требования, и настраивает сценарий, и тестирует его. Поддержка тоже максимально проста и недорога.
Бесспорно, если задачи можно реализовать доработкой системы или автоматизацией через API и на это есть средства, время и персонал, мы предложим клиенту идти этим путем, но зачастую (по разным причинам) роботы оказываются самым оптимальным и рабочим вариантом.
вообще - большие: у "РЖД" есть ведь стратегия цифровой трансформации + они выделили в холдинге две, если не ошибаемся, ИТ-компании под эти цели.
Понимаем вас! :) но к нам, увы, с такой задачей не приходили...
возможно, не совсем правильный сценарий был продуман или словарный запас оказался недостаточным в тех случаях, которые вас расстроили.
да-да, "словом года" ИИ стал по версии множества источников - от уважаемых словарей до профессиональных ассоциаций.
а стражи не заснут на посту?:) в кино всегда кто-то, кто остается на ночном дежурстве, начинает дремать. и начинается действо:)
поддерживаем вашу иронию о работе мечты! все люди устают в конечном итоге от повторяющейся работы. и если однотипные отчеты можно отдать роботу на аутсорс, как стирку футболок - машинке, почему бы и нет?
вот и аналитики McKinsey говорят, что определенные сферы деятельности получат буст. конечно, не все :)
как и со всем новым — в начале много шума :) но, надеемся, все перетечет в опыт — и выкристаллизуются четкие требования для работы. мы научимся точечно и эффективно их использовать.
Согласны! и ROBIN используется в госсекторе как раз (и работу никто не потерял — появилось больше времени на решение сложных вопросов). у нас 6 декабря будет вебинар, где разберем кейсы использования роботов в правительстве Санкт-Петербурга: https://my.mts-link.ru/ROBIN/govspb
Есть:) и мы расскажем в следующих постах как раз:) не переключайтесь (с)
отвечали бы в родительских чатах?:) делали закупки подарков?:)
Не расстроили. Скорее, вызвали недоумение: блог компании, в лиде упомянут бренд. Порассуждать о трендах рынках рады, это полезно. Но о преимуществах ваших решений лучше рассказывать в собственных блогах.
Коллеги, рады видеть!
Понимаем ваше желание рассказать о своих продуктах, ценим, что внимательно следите за другими игроками. Позволим добавить: пока вы собираетесь прикручивать, мы вот что сделали — интегрировали в решения "Цитрос" ML-технологию текстовой аналитики "Преферентум". Это позволяет, например, доставать из документов сущности и использовать их для аналитики по архивам. Или задавать поисковые вопросы на естественном языке.
Да, такие проекты есть. Мы встраиваем ИИ в решения "Цитрос"
для людей, которых угнетает документооборот - да!:)
опасливо смеемся)
а мы вас за то, что прочитали
у нас переговорные на одном этаже. в офисе сделали навигацию по названиям переговорных, на дверях тоже таблички. ну и возможно поможет оформление визуальное. а вот как не запутаться с XL и XXL, например? и есть несколько переговорных на одинаковое количество мест.
интересное наблюдение, спасибо! задумались - ведь верно, люди могут как-то по-своему их начать определять, как им удобнее или понятнее
и личные бренды! все ребята поняли сразу - и все придумано до нас:)
ой, класс! не знали про нее - почитаем, спасибо!
а вот здесь сложнее - к пиратским относить или к мифическим, как, например Арго? ) но вот получится ли восемь насобирать - вопрос :)
вот здесь и еще один вариант проклевывается - пиратские корабли :)
а "Дюны" что-то и не было — такого варианта никто не предложил. в таком кресле не грех и выезжать из переговорной - катить на кухню за кофе!
понимаем:) отзывается, да :) боюсь, никто не захочет уходить из "лени" - все останутся там на день.
Спасибо, мы рады, что вам понравился материал!
1. Весь процесс можно поделить на два этапа: интеграцию IDP с системой компании и настройку самой нейронной модели.
Интеграция может занять от 20 минут до нескольких часов.
Настройка же сильно зависит от того, какие материалы будут обрабатываться. Как правило, самое длительное в этом процессе — разметка документов для обучения нейронных сетей. Это требуется, если вендор не поставляет готовое решение или у вас совсем непопулярный тип материалов. Условно документы можно поделить на три типа сложности для разметки: простые, средние и сложные.
1) К первым относится извлечение до 3 атрибутов из документа с четкой и постоянной структурой с 2 текстовыми строками и таблицей с 2 столбцами. На разметку в этом случае может уйти 1-3 дня, в зависимости от размера датасета (рекомендуется от 100 примеров на каждый тип документа).
2) Ко вторым можно отнести извлечение от 3 до 6 атрибутов из документа с четкой и постоянной структурой, где содержится до 5 текстовых строк и таблица с 3-5 столбцами. Здесь на разметку может уйти 4-7 дней, в зависимости от размера датасета (рекомендуется от 100 примеров на каждый тип документа).
3) Ну а к третьему типу относится все, что не попало к первому и второму. Сюда можно отнести и первые два вида, если качество документа низкое и придется применять различные донастройки, а возможно, даже доработки решения для приемлемого качества распознавания. Разметка здесь занимает от 7 дней.
Обучение нейронной сети длится недолго — от 15 минут до нескольких дней, в случае если загружается очень большой датасет.
Учитывая эти нюансы, полная интеграция состоит из:
— Внедрения решения в контур.
— Разметки датасета, если вендор не предлагает готовый продукт.
— Обучение нейронной сети.
Посчитать сроки можно, исходя из примерных оценок выше.
2. Как правило, партнерами вендора просто так не становятся. Прежде чем предложить услуги интегратора, компания-разработчик изучает задачу клиента и предлагает только подходящего партнера. Если же таких кандидатов на сотрудничество несколько, то обратить внимание стоит на количество реализованных проектов и уровень экспертизы интегратора именно в этом направлении.
3. Переход на платные IDP-решения лучше осуществлять в нескольких случаях:
• Когда использование платных сервисов в перспективе (длительность определяете для себя сами) выходит дешевле, чем трата ценного времени сотрудника на оцифровку документов.
• Если вы понимаете, что сотрудник, занимающийся оцифровкой документов, принесет гораздо больше денег в другом направлении, даже если покупка IDP в моменте кажется дорогой.
• Бесплатное решение не покрывает требуемый уровень безопасности.
• Не хватает индивидуального подхода к решению задачи.
• Инструментов бесплатных сервисов недостаточно для решения задачи.
4. Внедрить всегда можно. Уровень организации на это не влияет. Все зависит от стратегии, бюджета и задач. И очень часто бюджет — ключевой фактор при принятии решения. Всегда нужно обращать внимание на целесообразность использования той или иной технологии.
Иногда маленькие вендоры ищут маленьких клиентов, чтобы расти вместе. И этот тандем будет выгоден обоим.