Автоматизация учета

Как выбрать разработчика систем распознавания? Чек-лист

У российских компаний и госструктур все чаще возникает вопрос, как сориентироваться при выборе имеющихся на рынке технологий распознавания документов? Мы, Smart Engines, подготовили универсальный чек-лист, который поможет вам минимизировать риски при выборе разработчика системы оптического распознавания текста (OCR) и найти оптимальное для вас решение.
Как выбрать разработчика систем распознавания? Чек-лист
Иллюстрация: Вера Ревина/Клерк.ру

Вот как он выглядит:

Профиль компании-разработчика:

  • У компании-разработчика официально трудоустроены более 20 человек?

  • Отзывы на продукты компании в основном положительные?

  • Среди клиентов разработчика — системно значимые банки, операторы связи или другие крупные компании?

  • Средняя зарплата сотрудников компании составляет более 200 тыс. рублей? 

  • Компания-разработчик патентует свои изобретения?

  • Сотрудники компании регулярно публикуют научные статьи и участвуют в конференциях?

Юридические риски:

  • У разработчика российское юридическое лицо?

  • Компания-разработчик принадлежит гражданам РФ? 

  • Программные продукты разработчика входят в реестр российского ПО?

Технологические аспекты решений:

  • В софте используется собственная OCR-система разработчика?

  • Решения компании-разработчика работают без GPU?

  • Распознавание документов осуществляется в контуре компании?

  • Изображения документов не передаются на обработку в облачные сервисы?

Возможности систем распознавания:

  • Программные продукты разработчика умеют обнаруживать и обрабатывать таблицы, печати и штрихкоды?

  • Решение обеспечивает распознавание документов других стран мира, помимо РФ?

  • Программные продукты разработчика обеспечивают распознавание неструктурированных документов? 

  • Решение умеет находить на фотографии или скане документ и распознавать его?

  • Решение распознает не только печатный текст, но и рукописный?

  • Поддерживается ли распознавание документов на мобильном телефоне, в том числе бюджетном?

Проверка решения «собственными силами»:

  • Разработчик согласен предоставить исходный код своих программных продуктов для аудита?

Профиль компании

Проверка компании-разработчика начинается с поиска ее профиля в Rusprofile или иных базах данных. Среди основных аспектов, на которые необходимо обратить внимание:

  • Научная деятельность компании.

Если сотрудники IT-фирмы постоянно публикуют статьи в научных журналах (особенно в таких, которые индексируются в WoS и Scopus — то есть являются «элитой» научных изданий), регулярно получают патенты на изобретения и участвуют в конференциях, включая международные, то это знак того, что решения компании основаны на собственных разработках, которые к тому же получают признание научного сообщества.

Если о статьях и патентах компании ничего не известно, то это может означать, что она пользуется чужими технологиями и не является разработчиком в полном смысле этого слова. 

  • Численность сотрудников и их средняя зарплата.

Для стартапа, разрабатывающего системы распознавания, необходимо иметь минимум один или два десятка работников — для непрерывной разработки решений, поставки софта и его дальнейшей технической поддержки. Как правило, у IT-специалистов, задействованных в создании систем распознавания, средняя зарплата в Москве равняется примерно 200 тысяч.

Если в стартапе работают всего 3–5 человек и, например, за 40 тысяч рублей, то это может свидетельствовать, в частности, об использовании чужих технологий — если у вас есть все готовое, то для переупаковки ПО в свой программный продукт понадобится не так много работников (и не обязательно с высокой квалификацией).

  • Отзывы и кейсы клиентов.

Обычно IT-стартапы активно информируют о своих клиентах: на сайтах под них выделен специальный раздел, и там указывается, кто интегрировал решения разработчика и какие именно; в пресс-релизах и новостях упоминаются случаи нового внедрения и тому подобное. То же касается и отзывов — они или размещены на сайте производителя систем распознавания, или без труда находятся на различных агрегаторах.

Если записи о клиентах отсутствуют или они имеются, но среди них нет системообразующих банков, ведущих операторов связи или крупных аэропортов, то это тоже является поводом выбрать другого разработчика.

Среди условных «красных флагов» можно выделить также, например, наличие арбитражных дел, связанных с ненадлежащим исполнением обязательств договора по оказанию услуг со стороны разработчика; резкое или продолжающееся снижение показателей прибыли и выручки; наличие сведений о непредставлении налоговой отчетности более года на сайте ФНС и так далее. Вся эта информация может свидетельствовать о финансовой неустойчивости компании, низком качестве ее программных продуктов и их невостребованности на рынке систем распознавания.

Юридические риски

После того, как вы просмотрели профиль компании, следует изучить юридические аспекты ее деятельности. Для этого уделите внимание тому:

  • Есть ли у компании российское юридическое лицо.

Важно, чтобы разработчик был полностью отечественной компанией. Иностранный владелец может в любой момент покинуть российский рынок, и тогда пользователи продукта могут столкнуться или с нестабильной работой систем, или остановкой многих бизнес-процессов.

Чтобы избежать это, рекомендуется зайти на сайт разработчика или сервисы проверки юридических лиц. Если структура компании скрыта (или в качестве формы собственности у нее указано, например, LLP — Limited Liability Partnership), это повод усомниться в долгосрочных перспективах ее работы на российском рынке.

  • Входят ли программные продукты разработчика в реестр российского ПО.

Ситуации 2022 года, когда многие зарубежные IT-стартапы ушли с российского рынка и перестали поддерживать свои корпоративные продукты на территории нашей страны, отчетливо показала, что в нынешних реалиях следует полагаться на отечественные, а не зарубежные решения. Это особенно актуально для объектов критической инфраструктуры, поскольку с 1 января 2025 года вводится запрет на использование там иностранного ПО.

В свою очередь для попадания в реестр необходимо соответствовать ряду строгих требований (большая часть компании-производителя должна быть в собственности россиян; ПО не должно принудительно обновляться и управляться из-за рубежа; софт и его компоненты не должны иметь ограничений на использование на территории России или некоторых регионов и так далее), и если программный продукт успешно прошел все необходимые проверки, то это значит, что ему доверяет  Минцифры.

Отсутствие подобной проверки чревато для компании-заказчика огромными штрафами. Так, в России действует закон «О персональных данных» от 27.07.2006 № 152-ФЗ. В нем, частности, регулируется трансграничная передача данных — если вы работаете с иностранными партнерами или пользуетесь зарубежным сервисом, обрабатывающим персональные данные, об этом необходимо сообщать Роскомнадзору.

В случае несоблюдения этого требования оператор может быть привлечен к административной ответственности: за трансграничную передачу данных без надлежащего правового основания — до 300 000 рублей (ч. 1 ст. 13.11 КоАП); за неуведомление Роскомнадзора о ТПД — до 5000 рублей (ст. 19.7 КоАП), за невыполнение предписания Роскомнадзора об устранении нарушений — до 20 000 рублей (ч. 1 ст. 19.5 КоАП).

Так что если вы пользуетесь иностранным ПО, то будете вынуждены регулярно отчитываться перед Роскомнадзором, который к тому же имеет право запретить передачу данных. Все это тормозит работу компании и в ряде случаев может привести к ее частичной или полной парализации.

Smart Engines — автоматическое распознавание документов

Персональный ИИ для автоматического распознавания

Технологические аспекты

После того, как все юридические тонкости были улажены, разработчика необходимо расспросить о всех технических нюансах его решений. Для этого прежде всего узнайте:

  • OCR-система, используемая в решении, является собственной разработкой компании?

Оптическое распознавание символов (optical character recognition — OCR) — технология, отвечающая за создание цифровой копии напечатанных или написанных от руки символов.

Она является ключевым элементом систем распознавания, а потому важно, чтобы поставщик ПО имел свою собственную OCR, а не пользовался чужой.

Вендор может в один момент ограничить работоспособность своих программных продуктов, и тогда под ударом окажутся и компания-разработчик, использовавшая стороннюю систему оптического распознавания, и ее клиенты.

  • С какими операционными системами и архитектурами совместимо OCR-решение?

Например, с процессорами x86 и ARM. Если это не уточнить, то есть риск того, что вы приобрете решение, а оно не будет запускаться на вашем компьютере или планшете. Соответственно, вы зря потратите деньги.

То же касается мощных графических процессоров (GPU) — разработчики обещают высокое качество распознавания с не менее впечатляющей скоростью, но для этого требуется мощное оборудование, на которое у организации может не быть средств.

Если поставщик решения заявляет, что программа будет обеспечивать высокое качество и скорость без GPU, то это можно считать хорошим знаком — технология OCR аппаратно-независимая, а потому ее можно спокойно запускать на всех своих устройствах.

Отдельно необходимо остановиться на том, где происходит обработка информации. Решения для распознавания бывают on-premise и on-cloud. В первом случае обработка документов осуществляется в локальной оперативной памяти телефонов, планшетов и иных устройств; во втором — изображения паспортов, квитанций и тому подобного пересылаются на обработку в облачные сервисы.

On-cloud является гораздо менее надежным, чем on-premise, так как высок риск того, что при пересылке данных туда и обратно часть из них могут быть случайно (или намеренно) слиты в сеть. 

Напомним, что в последнее время Государственная Дума стремится усилить наказание для компаний, допустивших утечки персональных данных граждан, и в январе 2024 года в первом чтении был принят закон об оборотных штрафах. Согласно ему, взыскиваемые суммы для юридических лиц могут составлять от 0,1% до 3% выручки за календарный год или за часть текущего года — не менее 15 млн рублей и не более 500 млн рублей.

Более того, в России планируют ввести специальные требования к квалификации и деловой репутации заместителей глав финансовых организаций, ответственных за информационную безопасность. В частности, при участии ЦБ был разработан законопроект, включающий положение о запрете для ответственных за информационную безопасность замглав организаций занимать подобную должность в течение 10 лет, если в период их работы в другом учреждении допускались нарушения требований к защите информации.

Так что в результате утечек персональных данных клиентов (а фактически — выбора on-cloud решений) компании могут столкнуться и с миллионными штрафами, и с репутационными потерями, и даже риском для некоторых сотрудников лишиться возможности занимать свою должность в течение ряда лет.

Помимо этого, сервисы к работе привлекают краудсорсинговые платформы, операторы которых проверяют качество распознавания и в ряде случаев набирают тексты со сканов или фотографий документов. При этом оператором может стать буквально любой желающий — достаточно зарегистрироваться в сервисе.

Другими словами, к данным паспортов или доверенностей клиентов получают доступ совершенно посторонние люди, которые могут распорядиться подобной информацией по своему усмотрению — поскольку в краудсорсинге задействованы тысячи людей, компания-разработчик или облачный провайдер не могут чисто физически контролировать действия каждого из них. При этом некоторые сервисы не скрывают, что применяют полученные данные в обучении своих нейросетей. Соответственно, любая организация, которая воспользовалась on-cloud решениями, рискует впоследствии столкнуться с возмущениями и исками от клиентов, ставших жертвами пиратского метода обучения ИИ.

Напоследок упомянем, что недавний сбой в работе Microsoft, затронувший авикомпании, банки, службы спасения и даже рестораны быстрого питания по всему миру, наглядно показал всю ненадежность модели on-cloud. Если компания не хочет, чтобы из-за ошибки в обновлении облачной платформы была остановлена часть ее бизнес-процессов, ей лучше выбрать on-premise.

Возможности систем распознавания

Отобрав несколько разработчиков, проверив их юридический статус, удостоверившись, что в ПО используются собственные технологии компании, и расспросив о технической стороне решений, далее клиенту при выборе системы распознавания стоит ориентироваться на то, в каких бизнес-процессах и для чего будет использоваться софт.

Например, для нотариальных палат, получающих каждый день тысячи сообщений с документами, будет крайне важно, чтобы решение работало с высокой скоростью (например, распознавало 15 документов в секунду на сервере), обладало комплектом документов, чье распознавание уже настроено (и дизайнер для настройки форм для распознавания, что может пригодиться в случае неструктурированных или редких типов документов) и умело обнаруживать и корректно обрабатывать таблицы, печати и штрихкоды. 

Для объектов транспортной инфраструктуры желательно, чтобы программный продукт поддерживал распознавание паспортов и других удостоверяющих личность документов не только РФ, но и всех стран мира для ускорения обслуживание клиентов из числа иностранцев. 

Для банков необходимо, чтобы решение умело находить на сканах документ и распознавать его, поскольку часто именно в таком виде изображения паспорта пересылаются в финансовую организацию.

Помимо этого, для оформления кредитов или проведения иных операций требуются данные прописки, однако в некоторых удостоверяющих личность документах она рукописная, а потому программный продукт должен распознавать не только машинописный текст.

Также для банковской сферы актуально, чтобы система распознавания могла быть запущена на мобильных устройствах, в том числе бюджетных. Это может пригодиться как при выездном обслуживании, так и в онлайн-банкинге: у клиентов есть возможность вместо того, чтобы посещать отделение, быстро отправлять денежные переводы, обновлять паспортные данные или оформлять кредиты в мобильном приложении или интернет-браузере без необходимости вручную вбивать все необходимые данные. 

Проверка решения «своими силами»

Напоследок упомянем, что перед приобретением системы распознавания у разработчика стоит уточнить, можно ли получить исходный код программного решения.

Так удастся провести аудит программного продукта, проверить работу алгоритмов, оценить их уязвимости и решить, подходит данное решение под нужды компании или нет. 

Если на подобную просьбу следует отказ, то к этому стоит относиться с подозрением: не означает ли нежелание делиться кодом то, что решение в действительности не обладает всем тем функционалом, обещанном разработчиком? В таком случае лучше обратиться к другому вендору, который уверен в своих программных продуктах и  готов дать их протестировать.

Вместо заключения

При желании можно пропустить все эти этапы и выбрать первую попавшуюся систему распознавания. Однако при таком сценарии компания-клиент в «лучшем» случае рискует тем, что решение будет не в полной мере или вовсе не справляться с возложенным на нее объемом работ в конкретной организации — соответственно, деньги будут потрачены зря.

А в «худшем» — утечки персональных данных и многомиллионные штрафы, недовольство (и иски) от пользователей, чьи документы использовались для тренировки ИИ, зависимость от облачных вендоров или иностранного ПО и многое другое.

Так что тщательная и длительная проверка разработчика систем распознавания позволит избежать всех этих рисков и проблем в будущем. 

Smart Engines – автоматическое распознавание документов

Персональный ИИ для автоматического распознавания

Реклама: ООО «СМАРТ ЭНДЖИНС СЕРВИС», ИНН 7728328449, erid: LjN8KEquD

Комментарии

3
  • А как насчёт производительности на слабых машинах? Сможет ли система распознавания нормально работать на старом оборудовании или это всё-таки больше для мощных серверов?

    • SmartEngines

      Добрый день!

      Большое спасибо за интерес к нашим продуктам! Да, наши системы распознавания не требовательны к вычислительным ресурсам, будут прекрасно работать на старом оборудовании в том числе.