Автоматизация учета

Как выбрать разработчика систем распознавания? Чек-лист

У российских компаний и госструктур все чаще возникает вопрос, как сориентироваться при выборе имеющихся на рынке технологий распознавания документов? Мы, Smart Engines, подготовили универсальный чек-лист, который поможет вам минимизировать риски при выборе разработчика системы оптического распознавания текста (OCR) и найти оптимальное для вас решение.
Как выбрать разработчика систем распознавания? Чек-лист
Иллюстрация: Вера Ревина/Клерк.ру

Вот как он выглядит:

Профиль компании-разработчика:

  • У компании-разработчика официально трудоустроены более 20 человек?

  • Отзывы на продукты компании в основном положительные?

  • Среди клиентов разработчика — системно значимые банки, операторы связи или другие крупные компании?

  • Средняя зарплата сотрудников компании составляет более 200 тыс. рублей? 

  • Компания-разработчик патентует свои изобретения?

  • Сотрудники компании регулярно публикуют научные статьи и участвуют в конференциях?

Юридические риски:

  • У разработчика российское юридическое лицо?

  • Компания-разработчик принадлежит гражданам РФ? 

  • Программные продукты разработчика входят в реестр российского ПО?

Технологические аспекты решений:

  • В софте используется собственная OCR-система разработчика?

  • Решения компании-разработчика работают без GPU?

  • Распознавание документов осуществляется в контуре компании?

  • Изображения документов не передаются на обработку в облачные сервисы?

Возможности систем распознавания:

  • Программные продукты разработчика умеют обнаруживать и обрабатывать таблицы, печати и штрихкоды?

  • Решение обеспечивает распознавание документов других стран мира, помимо РФ?

  • Программные продукты разработчика обеспечивают распознавание неструктурированных документов? 

  • Решение умеет находить на фотографии или скане документ и распознавать его?

  • Решение распознает не только печатный текст, но и рукописный?

  • Поддерживается ли распознавание документов на мобильном телефоне, в том числе бюджетном?

Проверка решения «собственными силами»:

  • Разработчик согласен предоставить исходный код своих программных продуктов для аудита?

Профиль компании

Проверка компании-разработчика начинается с поиска ее профиля в Rusprofile или иных базах данных. Среди основных аспектов, на которые необходимо обратить внимание:

  • Научная деятельность компании.

Если сотрудники IT-фирмы постоянно публикуют статьи в научных журналах (особенно в таких, которые индексируются в WoS и Scopus — то есть являются «элитой» научных изданий), регулярно получают патенты на изобретения и участвуют в конференциях, включая международные, то это знак того, что решения компании основаны на собственных разработках, которые к тому же получают признание научного сообщества.

Если о статьях и патентах компании ничего не известно, то это может означать, что она пользуется чужими технологиями и не является разработчиком в полном смысле этого слова. 

  • Численность сотрудников и их средняя зарплата.

Для стартапа, разрабатывающего системы распознавания, необходимо иметь минимум один или два десятка работников — для непрерывной разработки решений, поставки софта и его дальнейшей технической поддержки. Как правило, у IT-специалистов, задействованных в создании систем распознавания, средняя зарплата в Москве равняется примерно 200 тысяч.

Если в стартапе работают всего 3–5 человек и, например, за 40 тысяч рублей, то это может свидетельствовать, в частности, об использовании чужих технологий — если у вас есть все готовое, то для переупаковки ПО в свой программный продукт понадобится не так много работников (и не обязательно с высокой квалификацией).

  • Отзывы и кейсы клиентов.

Обычно IT-стартапы активно информируют о своих клиентах: на сайтах под них выделен специальный раздел, и там указывается, кто интегрировал решения разработчика и какие именно; в пресс-релизах и новостях упоминаются случаи нового внедрения и тому подобное. То же касается и отзывов — они или размещены на сайте производителя систем распознавания, или без труда находятся на различных агрегаторах.

Если записи о клиентах отсутствуют или они имеются, но среди них нет системообразующих банков, ведущих операторов связи или крупных аэропортов, то это тоже является поводом выбрать другого разработчика.

Среди условных «красных флагов» можно выделить также, например, наличие арбитражных дел, связанных с ненадлежащим исполнением обязательств договора по оказанию услуг со стороны разработчика; резкое или продолжающееся снижение показателей прибыли и выручки; наличие сведений о непредставлении налоговой отчетности более года на сайте ФНС и так далее. Вся эта информация может свидетельствовать о финансовой неустойчивости компании, низком качестве ее программных продуктов и их невостребованности на рынке систем распознавания.

Юридические риски

После того, как вы просмотрели профиль компании, следует изучить юридические аспекты ее деятельности. Для этого уделите внимание тому:

  • Есть ли у компании российское юридическое лицо.

Важно, чтобы разработчик был полностью отечественной компанией. Иностранный владелец может в любой момент покинуть российский рынок, и тогда пользователи продукта могут столкнуться или с нестабильной работой систем, или остановкой многих бизнес-процессов.

Чтобы избежать это, рекомендуется зайти на сайт разработчика или сервисы проверки юридических лиц. Если структура компании скрыта (или в качестве формы собственности у нее указано, например, LLP — Limited Liability Partnership), это повод усомниться в долгосрочных перспективах ее работы на российском рынке.

  • Входят ли программные продукты разработчика в реестр российского ПО.

Ситуации 2022 года, когда многие зарубежные IT-стартапы ушли с российского рынка и перестали поддерживать свои корпоративные продукты на территории нашей страны, отчетливо показала, что в нынешних реалиях следует полагаться на отечественные, а не зарубежные решения. Это особенно актуально для объектов критической инфраструктуры, поскольку с 1 января 2025 года вводится запрет на использование там иностранного ПО.

В свою очередь для попадания в реестр необходимо соответствовать ряду строгих требований (большая часть компании-производителя должна быть в собственности россиян; ПО не должно принудительно обновляться и управляться из-за рубежа; софт и его компоненты не должны иметь ограничений на использование на территории России или некоторых регионов и так далее), и если программный продукт успешно прошел все необходимые проверки, то это значит, что ему доверяет  Минцифры.

Отсутствие подобной проверки чревато для компании-заказчика огромными штрафами. Так, в России действует закон «О персональных данных» от 27.07.2006 № 152-ФЗ. В нем, частности, регулируется трансграничная передача данных — если вы работаете с иностранными партнерами или пользуетесь зарубежным сервисом, обрабатывающим персональные данные, об этом необходимо сообщать Роскомнадзору.

В случае несоблюдения этого требования оператор может быть привлечен к административной ответственности: за трансграничную передачу данных без надлежащего правового основания — до 300 000 рублей (ч. 1 ст. 13.11 КоАП); за неуведомление Роскомнадзора о ТПД — до 5000 рублей (ст. 19.7 КоАП), за невыполнение предписания Роскомнадзора об устранении нарушений — до 20 000 рублей (ч. 1 ст. 19.5 КоАП).

Так что если вы пользуетесь иностранным ПО, то будете вынуждены регулярно отчитываться перед Роскомнадзором, который к тому же имеет право запретить передачу данных. Все это тормозит работу компании и в ряде случаев может привести к ее частичной или полной парализации.

Smart Engines — автоматическое распознавание документов

Персональный ИИ для автоматического распознавания

Технологические аспекты

После того, как все юридические тонкости были улажены, разработчика необходимо расспросить о всех технических нюансах его решений. Для этого прежде всего узнайте:

  • OCR-система, используемая в решении, является собственной разработкой компании?

Оптическое распознавание символов (optical character recognition — OCR) — технология, отвечающая за создание цифровой копии напечатанных или написанных от руки символов.

Она является ключевым элементом систем распознавания, а потому важно, чтобы поставщик ПО имел свою собственную OCR, а не пользовался чужой.

Вендор может в один момент ограничить работоспособность своих программных продуктов, и тогда под ударом окажутся и компания-разработчик, использовавшая стороннюю систему оптического распознавания, и ее клиенты.

  • С какими операционными системами и архитектурами совместимо OCR-решение?

Например, с процессорами x86 и ARM. Если это не уточнить, то есть риск того, что вы приобрете решение, а оно не будет запускаться на вашем компьютере или планшете. Соответственно, вы зря потратите деньги.

То же касается мощных графических процессоров (GPU) — разработчики обещают высокое качество распознавания с не менее впечатляющей скоростью, но для этого требуется мощное оборудование, на которое у организации может не быть средств.

Если поставщик решения заявляет, что программа будет обеспечивать высокое качество и скорость без GPU, то это можно считать хорошим знаком — технология OCR аппаратно-независимая, а потому ее можно спокойно запускать на всех своих устройствах.

Отдельно необходимо остановиться на том, где происходит обработка информации. Решения для распознавания бывают on-premise и on-cloud. В первом случае обработка документов осуществляется в локальной оперативной памяти телефонов, планшетов и иных устройств; во втором — изображения паспортов, квитанций и тому подобного пересылаются на обработку в облачные сервисы.

On-cloud является гораздо менее надежным, чем on-premise, так как высок риск того, что при пересылке данных туда и обратно часть из них могут быть случайно (или намеренно) слиты в сеть. 

Напомним, что в последнее время Государственная Дума стремится усилить наказание для компаний, допустивших утечки персональных данных граждан, и в январе 2024 года в первом чтении был принят закон об оборотных штрафах. Согласно ему, взыскиваемые суммы для юридических лиц могут составлять от 0,1% до 3% выручки за календарный год или за часть текущего года — не менее 15 млн рублей и не более 500 млн рублей.

Более того, в России планируют ввести специальные требования к квалификации и деловой репутации заместителей глав финансовых организаций, ответственных за информационную безопасность. В частности, при участии ЦБ был разработан законопроект, включающий положение о запрете для ответственных за информационную безопасность замглав организаций занимать подобную должность в течение 10 лет, если в период их работы в другом учреждении допускались нарушения требований к защите информации.

Так что в результате утечек персональных данных клиентов (а фактически — выбора on-cloud решений) компании могут столкнуться и с миллионными штрафами, и с репутационными потерями, и даже риском для некоторых сотрудников лишиться возможности занимать свою должность в течение ряда лет.

Помимо этого, сервисы к работе привлекают краудсорсинговые платформы, операторы которых проверяют качество распознавания и в ряде случаев набирают тексты со сканов или фотографий документов. При этом оператором может стать буквально любой желающий — достаточно зарегистрироваться в сервисе.

Другими словами, к данным паспортов или доверенностей клиентов получают доступ совершенно посторонние люди, которые могут распорядиться подобной информацией по своему усмотрению — поскольку в краудсорсинге задействованы тысячи людей, компания-разработчик или облачный провайдер не могут чисто физически контролировать действия каждого из них. При этом некоторые сервисы не скрывают, что применяют полученные данные в обучении своих нейросетей. Соответственно, любая организация, которая воспользовалась on-cloud решениями, рискует впоследствии столкнуться с возмущениями и исками от клиентов, ставших жертвами пиратского метода обучения ИИ.

Напоследок упомянем, что недавний сбой в работе Microsoft, затронувший авикомпании, банки, службы спасения и даже рестораны быстрого питания по всему миру, наглядно показал всю ненадежность модели on-cloud. Если компания не хочет, чтобы из-за ошибки в обновлении облачной платформы была остановлена часть ее бизнес-процессов, ей лучше выбрать on-premise.

Возможности систем распознавания

Отобрав несколько разработчиков, проверив их юридический статус, удостоверившись, что в ПО используются собственные технологии компании, и расспросив о технической стороне решений, далее клиенту при выборе системы распознавания стоит ориентироваться на то, в каких бизнес-процессах и для чего будет использоваться софт.

Например, для нотариальных палат, получающих каждый день тысячи сообщений с документами, будет крайне важно, чтобы решение работало с высокой скоростью (например, распознавало 15 документов в секунду на сервере), обладало комплектом документов, чье распознавание уже настроено (и дизайнер для настройки форм для распознавания, что может пригодиться в случае неструктурированных или редких типов документов) и умело обнаруживать и корректно обрабатывать таблицы, печати и штрихкоды. 

Для объектов транспортной инфраструктуры желательно, чтобы программный продукт поддерживал распознавание паспортов и других удостоверяющих личность документов не только РФ, но и всех стран мира для ускорения обслуживание клиентов из числа иностранцев. 

Для банков необходимо, чтобы решение умело находить на сканах документ и распознавать его, поскольку часто именно в таком виде изображения паспорта пересылаются в финансовую организацию.

Помимо этого, для оформления кредитов или проведения иных операций требуются данные прописки, однако в некоторых удостоверяющих личность документах она рукописная, а потому программный продукт должен распознавать не только машинописный текст.

Также для банковской сферы актуально, чтобы система распознавания могла быть запущена на мобильных устройствах, в том числе бюджетных. Это может пригодиться как при выездном обслуживании, так и в онлайн-банкинге: у клиентов есть возможность вместо того, чтобы посещать отделение, быстро отправлять денежные переводы, обновлять паспортные данные или оформлять кредиты в мобильном приложении или интернет-браузере без необходимости вручную вбивать все необходимые данные. 

Проверка решения «своими силами»

Напоследок упомянем, что перед приобретением системы распознавания у разработчика стоит уточнить, можно ли получить исходный код программного решения.

Так удастся провести аудит программного продукта, проверить работу алгоритмов, оценить их уязвимости и решить, подходит данное решение под нужды компании или нет. 

Если на подобную просьбу следует отказ, то к этому стоит относиться с подозрением: не означает ли нежелание делиться кодом то, что решение в действительности не обладает всем тем функционалом, обещанном разработчиком? В таком случае лучше обратиться к другому вендору, который уверен в своих программных продуктах и  готов дать их протестировать.

Вместо заключения

При желании можно пропустить все эти этапы и выбрать первую попавшуюся систему распознавания. Однако при таком сценарии компания-клиент в «лучшем» случае рискует тем, что решение будет не в полной мере или вовсе не справляться с возложенным на нее объемом работ в конкретной организации — соответственно, деньги будут потрачены зря.

А в «худшем» — утечки персональных данных и многомиллионные штрафы, недовольство (и иски) от пользователей, чьи документы использовались для тренировки ИИ, зависимость от облачных вендоров или иностранного ПО и многое другое.

Так что тщательная и длительная проверка разработчика систем распознавания позволит избежать всех этих рисков и проблем в будущем. 

Smart Engines – автоматическое распознавание документов

Персональный ИИ для автоматического распознавания

Реклама: ООО «СМАРТ ЭНДЖИНС СЕРВИС», ИНН 7728328449, erid: LjN8KEquD

Информации об авторе

🔍 Узнайте то, чего нет в интернете!

💼 Главбух на УСН
Экспертные лайфхаки и методы, проверенные практикой.
💰 Цена: 4 500 ₽ 15 950 ₽
Подробнее

📊 ОСНО: налоговая отчетность
Тонкости отчетности от ведущих специалистов.
💰 Цена: 4 200 ₽ 15 990 ₽
Подробнее

🎓 Профессия бухгалтер с нуля
Секреты профессионалов для старта карьеры.
💰 Цена: 4 900 ₽ 19 900 ₽
Подробнее

🚀 Знания, которые вы не "нагуглите"! Начните обучение сейчас!

Каталог курсов

Комментарии

3
  • А как насчёт производительности на слабых машинах? Сможет ли система распознавания нормально работать на старом оборудовании или это всё-таки больше для мощных серверов?

    • SmartEngines

      Добрый день!

      Большое спасибо за интерес к нашим продуктам! Да, наши системы распознавания не требовательны к вычислительным ресурсам, будут прекрасно работать на старом оборудовании в том числе.


Похожие материалы

Сбер первым в России подтвердил безопасность своей биометрической системы во ФСТЭК

Полученный аттестат подтверждает безопасность хранения и обработки данных в биометрической системе банка, которая в том числе позволяет оплачивать покупки улыбкой.

Роспатент: в России стали уделять больше внимания внешнему виду продукции

За 12 месяцев 2024 года российские граждане и организации подали в Федеральную службу по интеллектуальной собственности (Роспатент) 6 479 заявок на патентование промышленных образцов. Это на 18% больше, чем в 2023 году и на 53% превышает показатель 2022 года.

Инвестиции

Мосбиржа начала торги первым биржевым фондом на платину и палладий

26 февраля 2025 на фондовом рынке Московской биржи стартовали торги биржевым паевым инвестиционным фондом (БПИФ) «Альфа-Капитал Платина – Палладий» под управлением УК «Альфа-Капитал». Это первый на бирже фонд инвестиций в платину и палладий, он получил торговый код AKPP.

Курсы повышения
квалификации

22
Официальное удостоверение с занесением в госреестр Рособрнадзора
Ипотека

Сбер запустил ипотеку на покупку дома и участка по договору долевого участия

На Домклик появилась возможность купить свой дом у застройщика по договору долевого участия (ДДУ) в ипотеку Сбербанка.

УСН

Как ИП на УСН уменьшить налог на страховые взносы в 2025 году

Индивидуальные предприниматели, работающие на УСН, могут уменьшить сумму налога за счет страховых взносов. Порядок учета этих вычетов зависит от выбранного объекта налогообложения и наличия наемных работников. Разберем, как правильно учитывать страховые взносы при расчете налога.

Как ИП на УСН уменьшить налог на страховые взносы в 2025 году

МВД объяснило, как отличить настоящего юриста от мошенника

Лжеюристы часто фигурируют в схемах телефонных мошенников, а схемы постоянно адаптируют и видоизменяют. Один из приемов – подключение к обману «юриста или адвоката по назначению», который обещает помочь гражданину в критической ситуации.

Анна

Покупка ОС у физического лица организацией

Добрый день!

ООО на ОСНО хочет купить гараж стоимостью 1 млн рублей у физического лица.

Гараж нужен для хранение и использования в рамках деятельности ООО, не для...

Читать полностью

Эксперт:

Надежда Камышева

Надежда Камышева
Эксперт

Добрый день.

Чек пробивать не нужно. Ничего тут не поменялось, в том числе и позиция чиновников.

Чеки пробивают в деятельности, связанной со скупкой...

Читать полностью

⚡️В поисках ответов: самое важное о VII Всероссийской бухгалтерской конференции «БухВесна-2025»

Нам начали приходить организационные вопросы от пользователей по VII Всероссийской бухгалтерской конференции «БухВесна-2025», которая пройдет 13 марта в Москве. Собрали все важное в одной статье: кто, что, как, куда, когда, во сколько, каким образом — все здесь! Забирайте в закладки, чтобы не потерять!

⚡️В поисках ответов: самое важное о VII Всероссийской бухгалтерской конференции «БухВесна-2025»
6

За неиспользованный отпуск можно получить компенсацию и без увольнения. Но есть ограничения

По заявлению сотрудника работодатель может заменить денежной компенсацией часть ежегодного отпуска, которая превышает 28 дней.

Инвестиции

Взлеты и падения недели

Торговая сессия выходного дня вносит определенные коррективы не только в размеренную инвестиционную «трудовую» пятидневку, но и в динамику бумаг.

Обзоры новостей

Рубль набрался сил и снова слабеет. Обратный туземун крипты. Недвижимость, акции, бонды, инфляция и другие новости. Воскресный инвестдайджест

Порадовались и хватит. Рубль перешёл от укрепления к ослаблению. Надеюсь, все остались довольны этим перформансом, впрочем, он может ещё повториться, причём в самую любую сторону. Слабеют также и акции, и крипта.

Рубль набрался сил и снова слабеет. Обратный туземун крипты. Недвижимость, акции, бонды, инфляция и другие новости. Воскресный инвестдайджест

Налоговики проиграли: как «номинальный» контрагент стал законным основанием для вычетов

Суд Уральского округа поддержал налогоплательщика в споре о необоснованной налоговой выгоде: почему формальность контрагента не всегда лишает права на вычеты.

3
Инвестиции

27% на коксе. Свежие облигации: ПАО Кокс на размещении

Тут могла бы быть очередная несмешная шутка про кокс. Смотрим новый флоатер от коксохимического завода Кокс. И заодно смотрим новый фикс от него же. Да, всё верно, коксовый дубль из двух выпусков. Фикс для всех, а флоатер только для квалов.

27% на коксе. Свежие облигации: ПАО Кокс на размещении

Как оформить налоговый вычет по ПДС: Сбер поделился инструкцией для возврата денег

Программа долгосрочных сбережений (ПДС) позволяет не только формировать накопления на будущее, но и получать налоговый вычет со взносов. Это хороший способ снизить налоговую нагрузку и вернуть часть внесенных средств.

Кадры

80% компаний следят за работой сотрудников

Почти половина работодателей требует от сотрудников регулярных отчетов, а еще 43% ведут видеонаблюдение в офисе.

IT-компании

Какие изменения коснутся IT-компаний в 2025 году

Налоговая реформа не обошла вниманием IT-компании. Некоторые изменения уже вступили в силу, например, применение 5% ставки налога на прибыль. Другие изменения заработают совсем скоро — например, с 3 марта 2025 года отменяется мораторий на выездные проверки в IT-компании. Рассказываем, что ждет айтишников и как адаптироваться к новым реалиям.

Какие изменения коснутся IT-компаний в 2025 году
Ведение бизнеса

Чем бизнес в Саудовской Аравии привлекателен для российских предпринимателей

Все больше российских компаний открывают для себя рынок Саудовской Аравии. Основными сферами вложения средств являются агропромышленный комплекс, строительство и инфраструктура, энергетика. Отечественных предпринимателей привлекает устойчивая бизнес-среда, стабильная политическая обстановка и, что особенно важно, система налоговых льгот.

Новости ФНС

Уведомления об изменениях в личном кабинете можно получать на свою электронку

Для получения сообщений из ФНС об обновлении данных в личном кабинете в разделе «Профиль» необходимо подтвердить свой электронный адрес.

Инвестиции

Большинство россиян планируют инвестиции на срок не более пяти лет

Горизонт инвестирования опрошенных женщин и мужчин часто не превышает пяти лет.

Счета-фактуры

Ошибки в счетах-фактурах: из-за каких откажут в вычете НДС, а какие не помешают этому 

Счет-фактура — основание для принятия продавцом сумм НДС к вычету. Правила применения вычетов установлены статьей 172 НК. Но в процессе хозяйственной деятельности налогоплательщики допускают в счетах-фактурах ошибки. Они могут быть как существенными и приводить в дальнейшем к отказу в вычете НДС, так и несущественными. 

Ошибки в счетах-фактурах: из-за каких откажут в вычете НДС, а какие не помешают этому 

Интересные материалы

На отдельные помещения в элитном здании повышенная ставка налога не действует. Но это могут изменить

Бизнес-недвижимость облагается налогом по ставке 2%, но если кадастровая стоимость выше 300 млн рублей, будет повышенная ставка 2,5%. Если кадастровая стоимость помещения ниже 300 млн, повышенной ставки не будет, даже если это помещение находится в здании, кадастровая стоимость которого превышает 300 млн рублей.