ABBY выпустила FineReader XIX

Данная OSR-система распознавания текстов позволяет распознавать документы, написанные на старых европейских языках.

ABBYY FineReader XIX обеспечивает распознавание старых европейских текстов, набранных старинными шрифтами, с учётом особенностей старинных алфавитов, вышедшей из употребления орфографии и морфологии.

Дополнительно к 177 языкам, используемым в системе FineReader, программа поддерживает 5 старых европейских языков: английский, немецкий, французский, испанский и итальянский. В арсенале системы — способность обрабатывать популярные в прошлом шрифты Fraktur и Schwabacher и большое количество готических («ломаных») шрифтов.

Во время работы над ABBYY FineReader XIX разработчики провели специальное обучение системы: более чем 2500 примеров было подобрано для каждого символа готического шрифта. Созданная технология распознавания была протестирована на 31000 страниц оригинального текста из различных источников. Специальные языковые модели для распознавания старых европейских языков были созданы совместно с партнёром ABBYY — новосибирской компанией ATAPY Software. В ходе разработки проанализировано 10 словарей и более 100 книг, изданных в период с 1750 по 1930 год. В систему добавлено 159 грамматических моделей, не использующихся в современных европейских языках. FineReader XIX учитывает особенности старых европейских алфавитов (с 1600 года) и умеет распознавать вышедшие из употребления символы, например, удлинённое «s» в ранних английских и французских алфавитах.

Начать дискуссию