Компания НТЦ “ПОИСК-ИТ” разработала новый морфологический анализатор, позволяющий повысить эффективность информационно-поисковых систем.
В качестве источника достоверной информации о слове морфологический анализатор использует словарь. Если случается, что слово в словаре отсутствует, обработку проводят правила стемминга для автоматического выделения его основы.
Анализатор обеспечивает:
-Получение нормализованной формы слова;
-Получение всех морфологических форм слова;
-Получение информации о словоформе.
Общий словарь содержит более 3 миллионов словоформ. Обработка слов в поисковых системах. Оборудованных анализатором, осуществляется со скоростью до 500 000 слов в секунду.
Начать дискуссию