Анализируемые характеристики | Информационно-поисковые системы | |
Google, Fast, Alta Vista | STOCONA SEARCH | |
Индексация слов текста ресурса | Все слова без учета морфологических изменений слова (лексем) | Все слова с учетом их морфологических и синтаксических характеристик |
Индексация слов запроса пользователя | Без учета морфологических изменений слова (лексем) | С учетом морфологических изменений слова (лексем) |
Исключаемые слова | Нет | Междометия, частицы (кроме "не" и "ни"), вводные слова и вставные конструкции |
Значение вопросительного слова в поисковом запросе | Является обычным ключевым словом для поиска | Является основой синтаксического разбора, определяет семантическую направленность вопросов пользователя |
Принцип оценки релевантности текстовой информации | Количество найденных ключевых слов | Оценка близости деревьев семантических связей слов в запросе пользователя и в предварительно отобранных текстах. Предварительный отбор текстов на основе морфологического анализа, синтаксический анализ текстов для определения членов предложений и их семантических связей |
Диалог системы с пользователем при вводе запроса | Нет | Уточнение написания слов с возможными ошибками. Уточнение семантики многозначных слов при возможной неоднозначной трактовке вопроса, уточнение необходимости поиска по синонимам и по однокоренным словам |
Типы запроса пользователя | Ключевые слова, формализованный язык запросов (расширенный поиск) | Запрос на естественном языке, ключевые слова |
Учет смысла многозначных слов | Есть 1 | |
Учет омонимов слов | Нет. Не учитываются различные значения омонимов слов (омоформ и омографов) | Есть |
Поиск по синонимам слов | Нет | Есть. Перечень синонимов слов составлен с учетом их семантики |
Поиск по однокоренным словам | Нет | Есть. Перечень однокоренных слов составлен с учетом их семантики |
Поиск чисел | Не обеспечивается корректный поиск дробных чисел | Обеспечивается корректный поиск целых и дробных чисел. |
Этапы лингвистического анализа | Лексический | Лексический, морфологический, синтаксический, семантический |
Основные разделы словаря | Морфологические формы слов (лексемы) | Основы слов, морфологические формы слов (лексемы), синонимы, однокоренные слова, семантическое значение слов |
Формы ответа поисковой системы | Упорядоченный перечень ссылок на тексты (ресурсы), содержащие ключевые слова | Упорядоченные по степени близости наиболее соответствующие по смыслу предложения и абзацы текстов. Упорядоченный по степени семантической, синтаксической и морфологической близости перечень ссылок на тексты, содержащие ключевые слова. |
Примечание 1. Словарная база лингвистического процессора составлена с учетом смысла многозначных слов. Это обеспечивает автоматическое определение наличия неоднозначности в вопросе и возможность проведения поиска с учетом семантики многозначных слов. Синтаксическая индексация многозначных слов реализована в полуавтоматическом режиме. Автоматическая синтаксическая индексация многозначных слов может быть обеспечена при реализации полнофункционального семантического анализа текстовой информации.