Путь к радости

Несмотря на потенциальные возможности, которые дает жизнь каждому человеку, люди редко чувствуют себя счастливыми. И редко понимают, что главная их непобедимая сила — это радость. Часто такую радость приносит вовремя найденная информация, без которой еще минуту назад жизнь была не мила, а работа не спорилась.

Сегодня информационный поиск — это и средство зарабатывания денег, и способ формирования престижа (большое количество ссылок на конкретного человека в Сети может тешить его самолюбие), и инструмент создания рейтингов, и т.п. А системы поиска — это конкретный пример результативности непосредственной связи некогда абстрактной науки и вполне реального бизнеса, оперирующего осязаемыми прибылями. Как отмечают авторы данного выпуска нашего журнала, посвященного «умному» поиску, даже абстрактные поисковые характеристики «релевантность» и «пертинентность», которые еще совсем недавно были знакомы лишь специалистам узкого профиля, теперь влияют на посещаемость сайтов и на доходы от их эксплуатации. Оказывается, позиция ссылки в списке результатов поиска определяется не только контентом страницы, но и особенностями доменного имени, играющего далеко не последнюю роль при поисковой оптимизации.

Пользователям нужны не документы как таковые или куча ссылок на них, а ответы на их вопросы, зачастую нечетко поставленные. Эти ответы должны содержать «полуфабрикаты», пригодные для принятия решений, иначе говоря, пользователям требуется содержимое документов. Некоторые наши авторы считают процесс поиска искусством, основанным на интеллектуальном итеративном процессе выявления нужной информации и тесно связанным с другими видами умственной деятельности. Для обеспечения такого процесса и получения всеобъемлющего представления об объекте поиска необходимы доступ к разным источникам данных, а главное — определенный запас специальных навыков, иначе путь к радости окажется весьма замысловатым.

Разумеется, традиционные информационно-поисковые системы, основанные на использовании ключевых слов, обеспечивают первый шаг в процессе поиска, но сегодня требуется точный поиск с учетом особенностей запросов конкретного пользователя и возможностью минимизации уточнений. По мнению авторов нашего журнала, ограниченность традиционных систем позволяют частично преодолеть, например, знания, полученные в ходе общения с поисковой машиной на естественном языке. Однако современные поисковые системы еще плохо умеют исследовать поведение пользователя, его намерения и профиль. А подход, в соответствии с которым поисковые машины и информационно-поисковые системы должны составлять представление о предмете исканий на базе ключевых слов, накладывает слишком много ограничений.

Задача обеспечения «умного» поиска весьма актуальна, но пока отсутствует целостный взгляд на нее, что косвенно подтверждает удручающая статистика. Например, аналитики из Enterprise Strategy Group утверждают, что циркулирующие в сетях данные на 80% не структурированы. Это существенно затрудняет поиск, особенно на фоне ожидаемого увеличения объемов баз с сегодняшних 4 тыс. Пбайт до 15,2 тыс. Пбайт в 2009 году (по данным Gartner). Кроме того, предпринятое AIM Statistics исследование хранилищ данных североамериканских компаний показывает, что 7,5% всех документов безвозвратно теряются, 3% ошибочно «подшиваются» не в те папки, а средний тираж копий документов составляет 19 экземпляров. В результате профессиональные аналитики тратят только 5-15% рабочего времени на чтение новой информации и до 50% — на ее поиск.

Непроизводительные затраты времени — не единственный источник интеллектуальных и материальных потерь. Например, есть определенный предел «процеживания» человеком результатов работы поисковой машины, по достижении которого он прекращает дальнейший поиск и приходит к выводу, что уже вполне информирован. Зачастую это приводит к ошибочным решениям, недооценке или переоценке рисков.

Истина одна, но путей к ней — бездна. Современные технологии поиска информации позволяют обрабатывать огромные массивы данных в разных форматах, но оправдывают себя, только если пользователи знают, что именно хотят найти, а так бывает далеко не всегда. По мнению наших авторов, помочь способна технология динамической классификации. Она нацелена на определение объекта поиска даже в том случае, когда пользователи заранее не знают, результаты какого процесса поиска принесут им радость, а не тяготы блуждания по закоулкам вавилонской башни Internet. Поиск информации нередко представляет собой заранее не запланированный процесс, осуществляемый в режиме реального времени и иногда приводящий к появлению новых знаний. Технология же динамической классификации, как утверждается, вносит в процесс мышления аналитика элементы творчества.