Поиск информации с целью получения нового знания, принятия решений, как и другая аналогичная сложная интеллектуальная деятельность, требует инструментальных средств и соответствующих сервисов. С появлением Всемирной Паутины и различных механизмов поиска, индексирующих ее контент, получение информации стало для многих из нас повседневной рутиной. И где бы мы ни были, дома, на работе, в школе, в путешествии – мы подспудно рассчитываем на то, что сможем мгновенно получить доступ к нужным сведениям по любой теме.
Результаты извлечения информации будут для нас достаточны в том случае, если мы хорошо представляем себе, какие именно сведения и с какой целью нам необходимы. Но если информация нужна для обучения, принятия решений или другой сложной интеллектуальной деятельности, то сам по себе факт извлечения информации, конечно, важен, но не достаточен.
Информация необходима, например, рабочим группам, создающим сервисы или продукты, студентам, изучающим какие-то темы в течение длительного промежутка времени, семьям, строящим долгосрочные планы, или ученым, изучающим сложные явления. Однако современные механизмы поиска в Web способны удовлетворить потребность в таком подходе к информации лишь поверхностно. В случае сложного поиска или при проведении исследований пользователям нужна поддержка, которую им не могут обеспечить простые сервисы предоставления результатов поиска. Системы поддержки поиска информации (Information-Seeking Support System, ISSS) представляют собой решения, помогающие выйти за рамки простого получения результатов по тем или иным критериям запроса.
Исследовательское сообщество и компании, создающие механизмы поиска, уделяют повышенное внимание проектированию и реализации систем, отвечающих более широким требованиям со стороны тех, кто ищет информацию. Приоритетность такой работы декларируется на семинарах по исследованию и разработке, в статьях и системах-прототипах, в которых для описания широкой проблемы поиска информации и ее возможных решений используются самые разные термины: исследовательский поиск, интерактивный поиск, человеко-машинное извлечение информации.
Этот выпуск журнала Computer посвящен анализу текущего положения дел в индустрии поиска информации, состояния исследований в этой области и предложений конкретных ISSS, помогающих пользователям обнаруживать, осмысливать и применять найденную информацию.
Поиск информации – фундаментальная деятельность, позволяющая нам получить большое количество «сырого» материала для планирования своих действий, принятия решений и производства новых информационных продуктов. Люди ищут объекты информации, воплощающие их идеи, используют свои познавательные способности для оценки того, что они нашли, а затем прилагают дополнительные усилия для того, чтобы, опираясь на это понимание, решать проблемы.
Процесс поиска информации включает в себя семь подпроцессов: осознание необходимости; восприятие проблемы; формулирование проблемы; выражение необходимости; рассмотрение результатов; переформулирование проблемы; переход к использованию. Весь процесс многократно повторяется в соответствии с текущим восприятием человека, ищущего информацию, и с его осмыслением процесса поиска. Все эти процессы высоко адаптивны к информационной среде и допускают удовлетворение обширного спектра потребностей – от элементарного нахождения простых элементов, таких как телефонные номера для заказа пиццы, до продолжающихся всю жизнь исследований в динамичной предметной области. Возможна также ситуация, когда люди отказываются от решения проблемы на любом этапе по любой причине, например из-за нежелания знать о чем-то потенциально неприятном либо из-за ощущения переизбытка информации по мере того, как им становится известно все больше и больше.
Кроме того, наша естественная склонность собирать информацию, чтобы принимать более обоснованные решения, в сочетании с вычислительными средствами, составляющими основу World Wide Web, приводит к тому, что в повседневной жизни все шире используется «алгоритмическое мышление» (computational thinking). Умение с помощью Всемирной Паутины и соответствующих инструментов поиска быстро искать информацию становится обязательным для каждого образованного человека. В результате мы рассчитываем на все более развитые возможности доступа к информации и ее использования во всех аспектах нашей повседневной жизни. Эффект «снежного кома» от повсеместного доступа к информации наряду с ростом числа нерешенных поисковых задач ставит новые проблемы перед теорией поиска информации и проектирования ISSS. Оперативный доступ к фактам, изображениям и документам не только кардинально меняет роль ведущих информационных сервисов, таких как газеты и каталоги, подобные «Желтым страницам», но и расширяет наши интеллектуальные возможности, о чем более пятидесяти лет назад писал Дуглас Энгельбарт. Современные механизмы поиска в сочетании с мобильным доступом к Web определенным образом расширяют нашу память, фактически освобождая мозг от лишней нагрузки и позволяя тратить больше мыслительных усилий на интерпретацию и использование информации для обучения и принятия решений.
Существуют три взаимозависимых аспекта задачи построения ISSS: разработка более надежных моделей взаимодействия человека и информации; создание новых инструментальных средств и сервисов, соответствующих современным требованиям к информационному обеспечению; создание улучшенных методик и методов оценки качества поиска информации. Новые модели, инструменты и метрики требуются также для описания динамического поиска – когда непрерывно меняются люди, источники информации и системы, а сам процесс поиска становится неотъемлемым компонентом нашей жизни, а не какой-то отдельной деятельностью. Статьи этого номера описывают некоторые из существующих подходов, направленных на удовлетворение перечисленных потребностей поиска.
В статье «Powers 10: моделирование сложных систем поиска информации в различных масштабах» (Powers of 10: Modeling Complex Information-Seeking Systems at Multiple Scales) Питер Пиролли утверждает, что рациональные и предикативные модели поиска информации, действующие во временном и пространственном масштабах, начинают заменять традиционные описательные модели поиска информации. Обращаясь к области экологии (производство продовольствия) и психологии (осмысление), автор предлагает на суд читателей модель прогнозирования поведения человека в конкретных условиях поиска информации. Эта модель согласуется с существующими представлениями о процессе познания, наблюдаемом в естественных и искусственных, в том числе социальных средах, продолжительность которого может быть достаточно большой. Следующие две статьи, «Поиск информации может быть социальным» (Information Seeking Can Be Social) Эдда Чи и «Коллективный поиск информации» (Collaborative Information Seeking) Жене Головчински, Перниллы Оварфорд и Джереми Пикенса приводят примеры социального и совместного поиска, указывая новые способы эффективного использования совместных усилий групп людей при поиске информации.
Совершенствующиеся модели поиска информации и быстро развивающиеся интерактивные Web-технологии стимулируют появление множества новых инструментов и сервисов, затрагивающих различные аспекты процесса поиска информации. В статье «Построение знаний: что за пределами поиска по ключевым словам?» (Building Knowledge: What’s beyond Keyword Search?) М. С. Шрафел помещает современный инструментарий в исторический контекст вычислений, проводимых до эпохи Web, и утверждает, что появляющиеся сегодня средства поддержки гибкого просмотра и навигации – это именно то, чего так не хватало во времена, когда Web еще не было. Автор иллюстрирует свои аргументы примерами инструментов фасетного поиска, которые тесно связывают выборки и результаты и добавляют визуальное представление, что поддерживает процесс высокоинтерактивного поиска информации. В деле поиска информации есть и еще один острый вопрос – переоценка ценностей. Усложнение человеческого поведения приводит к постепенному пересмотру метрик эффективности, результативности и удовлетворенности. При оценке средств поддержки поиска информации невозможно полностью отделить человеческое поведение от системных эффектов, поскольку инструменты так тесно связаны с действиями человека, что становятся симбиотическими. Одни только такие классические параметры, как время, количество щелчков мыши или точность, слишком грубы, чтобы оценить эффективность инструментов. В силу этого создаются новые методики оценки и новые наборы метрик. В статье «Оценка задач и направлений развития систем поддержки поиска информации» (Evaluation Challenges and Directions for Information-Seeking Support Systems), написанной Дайаной Келли, Сьюзен Думаис и Яном Педерсеном, приводится обзор стратегий оценки, позволяющих понять, что происходит между выдачей запроса и получением результата. Авторы в лабораторных условиях повысили качество распределенной оценки, демонстрируя пути улучшения работы с инструментами класса ISSS. Интересную параллель можно провести с задачей передачи знаний в биомедицине, когда группы ученых разных специальностей совместно с врачами применяют результаты фундаментальных исследований на практике. В случае ISSS задача в том, как ученые академических институтов со своими специфическими методами работы и особой системой вознаграждения могут совместно работать со специалистами-практиками над улучшением качества поиска. В статье «Отношения между отраслью и наукой» (Industry-Academic Relationships) Дениэл Рассел подчеркивает важность совместной работы специалистов-практиков и академических ученых. Например, компании, разрабатывающие механизмы поиска, располагают огромным массивом корпоративных данных, а академические группы имеют возможность создавать и применять новые подходы к их анализу и интерпретации.
В данном номере описаны лишь основные из ведущихся сейчас разработок в теории и архитектуре поиска информации, однако широта спектра исследований, затронутых в этом тематическом выпуске, показывает, насколько важными для успешной разработки и развертывания эффективных ISSS являются сотрудничество между разными дисциплинами и партнерство между наукой и отраслью.
Увеличение мощности систем поиска и повышение уровня готовности информации может сделать наше общество более информированным и способствовать развитию экономики. Мы все являемся потребителями информации как неистощимого ресурса. Исследования и разработка с помощью новых ISSS помогут удовлетворить наши усложняющиеся информационные потребности и наше желание получать и использовать информацию в любое время и в любом месте.