Для Jeopardy в IBM собрали колоссальный объем справочных материалов, в том числе множество энциклопедий, миллионы публикаций из СМИ и литературных произведений. Некоторые из этих материалов хранятся в структурированных базах данных, а другие — в виде обычных текстовых файлов (Фото: IBM) |
Именно этой стратегией пользуется компьютер Watson, специально созданный IBM для участия в телевикторине Jeopardy. (В России по американской лицензии на телевидении идет ее аналог под названием «Своя игра». — Прим. перев.) Съемки выпусков Jeopardy, в которых Watson соревнуется в эрудированности с чемпионами телеигры, прошли в исследовательском центре IBM Yorktown Heights. По американскому телевидению эти выпуски игры будут показаны с 14 по 16 февраля.
В IBM долгое время держали в секрете конфигурацию Watson, но недавно ведущий менеджер проекта Дэвид Ферруччи приоткрыл завесу тайны, рассказав об особенностях конструкции системы.
Для IBM участие компьютера в Jeopardy стало очередной ступенью развития искусственного интеллекта. В 1997 году компьютер Deep Blue корпорации выиграл в шахматы у Гарри Каспарова. По мнению Ферруччи, победить в Jeopardy — гораздо более сложная задача: «В шахматах нет ничего неявного, ни о чем не надо догадываться по контексту. Вопросы в Jeopardy, напротив, подразумевают понимание тонкостей человеческого общения, в том числе использования отсылок и косвенных указаний. Это задача колоссальной сложности. Обработка естественного языка осложняется тем, что одну и ту же информацию можно выразить множеством различных способов. Метод Watson — ‘разделяй и властвуй’. Компьютер рассматривает данные со множества точек зрения, а затем объединяет результаты исходя из того, что выразить то или иное понятие можно по-разному».
В телевикторине Jeopardy вопросы задаются в виде утверждений, а игроки должны давать ответы, наоборот, в форме вопроса. Чтобы еще больше усложнить задачу, вопросы нередко формулируются неоднозначно, так что участникам приходится догадываться, о чем именно идет речь. Пример вопроса:
«Эта мера ткани равна 40 ярдам». (Ответ может звучать, например, так: «Это рулон?»)
Как только ведущий заканчивает зачитывать вопрос, участники, готовые ответить, могут нажимать на кнопку. Кто раньше других успеет нажать, тот первым получает право ответа. Обычно на то, чтобы задать вопрос, у ведущего уходит около трех секунд, отмечает Ферруччи. За это краткое время Watson должен успеть подобрать подходящий ответ.
На первый взгляд данная задача может показаться простой, ведь системы интернет-поиска ищут ответы на подобные вопросы миллионы раз за сутки. Однако не все так уж просто, утверждает Ферруччи: «Считать, что компьютер всего лишь ищет ответ перебором, неверно. Хотелось бы мне, чтобы это было так просто. Google и другие интернет-сервисы лишь выдают документы, которые, возможно, содержат ответ на ваш вопрос, но не сами ответы. А из баз данных можно получить материалы, только если предельно точно сформулировать запрос. На самом деле нашей системе приходится интерпретировать вопрос и оценивать его с точки зрения массы всех возможных вариантов формулировки ответа».
Программная система, которая координирует процесс поиска ответа, называется DeepQA. Она сочетает в себе функции обработки естественного языка, машинного обучения и извлечения информации.
Получив вопрос, она вначале анализирует его, идентифицируя наименования, даты, географические названия и другие элементы, а также изучает грамматическую структуру фразы, ища подсказки, которые способны помочь понять суть вопроса.
Иногда вопрос является очевидным, и тогда ответ действительно можно найти с помощью простого поиска по конкретной базе данных. Однако, как правило, для ответа необходимо одновременно запустить пять—десять операций поиска по различным источникам, каждый из которых выбран в результате одной из интерпретаций вопроса.
Процесс поиска ответа происходит итеративно: после получения набора результатов может понадобиться новая серия операций поиска. «На определенном этапе одновременно могут работать сотни процессов, и каждый из них порождает новые варианты ответа, — отмечает Ферруччи. — Представьте себе, как происходит это ветвление». В конечном итоге машина может получить несколько тысяч возможных ответов.
В Jeopardy же необходимо дать всего один ответ, и предпочтительно верный. Поэтому, когда все возможные ответы собраны, система с помощью примерно ста алгоритмов оценивает каждый из них с различных точек зрения: например, укладывается ли ответ во временные рамки, на которые указывает вопрос; попадает ли ответ в нужный географический регион; соответствует ли грамматическая форма ответа требованиям вопроса. Выполняется также категорийная проверка: например, если вопрос требует назвать жидкость, то все варианты ответа, в которых не фигурирует жидкость, отметаются. Ответ с наивысшим рейтингом соответствия выдается системой как окончательный.
Если бы программа, реализующая данный подход, работала на однопроцессорном компьютере, на выбор ответа у нее уходило бы по два часа, утверждает Ферруччи. Watson же состоит из двух стоек серверов IBM Power7 System, содержащих в общей сложности 2,5 тыс. процессорных ядер, которые слаженно работают в кластеризованной конфигурации.
Несмотря на всю аппаратную мощь и сложность программного обеспечения, победа Watson в игре далеко не гарантирована. В июне прошлого года The New York Times сообщала, что систему еще предстоит немало совершенствовать, чтобы она смогла сравняться по скорости мышления с асами игры в Jeopardy.
Однако, независимо от результатов телевикторины, наработки команды Ферруччи в дальнейшем смогут найти гораздо более широкое применение. Со временем в IBM на основе DeepQA рассчитывают создать коммерческие системы поиска ответов на вопросы для различных отраслей: здравоохранения, технической поддержки, юриспруденции.
«В конечном итоге не так уж важно, победит ли Watson чемпионов Jeopardy, — написал в еженедельном аналитическом бюллетене сайта Pund-IT его главный редактор Чарльз Кинг. — Компьютерная система, по сути могущая состязаться с человеком в интеллектуальных способностях, однозначно знаменует собой гигантский технологический прорыв и является предвестником грандиозных инноваций в сфере коммерческих ИТ-систем».
В показанном по американским телеканалам пробном туре с участием Watson и чемпионов Jeopardy Кена Дженнингса и Брэда Раттера компьютеру удалось обыграть людей. Сами гроссмейстеры телевикторины, однако, не унывают и утверждают, что компьютер играет примерно на уровне хороших мастеров Jeopardy. О том, как компьютер сыграет дальше, станет известно в феврале.