Google, компания, имя которой в первую очередь ассоциируется с Web-поиском, занимает далеко не первое место среди производителей решений для поиска корпоративных данных.
Сейчас, как утверждается, около 9 тыс. клиентов применяют ее корпоративные средства поиска, в то время как компания Autonomy, работающая на том же рынке, насчитывает 17 тыс. таких клиентов.
В опубликованном недавно отчете Beyond Search («За рамками поиска»), подготовленном по заказу Gilbane Group, аналитик Стивен Арнольд заметил, что Google работает без излишней шумихи, создавая решения, которые могут намного превзойти технологии поиска нынешнего поколения.
Арнольда, внимательно следящего за патентными предложениями Google, особенно интересует концепция, получившая название dataspaces, которая появилась в результате работы специалиста Google Элона Халеви.
По мнению Арнольда, dataspaces переводит обработку контента на совершенно новый уровень.
«Посуществу, этот инструмент должен содержать всю информацию, касающуюся конкретной организации, вне зависимости от ее формата и местонахождения, и моделировать все разнообразие взаимосвязей между репозиториями данных, — писал Халеви вместе с двумя соавторами в статье, опубликованной в декабре 2005 года. — Мы моделируем dataspaces как набор участников и взаимоотношений».
«Участники — это отдельные источники данных: они могут быть реляционными базами данных, XML-репозиториями, текстовыми базами данных, Web-сервисами и программными пакетами, — утверждается в статье. — Благодаря dataspaces можно будет моделировать любой вид связей между двумя (или более) участниками».
По мнению Арнольда, несмотря на то что другие производители преследуют аналогичные цели, они не могут по масштабу конкурировать с Google.
«Даже самые надежные системы обработки контента не рассчитаны на поддержку потоков контента уровня Google. Принимая во внимание масштаб, можно сказать, что Google сейчас по большому счету вне конкуренции со стороны компаний, упомянутых в данном исследовании», — писал Арнольд в Beyond Search.
В то же время Google, безусловно, будет реализовывать амбициозные проекты, касающиеся поиска и обработки контента, и подавать заявку на патенты, которые отражают концепцию dataspaces.
Один из них, U.S. Patent No. 20070198481, Automatic Object Reference Identification and Linking in a Browseable Fact Repository, описывает изобретение, которое «сводит» вместе широкий спектр данных по отдельному человеку или теме в своего рода досье.
В Google отказались прокомментировать заявки на патенты.
«Мы подаем заявки на патенты по самым разным идеям, которые предлагают наши сотрудники, — заявил представитель компании. — Некоторые из этих идей позже превращаются в реальные продукты или сервис».
Но в компании согласились дать общее описание стратегии в отношении средства поиска.
«Внутри корпоративной информационной системы, в отличие от Internet, допустимо очень многое знать о пользователе, в том числе кому он подчиняется, — заметил Мэттью Глоцбах, директор по управлению продуктами корпоративного подразделения Google. — Вы можете получить массу эмпирической информации. Все это можно использовать для создания очень детального профиля пользователя, который затем может применяться для создания действительно богатых возможностей поиска».
Однако, по словам Глоцбаха, не стоит ожидать, что Google внезапно предложит на рынке продукт, кардинально меняющий ситуацию. «Эта модель не относится к категории кардинально новых подходов, над которыми мы работаем много лет, а затем выпускаем какой-то продукт. Что касается корпоративного поиска, то мы постепенно (а не в одночасье) предлагаем совершенно новые решения», — сказал он.