SAS, производитель систем бизнес-анализа, приобретает компанию Teragram, которая получила известность благодаря своему механизму обработки естественного языка (Natural Language Processing, NLP) и передовым лингвистическим технологиям.
С помощью технологий Teragram в SAS планируют расширить возможности своих аналитических систем бизнес-анализа и инструментов добычи текстовых данных, а также усовершенствовать функции корпоративного и мобильного поиска.
Эта компания со штаб-квартирой в США и штатом, которой насчитывает 40 человек, получит статус одного из подразделений SAS. Условия сделки не разглашаются. Технологии компании уже успели доказать свою эффективность: клиентами Teragram являются такие известные организации, как CNN, Forbes, «Нью-Йорк Таймс», Sony, «Вашингтон Пост», Wolters Kluwer, Всемирный банк и Yahoo!
«Технологии Teragram должны расширить возможности SAS в части объединения средств обработки структурированных и неструктурированных данных — не только в решениях, связанных с добычей текста, но и в рамках всей платформы SAS Enterprise Intelligence Platform, — что позволит нашим клиентам быстрее получать более точные ответы», — отметил генеральный директор SAS Джим Гуднайт.
«Объемы накопленных данных самой разной природы стремительно растут, и компаниям нужны интеллектуальные средства их обработки, независимо от того, находится информация в структурированных базах данных или же поступает из огромного числа неструктурированных источников», — подчеркнул президент Teragram Ив Шабес.
По оценкам аналитиков Gartner, большая часть информации, которой располагают сегодня предприятия, представляет собой неструктурированные данные, хранящиеся в текстовых документах, презентациях, мультимедийных файлах, электронных таблицах или в каком-то ином виде. Если у сотрудников есть возможность получения простого доступа к контенту, организации могут автоматизировать свои бизнес-процессы, повысить их эффективность, сократить затраты, обеспечить повторяемость и в итоге получить дополнительные конкурентные преимущества.
Технология Teragram помогает превратить текст, представленный на различных языках и хранящийся в самых разных источниках, в полезную информацию. Teragram NLP предлагает мощные средства обработки языковых конструкций на уровне слов, лингвистических отношений и семантики. В компании разработали и поддерживают объемные словари, объединяющие в общей сложности многие миллионы слов и словосочетаний на 30 различных языках.
Что касается средств корпоративного поиска, технологии Teragram позволяют осуществлять сканирование как структурированных корпоративных баз данных, так и неструктурированных источников и выдачу клиентам исчерпывающих сведений, полученных из множества различных информационных ресурсов. «Для современной многонациональной компании, которая имеет распределенный штат сотрудников и владеет огромными объемами данных, хранящихся в самых разных системах и форматах, очень важно иметь возможность получать быстрые и точные ответы на вопросы, возникающие в процессе принятия ключевых бизнес-решений», — заметил Шабес.
Сочетание технологий SAS и Teragram обеспечит проведение индексации на основе не только заголовков отчетов, но и фактического контента, а также связанных с ним метаданных. Система корпоративного поиска — мощное конкурентное оружие, позволяющее организации эффективно использовать существующие информационные ресурсы. Объединение систем бизнес-анализа SAS, механизмов интеграции данных и передовых аналитических средств с технологиями обработки естественного языка Teragram поможет в течение буквально нескольких секунд получать ответы на поисковые запросы.
В SAS готовы предложить мобильную поисковую технологию Teragram индивидуальным пользователям, которые смогут хранить и извлекать необходимую им информацию, подключаться к внешним приложениям и выполнять операции поиска в базах данных с помощью имеющегося у них смартфона или какого-то другого мобильного устройства.