Сергей Мацоцкий: «Целый ряд задач теперь можно решать не на основе многоступенчатой сложной архитектуры, а посредством масштабной, но одноранговой системы» |
Технологии Big Data позволяют через сбор и анализ первичных данных извлекать качественно иной вид интеллектуальной субстанции — знания, недоступные для стандартных методов обработки, считает генеральный директор IBS Сергей Мацоцкий. В беседе с корреспондентом «Сетей» он подробно обосновал свою точку зрения.
Современная структура IBS соответствует ее стратегии разделения предоставляемых решений на сложные комплексные и тиражируемые. Какое направление развивается более динамично и почему?
Трудно сказать определенно, что именно развивается быстрее, поскольку структура IBS неоднородна и в различных сегментах рынка наш бизнес развивается по-разному. Но если все-таки попытаться дать усредненную оценку, я бы сказал, что более динамично развивается направление тиражируемых решений. Это характерно для сегодняшней экономической ситуации. Бизнес играет «вкороткую», опасаясь инвестировать в долгосрочные проекты. Многие ждут результатов выборов в России. Да и мировые финансовые площадки оптимизма не добавляют. Все эти факторы вместе создают общее депрессивное настроение в экономике. В таких условиях заказчики приобретают только то, что им остро необходимо, или то, что даст быстрый эффект от внедрения, то есть тиражируемые решения. Это странно, потому что, например, после кризиса 1998 года началось бурное развитие рынка сложных ERP-систем. Тогда бизнес понял, что нужно научиться считать деньги. После кризиса 2008 года масштабного смыслового обновления (с точки зрения использования ИТ) в деловой среде, пожалуй, не произошло.
Когда же это переосмысление может произойти?
До 2008 года, бизнес переживал некий романтический этап. Все жили по принципу «хватай больше, кидай дальше». Этот этап закончился, и сейчас даже не столько с технологической, сколько с ментальной стороны бизнес требует определенного переформатирования. Мне кажется, что на смену собственникам, прежде самостоятельно рулившим бизнесом, в высшие эшелоны корпоративного управления приходят профессиональные менеджеры. Наверное, после выборов этот процесс ускорится и приобретет больший размах. Тогда, при условии что мировая экономика не преподнесет нам совсем уж неприятных сюрпризов, деловые круги перейдут на следующий эволюционный цикл, на котором будут превалировать долгосрочное планирование и масштабные инвестиции. На этом этапе, наверное, в IBS будет быстрее развиваться направление сложных комплексных проектов.
Что означает для IBS появление таких технологических концепций, как Cloud Computing и Big Data? Мощная шумиха вокруг них повлияла на состав продуктов и услуг вашей компании?
Конечно, повлияла. Cloud Computing знаменует собой очередной технологический цикл. Правда, сейчас облачные вычисления находятся на самом пике обсуждения и в меньшей степени на стадии внедрения. Добавлю, что сам по себе термин Cloud Computing очень общий и под ним можно понимать огромное количество разных продуктов, находящихся в разной степени зрелости. Если говорить о виртуализации серверов, то эта категория продуктов уже достаточно зрелая и активно используется подавляющим большинством клиентов. Если говорить о PaaS, то эта тема, наоборот, только выходит на стадию зрелости. Что касается SaaS, то продукты этой категории давно пережили всплеск интереса к ним, и сейчас наблюдается даже некоторое разочарование заказчиков в них.
А если говорить про виртуализацию рабочих мест?
Эта тема еще даже не вышла на стадию активного обсуждения. Я думаю, виртуализация рабочих мест будет мощным хитом через два-три года, когда применение данной технологии станет повсеместным явлением. Отдельные ветви Cloud Computing развиваются с разным ускорением, но большинство участников рынка вовлечено в процесс продвижения облачных технологий.
С Big Data, вероятно, все обстоит несколько иначе?
Big Data — совсем другое дело. Эта технологическая концепция ориентирована главным образом на государственные структуры и крупные корпорации. Например, одним из наиболее активных потребителей технологии Больших Данных может стать и становится медицина. Это целая отрасль, развитие которой подпадает под логику возможностей, определяемых концепцией Big Data. С помощью соответствующих технологий будут предсказываться эпидемии и создаваться новые, более эффективные лекарства. В корпорациях (только очень крупных) также может быть получен ощутимый эффект от Big Data. А небольшие предприятия вряд ли способны генерировать такой объем данных, из которого с помощью Больших Данных можно получить уникальный экстракт знаний. Это и есть главное отличие Big Data от облаков, особенно публичных, таких как Amazon, Google или Microsoft Azure. Эти продукты охватывают широкие слои пользователей. А Большие Данные предназначены для узкого круга очень крупных заказчиков, нуждающихся в интеллектуальном извлечении информации из огромных консолидированных хранилищ данных.
Какую же роль в продвижении идеологии Big Data могли бы сыграть крупные российские интеграторы и, в частности, IBS?
Вместе с вендорами интеграторы будут играть ключевую роль в этом процессе. Роль дистрибьюторов здесь минимальна и практически сводится к обеспечению доставки оборудования. Любой проект в области Big Data предполагает инсталляцию сложнейшего программно-вычислительного комплекса, нередко основанного на таких процессорах или серверах, о которых подавляющее участников рынка даже не слышало. Большие Данные — очень сложная технологическая концепция, и реализовать ее преимущества в интересах заказчиков способны только крупные интеграторы в тесном взаимодействии с вендорами. Речь идет либо об очень крупных, либо о специализированных вендорах, таких как Oracle, EMC, IBM, Teradata, а также компаниях, производящих продукты ETL, потому что таковые являются одним из важнейших инструментов сбора, очистки данных и приведения их к нужному виду.
Что вы вкладываете в понятие Big Data?
Технологии Big Data позволяют через сбор и анализ первичных данных извлечь качественно иной вид интеллектуальной субстанции — знания. Такую задачу раньше невозможно было решить существующими средствами, прежде всего из-за технических ограничений. Раньше, без технологий Big Data, нельзя было собрать большие объемы данных в одном месте и обработать их в реальном времени. Не существовало и отработанной методологии для выделения из большого объема данных сгустков полезной информации. Теперь благодаря Big Data все это стало реальностью. И нужно понимать, что решения из области Больших Данных относятся к разряду сложных комплексных, если не сказать уникальных.
Надо полагать, решения из разряда Cloud Computing являются тиражируемыми?
Облачные решения тиражируются очень хорошо, но чаще не целиком, а отдельными компонентами. Публичные облака по определению являются тиражируемыми — в любой момент можно приобрести требуемое количество «квантов» ИТ-инфраструктуры, необходимых для выполнения конкретных задач. Если говорить о частных облаках, то и здесь можно выбрать ряд стандартных компонентов, в значительной степени отработанных, и скомпоновать из них необходимую архитектуру. Но вот эта компоновка требует хороших знаний и большого опыта, которыми располагают крупные интеграторы.
Утверждается, что Cloud Computing и Big Data — взаимосвязанные вещи. Как, с вашей точки зрения, будет эволюционировать этот симбиоз?
Я думаю, что в этом утверждении гораздо больше маркетинга, чем практического смысла. Cloud Computing и Big Data объединяет не виртуализация, как можно было бы предположить, а скорее централизация и консолидация. Потому что логика Больших Данных состоит в том, чтобы вместо наращивания количества вычислительных агрегатов собрать первичные данные воедино и выстроить механизм их обработки для получения экстракта знаний. И если эта централизация — элемент частной или публичной облачной архитектуры, тогда их взаимосвязь, пожалуй, оправданна.
Есть мнение, что Cloud Computing и Big Data обусловят новый сдвиг парадигмы в ИТ. Вы поддерживаете эту точку зрения?
Да, этот сдвиг уже происходит.
В чем он проявляется? По каким признакам можно судить о его наличии?
По прогнозам аналитиков, развитие Big Data приведет к созданию в США почти полумиллиона рабочих мест по новой специальности «аналитик данных». И это может оказать очень большое влияние на ИТ-индустрию в целом.
До сих пор такая специальность не была востребованной и определенной с точки зрения ее содержания. А для пользователей сдвиг проявляется в том, что целый ряд задач теперь можно решать не на основе многоступенчатой сложной архитектуры, а посредством масштабной, пусть довольно сложной, но одноранговой системы.
Можно, к примеру, организовать сбор данных про истории болезней каждого гражданина страны и на их основе предсказывать уровень заболеваемости в том или ином регионе.
Или разрабатывать новые поколения лекарств совершенно иного качества. И эти возможности создадут огромный спрос на аналитиков данных, профессионалов, способных в огромном объеме первичных данных находить принципиально новые знания. Это один из самых очевидных признаков сдвига парадигмы — появление новой специальности, которая из уникальной станет массовой.
Надеюсь, что и Россия в этом процессе сможет занять свое место в международном разделении труда. Наши специалисты могли бы, не переезжая за границу, выполнять функции аналитиков данных по модели аутсорсинга. У нас ведь хорошая математическая школа.
На то, что сдвиг происходит, указывает и появление нового суперкомпьютинга. Раньше суперкомпьютерами называли только мощнейшие машины, настроенные на сложные терафлопсные и петафлопсные вычисления. Сейчас же возникают суперкомпьютеры, нацеленные на хранение и обработку огромных массивов данных. А это совсем другая внутренняя логика, и в данной области действуют совсем другие вендоры.
В концепции Big Data огромная роль отводится вопросам управления и анализа. Это как раз то, чего не хватает многим российским предприятиям, и отчасти именно поэтому у нас в стране низкий управленческий уровень. Выходит, Big Data — именно то, что нам нужно?
У нас действительно специфические условия — административная экономика, дешевизна рабочей силы и низкая производительность труда. Все это отрицательно скажется на развитии Big Data в нашей стране. Для административной экономики такая технологическая концепция не очень актуальна. Но она может оказаться полезной для государства, поскольку оно оперирует гигантскими массивами информации и на государство возложен огромный объем управленческих задач. Власти заинтересованы в качественном прогнозировании и моделировании внутренних процессов в экономике и обществе. Это характерно для любого государства. А для России, с учетом ее неравномерно освоенной обширной территории, недостаточной прозрачностью институтов управления, Большие Данные — очень актуальная вещь.
В корпоративной среде Большие Данные будут востребованы там, где высок уровень капитальных затрат. Потому что, прежде чем тратить гигантские средства, например, на разведку новых ископаемых ресурсов, следует провести предварительные расчеты. Кроме того, предприятия финансовой сферы остро нуждаются в новых способах прогнозирования и средствах обработки данных. Скажем, первым в России проектом, который можно было бы отнести к области Больших Данных, является проект внедрения решения компании Teradata в банке «Русский Стандарт».
Востребованы ли перспективные решения на основе Cloud Computing и Big Data в самой IBS? Вы используете их в своей деятельности? Какой это дает результат?
В 2011 году мы приступили к полномасштабной модернизации своей ИТ-инфраструктуры и созданию частного облака, которое будет поддерживать все прикладные информационные системы. Этот проект, стоимостью около 2 млн долл., развивается и сейчас. В том виде, как он был специфицирован, проект завершится к концу текущего года. К тому сроку произойдет миграция всех наших 70 бизнес-приложений в частное облако. Это дает нам совершенно другой уровень надежности и производительности. Мы уже существенно сэкономили на амортизации после вывода разнородного устаревшего ИТ-оборудования и замены его на более эффективный программно-вычислительный комплекс. На эксплуатационных расходах в этом году мы, конечно, не сможем сэкономить, но в будущем — уже наверняка.
А Big Data могли бы применить в своей практике?
Пока, наверное, нет. То, что мы делаем на уровне BI, нельзя назвать технологиями Больших Данных, это скорее классический OLAP. Пока я применения идеологии Big Data в нашей компании не вижу. У нас нет такого объема уникальных данных, который нельзя было бы обработать стандартными методами.