Чем сильнее в мире ИТ ажиотаж по поводу новшества, тем больше о нем неверных представлений, и аналитика не исключение. Методы аналитики, одного из самых «модных» направлений в современных ИТ, могут принести существенные преимущества бизнесу, но заблуждения способны помешать оперативно реализовать возможности, которые могли бы пойти на пользу как самой компании, так и ее клиентам.
При разработке и расширении стратегии в области аналитики организациям стоит иметь в виду распространенные мифы. Перечислим 12 таких мифов.
Миф № 1. Аналитика требует немалых инвестиций
В наше время любой технологический проект проходит через фильтр финансовой оценки. «Во что это нам обойдется?» — один из первых вопросов, который получают ИТ- и бизнес-руководители, когда предлагают начать проект или внедрить новый инструмент.
Принято считать, что аналитика данных — внедрение непременно дорогостоящее, а потому доступное только организациям с солидными бюджетами и внутренними ресурсами. Однако не все инициативы в этой области требуют значительных инвестиций.
Сегодня существует масса инструментов — с открытым кодом и не только, — с помощью которых вы сможете быстро увидеть преимущества аналитики. Однако для этого понадобится хорошее знание структуры внутренних источников данных и понимание задачи, которую требуется решить. К тому же пробные внедрения сегодня значительно упростились благодаря облачным сервисам.
Современная аналитика основана на облачных системах и средах обработки больших данных, которые по своей природе гораздо менее дорогостоящие, чем традиционные хранилища данных. Кроме того, данные и аналитика обычно применяются ради трех задач: повышения КПД процессов, увеличения выручки и прогнозного управления рисками. Поэтому в целом внедрение аналитики обеспечивает значительные экономические преимущества любой компании.
Миф № 2. Для аналитики требуются большие данные
В представлении многих концепции больших данных и аналитики идут рука об руку. Считается, что организациям, прежде чем осваивать аналитику, нужно собрать колоссальные объемы данных, чтобы получать полезные для бизнеса знания, улучшать процессы принятия решений и т. д.
Разумеется, преимущества анализа больших данных сегодня хорошо известны, и компании с соответствующими ресурсами действительно могут получить ощутимое конкурентное преимущество за счет использования информационных хранилищ в рамках аналитических инициатив. Однако представление о том, что большие данные обязательны для аналитики, неверно.
Зачастую в компаниях стараются сохранять как можно больше данных, пребывая в уверенности, что это необходимо. Но полагать, что чем больше данных, тем лучше, а остальное — дело техники, является ошибкой.
Для аналитики требуются не максимально большие объемы данных, а данные определенного рода. Сотрудникам прежде всего необходима информация, относящаяся к их должности, которая поможет в принятии решений и улучшении результатов. Нужно не гнаться за большим объемом данных, а уточнить, какие именно данные нужны бизнес-пользователям и в какой форме они должны быть представлены.
Для предоставления доступа ко всему объему информации во множестве форматов, может потребоваться чрезмерно сложный проект, который будет лишь сдерживать освоение аналитики. Поэтому необходимо выяснить, какие именно данные важны и как представить информацию в наиболее доступной для пользователей форме.
Миф № 3. Аналитика исключает присущую людям предвзятость
Принципы работы автоматизированных систем таковы, что ошибки из-за предубеждений им, казалось бы, не должны быть свойственны. По мнению некоторых, аналитика и машинное обучение устраняют предвзятость, присущую людям, но это, увы, не так. Технологии разрабатываются людьми, поэтому полностью исключить предвзятость невозможно. Алгоритмы аналитических систем настраиваются с помощью обучающих данных и воспроизводят все особенности, свойственные учебной выборке.
В одних случаях возникающая таким образом системная предвзятость может быть незначительной, в других — сильной. Поэтому не стоит полагать, что полученный результат верен и объективен только потому, что «так сказал компьютер».
Миф № 4. Лучшие алгоритмы — залог успеха
В некоторых случаях обработка с помощью простого алгоритма более обширного набора данных позволяет получать лучшие результаты. В публикации IEEE, озаглавленной «Необоснованная эффективность данных», инженеры Google доказывают, что простые статистические модели в сочетании с гигантскими объемами данных позволяют получить лучшие результаты, чем более «интеллектуально развитые» модели, учитывающие множество признаков и выполняющие сложные обобщения.
Миф № 5. Алгоритмы безотказны
Людям свойственно безоговорочно доверять статистическим моделям, алгоритмам и методам науки о данных. Не обладая достаточными знаниями, чтобы подвергать сомнению качество моделей, они предпочитают доверять «умникам», которые их разработали.
Прежде чем можно будет безоговорочно доверять машинному обучению и результатам работы моделей, пройдет еще очень много времени. А пока что необходимо требовать от людей, разрабатывающих алгоритмы и модели, объяснений того, как именно получаются те или иные результаты.
Прогнозы о том, что искусственный интеллект через пару десятков лет обойдет по интеллектуальным способностям людей, слышны уже более полувека и будут раздаваться далее. Однако, прежде чем можно будет безоговорочно доверять машинному обучению и результатам работы моделей, пройдет еще очень много времени. А пока что необходимо требовать от людей, разрабатывающих алгоритмы и модели, объяснений того, как именно получаются те или иные результаты. Речь идет не о том, что верить им в принципе нельзя, а о том, что нужны уточнения, которые помогут проверять аналитику и после этого доверять ей.
Миф № 6. Наука о данных — искусство для избранных
В последние годы наука о данных (data science) получила широкую известность, но, тем не менее, не все понимают, что это такое. Говоря упрощенно, это поиск закономерностей в данных с помощью специальных алгоритмов.
Наука о данных представляется загадочной, поскольку такие алгоритмы способны анализировать больше переменных и данных, чем может себе представить человеческий разум. С ростом доступных вычислительных мощностей и объемов памяти, происшедшим за последние годы, мы обрели возможность быстро решать задачи, которые еще десять лет тому назад было бы невозможно экономично решить доступными способами. Наука о данных — это естественное развитие методов статистического анализа, хорошо известных уже много десятков лет. Никакой загадки в науке о данных нет — достаточно освоить соответствующие разделы математики.
Миф № 7. Аналитика занимает слишком много времени
Скорость сегодня имеет огромное значение для конкурентоспособности компаний, идет ли речь о срочном выпуске продукта на рынок или о быстром ответе на запрос клиента. Существует мнение, что аналитика занимает много времени, а потому мешает повышению скорости и деловой гибкости.
Миф о том, что проекты подобного рода слишком длительны и сложны, довольно расхож. Однако на деле все сводится к кадровому вопросу. При наличии специалистов с необходимыми навыками, умеющих грамотно применять Agile-методологии, вы сможете отвечать на важные вопросы за считанные дни, а не месяцы.
Миф № 8. Чтобы выполнять больше аналитики, нужно больше ученых по данным
Ученые по данным (data scientist) на сегодня одна из самых востребованных технических профессий. В каких-то случаях организация может обойтись меньшим количеством этих специалистов, если перераспределить обязанности.
Масса времени ученого по данным тратится на второстепенную работу — поиск наборов данных, перенос в системы обработки, преобразование и очистку. Учитывая, насколько непросто сегодня нанять ученого по данным, эти малоценные задачи следует поручить другим.
В качестве примера можно привести разработанную в компании Uber платформу Michelangelo, которая позволяет ученым по данным заниматься не переброской данных туда-сюда, а проектированием, выделением и анализом признаков, предоставляя им возможность работать продуктивнее.
Миф № 9. Аналитикой должен заниматься специальный отдел
В некоторых организациях аналитикой занимается отдельный департамент, в других — кросс-функциональная группа специалистов.
Однако, учитывая взрывной рост накапливаемых объемов данных по всем аспектам бизнеса и современные темпы перемен, можно утверждать, что модель самостоятельного отдела уже не подходит. В эпоху, когда компании становятся более клиентоориентированными, специалисты по аналитике должны работать непосредственно в бизнес-подразделениях, а не в самостоятельном отделе, к которому обращаются как к службе поддержки.
Ключ к решению многих сложных задач, стоящих перед бизнес-подразделениями, спрятан именно в данных. Поэтому ученые по данным и другие специалисты, применяющие искусственный интеллект для обработки обширных информационных срезов в тесном сотрудничестве с бизнес-пользователями, станут важнейшим звеном в создании новых продуктов, услуг и принципов взаимодействия с клиентом.
Миф № 10. Самое сложное — технологии
В связи с постоянным ростом количества доступных технологий, выбрать правильный комплект инструментов для аналитиков сегодня не так-то просто.
Но в действительности самое сложное — выстроить организационную структуру и операционную модель, которая поможет объединить результаты работы людей, процессов и технологий. Кроме того, очень сложно создать такую структуру внутри существующего отдела ИТ или параллельно ему.
При этом важно не впадать в заблуждение относительно того, что всю работу будут выполнять аналитические инструменты. Технологии сами по себе не решают задачи бизнеса. Спеша создавать озера данных, организации нередко получают болота — информационную «трясину», в которой невозможно разобраться.
Технология не решает аналитические задачи. Вначале нужно выявить проблему бизнеса и выяснить, какие именно данные нужны для ее решения. Это поможет уточнить наличие пробелов в данных, имеющихся у вашей организации.
Миф № 11. Аналитика доступна только кандидатам наук
Большое количество аналитиков с учеными степенями — это плюс, но не обязательное условие. В компаниях нередко считают, что без кандидатов наук высококвалифицированный анализ невозможен. Однако современная аналитика требует наличия специалистов многих квалификаций, в том числе разбирающихся в современных технологиях и ПО с открытым кодом. Формирование группы, в которую входят архитекторы больших данных, инженеры, ученые по данным, специалисты по визуализации и т. д., — залог успеха.
Миф № 12. Искусственный интеллект лишит людей работы и разрушит экономику
Появляющиеся новые технологии всегда влияли на рынок труда и различные отрасли, и сегодня существуют страхи по поводу того, что искусственный интеллект сделает ряд профессий ненужными.
Искусственный интеллект действительно гораздо лучше справляется с определенными задачами: по сравнению с человеком машина быстрее читает, способна больше запомнить и может выполнять более сложные математические расчеты. Однако в новых ситуациях человек ориентируется намного лучше.
Да, некоторые профессии уже исчезают в связи с развитием искусственного интеллекта, и за ними последуют другие. Однако, в отличие от человека, существующие технологии искусственного интеллекта лишены способности осваиваться и действовать в непредвиденных ситуациях. В обозримом будущем искусственный интеллект наибольшую пользу будет приносить при решении сложных задач, дополняя человеческие возможности. Многие профессии в связи с появлением искусственного интеллекта изменятся, но люди по-прежнему будут оставаться критически важным элементом экосистемы бизнеса.
— Bob Violino. 12 myths of data analytics debunked. CIO. NOV, 2017