Золотая лихорадка» уже началась, и никто не будет оспаривать целесообразность покупки лишнего участки земли с ручьем, где можно найти свой собственный самородок – в нашем случае ученого по данным (data scientist). Много написано о том, какими чертами должен обладать хороший специалист по данным. Но давайте лучше поговорим о плохих ученых, способных скорее навредить вашей организации, чем помочь ей.
1. Слабая математическая подготовка
Ученые по данным, за редким исключением, очень любят математику. Спектр таких специалистов достаточно широк, начиная от обладателей абсолютно математического склада ума, которые пишут на внушающем ужас языке Python (а может быть, и на R), и заканчивая людьми, разрабатывающими алгоритмы машинного обучения. Возможно, вам понадобятся оба типа. Все зависит от конкретных задач. Но ученый по данным, имеющий слабую математическую подготовку, не имеет права называть себя таковым. Быть может, ему подойдет роль архитектора или инженера баз данных, а еще вероятнее – какого-нибудь консультанта из кадрового агентства.
2. Слабая компьютерная подготовка
Ученые по данным, имеющие математическое образование, но не разбирающиеся в компьютерах, не слишком полезны. В большинстве ситуаций способы, применяемые при расчетах на бумаге, отличаются от расчетов на распределенной платформе, например на платформе Spark.
3. Слишком хорошо, чтобы быть правдой
Вряд ли вы встретите ученого по данным, хорошо знающего математику, статистику и технологии распределенных вычислений, обладающего степенью MBA и реальным опытом решения математических задач и организации распределенных вычислений, деловыми навыками и т. д. Сколько лет может быть человеку с таким послужным списком? Вот почему вам нужна команда. Помните: единорогов в природе не существует!
4. Никчемные теоретики
Подобно программистам, которые не пишут кода, и архитекторам, не обладающим реальными техническими знаниями, встречаются порой и ученые по данным, имеющие весьма ограниченный опыт работы с этими самыми данными. Более того, они не желают пачкать руки, копаясь в программном коде. Но вам ведь нужны практические приложения, а не теория.
5. Слабые коммуникационные навыки
По сути задача ученого по данным заключается в том, чтобы вносить в эти данные ясность. Будучи профессионалом в области технологий или экспертом в бизнесе, вы можете не понимать каких-то математических тонкостей и не уметь самостоятельно применять какие-то методы на практике. Но для того чтобы доверять им в процессе принятия решений, нужно иметь о них хотя бы концептуальное представление. И если речь идет об алгоритме кластеризации, расчете вероятностей или обработке естественного языка, передать суть не так уж сложно. Ученый по данным, который не в состоянии это сделать, плохо справляется со своими обязанностями. А умение четко выражать свои мысли в процессе предоставления дополнительной информации, данных или доступа к данным – а также подробностей обработки этих данных – заметно упростило бы ему жизнь.
6. Непонимание задач бизнеса
Не стоит искать человека, который будет описывать ученому по данным все задачи бизнеса в математической или статистической терминологии. Потому что если сотрудник A знает, как все это сделать, скорее всего, он обладает достаточными знаниями и для описания сформулированных задач на алгоритмическом языке, понятном компьютеру. Так зачем вам тогда сотрудник B?
7. Незнание инструментов
Существует программное обеспечение SAS. Есть R. Есть Scala. Есть Python. Есть Matlab и целая куча других инструментов. И если вы не видите всего этого перечня в резюме, скорее всего, претендент на должность ученого по данным не является тем, за кого себя выдает.
8. Синдром рамок одной технологии
Создается впечатление, что разработчики, не владеющие ничем, кроме одной из технологий, уже провозгласили себя «учеными по данным». Но это вовсе не значит, что об исследовании данных им известно хоть что-то, выходящее за рамки написания кода.
Какой человек нужен вам? Специалист, который обладает конкретными навыками решения задач и укрепит существующую технологическую команду: математик с опытом программирования и проведения анализа, пониманием бизнеса и умением разговаривать как с генеральным директором, так и с техническими специалистами. Так что не стоит гоняться за единорогами, но и брать на работу болванов тоже не следует.
– Andrew C. Oliver. 8 telltale signs of a bad data scientist. InfoWorld. Mar 3, 2016