Конференция по Data Science! 02 ноября 2023 Участвовать →

4 способа провалить собеседование на должность Data Scientist

«Data Scientist» вполне можно считать самой сексуальной профессией века, чего не скажешь о самом процессе принятия на работу Data Scientist’а. На самом деле, для компаний это может быть невыносимым мучением. Столь же большое дело и для кандидатов сопоставить предложение работодателя с основами Data Science.  

В то время как машинное обучение – процесс сложный, то обучение человека, способного обучать машины, может быть еще более трудоемким. Такой человек проходит через разные этапы, чтобы стать продуктивным Data scientist’ом. 

Для компаний, пытающихся идентифицировать подходящих кандидатов, это похоже на поиск иглы в стоге сена. После нескольких лет найма Data Scientist’ов в Gramener, я заметил некоторые явно повторяющиеся тенденции недостатков в навыках на рынке. Несмотря на то, что есть сотни способов провалить собеседование, их можно поделить на 4 большие группы.

4 причины отказа

Учитывая, что только единицы из тысячи кандидатов будут приняты на данную должность, полезно понять, где большинство людей терпит неудачу. Любой Data scientist, будь то начинающий или тот, кто желает продвинуться по карьерной лестнице, должен обращать внимание на эти подводные камни и избегать их.

Осознание своей слабости - это уверенный и надежный первый шаг в ее устранении.

Чтобы стать по-настоящему успешным специалистом Data Science, нужен особый набор навыков. Для более наглядной иллюстрации проведем параллель со снайпером – еще одной профессией, требующей детализации и высокого уровня мастерства.  

Итак, начнем…По каким же причинам можно провалить собеседование на должность Data Scientist?

1. Оформление резюме с использованием модных словечек связанных с Machine learning

Как и с любой работой может возникнуть соблазн адаптировать свое резюме под профессиональный жаргон. Так и Data Science не лишен своего сленга. И, хотя вариант такого резюме повышает шансы при прохождении проверки специальными ботами в отделе HR, это может дать обратный эффект довольно быстро. 

Не редкость обнаружить, что передовые навыки в области аналитики, заявленные в резюме, фактически являются не более, чем базовыми знаниями таблиц Excel, SQL-запросов или аналитики Google. Даже если не брать в расчет впустую потраченное время на составление подобного резюме, такая тактика обрекает кандидата на провал.

Если спроецировать данную ситуацию на нашего воображаемого снайпера, такое действие – это все равно что надеть солдатскую форму и взять в руки пистолет без какого-либо уровня профессиональной подготовки. Как бы абсурдно ни звучало, но это совсем не шутка, когда овца охотится в костюме волка. 

2. Сокращение моделирования до вызовов библиотек

Многие кандидаты, которые утверждают, что знают все о моделировании, во многом спорят насчет вызовов функции и параметров. Даже перед тем, как спросить, что представляет собой, например, алгоритм Random Forest, наиболее важный вопрос заключается в том, почему это необходимо в первую очередь.  

Честно говоря, модель работает и с однострочным вызовом библиотеки. Но это не входит в понятие машинное обучение. Понять нужно одно: где логистическая регрессия более приемлема, чем SVM. Или, когда простая экстраполяция более действенна, чем методы прогнозирования, такие как ARIMA или Holt-Winters.

Хорошему снайперу нужно уметь делать гораздо больше, чем просто целиться и стрелять. На самом деле, стрельба – это всего 20% того, чему учат снайпера. Нужны наиболее тонкие навыки, такие как терпение, дисциплина и отличное наблюдение для оценки дальности действия цели.

3. Отсутствие фундаментальных знаний, необходимых для анализа данных

Хотя интуитивное понимание техник machine learning является большим плюсом для кандидатов, они, к несчастью, зачастую ограничиваются только этим. Инвестирование в практическое обучение для освоения более фундаментальных навыков, таких как анализ статистики и прочих данных, часто игнорируется. 

Моделирование занимает лишь небольшую часть жизненного цикла аналитики. В любом успешном ML проекте более 50% времени приходится на подготовку данных, решение спорных моментов и выбор подходящей техники. Затем 25% - на интерпретацию и рекомендацию модели.

Даже если кандидаты афишируют 90% accuracy в проектах, то, порой, это трагедия – видеть как тает на глазах их уверенность, когда они пытаются объяснить, что такое «p-value» и почему необходимы «confidence intervals» для модели. 

Твердое владение фундаментальными знаниями имеет решающее значение во всех дисциплинах, так и снайпер сначала должен быть отличным пехотинцем. Ведь какая польза от превосходной стрельбы, если стрелок не может исправить пистолет, который заклинило, в самом разгаре битвы?

4. Неумение применять аналитику для решения бизнес-задач

Очевидно, что это сложная задача, охватывающая все аспекты, рассмотренные ранее. Но до этого момента мы не говорили о главном моменте, а именно на нем с треском валятся большинство кандидатов. 

Основной миссией Data Scientist’ов является решение бизнес-задач, а не просто анализ данных или построение отличной модели. Это Святой Грааль аналитики данных. Необходимо правильно сформулировать вопросы и разработать последовательность шагов для их решения еще до загрузки данных в программу. 

При вопросе «как бизнес может решить проблему с клиентами», явно проигрышный вариант, когда кандидат торопится с идеями аналитики данных или, что еще хуже, разбрасывается названиями моделей впустую. Лучше начать исследовать, почему клиенты регистрируются, каковы их ожидания и что влияет на бизнес.

Представьте себе снайпера-эксперта, который знает это все, но не может спрятаться или замаскироваться и выбрать цель уничтожения. Такой человек действительно опасен, и его риск направлен именно вовнутрь, чем вовне. 

ПОДВЕДЕНИЕ ИТОГОВ: В ПОГОНЕ ЗА DATA SCIENCE

Таким образом, по отношению к Data Science необходимо следующее:

  • Рассмотрение бизнес-проблем через переосмысление вопросов и разработку последовательных шагов для их решения;
  • Использование фундаментальных знаний в анализе данных с целью получить представление о них и применить соответствующий аналитический подход;
  • Выбор набора аналитических методов или моделей машинного обучения, а затем разработка и интерпретация результатов для бизнес-пользователей;
  • И, наконец, правильная демонстрация этих навыков 

Что ж, удачи в исправлении указанных пробелов! Взорвите рынок вакансий аналитиков!

Источник

Поделиться записью
Вверх