Ни за что не становись Data Scientist'ом!

Cовет, который я даю, когда кто-то спрашивает меня, как стать Data Scientist'ом. Вместо этого, лучше стань программистом.

Сейчас очень многие рвутся стать специалистами по данным. Но в то время, как data science является, возможно, самой желанной профессией 21 века, обесценивается другая не менее полезная и высокооплачиваемая специальность - программист. 

Я часто получаю сообщения от выпускников и людей, собирающихся поменять профессию, которые спрашивают меня о том, с чего начать изучение науки о данных. Вместо этого, я советую им стать программистами.

Имея опыт того и другого, я постараюсь убедить вас стать именно разработчиком программного обеспечения.

1. В области программирования больше рабочих мест

В программной инженерии на порядок больше рабочих мест по сравнению с наукой о данных.

Ниже приведено несколько снимков экрана после поиска в Google «специалист по данным» и «программист».

7616 рабочих мест в data science по сравнению с 53 8893 рабочими местами в программировании. Это рабочие места в США, но другие страны показали аналогичные результаты.

Согласно Glassdoor, специалисты по данным зарабатывают больше, но моя гипотеза также гласит, что работа в data science требует и больше знаний.

www.glassdoor.ca

www.glassdoor.ca

Тем не менее, если вам предложат зарплату 1 млн долларов в области искусственного интеллекта - соглашайтесь!)

2. Нет единого мнения, что означает "Data Science"

У руководства часто нет единого мнения о том, что означает наука о данных. Также опыт показывает, что, учитывая ограничения в бизнесе, у них нет возможности строго следовать структуре распределения ролей. 

Это означает, что обязанности «data scientist'а» в разных компаниях сильно различаются. 

Хотя идеальный спектр должностей между программистом и специалистом по данным может существовать, маловероятно, что он будет реализован на самом деле. Это особенно касается стартапов, создающих основу инфраструктуры. 

Наемные кандидаты в конечном итоге работают над проблемами, которые на самом деле необходимо решать силами компании, а не силами сотрудника, который только что был принят на должность data scientist. 

Один из смешных случаев среди коллег в данной области заключался в том, что многие специалисты по данным писали бэкэнд-код, как разработчики программного обеспечения. Я знаю и других data scientist'ов, которые сидели в Excel и ломали головы над финансовыми вопросами.

Это резко контрастирует с тем, что вы ожидаете, если вы выросли на соревнованиях Kaggle.

3. Изолированность Data Science

Большинству компаний не нужно столько специалистов по данным, сколько программистов. Другие компании только еще нанимают своего первого data scientist'а прямо сейчас.

По этой причине многие специалисты по данным работают в одиночку, даже если они сидят за одним столом с разработчиками.

Тут возникают сложности с получением обратной связи и мнения со стороны. Программисты либо не разбираются в прогнозном моделировании, либо слишком заняты работой над совершенно другими проблемами. 

Напротив, одним из преимуществ наличия целой команды разработчиков является возможность сказать коллегам: «Я думаю, что мы должны внедрить ABC в XYZ. Что вы думаете на этот счет?"

Будьте готовы поговорить с самим собой ... или с резиновой уткой (прим.пер. Метод тестирования ПО).

4. Data Science - это исследование

Будьте готовы к неловким разговорам с руководством о том, почему то, на что вы потратили 2 недели, не может быть использовано.

Работа над решенными и нерешенными проблемами - одно из фундаментальных отличий между разработкой программного обеспечения и ИИ.

Помимо ошибок и ограничений, вы уже знаете, возможно ли реализовать большинство проектов по разработке программного обеспечения еще до начала самой работы. Чего нельзя сказать о ML, когда вы не знаете, будет ли модель эффективной до тех пор, пока вы ее не построите.

5. Компании не готовы к AI

Даже в эпоху, когда каждая компания внедрила искусственный интеллект, у большинства из них нет инфраструктуры для ее поддержки. 

Глава Data Science за чашечкой кофе недавно поделился советами для быстро растущего стартапа:

Сначала вы определяете проблему, затем создаете инфраструктуру и только потом привлекаете специалистов по данным. Это не быстрый процесс. 

Еще один крупный специалист по Data Science в известной компании недавно высказался мне. Она была вынуждена обучать модели искусственного интеллекта на больших данных на своем ноутбуке, а не в облаке.

Если перед компанией не стоит специфичная проблема, которая решается только силами Data Science, или инфраструктура компании не подготовлена к решению таких вопросов, то вы, скорее всего, столкнетесь с трудностями, доказывая свою значимость, как специалиста.

6. Программирование учит общим навыкам

Стать младшим инженером-программистом - все равно, что получить степень MBA в области технологий. Вы узнаете всего понемногу.

Вы изучите базы данных, облачные технологии, развертывание, безопасность и написание чистого кода.

Вы научитесь создавать программное обеспечение, наблюдая за лидером отдела, старшим разработчиком или руководителем проекта.

Вы получите наставничество через обзоры кода.

Если вы окажетесь в компании с устоявшейся командой разработчиков, почти гарантировано, что вы быстро улучшите свои навыки и обретете колоссальный опыт.

7. Программная инженерия более передаваема

Предоставляя более комплексный опыт в области технологии, разработка программного обеспечения дает лучшие возможности выхода, когда вы решили, что пришло время перемен. 

DevOps, безопасность, интерфейс, бэкэнд, распределенные системы, бизнес-аналитика, инженерия данных, наука о данных…

Я знаю ряд разработчиков, которые перешли от программирования к науке о данных. Если вы пробежитесь глазами по требованиям к специалисту в Data Science, то сразу заметите там массу требуемых навыков программиста:

  • Опыт работы с SQL и Python, R или SAS;
  • Знание AWS;
  • Знание Linux;
  • Знание экспериментального дизайна для бизнес-экспериментов;
  • Знание систем DevOps, таких как GitLab;

Если вы можете создавать сквозные проекты, то вы также можете сделать как минимум модель для Kaggle. Вы можете взять эту модель, произвести ее, настроить авторизацию и Stripe, а затем начать взимать плату с пользователей за доступ. Это ваш собственный стартап.

Я бы никогда не стал утверждать, что наука о данных не подлежит передаче. Принятие решений на основе данных является по истине убойным навыком. Но это также становится чем-то большим, чем когда-либо, поскольку мы все больше ориентируемся на данные.

8. Машинное обучение станет инструментом для разработчиков программного обеспечения

По мере того, как ИИ становится удобнее и проще в использовании, разработчики программного обеспечения начинают использовать его для решения своих задач. 

Я могу научить разработчика создавать классификаторы Sklearn. Это не значит, что он сможет построить следующий Alphago, но это дает ему альтернативу жестко запрограммированной условной логике, основанной на пользовательском вводе.

Data scientist'ы имеют специальные знания, такие как статистика и интуиция, о том, как работают модели. Но инженеры DevOps и Security также имеют свои специальные знания.

Я бы сказал, что они больше общие, чем разные. Опытный специалист по программному обеспечению может очень быстро перемещаться между специальностями.

Хотя я не думаю, что мы увидим полное слияние науки о данных с разработкой программного обеспечения, но похоже, что наука о данных может стать еще одной специальностью программирования.

9. AI не заменит программистов

Как бы глупо это ни звучало, я занялся разработкой программного обеспечения в 2014 году, потому что боялся, что ИИ изживет любую другую профессию. 

Но дело в том, что внедрение технологий происходит медленно, а ИИ намного Уже, чем вы можете себе представить. 

По сравнению с другими профессиями, машинное обучение очень далеко от автоматизации разработки программного обеспечения. Хотя у нас есть стартапы, создающие классные продукты, такие как автозавершение кода с поддержкой AI , написание кода - не специальность. Суть профессии все же заключается в решении задач с использованием технологий. А это то, что останется ценным и высокооплачиваемым навыком.

Заключение

Во-первых, это слегка нелепо. Во-вторых, я понимаю, что я объединил специалистов по данным, инженеров ML и исследователей ИИ. Но я думаю, что эти аргументы все же стоит рассмотреть, учитывая, что это ваша карьера.

Не воспринимайте это слишком серьезно. Я бы предпочел, чтобы вы прочли это и приняли собственное решение. Это часть того, чтобы стать data scientist'ом в конечном итоге :)

В конце концов, нам платят за решение проблем.

Источник

 

 

Поделиться записью
Вверх