Конференция по Data Science! 02 ноября 2023 Участвовать →

Как собрать портфолио по Data Science? Часть II

Важность социальных медиа

Этот раздел не менее важен, чем раздел Портфолио, отличие в том, что он разделен на подразделы. Наличие профилей на Github, Kaggle, Stack Overflow, и т.д. может улучшить ваше резюме. Хорошим сигналом для менеджеров могут послужить полностью заполненные анкеты в соцсетях.  

По словам Дэвида Робинсона:

Обычно, при оценке кандидата меня очень радует, когда я вижу то, чем они делятся в сети, даже если их проекты далеки от совершенства. Показывать хоть какие-то работы лучше, чем не показывать ничего. 
Уилл Стэнтон приводит причины, по которой Data scientists любят видеть работы в открытом доступе: 
Data scientists используют эти инструменты чтобы делиться собственными работами и находить ответы на волнующие их вопросы. Если вы пользуетесь теми же интсрументами, вы показываете Data scientists, что вы — один из них, даже если вы еще не работали на этой должности.

Data Science — это, в том числе, общение и показ данных, так что весьма неплохо иметь профили в этих соцсетях. Помимо того, что данные платформы помогают учиться, они еще помогают привлечь внимание к себе и своему резюме. Кто-нибудь может найти вас на различных ресурсах (LinkedIn, GitHub, Twitter, Kaggle, Medium, Stack Overflow, Tableau Public, Quora, Youtube, и т.д.). Может даже оказаться, что профиль в одной сети приводит к профилю в другой. 

Github


Профиль Github это очень сильный показатель того, что вы — компетентный data scientist. В разделе резюме “Проекты” многие проставляют ссылку на свой Github, где хранится код проектов. Кромет того, там могут храниться описания проектов и markdown’ы. Github позволяет увидеть, что вы именно делали и как вы это делали. В некоторых компаниях HR  менеджеры просматривают Github кандидатов. Это один из способов показать, что вы — не пустышка. Если приложить усилия и прокачать свой профиль, то он даст вам преимущество перед другими кандидатам.  Нужно упомянуть, что ваш проект должен содержать что-то типа файла README.md с описанием проекта, поскольку Data Science подразумевает, что вы делитесь результатами исследований. Удостоверьтесь, что README.md четко описывает проект, его функционирование и процедура запуска кода. 

Kaggle

Участие в Kaggle, создание ядра и участие в дискуссиях — это все способы показать свою компетенцию как data scientist. Важно упомянуть, что Kaggle не похож на коммерческие проекты, об этом говорит Коллин Фаррелли, в своем ответе на Quora. Kaggle предоставляет задание, добывает вам данные и делает их пригодными к работе. Вам дается шанс поупражняться в анализе данных и создании модели. Решама Шайх написала пост  To Kaggle Or Not, в котором она обсудила важность соревнования Kaggle. Из ее поста:

И вправду, участие в одном соревновании Kaggle не делает из вас data scientist. Так же, как не делает им посещение одного урока или конференции или анализ одного набора данных или чтение одной книги по Data Science. Участие в соревнованиях прибавляет вам опыта и улучшает портфолио. Это дополнение к другим вашим проектом, а не уникальная лакмусовая бумажка для ваших навыков Data Science. 

Кроме того, даже Kaggle Grandmasters имеют определенные причины продолжать участвовать в соревнованиях Kaggle.

Linkedin

В отличие от резюме, ограниченного по объему, анкета на LinkedIn позволяет вам описать ваши проекты и рабочий опыт более развернуто. Udacity представило пособие по созданию хорошей анкеты на LinkedIn. Важная часть LinkedIn — это его поисковый движок. Вам нужно указать ключевые слова для того, движок начал вас отображать. LinkedIn позволяет увидеть, какие компании искали вас и кто просматривал вашу анкету. 


LinkedIn не только позволяет компаниям найти вас и осведомиться о вашей доступности, он также дает возможность попросить о рекомендации. Джейсон Гудмэн в своей статье Advice on Applying to Data Science Jobs советует использовать LinkedIn  для публикации просьбы о рекомендациях.

Я вообще никогда не отправлял резюме ни в одну компанию, не заведя знакомства с кем-нибудь оттуда … когда у меня появлялся интерес к какой-нибудь компании, я искал знакомых, знакомых знакомых или знакомых знакомых знакомых из этой компании. Тогда я писал этим людям  и просил рассказать об их работе в компании и спрашивал, могут ли они свести меня с кем нибудь из отдела Data Science. Если это было возможно, я старался встретиться вживую (на кофе или ланч) вместо того,чтобы звонить по телефону.  Кстати, Трей Кози написал отличный пост о том как просить о подобного рода встречах. Я лично никогда не спрашивал о работе напрямую, это они просили меня показать резюме и предлагали дать свою рекомендацию, или предлагали познакомить меня c HR менеджером. Если они этого не делали… Я просто благодарил их за то, что уделили мне время и продолжал дальше.  

Заметьте, что он никогда напрямую не спрашивал о рекомендации. В то время как очень часто советуют при приеме на работу обзавестись рекомендация, все равно ОЧЕНЬ ВАЖНО помнить, что вам все еще будет нужно портфолио, опыт и какое-то доказательство вашей пригодности к работе. Джейсон отмечает важность портфолио в этой и в  других своих статьях.

Аман Далмиа пришел к подобным выводам в статье Interviewing at Multiple AI Companies and Startups.

Работа в соцсетях это НЕ написание бесконечных сообщений с просьбами о рекомендации. Когда я начинал, я часто совершал эту ошибку,пока не наткнулся на эту прекрасную статью Марка Мелуна, в которой говорит о том, что важно строить настоящие отношения с людьми, сначала предлагая им свою помощь. Кроме того он замечает, что LinkedIn  хорошо подходит для того чтобы публиковать ваш контент или портфолио. 
Другой важный аспект работы в соцсетях — это публикация контента. 
Например, если вам хорошо что-то удается, напишите об этом в блог и поделитесь этим блогом на Facebook или LinkedIn. Это не только помогает вам, но и другим. 

Medium и блоги

Вести блог весьма полезно. Data Science — это коммуникация и презентация данных. Блоггинг помогает делать это и показывать, что вы умеете это делать. Описание проекта или темы из Data SCience позволяет вам делиться работой с сообществом, а также стимулирует вас письменно выражать свои мысли и структуру исследования. А это может быть весьма полезно во время собеседования. 

Как сказал Дэвид Робинсон:

Блог — это шанс тренировать следующие важные навыки. 

Очистка данных: Одно из преимуществ работы с разноообразными наборами данных заключается в том, что вы учитесь работать с данным как они есть, даже если данные приведены в форме файла, сопровождающего научную статью или киносценария.

Статистика: работа с незнакомыми наборами данным позволяет практиковать статистические методы, и написать пост, который передает и объясняет концепты , помогает улучшить собственные знания. 

Машинное обучение: Существует большая разница между использованием предикативного алгоритма один раз, и его использованием на большом количестве проблем, с четким пониманием, почему вы используете именно его.

Визуализация: Осознание того, что кто-то увидит ваши графики заставляет лучше над ними работать и вырабатывать индивидуальный стиль.  

Коммуникация: Вы практикуете свой навык письменной речи и улучшаете изложение мыслей, подкрепленных данными. Это, наверно, самый важный навык, поскольку его сложно практиковать где-либо еще, а он является важной частью любой карьеры в Data Science. 

Ведя блог, вы практикуетесь в изложение своих открытий другим. Кроме того, это способ себя прорекламировать. Блоги об использовании Scrapy для создания своего набора данных (Using Scrapy to Build your Own Dataset) и ироничный блог “Работа в  среде Python вместе с Кондой” (Python Environment Management with Conda) научили меня многому и дали мне возможности, которых я иначе не получил бы. 

Весьма полезны комментарии к постам:  после критики в блоге и указаний на возможные улучшения, ты уже готов к подобным комментариям во время интервью.  Более очевидный бонус ведения блога заключается в том, что в результате ты читаешь больше постов о Data Sience  и машинному обучение и больше учишься сам. 

Что касается платформы для блогов, я рекомендую Medium. 

Манали Шинде в своем посте How to Construct a Data Science Portfolio from Scratch хорошо объясняет, почему она выбрала Medium в качестве платформы для блога. 

Я планировала мой собственный сайт на платформе вроде WordPress или Squarespace. Хотя эти сайты отлично подходят для создания портфолио, мне нужно было место, где меня могли бы лучше заметить. Мне нужно была хорошая система тэгов, которая позволила бы достичь большей аудитории. К счастью, Medium, как мы знаем, обладает этими возможностями (а еще он бесплатный). 

Если непонятно, о чем именно писать, советую обратить внимание на совет Дэвида Робинсона.


Twitter

Активность в Twitter — это отличный способ найти и подружиться с людьми в своей области. Кроме того, в твиттере можно продвигать свое портфолио так, что оно станет более заметным. В твиттере много разных возможностей взаимодействовать с людьми. Как сказала Решама Шайх в ее широко известном посте “How Do I Get My First Data Science Job?”:

Дэвид Робинсон щедро предлагает ретвитнуть твой первый пост о Data Science. Учитывая его 20K+ подписчиков, от такого предложения нельзя отказаться.

В твиттере можно не только продвигать себя. Data Science Renee написала пост “How to use Twitter to Learn Data Science (or Anything)” который показывает, как можно использовать твиттер для развития своих навыков. Еще ее говорит о том, что присутствие в твиттере помогло ей построить собственную социальную сеть и добиться новых возможностей. 

Меня неоднократно просили об интервью в подкастах и блогах (некоторые из них скоро выйдут), предлагали контракты и предлагали бесплатное участие в конференциях, в которых я не могла участвовать, хоть и очень сильно хотела бы. “Знаменитости” из нашей отрасли часто обращаются ко мне с предложением работать вместе. 

Tableau Public

Далеко не всякая должность в Data Science требует использования Tableau и других инструментов Business Intelligence. Тем не менее, если вы откликаетесь на вакансию, где эти инструменты используются, то нужно помнить, что на некоторых из этих сайтов можно настроить общественно доступный профиль. Например, если вы говорите, что вы изучаете или уже знаете Tableau, выставить пару панелей на Tableau Public. Хотя многие компании не против того, чтобы вы изучили Tableau уже во время работы, видимые проявления ваших знаний Tableau могут быть полезны. Если вам нужны хорошие примеры профилей Tableau Public, обратите внимание на  Орысю Стусь и Брит Кава.


Заключение


Долгое время хорошее резюме было для соискателей главным способом продемонстрировать свои навыки потенциальным работодателям. В наше время, есть другие методы показать свои навыки и получить работу. Общественно значимое портфолио дает возможности, которые в обычных условиях недоступны. Важно напомнить, что портфолио — это итеративный процесс. Портфолио должно обновляться с ростом ваших знаний. Никогда не прекращайте учиться и развиваться. Даже этот пост будет обновляться по результатам комментариев.  Если нужны интервью с советами/наставлениями, самое время посмотреть на советы Брэндона Рорера по выживанию на Data Scince собеседовании, гайд Садата по собеседованиям или советы Springboard. Если у вас есть какие-то вопросы по этому тексту, пожалуйста, пишите комментарии внизу или через Twitter.

Оригинал статьи: towardsdatascience.com


Поделиться записью
Вверх