10 сложностей с использованием Data Science на работе
Недавний опрос более 16 000 специалистов по данным показал, что наиболее распространенными проблемами в области науки о данных являются грязные данные (36%), нехватка талантов в области данных (30%) и отсутствие управленческой поддержки (27%). Кроме того, специалисты по данным сообщили, что в прошлом году было выявлено около трех проблем. Анализ 20 проблем при помощи метода главных компонент показал, что проблемы можно сгруппировать по пяти категориям.
Data science - это поиск полезных идей и использование их. Однако data science не возникает в вакууме. Осуществляя анализ, специалисты по данным могут столкнуться с различными типами проблем, которые тормозят их прогресс. В этом посте рассматриваются проблемы, с которыми сталкиваются специалисты по данным. Чтобы изучить эту проблему, я использовала данные опроса State of Data Science and Machine Learning из Kaggle 2017, в котором приняли участие более 16 000 специалистов по данным (данные опроса, собранные в августе 2017 года).
Во время опроса респондентов спрашивали: «С какими трудностями или проблемами на работе вы сталкивались в прошлом году? (Выберите все, что применимо)».
Результаты показаны на рисунке ниже, они демонстрируют, что первые 10 сложностей были:
- Грязные данные (36%)
- Отсутствие таланта в области науки о данных (30%)
- Политика компании (27%)
- Отсутствие четкого запроса (22%)
- Недоступность данных (22%)
- Результаты не были использованы лицами, принимающими решения (18%)
- Объяснение науки о данных другим (16%)
- Вопросы конфиденциальности (14%)
- Отсутствие знаний в этой области (14%)
- Из-за маленького размера организация не может позволить себе отдел Data science (13%)
