10 сложностей с использованием Data Science на работе

Недавний опрос более 16 000 специалистов по данным показал, что наиболее распространенными проблемами в области науки о данных являются грязные данные (36%), нехватка талантов в области данных (30%) и отсутствие управленческой поддержки (27%). Кроме того, специалисты по данным сообщили, что в прошлом году было выявлено около трех проблем. Анализ 20 проблем при помощи метода главных компонент показал, что проблемы можно сгруппировать по пяти категориям.

Data science - это поиск полезных идей и использование их. Однако data science не возникает в вакууме. Осуществляя анализ, специалисты по данным могут столкнуться с различными типами проблем, которые тормозят их прогресс. В этом посте рассматриваются проблемы, с которыми сталкиваются специалисты по данным. Чтобы изучить эту проблему, я использовала данные опроса State of Data Science and Machine Learning из Kaggle 2017, в котором приняли участие более 16 000 специалистов по данным (данные опроса, собранные в августе 2017 года).

Во время опроса респондентов спрашивали: «С какими трудностями или проблемами на работе вы сталкивались в прошлом году? (Выберите все, что применимо)»

Результаты показаны на рисунке ниже, они демонстрируют, что первые 10 сложностей были:

  • Грязные данные (36%)
  • Отсутствие таланта в области науки о данных (30%)
  • Политика компании (27%)
  • Отсутствие четкого запроса (22%)
  • Недоступность данных (22%)
  • Результаты не были использованы лицами, принимающими решения (18%)
  • Объяснение науки о данных другим (16%)
  • Вопросы конфиденциальности (14%)
  • Отсутствие знаний в этой области (14%)
  • Из-за маленького размера организация не может позволить себе отдел Data science (13%)


Результаты показали, что в среднем специалисты по данным сообщают о трех (в среднем) проблемах, испытанных в предыдущем году. Количество заданных проблем значительно варьировалось в зависимости от названия работы. Специалисты по данным, представившиеся как Data Scientist или Predictive Modeler, оставляли сообщения о четырех сложностях. Программисты в Data Science, сообщали только об одной проблеме.

Источник: www.datasciencecentral.com
Поделиться записью
Вверх