4 способа решить проблемы внедрения Machine Learning в стартапы

Machine Learning — лучший метод анализа данных. К тому же, он автоматизирует создание аналитических бизнес-моделей. Именно поэтому машинное обучение играет столь важную роль в развитии бизнеса. А значит, вполне возможно, что и вашему бизнесу потребуются новые идеи для внедрения решений Machine Learning. Однако c реализацией методов машинного обучения могут возникнуть проблемы.

Чтобы выявить проблемы применения машинного обучения, компаниям необходимо полностью понимать механизмы работы ML и знать о последних разработках.

Я перечислю проблемы, с которыми сталкиваются стартапы при внедрении методов Machine Learning, и опишу способы их решения.

1. Проблемы с развертыванием модели (Model Deployment)

Для выявления проблем развертывания модели при внедрении методов ML, компаниям необходимы отраслевые эксперты, которые хорошо разбираются в последних технологиях AI/ML. Или же нанять разработчиков Machine Learning, чтобы решить проблему несовместимости модели машинного обучения и бизнес-процесса, которая непосредственно влияет на развертывание систем ML.

Модели машинного обучения обычно создаются с использованием таких языков, как Java, C, Python, R и SQL. Например, много улучшений произошло в способности Facebook распознавать лица или Amazon Alexa понимать конкретные голосовые команды. В частности, коммерческие компании должны убедиться, что они могут ответить на следующие вопросы:

Какую модель ML необходимо обновить в вашем профиле бизнеса?

Какой шаблон использования данных применим в вашем бизнесе?

Каковы правильные алгоритмы разработки для вашей модели Machine Learning?

Для успешного введения Machine Learning предприятия должны иметь верное понимание потоков данных, алгоритмов и того, как их можно применять к различным процессам. Компаниям, производящим машины и оборудование, Machine Learning обеспечивает платформу для прогнозирования активных мер и возможных сбоев в производственном отделе. Для обеспечения нормального рабочего состояния должен соблюдаться точный алгоритм.

2. Этические проблемы в Machine Learning

Этические проблемы в машинном обучении включают вопросы, связанные с использованием данных.
В программах Machine Learning встречались некоторые случаи расовых предубеждений, которые также неумышленно влияют на внедрение технологий ML.

Вот пример:

Точно так же, разговаривая с сотрудником службы поддержки, людям нелегко понять, разговаривают ли они с человеком или машиной. Уже это делает технологию ML сложной для реализации.

Известный случай с расизмом произошел два года назад, когда программное обеспечение Google для распознавания лиц неправильно маркировало двух афроамериканских ребят и классифицировало подростков как горилл.

Google пришлось столкнуться с большой критикой, а люди начали задаваться вопросом, возможно ли обучить искусственный интеллект быть сознательно расистским. Реальная причина неправильной классификации не в расизме, а в фактической ошибке в обучающем наборе системы.

Разработчики должны принимать более прозрачные решения в ML, когда речь идет об этике и характере поведения пользователей. Ваша техническая команда должна собрать достаточное количество данных в отношении этических принципов для надлежащей подготовки приложений Machine Learning. Это важно, так как разные ситуации нуждаются в разных этических подходах, и система должна быть разработана в соответствии с их целями и действиями, чтобы технологии разработки ML были полезны и давали новые возможнотси как можно большему числу людей.

3. Проблемы, связанные со сбором и хранением данных

Сбор и хранение данных — действительно большая проблема в применении ML. Взять хотя бы пример с проектом в области здравоохранения, который был направлен на сокращение расходов на лечение пациентов с пневмонией. То есть они интегрировали машинное обучение для сортировки записей пациентов, чтобы определить, у кого высокий риск заражения и поэтому они должны находиться в больнице, а для кого вероятность заражения пневмонией мала.

Тем не менее, они не могут получить нужную информацию из записей данных, а значит, машинное обучение будет не так полезно или, возможно даже, вовсе бесполезно для них. Итак, как правильно решать такие проблемы?

Это правда, что с необходимостью создания корректного механизма сбора данных, возможно, будет справиться сложнее всего. Пользователи обращаются к ML для предсказательной аналитики (predictive analytics), и первое, что необходимо делать — бороться с фрагментацией данных.

Например, в сфере туризма фрагментация данных является одной из главных проблем. В данном случае отель знает данные кредитных карт гостей, домашние адреса, контактные телефоны и другие детали. Эти данные передаются в различные отделы отеля. В итоге команда отеля не всегда может собрать воедино все потоки данных.

Ну, и это может стать проблемой для гостей. Большой объем данных и пропущенные значения в данных могут снизить точность прогнозирования, а это неприемлемо. Благодаря Machine Learning приблизительные и прогнозируемые значения, которые им предоставяются, считаются «более точными» для программного алгоритма.

Описанные здесь пункты кажутся простыми и понятными. Тем не менее, вам все еще нужен эксперт по Machine Learning, если вам необходимо разработать методику сбора и хранения данных, полностью настроить инфраструктуру и найти сложные задачи Machine Learning.

4. Проблемы, связанные с затратами

Умные компании осознают возможность полагаться на решения, основанные на данных, в своей деятельности. А много данных требуют много места для хранения. Итак, как это все может стать полезным и сколько это стоит? Во многих случаях анализ стоимости вариантов необходим для принятия обоснованного решения.

Давайте разберем шаги, необходимые для разработки пользовательской модели Machine Learning, и то, как стоимость может изменяться для каждого шага.

Требования: Фаза требований посвящена пониманию того, что из модели нужно вашему бизнесу. Мы рекомендуем вам иметь четкие представления о том, чего вы хотите для своего бизнеса, потому что расплывчатая идея может стоить вам больших трат.

Данные: Можете рассматривать данные как опыт, в котором нуждается ваша бизнес-модель. Чем больше опыта хорошего качества вы дадите бизнес-модели, тем лучше она научится решать наши задачи. Стоимость этого процесса может быть нулевой, если ваши данные готовы для модели, в противном случае это потребует некоторых затрат. А если мы говорим о больших наборах данных, управляемых с помощью кластера, стоимость может исчисляться тысячами.

Модель: всегда важно оценить вашу бизнес-модель, чтобы эффективно измерить затраты. Также потребуется несколько дней, чтобы оценить и выбрать алгоритм, обучить бизнес-модель, протестировать ее и внедрить. Это основная часть вашего бизнес-процесса, и определить его стоимость действительно непросто.

Производство: Как только ваш алгоритм протестирован и готов к производству, необходимо выполнить два основных действия:

Интеграция с существующей структурой бизнеса.
Обновление бизнес-модели, для которого может потребоваться изучение новых данных или внедрение новых функций.

И то, и другое необязательно для вашего бизнеса, поэтому здесь стоимость тоже может колебаться от нуля до нескольких тысяч долларов.

Таким образом, алгоритм ML и работа по разработке Deep Learning — основные факторы, на которые следует обратить внимание. Производительность действительно зависит от бизнес-целей клиента и стоимости прогнозирования данных. Проектам Machine Learning нужно время, чтобы достигнуть лучших результатов.
Даже если вам повезет, и ваш алгоритм ML сразу же совпадет с тестами производительности, шансы того, что ваша программа будет работать эффективно или потерпит полный провал, равны.

Следовательно, беспрерывный мониторинг может только защитить вашу модель ML от снижения эффективности, но со временем ситуация улучшится. Кроме того, при определении показателей вашего бизнеса, планирование технической архитектуры на самой ранней стадии определяет успех или неудачу вашей авантюры с ML.

Итоги

Надеюсь, получилось действительно глубокое погружение в мир внедрения ML в бизнес-стартапы. Принципиальный момент заключается в сведении в минимуму проблем и создании как можно большего количества преимуществ за счет разработки ML, которые дадут вашему бизнесу все ключевые возможности Machine Learning.

Источник