30 июня 2020
NEURAL NETWORK / MACHINE LEARNING / BIG DATA
зарегистрироваться программаВнедрение передовых технологий – это ключ к стабильному росту, повышению прибыли и отрыву от конкурентов
Активное взаимодействие, нетворкинг и получение полезных контактов в удобном формате
Наш курс обработки и анализа данных поможет работе с BigData, рассказывая о максимально подходящих и действенных методиках
Поможем выбрать техническую специализацию, сэкономить время и набраться вдохновения для исследования новых задач
Senior DS в Mechanica.ai
Agile Coach, ScrumTrek
Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор
Cтарший специалист по ML Lamoda
ML and CV Developer в Trafficdata
Expert Data Scientist в MTS Big Data Department
Head of Risks, Macro and Research в X5 Retail Group
Директор по инновациям в ПАО АК БАРС Банк
Senior machine learning engineer ВКонтакте
Руководитель группы исследований и разработки в Центре Исследования Больших Данных
Senior Research Scientist в Noah’s Ark Lab
Консультант по Data Science. Спикер ведущих конференций по маркетингу, аналитике и Data Science
Head of unstructured data analysis в Yandex.Taxi
Директор Центра Искусственного Интеллекта Samsung в Москве
Разработчик CatBoost в Яндекс
11:00-11:45
Senior DS в Mechanica.ai
Разработка кастомных сервисных решений для похожих задач приводит к появлению "зоопарка" различных сервисов, который трудно поддерживать, обновлять и передавать из одних рук в другие. Установка таких решений on-premises в промышленности приносит дополнительные сложности - своя инфраструктура у каждого заказчика, ограниченный доступ в интернет. Мы расскажем, как для решения этой задачи мы разработали шаблонное решение на основе Kubernetes, включающее в себя корректную обработку входных запросов, модели машинного обучения, логирование и мониторинг.
11:45-12:00
12:00-12:45
ML and CV Developer в Trafficdata
Зачастую мы ограничены в используемых ресурсах на продакшене - это могут быть мобильные устройства или GPU из низшего ценового сегмента. А для решения задач часто берутся предобученные state-of-the-art архитектуры избыточного размера. Как итог, перед нами встает задача уменьшения и ускорения сверточных сетей. В докладе расскажу, какими методами можно уменьшить и ускорить глубокие сверточные сети. Разберем на примере 3-х кратного ускорения YOLOv3 в задаче детектирования автомобилей.
12:45-13:00
13:00-13:45
Senior machine learning engineer ВКонтакте
После проведения А/Б теста возникает вопрос об оценке статистической значимости различий в тестовых группах. Для этого используются статистические тесты, коих существует достаточно большое количество. Не всегда очевидно, стоит ли использовать t-тест Стьюдента или же критерий Манна-Уинтни, или оценивать значимость при помощи бутстрапа, дельта-метода, линеаризации и так далее. Я расскажу о том, как оценить применимость того или иного статистического теста к вашей задаче и как выбрать тот тест, который покажет самую высокую мощность на ваших данных.
13:45-14:00
14:00-14:45
Cтарший специалист по ML Lamoda
Большое число компаний движутся в сторону Data Driven, но порой цена и сложность некоторых BI инструментов являются загродительным барьером. В докладе будет представлено сравнение самых популярных open-source BI инструментов: superset, metabase, redash Подробнее поговорим про superset, а также как построить дашборд из jupyter notebook-а
14:45-15:00
15:00-15:45
Руководитель группы исследований и разработки в Центре Исследования Больших Данных
В 2018 появилась модель BERT(Transformer), которая перевернула NLP-игру. Оказалось, что принятые ранее за SOTA рекуррентные нейронные сети(RNN: LSTM, GRU) уступают по качественным характеристикам новой архитектуре "трансформер" почти во всех прикладных задачах.
Однако BERT имеет ряд недостатков. В основном это сложность вычислений предсказаний модели и ограничения на входную последовательность. Кроме того, тот самый первый BERT был не оптималено построен. Оказалось, на той же архитектуре можно решать задачи лучше.
Уже почти 2 года исследователи проверяют на прочность архитектуру трансформеров и придумывают что-то новое.
На докладе будет короткий обзор изначальной реализации трансформеров BERT, найдём его недостатки.
БОльшую часть времени посвятим результатам работы исследователей за прошедшие 2 года: улучшения, модификации, вариации.
В конце будет ответ на вопрос "что использовать для моей задачи?"
15:45-16:00
16:00-16:45
Senior Research Scientist в Noah’s Ark Lab
В своем докладе я расскажу о современных тенденциях и последних достижениях в области обработки естественного языка, в том числе про GPT-3 и другие большие модели
16:45-17:00
17:00-17:45
Директор Центра Искусственного Интеллекта Samsung в Москве
Персонализированные аватары -- ключевой элемент новых систем телеприсутствия. Использование нейросетей в процессе рендеринга (рисования) аватаров позволяет существенно увеличить их реалистичность и точность персонализации. В докладе я расскажу про новые подходы к созданию нейросетевых аватаров, разработанные в лаборатории VIOLET (Vision-Learning-Telepresence) Центра Искусственного Интеллекта Самсунг в последние полтора года. Будут рассмотрены как задача создания аватаров головы человека, так и создание аватаров всего тела.
17:45-18:00
18:00-18:45
Разработчик CatBoost в Яндекс
CatBoost - библиотека градиентного бустинга, созданная в Яндексе.
Одной из особенностей библиотеки является наличие набора ранжирующих режимов, показывающих state of the art на публичных и внутренних для Яндекса датасетах. Ранжирующие режимы CatBoost используются для ранжирования поисковой выдачи, в рекомендательных системах, в диалоговом ассистенте и во многих других проектах Яндекса.
В этом докладе мы расскажем о том, какие существуют ранжирующие режимы в катбусте, и как ими пользоваться.
18:45-19:00
11:00-11:45
Head of unstructured data analysis в Yandex.Taxi
Помимо постоянного увеличения выручки и продаж, бизнесу критически важно выполнять свою основную функцию — приносить прибыль.
Во многих компаниях до сих пор существуют ручные или полуручные процессы, в рамках которых большое количество людей выполняют однотипную работу: разбирают обращения пользователей, проверяют документы, обзванивают клиентов, отсматривают записи с камер.
Все это стоит бизнесу немалых денег и плачевно сказывается на финансовых показателях.
В докладе на примере успешных кейсов Яндекс Такси подробно обсудим, как подступиться к автоматизации людского труда, оценим, сколько времени и усилий уйдет на реализацию такой инициативы, разберем, как выстроить процесс и кто для этого нужен, и наконец поймем, как оценивать и контролировать полученную автоматизацию, чтобы не сломать сервис.
11:45-12:00
12:00-12:45
Expert Data Scientist в MTS Big Data Department
Что делать, если у вас маленькая выборка? Что делать, если ваша основная метрика - деньги? Как провести A/B тест на регионах? В своем докладе я попытаюсь ответить на эти вопросы и расскажу об особенностях проведения A/B тестов на малых выборках в компаниях.
12:45-13:00
13:00-13:45
Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор
Для многих компаний запуск AI-решений — лотерея: им сложно определить, будет ли проект прибыльным, и контролировать риски по ходу проекта. В случае неудачи бизнес теряет миллионы рублей. В докладе мы обсудим основные инструменты для распознавания перспективного проекта на ранних этапах, контроля бизнес-рисков и управления проектом.
13:45-14:00
14:00-14:45
Agile Coach, ScrumTrek
Канбан - современный подход к управлению, прекрасно подходит для управления DS проектами. На докладе мы поговорим, как должна выглядеть канбан-доска, как планировать проекты, предсказывать сроки выполнения, измерять эффективность команд и взаимодействовать с заказчиком.
14:45-15:00
15:00-15:45
Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор
Ключевыми задачами в потребительских бизнесах (ритейл, FMCG, QSR и др.) являются ценообразование, планирование закупок, ассортимента, логистики, в основе которых лежат модели прогнозирования спроса на товары. На докладе мы обсудим, в каких бизнес-процессах нужен прогноз спроса, как работает машинное обучение для предсказания спроса, как делать модели интерпретируемыми для бизнес-пользователя, оценить эффект от внедрения и организовать рабочий процесс Data Science команды.
15:45-16:00
16:00-16:45
Директор по инновациям в ПАО АК БАРС Банк
В своем докладе я расскажу о том, с какими трудностями можно столкнуться при выстраивании первых шагов по выращиванию компетенций DS/ML в командах, где подобные подходы ранее отсутствовали. Поговорим о мотивации корпоративных стейкхолдеров к применению data-driven подходов в своей деятельности. Как мы пришли к необходимости фиксирования стратегии развития AI/ML и как она связана с общей стратегией бизнеса.
16:45-17:00
17:00-17:45
Head of Risks, Macro and Research в X5 Retail Group
Сегодня многие крупные компании выбирают путь цифровой трансформации, который обещает быстрый и ошеломительный успех. Но на любом пути встречаются трудности и подводные камни – по различным оценкам, около 94% проектов в области цифровизации не приносят результата. Поговорим о том, что ожидания от измерения эффективности проектов с помощью А/Б тестирования не совпадают с реальностью, что не любой проект вообще можно реализовать, а также о том, как выстроить систему валидации цифровых проектов и ограничить неэффективные расходы компании на проекты цифровой трансформации.
17:45-18:00
18:00-18:45
Консультант по Data Science. Спикер ведущих конференций по маркетингу, аналитике и Data Science
Мы поговорим о том, как Data Science влияет на различные, в том числе традиционные, индустрии. Почему с помощью Data Science сегодня можно дисраптить (уничтожать) традиционные модели бизнеса. Как цифровая трансформация одной или нескольких компаний в цепочке поставок может полностью менять индустрию. Мы НЕ будем говорить про Uber :).
Мы рассмотрим кейсы из фудтеха и сложных цепочек поставок. Обсудим сложности внедрения стратегий цифровой трансформации. Что делать, если мало данных на B2B рынке?
Как внедрять Data Science в операционные процессы бизнеса?
18:45-19:00
Видеозаписи Конференции от 29/04/2020 в подарок
Видеозаписи Конференции от 29/04/2020 в подарок
За последние три года были проведены шесть конференций в Москве и Санкт-Петербурге. Ведущие специалисты России поделились своими знаниями и практическими навыками по Big Data, Machine Learning и Neural Network.
Команда DataStart скоро с Вами свяжется
Вся дальнейшая информация и доступ к трансляции через Личный кабинет
Перейти в Личный кабинетПригласить друзей: