Бесплатная летняя онлайн-конференция Data Science 2020

Cпикеры

Александр Гущин
Senior DS в Mechanica.ai
Асхат Уразбаев
Agile Coach, ScrumTrek
Александр Фонарев
Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор
Петр Ермаков
Cтарший специалист по ML Lamoda
Дмитрий Пагин
ML and CV Developer в Trafficdata
Ильдар Сафило
Expert Data Scientist в MTS Big Data Department
Ирина Голощапова
Head of Risks, Macro and Research в X5 Retail Group
Дамир Галиев
Директор по инновациям в ПАО АК БАРС Банк
Данила Савенков
Senior machine learning engineer ВКонтакте
Геннадий Штех
Руководитель группы исследований и разработки в Центре Исследования Больших Данных
Валентин Малых
Senior Research Scientist в Noah’s Ark Lab
Алексей Чернобровов
Консультант по Data Science. Спикер ведущих конференций по маркетингу, аналитике и Data Science
Татьяна Савельева
Head of unstructured data analysis в Yandex.Taxi
Виктор Лемпицкий
Директор Центра Искусственного Интеллекта Samsung в Москве
Иван Лыжин
Разработчик CatBoost в Яндекс

11:00-11:45

Деплой моделей машинного обучения on-premises с использованием Kubernetes. Как свести разработку кастомных сервисов к одному стандарту: опыт Mechanica.ai

Александр Гущин

Senior DS в Mechanica.ai
Разработка кастомных сервисных решений для похожих задач приводит к появлению "зоопарка" различных сервисов, который трудно поддерживать, обновлять и передавать из одних рук в другие. Установка таких решений on-premises в промышленности приносит дополнительные сложности - своя инфраструктура у каждого заказчика, ограниченный доступ в интернет. Мы расскажем, как для решения этой задачи мы разработали шаблонное решение на основе Kubernetes, включающее в себя корректную обработку входных запросов, модели машинного обучения, логирование и мониторинг.
- #deploying-on-premise
- #kubernetes
- #devops
- #ml-apps
11:45-12:00

Вопросы спикеру
12:00-12:45

Способы уменьшения и ускорения глубоких сверточных сетей

Дмитрий Пагин

ML and CV Developer в Trafficdata
Зачастую мы ограничены в используемых ресурсах на продакшене - это могут быть мобильные устройства или GPU из низшего ценового сегмента. А для решения задач часто берутся предобученные state-of-the-art архитектуры избыточного размера. Как итог, перед нами встает задача уменьшения и ускорения сверточных сетей. В докладе расскажу, какими методами можно уменьшить и ускорить глубокие сверточные сети. Разберем на примере 3-х кратного ускорения YOLOv3 в задаче детектирования автомобилей.
- #TensorRT
- #deep_learning
- #cv
12:45-13:00

Вопросы спикеру
13:00-13:45

Выбор и сравнение статистических критериев

Данила Савенков

Senior machine learning engineer ВКонтакте
После проведения А/Б теста возникает вопрос об оценке статистической значимости различий в тестовых группах. Для этого используются статистические тесты, коих существует достаточно большое количество. Не всегда очевидно, стоит ли использовать t-тест Стьюдента или же критерий Манна-Уинтни, или оценивать значимость при помощи бутстрапа, дельта-метода, линеаризации и так далее. Я расскажу о том, как оценить применимость того или иного статистического теста к вашей задаче и как выбрать тот тест, который покажет самую высокую мощность на ваших данных.
- #statistics
- #data_science
- #analytics
- #ab_tests
13:45-14:00

Вопросы спикеру
14:00-14:45

Выбираем open-source BI: superset, metabase, redash

Петр Ермаков

Cтарший специалист по ML Lamoda
Большое число компаний движутся в сторону Data Driven, но порой цена и сложность некоторых BI инструментов являются загродительным барьером. В докладе будет представлено сравнение самых популярных open-source BI инструментов: superset, metabase, redash Подробнее поговорим про superset, а также как построить дашборд из jupyter notebook-а
- #data
- #bi
- #analytics
- #superset
- #opensource
- #redash
- #metabase
14:45-15:00

Вопросы спикеру
15:00-15:45

Познавательная BERT-ология

Геннадий Штех

Руководитель группы исследований и разработки в Центре Исследования Больших Данных
В 2018 появилась модель BERT(Transformer), которая перевернула NLP-игру. Оказалось, что принятые ранее за SOTA рекуррентные нейронные сети(RNN: LSTM, GRU) уступают по качественным характеристикам новой архитектуре "трансформер" почти во всех прикладных задачах.
Однако BERT имеет ряд недостатков. В основном это сложность вычислений предсказаний модели и ограничения на входную последовательность. Кроме того, тот самый первый BERT был не оптималено построен. Оказалось, на той же архитектуре можно решать задачи лучше.
Уже почти 2 года исследователи проверяют на прочность архитектуру трансформеров и придумывают что-то новое.
На докладе будет короткий обзор изначальной реализации трансформеров BERT, найдём его недостатки.
БОльшую часть времени посвятим результатам работы исследователей за прошедшие 2 года: улучшения, модификации, вариации.
В конце будет ответ на вопрос "что использовать для моей задачи?"
- #NLP
- #BERT
- #Transformer
- #GPT
- #Reformer
- #XLNet
- #TransformerXL
15:45-16:00

Вопросы спикеру
16:00-16:45

Современное состояние области NLP: к чему мы пришли в середине 2020 года

Валентин Малых

Senior Research Scientist в Noah’s Ark Lab
В своем докладе я расскажу о современных тенденциях и последних достижениях в области обработки естественного языка, в том числе про GPT-3 и другие большие модели
- #nlp
- #deep_learning
- #state_of_the_art
16:45-17:00

Вопросы спикеру
17:00-17:45

Нейросетевые аватары

Виктор Лемпицкий

Директор Центра Искусственного Интеллекта Samsung в Москве
Персонализированные аватары -- ключевой элемент новых систем телеприсутствия. Использование нейросетей в процессе рендеринга (рисования) аватаров позволяет существенно увеличить их реалистичность и точность персонализации. В докладе я расскажу про новые подходы к созданию нейросетевых аватаров, разработанные в лаборатории VIOLET (Vision-Learning-Telepresence) Центра Искусственного Интеллекта Самсунг в последние полтора года. Будут рассмотрены как задача создания аватаров головы человека, так и создание аватаров всего тела.
- #neural_avatars
- #neural_rendering
- #few_shot_learning
- #generative_models
17:45-18:00

Вопросы спикеру
18:00-18:45

Ранжирование в CatBoost

Иван Лыжин

Разработчик CatBoost в Яндекс
CatBoost - библиотека градиентного бустинга, созданная в Яндексе.
Одной из особенностей библиотеки является наличие набора ранжирующих режимов, показывающих state of the art на публичных и внутренних для Яндекса датасетах. Ранжирующие режимы CatBoost используются для ранжирования поисковой выдачи, в рекомендательных системах, в диалоговом ассистенте и во многих других проектах Яндекса.
В этом докладе мы расскажем о том, какие существуют ранжирующие режимы в катбусте, и как ими пользоваться.
- #catboost
- #machinelearning
- #gradientboosting
18:45-19:00

Вопросы спикеру

Поток 1
Технический
Поток 2
Бизнес

11:00-11:45

Автоматизируем ваши процессы с помощью DS - пошаговый гид для самых прибыльных

Татьяна Савельева

Head of unstructured data analysis в Yandex.Taxi
Помимо постоянного увеличения выручки и продаж, бизнесу критически важно выполнять свою основную функцию — приносить прибыль.
Во многих компаниях до сих пор существуют ручные или полуручные процессы, в рамках которых большое количество людей выполняют однотипную работу: разбирают обращения пользователей, проверяют документы, обзванивают клиентов, отсматривают записи с камер.
Все это стоит бизнесу немалых денег и плачевно сказывается на финансовых показателях.
В докладе на примере успешных кейсов Яндекс Такси подробно обсудим, как подступиться к автоматизации людского труда, оценим, сколько времени и усилий уйдет на реализацию такой инициативы, разберем, как выстроить процесс и кто для этого нужен, и наконец поймем, как оценивать и контролировать полученную автоматизацию, чтобы не сломать сервис.
- #business
- #automatization
- #deep_learning
11:45-12:00

Вопросы спикеру
12:00-12:45

Особенности проведения A/B тестов на маленьких выборках в бизнесе

Ильдар Сафило

Expert Data Scientist в MTS Big Data Department
Что делать, если у вас маленькая выборка? Что делать, если ваша основная метрика - деньги? Как провести A/B тест на регионах? В своем докладе я попытаюсь ответить на эти вопросы и расскажу об особенностях проведения A/B тестов на малых выборках в компаниях.
- #A/B_test
- #small_data
- #statistics
- #business
- #ds
12:45-13:00

Вопросы спикеру
13:00-13:45

Искусственный интеллект для бизнеса: как выбрать и реализовать перспективный проект

Александр Фонарев

Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор
Для многих компаний запуск AI-решений — лотерея: им сложно определить, будет ли проект прибыльным, и контролировать риски по ходу проекта. В случае неудачи бизнес теряет миллионы рублей. В докладе мы обсудим основные инструменты для распознавания перспективного проекта на ранних этапах, контроля бизнес-рисков и управления проектом.
- #AI
- #business
- #data-science
13:45-14:00

Вопросы спикеру
14:00-14:45

Канбан для управления проектом в Data Science

Асхат Уразбаев

Agile Coach, ScrumTrek
Канбан - современный подход к управлению, прекрасно подходит для управления DS проектами. На докладе мы поговорим, как должна выглядеть канбан-доска, как планировать проекты, предсказывать сроки выполнения, измерять эффективность команд и взаимодействовать с заказчиком.
- #scrum
- #kanban
- #управлениепроектами
14:45-15:00

Вопросы спикеру
15:00-15:45

Искусственный интеллект для предсказания спроса в ритейле, FMCG и QSR

Александр Фонарев

Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор
Ключевыми задачами в потребительских бизнесах (ритейл, FMCG, QSR и др.) являются ценообразование, планирование закупок, ассортимента, логистики, в основе которых лежат модели прогнозирования спроса на товары. На докладе мы обсудим, в каких бизнес-процессах нужен прогноз спроса, как работает машинное обучение для предсказания спроса, как делать модели интерпретируемыми для бизнес-пользователя, оценить эффект от внедрения и организовать рабочий процесс Data Science команды.
- #business
- #retail
- #forecasting
15:45-16:00

Вопросы спикеру
16:00-16:45

Роль DS/ML стратегии в развитии корпорации

Дамир Галиев

Директор по инновациям в ПАО АК БАРС Банк
В своем докладе я расскажу о том, с какими трудностями можно столкнуться при выстраивании первых шагов по выращиванию компетенций DS/ML в командах, где подобные подходы ранее отсутствовали. Поговорим о мотивации корпоративных стейкхолдеров к применению data-driven подходов в своей деятельности. Как мы пришли к необходимости фиксирования стратегии развития AI/ML и как она связана с общей стратегией бизнеса.
- #стратегия
- #AI-based-products
16:45-17:00

Вопросы спикеру
17:00-17:45

Валидация эффективности цифровых инициатив: как не оступиться на пути цифровой трансформации

Ирина Голощапова

Head of Risks, Macro and Research в X5 Retail Group
Сегодня многие крупные компании выбирают путь цифровой трансформации, который обещает быстрый и ошеломительный успех. Но на любом пути встречаются трудности и подводные камни – по различным оценкам, около 94% проектов в области цифровизации не приносят результата. Поговорим о том, что ожидания от измерения эффективности проектов с помощью А/Б тестирования не совпадают с реальностью, что не любой проект вообще можно реализовать, а также о том, как выстроить систему валидации цифровых проектов и ограничить неэффективные расходы компании на проекты цифровой трансформации.
- #digital_transformation
- #risks
- #validation
17:45-18:00

Вопросы спикеру
18:00-18:45

Как дисрапт традиционных моделей с помощью data science может стать основной стратегией цифровой трансформации

Алексей Чернобровов

Консультант по Data Science. Спикер ведущих конференций по маркетингу, аналитике и Data Science
Мы поговорим о том, как Data Science влияет на различные, в том числе традиционные, индустрии. Почему с помощью Data Science сегодня можно дисраптить (уничтожать) традиционные модели бизнеса. Как цифровая трансформация одной или нескольких компаний в цепочке поставок может полностью менять индустрию. Мы НЕ будем говорить про Uber :).
Мы рассмотрим кейсы из фудтеха и сложных цепочек поставок. Обсудим сложности внедрения стратегий цифровой трансформации. Что делать, если мало данных на B2B рынке?
Как внедрять Data Science в операционные процессы бизнеса?
- #digital_transformation
- #disrupt
- #data_science
18:45-19:00

Вопросы спикеру

Бесплатнаяонлайн-конференция Data Science

Кому подходит

Рукодоводителям

Разработчикам

Аналитикам

Студентам

Cпикеры

Программа мероприятия

Деплой моделей машинного обучения on-premises с использованием Kubernetes. Как свести разработку кастомных сервисов к одному стандарту: опыт Mechanica.ai

Александр Гущин

Способы уменьшения и ускорения глубоких сверточных сетей

Дмитрий Пагин

Выбор и сравнение статистических критериев

Данила Савенков

Выбираем open-source BI: superset, metabase, redash

Петр Ермаков

Познавательная BERT-ология

Геннадий Штех

Современное состояние области NLP: к чему мы пришли в середине 2020 года

Валентин Малых

Нейросетевые аватары

Виктор Лемпицкий

Ранжирование в CatBoost

Иван Лыжин

Автоматизируем ваши процессы с помощью DS - пошаговый гид для самых прибыльных

Татьяна Савельева

Особенности проведения A/B тестов на маленьких выборках в бизнесе

Ильдар Сафило

Искусственный интеллект для бизнеса: как выбрать и реализовать перспективный проект

Александр Фонарев

Канбан для управления проектом в Data Science

Асхат Уразбаев

Искусственный интеллект для предсказания спроса в ритейле, FMCG и QSR

Александр Фонарев

Роль DS/ML стратегии в развитии корпорации

Дамир Галиев

Валидация эффективности цифровых инициатив: как не оступиться на пути цифровой трансформации

Ирина Голощапова

Как дисрапт традиционных моделей с помощью data science может стать основной стратегией цифровой трансформации

Алексей Чернобровов

Регистрация | Вход участника

Онлайн-просмотр

Онлайн-трансляция+ видеозаписи одного потока на выбор

Онлайн трансляция + видеозаписи двух потоков

Чем мы занимаемся

Весна 2020, Онлайн

Осень 2019, Москва

Весна 2019, Москва

Осень 2018, Москва

Весна 2018, Москва

Осень 2017, СПб

Информационные партнеры

Хотите стать спикером DataStart?

Регистрация DataStart

Опыт в Data Science

Варианты участия

Стать партнером DataStart

Подать доклад

Спасибо за обращение!

Регистрация выполнена!

Бесплатная
онлайн-конференция Data Science

Онлайн-трансляция
+ видеозаписи одного потока на выбор