14 декабря 2021
с 10:00 до 19:00 (мск)
Data Science, машинное обучение и нейросети
купить записи программаНа один день вы попадете в круг «своих» людей, которым не надо объяснять, что такое датасет и анализ данных. Спикеры расскажут о своих успешных кейсах, и вы сможете применить полученные знания, а также поупражняться на воркшопах
Каждый день появляются новые способы применения технологий NLP и CV, необходимо постоянно следить за трендами, чтобы оставаться востребованным специалистом
Вы увидите самый передовой опыт коллег и применение последних технологий искусственного интеллекта. Узнаете различные варианты прикладного применения ML алгоритмов
Здесь вы сможете найти себе подрядчика, потому что на конференции собирается весь «цвет» индустрии. А также разобраться, как это все работает и устроено изнутри
Вы познакомитесь с коллегами, получите поддержку, обменяетесь опытом и найдете новых друзей среди позитивных и открытых людей
Вы услышите насыщенные доклады профессионалов по Dаta Science, поучаствуете в воркшопах, получите концентрированную дозу опыта и прокачаете свой уровень
Получите максимум позитива и большой поток энергии. Унесете с собой новые идеи, инсайты и мотивацию
Доктор физико-математических наук, доцент Сколтеха
Директор по Big Data в МТС
Product owner в Yandex.SupportAI
AI Solutions Architect в NVIDIA
Senior DS в Леруа Мерлен
Архитектор Data Science в Softline, лидер направления машинного обучения в Цифровой Лаборатории Softline
Co-Founder, Head of Computer Vision в EORA.ai
Преподаватель краудсорсинга в ШАДе, ВШЭ, МФТИ
Сколтех, научный сотрудник
Ведущий ML/CV разработчик в TrafficData
Программист в Provectus
ML Tech Lead, Orion Innovation
Developer Advocate
Senior DS @ Face Recognition в NTechLab
Инженер-исследователь научной группы ADASE в Сколтехе
Chief Data Scientist MTS BigData
10:00-10:40
Ведущий ML/CV разработчик в TrafficData
• Сложности работы с большим числом несбалансированных классов
• Особенности использования механизмов внимания в CV
• Плюсы и минусы ViT и CCT
• Кастомная архитектура трансформера в TrafficData
• Результат применения в цифрах
10:40-10:50
11:00-11:40
Инженер-исследователь научной группы ADASE в Сколтехе
• Open Source: зачем в нем участвовать, с кем вы будете работать, как найти себя в этом
• Разберем устройство фреймворка для нейронных сетей
• PyTorch и его экосистема
• Где можно работать контрибьютером на фуллтайм
• Как в различных проекта создаются и решаются issue, как найти себе задачу
• А также, расскажу о своём опыте участия и разберу на примере этапы попадания идеи в код проекта
11:40-11:50
12:00-12:40
Co-Founder, Head of Computer Vision в EORA.ai
• Обучение нейросетей на сегментацию скреплений шпал, стыковых зазоров и контрольных сечений угона
• Разработка пайплайна на базе NVIDIA DeepStream для обработки 4-х видеопотоков
• Оптимизация моделей на TensorRT
• Связка пост-процессинга на Python с DeepStream пайплайном и сохранением общего FPS >= 60
• Алгоритм трекера шпал на основе классического CV
12:40-12:50
13:00-14:00
14:00-14:40
Senior DS @ Face Recognition в NTechLab
• Эффективное распараллеливание обучения на большом количестве данных
• Триплеты, или как использовать старые методы по-новому
• Почему ансамбль моделей — это не всегда хорошо
• Нюансы чистки тренировочных данных
14:40-14:50
15:00-15:40
ML Tech Lead, Orion Innovation
• Краткий обзор Deep Learning инструментария: нелинейная регрессия, RNN, Temporal Fusion Transformer, TabNet
• Какие свойства временного ряда важны для его анализа
• Как эти свойства учитываются инструментами
• Пример ряда из IoT области: легко ли его аппроксимировать универсальной моделью
• Пример из Kaggle соревнования Ventilator Pressure Prediction
• Прогноз развития области: в каком виде возможна революция
15:40-15:50
16:00-16:40
Senior DS в Леруа Мерлен
• Разработка ML продукта с нуля до окупаемости в условиях цифровой трансформации компании
• Пример продуктивизации и внедрения ML-рекомендаций товаров в онлайн и офлайн системы
• Расчет экономической выгоды до начала разработки, а также АБ-тесты своими руками
• Изъяны алгоритмов на реальных данных и как мы с ними боролись
• Наши выводы и советы по работе
16:40-16:50
17:00-17:40
Преподаватель краудсорсинга в ШАДе, ВШЭ, МФТИ
• Сколько данных нужно для обучения нейронной сети
• Что выгоднее: улучшать архитектуру нейронной сети или увеличивать датасет
• Зачем использовать Active Learning
• Как предразметка позволяет удешевить создание датасета
• В чем главный плюс концепции Human in the Loop
• Тренды в разметке данных
17:40-17:50
18:00-18:40
Архитектор Data Science в Softline, лидер направления машинного обучения в Цифровой Лаборатории Softline
Все, кто доводил до конца проект по созданию и внедрению ML сталкивались с непредвиденными сложностями. О рисках в ML проектах только появляются статьи и подходы к их оценке. Мы рассмотрим реальные кейсы, изучим рисках в ML проектах: какие могут возникнуть и как ими можно управлять.
18:40-18:50
10:00-10:40
Доктор физико-математических наук, доцент Сколтеха
В данном докладе мы расскажем о том, как различные математические идеи и концепции могут существенно повышать качество работы алгоритмов машинного обучения, а также более эффективно анализировать результаты работы
10:40-10:50
11:00-11:40
Сколтех, научный сотрудник
Мы обсудим возможности применения геометрических методов на основе неевклидовой геометрии для решения практических задач построения рекомендательных систем. На примере автокодировщиков разберем, как без потери точности предсказаний можно значительно сократить вычислительную сложность нейросетевых моделей, используя модели гиперболических пространств
• Неевклидова геометрия в рекомендательных системах
• Коллаборативная фильтрация на основе гиперболических пространств
• Практичность гиперболических автокодировщиков
11:40-11:50
12:00-12:40
Product owner в Yandex.SupportAI
• Тренды индустрии
• Как и зачем мы сделали сервис Support AI для Яндекса, какие боли полечили
• Что SupportAI умеет (чат-бот, голосовой ассистент, аналитика)
• Какая экономика историй с автоматизацией
• Интерфейсы по настройке бота
• Что такое ML Ops и почему это важно
• Сюрприз
12:40-12:50
13:00-14:00
14:00-14:40
Директор по Big Data в МТС
Колыбель Machine learning, как известно, IT-компании, но есть и несколько традиционных сфер, где это направление процветает: телеком, банки и ритейл. В МТС нам приходится иметь дело как со всеми этими сферами, так и с новыми, более айтишными бизнесами. Это вызывает резонный вопрос: что сделать, чтобы радикально ускорить распространение ML во всей группе компаний? Об этом мы и поговорим.
14:40-14:50
15:00-15:40
Chief Data Scientist MTS BigData
В докладе изложен системный подход к найму специалистов в анализе данных, базирующийся на методах машинного обучения, баесовском анализе и вероятностном обучении. Приведены основные ограничения, встречающие при решении данной задачи, коротко затрагиваются вопросы регуляризации
15:40-15:50
16:00-16:40
AI Solutions Architect в NVIDIA
В докладе мы расскажем об инструментах и технологиях, которые позволяют ускорить разработку и инференс IVA решений, разберём как и почему они работают:
• Automatic Mixed Precision для обучения моделей
• NVIDIA TAO Toolkit для быстрого обучения референсной модели
• DeepStream, фреймворке для инференса на потоковых данных, особенно видео
• Triton Inference Server, как решение для инференса всего остального
16:40-16:50
17:00-17:40
Программист в Provectus
Исследования в области машинного обучения хаотических систем могут значительно углубить и обогатить наше понимание не только хаоса, но и самого машинного обучения
• Понятие Теории хаоса
• Развитие математических моделей
• Нейронные сети и спиновые стёкла
• Методы машинного обучения в прогнозировании эволюции хаотических систем
• Резервуарные вычисления
17:40-17:50
18:00-18:40
Developer Advocate
В основе любой работы с большими данными лежат распределённые системы. От постгреса с асинхронной репликацией до глобально распределённых хранилищ вроде Amazon S3. Казалось бы, все они надёжны… но только до тех пор, пока что-то не пойдёт не так. Вот о том, что и когда может пойти не так и поговорим. А так же как это сказывается на нас.
18:40-18:50
Основная цель проекта – повышение профессионального уровня знаний специалистов, исследователей и инженеров, связанных с Data Science. Живое общение и обмен опытом
Конференция рассчитана на специалистов уже «в теме» уровня Middle, но мы уверены, что доклады будут полезны на любом уровне профессионализма, ведь эта отрасль очень многогранна
Если вы только учитесь, DataStart будет вдвойне полезен. Мало того, что вы сможете получить отборную информацию из первых уст, так еще и познакомитесь с людьми, которые способны объяснить сложные понятия простыми словами
Конференции DataStart происходят со средней частотой два-три раза в год. Этого времени как раз хватает на то, чтобы у вас накопились вопросы и появилось желание, чтобы впитать новую порцию знаний
Команда DataStart скоро с Вами свяжется
Письмо с видеозаписями придет после подтверждения почтового адреса
Вся дальнейшая информация и доступ к трансляции через Личный кабинет
Перейти в Личный кабинетПригласить друзей: