DataStart Conference 2019

IV весенняя практическая конференция по
Data Analytics, Data Science и Machine Learning

Как проходит конференция?

27 апреля 2019 / Москва / Azimut Smolenskaya
Мероприятие завершено
КУПИТЬ ВИДЕОЗАПИСИ

О мероприятии

DataStart это ежегодные конференции, где ведущие спикеры Москвы и Санкт-Петербурга делятся трендами, кейсами и практическими навыками по Data Science, Data Analytics, Machine Learning и AI.
На конференции вы узнаете о новых методах, возможностях и решениях проблем при внедрении и развития Data Science в бизнесе.

Для кого эта конференция

Для разных уровней технической подготовки: от интересущихся темой до профессиональных Data Scientists

Разработчики

Технические специалисты, программисты, желающие внедрить машинное обучение в свой проект.

Руководители

Понимать современные технические возможности для роста бизнеса и внедрения цифровых технологий в процесс.

Аналитики

Наш курс обработки и анализа данных поможет работе с объемными данными, применяя современные технологии.

Студенты

Набраться вдохновления на исследование новых задач. Выбрать техническую специализацию для обучения.

Тайминг и подробное описание докладов DataStart 2019 Moscow

Мероприятие состоит из трех потоков с теоретическим, практическими материалами и кейсами.

Зал A • Теория

  • Александр Фонарев

    Chief Data Scientist, Rubbles, преподаватель ШАД Яндекс

    Data science с точки зрения бизнеса

    Data-driven проекты всё чаще встречаются в самых разных компаниях и индустриях. На докладе мы рассмотрим их основные аспекты с организационной точки зрения, развеем основные заблуждения относительно применения анализа данных в бизнесе и поговорим про то, куда сейчас движется эта индустрия. Доклад будет полезен как менеджменту, так и data scientist’ам. 

    #data-driven #business
  • Кофе-брейк
  • Александр Кузьмин

    Руководитель направления моделирования бизнес-процессов в Альфа-Банке

    Здравый подход к Data Science, или нужен ли вашей компании Machine Learning?

    В современном цифровом мире многие компании думают о применении машинного обучения для оптимизации своих бизнес-процессов и повышения их эффективности. На докладе будут разобраны основные этапы естественной эволюции data science в компаниях. Вы сможете понять, на каких стадиях находятся бизнес-процессы вашей компании и как их лучше всего развивать дальше.

    #data-science #machine-learning #бизнес-процесс #моделирование #оптимизация
  • Геннадий Штех

    Lead DS в IRELA

    Текстовые эмбеддинги и их применения

    Разберём основные принципы работы текстовых эмбеддингов, Покажем, какими свойствами они обладают и как извлекать из этого пользу в реальных задачах, Разберемся, почему умения пользоваться gensim.models.word2vec может быть не достаточно в реальном применении, и что с этим можно сделать.

    #byte-pair #encoding #word2vec #fasttext #embeddings
  • Обед
  • Александр Фонарев

    Chief Data Scientist, Rubbles, преподаватель ШАД Яндекс

    Data science в финансовой индустрии

    Банки и финансовые организации обладают большим количеством разнообразных данных о своих клиентах, финансовых потоках, поведении сложного оборудования и многом другом. В связи с этим в этих компаниях становится возможным реализовать разнообразные data-driven проекты, направленных на оптимизацию процессов. На докладе мы рассмотрим некоторые из применений методов анализа данных в финансовой индустрии, а так же углубимся в некоторые нюансы применения таких подходов на практике.

    #fintech #business
  • Павел Мягких

    Chief Data Scientist в Kreate. Консультант по внедрению data science решений в ритейле и e-commerce.

    Почему не взлетают Data Science проекты в индустрии

    Последние десятилетия софтварные компании в огромном количестве поставляют бизнесу свои решения: от систем учёта и отчётности до blockchain-контрактов с поставщиками товаров. Но многие (если не большинство) не приносят тех успехов, которые обсуждаются на проектных встречах. В этом вопросе Data Science проекты - не исключение. Мы обсудим основные причины такой ситуации и чем эта область отличается от внедрения ERP и CRM.

    #проекты #риски #управление-ожиданиями
  • Кофе-брейк
  • Павел Плесков

    Data Scientist в Point API, Kaggle Grandmaster

    10 причин участвовать в соревнованиях по машинному обучению

    Почему лучшие дата саентисты проводят бессонные ночи, решая соревнования по анализу данных? Зачем тратить свободные выходные на участие в оффлайн хакатонах? Какая польза от бесконечного копания в чужих данных? На эти и другие вопросы ответит Kaggle Grandmaster и топ-1 среди русскоговорящих дата саентистов.

    #kaggle #competitions #machine-learning
  • Алексей Хахунов

    Co-owner/ СTO Dbrain

    ИИ для автоматизации документооборота с 99% качеством

    Доклад посвящен технологии оптического распознавания данных с помощью которой автоматизируются такие бизнес-процессы, как идентификация личности клиентов при обращении в оффлайн отделения, удаленную активация новых клиентов или новых работников для маркетплейсов, сверка данных, введенных пользователем с данными в документах, внесение в ПО данных из кредитных договоров и множество других. В докладе будет рассказано о том, как объединение алгоритмов искусственного интеллекта и людей позволяет добиваться 99% качества распознавания документов, как работать с персональными данными, чем технология OCR отличается от RPA. 

    #OCR #AI #RPA #machine-learning
  • Анна Козлова

    Lead DS в ChatmeAi

    Как научить диалогового агента самому генерировать уточняющие вопросы?

    При общении диалогового агента с пользователем может возникнуть необходимость задать пользователю уточняющий вопрос: например, если пользователь не предоставил достаточно информации для однозначного распознавания его намерения. Когда и какой уточняющий вопрос нужно задать? Как сделать так, чтобы диалоговый агент самостоятельно это определял?

    #NLP #боты #диалоговые-агенты #интенты

Зал B • Практика

  • Олег Дурандин

    Data Scientist в EPAM

    Represent everything! Векторное представление произвольных объектов

    Интересная особенность нейронных сетей - способность преобразовывать входные данные так, чтобы они как можно лучше отражали внутренние аспекты конкретной задачи. Таким образом, решающую роль играет качество наших датасетов. Мы привыкли подавать на вход алгоритму объекты в числовом представлении. Но что делать, если хочется использовать более сложные структуры - целые предложения и абзацы, неструктурированные документы, графовые объекты? В докладе мы расскажем, какие подходы используются для обучения подобных репрезентаций. А во второй, практической, части решим несколько реальных задач с помощью существующих инструментов. 

    #representations #neural-networks #graphs #embeddings #deep-learning #StarSpace
  • Кофе-брейк
  • Дмитрий Коробченко

    Deep Learning R&D engineer в NVIDIA

    Современное состояние NLP на основе нейронных сетей: от RNN до Transformer

    В докладе будет дан обзор современных нейросетевых архитектур для обработки естественного языка (NLP). Будет дано введение в рекуррентные нейронные сети (RNN), методы их обучения, а также их усовершенствованные формы, такие как LSTM и GRU. Кроме того, будут описаны State-of the-art методы, основанные на технологии Attention, такие как Transformer. Помимо теоретического введения будут показаны практические примеры применения нейронных сетей для анализа, преобразования и генерации текстов.

    #nlp #deep-learning #neural-network #rnn #transformer
  • Дмитрий Коробченко

    Deep Learning R&D engineer в NVIDIA

    Обучение LSTM на TensorFlow

    В этом мастер-классе будет продемонстрированно, как обучать свои нейронные на основе LSTM для решения различных задач NLP. Для начала будет показан пример обучения языковой модели для генерации текста. Затем будет разобрана задача оценки эмоционального окраса текстовых отзывов и комментариев.

    #nlp #lstm #python #tensorflow
  • Обед
  • Геннадий Штех

    Lead DS в IRELA

    Практика применения эмбеддингов при работе с текстами

    Разборы реальных применений эмбеддингов к задачам классификации и кластеризации текстов. Потренируемся на Википедии: получение данных, скачивание предобученных моделей, обработка и нормализация текстов, преобразование данных к нужному формату, финальное решение задачи классификации.

    #text-classification #text-clusterization #gensim #nlp #pretrained-models #word2vec #fasttext
  • Дмитрий Бугайченко

    Одноклассники

    Big Data Science на практике с Apache Zeppelin и SparkML

    Большинство МЛ сегодня происходит с использованием Python, особенно когда речь идет о начинающих специалистах. С другой стороны, для сбора и хранения данных в крупных и не очень компаний используется преимущественно JVM-стек Spark/Hadoop/Kafka и т.д. В результате появлется необходимость "переключения экосистем" при передаче данных в МЛ проработку и внедрению полученных МЛ результатов в бизнес, что, конечно же, приводить к целому букету проблем: разработка идет дольше, результаты часто не удается воспроизвести и они идут "в стол". О том как этого можно избежать и почему Python уже далеко не всегда лучшая альтернатива для начал знакомства с Data Science и пойдет речь

    #data-science #machine-learning #spark #big-data
  • Кофе-брейк
  • Никита Дмитриев

    Разработчик систем машинного обучения в Яндекс

    Решение задач классификации при помощи CatBoost

    С возможностями библиотеки мы будем знакомиться на примере решения задачи классификации. Вместе мы пройдём все этапы построения модели прогнозирования и рассмотрим следующие темы:Выбор подходящих функций потерь и метрик для оптимизации, обучение модели, визуализация процесса обучения и кросс-валидации, работа со встроенным детектором, важность признаков и интерпретация прогнозов модели переобучения, применение обученной модели к тестовым данным.

    #ml #catboost #classification #tutorial #python
  • Артем Селезнев

    Аналитик больших данных в Мегафон

    Выбираем CatBoost или XGBoost для поставленной задачи в формате соревнования

    Для какой задачи выбрать именно бустинг и какой именно? Сложно дать конкретный ответ, но просто понять во время решения. Для понимания какой бустинг лучше подойдет под вашу задачу, мы устроим выбор подходящей реализации бустинга в формате соревнования, между популярным XGBoost и разработкой от Yandex CatBoost, получим результаты и решим, какой из бустингов подойдет именно для нашей задачи. Рассмотрим на практике: структурные отличия, настройку параметров и их понимание, варианты подготовки данных, работу и особенности алгоритмов. 

    #boosting #CatBoost #XGBoost #machine-learning

Зал C • Кейсы

  • Петр Ермаков

    Senior Data Scientist в Lamoda

    Пальто с 300 карманами или Как провалидировать контент

    LAMODA - это один из основных игроков онлайн-торговли в России с более чем 5 миллионами товаров в каталоге. LAMODA - это не только сайт: это свои склады размером с футбольные поля, свои курьеры и парк автомобилей, свой отдел e-production с фотостудией и моделями. Мы не только делаем свои фотографии товаров, но и сами пишем описание и заполняем атрибуты. К сожалению ручной процесс не исключает ошибок. В докладе я расскажу, как мы автоматизируем поиск ошибок в контенте и как методы анализа данных нам в этом помогают. 

    #machine-learning #data-quality #e-commerce
  • Кофе-брейк
  • Борис Лесцов

    Младший программист-исследователь Mail.ru

    Детектирование людей в толпе / Person detection in crowds

    Задача детектирования людей на изображении или видеопотоке - это сложная задача компьютерного зрения, основными сложностями в которой являются разнообразие возможных сценариев детектирования, большая внутриклассовая вариативность самих людей (одежда, поза), а также частое перекрытие людей (ообенно сложный случай - толпы). Для ее решения исторически было придумано множество способов, но на данный момент наилучшее качество демонстрируют сверточные нейронные сети. Доклад посвящен построению собственной production-ready системы детектирования людей, работающей на сверточных нейронных сетях в реальном времении. Рассматриваются специфические приемы (архитектуры, функции потерь, особенности обучения), позволяющие существенно поднять качество детектирования.

    #machine-learning #deep-learning #computer-vision
  • Natural Language Processing онлайн-чеков: курс уроков волшебства для обычного кота и другие проблемы автоматической классификации

    Имеется задача многоклассовой классификации коротких текстов на примере чеков покупок в Интернет-магазине. Такую задачу возможно решить посредством построения большого количества бинарных классификаторов, каждый из которых предсказывает флаг наличия определенных интересов у покупателя. Для применения обучения с учителем необходимо использовать размеченную тренировочную выборку, которую получить для каждой конкретной темы проблематично. Мы нашли приемлемое по качеству решение, позволяющее получить размеченную тренировочную выборку для каждой из наших моделей. В нашем решении модели строятся автоматически, поэтому оказывается важным оценивать их качество используя не только стандартные метрики (в силу высокой разделимости классов метрики имеют большие значения). Для решения контроля качества была найдена новая метрика, позволяющая выявлять наиболее значимые различия между качественными и некачественными моделями классификации.Полученная мета-модель на основе ряда признаков принимает решение о применимости модели классификации.

    #machine-learning #nlp #text-mining #оценка-качества-ML-моделей #бинарная-классификация
  • Обед
  • Константин Кубрак

    Аналитик данных в Eora

    Чат-бот с нейронками внутри

    История о создании чат-бота, анализирующего фотографии: сбор требований, - создание моделей для извлечения признаков из фотографии: сбор данных, обучение, валидация, демонстрация заказчику результатов, проблемы при создании таких моделей, интеграция моделей с бекэндом чат-бота, контроль качества на проекте

    #CV #chat-bots #neural-networks
  • Процесс Data Science разработки

    Описание процесса разработки в Data Science; проблемы, с которыми можно столкнуться; как решать эти проблемы и идти дальше.

    #data-science #разработка #процессы
  • Кофе-брейк
  • Виктор Носко

    Founder / CEO GraphGrailAi

    Прозрачный и безопасный искусственный интеллект: подходы к технологическому решению

    В современном мире все сильнее назревает проблема безопасного и прозрачного искусственного интеллекта. В общественном дискурсе же преобладает философский взгляд на проблему. В докладе мы расскажем не только о том, какие есть проблемы в этике принимаемых ИИ решений, но и о технологическом стеке, позволяющем эти проблемы решить: подходах, протоколах на блокчейне. Покажем, как правильно документировать все этапы разработки ИИ - разметку данных, очистку, обучение нейросетей, переобучение и пр.

    #machine-learning #smart-contract #federated-learning
  • Ярослав Шмулев

    Data Scientist в компании SAP

    Прогнозирование продаж с использованием методов машинного обучения

    На сегодняшний день прогнозирование продаж является одним из ключевых драйверов любого успешного бизнеса. На основе прогноза базируются модули закупок, поставок, планирования промо-акций и др. Использование большого количества исторических данных позволяет разработать автоматизированную систему прогнозирования продаж на основе методов машинного обучения. Однако выбор моделей и подходов к прогнозированию очень сильно зависит бизнеса клиента. Из данного доклада вы узнаете, какие данные и методы нужно принять на практике.

    #practical-ml #time-series #category-embedding
  • Подход к построению и выбор модели для задачи прогнозирования отклика клиента на предложение Банка в сегменте СМБ

    Решение задачи увеличения конверсии CRM-кампаний по банковскому продукту для среднего и малого бизнеса от идеи до внедрения: анализ требований, построение признакового пространства, сравнительная характеристика моделей, выбор метрики и оценка результатов внедрения. Рассмотрим не только теоретические вопросы, но и реальные условия реализации кейса.

    #machine-learning #бизнес-процесс #моделирование

Пропустил мероприятие?

Мы записали все треки мероприятия и они доступны для скачивания. В комплекте ссылка на видеозаписи и все материалы спикеров.

Партнеры конференции

Компании представят активности и розыгрыши на мероприятии

First Line Software

На стенде компании First Line Software во время конференции вы сможете принять участие в on-line викторине. Наши сотрудники с экрана будут рассказывать своими словами о разных понятиях из мира IT. Если вы угадаете хотя бы 1-о слово из 3-х, то в подарок получите прикольные фрисби или классные кружки. Во второй половине дня вас ждет прикольное развлечение «Верю-не верю», никто не останется без подарка, прикольные наклейки, кружки и другие приятные мелочи вам обеспечены.

Eora

В зоне диалоговых систем нашего стенда можно испытать в действии написанные нами навыки для Яндекс.Алисы пообщавшись с Яндекс Станцией, увидеть демонстрации приложений для Google Ассистента и других ботов. В "музыкальной" зоне будет возможность сыграть или спеть вместе с системой, подбирающей ударные под ритм звучащей мелодии. В зоне посвященной видеоаналитике можно ознакомиться с уже реализованными кейсами и узнать больше интересующей информации от наших представителей. Кроме того на стенде будет место, где вы сможете спокойно обсудить подробнее все возникшие вопросы.

Издательство ДМК

Предоставление 20 книг по Data Science для розыгрыша среди участников конференции. Мы предоставим участникам самостоятельно выбрать книги на нашем стенде.

NVidia

Розыгрыш онлайн-курсов по глубокому обучению NVIDIA Deep Leaning Institute.

Партнеры и участники конференции

Информационные партнеры конференции

Как проходит конференция

Мы разместили несколько докладов с прошлых конференций, чтобы вы оценили уровень подготовленного материала и качество трансляции

Дмитрий Коробченко

Как ускорить обучение и инференс ваших нейронных сетей

Обзор технологического стека NVIDIA для эффективного решения задач глубокого машинного обучения, включающего в себя такие инструменты как GPU, NVIDIA GPU Cloud, CUDA, cuDNN, TensorRT и другое.

Валерий Бабушкин

Кейс Ошибки при построении Data Science проекта и как их избежать

Все больше и больше компаний понимают что Data Science, Big Data и машинное обучение это не просто модные слова, но и способ получить дополнительную прибыль, конкурентное преимущество и не быть съеденными компаниями, которые уже начали активно работать с данными. Я расскажу затем как и каких ошибок нужно избегать и чему нужно уделять внимание при построении решений

Геннадий Штех

Использование ML в продукте подходы и подводные камни

Рассмотрим основные подходы к ведению проектов с применением ML, как работать с возникающими сложностями и как избежать ошибок. Дадим рекомендации по выбору моделей и фреймворков, покажем последствия этого выбора. Разребём цикл “задача-исследование-разработка-внедрение-эксплуатация” в контексте ML-разработки. Посмотрим на лучшие практики IT и анализа данных и сэкономим на чужом опыте.

Александр Фонарев

Введение в методы машинного обучения и data science

В последние годы человечество находит всё больше способов с пользой использовать данные, накапливающиеся в ходе самых разных процессов. Например, информация о поведении пользователя на музыкальном сайте позволяет рекомендательной системе предположить, что ещё может ему понравиться. Анализируя истории болезней пациентов, можно обнаруживать незаметные для человека связи и устанавливать неизвестные ранее симптомы опасных заболеваний. А используя базу изображений из интернета, можно построить алгоритм для автоматической детекции нужных объектов на фотографиях. Все эти задачи решаются с помощью методов машинного обучения, которые способны находить сложные закономерности в больших данных. Мы поговорим о том, что такое машинное обучение и что изучает data science. А также обсудим большое количество современных методов машинного обучения и задач, для решения которых они применяются.

Геннадий Штех

Эволюция задач и алгоритмов на текстах, NLP и production

В процессе доклада выясним необходимые этапы работы с текстами и проблемы с этим возникающие. В бизнес-секции поговорим о пользе, которую приносят современные решения NLP. Далее речь пойдет о классических решениях задач и новых вызовах, связанных с повышенными требованиями к течению информации, и новых возникших методах. В исследовательском блоке посмотрим подробнее на перспективные методы. В инженерном - кратко познакомимся с типичными инструментами для NLP.

Александр Жебрак

Как генеративные модели спасут мир. Искусственный интеллект для создания лекарств

В этом докладе я расскажу о том, что такое генеративные модели, и какие существуют подходы к созданию новых объектов и моделированию распределений реальных данных. Мы поговорим о том, как на самом деле работают эти модели, и где они применяются уже сейчас. Во второй части я расскажу, как мы применяем генеративные модели для создания новых лекарств с требуемыми свойствами в Insilico Medicine.

Спикеры конференции

Дмитрий Коробченко Deep Learning R&D engineer в NVIDIA

Закончил ВМК МГУ с отличием. Работал в IBM и Samsung, где занимался исследовательскими задачами, связанными с машинным обучением (Deep Learning), компьютерным зрением и обработкой сигналов. Сейчас работает в NVIDIA, где продолжает исследования и разработку в этой области.

Никита Дмитриев Разработчик систем машинного обучения в Яндекс

Окончил механико-математический факультет МГУ и Школу анализа данных. В Яндексе занимается разработкой систем машинного обучения.

Геннадий Штех Lead DS в IRELA

Занимается исследованиями в областях моделирования потоков информации, поисковых моделей и персонализации. Руководит разработкой и внедрением Machine Learning решений. Специализируется на мультитаск-эмбеддингах, методах работы "разметки нет, но модели строить нужно" и инженерных аспектах построения сложных систем, зависимых от данных.

Александр Фонарёв Chief Data Scientist, Rubbles, преподаватель ШАД Яндекс

Chief Data Scientist и сооснователь компании Rubbles (SBDA Group), преподаватель машинного обучения в Школе Анализа Данных Яндекса и аспирант Сколтеха. В прошлом работал в Яндексе в отделах машинного перевода и исследований в машинном интеллекте.

Павел Мягких Chief Data Scientist в Kreate. Консультант по внедрению data science в ритейле и e-commerce

Приглашенный преподаватель НИУ ВШЭ Факультет Компьютерных Наук, Департамент больших данных и информационного поиска. Занимаюсь созданием оффлайн и онлайн курсов по Искусственному интеллекту. До этого руководил функциями Data Science в розничных международных компаниях.

Артем Просветов Эксперт в области Data Science и Deep Learning в CleverDATA

Кандидат физ.-мат. наук, в CleverDATA занимается разработкой рекомендательных систем, предсказательных и Lookalike моделей, проектов Text mining. Работал в Институте Космических Исследований (ведущий математик). Имеет ряд научных публикаций по анализу данных, неоднократный призер научных конкурсов. Проводит лекции на тему Big Data в «Нетологии»

Артём Селезнёв Аналитик больших данных в Мегафон

Работает над комплексными аналитическими системами и рекомендательными системами в сфере телекома; является младшим научным сотрудником международной научно-учебной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, где проводит исследования в области профессионального образования и рынка труда.

Дмитрий Бугайченко Одноклассники

Закончил Санкт-Петербургский Государственный Университет в 2004 году, там же защитил кандидатскую по формально-логическим методам в 2007. Почти 9 лет проработал в аутсорсинге, не теряя контакта с университетом и научной средой. Анализ больших данных в Одноклассниках стал для Дмитрия уникальным шансом совместить теоретическую подготовку и научный фундамент с разработкой реальных, востребованных продуктов. И этим шансом он с радостью воспользовался, придя туда семь лет назад.

Борис Лесцов Младший программист-исследователь Mail.ru

Учился на факультете ВМК МГУ, проводил исследования со сверточными нейронными сетями. На данный момент обучаюсь в магистратуре ВМК в лаборатории компьютерной графики и мультимедиа, продолжаю исследования в сфере компьютерного зрения. В mail.ru занимаюсь оптимизацией инференса нейронных сетей, решаю инженерные и исследовательские задачи.

Павел Плесков Data Scientist в Point API, Kaggle Grandmaster

Закончил мехмат МГУ (2010) и магистратуру РЭШ (2012). Год работал финансовым консультантом в компании Oliver Wyman. Далее занимался созданием торговых биржевых роботов в индустрии высокочастотной торговли (HFT). В течении двух лет был сооснователем и главным квантом фонда ThunderBid. После этого нашел свое призвание в Data Science. За полтора года стал первым в России и четвертым в мире в рейтинге самой популярной соревновательной платформы по анализу данных - Kaggle. С тех пор профессионально участвует и помогает организовывать онлайн соревнования и хакатоны по DS/ML. Увлекается путешествиями, мотоциклами и кайтсерфингом.

Олег Дурандин Data Scientist в EPAM

Работаю Data Scientist’ом в компании EPAM. Занимаюсь анализом данных около 5 лет, в основном работаю с задачами обработки естественного языка. Преподаю курсы, связанные с анализом данных в НИУ ВШЭ НН.

Петр Ермаков Senior Data Scientist Lamoda

Senior Data Scientist компании Lamoda, прежде занимал позиции Руководителя отдела аналити в MailRu Group (бизнес-юнита Юла) и Data Scientist в HeadHunter. Один из организаторов сообщества OpenDataScience и митапов PyData Moscow и Hadoop Moscow Meetup

Анастасия Семенова Data Scientist в CleverDATA

Закончила Институт математики, механики и компьютерных наук им.Воровича ЮФУ с отличием по специальности «Математика» – материалы дипломной работы по теме «Критерий обратимости оператора свёртки с ядром радиального типа на группе Гейзенберга» представлены и опубликованы в тезисах международной конференции «Современные проблемы теории операторов и гармонического анализа и их приложения VI». Магистр математики НИУ ВШЭ (факультет математики). Участник летней школы «Современная математика». В CleverDATA занимается NLP (Natural Language Processing) анализом больших данных биржи данных, через которую проходит более 100 млн профилей в день.

Алексей Хахунов Co-owner/ СTO Dbrain

Эксперт в области машинного обучения и искусственного интеллекта, сооснователь и CTO платформы Dbrain, основатель роботизированной молочной фермы R-SEPT. Алексей автор статей и ведущий телеграм-канала о применении ИИ в бизнесе, спикер многочисленных тематических конференций.

Константин Кубрак Аналитик данных в Eora

Учился в Университете Иннополис, до этого работал 2,5 года разработчиком БД Oracle в банке. С октября 2018 – аналитик данных в EORA DataLab, участвует в проектах, связанных с CV.

Магеррамов Эмиль COO в Eora

Работал разработчиком, поднялся до тимлида, потом поступил в Data Science магистратуру и после завершения открыл свою Data Science компанию. С лета 2018 – COO в EORA DataLab, налаживает процессы, общается с заказчиками, помогает команде.

Александр Кузьмин Руководитель направления моделирования бизнес-процессов в Альфа-Банк

Возглавляет моделирование и оптимизацию бизнес-процессов в кредитных и розничных направлениях Альфа-Банка, занимается исследованиями в области предиктивной аналитики на базе Яндекса и МФТИ. В прошлом работал руководителем отдела Data Science и разрабатывал решения для крупнейших российских и зарубежных банков, продовольственных сетей и ресторанов быстрого питания.

Виктор Носко Основатель и CEO платформы искусственного интеллекта GraphGrailAi

Окончил ЮФУ. Эксперт в области искусственного интеллекта, в том числе по проблемам прозрачной экосистемы ИИ. Выполнял Data-science разработку в области глубокого анализа смысла текстов для бизнеса и госструктур.

Андрей Анисимов ВТБ

Руководитель проекта отдела по работе с большими данными Департамента корпоративного цифрового бизнеса в Банке ВТБ (ПАО). Занимается аналитикой и построением моделей машинного обучения в сфере банковского обслуживания среднего и малого бизнеса Банка ВТБ (ПАО). Имеет несколько научных публикаций, участвовал в реализации НИР.

Ярослав Шмулев Data Scientist в компании SAP, руководитель Data Science команды в секторе «Торговля»

Окончил с отличием МФТИ и Skoltech по направлению Data Science. В компании SAP руководит Data Science командой по решению задач в секторе «Торговля». В прошлом занимался исследованиями в области нейродегенеративных заболеваний с помощью глубоких нейронных сетей.

Анна Козлова Lead DS в ChatmeAi

В данный момент Анна занимается управлением командой data scientist в ChatmeAi, разрабатывает ML NLP алгоритмы, которые необходимы для диалоговой системы. Имеет большой опыт в datascience, участвовала в различных проектах в NLP и предсказательных системах: классификация и кластеризация текстов на русском и английском языках, выделение именнованных сущностей, выделение фактов из текстов (fact extraction), разработка диалоговых агентов и др.

Прошедшая DataStart Conference Осень 2018

В октябре 2018 года прошла третья однодневная обучающая конференция DataStart. Конференция была приурочена к применению технологий в бизнесе. Практикующие спикеры поделились кейсами и подходами к решению задач в Data Science, Machine Learning и AI.

Место проведения

Конференция пройдет в субботу, 27 апреля 2019 в современных просторных конференц-залах отеля Azimut Smolenskaya

Место проведения

Мероприятие пройдет в центре Москвы у метро Смоленская и в 3 минутах от Арбата и 10 минутах от метро Киевская.

  • Москва, ул. Смоленская, 8, Отель Азимут Смоленская
  • 27 апреля 2019, 10:00 - 20:00

Пропустил мероприятие?

Мы записали все треки мероприятия и они доступны для скачивания. В комплекте ссылка на видеозаписи и все материалы спикеров.

Top