03 июля 2024
с 10:00 до 19:00 (мск)
Data Science, машинное обучение и нейросети
зарегистрироваться программаНа один день вы попадете в круг «своих» людей, которым не надо объяснять, что такое датасет и анализ данных. Спикеры расскажут о своих успешных кейсах, и вы сможете применить полученные знания, а также поупражняться на воркшопах
Каждый день появляются новые способы применения технологий NLP и CV, необходимо постоянно следить за трендами, чтобы оставаться востребованным специалистом
Вы увидите самый передовой опыт коллег и применение последних технологий искусственного интеллекта. Узнаете различные варианты прикладного применения ML алгоритмов
Здесь вы сможете найти себе подрядчика, потому что на конференции собирается весь «цвет» индустрии. А также разобраться, как это все работает и устроено изнутри
Вы познакомитесь с коллегами, получите поддержку, обменяетесь опытом и найдете новых друзей среди позитивных и открытых людей
Вы услышите насыщенные доклады профессионалов по Dаta Science, поучаствуете в воркшопах, получите концентрированную дозу опыта и прокачаете свой уровень
Получите максимум позитива и большой поток энергии. Унесете с собой новые идеи, инсайты и мотивацию
Deep Learning Researcher в Huawei, основатель конференции НейроSet, преподаватель в МФТИ
Кандидат физ.-мат. наук; руководитель исследовательской группы в центре прикладного ИИ Сколтеха; научный сотрудник AIRI
Доктор физико-математических наук, профессор, директор Центра прикладного искусственного интеллекта Сколтеха, руководитель группы Обучаемый интеллект AIRI
Сотрудник Научно-образовательного центра когнитивного моделирования, участник проекта КОД-ИИ Фонда содействия инновациям
Lead DS в Рокет контрол, эксперт в задачах ИИ в промышленности, автор тг канала @DataKatser
к.ф.-м.н., доцент, в.н.с. ФИЦ ИУ РАН & AIRI, директор Центра когнитивного моделирования МФТИ
Ex-CDO/CDS Сбер, CTO Pygma AI, консультант AI стартапов
Исследователь, аналитик, Лаборатория нейронных систем и глубокого обучения МФТИ
CEO в laikadog.ai
Data scientist, предприниматель, исследователь AI, автор и преподаватель курсов по машинному обучению
Разработчик в Datagile
Консультант в Data Science, предприниматель
Д.т.н., научный директор Sber AI Lab, профессор НИУ ВШЭ - Н.Новгород
Старший научный сотрудник, Институт ИИ AIRI
Директор Центра ИИ, НИТУ МИСиС
10:00-10:40
Кандидат физ.-мат. наук; руководитель исследовательской группы в центре прикладного ИИ Сколтеха; научный сотрудник AIRI
В докладе будет рассказано про новые методы на основе потоков и диффузионных мостов для построения генеративных моделей для изображений. Такие подходы являются обобщениям популярных моделей на основе диффузии и уже используются для обучения больших генеративных моделей текст-в-изображение.
10:40-10:50
11:00-11:40
Data scientist, предприниматель, исследователь AI, автор и преподаватель курсов по машинному обучению
Поиск информации - ключевая составляющая не только решения задач, но и качественного обучения.
В процессе образования, преподаватели помогают систематизировать нужную информацию для передачи ученикам, а всегда ли этого достаточно?
Нередко сталкивался с тем, полезной и нужной информации настолько много, что сжимая её до рамок образовательной программы, что-то теряется или остаётся “на потом”.
В своём докладе я собираюсь рассказать, как можно совместить экспертизу преподавателя, внутренних и внешних баз знаний, нейронных сетей для обучения сотрудников
11:40-11:50
12:00-12:40
Консультант в Data Science, предприниматель
Коснемся темы матриц вращений и особенно их версии для многомерных пространств. Матрицы вращений широко используются в задачах 3D моделирования, для контролируемого поворота объекта. Но как оказалось, можно посмотреть на них шире и применить к многомерному латентному пространству диффузионных моделей. И первые опыты показали применимость матриц вращений при решении задачи генерации видео из текста.
12:40-12:50
13:00-14:00
14:00-14:40
Старший научный сотрудник, Институт ИИ AIRI
Директор Центра ИИ, НИТУ МИСиС
Одной из актуальных задач в области искусственного интеллекта является оценка безопасности и соответствия (alignment) больших языковых моделей (LLM) человеческому поведению. Традиционный подход к этой задаче заключается оценивании моделей на классических NLP задачах. Однако, как известно из психологии, эмоции играют ключевую роль в процессе принятия решений у людей, что не учитывается в таких бенчмарках.
В данном докладе будет представлен новый подход, который оценивает поведение LLM в этических и экономических сценариях, принимая во внимание эмоциональные аспекты. Этот метод позволяет выявить внутренние предвзятости (bias) LLM и оценить их поведение с двух точек зрения: схожести с человеческим поведением и оптимальности принятых решений.
14:40-14:50
15:00-15:40
Сотрудник Научно-образовательного центра когнитивного моделирования, участник проекта КОД-ИИ Фонда содействия инновациям
Как локализовать робота или автомобиль в случае отсутствия или потери GPS-сигнала? Как повысить качество детекции циклов в алгоритмах SLAM?
В докладе мы дадим ответы на эти вопросы и обсудим возможности технологии распознавания места, которая с помощью современных моделей нейронных сетей и способов их обучения может добиваться впечатляющих результатов по запоминанию роботом ранее посещенных мест. Особое внимание будет уделено мультимодальным методам, которые принимают на вход сырые изображения камер (сразу нескольких) и облака точек лидаров и на выходе могут получить трехмерные координаты робота на основе сохраненной базы данных.
Мы также представим разработанную нами открытую программную библиотеку OpenPlaceRecognition, которая поддерживает много известных методов распознавания места, а также оригинальные алгоритмы, позволяющие использовать результаты семантической сегментации изображений, распознавания текстовых надписей, Aruco-меток и многое другое.
15:40-15:50
16:00-16:40
Lead DS в Рокет контрол, эксперт в задачах ИИ в промышленности, автор тг канала @DataKatser
Наверное, ни для кого не секрет, что промышленные данные часто являются закрытыми и не публикуются в открытых источниках. Владельцы настолько ценят свои датасеты: до сих пор нет рынка промышленных данных. А область анализа данных и машинного обучения ну очень сильно опирается на открытые разработки, библиотеки, исследования и датасеты. В докладе планирую рассказать о том, где искать открытые промышленные данные, поделюсь накопленными за мои 6+ лет опыта в промышленности и о репозитории, где собираю такие датасеты и расскажу о проблемах с открытыми данными, а также что с этим делать
16:40-16:50
17:00-17:40
Бизнес-аналитик, DeepPavlov.ai
Доклад включает в себя следующие темы:
• Какие задачи можно решать с помощью LLM и что такое промпт
• Для чего нужен Prompt Engineering
• Таксономия методов промпт инжиниринга
• Как ставить эксперименты
• Практические рекомендации
• Несколько полезных продвинутых методов работы с промптами
Будет представлено большое количество полезных кейсов и практических примеров.
17:40-17:50
18:00-18:40
Доктор физико-математических наук, профессор, директор Центра прикладного искусственного интеллекта Сколтеха, руководитель группы Обучаемый интеллект AIRI
Моделирование сложных физических процессов (например, процессов фильтрации на нефтяном месторождении) требует использования вычислительной сетки с миллиардами ячеек. Из-за значительных вычислительных затрат на симуляции в высоком разрешении многие задачи оптимизации, требующие большого количества таких симуляций, становятся невыполнимыми (например, адаптация цифровой геолого-фильтрационной модели). Таким образом, необходима разработка моделей машинного обучения, которые включают в себя элементы моделируемых физических процессов, и позволяют учитывать сложные особенности задачи в более мелких масштабах при работе в крупном масштабе с меньшими вычислительными затратами.
В докладе будет проведен обзор текущего состояния области и предложены новые подходы к решению такого рода задач. В частности, новым многообещающим направлением является использование графовых нейронных сетей для моделирования взаимодействия между пространственными элементами, участвующими в физическом моделировании, для плавного увеличения масштаба с использованием настраиваемых графовых операторов.
18:40-18:50
10:00-10:40
Разработчик в Datagile
Как правило, большая часть данных для аналитики сосредоточена в БД. Современная концепция больших данных в том, что не данные должны идти к модели, а код к направляться к данным. В рамках этой концепции еще в конце 90х в базах данных появилось серверное программирование. А уже в начале 2010-х гг начались разработки прикладных ML библиотек непосредственно внутри БД. Как пример - это решение от Google BigQuery или Apache MadLib - первая открытая ML библиотека для PostgreSQL. В 2023 г - PostgreSQL стала самой популярной БД в открытых проектах и в ней в последнее время стали появляятьтся новые AI библиотеки. Какие задачи можно решать непосредственно в PostgreSQL? Это регрессия, классификация, рекомендации, детекция, ранжирование, работа с текстом. На примере будет продемонстрированы возможности работы таких библиотек, как MadLib, PostgresML, pgvector а так же представлена разработка собственной библиотеки pg_ml, основанной на фреймворке CatBoost.
10:40-10:50
11:00-11:40
Д.т.н., научный директор Sber AI Lab, профессор НИУ ВШЭ - Н.Новгород
В докладе расскажу про добавление эмоциональности в мультимодальные диалоговые системы. Подробно расскажу про эффективные алгоритмы онлайн распознавания выражений лиц на видео. В конце затрону мультиагентную генерацию эмоциональных ответов LLM с учетом результатов распознавания эмоций по видео
11:40-11:50
13:00-14:00
14:00-14:40
CEO в laikadog.ai
• Введение, о чём доклад, какие результаты получим в конце
• Сбор и подготовка данных
• Подходы к обучению
• Где и как запустить самому, сколько это стоит
• Анализ артефактов после обучения
14:40-14:50
15:00-15:40
Deep Learning Researcher в Huawei, основатель конференции НейроSet, преподаватель в МФТИ
Последние несколько месяцев активно обсуждается перспективная альтернатива для Многослойного перцептрона (MLPs) – Kolmogorov Arnold Networks (KANs). В KANs нет обучения линейных весов – вместо этого тренируются нелинейные функции активации. Эта архитектура позволяет по сути обучать математические формулы на признаках, благодаря чему их проще визуализировать и интерпретировать результаты. Также, есть основания полагать, что KANs обладают более быстрыми законами масштабирования нейронных сетей (scaling laws) по сравнению с MLPs и для некоторых задач меньшим количеством параметров достигают сопоставимого качества, что может быть особенно полезным для обучения более продвинутых LLM моделей.
В докладе мы подробно обсудим особенности работы KANs, их плюсы и минусы, сравнив их с MLPs. Разберемся для каких задач сейчас имеет смысл использовать KANs. Посмотрим, какие есть модификации и оптимизации KANs. Рассмотрим свертки на их основе и прочие реализации уже знакомых слоев, сетей и блоков с KANs под капотом.
15:40-15:50
16:00-16:40
Ex-CDO/CDS Сбер, CTO Pygma AI, консультант AI стартапов
В докладе будет рассмотрена проблема персонализации автономных мультиагентных интеллектуальных систем. Особое внимание будет уделено ключевым компонентам интеллектуальных агентов и уровням их автономности. Будут представлены различные подходы к обеспечению автономности агентов, а также краткому обзору и анализу фреймворков для разработки мультиагентных систем. Методы персонализации агентов будут проиллюстрированы на примере задачи ведения блога в социальных сетях
16:40-16:50
18:00-18:40
к.ф.-м.н., доцент, в.н.с. ФИЦ ИУ РАН & AIRI, директор Центра когнитивного моделирования МФТИ
В докладе обсудим современные тенденции в использовании трансформерных архитектур в обучении с подкреплением. Поговорим о задачах, где нужна память, а также о том, что не так с контекстом трансформера. Обсудим и альтернативные подходы с Мамба, SSM и с токенами памяти в стиле RATE
18:40-18:50
Основная цель проекта – повышение профессионального уровня знаний специалистов, исследователей и инженеров, связанных с Data Science и искусственным интеллектом. Живое общение и обмен опытом позволят участникам конференции быть в курсе последних достижений и тенденций в этих областях.
Конференция рассчитана на специалистов уровня Middle и выше в области Data Science и искусственного интеллекта. Однако, доклады будут полезны и актуальны для участников на любом уровне профессионализма, ведь эти отрасли постоянно развиваются и предлагают новые возможности.
Да, если вы только начинаете свой путь в Data Science и искусственном интеллекте, конференция DataStart будет вдвойне полезна. Вы сможете получить ценную информацию из первых уст от опытных специалистов и познакомиться с людьми, которые смогут объяснить сложные понятия простыми словами и помочь вам в вашем профессиональном развитии.
Конференции DataStart проходят со средней частотой два-три раза в год, что позволяет участникам быть в курсе актуальных тенденций и новых разработок в области Data Science и искусственного интеллекта. Этого времени как раз хватает на то, чтобы у вас накопились вопросы и появилось желание погрузиться в новую порцию знаний.
Для участия в конференции DataStart необходимо зарегистрироваться на сайте мероприятия и оплатить участие. Стоимость билетов варьируется в зависимости от выбранного типа (стандартный, VIP, студенческий) и времени покупки (ранняя регистрация, стандартная или последний момент). На сайте конференции предоставлена подробная информация о стоимости билетов и возможных скидках.
Конференция DataStart собирает ведущих специалистов и экспертов из разных компаний, работающих в области искусственного интеллекта и Data Science. Участники смогут послушать доклады от представителей крупных технологических гигантов, успешных стартапов и академических институтов. Список спикеров и подробная программа конференции доступны на сайте мероприятия.
Команда DataStart скоро с Вами свяжется
Письмо с видеозаписями придет после подтверждения почтового адреса
Вся дальнейшая информация и доступ к трансляции через Личный кабинет
Перейти в Личный кабинетПригласить друзей: