15 апреля в особняке Серебряковой пройдет воркшоп по анализу данных. Воркшоп — результат сотворчества двух центров Европейского университета: прикладного центра МАСТ (центр Машинного обучения, анализа данных и статистики) и лаборатории «Искусство и искусственный интеллект».
Он будет полезен студентам, которые задумываются о поступлении в магистратуру и на ДПО программы «ПАНДАН» (Прикладной анализ данных в социогуманитарных областях) и новую магистратуру Школы искусств и музейного наследия — «Музейные исследования и кураторские стратегии».
Обе программы ориентированы на подготовку специалистов, которые будут способны применять навыки анализа, разметки и визуализации данных в социогуманитарных науках, в том числе в области музейных технологий. Воркшоп позволит участникам больше узнать о технологиях, преподаваемых на программах, попробовать на практике полученные знания под руководством наставников, а также задать интересующие вопросы о поступлении. Предварительные знания в области программирования не требуются.
Воркшоп пройдет в двух частях:
-
Пауки + роботы: королевство автоматизации во вселенной данных.
Иван Бибилов
Директор Прикладного центра машинного обучения, анализа данных и статистики (ПЦ МАСТ); Руководитель программы прикладного анализа данных (ПАНДАН)
Воркшоп посвящен скрепингу и парсингу данных из различных источников. Представим, что мы хотим ответить на вопрос, что чаще бывает в меню школ c котлетками: макароны или пюре. У нас есть очень много сайтов школ, где есть повседневное меню. Иногда в лучших традициях автоматизации: это фотография распечатки документа, которая представлена в виде pdf-документа. А может быть иногда и Excel. Необходимо пройтись по тысяче документов и накопить статистику. Далее автоматизировать рутинные действия.
Навыки могут быть применимы как в исследовательских целях, так и в рабочих и бизнес-задачах. А также в быту (наконец-то разобрать свой архив за десятки лет).
Что изучим:
- Создание собственного датасета
- Автоматизация поиска и извлечения информации с сайтов и жестких дисков
- Работа с изображениями и текстами. Различные форматы файлов
- Сценарии на языке Python
- Утилиты и библиотеки
-
Картинки в текстовом пространстве
Олег Лашманов
Научный руководитель и исполнительный директор Лаборатории «Искусство и искусственный интеллект»
Когда у вас много изображений всегда хочется найти среди них интересные или содержащие какой-то предмет. Но как это сделать? Просматривать тысячи фотографий скучно и долго. В такие моменты приходят на выручку алгоритмы машинного обучения.
Что изучим:
- Создание собственного датасета
- Zero-shot алгоритмы для поиска по изображениям
- CLIP, BLIP и трансформация изображений в вектор
Для участия необходимо зарегистрироваться. Также мы просим участников, которые придут оффлайн, принести свои ноутбуки. Планшеты и смартфоны для практики не подойдут. Вы можете взять с собой любой работающий ноутбук, однако если возможности принести его нет, пишите нам на почту ievseeva@eu.spb.ru — мы постараемся вместе решить этот вопрос.