29–30 октября в особняке Серебряковой прошел студенческий хакатон «ХАРТ», организованный Прикладным центром Машинного обучения, анализа данных и статистики (ПЦ МАСТ) и Школой искусств и культурного наследия Европейского университета в Санкт-Петербурге. Подводим итоги и делимся результатами работы команд.
Темой хакатона стала визуализация данных в области культуры, таких как большие данные о музеях, о коллекциях и архитектурных объектах. Что чаще всего изображалось на полотнах эпохи Возрождения в разных странах? На музеи каких регионов приходится наибольшее число посещений? Какие архитектурные стили превалировали на территории Васильевского острова в разные века и как составить культурный маршрут с помощью интерактивной карты? Какие слова чаще всего встречаются в названии скульптур и в каких регионах прошло больше всего выставок для слабовидящих? Ответы на эти вопросы можно найти в визуализациях, созданных участниками хакатона.
Мы получили более 100 заявок от студентов со всей России, и отобрали 30 человек для участия в насыщенной двухдневной программе хакатона. Опыт работы с данными для участия не был обязателен. Было сформировано шесть команд, каждая из которых работала над выбранным датасетом.
Узнать основы анализа и визуализации данных участникам помог дата-журналист и специалист по визуализации данных Андрей Дорожный. Он рассказал, зачем необходимо визуализировать данные, как работает визуализация данных и как избежать ошибок при выборе графика и работе над его элементами.
Во время изучения теории участники создали первые визуализации с помощью ручки и бумаги, а затем приступили к созданию собственных визуализаций в инструменте Tableau при поддержке наставников команд — дизайнера инфографики Константина Мшагского и дата-художницы Натальи Киселевой, автора канала Дата-комиксы, а также Дианы Бадалян –—студентки второго курса магистратуры Прикладной анализ данных (ПАНДАН). Участников поделили на шесть команд и предложили выбрать любой понравившийся датасет.
Первая команда — Арсений Кустов, Яна Хлусова, Демид Похильчук, Елена Багдиян. Участники исследовали, как в регионах России реализуется государственная программа по созданию инклюзивной среды в музеях. Для этого они использовали открытые данные Министерства культуры «Музеи. Сводные данные. Статистическая информация».
Вторая команда — София Бердыева, Диана Зинченко, Юлия Морева, Анна Самосудова, Евгения Хавронина. Они решили визуализировать, какие объекты увидела нейросеть на картинах Эрмитажа, созданных с 1700 по 1900 год. Датасет, с которым работали участники, был подготовлен научным руководителем и исполнительным директором лаборатории «Искусство и искусственный интеллект» Олегом Лашмановым специально для участников хакатона. Участники команды, исследовали какие предметы чаще всего изображают на картинах разных стран, и узнали, что большая часть картин независимо от географии содержит изображения людей.
Третья команда — Александра Тихоненко, Валерия Моисеева, Денис Ленкевич, Никита Ивановс и Ядвига Синявская. Участники также решили использовать датасет Министерства Культуры со статистической информацией о музеях России, но задали ему новые вопрос. Куда ехать, если хочется в тур по музеям? Где придется потолкаться, а где можно наслаждаться шедеврами целую вечность? Музеи в каких регионах лучше всего охраняются?
Четвертая команда — Екатерина Григораш, Ильяс Асланов, Надежда Лещук, Мария Пономаренко, Оксана Иванова. Датасетом для этой команды стали данные «Карты возраста домов», интерактивного проекта картографа Никиты Славина. Участники разработали культурный маршрут по Васильевскому острову, а также создали рейтинг архитектурных стилей Васильевского острова по векам.
Пятая команда — Георгий Катречко, Анна Абрамова, Артур Печерских, Полина Колосова, Вера Карзакова. Эта команда взяла датасет с данными о живописных полотнах из Эрмитажа, обработанных нейросетью. Они стремились узнать, какие названия картин, объектов, имен персонажей встречаются в датасете чаще всего? Как часто нейросеть ошибается в определении объектов и каковы самые очевидные ошибки нейросети, а самое главное, как их искать?
Шестая команда — Мария Погодина, Зарина Афанасьева, Дарья Ромакер, Дари Батожаргалова, Екатерина Бондаренко. Участники изучали раздел «Скульптура» в открытых данных Государственного каталога Музейного Фонда РФ. В процессе создания визуализаций удалось узнать, что Пермский край — второй регион по богатству фонда скульптур, а также имя самого продуктивного скульптора Госкаталога.
Мы благодарим участников, наставников и всех, кто помогал в создании хакатона, и надеемся на новые встречи!