Воркшопы ПАНДАНа на Книжных аллеях 2024

Добавить в календарь 2024-07-31 17:30:00 2024-07-27 12:40:42 Воркшопы ПАНДАНа на Книжных аллеях 2024 Description Прикладной анализ данных info@eusp.org Europe/Moscow public
Дата:
31.07.2024
Время:
17:30
Организатор:
Прикладной анализ данных

ПАНДАН приглашает на воркшопы на «Книжных аллеях». 31 июля с 17:30 до 20:00 соруководитель программы ПАНДАН Иван Бибилов и выпускник магистратуры Ильяс Асланов проведут два воркшопа по парсингу данных в рамках Недели науки фестиваля «Книжные аллеи». 

«Книжные аллеи» — это сезонный книжно-просветительский проект, запущенный по инициативе Правительства Санкт-Петербурга и творческих писательских союзов города. Впервые проект был реализован в 2015 году, а в 2024 году открылся уже 10 сезон. 

Команда ПАНДАНа проведет два воркшопа по парсингу данных сайтов «старого интернета» и ретровидеоигр. Базовое знание языка программирования Python пригодится, но не обязательно. 

  • 17:30–18:30 BeautifulSoup и Selenium: рецепт «вкусного» «народного» парсинга
    Спикер: Ильяс Асланов, выпускник магистратуры ПАНДАН ЕУСПб

Уникальным хранилищем таких необработанных данных цифрового наследия является портал Narod.ru — бесплатный хостинг от компании Яндекс, функционировавший в 2000-х годах. Narod.ru содержит уникальную с исследовательской точки зрения информацию: более миллиона сайтов эпохи раннего Рунета. Тем не менее единого архива или датасета с данными сайтов Narod.ru не существует, что значительно усложняет доступ социологам, антропологам и другим ученым к потенциальному объекту исследования.

В ходе воркшопа будет продемонстрирован процесс создания парсера для сбора данных с помощью языка программирования Python и библиотеки для парсинга веб-страниц BeautifulSoup. Также будет затронута работа с Selenium — инструментом, который имитирует работу пользователя в браузере и используется для автоматизации сбора скриншотов сайтов.

  • 18:45–20:00 Дружелюбный хакинг ретроигр
    Спикер: Иван Бибилов, соруководитель программы прикладного анализа данных (ПАНДАН) ЕУСПб

Видеоигры давно стали частью цифрового культурного наследия. Их сценарная часть часто не уступает литературным произведениям. Однако многие элементы недоступны для исследователя за пределами самой игры: сценарии действий персонажей, элементы геймплея, элементы визуального оформления. Игры являются примером сложной системы, извлечение данных из них может быть вызовом. Во время воркшопа мы попробуем сложный парсинг, чтобы извлечь данные из «старых» игр, сделав их доступными для дальнейшего изучения, в том числе инструментами анализа данных. 

Подробнее о программе и поступлении можно прочитать на сайте программы.

Мероприятие состоится очно и онлайн. Для участия в любом из этих форматов зарегистрируйтесь на Timepad.

 

Фото из архива Книжных аллей, фотограф: Константин Бордюгов

Регистрация