Уже несколько лет подряд преподаватели и сотрудники ПАНДАНа и центра МАСТ Европейского университета в Санкт-Петербурге принимают участие в организации мастерской по автоматическому анализу текстов на базе Летней школы.
Летняя школа — это ежегодный образовательный проект для школьников и взрослых междисциплинарной направленности. Школа проводится в формате полевого лагеря на берегу Волги. В 2025 году она проходила со 2 июля по 3 августа. На протяжении двух–трех недель участники живут в палатках, питаются едой, приготовленной на костре, и проводят много времени с людьми, разделяющими их интересы.
В свободное время от занятий участники занимаются историческими танцами, играют в бадминтон, фехтуют, рисуют, пишут стихи, сочиняют песни и делают множество других интересных вещей.
Что было нового в 2025?
Во-первых, участников разделили на два потока: начинающих слушателей и продвинутых пользователей Python. Во-вторых, студенты с первого же дня работали над большими проектами, поэтапно применяя освоенные методы.
Комментарий Яны Сосновской, исследовательницы программы ПАНДАН:
Я попала на Летнюю школу еще в 2022 году в качестве координатора мастерской и с тех пор участвую в ее организации уже в четвертый раз. По моим наблюдениям, создание двух параллельных треков и пересбор модели работы над проектами улучшили результаты мастерской по сравнению с предыдущими годами.
Автор фото @Elena_M_Kalinina
Идеи для проектов и датасеты предоставили партнеры мастерской по автоматическому анализу текстов. Всего было шесть проектов: от Полины Колозариди (DH-ИТМО), Центра Прожито Европейского университета в Санкт-Петербурге, Института проблем правоприменения, программы прикладного анализа данных ЕУСПб (ПАНДАН), Центра «Искусство и Искусственный Интеллект» и проекта PhytoLex.
Комментарий Александра Вильховенко, исследователя программы ПАНДАН:
И вот мы снова приехали в лес, программировать под соснами. В прошлом году мы рассказывали про свои новые впечатления, а в этот раз мне бы хотелось восхититься тем, как продуктивно прошла работа над проектами. За 2 недели ребята плотно поработали с предложенными данными и задачами. Некоторые даже успели сделали полезные инструменты. Так, ребята, работавшие с корпусом «Прожито» воплотили инструмент поиска по ключевым словам в дневниках, а команда, работавшая над данными с форумов LizaAlert, вычистила огромное количество данных и подсветила проблемы цифровизации таких корпусов. Перечислять их успехи можно долго, и — может быть — это превратится во что-то большее, например масштабные совместные проекты. ЛШ — это не только про учебу, но и про практическую пользу и общение.
Автор фото Яна Сосновская
В этом году мастерская по автоматическому текстовому анализу провела четвертый набор участников. Ежегодно она обновляет программу, подбирает новых специалистов в своей области и помогает участникам за две недели начать больше понимать программирование в неформальной обстановке.
Автор фото Яна Сосновская
Если вы интересуетесь компьютерной обработкой языка и хотите обрести новые социальные связи из узкоспециализированной области и стать частью сообщества, пробуйте свои силы в 2026 году.