Центр МАСТ рад объявить о проведении первого воркшопа по обработке естественного языка (NLP), в рамках которого участники будут работать с датасетом произведений лауреатов крупнейших российских литературных премий.
Воркшоп «Изучение языкового разнообразия литературных премий» состоится 20–21 апреля в стенах Европейского университета. Мероприятие позволит участникам, уже знакомым с инструментами для анализа данных, глубже изучить область обработки естественного языка и применить полученные знания на практике под руководством опытных кураторов.
Приглашенные эксперты, Эдуард Клышинский (НИУ ВШЭ), Вероника Зыкова (НИУ ВШЭ), Евгения Заковоротная (НИУ ВШЭ), Яна Сосновская (ЕУ СПб) и Александр Вильховенко (ЕУ СПб) расскажут о инструментах работы с NLP и области их применения. У участников будет возможность поработать с разнообразным корпусом литературных текстов: от лауреатов книжных премий и профильной литературы до фан-прозы. На протяжении двух дней участники воркшопа будут работать в командах над своими исследовательскими проектами с применением методов машинного обучения с поддержкой кураторов. По итогам воркшопа планируется публикация проектов участников.
Для участия вам потребуется:
- рабочий ноутбук (если у вас нет рабочего ноутбука, напишите нам и мы попробуем что-нибудь придумать);
- базовые знания Python (основы работы с постобработкой данных, pandas, numpy);
- знание классификации текстовых данных.
Воркшоп является частью стратегии Центра МАСТ по развитию исследований с применением NLP.
Прием заявок
Прием заявок проводится по этой ссылке и будет открыт до 3 апреля 2024 года включительно. Подача заявки включает в себя выполнение задания. По всем вопросам вы можете обращаться к менеджеру воркшопа Елизавете Злобиной (e.zlobina@eu.spb.ru).
UPD: прием заявок продлен до 8 апреля 2024 г. включительно.
Свяжемся со всеми, кто отправил заявку, не позднее 15 апреля 2024 г.
Программа воркшопа
- В первый день, 20 апреля, пройдут лекции Эдуарда Клышинского на темы «Как правильно вести исследование в NLP», «Предобработка в зависимости от разных видов моделей», лекция Вероники Зыковой на тему «Языковые модели», лекция Евгении Заковоротной на тему «Извлечение именованных сущностей». Также предусмотрено время для групповой работы.
- Во второй день, 21 апреля, продут лекции Александра Вильховенко на тему «Тематическое моделирование», Вероники Зыковой на тему «Языковые модели с использованием Hugging Face», Яны Сосновской и Евгении Заковоротной на тему «Ключевые инструменты для генерации и проверки гипотез». Также предусмотрено время для групповой работы, после которой пройдет презентация групповых проектов в формате печа-куча.
Обращаем внимание, что программа мероприятия может быть незначительно изменена. Следите за обновлениями и оставайтесь на связи!