Проекты

Воркшопы по обработке естественного языка

2023-12-11
Центр МАСТ проводит воркшопы по изучению и применению методов обработки естественного языка (NLP), в рамках которых участники работают над групповыми проектами на базе уникальных тематических датасетов.

Студенческий хакатон «ХАРТ» по визуализации данных в области культуры

2022-08-25
2022-11-30
«ХАРТ»​​​​​​​ – студенческий хакатон, организованный Прикладным центром Машинного обучения, анализа данных и статистики (ПЦ МАСТ) и Школой искусств и культурного наследия Европейского университета в Санкт-Петербурге.  Темой хакатона стала визуализация данных в области культуры, таких как большие данные о музеях, о коллекциях и архитектурных объектах.  

Собирать и выставлять: База данных о художественных выставках и коллекциях в Российской империи

2022-08-12
Сайт проекта Проект «Собирать и выставлять в Российской Империи» построен вокруг двух неразрывно связанных составляющих художественной жизни – экспонировании и коллекционировании произведений искусства.

RUSCAN

2021-11-03
RUSCAN — проект, объединяющий онкоэпидемиологические исследования и визуализацию данных раковых регистров: трендов заболеваемости и смертности, рисков развития рака, выживаемости пациентов с онкозаболеваниями.

Открытая база данных междисциплинарного искусства в России (МИР)

2021-10-04
Открытая база данных междисциплинарного искусства в России (МИР). Проект Европейского университета в Санкт-Петербурге и Техно-Арт-Центра реализуется при поддержке Фонда президентских грантов, центр МАСТ осуществляет разработку и поддержку базы данных

Рабочее время специалистов по госзакупкам в регионах России (по данным ЕИС «Закупки»)

2021-10-03
2021-12-31
Задача проекта — определить границы рабочего дня и объем рабочего времени у специалистов по государственным закупкам в разных регионах России. Исследование проводится на основе данных о времени размещения договора на сайте zakupki.gov.ru за 2015–2021 гг. 

You Shall Not Parse

2021-10-01
2022-06-30
Центр разрабатывает универсальный парсер для тех форматов файлов, с которыми чаще всего работают исследователи в области социальных и гуманитарных наук.

Samwise

2021-10-01
2022-06-30
Центр разрабатывает библиотеку для Python, которая в ущерб времени позволит проводить масштабные вычисления даже с ограниченными возможностями оперативной памяти компьютера.

МузеоГраф

2021-09-01
Проект по созданию доступной и удобной системы поиска на основе открытых данных Государственного каталога Музейного Фонда России. 

Оценка эффективности национального проекта «Безопасные качественные дороги» (БКД) (2019-2030)

2021-07-01
2021-12-31
На основе базы данных, собранных из открытых источников, исследователи строят математические модели для оценки эффектов воздействия ремонта дорог, оценивают эффективность нац. проекта «Безопасные качественные дороги» в том числе по показателю смертности и формируют предложения по дальнейшей организации дорожных работ.

Автоматизированное распознавание текста эпитафий на фотографиях еврейских надгробий

2021-07-01
2022-06-30
На материалах, предоставленных центрами «Петербургская иудаика» и «Сэфер», МАСТ ведет разработку инструмента, позволяющего автоматически распознавать тексты эпитафий по фотографиям еврейских надгробий.  Такой инструмент не только существенно сократит время, которое исследователи тратят на расшифровку текста вручную, но и позволит анализировать большой массив текстов эпитафий как данные, ставя новые исследовательские вопросы.