15 октября в Европейском университете прошел круглый стол «Революция данных. Перезагрузка». Встреча была приурочена к запуску образовательной программы «ПАНДАН», на которую ЕУСПб и компания «Яндекс» набирают людей, далеких от математики и программирования, чтобы обучить их анализу данных.
В круглом столе, прошедшем в Гагаринском зале университета, приняли участие ректор Вадим Волков, генеральный директор компании «Яндекс» в России Елена Бунина, со-директора ПАНДАНа Ника Костенко и Иван Бибилов и ассоциированный профессор ПАО «МТС» по эмпирико-правовым исследованиям Дмитрий Скугаревский.
Открывая дискуссию, Вадим Волков рассказал, что Европейский университет пришел к практике анализа и сбора больших данных не сразу. Изначально он задумывался как аспирантский и магистрантский постдипломный колледж по социальным и гуманитарным наукам без компьютерных наук, математики и физики. Однако произошедшая революция данных внесла свои коррективы. В университете стали проводить исследования, связанные со сбором и анализом больших данных, что первым начал делать Институт проблем правоприменения.
Сегодня в Европейском собирают и анализируют данные в области образования, общественной и гражданской активности; появился центр «Прожито», который оцифровывает письма и дневники. В 2019 году возникла идея создать программу по прикладному анализу данных.
«Мы очень рады, что при первых запросах о том, чтобы попытаться соединить социальные и гуманитарные науки с современными возможностями анализа данных, машинного обучения, компания «Яндекс» откликнулась, и за год мы создали эту программу», — отметил ректор.
Елена Бунина рассказала, что «Яндекс» не первый год экспериментирует над созданием программ на стыке анализа данных и предметных областей. Высококвалифицированных специалистов по этому направлению найти непросто, поэтому «Яндекс» выращивает специалистов сам (в Школе анализа данных) или в сотрудничестве с университетами, в первую очередь, техническими.
В «Яндексе» сегодня работает чуть более 10 тысяч штатных сотрудников. Половина из них — это специалисты с техническим образованием, в том числе разработчики с математическим бэкграундом. Они продолжают оставаться ценным звеном компании, а спрос на таких специалистов не перестает расти.
При этом за последние два года в компании в 2–3 раза вырос спрос на сотрудников по околотехническим направлениям — специалистов, владеющих знаниями и навыками на стыке социально-гуманитарных и технических наук. В частности, на 200% выросло количество вакансий для менеджеров проектов, на 260% — менеджеров продуктов. Предполагается, что эти сотрудники обладают не только хорошими аналитическими способностями для систематизации информации, коммуникативными навыками для общения с командой разработчиков («становятся переводчиками между двумя мирами — физиков и лириков»), но и знакомы с техническим стэком (например, умеют программировать, хотя бы немного, и владеют терминологией разработчиков).
Образовательные программы на стыке технических и социально-гуманитарных наук могут не только способствовать ускорению процесса поиска и найма подходящих сотрудников, считает Елена Бунина, но и дадут толчок к появлению новых социально значимых проектов в медицине, образовании, социальной работе. Сегодня «Яндекс» уже работает над такими социально значимыми сервисами, как помощники для учителей (например, Яндекс.Учебник), врачей, маломобильных групп населения и пожилых. Кроме того, программы по прикладному анализу данных позволят сформировать ядро кадров для проведения масштабных междисциплинарных исследований в таких экстремальных и глобальных ситуациях как пандемия коронавируса.
«Мы хотим, чтобы те, кто любит историю, искусствоведение, политологию и другие социальные и гуманитарные науки, соединили это с умением анализировать большие данные, навыками программирования, не боялись пробовать себя в технических областях. Из этого сочетания может получиться что-то очень интересное», — отметила Елена Бунина.
«Пандан» на круглом столе представили со-директоры программы — Ника Костенко и Иван Бибилов. Они рассказали, что за время обучения участникам программы предстоит прослушать 11 из 14 курсов и поработать над настоящим исследовательским проектом, который реализуется в одном из научных центров ЕУ. Самый непростой модуль — первый. В рамках него слушатели изучают два языка программирования, R и Python, статистику, вызовы в общественных науках, а также технический минимум, необходимый для работы с данными.
Данные для работы над проектами участникам программы предоставят исследовательские центры и факультеты Европейского университета: центр «Прожито», «Петербургская иудаика», группа исследователей блокады Ленинграда, а также факультет истории искусств (проект «Госкаталог»).
«Наша цель, чтобы команда каждого проекта почувствовала, что это их проект, им в этом проекте интересно, и чтобы коллеги из предметных областей тоже получили некоторый позитивный опыт работы с нами. Мы продолжим работать и консультировать, внедрять некоторые решения и после окончания обучения. Решения, не только связанные с анализом данных, но и в том числе инфраструктурные», — подчеркнул Иван Бибилов.
Иллюстрацию того, как данные операционной деятельности организации могут превратиться в исследовательские вопросы для социальных наук, привел Дмитрий Скугаревский. Исследуя данные системы переводов денег заключенным или находящимся под стражей «ФСИН-деньги» за период с 2017 года по настоящее время, команде Института проблем правоприменения удалось измерить степень поддержки заключенных в зависимости от того, насколько место заключения удалено от места проживания близких. Они пришли к выводу, что отдаленность от города проживания заключенного ведет к заметному падению финансовой поддержки. Это, в свою очередь, говорит о необходимости проведения реформ в системе исправительных учреждений.
«Если дистанция влияет на уровень поддержки, одновременно уровень поддержки влияет на то, как быстро человек совершит следующее преступление, логично предположить, что надо перестраивать систему исправительных учреждений, чтобы направлять людей ближе к их месту проживания. Но здесь, в России по крайне мере, данные останавливаются. Данные о том, где, когда, какой человек после освобождения совершил повторное преступление в стране не собираются. Это уже проблема не частной компании, которая производит переводы, а системы исправления наказаний, которая не задумывается над этим вопросом», — заключил Дмитрий Скугаревский.
После выступлений участники ответили на вопросы коллег. Иван Бегтин (Информационная культура, Открытые данные) прокомментировал выступления, заметив, что спрос на тех специалистов, которых готовит ПАНДАН, сейчас постоянно растет.