Магистратура
Направление «Социология»

Вычислительная социология

Поступить Задать вопрос
Срок обучения: 2 года
Мест: 15
Язык: Русский

О программе

Программа объединяет три сферы: социологию, науки о данных и исследования причинности. Социологические курсы помогают разобраться в теории и в основных подходах к объяснению социальных явлений. Курсы по программированию на R и Python и по аналитике данных дают инструменты для проверки предположений о закономерностях в поведении людей. Наконец, курсы, посвященные каузальности, учат создавать правильные исследовательские дизайны, позволяющие определять причины и следствия, и проводить каузальный анализ данных. Наша цель — развить социологическое воображение наших студентов, научить их видеть механизмы, стоящие за теми или иными социальными феноменами, и анализировать эти механизмы с помощью наиболее подходящих методов.

Любые объяснения, которые мы даем, каузальны по своей природе: объяснить — значить найти причину и следствие и раскрыть, каким образом одно ведет к другому. Именно в объяснениях заинтересованы как ученые, так и практики: мы не просто хотим знать, что происходит, но и понимать, почему. Однако большинство дизайнов сбора и методов анализа данных не позволяют в реальности проверять эти механизмы. Обычно мы просто ищем связи и дальше предполагаем каузальность вместо того, чтобы устанавливать и проверять ее. Наша программа создана, чтобы преодолеть этот разрыв, обучив студентов не только видеть теоретические механизмы, но и создавать специфические дизайны и применять методы для их анализа — от ставших уже стандартом АБ тестов до более сложных традиционных методов анализа причинности (разрывная регрессия, модели разницы разниц, matching) и самых современных подходов к майнингу казуальности из данных с помощью машинного обучения.

Выпускники нашей программы научатся видеть смысл в данных, соединяя навыки, взятые из социальных наук и наук и о данных. Они будут способны использовать широкий спектр методов анализа данных, включая последние разработки в сфере машинного обучения и интерпретируемого искусственного интеллекта. При этом особенность программы в том, что она не просто фокусируется на большом количестве разнообразных методов, но учит применять эти методы к реальным задачам реальных организаций. Такой широкий спектр умений позволит найти себя в индустрии высоких технологий — в аналитике, управлении проектами и R&D департаментах компаний; в государственном секторе, где навыки оценки социальных программ играют важную роль, а также в науке, где каузальные исследования ценятся наиболее высоко.

Узнать подробную информацию о ходе приемной кампании, а также подать документы вы можете здесь:

Обязательные курсы

Введение в программирование на R

Курс знакомит студентов с языком программирования R и средой разработки RStudio. Учащиеся освоят основы синтаксиса, работу с данными, создание визуализаций с помощью ggplot2, а также научатся оформлять аналитические отчеты в RMarkdown. Ключевые темы: основы программирования в R (переменные, структуры данных, функции); импорт и обработка данных (dplyr, tidyr); визуализация данных (ggplot2); создание динамических отчётов в RMarkdown. Студентам также покажут наиболее современные ИИ-инструменты, помогающие изучать программирование и упрощающие сам процесс кодинга.

Аналитическая социология

Курс посвящен работе с теорией в вычислительной социологии. Студентов познакомят с одним из ключевых для вычислительной социологии подходов — аналитической социологией. Студенты разберут, как строится объяснение в социальных науках, какие концепты можно рассматривать в качестве основополагающих и как их можно использовать для объяснения поведения и для генерации новых теорий. Ключевые темы: объяснение в социальных науках; теория среднего уровня; модель DBO: desires, beliefs, opportunities; нормы; коллективное принятие решений и коллективное поведение; эмоции.

 

Иностранный (английский) язык

Анализ данных — 1

Базовый курс представляет собой введение в количественный анализ данных. При этом он будет интересен как новичкам, так и тем, кто уже знает основы анализа данных: мы сразу разберем принципы симуляции данных для оценки неуверенности (uncertainty) и внедрим этот подход в анализ данных. Также мы уделим большое внимание power analysis и тому, для каких целей можно использовать предельные эффекты. Ключевые навыки, которым будут обучаться студенты, помимо собственно методов анализа, включают способность определять уместность и необходимость изученных методов для решения конкретных задач, а также умение давать содержательную интерпретацию результатов анализа. Ключевые темы: распределения; типы гипотезы и простые тесты; симуляция данных для проверки гипотез; линейная регрессия; логистическая регрессия; методы снижения размерности (факторный анализ, кластерный анализ).

Введение в программирование на Python

Курс предназначен для освоения основ программирования на Python — одном из самых популярных языков в Data Science, аналитике и автоматизации. Студенты познакомятся с базовым синтаксисом, структурами данных, работой с функциями и модулями, а также научатся решать практические задачи. Ключевые темы: основы Python (переменные, операторы, циклы, условия); работа со структурами данных (списки, словари, множества); функции и модули (создание и использование); чтение и запись файлов (текстовые, CSV); основы ООП (классы и объекты). Студентов обучат работе с ИИ-помощниками (Copilot и аналогами).

Качественные методы

Курс призван познакомить слушателей с качественной методологией социологического исследования. Он будет сфокусирован на двух основных направлениях: 1) концептуализация и дизайн качественного исследования; 2) конкретные методы сбора данных и навыки эмпирической работы. Большая часть занятий будет проходить в формате семинаров. На протяжении курса студентам предстоит выполнить собственный исследовательский проект в рамках качественной методологии (приветствуются проекты, связанные с темой магистерской диссертации), а также принять участие в коллективном исследовательском проекте (с применением стратегии case study).

 

Машинное обучение: продвинутый уровень

В рамках данного курса студенты познакомятся с основными направлениями причинно-следственного анализа в машинном обучении. В эпоху больших данных методы машинного обучения, в частности их комбинация с дата-майнингом (causality mining), начинают играть ключевую роль в ответе на сложные научные вопросы, принятии управленческих решений, объяснении поведения социальных акторов, предсказании социально-экономических событий и в других важных социальных сферах. Это станет одной из тем нашего обсуждения. Мы также покроем современные подходы к причинно-следственному выводу в машинном обучении, в частности, наработки команды В. Черножукова по двойному де-смещенному машинному обучению. Данный подход полагается на простые теоретико-статистические основания, при этом поможет слушателям применять весь спектр современных ML-методов (L1/L2, ансамбли, случайные леса и др.) для анализа данных. В конце курсах мы также покроем основные идеи, техники и решения объяснимого искусственного интеллекта (xAI) и машинного обучения для обеспечения ключевых параметров научного исследования, таких как возможность интерпретации результатов моделирования и прозрачности аналитического процесса.

 

Технологии программирования

Курс знакомит студентов с методологией разработки программного обеспечения, включая парадигму объектно-ориентированного программирования, а также шаблоны проектирования. Особое внимание уделяется углубленному знакомству с методологией объектно-ориентированного программирования, получению навыков работы в современных IDE, включая профилирование и отладку, а также приемы рефакторинга, получению навыков работы с трехзвенной архитектурой и архитектурой клиент-сервер, получению навыков веб-разработки, получению навыков развертывания ПО на серверах, пакетирования приложений в различные контейнеры.

Семинар по СSS

Семинар по CSS (Computational Social Science, Вычислительным социальным наукам) подразумевает глубокое знакомство студентов с разными аспектами вычислительных социальных наук. Семинар будут вести как штатные преподаватели, так и приглашенные эксперты, которые помогут разобраться со специфическими аспектами подхода. Семинар сфокусирован на развитии как «твердых» навыков — таких как работа с теорией, разработка разнообразных дизайнов исследований, оценка исследовательских проектов — так и «мягких» — управление проектами на разных стадиях, особенности взаимодействия с индустрией и рынком труда. Большая часть занятий будет строиться вокруг чтения и разбора наиболее свежих и актуальных статей из разных сфер вычислительных социальных наук, но также будут проводиться и более прикладные мастер-классы.

СSS в объяснении социальных процессов

Современное общество существует в условиях беспрецедентной взаимосвязанности: от глобальных финансовых рынков до вирусного распространения информации в социальных сетях. Этот курс предлагает междисциплинарный взгляд на анализ социальных процессов через призму сетевых структур, коллективного поведения и рыночных механизмов. Ключевые направления курса: теория сетей (структура социальных, информационных и экономических сетей, механизмы распространения влияния); модели коллективного поведения (как индивидуальные решения трансформируются в групповые паттерны); рыночные механизмы (алгоритмические аспекты экономических взаимодействий в цифровую эпоху); вычислительные методы (применение инструментов data science для анализа сложных социальных систем).

Введение в каузальность

Вводный курс, посвященный основным понятиям причинно-следственного вывода и подходам к определению и измерению каузальности. В ходе курса студенты ознакомятся с основными разделами каузального анализа (дизайн исследований, постановка исследовательских вопросов, отличие от предсказательного подхода, методы каузального вывода, каузальные диаграммы и DAG), будут читать актуальные статьи, чтобы понять, как разные подходы применяются в эмпирических исследованиях и с какими ограничениями сталкиваются авторы. Отдельное внимание будет уделено роли теории в причинно-следственного выводе.

Введение в машинное обучение

Курс предназначен для ознакомления с теоретическими основами алгоритмов машинного обучения, типами задач анализа данных и методами анализа данных. В рамках курса студенты узнают про алгоритмы кластеризации, деревья решений, применение регрессионного анализа, ансамблевых методов и стохастического поиска для решения различных задач. В рамках курса особое внимание уделяется специфике экономических и финансовых данных и соответствующей адаптации алгоритмов.

Базы данных и SQL

Курс посвящен работе с большими и разнородно организованными данными с использованием SQL. Студенты освоят как базовые, так и сложные запросы и оптимизацию их производительности, а также научатся визуализировать результаты анализа в интерактивных дэшбордах. Ключевые темы: основы реляционных баз данных; SQL (от базовых запросов до оконных функций и CTE); работа с разными типами данных (JSON, геоданные); интеграция SQL-анализа с BI-инструментами (Tableau, Power BI); создание дэшбордов для презентации данных.

Моделирование каузальности

В рамках данного курса слушатели познакомятся с современными методами статистического причинно-следственного вывода (causal inference). В рамках предмета студенты познакомятся с основными каузальными парадигмами (potential outcomes framework vs directed acyclic graphs) и дизайном рандомизированных контролируемых экспериментов. На данной основе мы продолжим дискуссию о современных методах, рассмотрим техники взвешивания и совмещения, квази-экспериментальные методы для панельных данных (разность в разностях, синтетический контроль), инструментальные переменные и разрывные регрессионные дизайны. Дополнительно, будут рассмотрены стандартные социологические техники каузального анализа – стандартное и многоуровневое моделирование структурными уравнениями, анализ пути, казуальный медиационный анализ. В результате освоения курса слушатели смогут корректного формировать причинные дизайны исследований, правильно устанавливать и выбирать теоретические и эмпирические эстиманды, выбирать соответствующие оценщики и методы оценивания. Это позволит проводить анализ эффективности государственных программ, исследовать меры по предотвращению неравенства, а также работать в крупных компаниях, проводя количественную аналитику продуктовых показателей.

Обработка естественного языка

Курс представляет собой интенсивное погружение в мир современных методов и инструментов для анализа текста. Вы познакомитесь с передовыми подходами, включая нейронные сети и трансформеры, лежащие в основе таких технологий, как ChatGPT.  Научитесь извлекать смысл из текстовых данных, классифицировать тексты, генерировать новый контент и решать другие прикладные задачи NLP.  В процессе обучения вы приобретете практические навыки работы с популярными библиотеками и фреймворками для NLP.  Особое внимание уделяется этическим аспектам и оценке качества моделей. Курс подготовит вас к применению NLP в различных областях, от анализа социальных сетей до разработки интеллектуальных чат-ботов.

Модельное мышление

Курс знакомит с ключевыми математическими, статистическими и вычислительными моделями, которые позволяют анализировать сложные социальные, экономические и управленческие процессы. В основе программы лежит парадигма множественных моделей (many-model thinking), демонстрирующая, как применение разных аналитических подходов помогает структурировать данные, улучшать прогнозы и принимать более обоснованные решения. В результате студенты научатся выбирать правильный набор моделей для каждой задачи и давать результатам наиболее точную и осмысленную интерпретацию.

Анализ данных — 2

В фокусе курса – техники, позволяющие преодолеть ограничения классических опросов и получить более точные и содержательные результаты. Ключевые модули: обогащенные опросы (Enriched Surveys), регрессионный анализ с постстратификацией, методы корректировки смещений выборки, эксперименты в опросах, модели выбора (Choice Models). В курсе сделан акцент на сравнительный анализ традиционных и вычислительных методов, валидацию результатов через триангуляцию подходов и критическую работу с ограничениями каждого метода.

Критический подход к данным

Критический подход к данным (Critical Data Studies — CDS) — это обобщающий термин для ряда работ, которые используют данные в качестве объекта исследования. Критический подход к исследует «природу» данных, способы производства и использования, инфраструктурный аспект создания и управления жизненным циклом. CDS уходит корнями в интеллектуальные направления, находящиеся под влиянием критической социальной теории, активно осмысляющей эпистемологию и методологию научного метода, и проблематизирующей вопросы политики производства знаний и понимания того, как социальные и технические процессы. Методологически CDS чаще всего использует качественные методы для изучения политики и практики работы с данными. Цель курса состоит в том, чтобы создать рефлексивные и критические знания о данных и с их использованием.

Научно-исследовательский семинар

Научно-исследовательский семинар является площадкой для обсуждения прогресса в подготовке курсовых и в дальнейшем выпускных работ студентов. На семинаре разбираются все шаги подготовки исследования — от выбора темы и постановки задачи до презентации результатов. Семинар дает возможность студентам получать регулярный фидбек от разных преподавателей программы и однокурсников, отслеживать свой прогресс в подготовке проекта и получать своевременную поддержку.

Генеративный искусственный интеллект

Курс углубляет знания, полученные в курсе «Машинное обучение», фокусируясь на создании моделей, способных генерировать новые данные: тексты, изображения, аудио и видео. Слушатели изучат различные архитектуры генеративных моделей, включая вариационные автокодировщики (VAE), генеративно-состязательные сети (GAN) и трансформеры, а также методы их обучения и оценки. Особое внимание уделяется применению генеративного ИИ в гуманитарных и социальных науках, например, для создания синтетических данных, стилизации контента и решения творческих задач. Практическая часть курса включает работу с современными библиотеками (такими как TensorFlow, PyTorch) и фреймворками для генерации различных типов данных. Вы научитесь настраивать и оптимизировать генеративные модели, а также оценивать качество и реалистичность сгенерированного контента. В результате слушатели смогут применять технологии генеративного ИИ для решения исследовательских и прикладных задач в своей предметной области, создавая оригинальный контент и расширяя возможности анализа данных.

Дисциплины по выбору

Социология образования

Курс направлен на изучение институциональных форм, в которых протекает академическая жизнь — университетов, научных журналов и дисциплин. Занятия организованы вокруг ключевых тем, позволяющих взглянуть на академический мир как «сверху» — через призму организаций и дисциплинарных структур, так и «изнутри» — через динамику академических карьер. Курс затрагивает те изменения, которые происходят в образовании и науке под воздействием государственной политики, рыночных запросов, культурных и технологических сдвигов. Мы обсудим, какие формы эти трансформации принимают и как они влияют на производство и распространение знания.

Опросная методология (психометрика)

Курс посвящен методологии опросных исследований в социальных науках. Студенты изучат, как устроен полный цикл работы с опросными данными: от постановки исследовательского вопроса и разработки опросного инструмента до анализа опросных данных с помощью языка программирования R. В качестве практической работы в рамках курса студенты подготовят финальный проект в виде отчета по мини-исследованию на основе анализа «вторичных» данных.

Ключевые темы: выборочная совокупность и репрезентативность; концептуализация и операционализация понятий; типы опросов и дизайн опросной анкеты; анализ и импутация данных; этические аспекты опросных исследований.

Методология доказательного подхода

Курс посвящен социологическому анализу ключевых теорий и методологических подходов к изучению деятельности государства всеобщего благосостояния, понимаемой как поле взаимодействий различных акторов (государство, рынок, НКО). Эта деятельность представлена в программах и практиках, которые адресованы различным категориям граждан. Курс предполагает социологический анализ различных теорий и методологических парадигм доказательного подхода в отношении семьи, образования, трудоустройств, цель которых состоит в развитии социальной сферы общества и поддержания благосостояния граждан. Логика курса выстроена вокруг изучения различных методологических подходов изучения социальных программ и проектов, адресованных различным возрастным группам: дети и молодежь, сендвич-поколение, представители старшего поколения.

Эмпирические исследования здоровья

Дисциплина «Эмпирические исследования здоровья» охватывает круг вопросов, связанных с применением экономических и эконометрических методов для анализа факторов, влияющих на здоровье населения, включая оценку эффективности медицинских вмешательств, влияние социально-экономических условий, поведенческих факторов и государственных программ.

Эмпирические исследования права

— 

Продвинутый сетевой анализ

Данный курс является введением в современные методы анализа сетевых данных с акцентом на статистическое моделирование и вывод. В ходе курса студенты будут изучать продвинутые статистические модели для сетевого анализа, включая экспоненциальные случайные графовые модели (ERGM) и стохастические акторно-ориентированные модели (SAOM). Учащиеся освоят методы обнаружения сообществ (community detection), которые включают стохастические блоковые модели, алгоритмы Гирвана-Ньюмена, Лювена и Лейдена, научатся интерпретировать параметры моделей и проверять их соответствие. Практическая работа будет проводиться в специализированных пакетах ergm и rsiena, что позволит студентам применять изученные методы к реальным сетевым данным. Курс также включает разбор кейсов, где сетевой анализ используется для решения задач в социальных науках.

Машинное обучение: deep learning

В данном курсе слушатели познакомятся с основами глубинного обучения и его применением в вычислительных социальных науках. Студенты изучат ключевые архитектуры нейронных сетей, такие как сверточные (CNN), рекуррентные (RNN) и трансформеры, а также научатся работать с текстовыми, графическими и временными данными. Особое внимание уделяется использованию глубинного обучения для анализа социальных медиа, моделирования и прогнозирования поведения акторов. Курс охватывает методы обработки естественного языка (NLP) для изучения социолингвистических закономерностей и анализа тональности текстов. Учащиеся освоят применение генеративных моделей (GAN, VAEs) в исследовании социальных явлений. В курсе также рассматриваются этические аспекты и ограничения глубинного обучения в вычислительных социальных науках, включая проблему смещений в данных. Практические задания включают работу с реальными наборами данных из социологии и экономики.

Актуальные проблемы социологии

Курс посвящен анализу ключевых социальных проблем современности, их взаимосвязям и способам изучения через призму социологической теории и методов. В условиях глобализации, цифровой трансформации и роста социального неравенства традиционные подходы к решению сложных вопросов требуют переосмысления. На курсе мы рассмотрим социальные проблемы на микро-, мезо- и макроуровнях с учетом глобальных тенденций и локальных особенностей. Особое внимание уделяется междисциплинарным подходам — сочетанию социологических, экономических и политических методов для комплексного анализа.

Преподаватели

Стоимость обучения

ЕУСПб — негосударственный вуз. У нас платное образование, но мы предоставляем скидки на оплату обучения и стипендии на основании рейтинга. Рейтинг составляется по результатам вступительных испытаний и пересматривается после каждой сессии.