MA
Direction «Applied Informatics»

Applied Data Analysis

vacancies: 17
Language: Russian

О программе

Современные программы по анализу данных учат решать задачи, поставленные кем-то другим: аналитики данных не знакомы с задачами, которые стоят в искусстве, культуре, гуманитарной и социальной науке, а искусствоведы, историки, антропологи, социологи редко представляют себе современные технологические возможности, еще реже — применяют их в работе

Программа «Прикладной анализ данных»  преодолевает этот разрыв: академические ученые из ЕУ и программисты из Яндекса вырабатывают новый язык для диалога между исследователями в гуманитарных и общественных науках и техническими специалистами.

Студенты программы при поступлении не обладают техническими навыками и знаниями, но на выпуске работают с методами классической статистики в R, с Python, методами машинного обучения, обработки естественных языков, компьютерного зрения.

ПАНДАН на завтрак

Частью вступительных испытаний программы является портфолио, в котором должны быть представлены два эссе, написанные по двум из шести предложенных заданий. Задания составляют преподаватели, партнеры и проектные команды ПАНДАНа. Уникальные задания 2025 года можно найти на сайте. Темы для эссе прошлых лет опубликованы в социальных сетях университета с тегом #пандан_на_завтрак.  

Узнать подробную информацию о ходе приемной кампании, а также подать документы вы можете здесь:

Курсы

Иностранный (английский) язык

Курс разработан в русле коммуникативно-ориентированного обучения иностранным языкам. Его ключевым принципом является ориентация на овладение языком как средством общения в рамках жизненных ситуаций, актуальных для студентов. Особый упор в курсе делается на профессиональную коммуникацию: формируются навыки различных видов чтения (поискового, ознакомительного, просмотрового, аналитического), осуществляется обучение семантико-синтаксического и лексико-грамматического анализа текста и основам перевода текстов по специальности с иностранного (английского) языка на русский, развиваются навыки восприятия на слух монологической и диалогической аутентичной речи в профессиональной сфере, а также совершенствование навыков устной и письменной речи в рамках профессионального общения (в частности, умение сформировать основную идею сообщения, кратко изложить содержание текста).

Высшая математика и введение в статистику

Данный курс объединяет ключевые разделы высшей математики и статистики, предоставляя студентам фундаментальные знания и практические навыки для работы с данными. Слушатели изучат линейную алгебру, включая матрицы, системы уравнений и линейные пространства, а также освоят основные статистические концепции, такие как распределения, гипотезы и регрессионный анализ. Курс начинается с повторения основ и постепенно переходит к более сложным темам, обеспечивая прочную математическую базу. Особое внимание уделяется применению изученных методов в прикладных областях, включая машинное обучение, с использованием статистических пакетов R и Python. В результате студенты научатся формулировать задачи на языке математики и статистики, анализировать данные и интерпретировать результаты. Этот курс необходим для глубокого понимания количественных методов и их эффективного использования.

Основы языка программирования Python

Курс направлен на освоение основ алгоритмизации, а также прикладного программирования с упором на последующую сферу анализа данных.

Слушатели приобретают навыки:

  • работы с основными элементами структурного программирования
  • декомпозиции задач и структурирования кода
  • объектно-ориентированного и функционального программирования
  • работы со стандартной библиотекой языка и внешними модулями, формирования своего инструментария для задач автоматизации
  • практического применения основных пакетов обработки данных
Практический минимум

Курс посвящен основным видам серверного ПО и серверных ОС на примере Linux, их архитектуре и основным принципам работы.

Слушатели приобретают навыки:

  • работы с командной оболочкой bash и набором базовых утилит, доступных в ОС
  • написания скриптов автоматизации
  • работы с основными протоколами передачи информации в информационных системах
  • выстраивания взаимодействий клиент-сервер, взаимодействия через API, межпроцессного взаимодействия
  • развертывания ПО как на одиночный сервер, так и на вычислительный кластер
Программирование в R

Курс направлен на освоение основ программирования на языке R с упором на последующую сферу анализа данных.

Слушатели изучают:

  • основные способы манипуляции и обработки данных в R
  • инструменты data.table и dplyr
  • способы визуализации данных в R
  • основные принципы tidy data
  • инструменты статистических методов в программной среде R-Studio
  • создание документов при помощи R Markdown
Машинное обучение и нейронные сети

Курс предоставляет всесторонний обзор современных методов анализа данных, сочетая классические алгоритмы машинного обучения с передовыми технологиями нейронных сетей. Слушатели не только освоят теоретические основы, но и получат практические навыки решения задач классификации, кластеризации и регрессии, применяемые в гуманитарных и социальных науках. Особое внимание уделяется глубокому обучению, включая архитектуры нейронных сетей, методы их обучения и оптимизации. Курс охватывает работу с современными библиотеками машинного обучения (такими как scikit-learn, TensorFlow, PyTorch), позволяя применять изученные методы к реальным данным. Вы научитесь выбирать подходящие модели и метрики качества для конкретных задач анализа данных, а также интерпретировать их результаты. В итоге слушатели смогут самостоятельно разрабатывать и применять модели машинного обучения и нейронные сети для решения исследовательских задач в социогуманитарной сфере.

Обработка естественного языка

Обновленный курс «Обработка естественного языка (NLP)» представляет собой интенсивное погружение в мир современных методов и инструментов для анализа текста. Вы познакомитесь с передовыми подходами, включая нейронные сети и трансформеры, лежащие в основе таких технологий, как ChatGPT.  Научитесь извлекать смысл из текстовых данных, классифицировать тексты, генерировать новый контент и решать другие прикладные задачи NLP.  В процессе обучения вы приобретете практические навыки работы с популярными библиотеками и фреймворками для NLP.  Особое внимание уделяется этическим аспектам и оценке качества моделей. Курс подготовит вас к применению NLP в различных областях, от анализа социальных сетей до разработки интеллектуальных чат-ботов.

 

Визуализация данных

Курс знакомит с основными принципами визуализации разных типов данных, а также формирует практические навыки визуализации.

Слушатели изучают:

  • модели визуализации для отображения различных типов данных
  • методы визуализации геоданных
  • основные принципы проектирования эффективной модели визуализации
  • проектирование визуализации с помощью языка Python
Технологии программирования

Курс знакомит студентов с методологией разработки программного обеспечения, включая парадигму объектно-ориентированного программирования, а также шаблоны проектирования. Особое внимание уделяется углублённому знакомству с методологией объектно-ориентированного программирования, получению навыков работы в современных IDE, включая профилирование и отладку, а также приемы рефакторинга, получению навыков работы с трехзвенной архитектурой и архитектурой клиент-сервер, получению навыков веб-разработки, получению навыков развертывания ПО на серверах, пакетирования приложений в различные контейнеры.

Базы данных и SQL

Дисциплина «Базы данных» знакомит слушателей с современным СУБД и организации данных в них, дает представление о реляционной алгебре и реляционных СУБД, о реляционной алгебре и документно-ориентированных СУБД, умение создать схему хранения данных для проекта, получить навыки работы с SQL-подобными языками запросов, сопрягать приложения на Python и С++ с базами данных, умение использовать ORM (Object-Relational Mapping) в программах для работы с СУБД.

Генеративный искусственный интеллект

Курс углубляет знания, полученные в курсе «Машинное обучение и нейронные сети», фокусируясь на создании моделей, способных генерировать новые данные: тексты, изображения, аудио и видео. Слушатели изучат различные архитектуры генеративных моделей, включая вариационные автокодировщики (VAE), генеративно-состязательные сети (GAN) и трансформеры, а также методы их обучения и оценки. Особое внимание уделяется применению генеративного ИИ в гуманитарных и социальных науках, например, для создания синтетических данных, стилизации контента и решения творческих задач. Практическая часть курса включает работу с современными библиотеками (такими как TensorFlow, PyTorch) и фреймворками для генерации различных типов данных. Вы научитесь настраивать и оптимизировать генеративные модели, а также оценивать качество и реалистичность сгенерированного контента. В результате слушатели смогут применять технологии генеративного ИИ для решения исследовательских и прикладных задач в своей предметной области, создавая оригинальный контент и расширяя возможности анализа данных.

 

Введение в количественные исследования социогуманитарных наук

Курс направлен на формирование у магистрантов базового понимания логики и этапов количественных исследований в социальных и гуманитарных науках. Будут рассмотрены способы формулировки исследовательских вопросов, операционализация понятий, выбор и первичный анализ данных, основы интерпретации результатов и критической оценки эмпирических исследований. Особое внимание уделяется связи между теорией, данными и методами, а также ограничениям и возможным искажениям количественного анализа. Курс закладывает основу для выполнения самостоятельных исследовательских проектов.

Административные данные

Курс направлен на формирование у студентов навыков работы с данными, собираемыми государственными органами. Студенты познакомятся с постановкой исследовательских вопросов в исследованиях, основанных на административных данных. 

Ключевые темы курса: нормотворческая специфика производства административных данных, качество и полнота данных, исследовательские вызовы при работе с неисследовательскими данными, административные данные как система ведомственной отчетности, артефакты в данных. 

 

Опросная методология

Курс посвящен методологии опросных исследований в социальных науках. Студенты изучат, как устроен полный цикл работы с опросными данными: от постановки исследовательского вопроса и разработки опросного инструмента до анализа опросных данных с помощью языка программирования R. В качестве практической работы в рамках курса студенты подготовят финальный проект в виде отчета по мини-исследованию на основе анализа «вторичных» данных.

Ключевые темы: выборочная совокупность и репрезентативность; концептуализация и операционализация понятий; типы опросов и дизайн опросной анкеты; анализ и импутация данных; этические аспекты опросных исследований.

Социология образования

Курс направлен на изучение институциональных форм, в которых протекает академическая жизнь — университетов, научных журналов и дисциплин. Занятия организованы вокруг ключевых тем, позволяющих взглянуть на академический мир как сверху — через призму организаций и дисциплинарных структур, так и изнутри — через динамику академических карьер. Курс затрагивает те изменения, которые происходят в образовании и науке под воздействием государственной политики, рыночных запросов, культурных и технологических сдвигов. Мы обсудим, какие формы эти трансформации принимают и как они влияют на производство и распространение знания.

Курсы по выбору

Критический анализ данных

Курс предназначен для студентов магистратуры, желающих углубить знания и навыки, полученные в курсе «Данные и вызовы в общественных науках», с акцентом на количественные методы в социологии. Курс развивает критическое мышление в отношении данных, используемых в социальных исследованиях, обучая студентов оценивать методологические ограничения, потенциальные смещения и этические дилеммы, связанные с различными типами данных и методами их анализа. Особое внимание уделяется интерпретации результатов количественных исследований, выявлению причинно-следственных связей, а также оценке валидности и надежности выводов. Студенты научатся применять продвинутые статистические методы для анализа социальных данных, распознавать манипуляции и некорректное использование статистики в публичном пространстве. Курс предполагает активное участие в дискуссиях, выполнение практических заданий и разработку собственных исследовательских проектов, использующих количественные данные для анализа актуальных социальных проблем. Конечная цель курса — подготовить выпускников к самостоятельной и критически-осмысленной исследовательской работе в области социологии с применением количественных методов.

Модельное мышление

Курс знакомит с ключевыми математическими, статистическими и вычислительными моделями, которые позволяют анализировать сложные социальные, экономические и управленческие процессы. В основе программы лежит парадигма множественных моделей (many-model thinking), демонстрирующая, как применение разных аналитических подходов помогает структурировать данные, улучшать прогнозы и принимать более обоснованные решения. В результате студенты научатся выбирать правильный набор моделей для каждой задачи и давать результатам наиболее точную и осмысленную интерпретацию.

Безопасность искусственного интеллекта

Завершая цикл технической подготовки, этот курс фокусируется на критически важных аспектах безопасности, возникающих при разработке и применении систем ИИ. Студенты изучат вопросы защиты чувствительных данных, предотвращения утечек информации и обеспечения конфиденциальности.  Будут рассмотрены методы анализа уязвимостей систем ИИ, а также этические и правовые аспекты, связанные с безопасностью. Особое внимание уделяется практическим кейсам и разработке стратегий минимизации рисков, связанных с ИИ.  Цель курса — подготовить специалистов, способных создавать и внедрять надежные и безопасные системы искусственного интеллекта, учитывая как технические, так и социо-гуманитарные аспекты.

Техноэтика

Техноэтика — это междисциплинарная исследовательская область, затрагивающая различные аспекты социальных, культурных и политических последствий развития и использования техники, а также связанная с изучением анализом нормативных практик инновационного развития. Нормативные рамки, определяющие социальные взаимодействия, не являются статичными и трансформируются вместе с развитием технологических инноваций. Таким образом, техноэтика выступает как форма рефлексии со стороны самих разработчиков инноваций, а также как инструмент общественной экспертизы.

В рамках курса планируется рассмотрение широкого круга кейсов, связанных с развитием технологий. Подобная работа направлена на формирование практических навыков анализа моральных дилемм и понимания базовых принципов техноэтики.

Продвинутый сетевой анализ

Данный курс является введением в современные методы анализа сетевых данных с акцентом на статистическое моделирование и вывод. В ходе курса студенты будут изучать продвинутые статистические модели для сетевого анализа, включая экспоненциальные случайные графовые модели (ERGM) и стохастические акторно-ориентированные модели (SAOM). Учащиеся освоят методы обнаружения сообществ (community detection), которые включают стохастические блоковые модели, алгоритмы Гирвана-Ньюмена, Лювена и Лейдена, научатся интерпретировать параметры моделей и проверять их соответствие. Практическая работа будет проводиться в специализированных пакетах ergm и rsiena, что позволит студентам применять изученные методы к реальным сетевым данным. Курс также включает разбор кейсов, где сетевой анализ используется для решения задач в социальных науках.

Компьютерное зрение

Курс предназначен для студентов с гуманитарным и социальным бэкграундом, желающих освоить передовые методы анализа визуальной информации. Курс начинается с основ обработки изображений и классических методов машинного обучения, а затем плавно переходит к современным архитектурам глубокого обучения, в частности, к моделям на основе трансформеров. Особое внимание уделяется практическому применению, поэтому большая часть курса посвящена написанию кода с использованием библиотеки `transformers` для решения задач классификации изображений, детекции объектов и сегментации. Студенты научатся работать с предобученными моделями, адаптировать их под свои задачи и оценивать качество полученных результатов. Рассматриваются примеры из областей, близких к социогуманитарным исследованиям: анализ изображений в социальных медиа, распознавание эмоций, обработка исторических архивов. По окончании курса студенты смогут самостоятельно разрабатывать и внедрять решения в области компьютерного зрения, применимые к широкому спектру исследовательских и прикладных задач.

Проектный менеджмент

Преподаватели

Стоимость обучения

ЕУСПб — частный вуз, учеба в котором по закону не может быть бесплатной.
Однако мы предоставляем скидки на оплату обучения (95 %) и стипендии на основании рейтинга. Рейтинг составляется по результатам вступительных испытаний и пересматривается после каждой сессии.