С 28 по 30 мая прошел хакатон Emergency DataHack, организованный Инфраструктурой научно-исследовательских данных совместно с МЧС России и другими партнерами. Участники выбирали одну из трех задач и разрабатывали модели машинного обучения, способные с высокой точностью прогнозировать вероятность возникновения той или иной чрезвычайной ситуации или ДТП. Применяя эти модели на практике, МЧС России сможет заранее принимать меры для предотвращения чрезвычайных ситуаций.
Команда в составе с сотрудницей программы «Прикладной анализ данных» Полиной Королевой стала победителем в треке, где решалась задача по предсказанию вероятности возникновения ДТП на двух федеральных трассах РФ. Для этого была построена предиктивная модель, выученная на данных за последние несколько лет о погодных условиях, загруженности дорог и изменениях в этих показателях. Ключевой инсайт при создании модели — использование динамических признаков. Так, основными характеристиками, повышающими качество модели, стали данные об изменениях погодных показателей и уровня загруженности дорог относительно предыдущего часа. Самым значимым признаком оказалось расстояние до ближайшей камеры. Это можно объяснить тем, что навигатор предупреждает водителей о приближении к камере, что приводит к снижению скорости и более осторожному вождению. С другой стороны, камеры могут быть установлены именно в тех местах, где концентрируется наибольшее количество ДТП.
Использование модели поможет локализовать и предотвратить места концентрации ДТП, а также оптимизировать способы реагирования МЧС России на ДТП высокого уровня тяжести.
В рамках ПАНДАН проводится исследование безопасности дорог. В частности, оценивается взаимосвязь финансирования дорог по национальной программе «Безопасные и качественные дороги» и аварийностью на участках дорог. Присоединиться к исследованию можно, отправив заявку на поступление в магистратуру или на ДПО по прикладному анализу данных (ПАНДАН).