Вчера директор Центра машинного обучения, анализа данных и статистики, соруководитель программы прикладного анализа данных Иван Бибилов выступил с лекцией в рамках онлайн-марафона «Тотального диктанта». Тема лекции — «В поисках идеального диктанта». Основной задачей, которую ставили перед собой организаторы онлайн-марафона, было поговорить о разных аспектах грамотности. Так, Иван Бибилов рассказал об использовании компьютеров в работе с текстами.
Приводим его основные тезисы:
Компьютеры работают с текстами уже более 60 лет. Триумфы сменялись сомнениями и наоборот. С каждой такой волной возможности становились все более впечатляющими. Сейчас мы находимся в очередной точке оптимизма в использовании умных алгоритмов в любой области, в том числе в работе с текстами.
В ходе лекции Иван Бибилов рассмотрел корпус русской классической литературы и показал на каждом уровне, начиная от простой статистики и заканчивая алгоритмами извлечения фактов, можно ли найти интересные отрывки, которые смогут стать основой для интересных и сложных диктантов.
Запись трансляции онлайн-марафона доступна по ссылке (выступление Ивана в промежутке с 1.58.11 до 2.08.09).
Update. 15.09.2022. Отдельная запись с выступлением Ивана Бибилова здесь.