ИИ видит черепок, археолог — историю: Олег Лашманов и Егор Блохин рассказали, как археологи и ИИ атрибутируют артефакты

 
24.06.2025
 
Лаборатория «Искусство и искусственный интеллект»; Школа искусств и культурного наследия
 
Олег Юрьевич Лашманов
 
Европейский в медиа

На портале «Системный блокъ» вышел материал в блоге научного руководителя и исполнительного директора Лаборатории «Искусство и искусственный интеллект» Олега Лашманова. Он подготовлен в соавторстве: Олегом Лашмановым (ЕУСПб) и Егором Блохиным (ИИМК РАН).

Авторы рассмотрели, как алгоритмы и люди по-разному измеряют «похожесть» артефактов и почему это важно. Приводим отрывок из материала:

 

В поисках похожего

Зайдем издалека. Когда мы что-то ищем — будь то в квартире или в своей памяти — мы невольно опираемся на образы, схожие с нашим внутренним представлением о предмете. Фактически у нас в голове есть обобщенная модель искомого, с которой мы бессознательно сравниваем все, что попадает в поле зрения.

Пока мы ищем, скажем, забытые ключи в квартире — все относительно просто. Квартира одна, ключи единственные, с узнаваемым брелоком в виде динозаврика. Мы быстро находим нужное, потому что ориентируемся по знакомым признакам. Но задача усложняется, если в одной руке у нас есть пример ключа, а перед нами — коробка, полная других ключей. Нужно найти точно такой же или хотя бы максимально похожий. Тут начинаются проблемы с перебором.

А теперь представим еще более сложную ситуацию: мы помним, что где-то уже видели похожий ключ, но не можем точно вспомнить, где именно и при каких обстоятельствах. Это самая интересная и в то же время сложная задача — и именно она ближе всего к той, с которой сталкивается археолог.

Чтобы лучше понять, в чем суть этой проблемы, попробуем сначала разложить человеческий подход на составляющие и взглянуть на него с позиции машины.

 

Память — это граф

У нас есть память, в которой в том или ином виде хранятся образы предметов. Эти образы не изолированы — каждый связан с другими через ассоциации. А те, в свою очередь, ведут к следующим. В итоге возникает целая сеть связей — граф, где узлы представляют образы, а ребра — ассоциации между ними. Проще говоря, это нечто вроде базы данных. Если попробовать мысленно представить предмет и начать раскручивать цепочку ассоциаций, вы заметите, как граф начинает разрастаться. Вы вспоминаете детали, о которых еще секунду назад не думали. Однако такие графы сложно обрабатывать — как человеку, так и машине. Поэтому технически выбирают иной подход.

Что же на самом деле хранится в нашей «внутренней базе данных»? Это идеи, представления о предметах, явлениях, людях, питомцах и множестве других фактов. Как именно они представлены в мозге — вопрос все еще открытый. Но в технике этим абстрактным понятиям принято сопоставлять вектора — то есть просто наборы чисел. Один объект — один вектор. Эти вектора могут быть разной длины, но внутри конкретной системы длина фиксирована для всех. Важно, что каждый вектор в каком-то смысле «сжимает» смысл объекта в числовую форму.

Дальше все выглядит просто: мы перебираем вектора в памяти и ищем похожие. Вроде бы на этом можно было бы и остановиться. Но главный вопрос — как мы определяем, что два объекта похожи? Что делает один вектор ближе к другому? Именно здесь начинается самое интересное. Эволюция устроила нас так, что мы воспринимаем вещь не только визуально. Мы связываем ее с целым набором ощущений: тяжестью, фактурой, мягкостью, запахом, звуками окружающей среды. Все это — часть образа, и все это влияет на то, насколько предмет кажется нам «похожим» на другой.

Дисклеймер: я сознательно опускаю интуитивные и неосознанные способы поиска похожего в глубинах разума. Да, они быстрые, но слишком неточные, чтобы на них можно было опереться.

 

Контекст важнее формы

Археологи идут еще дальше: у них есть не только физические признаки находки, но и контекст — слой земли, соседние объекты, культурная эпоха. Это добавляет новые уровни к понятию схожести.

Если попытаться обобщить, можно выделить несколько основных критериев, по которым мы определяем, похожи ли объекты между собой. Это два типа признаков.

 

А узнать, какие именно это признаки и как решает эту задачу компьютер, в отличие от человека, а заодно и об инструменте SIMILIS, разработанном в лаборатории «Искусство и искусственный интеллект» ЕУСПб совместно с ИИМК РАН, можно в полной версии материала на «Системном блоке».