Автор: Ян Йими
Источник: Academic Headlines
Древние свитки, которые «исчезли» более 2000 лет назад, теперь воспроизводятся искусственным интеллектом.
** Недавно 21-летний студент, изучающий информатику, использовал технологию искусственного интеллекта (ИИ), чтобы обнаружить первое слово в нераспечатанном свитке Геркуланума. **
Это был Люк Фарритор из Университета Небраски-Линкольна, который разработал алгоритм машинного обучения, который мог обнаруживать греческие буквы на свернутом папирусе, в том числе πορphiυρας (porphyras), что означает «пурпурный».
** Люк выиграл приз в размере 40 000 долларов США за успешную расшифровку и чтение более 10 символов на площади 4 квадратных сантиметра путем обучения нейронной сети и выделения чернил с использованием тонких, мелкомасштабных различий в текстуре поверхности. **
Первая сдача Люка Фарритора
Федерика Николарди, папирус из Неаполитанского университета в Италии и член академического комитета, который рассматривал исследования Фарритора, сказала: «Я была шокирована, когда увидела первое изображение, я действительно могла видеть что-то изнутри свитка. "**
Свитки Геркуланума, древние свитки, хранящиеся в частной библиотеке недалеко от Помпеи, были захоронены и обуглены во время извержения Везувия в 79 году нашей эры. В течение почти 2000 лет единственная сохранившаяся древняя библиотека была погребена под вулканической грязью на глубине 20 метров под землей. В 18 веке они были раскопаны и, хотя и сохранились в некоторой степени, были очень хрупкими и могли превратиться в пыль, если с ними не обращаться должным образом.
**Как прочитать ролик, который не открывается? Этот вопрос остается без ответа на протяжении сотен лет. **
В 2019 году профессор Брент Силс из лаборатории EduceLab Университета Кентукки сфотографировал свитки Геркуланума в ускорителе частиц, создав 3D-КТ-сканы с разрешением до 4 мкм. Его команда также отсканировала и сфотографировала фрагменты разделенного свитка видимыми чернилами, предоставив реальный набор данных. Аспирант профессора Силса, Стивен Парсонс, работал над использованием моделей машинного обучения для обнаружения чернил из компьютерной томографии и добился успеха на отдельных фрагментах.
Обучение модели машинного обучения на реальных данных из изолированных фрагментов (Источник: докторская диссертация Стивена Парсонса)
Этот успех привлек внимание технологических предпринимателей Ната Фридмана и Даниэля Гроса, которые запустили Vesuvius Challenge, чтобы ускорить этот прогресс. ** В марте 2023 года они запустили открытый конкурс с несколькими меньшими наградами за разработку инструментов и технологий с открытым исходным кодом в дополнение к главному призу в размере 700 000 долларов США.
Позже небольшая группа исследователей начала использовать инструменты, первоначально созданные EduceLab и усовершенствованные сообществом, чтобы нарисовать 3D-структуру свитка. К июлю этого года сотни квадратных сантиметров свитков были разделены и «почти сплющены».
В начале августа бывший основатель стартапа JPL Кейси Хэндмер написал пост в блоге об обнаружении «узора трещины», похожего на чернила. ** Кейси был первым человеком за 2000 лет, который нашел чернила и письмо в нераспечатанном свитке.
Рисунок | Аннотация, показывающая положение чернил (Источник: запись в блоге Кейси)
Люк Фарритор, студент колледжа и летний стажер SpaceX, услышал о Vesuvius Challenge из подкаст-интервью Дваркеша Пателя с Натом.
Паттерны трещин, которые он увидел в Кейси, обсуждались в Discord и начали обучать модели машинного обучения на паттернах трещин поздно ночью. С каждой новой обнаруженной трещиной модель улучшается, и на свитке может быть обнаружено больше трещин.
Люк нашел десятки чернильных росчерков, а также несколько полных букв, которые он мог пометить и использовать в качестве обучающих данных. Вскоре после этого на свитке появились следы трещин, невидимые невооруженным глазом. Вскоре эти следы начали образовывать намеки на буквы и настоящие слова.
Между тем, другой участник, Юссеф Надер, египетский аспирант по биоробототехнике в Берлине, выбрал другой подход. Воодушевленный открытием Кейси и Люка, он проверил победителей конкурса Ink Inspection Award на Kaggle, который фокусируется на улучшении подхода Стивена Парсонса к машинному обучению изолированных фрагментов. Он использует методы переноса доменов для адаптации этих моделей к прокруткам: предварительное обучение на данных катушки без учителя с последующей тонкой настройкой меток фрагментов.
Он подал идею на конкурс Ink Detection Followup Prize и выиграл небольшой приз. Несколько недель спустя Юссеф представил свою работу на премию First Letter Award. Он увидел первые результаты, которыми Люк поделился в Twitter и Discord, и решил сосредоточиться на той же области в барабанах.
Финальная сдача Юссефа Надера
Несмотря на то, что он не полагался на то, что Кейси вручную найдет трещины, ему удалось найти несколько букв с помощью модифицированной модели соревнования Kaggle. Затем он аннотирует то, что выглядит как буква в данных метки.
Сегментация команд и участников продолжала прогрессировать, и несколько дней назад модель Юсефа создала новое изображение с удивительной четкостью и размером (на фото ниже).
Теа Соммершилд, историк из Университета Кафоскаскари в Венеции, объяснила журналу Nature, что это открытие может «произвести революцию в нашем понимании древней истории и литературы».
Ссылки: