Một sinh viên đại học 21 tuổi khám phá ra bí ẩn của một cuộn giấy 2.000 năm tuổi: tái tạo các từ "biến mất" bằng AI và giành được 40.000 đô la

巴比特_

Tác giả: Yan Yimi

Nguồn: Tiêu đề học thuật

Những cuộn giấy cổ “biến mất” cách đây hơn 2.000 năm nay đã được AI tái tạo.

** Gần đây, một sinh viên khoa học máy tính 21 tuổi đã sử dụng công nghệ trí tuệ nhân tạo (AI) để khám phá từ đầu tiên trong cuộn Herculaneum chưa mở. **

Ông là Luke Farritor của Đại học Nebraska-Lincoln, người đã phát triển một thuật toán học máy có thể phát hiện các chữ cái Hy Lạp trên giấy cói cuộn, bao gồm πορphiυρας (porphyras), có nghĩa là “màu tím”.

Luke đã giành được giải thưởng First Letters trị giá 40.000 đô la vì đã giải mã và đọc thành công hơn 10 ký tự trong một khu vực rộng 4 cm vuông bằng cách đào tạo một mạng lưới thần kinh và làm nổi bật mực bằng cách sử dụng sự khác biệt tinh tế, quy mô nhỏ trong kết cấu bề mặt. **

Bài nộp đầu tiên của Luke Farritor;

Federica Nicolardi, một cuộn giấy cói tại Đại học Naples ở Ý và là thành viên của ủy ban học thuật đã xem xét nghiên cứu của Farritor, cho biết: "Tôi đã bị sốc khi nhìn thấy hình ảnh đầu tiên, tôi thực sự có thể nhìn thấy thứ gì đó từ bên trong cuộn giấy. "**

Cuộn Herculaneum, cuộn giấy cổ được lưu giữ trong một thư viện tư nhân gần Pompeii, đã bị chôn vùi và cacbon hóa bởi vụ phun trào của núi Vesuvius vào năm 79 sau Công nguyên. Trong gần 2.000 năm, thư viện cổ duy nhất còn sót lại đã bị chôn vùi dưới bùn núi lửa sâu 20 mét dưới lòng đất. Vào thế kỷ 18, chúng đã được khai quật và, ** trong khi được bảo quản ở một mức độ nào đó, rất mỏng manh và có thể biến thành bụi nếu không được xử lý đúng cách.

**Làm cách nào để đọc cuộn không mở? Câu hỏi này vẫn chưa được trả lời trong hàng trăm năm. **

Vào năm 2019, Giáo sư Brent Seales thuộc EduceLab của Đại học Kentucky đã chụp ảnh Herculaneum Scrolls trong một máy gia tốc hạt, tạo ra các bản quét CT 3D với độ phân giải lên tới 4 μm. Nhóm của ông cũng quét và chụp ảnh các mảnh vỡ của cuộn giấy được tách ra bằng mực nhìn thấy được, cung cấp một bộ dữ liệu thực tế. Sinh viên tốt nghiệp của Giáo sư Seales, Stephen Parsons, đã làm việc để sử dụng các mô hình học máy để phát hiện mực từ CT scan, và đã thành công trên các mảnh riêng biệt.

Đào tạo mô hình học máy dựa trên dữ liệu trong thế giới thực từ các mảnh bị cô lập (Nguồn: Luận án tiến sĩ của Stephen Parsons)

Thành công này đã thu hút sự chú ý của các doanh nhân công nghệ Nat Friedman và Daniel Gros, những người đã phát động Thử thách Vesuvius để đẩy nhanh tiến độ này. **Họ đã phát động một cuộc thi mở vào tháng 3/2023 với một số giải thưởng nhỏ hơn cho việc phát triển các công cụ và công nghệ nguồn mở bên cạnh giải thưởng lớn trị giá 700.000 USD.

Sau đó, một nhóm nhỏ các nhà nghiên cứu bắt đầu sử dụng các công cụ ban đầu được xây dựng bởi EduceLab và được cộng đồng cải tiến để vẽ cấu trúc 3D của cuộn. Đến tháng 7 năm nay, hàng trăm cm vuông cuộn giấy đã bị chia cắt và “gần như bị san phẳng”.

Vào đầu tháng Tám, cựu sáng lập công ty khởi nghiệp JPL Casey Handmer đã viết một bài đăng trên blog về việc phát hiện ra một “mẫu vết nứt” trông giống như mực. ** Casey là người đầu tiên trong 2000 năm tìm thấy mực và một lá thư trong một cuộn giấy chưa mở.

Hình | Chú thích hiển thị vị trí mực (Nguồn: bài đăng trên blog của Casey)

Luke Farritor, một sinh viên đại học và thực tập sinh mùa hè của SpaceX, đã nghe về Thử thách Vesuvius từ cuộc phỏng vấn podcast của Dwarkesh Patel với Nat.

Các mẫu vết nứt mà anh thấy ở Casey đã được thảo luận trong Discord và bắt đầu đào tạo các mô hình học máy về các mẫu vết nứt vào đêm khuya. Với mỗi vết nứt mới được phát hiện, mô hình được cải thiện và nhiều vết nứt hơn có thể được tiết lộ trên cuộn.

Luke đã tìm thấy hàng chục nét mực cũng như một số chữ cái hoàn chỉnh mà anh có thể dán nhãn và sử dụng làm dữ liệu đào tạo. Ngay sau đó, cuộn giấy cho thấy những vết nứt không thể nhìn thấy bằng mắt thường. Chẳng mấy chốc, những dấu vết này bắt đầu hình thành gợi ý về các chữ cái và từ thực tế.

Trong khi đó, một thí sinh khác, Youssef Nader, một sinh viên tốt nghiệp ngành robot sinh học Ai Cập ở Berlin, đã có một cách tiếp cận khác. Được thúc đẩy bởi khám phá của Casey và Luke, ông đã sàng lọc những người chiến thắng Giải thưởng Kiểm tra Mực trên Kaggle, tập trung vào việc cải thiện phương pháp học máy của Stephen Parsons đối với các mảnh bị cô lập. Ông sử dụng các kỹ thuật chuyển miền để điều chỉnh các mô hình này cho phù hợp với các cuộn: đào tạo trước không giám sát về dữ liệu cuộn, tiếp theo là tinh chỉnh các nhãn phân đoạn.

Ông đã gửi ý tưởng cho Giải thưởng Theo dõi Phát hiện Mực và giành được một giải thưởng nhỏ. Vài tuần sau, Youssef gửi tác phẩm của mình đến Giải thưởng Thư đầu tiên. Anh ấy đã nhìn thấy kết quả ban đầu mà Luke chia sẻ trên Twitter và Discord và quyết định tập trung vào cùng một lĩnh vực trong guồng.

Bài dự thi cuối cùng của Youssef Nader

Mặc dù anh ta không dựa vào Casey để tìm vết nứt theo cách thủ công, anh ta đã tìm được một số chữ cái thông qua một mô hình sửa đổi của cuộc thi Kaggle. Sau đó, anh ta chú thích những gì trông giống như một chữ cái trong dữ liệu nhãn.

Các đội phân khúc và thí sinh tiếp tục đạt được tiến bộ, và một vài ngày trước, mô hình của Youssef đã tạo ra một hình ảnh mới với độ rõ nét và kích thước đáng kinh ngạc (hình bên dưới).

Thea Sommerschield, một nhà sử học Hy Lạp và La Mã cổ đại tại Đại học Caphoscascari ở Venice, giải thích với Nature rằng khám phá này có thể “cách mạng hóa sự hiểu biết của chúng ta về lịch sử và văn học cổ đại”.

Liên kết tham khảo:

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận