Tóm tắt ngắn gọn
Chatbot AI đang cố gắng trở thành xu hướng lớn tiếp theo trong lĩnh vực chăm sóc sức khỏe, vượt qua các bài kiểm tra tiêu chuẩn và đưa ra lời khuyên cho các vấn đề y tế của bạn. Nhưng một nghiên cứu mới công bố trên Nature Medicine đã cho thấy rằng chúng không chỉ còn xa mới đạt được điều này, mà còn có thể nguy hiểm. Nghiên cứu do nhiều nhóm từ Đại học Oxford dẫn đầu đã xác định một khoảng cách rõ rệt trong các mô hình ngôn ngữ lớn (LLMs). Trong khi chúng về mặt kỹ thuật rất tiên tiến trong hiểu biết y học, chúng lại thiếu hiệu quả khi giúp người dùng xử lý các vấn đề y tế cá nhân, các nhà nghiên cứu nhận thấy. “Dù có tất cả sự hào hứng, AI vẫn chưa sẵn sàng đảm nhận vai trò của bác sĩ,” Tiến sĩ Rebecca Payne, người đứng đầu nhóm y tế trong nghiên cứu, nói trong một thông cáo báo chí công bố kết quả. Bà bổ sung rằng, “Bệnh nhân cần nhận thức rằng việc hỏi một mô hình ngôn ngữ lớn về các triệu chứng của họ có thể nguy hiểm, dẫn đến chẩn đoán sai và không nhận biết được khi cần giúp đỡ khẩn cấp.” Nghiên cứu đã có 1.300 người tham gia sử dụng các mô hình AI từ OpenAI, Meta và Cohere để xác định các tình trạng sức khỏe. Họ đưa ra một loạt các tình huống do bác sĩ phát triển, yêu cầu hệ thống AI cho biết bước tiếp theo cần làm để xử lý vấn đề y tế của họ.
Nghiên cứu cho thấy kết quả của họ không tốt hơn các phương pháp tự chẩn đoán truyền thống, như tìm kiếm trực tuyến hoặc dựa vào phán đoán cá nhân. Họ cũng nhận thấy có sự mất kết nối đối với người dùng, không rõ thông tin nào LLM cần để cung cấp lời khuyên chính xác. Người dùng nhận được sự kết hợp giữa lời khuyên tốt và kém, khiến họ khó xác định bước tiếp theo. Decrypt đã liên hệ với OpenAI, Meta và Cohere để lấy ý kiến, và sẽ cập nhật bài viết này nếu họ phản hồi.
“Là một bác sĩ, việc chẩn đoán chính xác không chỉ đơn thuần là nhớ lại các facts. Y học là một nghệ thuật cũng như một khoa học. Lắng nghe, thăm dò, làm rõ, kiểm tra sự hiểu biết và hướng dẫn cuộc trò chuyện là điều thiết yếu,” Payne nói với Decrypt. “Các bác sĩ chủ động tìm kiếm các triệu chứng liên quan vì bệnh nhân thường không biết những chi tiết nào quan trọng,” bà giải thích, đồng thời cho biết nghiên cứu cho thấy LLMs “chưa đủ đáng tin cậy để quản lý tương tác động này với những người không phải chuyên gia.” Nhóm kết luận rằng AI hiện tại không phù hợp để cung cấp lời khuyên y tế, và cần có các hệ thống đánh giá mới nếu muốn sử dụng đúng cách trong lĩnh vực chăm sóc sức khỏe. Tuy nhiên, điều đó không có nghĩa là chúng không có vai trò trong ngành y tế hiện nay. Trong khi LLMs “chắc chắn có vai trò trong chăm sóc sức khỏe,” Payne nói, đó nên là vai trò “thư ký, chứ không phải bác sĩ.” Công nghệ này có lợi ích trong việc “tóm tắt và đóng gói lại thông tin đã có,” với LLMs đã được sử dụng trong các phòng khám để “phiên dịch các cuộc tư vấn và đóng gói lại thông tin đó thành thư gửi chuyên gia, tờ thông tin cho bệnh nhân hoặc hồ sơ y tế,” bà giải thích. Nhóm kết luận rằng, mặc dù họ không phản đối AI trong lĩnh vực y tế, họ hy vọng nghiên cứu này có thể giúp định hướng AI đi đúng hướng hơn.