Trang chủ COVID

Chatbot SARAH của WHO đưa ra những câu trả lời kỳ lạ, thiếu dữ liệu cập nhật

SARAH (Smart AI Resource Assistant for Health) là nhân viên y tế ảo sẵn sàng nói chuyện 24/7 bằng 8 ngôn ngữ khác nhau để giải thích các chủ đề như sức khỏe tâm thần, sử dụng thuốc lá và ăn uống lành mạnh. Đây là một phần trong chiến dịch của WHO nhằm tìm kiếm công nghệ có thể vừa giáo dục con người, vừa lấp đầy khoảng trống về nhân sự trong bối cảnh thế giới đang phải đối mặt với tình trạng thiếu nhân viên y tế.

WHO cảnh báo trên trang web của mình rằng nguyên mẫu SARAH này, được giới thiệu vào ngày 2.4, đưa ra những phản hồi “có thể không phải lúc nào cũng chính xác”. Một số chương trình huấn luyện AI của SARAH chậm hơn nhiều năm so với dữ liệu mới nhất. Đôi khi SARAH đưa ra những câu trả lời kỳ lạ, được gọi là ảo giác trong các mô hình AI, có thể truyền bá thông tin sai lệch về sức khỏe cộng đồng.

SARAH không có tính năng chẩn đoán như WebMD hay Google. Trên thực tế, SARAH được lập trình để không nói về bất cứ điều gì ngoài tầm nhìn của WHO, gồm cả các câu hỏi về các loại thuốc cụ thể. Vì vậy, SARAH thường gợi ý mọi người đến trang web của WHO hoặc nói rằng người dùng nên “tham khảo ý kiến của nhà cung cấp dịch vụ chăm sóc sức khỏe của bạn”.

WebMD là một trang web chuyên cung cấp thông tin y tế và sức khỏe cho người tiêu dùng.

Ramin Javan, nhà nghiên cứu và là bác sĩ X quang tại Đại học George Washington (Mỹ), nói: “SARAH thiếu chiều sâu, nhưng tôi nghĩ đó là vì WHO không muốn vượt qua ranh giới của mình và đây chỉ là bước đầu tiên”.

WHO cho biết SARAH có nhiệm vụ hợp tác với các nhà nghiên cứu và chính phủ để cung cấp số liệu thống kê y tế công cộng chính xác, đề xuất các bước cơ bản để sống lành mạnh hơn. Cơ quan y tế toàn cầu đang xin lời khuyên về cách cải thiện SARAH và sử dụng nó trong các tình huống khẩn cấp về sức khỏe. Thế nhưng, WHO nhấn mạnh rằng trợ lý AI vẫn đang trong quá trình hoàn thiện.

Alain Labrique, Giám đốc y tế kỹ thuật số và đổi mới của WHO, nói: “Những công nghệ này không thể thay thế cho việc tương tác với chuyên gia hoặc nhận lời khuyên y tế từ bác sĩ hoặc nhà cung cấp dịch vụ y tế được đào tạo thực tế”.

SARAH đã được đào tạo trên mô hình ngôn ngữ lớn GPT-3.5 của , sử dụng dữ liệu đến tháng 9.2021. Vì vậy chatbot này không có thông tin cập nhật về các khuyến cáo y tế hoặc sự kiện tin tức.

Ví dụ, khi được hỏi liệu Cục Quản lý thực phẩm và dược phẩm Mỹ (FDA) có phê duyệt thuốc Lecanemab điều trị bệnh Alzheimer hay không, SARAH cho biết loại thuốc này vẫn đang trong quá trình thử nghiệm lâm sàng. Song trên thực tế, Lecanemab đã được FDA phê duyệt để điều trị bệnh Alzheimer giai đoạn đầu vào tháng 1.2023.

Ngay cả dữ liệu của chính WHO cũng có thể khiến SARAH gặp khó khăn. Khi được hỏi liệu số ca tử vong do viêm gan có gia tăng hay không, SARAH không thể cung cấp ngay thông tin chi tiết từ báo cáo gần đây của WHO cho đến khi được nhắc kiểm tra trang web cơ quan này để biết số liệu thống kê cập nhật. WHO lý giải rằng điều này là do SARAH được đào tạo dựa trên GPT-3.5.

Đôi khi SARAH cũng không thể trả lời được. Bác sĩ Ramin Javan hỏi SARAH về địa điểm để chụp X-quang tuyến vú ở thủ đô Washington của Mỹ, nhưng chatbot này không thể cung cấp câu trả lời.

Điều đó không có gì là bất thường trong những ngày đầu phát triển AI. Trong một nghiên cứu năm ngoái xem xét cách trả lời 284 câu hỏi y tế, các nhà nghiên cứu tại Trung tâm Y tế thuộc Đại học Vanderbilt (Mỹ) phát hiện rằng dù ChatGPT thường cung cấp câu trả lời đúng nhưng có nhiều trường hợp chatbot của OpenAI “sai một cách đáng ngạc nhiên”.

Đôi khi SARAH của WHO đưa ra những câu trả lời kỳ lạ, có thể truyền bá thông tin sai lệch về sức khỏe cộng đồng - Ảnh chụp màn hình

Jaimie Guerra, Giám đốc Truyền thông của WHO, nói để có thể bắt chước sự đồng cảm trong các phiên đặt câu hỏi, SARAH truy cập vào camera máy tính để lưu trữ nét mặt người dùng trong 30 giây, sau đó xóa các bản ghi hình. Mỗi lượt truy cập đều ẩn danh nhưng người dùng có thể chọn chia sẻ câu hỏi của họ với WHO trong một cuộc khảo sát để cải thiện trải nghiệm, dù Jaimie Guerra nói mọi dữ liệu được thu thập đều là ngẫu nhiên và không liên kết với địa chỉ IP hoặc người dùng cụ thể để bảo vệ quyền lợi của họ.

Tuy nhiên, việc sử dụng dữ liệu nguồn mở có những rủi ro riêng vì đây là mục tiêu thường xuyên của tội phạm mạng, theo Jingquan Li - nhà nghiên cứu CNTT và y tế cộng đồng tại Đại học Hofstra (Mỹ). Một số người truy cập SARAH qua Wi-Fi rất dễ bị phần mềm độc hại tấn công hoặc hack camera video. Jaimie Guerra cho biết các cuộc tấn công cố gắng truy cập dữ liệu sẽ không thành vấn đề vì những phiên ẩn danh.

Các đối tác và nhà nghiên cứu của chính phủ cũng không có quyền truy cập thường xuyên vào dữ liệu, gồm cả những câu hỏi có thể giúp theo dõi các mô hình sức khỏe, trừ khi họ yêu cầu dữ liệu khảo sát tự nguyện. Jaimie Guerra nói điều này đồng nghĩa SARAH sẽ không phải là công cụ chính xác nhất để dự đoán đợt bùng phát cúm tiếp theo chẳng hạn.

SARAH là phần tiếp theo dự án nhân viên y tế ảo của WHO năm 2021 có tên Florence nhằm cung cấp thông tin cơ bản về COVID-19 và thuốc lá. Soul Machines, công ty đặt trụ sở tại New Zealand, đã xây dựng hình đại diện cho cả hai dự án.

Soul Machines không thể truy cập dữ liệu SARAH, nhưng Giám đốc điều hành Greg Cross cho biết công ty đang sử dụng dữ liệu mô hình ngôn ngữ lớn GPT của OpenAI để cải thiện kết quả và trải nghiệm. Đầu năm nay, WHO đã ban hành hướng dẫn đạo đức cho các đối tác chính phủ của mình với những mô hình AI liên quan đến sức khỏe, gồm cả thúc đẩy tính minh bạch của dữ liệu và bảo vệ sự an toàn.

Trong khi Florence có vẻ ngoài là một cô gái, không phải da trắng thì SARAH lại có vẻ ngoài là người da trắng. Alain Labrique nói việc thay đổi giao diện và cập nhật hình đại diện không phải là vấn đề. Người dùng có thể chọn tùy chọn hình đại diện trong các phiên bản SARAH sau.

Khi được hỏi về giới tính của SARAH, chatbot này cho biết: “Tôi là một chatbot, nhân viên y tế kỹ thuật số, nên tôi không có giới tính hay sử dụng đại từ nhân xưng. Mục đích của tôi là hỗ trợ bạn sống lành mạnh. Bạn có câu hỏi nào về việc bỏ thuốc lá, giảm uống rượu hoặc cải thiện sức khỏe tổng thể của mình không?”.

Sơn Vân