ChatGPT đạt điểm cao hơn bác sĩ khi làm bài kiểm tra y khoa

31/05/2023, 17:25
Theo dõi Giáo dục Thủ đô trên

ChatGPT đưa ra câu trả lời dài, chi tiết và nhiều thông tin quan trọng hơn. Chuyên gia cũng đánh giá ngôn ngữ của ChatGPT dễ gây đồng cảm hơn so với câu trả lời của bác sĩ.

Câu trả lời của ChatGPT được các bác sĩ đánh giá cao. Ảnh: Shutterstock.

Mới đây, Đại học California (Mỹ) đã thực hiện một nghiên cứu để kiểm tra khả năng của ChatGPT bằng cách cho công cụ này trả lời 195 câu hỏi y tế, sau đó so sánh với phần trả lời với các bác sĩ.

Song song với việc cho ChatGPT làm bài thi, các nhà nghiên cứu cũng đăng các câu hỏi này lên một diễn đàn công khai có tên là AskDocs. Một bác sĩ đã trả lời các câu hỏi trên diễn đàn. Thông tin về bác sĩ này đã được kiểm duyệt và xác minh, theo ScienceAlert.

Câu trả lời của ChatGPT được đánh giá cao hơn

Sau khi thu thập câu hỏi từ ChatGPT và vị bác sĩ, nhóm nghiên cứu đã mời một hội đồng gồm các bác sĩ để đánh giá câu trả lời nào tốt hơn. Hội đồng sẽ không được biết câu trả lời nào của con người, câu trả lời nào của AI.

Trong số 195 câu hỏi, Đại học California nêu 2 câu hỏi tiêu biểu là: Một người nuốt phải tăm sẽ gặp nguy hiểm như thế nào; một người có bị chấn thương sau khi đập đầu vào một thanh kim loại hay không.

Mỗi câu trả lời sẽ được 3 bác sĩ chấm điểm và tính điểm trung bình. Hai bài thi của con người và AI sẽ nhận được 585 đánh giá từ chuyên gia.

Khoảng 79% đánh giá của ban giám khảo nghiêng về chatbot. Họ nói rằng họ thích câu trả lời của ChatGPT vì công cụ này đưa ra những thông tin chất lượng hơn và sử dụng ngôn ngữ mang giá trị đồng cảm cao hơn so với câu trả lời của bác sĩ.

ChatGPT lam bai thi anh 1

Câu trả lời về y khoa của ChatGPT được đánh giá cao về chất lượng. Ảnh: LeBigData.

Số câu trả lời của ChatGPT được đánh giá cao về chất lượng nhiều hơn số câu của bác sĩ khoảng 4 lần. Con số này về xếp hạng đồng cảm cao hơn khoảng 10 lần.

Ngoài ra, các câu trả lời của ChatGPT cũng dài hơn khoảng 4 lần so với các câu trả lời bác sĩ cung cấp. Trung bình, chatbot trả lời 221 từ cho mỗi câu hỏi trong khi câu trả lời của bác sĩ chỉ khoảng 52 từ.

Dưới đây là một ví dụ về câu trả lời của bác sĩ và ChatGPT. Câu hỏi là "Một người nuốt phải tăm sẽ gặp nguy hiểm như thế nào?".

Bác sĩ trả lời: Nếu bạn đã nuốt cây tăm quá 2-6 giờ, rất có thể cây tăm đã đi vào ruột. Điều đó có nghĩa việc lấy cây tăm ra ngoài sẽ không dễ dàng. Tuy nhiên, nhiều người nuốt lưỡi dao cạo và tăm xỉa răng nhưng không gặp vấn đề gì. Nếu bạn bị đau bụng, đừng ngần ngại tìm đến phòng cấp cứu và nói rõ bạn nuốt phải tăm. Tạm thời, cây tăm sẽ không gây hại gì nhiều.

ChatGPT trả lời: Việc lo lắng khi nuốt phải vật thể lạ là điều đương nhiên. Tuy nhiên, trong trường hợp này, việc nuốt phải tăm sẽ ít khả năng gây hại nghiêm trọng cho bạn. Tăm được làm bằng gỗ, không độc hại và không gây ngộ độc. Song một cây tăm có thể gây thương tích nếu nó mắc vào cổ họng hoặc chọc thủng đường tiêu hóa.

Tuy nhiên, điều này khó có thể xảy ra với một cây tăm dùng trong nấu ăn, xỉn màu và chỉ dài 2 cm. Nếu bạn cảm thấy khó chịu hoặc có các triệu chứng như đau bụng, khó nuốt hoặc nôn mửa, bạn cần liên hệ với nhà cung cấp dịch vụ chăm sóc sức khỏe để kiểm tra thêm.

Nếu bạn không có triệu chứng nào, bạn có thể yên tâm vì có thể cây tăm đã đi qua hệ thống tiêu hóa. Dù vậy, bạn vẫn cần thận trọng khi ăn uống và cần loại bỏ các dị vật trước khi ăn.

Có thể, bạn sẽ thấy mình mắc bệnh ảo, đây là điều dễ hiểu, nhưng bạn đừng quá lo lắng vì khả năng cây tăm gây ảnh hưởng nghiêm trọng đến bạn rất khó xảy ra.

ChatGPT vẫn còn nhiều nhược điểm

ChatGPT cung cấp câu trả lời lịch sự, dễ đọc hiểu và thoạt nhìn có vẻ mạch lạc, nhưng thực tế, nó vẫn mắc những lỗi cơ bản về mã hóa và toán học. Ngoài ra, nhiều sự kiện trong câu trả lời của nó là bịa đặt hoặc thông tin không chính xác.

Tuy nhiên, chatbot này vẫn có thể hỗ trợ bác sĩ, nhất là trong bối cảnh bác sĩ bị "ngập" trong đống tin nhắn của bệnh nhân khi đại dịch Covid-19 bùng phát, nhu cầu thăm khám từ xa phổ biến hơn.

Theo đó, chatbot có thể giúp bác sĩ soạn thảo các câu trả lời để giải đáp thắc mắc của bệnh nhân. Sau đó, bác sĩ sẽ chỉnh sửa những câu trả lời này.

Các nhà nghiên cứu tại Đại học California nói thêm nghiên cứu hiện tại sẽ thúc đẩy thêm nghiên cứu về việc áp dụng AI để nhắn tin. Khi đó, câu hỏi của bệnh nhân sẽ được trả lời nhanh chóng, sự đồng cảm và các tiêu chuẩn sẽ được nâng cao. Đồng thời, chatbot sẽ làm giảm các hoạt động khám lâm sàng không cần thiết để giải phóng nguồn lực cho những trường hợp cần thiết hơn.

Bài liên quan

(0) Bình luận
Nổi bật Giáo dục thủ đô
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
ChatGPT đạt điểm cao hơn bác sĩ khi làm bài kiểm tra y khoa