Những sai sót trong bài luận của ChatGPT được thầy Diamond tô vàng. Ảnh: WSJ. |
Bài viết được chấm 3/6 điểm, nằm trong phạm vi từ B- đến C theo tiêu chí của AP. Dù đạt điểm chất lượng, kết quả của ChatGPT không đáp ứng yêu cầu của Stern.
"Chất lượng tổng thể bài viết nằm trong khoảng 30% tệ nhất lớp", thầy Diamond cho biết.
Khi được hỏi có nghi ngờ bài luận được viết bởi AI hay không, Diamond thừa nhận ông không nghĩ đến khả năng đó bởi một số học sinh vẫn có thể viết bài với cấu trúc tốt như trên.
Kiểm tra đạo văn trên Grammarly, chỉ một số cụm từ phổ biến trong bài bị đánh dấu. Dù vậy, các phần mềm đạo văn đã lên kế hoạch bổ sung tính năng phát hiện văn bản viết bởi AI.
Eric Wang, Phó chủ tịch AI của Turnitin, công cụ phát hiện đạo văn cho biết phần mềm có thể phát hiện văn bản viết bởi AI dựa trên một số chi tiết mà con người không thể nhận ra. Dự kiến đến năm 2023, Turnitin sẽ bổ sung tính năng phát hiện văn bản viết bởi AI.
Giao diện chính của ChatGPT. Ảnh: WSJ. |
Một thử thách khác dành cho ChatGPT là giúp Stern tham gia thảo luận nhóm về một văn bản nhưng cô không thực sự đọc.
Văn bản được thảo luận là truyện ngắn Car Crash While Hitchhiking trong tập Jesus' Son. Trong khi bạn cùng nhóm sôi nổi thảo luận, ChatGPT không giúp ích nhiều cho Stern.
Khi tìm kiếm thông tin về cuốn sách, phần mềm trả về một số dữ liệu cơ bản, nhưng tên nhân vật chính bị ghi sai. Tổng kết, thầy Diamond chấm điểm C cho phần thảo luận của Stern và ChatGPT.
Sam Altman, CEO OpenAI cho biết tại thời điểm này, phần mềm không đáng tin cậy cho những tác vụ quan trọng. Tuy nhiên, các kỹ sư sẽ làm việc để cải thiện tốc độ, hiệu quả tìm kiếm dữ liệu của ChatGPT trong tương lai.