Nhóm chuyên gia của Đại học Y Dược TPHCM đã hoàn thành nghiên cứu “Xây dựng mô hình đánh giá đặc điểm hóa mô miễn dịch và sinh học phân tử của ung thư biểu mô tế bào gai niêm mạc miệng bằng kỹ thuật học máy (machine learning)”.
Ung thư niêm mạc miệng là một trong những loại ung thư phổ biến nhất trong nhóm ung thư đầu cổ, chiếm khoảng 90% các ca ung thư ác tính ở vùng khoang miệng. Căn bệnh này ảnh hưởng trực tiếp đến sức khỏe, chức năng ăn uống, giao tiếp của người bệnh và có tỷ lệ tử vong cũng như tái phát cao.
Tại Việt Nam, tỷ lệ mắc bệnh liên quan đến thói quen hút thuốc lá, nhai trầu và uống rượu còn ở mức đáng báo động. Trong bối cảnh đó, việc nghiên cứu và ứng dụng các công nghệ tiên tiến nhằm hỗ trợ chẩn đoán và điều trị bệnh trở nên cấp thiết.
Trong y học hiện đại, công nghệ sinh học phân tử đóng vai trò quan trọng trong chẩn đoán và điều trị ung thư trúng đích. Một trong những kỹ thuật tiên tiến là giải trình tự RNA (RNA-seq), giúp ghi nhận biểu hiện gene ở cấp độ phân tử, từ đó xác định các dấu ấn sinh học đặc hiệu cho từng loại ung thư. Tuy nhiên, chi phí cao và yêu cầu kỹ thuật phức tạp khiến phương pháp này chưa được ứng dụng rộng rãi ở Việt Nam, đặc biệt trong nhóm ung thư đầu cổ.
TS.BS Huỳnh Công Nhật Nam, chủ nhiệm nhiệm vụ, chia sẻ: “Hiện tại, chưa có nghiên cứu nào tại Việt Nam thực hiện giải trình tự mRNA trên bệnh nhân ung thư biểu mô tế bào gai niêm mạc miệng. Vì vậy, nhóm chúng tôi đặt mục tiêu tích hợp dữ liệu lâm sàng, mô bệnh học và phân tích RNA bằng công nghệ học máy để xây dựng mô hình dự đoán chính xác, phục vụ chẩn đoán và điều trị cá nhân hóa cho bệnh nhân Việt”.
Trong khuôn khổ nhiệm vụ, nhóm nghiên cứu đã thực hiện một chuỗi các công việc phức tạp và có hệ thống. Trước hết, nhóm đánh giá đặc điểm lâm sàng và mô bệnh học của bệnh nhân ung thư niêm mạc miệng, sau đó giải trình tự và phân tích mRNA từ các khối mô bệnh phẩm. Dữ liệu được xử lý và đưa vào mô hình học máy với mục tiêu phân nhóm bệnh nhân, tiên lượng diễn biến và gợi ý các dấu ấn sinh học tiềm năng.
Hai mô hình học máy được lựa chọn là SVM và XGBoost đã cho kết quả ấn tượng: Đạt độ chính xác dự đoán phân nhóm lên đến 70,5% và 71,4%. Các mô hình này giúp bác sĩ dự đoán biểu hiện gene từ hình ảnh mô bệnh học và đặc điểm lâm sàng, một bước tiến quan trọng giúp tiết kiệm thời gian, chi phí mà vẫn duy trì độ chính xác cao.
Đáng chú ý, cơ sở dữ liệu được nhóm xây dựng rất đồ sộ: gồm dữ liệu giải trình tự mRNA của 101 mẫu ung thư niêm mạc miệng với hơn 15.000 gene được phân tích, cơ sở dữ liệu mô bệnh học từ 206 mẫu và dữ liệu hóa mô miễn dịch từ 50 mẫu độc lập. Các dữ liệu này được tổ chức, phân loại và tích hợp trong một nền tảng website tại địa chỉ https://oscc.vn - trang web đầu tiên tại Việt Nam hỗ trợ chẩn đoán ung thư niêm mạc miệng bằng trí tuệ nhân tạo.
Trang web https://oscc.vn gồm nhiều phần chức năng như: tra cứu giải trình tự mRNA, phân tích mô bệnh học, biểu hiện gene, mô hình học máy, đánh giá đặc điểm lâm sàng, báo cáo kết quả… Giao diện đơn giản, dễ tiếp cận giúp các bác sĩ, nhà nghiên cứu và sinh viên y khoa có thể sử dụng thành thạo mà không cần chuyên môn sâu về công nghệ thông tin.
Theo TS.BS Huỳnh Công Nhật Nam, trang web không chỉ cung cấp công cụ hỗ trợ chẩn đoán mà còn mở ra khả năng hợp tác với các công ty công nghệ sinh học, dược phẩm để phát triển các xét nghiệm và liệu pháp điều trị trúng đích hiệu quả hơn.
Dựa trên phân tích dữ liệu, nhóm nghiên cứu đã phân loại ung thư biểu mô tế bào gai niêm mạc miệng thành hai nhóm riêng biệt với các đặc điểm lâm sàng và sinh học phân tử khác nhau.
Phân nhóm 1 thường gặp ở bệnh nhân lớn tuổi, nam giới, có thói quen uống rượu. Nhóm này có các đặc điểm mô bệnh học nghiêm trọng hơn, nhưng phản ứng miễn dịch mạnh, tăng tế bào T CD8 và biểu hiện cao các gene SLAIN2, ADNP, SLK. Nhóm này có tiên lượng tốt hơn, có khả năng đáp ứng với liệu pháp điều trị trúng đích.
Phân nhóm 2 gặp ở nhóm bệnh nhân có đặc điểm lâm sàng nghiêm trọng hơn nhưng ít uống rượu. Các dấu ấn sinh học của nhóm này liên quan đến đột biến gene và quá trình phân chia tế bào, biểu hiện cao gene MARCKS, ít đáp ứng miễn dịch hơn, tiên lượng kém hơn.
Từ kết quả này, nhóm đã đề xuất 12 gene có biểu hiện khác biệt rõ giữa hai nhóm làm dấu ấn sinh học tiềm năng cho chẩn đoán và điều trị. Việc xây dựng mô hình dự đoán biểu hiện gene từ dữ liệu lâm sàng mở ra cơ hội điều trị cá nhân hóa, giúp bác sĩ có thêm công cụ hỗ trợ ra quyết định chính xác.
Theo TS.BS Huỳnh Công Nhật Nam, mục tiêu dài hạn của nhóm là mở rộng nghiên cứu sang các loại ung thư đầu cổ khác, tích hợp thêm dữ liệu gene từ nhiều nguồn, hoàn thiện mô hình học máy và hợp tác quốc tế để chuẩn hóa dữ liệu.