Phần mềm chuyển đổi văn bản thành giọng nói

28/12/2023, 08:21
Theo dõi Giáo dục Thủ đô trên

Sử dụng trí tuệ nhân tạo (AI) để tự động chuyển đổi văn bản thành giọng nói là sản phẩm của PGS.TS Lương Chi Mai và cộng sự.

Chỉ cần 10 phút lấy mẫu giọng nói

PGS.TS Lương Chi Mai đã công bố gần 50 công trình nghiên cứu và viết 4 cuốn sách làm tài liệu tham khảo có giá trị cho sinh viên đại học và học viên cao học trong lĩnh vực CNTT như: “Nhập môn đồ hoạ máy tính”; “An Introduction to Computer Vision and Image Processing”;… Ngoài ra, PGS.TS Lương Chi Mai cũng là chủ nhiệm của nhiều đề tài cấp Nhà nước...

PGS.TS Lương Chi Mai cho biết, hệ thống tổng hợp tiếng nói Text-to-speech (TTS) thông thường phải xây dựng trên các bộ cơ sở dữ liệu lớn khó thu thập, đây là bài toán khó nói chung cho các ngôn ngữ cũng như cho tiếng Việt nói riêng. Do tiếng Việt có tính đặc thù của ngôn ngữ như thanh điệu, ngữ điệu và tài nguyên hạn chế.

Để tạo ra giọng mới với mẫu quá nhỏ không đủ từ vựng thì kỹ thuật đề xuất cho phép những gì chưa có của giọng mới sẽ được mượn từ những người khác. Thích nghi cho tiếng Việt với dữ liệu mẫu cá nhân nhỏ có thông qua huấn luyện hoặc không huấn luyện sử dụng các mô hình học sâu (Deep learning) với kiến trúc End-to-End để tạo ra giọng đặc trưng riêng. Đây cũng là kỹ thuật tiên tiến và là chủ đề có tính thời sự hiện nay trên thế giới.

Kết quả nghiên cứu cho phép tạo giọng đọc mới với việc lấy mẫu giọng nói khá ngắn dưới 10 phút thay vì phải lấy mẫu dữ liệu lên đến khoảng 10 giờ như trước đây. Kết quả đã được chuyển giao thương mại cho một số đài phát thanh, truyền hình.

Giọng nói mô phỏng Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam được trình diễn trước các lãnh đạo các Bộ, ngành, cơ quan Trung ương đã một lần nữa khẳng định sự tiên phong trong nghiên cứu, triển khai ứng dụng công nghệ mới của một cơ quan nghiên cứu khoa học công nghệ hàng đầu Việt Nam.

Theo giaoducthoidai.vn
https://giaoducthoidai.vn/phan-mem-chuyen-doi-van-ban-thanh-giong-noi-post666378.html
Copy Link
https://giaoducthoidai.vn/phan-mem-chuyen-doi-van-ban-thanh-giong-noi-post666378.html
Bài liên quan
Ứng dụng công nghệ cao trong phát triển lâm nghiệp bền vững
Nhiều ứng dụng mới được áp dụng trong ngành lâm nghiệp không chỉ giúp truy xuất nguồn gốc rừng nguyên liệu, định vị từng khoảnh rừng mà còn có thể đo được khả năng hấp thụ carbon, bụi mịn của từng loại cây.

(0) Bình luận
Nổi bật Giáo dục thủ đô
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Phần mềm chuyển đổi văn bản thành giọng nói