Sự kiện: Thế giới trẻ

Tiến sĩ trẻ chuyển văn bản sang tiếng nói

TP - Một tiến sĩ trẻ của ĐH Khoa học Tự nhiên (ĐHQG TPHCM) xây dựng thành công một phần mềm có thể tạo ra giọng nói nhân tạo của người trên máy tính từ dữ liệu đầu vào là văn bản.

Thành công này mở ra rất nhiều ứng dụng thiết thực trong đời sống hàng ngày.

TS. Vũ Hải Quân

Năm 2001, giảng viên Vũ Hải Quân, cựu sinh viên Khoa Công nghệ Thông tin – ĐHKHTN (ĐHQG TPHCM) sang thành phố Trento (Italy) làm nghiên cứu sinh ngành khoa học máy tính tại ĐH Tổng hợp Trento. Đến năm 2005, anh lấy bằng tiến sĩ với đề tài dịch tiếng nói tại đây.

Luận án của anh là mắt xích trong dự án TC-STAR lớn nhất thế giới về dịch tiếng nói, do Liên minh Châu Âu tài trợ, quy tụ các nhà khoa học thuộc trường đại học, công ty tên tuổi như Nokia, IBM, Google (http://www.tc-star.org/).

Sau đó, Vũ Hải Quân lại sang ĐH Leuven (Bỉ) để tiếp tục làm nghiên cứu sau tiến sĩ với sự hướng dẫn của Dirt Van Compernolle, giáo sư đầu ngành về xử lý tiếng nói trên thế giới.

Tiến sỹ Vũ Hải Quân được giữ lại giảng dạy tại ĐH này. Năm 2007, anh quyết định về Việt Nam để theo đuổi ước mơ xây dựng hệ thống tổng hợp tiếng nói nhân tạo cho tiếng Việt.

Năm 2008, ĐHQG TPHCM phê duyệt dự án phòng thí nghiệm trí tuệ nhân tạo đặt tại trường ĐHKHTN. Cũng trong năm đó, trường tiếp tục phê duyệt đề tài trọng điểm về tổng hợp tiếng nói tiếng Việt và giao nhóm nghiên cứu Vũ Hải Quân thực hiện.

Công trình của Vũ Hải Quân và cộng sự có tên gọi Tiếng nói Phương Nam (VOS) tạo ra giọng nói nhân tạo của người trên máy tính từ dữ liệu đầu vào là văn bản.

Đã có một số chương trình đi theo hướng này, nhưng VOS phiên bản 1.0 được phát triển theo phương pháp mới với các cải tiến để tạo ra tiếng nói được tổng hợp tự nhiên, rõ ràng, rất gần với giọng thực.

Đơn vị ngữ âm không nhất thiết phải là âm tiết mà có thể là từ, thậm chí cụm từ, được xác định một cách mềm dẻo trong quá trình tổng hợp. Các đơn vị này sẽ được phân đoạn một cách tự động trên mỗi câu thu âm bằng phần mềm nhận dạng tiếng nói mà nhóm đã phát triển.

Theo TS Vũ Hải Quân, VOS có rất nhiều ứng dụng trong thực tế. VOS có thể được áp dụng trong các ứng dụng truy vấn thông tin qua tổng đài điện thoại, trong đó yêu cầu của người dùng sẽ được tiếp nhận và xử lý, trả về thông tin do người dùng yêu cầu dưới dạng văn bản.

VOS còn có thể được tích hợp với hệ thống định vị GPS trong các ứng dụng tìm đường đi gắn trên xe hơi để cung cấp các chỉ dẫn dạng âm thanh, hạn chế việc vừa lái xe vừa nhìn chỉ dẫn.

Ngoài ra, VOS còn có thể sử dụng trong các hệ thống dịch tiếng nói, giúp người khiếm thị cập nhật kiến thức, dạy tiếng Việt cho người nước ngoài. Mục tiêu VOS hướng tới nữa sẽ là Việt hóa các sản phẩm của Microsoft, Google v.v… bằng tiếng nói.

PGS - TS Dương Anh Đức – Phó Hiệu trưởng Trường ĐHKHTN ĐHQG TPHCM, chủ nhiệm đề tài, cho biết: “VOS sẽ dần trở nên quen thuộc vì những tính năng độc đáo của nó. Chúng tôi sẽ tiếp tục hoàn thiện để tạo nên một sản phẩm hoàn chỉnh. Thực tế cũng cho thấy, sau một tuần đưa lên mạng, đã có hơn 10.000 người dùng thử”.

Theo TS Vũ Hải Quân, đây mới chỉ là bước đi đầu tiên của anh. Hướng  nghiên cứu tiếp theo của anh là phát triển để xây dựng hệ thống giao tiếp giữa người – máy bằng tiếng Việt. 

Video đang được xem nhiều

Cùng chuyên mục

Xem thêm Công nghệ

Cùng chủ đề

Mới - Nóng

Khám phá