Google hướng tới viễn cảnh 'dịch phát ăn ngay'

Google hướng tới viễn cảnh 'dịch phát ăn ngay'
Trong mắt nhìn của Google về tương lai, người dùng sẽ có thể phiên dịch mọi tài liệu sang tiếng Anh chỉ trong chớp mắt, và tất nhiên là không hề ngô nghê, máy móc như hiện nay.

Được mang tên "Dịch máy thống kê", công nghệ này khác hẳn với những nỗ lực trước đây ở chỗ nó loại bỏ hoàn toàn vai trò của các chuyên gia ngôn ngữ, các quy tắc ngữ pháp và từ điển học.

Dựa vào tần suất

Thay vào đó, nó tổng hợp tất cả những tài liệu mà loài người đã từng phiên dịch ra ít nhất hai thứ tiếng, sau đó xây dựng một cơ sở dữ liệu khổng lồ để phân tách, đối chiếu và chuyển nghĩa.

Có thể chất lượng lúc đầu không thật hoàn hảo, song dù sao, "Dịch máy thống kê" vẫn là một bước cải tiến so với các công nghệ dịch máy trước đây, ông Franz Och, 35 tuổi, Giám đốc dự án cho biết.  Để minh chứng, Och đã cho phóng viên AP xem một trang tin tức bằng tiếng Ả rập được dịch sang thứ tiếng Anh khá "dễ tiêu hóa".

Hai nhân viên khác của Google ngồi bàn bên cạnh cho biết họ là người Nga, và phiên bản dịch từ tiếng Anh sang tiếng Nga của một trang tin khác cũng khá dễ hiểu, tuy đôi chỗ có "lạ tai" chút ít.

Nói thông thạo tiếng Đức, Anh và tiếng Ý, Och đã cần mẫn nhập hàng trăm triệu từ trong các văn bản tiếng Ả rập và Anh vào máy tính. Các nguồn tư liệu chủ yếu được lấy từ tài liệu của EU và Liên hợp quốc. "Càng nhập nhiều dữ liệu vào trong hệ thống, kết quả thu được càng chính xác", Och nói.

Khó thay thế con người

Hiện tại, Google đang cung cấp công cụ dịch máy thống kê cho 3 thứ tiếng A rập, Trung Quốc và Nga sang/từ tiếng Anh tại địa chỉ http://www.google.com/language_tools.

Giới phân tích tỏ ý khen ngợi nỗ lực của Google, nhưng không quên nhấn mạnh rằng công nghệ này vẫn còn nhiều hạn chế.

"Phần mềm không thể thay thế con người trong việc dịch thuật chuyên nghiệp được. Có thể dùng phần mềm để đọc hiểu một tài liệu, chứ không thể tung hứng với ngôn từ để "đánh bóng" tài liệu được", một giáo sư ngôn ngữ học tại Berlin nhận định.

Theo Trọng Cầm
VietnamNet/ AP

MỚI - NÓNG