Nếu Thượng đế thực sự tồn tại, ông ấy gần đây có thể đang có chút lo lắng.
Trong những truyền thuyết cổ xưa của người Do Thái, con người từng cố gắng xây dựng một tòa tháp vươn lên trời cao gọi là "Tháp Babel". Để ngăn chặn kế hoạch điên rồ này, Chúa đã đưa ra một chiến thuật tinh vi – ban cho các dân tộc khác nhau những ngôn ngữ riêng biệt, khiến họ khó giao tiếp với nhau.
Cuối cùng, rào cản ngôn ngữ khiến kế hoạch "Tháp Babel" bị đình trệ. Đến ngày nay, dù công nghệ thông tin và giao thông đã biến thế giới thành một "làng toàn cầu", việc giao tiếp giữa các hệ ngôn ngữ vẫn chỉ có thể thực hiện được nhờ sự học tập chuyên sâu về ngôn ngữ của nhau.
Tuy nhiên, sự phát triển vượt bậc của trí tuệ nhân tạo trong lĩnh vực dịch thuật đã mang lại hy vọng mới cho việc hoàn thành "Tháp Babel".
Chín mươi sáu phần trăm thí sinh cấp sáu không bằng "nó"
Trong khoảng thời gian này, công nghệ dịch máy đã trở nên nổi bật.
Mới đây, Microsoft đã tung ra một "chiến lược lớn" vào ngày 13 tháng 12 – ứng dụng dịch giọng nói thời gian thực Microsoft Translator, hỗ trợ giao tiếp đa người, đa ngôn ngữ và đa thiết bị. Các doanh nghiệp trong nước cũng không hề kém cạnh. Vào cuối tháng trước, Công ty Kechuang Xunfei đã giới thiệu công nghệ tương tự tại hội nghị thường niên của họ, có thể dịch trực tiếp các bài diễn văn bằng tiếng Trung sang tiếng Anh, Nhật, Hàn, Uyghur và nhiều ngôn ngữ khác, hiển thị trên màn hình lớn. Máy dịch giọng nói "Xiaoyi" mà họ giới thiệu còn hướng đến những ứng dụng rộng rãi hơn – du lịch nước ngoài.
Những ứng dụng dịch trực tuyến vốn không quá nổi bật cũng đã được nâng cấp đáng kể. Vào tháng 9 năm nay, Google Translate đã chính thức áp dụng hệ thống Google Neural Machine Translation (GNMT), gây xôn xao trong giới trí tuệ nhân tạo.
xem bóng đá
Còn nếu nhìn lại vào tháng 5 năm ngoái, đó là thời điểm Translate công bố hệ thống dịch máy dựa trên mạng nơ-ron (NMT).
Sự nổi bật của công nghệ dịch máy dựa vào những tiến bộ đáng kể trong lĩnh vực này nhờ công nghệ trí tuệ nhân tạo.
Ông He Zhongjun, Kiến trúc sư trưởng của, chia sẻ rằng từ những năm 40 của thế kỷ trước, các phương pháp dịch máy dựa trên quy tắc, ví dụ và thống kê lần lượt xuất hiện. Từ năm 2014, mạng nơ-ron nhân tạo bắt đầu dẫn đầu trong lĩnh vực dịch máy.
“Kết quả dịch cuối cùng trở nên mượt mà hơn rất nhiều,” bà Liu Junhua, Giám đốc Nghiên cứu Dịch máy của Kechuang Xunfei, cho biết với phóng viên khoa học, hệ thống dịch máy trực tiếp tại hội nghị và máy dịch "Xiaoyi" đều sử dụng phương pháp dịch máy dựa trên mạng nơ-ron.
Nếu hỏi sự đến của trí tuệ nhân tạo đã nâng trình độ dịch máy lên mức nào, He Zhongjun đưa ra một đề bài thi tiếng Anh cấp độ CET-6. Đề bài yêu cầu dịch một câu tiếng Trung sang tiếng Anh, và kết quả do Translate đưa ra gần như không có lỗi về từ vựng và ngữ pháp.
Không riêng gì, khi giới thiệu sản phẩm Xiaoyi, Kechuang Xunfei cũng khẳng định nó có thể đạt trình độ CET-6. “Đề thi dịch tiếng Anh cấp độ CET-6 có tổng điểm là 15, hiện tại phần mềm dịch máy có thể đạt được 11 điểm,” Liu Junhua giải thích, điều này cho thấy công nghệ dịch máy có thể vượt qua hơn 90% sinh viên thi CET-6.
dây chuyền sản xuất
Vào hai hoặc ba năm trước, từ "mượt mà" và "tự nhiên" vẫn khiến các nhà nghiên cứu dịch máy cảm thấy khó khăn. Lúc đó, phương pháp dịch máy dựa trên thống kê là xu hướng chủ đạo.
Trong vòng hơn hai năm, hệ thống dịch máy dựa trên mạng nơ-ron đã vượt qua hệ thống dịch máy dựa trên thống kê trên nhiều bộ dữ liệu công khai.
Theo trải nghiệm của Liu Junhua, dịch máy dựa trên mạng nơ-ron đơn giản hơn rất nhiều so với phương pháp trước đó. Ví dụ, để dịch một câu tiếng Trung sang tiếng Anh, phương pháp dựa trên thống kê sẽ phải phân tách từ vựng và cụm từ của câu, sau đó dịch từng đơn vị, rồi ghép lại và điều chỉnh thứ tự. Mỗi bước đều liên quan đến mô hình phức tạp.
Nói cách hình tượng, nếu phương pháp dựa trên thống kê giống như một dây chuyền dài, thì sau khi dùng mạng nơ-ron chỉ cần một "lò luyện đan".
Mô hình dịch máy nơ-ron cơ bản bao gồm hai phần: bộ mã hóa và bộ giải mã,
Không chỉ hiệu suất dịch được cải thiện rất nhiều, kết quả còn mượt mà và tự nhiên hơn. Lý do là vì phương pháp dịch máy nơ-ron xử lý toàn bộ câu, có thể chú ý đến ngữ cảnh của từ vựng, do đó bản dịch không cứng nhắc như phương pháp dịch máy dựa trên thống kê.
Chính sự "mượt mà" và "tự nhiên" đã đưa công nghệ dịch máy đến những ứng dụng thực tế hơn. Hơn nữa, khi kết hợp với các công nghệ trí tuệ nhân tạo khác, dịch máy có thể chạm đến "điểm đau" của việc không hiểu ngôn ngữ, từ đó thâm nhập sâu vào nhiều lĩnh vực như kinh doanh, du lịch và học tập.
Ví dụ, cả Microsoft Translator hay hệ thống dịch máy trực tiếp tại hội nghị của Kechuang Xunfei và máy dịch Xiaoyi đều tích hợp công nghệ nhận diện giọng nói để tạo cầu nối giao tiếp ngôn ngữ.
tin tuc the thao
Ứng dụng Translate, tích hợp công nghệ OCR, có thể giúp người dùng dịch biển báo, thực đơn và hướng dẫn sử dụng bằng tiếng Anh trong môi trường du lịch nước ngoài.
Chờ đợi phá vỡ "tường thở than"
chủ nghĩa tối tăm
Tuy nhiên, đặt niềm tin vào công nghệ dịch máy hiện tại, thậm chí là trong vài năm tới, để xây dựng lại "Tháp Babel" vẫn chưa thực sự khả thi.
Phương pháp dịch máy dựa trên mạng nơ-ron tuy đã nâng cao chất lượng dịch máy đáng kể, nhưng vẫn tồn tại nhiều thách thức kỹ thuật,
Quan trọng hơn, sự phức tạp và đa dạng của "con người" – thứ ngay cả chúng ta cũng không thể kiểm soát – vẫn là bức tường thở dài đối với mọi sự phát triển của trí tuệ nhân tạo.
Mặc dù có thể dịch một câu đơn lẻ một cách mượt mà và tự nhiên, nhưng trong việc hiểu toàn bộ văn bản, dịch máy vẫn chưa đủ tốt. Khi gặp các thành ngữ, thơ ca, chơi chữ hay biểu đạt khẩu ngữ, dịch máy sẽ lộ rõ sự yếu kém. Về việc tích hợp kiến thức vào hệ thống dịch máy để máy thực sự "hiểu" ngôn ngữ của con người, hiện tại vẫn chưa có giải pháp tốt.
Từ góc độ khác, dù là dịch máy dựa trên thống kê hay mạng nơ-ron, đều dựa trên một kho dữ liệu khổng lồ.
xem bóng đá
Tuy nhiên, Liu Junhua cho biết với phóng viên khoa học rằng, mặc dù dữ liệu ngôn ngữ chính như tiếng Trung và tiếng Anh tương đối đầy đủ, nhưng dịch máy cho các ngôn ngữ nhỏ, như ngôn ngữ thiểu số trong nước mà Kechuang Xunfei đang chú trọng, vẫn còn thiếu dữ liệu.
Hiện tại, kết quả đạt được chứng minh rằng mạng nơ-ron có hiệu quả tốt trong lĩnh vực dịch máy, nhưng tiềm năng của nó vẫn chưa được khai thác hết,
trọng trách dài lâu
Nói như vậy, Chúa có thể yên tâm hơn: Dù trí tuệ nhân tạo muốn giúp con người xây dựng lại "Tháp Babel", thì cũng chỉ mới bắt đầu đặt những viên gạch đầu tiên mà thôi.
Chỉ là, tương lai thì sao?