Port

基於語言學驅動神經機器翻譯模型與中葡機器翻譯系統應用

黃輝、劉學博、周沁

澳門大學

機器翻譯是人工智能與自然語言處理的核心領域之一,可以實現世界上不同國家不同語言間的無障礙交流,協助打破語言壁壘。基於神經網絡技術的神經機器翻譯目前已成為主流方法,但由於神經網絡的低解釋性等因素,當前神經機器翻譯研究與應用停滯不前,模型已達性能天花板。語言學知識的引入可以提升模型對句子的建模能力並幫助理解機器翻譯的推理過程,從而達到改善譯文質量的目的。本項目從澳門實際的中文與葡文的互譯需求出發,創新性地提出基於語言學驅動的神經機器翻譯並應用於中葡機器翻譯系統。

本項目開發出「UM2T中葡在線神經機器翻譯系統」和「UM-CAT在線中葡英輔助翻譯平臺」,在中葡的互譯效果顯著超越了國內外主流的在線翻譯系統,被大量用戶使用並收到好評,目前已被超過50家機構註冊使用。除了提供實時、高質量的全文翻譯外,所研產品還配備澳門術語本土化、翻譯記憶、輔助提示、多領域翻譯等功能,可服務於科技、政治、文化、教育等行業和領域,協助澳門打造「溝通無障礙」的智慧城市和「中國與葡語系國家商貿合作服務平臺」的樞紐城市。

圖1 本項目提出的語言學驅動神經機器翻譯模型示意圖

圖2 UM2T在線中葡機器翻譯平台產品圖

圖3 項目組二十餘年研發的「中葡英機器翻譯產品」總覽圖