閒聊:「機器翻譯的歷史」

若您覺得文章寫得不錯,請點選文章上的廣告,來支持小編,謝謝。

先說明Google Translate Service的發展歷史[1],Google Translate 是在2006年四月開始發展的,一開始所使用的方法為統計機器翻譯(statistical machine translation),此方法是以聯合國與歐洲議會的稿子來收集語料,接著在這龐大的文件檔案找出最適合的翻譯方式。但這樣子翻譯出來的準確度一直被質疑,所以在2016年時,Google轉用neural machine translation,取名為 Google Neural Machine Translation(GNMT),不同以往統計機器翻譯的逐字翻譯,GNMT所採用的是整句翻譯方式,以提高翻譯的準確度。李開復也在人工智慧來了一書中說明他自己對機器翻譯的經驗從【語法分析】==>【統計方法】==>【類神經網路(深度學習)】。

但很諷刺的是

類神經網路(現稱深度學習)很早就有學者提出來了】

註:類神經網路的歷史可參考「用十分鐘理解 《神經網路發展史》

那為什麼會有很多的研究者要投入機器翻譯呢?筆者的看法有兩點:
1. 可以節省成本。
2. 機器翻譯的一些技術可應用到機器人的領域中(請參考 TED的影片:機器人可以通過大學入學考試嗎?)

那麼從事翻譯的這些人是不是就會沒工作了?根據「進擊的 Google 翻譯──透過神經機器翻譯系統,Google 翻譯可望與人類譯者並駕齊驅?」此篇文章指出Google翻譯無法翻出有詩意的文章,也還比不上那些專業的翻譯人士。還有每種語言都有屬於本身特色的文化在,例如中文裡的合文或合體字,招財進寶就是一例:

此外中文文學裡還有唐詩、絕句、律詩等詩詞歌賦,筆者不確定用機器翻譯來翻譯這些詩詞歌賦會有什麼作品出現呢?

套用一字千金所用的標語:「淘五千年中華文化,考現代人一字千金、讓我們一起來領略中華文字之美。

沒有留言:

張貼留言