先說明Google Translate Service的發展歷史[1],Google Translate 是在2006年四月開始發展的,一開始所使用的方法為統計機器翻譯(statistical machine translation),此方法是以聯合國與歐洲議會的稿子來收集語料,接著在這龐大的文件檔案找出最適合的翻譯方式。但這樣子翻譯出來的準確度一直被質疑,所以在2016年時,Google轉用neural machine translation,取名為 Google Neural Machine Translation(GNMT),不同以往統計機器翻譯的逐字翻譯,GNMT所採用的是整句翻譯方式,以提高翻譯的準確度。李開復也在人工智慧來了一書中說明他自己對機器翻譯的經驗從【語法分析】==>【統計方法】==>【類神經網路(深度學習)】。
但很諷刺的是
註:類神經網路的歷史可參考「用十分鐘理解 《神經網路發展史》」
那為什麼會有很多的研究者要投入機器翻譯呢?筆者的看法有兩點:
1. 可以節省成本。
2. 機器翻譯的一些技術可應用到機器人的領域中(請參考 TED的影片:機器人可以通過大學入學考試嗎?)
那麼從事翻譯的這些人是不是就會沒工作了?根據「進擊的 Google 翻譯──透過神經機器翻譯系統,Google 翻譯可望與人類譯者並駕齊驅?」此篇文章指出Google翻譯無法翻出有詩意的文章,也還比不上那些專業的翻譯人士。還有每種語言都有屬於本身特色的文化在,例如中文裡的合文或合體字,招財進寶就是一例:
圖取自Youtube影片:https://www.youtube.com/watch?v=r3oAbouFFOA
此外中文文學裡還有唐詩、絕句、律詩等詩詞歌賦,筆者不確定用機器翻譯來翻譯這些詩詞歌賦會有什麼作品出現呢?
沒有留言:
張貼留言