AI 浪潮下的本地化作業

在業界來說,經常使用「本地化」(localization) 一詞代替「翻譯」(translation)。其實翻譯三原則 (信、達、雅) 已經足以含括本地化工程的一切。但在數位時代,為人類服務的機器早已取代一般能力的譯者,能夠近乎即時地產生對象所需的本地文字。於是乎,在追求完美的文案中,「翻譯」及「機器翻譯」變成貶義詞,我們又開始追求可以達到「信達雅」的本地化了。

連圖片都能無中生有了,在 AI 時代自動翻譯還會是問題嗎?

過去,業界大多使用電腦輔助翻譯軟體 (CAT) 來幫助譯者。在這類工具中,電腦可以「記憶」譯者曾經翻過的文字,將其存入「翻譯記憶」(TM, Translation Memory) 中,以便在後續翻譯時可以時時進行比對。只要比對相似度達到一定程度,翻譯工具就會將前次翻譯的結果預先填入 (或顯示在一旁) 欲翻譯的本地語句中。此時譯者只要稍加修飾/調整,即可完成這一條相似度高的語句的翻譯工作。幾番操作後,一個包含幾萬詞條的 TM 可以當寶,因為它可省下大量時間,以及保有翻譯的一致性。

一個經過校對和維護的 TM 有助於翻譯工作的進行

當然,有規模的業者/業主也會利用這項工具,例如發出翻譯案件時就隨附需要參考的 TM 檔,希望譯者可以遵循過去保有/審核過的翻譯詞條。

好還要更好。最近,這個靠著電腦輔助翻譯的好日子結束了。我們迎來了 Google 翻譯和 AI 的浪潮。

在數位時代中,除非是純文學作品,否則信達雅已經不是本地化的最高準則,而或許是速度。我們知道股票交易是全球連動性最高的一種業務,若想讓資訊像股市表現一樣在全球快速流動,那麼我們只能喜迎機器翻譯和人工智慧翻譯的到來。接著,容我為您引薦兩大先進的工具──Google 翻譯和 ChatGPT。

這兩個 logo 你應該不陌生吧

先來看一下 Google 翻譯現在的能耐。過去只能將原始文字貼入網頁上翻譯,如今 Google 翻譯多了上傳「文件」、「圖片」等功能,更符合我們的實際需要。這裡我提供一個翻譯蔡司型錄的實例。我們可以上傳 PDF 檔案進行翻譯,然後得到 Google 翻譯幫你 (粗略) 排版好的成果。

過去只能直接貼入文字翻譯,現在可以上傳圖片、文件和翻譯網站了
這是原始 PDF 檔
此時我們可以得到 Google 機器翻譯好的文件,連粗略的版型都有
再來看一個例子,我們找個日文文件來使用機器翻譯
雖然稍可了解其意,但這樣的成品是不可以使用的

仔細看翻譯內容,雖然機器翻譯的味道很重,但基本上已經是可讀的語句。想要閱讀論文或其他專業文件的人有福了。不需受困於單字能力,直接就能切入核心,快速了解原文中需要「取得」的知識。

同樣的一個範例,來看看最近大行其道的 AI 工具 (ChatGPT) 能做到什麼程度。

只要你有電腦,一定也已經試過 ChatGPT 了吧
逐段要求 ChatGPT 翻譯。可惜的是即使已經要求使用繁體中文,ChatGPT 還是會很固執地使用簡體中文回答

答案是,我們大概只用了 ChatGPT 3% 的功能吧。我的做法是逐段貼上 ChatGPT 獲得翻譯好的語句,然後一段一段問 (免得它異想天開弄錯領域)。實際把 ChatGPT 翻譯結果與 Google 翻譯相比,ChatGPT 明顯通順了許多。好處是,ChatGPT 還可以讓你「問」。一些慣用俚語或說法,經過 ChatGPT 解釋後可以獲得更通順的表示。再也不是逐句翻譯了。

當然,ChatGPT 的 AI 翻譯缺點也不少。它更像是翻「意」而不只是翻譯。你可以得到更口語的譯句,但卻不夠精簡。而且目前的介面還不好使用,也沒有能力直接翻譯檔案或圖片。又或許,我應該上幾堂 ChatGPT 的課才能知道如何吟唱,讓 ChatGPT 為我表演魔法。

所以,即使有了這些工具,真人的角色還是不可或缺。我們需要一個熟悉該領域的大腦。利用機器翻譯/AI 翻譯的成果,然後經由真人「再度翻譯」,才是兼具速度和品質的翻譯方法。