中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

人類已經(jīng)阻止不了蘋果翻譯了?

2020-09-24 16:40
來源:澎湃新聞·澎湃號·湃客
聽全文
字號

原創(chuàng) 邢逸帆 品玩

作者丨邢逸帆

郵箱丨xingyifan@pingwest.com

萬眾矚目的 iOS14 帶來了全新的內(nèi)置翻譯功能。

打開它,第一眼看去平平無奇。

翻譯應(yīng)用本體非常簡潔。在頂端選好互譯的語言后,用戶可以通過文字或語音輸入需要翻譯的內(nèi)容,翻譯后的文字會以藍色字體顯示在下方。

蘋果翻譯目前支持包括中文、英語、日語、德語、西語在內(nèi)的 11 種常用語。

不過,當我們仔細“把玩”了一下蘋果的這個翻譯軟件后,發(fā)現(xiàn)事情并不簡單。

一開始我們發(fā)現(xiàn),除了日常用語外,連一些不太常見的說法,它也能輕松解決:

比如,輸入“快樂肥宅水”后,蘋果翻譯給出的結(jié)果直接是“可樂”。

這勾起了我們的興趣,翻出一些上古老梗試了試,居然也忠實地“還原”了——

“藍瘦香菇”這一題蘋果給出的答案是“Sad.gif”。(“藍瘦香菇”是2016年火遍網(wǎng)絡(luò)的梗,源自一失戀的南寧小哥拍攝的自拍視頻,他用方言表達“難受,想哭”,被“直譯”為了“藍瘦香菇”)

這實在太神奇了。要知道,谷歌翻譯在這一題的答案還是:
我們又接著試了試更多網(wǎng)絡(luò)流行語,發(fā)現(xiàn)蘋果翻譯很有自己的想法。

輸入“奧利給”后,蘋果翻譯表示這個詞是“酷”的意思。

成精了!
而且,在面對跨文化交流的微妙場合時,蘋果翻譯也沒有輸?shù)簟?p>

日文的“月色真美”經(jīng)了它的手就變成了“我愛你”。日本網(wǎng)友紛紛表示對蘋果好感大增。

▲ 夏目漱石白教了

然而隨著先用上 iOS14 的一批人,像我們一樣不斷“試探”蘋果翻譯,大家很快發(fā)現(xiàn),這個應(yīng)用開始有點不對勁了。

比如輸入“五五開”,出現(xiàn)的英文是“盧本偉”……(盧本偉是一名前斗魚主播,在一次游戲比賽中被問到和比自己實力強大很多的對手比賽什么感受,他強行回答了“五五開”,自此在游戲圈變成這個詞的代名詞,但在游戲圈外,可能并不是所有人都知道這個梗)

▲ 它不是準確不準確的問題,它真的是那種……那種很少見的那種

而輸入“滾筒洗衣機”,日語直接顯示“工藤新一”,不由讓人替真的需要在日本購買洗衣機的人捏了一把汗。(因為“工藤新一”的日語發(fā)音,聽起來很像滾筒洗衣機。所以許多中國動漫迷會這么稱呼他。但放在一個“正經(jīng)”的翻譯軟件里,是不是太隨意了?)

▲ 雖然從某種程度來講并沒有翻譯錯

至此,蘋果翻譯給人的感覺已經(jīng)從“能精準翻譯出晦澀中文梗的精髓”變成了“這是不是有點太隨意,要耽誤真正想要翻譯的人的正事?”的疑惑了。

而且,在另一些時候,蘋果翻譯表現(xiàn)得更是好像沉迷于玩爛梗的小鬼。

明明只是普通的一句“一袋米要扛幾樓”,都硬要翻譯成“感受痛苦吧”。(因為后者的日文讀音,聽起來就像是中文的一袋米要扛幾樓,諸君可以打開蘋果翻譯一試......)

▲ 也可以輸入“辛辣天塞”試試

類似的翻車時刻越來越多,大家就開始覺得蘋果的“隨心所欲二次元”濃度也未免太高了。

被“污染”的語料

“把玩”至此,我們實在是好奇,是誰“教壞了”蘋果呢?

雖然蘋果一向?qū)ψ约业募夹g(shù)三緘其口,這次也一樣沒有說明 iOS14 到底用到了什么模型,但我們可以參考蘋果翻譯的老前輩 Google 翻譯。

Google 翻譯用到的是 Seq2Seq (Sequence to Sequence) 模型,Seq2Seq 由兩個循環(huán)神經(jīng)網(wǎng)絡(luò)模型協(xié)力組成,一個用于對輸入序列進行編碼,一個用于對輸出序列進行解碼。

當輸入中文“知識就是力量”時,編碼模型把每個字都標上一個矢量,其中每個矢量代表到目前為止已讀取的所有字的含義。在整個句子編碼結(jié)束后,解碼器即會開始生成對應(yīng)的英語句子。

通過分析大量的語料數(shù)據(jù),模型能自動從中學習出相應(yīng)的語法規(guī)則,也就是說,工程師教給模型什么,模型就學會什么。因此,蘋果的工程師可能為蘋果翻譯 feed 了太多網(wǎng)絡(luò)平行語料,導致蘋果翻譯被網(wǎng)絡(luò)用語“污染”,而識別不出文本原來的含義。

蘋果翻譯出現(xiàn)失誤的另一個可能性是,蘋果翻譯引入了知識圖譜。

知識圖譜是 Google 于 2012 年提出的概念,本質(zhì)上是一種基于圖的數(shù)據(jù)結(jié)構(gòu)。在知識圖譜中,每個名詞(又叫實體)都是一個節(jié)點,每個節(jié)點間又有邏輯關(guān)系線相連。通過這種知識圖譜,神經(jīng)網(wǎng)絡(luò)能更好地理解上下文之間的關(guān)聯(lián)。

▲ 一種知識圖譜示意圖

也許在蘋果翻譯構(gòu)建的知識圖譜中,“五五開”被鏈接到“盧本偉”這個實體,而這個實體又可以被翻譯為“Lu Benwei”,同理,“滾筒洗衣機”也可能被鏈接到了“工藤新一”這個實體。

因為網(wǎng)絡(luò)平行語料和知識圖譜的存在,翻譯模型在面對獨立的名詞時很容易翻車。比如說“瓜皮”,蘋果直接按方言理解,翻譯成“笨蛋”。

▲ "方言本當上手"

不過,根據(jù)我們對它原理的判斷,想要更準確的翻譯,解決方法之一就是在蘋果翻譯出現(xiàn)錯誤時,我們可以嘗試為文本添加上下文,來幫助模型更好地理解。

比如把“瓜皮”改成“我不吃瓜皮”,把“滾筒洗衣機”改成“滾筒洗衣機多少錢”。

蘋果的這些翻譯確實帶來了很多樂趣,但當人們真的需要用它來完成跨語言溝通時,又不由得捏一把汗。

現(xiàn)在問題來了,這樣的蘋果翻譯你喜歡嗎?

原標題:《人類已經(jīng)阻止不了蘋果翻譯了》

閱讀原文

    本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司