下載客戶端

登錄

周伯文對(duì)話斯坦福教授曼寧：人機(jī)對(duì)話智能新進(jìn)展需要新“圖靈測(cè)試”

2020-06-29 15:46

來(lái)源：澎湃新聞·澎湃號(hào)·湃客

原創(chuàng) Synced 機(jī)器之心

機(jī)器之心報(bào)道

機(jī)器之心編輯部

6 月 22 日，在 2020 智源大會(huì)上，有一場(chǎng)大佬對(duì)大佬的精彩會(huì)談。

過(guò)去一年里，人工智能進(jìn)展最大的方向在自然語(yǔ)言處理（NLP），BERT、GPT-2 等預(yù)訓(xùn)練模型引領(lǐng)了很多方向的新時(shí)代，又催生出了大量商業(yè)應(yīng)用機(jī)會(huì)。面對(duì)技術(shù)的進(jìn)步，AI 領(lǐng)域的頂級(jí)學(xué)者和從業(yè)高管是如何看待未來(lái)前景的？近日，2020 智源大會(huì)在線上召開(kāi)，在為期四天的會(huì)議中，5 位圖靈獎(jiǎng)得主、上百位業(yè)內(nèi)專家在 19 個(gè)專題論壇云上共同暢想了人工智能的下一個(gè)十年。

在智源大會(huì)上，京東集團(tuán)技術(shù)委員會(huì)主席、京東智聯(lián)云總裁、京東人工智能研究院院長(zhǎng)、IEEE Fellow 周伯文與斯坦福大學(xué)教授、人工智能實(shí)驗(yàn)室負(fù)責(zé)人克里斯托弗 · 曼寧（Christopher Manning）展開(kāi)了一次精彩的交流。他們討論了自然語(yǔ)言處理領(lǐng)域近期的進(jìn)展，預(yù)訓(xùn)練模型興起之后的未來(lái)發(fā)展方向，甚至還為人工智能的標(biāo)桿評(píng)測(cè)基準(zhǔn)——圖靈測(cè)試找到了一個(gè)「替代方案」。

在交流過(guò)程中，兩人也提及了京東最近被人工智能頂會(huì) ACL-2020 接收的研究，以及曼寧剛剛發(fā)表的工作，有關(guān)預(yù)訓(xùn)練模型學(xué)習(xí)到的語(yǔ)言結(jié)構(gòu)。

在過(guò)去這一年中，我們見(jiàn)證了許多 NLP 領(lǐng)域的技術(shù)成果和場(chǎng)景落地。對(duì)此，人工智能著名學(xué)者克里斯托弗 · 曼寧和京東集團(tuán)技術(shù)「掌門人」周伯文是如何看待的？讓我們一探究竟。

語(yǔ)言理解 & 人機(jī)對(duì)話領(lǐng)域過(guò)去一年的進(jìn)展

周伯文與曼寧在對(duì)話伊始回顧了在 2019 年智源大會(huì)上尖峰對(duì)話中達(dá)成的共識(shí)：任務(wù)導(dǎo)向的多輪對(duì)話是 NLP 下一個(gè)十年重點(diǎn)的研究和應(yīng)用方向。周伯文還創(chuàng)造了一個(gè)新詞「任務(wù)導(dǎo)向型對(duì)話智能」（Task-oriented Conversational Intelligence），一方面，任務(wù)導(dǎo)向型對(duì)話智能可以反向推動(dòng)許多基礎(chǔ)技術(shù)能力的進(jìn)步，另一方面，它的發(fā)展也將對(duì)經(jīng)濟(jì)方面產(chǎn)生巨大影響，帶來(lái)人機(jī)交互技術(shù)驅(qū)動(dòng)的萬(wàn)億級(jí)市場(chǎng)。

在語(yǔ)言理解 & 人機(jī)對(duì)話領(lǐng)域過(guò)去一年的進(jìn)展層面上，周伯文和曼寧不約而同提到了「最令人印象深刻的就是人們見(jiàn)證了超大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的出現(xiàn)，它們可以生成有組織的語(yǔ)言文字表達(dá)，」

曼寧表示：「其中的代表就是 GPT-2 和 GPT-3，也包含 BERT、RoBERTA 和 ALBERT、ERNIE 等等不少 BERT 變種。它們使得自然語(yǔ)言理解與生成有了非常大的發(fā)展。我們也看到傳統(tǒng) AI 領(lǐng)域有了很大轉(zhuǎn)變，很多任務(wù)目前都傾向于被大型模型來(lái)解決?！?/p>

人工智能發(fā)展的 40 多年來(lái)，我們一直在努力試圖讓 AI 可以回答科學(xué)問(wèn)題。我們過(guò)去嘗試使用的思路是研究知識(shí)的表達(dá)方法，阿蘭圖靈實(shí)驗(yàn)室的 Aristo Project 試圖讓 AI 理解科學(xué)道理，進(jìn)而深度理解世界，這一思路在最初的十年推動(dòng)了知識(shí)的表達(dá)與推理。

在 2020 年，我們通過(guò)超大尺寸模型實(shí)現(xiàn)了巨大的進(jìn)步。基于 RoBERTa 預(yù)訓(xùn)練模型，我們可以實(shí)現(xiàn) 95% 的科學(xué)問(wèn)題回答準(zhǔn)確率，這看起來(lái)是目前解決知識(shí)問(wèn)題的最好方法了。

這些進(jìn)步為新一輪商業(yè)應(yīng)用打開(kāi)了道路。「未來(lái)的方向雖然還無(wú)法確定，但我們可以看到基于預(yù)訓(xùn)練語(yǔ)言模型，為搜索引擎公司等科技企業(yè)帶來(lái)了很多新商業(yè)機(jī)會(huì)，」曼寧表示?！杆麄兛梢詫?shí)現(xiàn)近十年來(lái)最大的單個(gè)技術(shù)進(jìn)步，構(gòu)建更好的機(jī)器翻譯系統(tǒng)，對(duì)話 AI，人工智能客服系統(tǒng)等等?，F(xiàn)在，我們正在經(jīng)歷 NLP 領(lǐng)域激動(dòng)人心的時(shí)刻。」

NLP 領(lǐng)域最近發(fā)生了從特定任務(wù)模型向多任務(wù)，大規(guī)模預(yù)訓(xùn)練模型方向轉(zhuǎn)變的重要變化。一方面，工業(yè)界樂(lè)于看到 BERT 這樣模型在下游應(yīng)用上的前景。但對(duì)于學(xué)界研究者來(lái)說(shuō)，這種發(fā)展大大提高了新研究的門檻。看看 GPT-2 到 GPT-3，它的參數(shù)從 15 億增加到了 1750 億。但如果仔細(xì)觀察的話，你會(huì)發(fā)現(xiàn)模型對(duì)知識(shí)的獲取和推理性能的提高，可沒(méi)有參數(shù)增加的數(shù)量那么多。

針對(duì)這一問(wèn)題，周伯文指出「在查看 GPT-2、GPT-3 相關(guān)論文后，有一件事情引起了我的注意，那就是 - 當(dāng)我們從零樣本學(xué)習(xí) (zero-shot) 到單樣本 (one-shot) 學(xué)習(xí)時(shí)，我認(rèn)為 GPT-3 改進(jìn)了很多。這有效證明了，從小型模型轉(zhuǎn)換為大型模型時(shí)，預(yù)訓(xùn)練等于更多的信息?！?/p>

與此同時(shí)，周伯文發(fā)現(xiàn)，從單樣本 (one-shot) 學(xué)習(xí)過(guò)渡到少樣本 (few-shot) 學(xué)習(xí)時(shí)，GPT-3 或 GPT-2 的改進(jìn)非常非常有限。周伯文指出：「我認(rèn)為這從另一方面證明，這些更大規(guī)模的模型可能并沒(méi)有學(xué)習(xí)到足夠多的信息?！?/p>

由此觀之，知識(shí)的獲取和表征可能仍是 NLP 的正確方向。

曼寧認(rèn)為，目前的大規(guī)模預(yù)訓(xùn)練模型可能存在一些「根本性」的錯(cuò)誤——這些模型非常低效率。從現(xiàn)實(shí)世界人們的對(duì)話中學(xué)習(xí)知識(shí)的表征，總不是一個(gè)好方法?？赡?5 年后人們往回看就會(huì)嘲笑現(xiàn)在的工作：「看看這些人吧，只想著把模型做得越來(lái)越大就妄想能夠?qū)崿F(xiàn)人工智能了?！?/p>

對(duì)于研究者來(lái)說(shuō)，我們必須尋找更加有趣的，讓模型可以思考、能夠更高效提取知識(shí)的方法。某種程度上，人們應(yīng)該需要找到更好的知識(shí)編碼機(jī)制，這有關(guān)知識(shí)空間，語(yǔ)義連接的更好表達(dá)方式。這可能和傳統(tǒng) NLP 的知識(shí)圖譜和知識(shí)表征有關(guān)。所以讓模型記憶和推斷真實(shí)世界的情況，看起來(lái)從基礎(chǔ)上就不是一個(gè)正確的，高效的方法。

「人類不是通過(guò)這種方法學(xué)習(xí)知識(shí)的。人類存儲(chǔ)的知識(shí)很少，但可以理解大量知識(shí)?！孤鼘幷f(shuō)道。

GPT-3 通過(guò)高達(dá) 1750 億參數(shù)實(shí)現(xiàn)了其他模型無(wú)法匹敵的文本生成效果。

作為一個(gè)在該領(lǐng)域中務(wù)實(shí)的研究人員，周伯文非常關(guān)注最近預(yù)訓(xùn)練的大規(guī)模語(yǔ)言模型以及對(duì)語(yǔ)言任務(wù)進(jìn)行微調(diào)的功能。在一個(gè)月前放榜的自然語(yǔ)言處理頂會(huì) ACL 2020 上，周伯文等人有兩篇論文被接收。

「在論文《Orthogonal Relation Transforms with Graph Context Modeling for Knowledge Graph Embedding》中，我們得出的結(jié)論是通過(guò)預(yù)訓(xùn)練模型，我們可以生成非常自然的商品介紹，內(nèi)容來(lái)自預(yù)訓(xùn)練模型，還有圖片、知識(shí)圖譜和用戶的評(píng)價(jià)，」周伯文表示。

另一個(gè)例子是在論文《Self-Attention Guided Copy Mechanism for Abstractive Summarization》中，自注意力機(jī)制（self-attention）可以幫助我們?cè)趯?duì)話任務(wù)和文本摘要任務(wù)上，生成了更多更自然的語(yǔ)句。

據(jù)了解，京東智聯(lián)云在跨模態(tài)內(nèi)容生成上已取得諸多成果，并正式應(yīng)用到京東的業(yè)務(wù)流程中。目前京東智聯(lián)云打造的智能寫作產(chǎn)品，是基于商品圖譜和語(yǔ)言模型構(gòu)建的營(yíng)銷內(nèi)容智能生成服務(wù)，在 2020 年京東 618 期間，已覆蓋京東零售過(guò)半數(shù)的商品品類，創(chuàng)作出的導(dǎo)購(gòu)素材，曝光點(diǎn)擊率相較于人工撰寫的內(nèi)容高出 40%，讓用戶在大促高峰期間也享受到優(yōu)質(zhì)服務(wù)。

這樣一些接近實(shí)用化的方向已經(jīng)受到了 NLP 新范式的幫助。毫無(wú)疑問(wèn)，使用預(yù)訓(xùn)練的模型現(xiàn)在可以生成很自然的文本以及對(duì)話。但目前的預(yù)訓(xùn)練模型還稱不上完美，曼寧指出，我們還沒(méi)法控制這些模型生成的內(nèi)容。

超越圖靈測(cè)試的 AI 新基準(zhǔn)

若想實(shí)現(xiàn)更好的人工智能，我們必須擁有完美的評(píng)測(cè)基準(zhǔn)（Benchmark），幾十年以來(lái)我們一直將圖靈測(cè)試作為「真正人工智能」的測(cè)試標(biāo)準(zhǔn)。但圖靈測(cè)試是以 AI 模仿人類，試圖「欺騙」測(cè)試者進(jìn)行無(wú)特定內(nèi)容對(duì)話的形式來(lái)進(jìn)行的。對(duì)于研究者來(lái)說(shuō)，這個(gè)過(guò)程一直存在難以量化的問(wèn)題。

在 NLP 技術(shù)發(fā)展多年后的今天，「我們會(huì)不會(huì)出現(xiàn)可以代替圖靈測(cè)試的新基準(zhǔn)呢？」周伯文在對(duì)話中提出了這個(gè)問(wèn)題，「過(guò)去的幾十年中，圖靈測(cè)試一直是基準(zhǔn)，但是在日常研究中，它讓我們的研究目標(biāo)變得明確，對(duì)結(jié)果推動(dòng)又沒(méi)有太多直接的幫助?！?/p>

「這個(gè)問(wèn)題很有趣，也很難回答，」曼寧表示?！肝彝膺@個(gè)看法——圖靈測(cè)試不是非常清楚的基準(zhǔn)。某種程度上我們需要找一個(gè)另外的方法，標(biāo)量真正的理解、真正的持續(xù)對(duì)話。但我一時(shí)沒(méi)法給出完美的答案。」

不過(guò)周伯文有一個(gè)「稍顯瘋狂」的主意，有關(guān)最近正火的直播帶貨：熱門主播幾個(gè)小時(shí)可以帶幾千萬(wàn)元的貨。這種互動(dòng)形式看起來(lái)非常吸引人，究其根本，它是一個(gè)實(shí)時(shí)的、富有交互性的方式。在這里播主和觀眾用彈幕和語(yǔ)音實(shí)時(shí)交流，這似乎為對(duì)話型 AI 提出了更多的要求。

原本的圖靈測(cè)試，不會(huì)預(yù)先指出被測(cè)試者的身份，通過(guò)評(píng)判相似性去界定智能化水平；那么，我們是不是可以直接公開(kāi)使用兩個(gè)對(duì)話型 AI 做直播帶貨，通過(guò)統(tǒng)計(jì)以每小時(shí)能賣出多少商品的可量化指標(biāo)來(lái)對(duì)比哪個(gè) AI 的對(duì)話更吸引人，從而評(píng)估對(duì)話型 AI 的智能化水平？

這樣的話，所有評(píng)價(jià)指標(biāo)都可以量化，形式也非常接近于真實(shí)世界。

「這是一個(gè)非常有趣的想法，可以帶來(lái)非常清楚的評(píng)價(jià)指標(biāo)，」曼寧表示?！钢辈?duì)于我來(lái)說(shuō)是一個(gè)很新鮮的概念，某種程度上來(lái)說(shuō)，這是一個(gè)非常直接的評(píng)價(jià)方式。我不清楚是否完美，但它很有創(chuàng)意：一個(gè)人類銷售想要成功，并不取決于對(duì)潛在消費(fèi)者傳遞信息的完美平衡，有時(shí)還需要提出超出實(shí)際一點(diǎn)點(diǎn)的主張，更加強(qiáng)烈地表達(dá)自己的觀點(diǎn)。」

周伯文表示，在未來(lái)幾個(gè)月里，京東會(huì)對(duì)這個(gè)方向進(jìn)行一些嘗試和研究。

學(xué)術(shù)界如何在預(yù)訓(xùn)練時(shí)代引領(lǐng)前瞻性研究

今天的人工智能研究正憑借算力的增長(zhǎng)而快速發(fā)展，隨著模型體量的增加，學(xué)界研究者面臨的挑戰(zhàn)越來(lái)越大。對(duì)于研究者們來(lái)說(shuō)，即使希望方法足夠創(chuàng)新，也會(huì)在大會(huì)上宣講論文時(shí)受到這樣的挑戰(zhàn)：「你使用的基準(zhǔn)是最新的嗎？」這意味著你不得不直面大量數(shù)據(jù)。

周伯文表示：「近來(lái)，我常被問(wèn)到一個(gè)問(wèn)題，在如今的云計(jì)算 + AI 時(shí)代，研究人員和學(xué)者如何跟上？」

據(jù)了解，2019 年底，京東整合云計(jì)算、人工智能、物聯(lián)網(wǎng)業(yè)務(wù)資源，形成京東云與 AI 事業(yè)部，并于 3 月 5 日面向技術(shù)服務(wù)領(lǐng)域推出全新的「京東智聯(lián)云」品牌。在剛剛過(guò)去的京東 618，京東智聯(lián)云提供了全面、穩(wěn)定、安全、可信賴的技術(shù)保障，成為京東 618 的技術(shù)基石，并秉持著「成為最值得信賴的智能技術(shù)提供者」的愿景，對(duì)外輸出更多、更好、更融合、更場(chǎng)景化的技術(shù)與服務(wù)。

目前云服務(wù)在商業(yè)公司中的布局已日趨成熟。那么在斯坦福大學(xué)，教授們是怎樣平衡增量創(chuàng)新與理論創(chuàng)新的？研究者們是如何使用算力的？

「近年來(lái)我們的工作方式有了很大變化。在 20 年前，大學(xué)里才有最大的超級(jí)計(jì)算機(jī)、最快的網(wǎng)絡(luò)。但在最近這些年里，情況有了翻天覆地的變化——現(xiàn)在算力都在商業(yè)公司那里了，」曼寧說(shuō)道。

如何解決算力不足的問(wèn)題，每所大學(xué)都有不少思路，最直接的方式就是購(gòu)買數(shù)量有限的，當(dāng)前最頂配的 GPU，讓很多博士生共用以滿足 80% 時(shí)間的需求?！肝蚁脒@是很多大學(xué)都在使用的方法，如果你的實(shí)驗(yàn)室里有 20 名博士生，這要比每人配置一臺(tái)機(jī)器節(jié)省三倍成本，」曼寧表示。「現(xiàn)在我們構(gòu)建起了小型集群，斯坦福 NLP 實(shí)驗(yàn)室有 15 名研究者，我們有大約 100 塊 GPU。你看，這不是一個(gè)很大的數(shù)字?！?/p>

另一個(gè)思路就是和京東智聯(lián)云這樣的科技公司合作，在一些需要更多計(jì)算的研究中，斯坦福也在購(gòu)買云端算力。

每年冬天，曼寧都會(huì)親自為斯坦福 NLP 大課 CS224N 授課。這門課可以吸引 500 名學(xué)生，他們的作業(yè)都需要使用 CPU、GPU 來(lái)訓(xùn)練模型，而所有學(xué)生在課程期間的算力需求是大學(xué)負(fù)擔(dān)不起的。因此，斯坦福接受業(yè)界的捐贈(zèng)。

斯坦福的自然語(yǔ)言處理課程 CS224n 與計(jì)算機(jī)視覺(jué)課程 CS231n 齊名，是 AI 領(lǐng)域最具影響力的公開(kāi)課程之一。

最后，研究方向也是個(gè)問(wèn)題?！缸屇Ｐ驮絹?lái)越大可能在最近五年可以實(shí)現(xiàn)很大的進(jìn)展，但在下個(gè)十年就不一定了，」曼寧說(shuō)道。「我們現(xiàn)在可以構(gòu)建出更大的模型，然后發(fā)出論文。但這個(gè)對(duì)于基礎(chǔ)方向的研究沒(méi)有什么幫助。未來(lái) 5-7 年里可能會(huì)出現(xiàn)一個(gè)窗口，最聰明的研究者可以用普通電腦和 GPU 構(gòu)建出 SOTA 模型，打敗大公司的巨大模型?！?/p>

「但未來(lái)也有可能不是這樣，看看其他行業(yè)，如果你是個(gè)機(jī)械工程的 PhD，你肯定沒(méi)法上來(lái)就蓋世界最高的摩天大樓，如果你是個(gè)航空工程學(xué)生，你肯定不會(huì)試圖造一架比波音還好的飛機(jī)。你需要做的是尋找新的想法。」

研究學(xué)者需要更加注重于尋找具有開(kāi)創(chuàng)性的新想法，并提出原型。舉個(gè)例子：機(jī)器學(xué)習(xí)領(lǐng)域里的 Dropout，其實(shí)是在很小的數(shù)據(jù)集上首次實(shí)踐的。

構(gòu)建可信賴的 AI：可解釋性和真實(shí)世界的魯棒性

最近一段時(shí)間，周伯文曾在多個(gè)不同場(chǎng)合表達(dá)了對(duì)于可信賴的 AI（Trustworthy AI）的看法，并指出可信賴的 AI 將是智能經(jīng)濟(jì)未來(lái) 10 年的新原點(diǎn)。

目前有關(guān)可信賴的 AI 已經(jīng)達(dá)成 6 個(gè)共識(shí)，包含公平、魯棒性（技術(shù)的可用性）、價(jià)值對(duì)齊（技術(shù)提供者、使用者和產(chǎn)品應(yīng)用方都認(rèn)為產(chǎn)品帶來(lái)價(jià)值）、可復(fù)制、可解釋以及負(fù)責(zé)任。構(gòu)建可信賴的 AI 一面是對(duì)技術(shù)的巨大挑戰(zhàn)，一面是人文精神，無(wú)論是京東智能情感客服傳遞溫暖、亦或京東物流設(shè)施傳遞信賴，都是對(duì)人類的社會(huì)責(zé)任與價(jià)值體現(xiàn)。

曼寧認(rèn)為，人工智能學(xué)界目前在可解釋性方面已經(jīng)取得了一些進(jìn)展。一方面是像 transformer 這樣的預(yù)訓(xùn)練模型，注意力機(jī)制帶來(lái)的好處——這些模型具有相當(dāng)高的可解釋性。

「我的一些學(xué)生發(fā)表過(guò)論文試圖解讀 BERT 的運(yùn)作機(jī)制。現(xiàn)在，我們已能夠?qū)@些模型進(jìn)行大量解碼，并看到這些模型不僅是巨大的聯(lián)想學(xué)習(xí)機(jī)器，而且它們實(shí)際上是在學(xué)習(xí)人類語(yǔ)言的結(jié)構(gòu)，其解句子的語(yǔ)法結(jié)構(gòu)，了解哪些詞是指同一實(shí)體，」曼寧說(shuō)道。

因此，我們已經(jīng)能夠獲得模型內(nèi)部的可解釋性，這意味著模型可以對(duì)其整體行為做出某種決定的原因做出一些解釋。當(dāng)然，這里還有很多工作要做，斯坦福研究者們正進(jìn)行的工作希望就驅(qū)動(dòng)模型決策的特征進(jìn)行解釋。

曼寧教授在 6 月份還以第一作者的形式發(fā)表了論文《Emergent linguistic structure in artificial neural networks trained by self-supervision》，其中寫到預(yù)訓(xùn)練模型實(shí)際上可以學(xué)習(xí)語(yǔ)言結(jié)構(gòu)，不需要任何監(jiān)督。這解釋了為什么大規(guī)模的模型是可行的。但是對(duì)于下一步如何更好的理解他們是怎么學(xué)習(xí)到的，這個(gè)目前還不太清楚，周伯文指出「這部分需要可信賴的 AI 來(lái)解決」。

這些發(fā)現(xiàn)非常令人興奮。之前我們總是認(rèn)為想讓 AI 在某些任務(wù)上工作良好，需要是大型有監(jiān)督模型。因此我們總是以大量資金、雇傭很多人進(jìn)行數(shù)據(jù)標(biāo)注開(kāi)始。這是過(guò)去 20 年來(lái)的工作范式，人們也是通過(guò)這種形式在某些任務(wù)上讓 NLP 模型達(dá)到接近人類水平的。

「如果下一代人工智能機(jī)器本質(zhì)上和十年前一樣，而考慮到訓(xùn)練的內(nèi)容大幅增加，我們實(shí)際上是倒退了，而不是前進(jìn)了，」曼寧說(shuō)道。

「從技術(shù)角度來(lái)看，我將專注于嘗試提高 NLP 的魯棒性以及可解釋性。在 NLP 領(lǐng)域中，如果了解 NLP 的結(jié)構(gòu)，了解 NLP 的語(yǔ)義，將是人們構(gòu)建可信任 AI 向前邁進(jìn)的一大步，」周伯文表示?！溉绾晤A(yù)測(cè)下一個(gè)單詞的過(guò)程對(duì)于人們來(lái)說(shuō)還是一個(gè)黑箱。另一個(gè)方向是可擴(kuò)展性，當(dāng)我們從一個(gè)任務(wù)轉(zhuǎn)移到另一個(gè)任務(wù)時(shí)，模型需要遷移得足夠好。無(wú)論如何，可信賴的 AI 非常重要。如果我們可以在這個(gè)領(lǐng)域取得更大的進(jìn)步，AI 市場(chǎng)和 AI 應(yīng)用將變得越來(lái)越大、越來(lái)越多，并且適應(yīng)性也將大大提高。因此，這將是我們長(zhǎng)期關(guān)注的重點(diǎn)?！?/p>

2020 智源 - 京東多模態(tài)對(duì)話挑戰(zhàn)大賽

在 2019 年，京東舉辦了 JDDC 對(duì)話大賽，去年的主題是 Knowledge-enhanced Task-Oriented Dialogue，今年在智源大會(huì)上舉辦的對(duì)話大賽則主要關(guān)注對(duì)話中的多模態(tài)交互，即研究如何更好的理解對(duì)話中的多模態(tài)信息，產(chǎn)生 Task-Oriented Conversational response。

本次競(jìng)賽的數(shù)據(jù)來(lái)自于脫敏后的京東真實(shí)客服對(duì)話日志，共包含約 200 萬(wàn)輪次的對(duì)話，其中用戶問(wèn)題涉及約圖片約 50 萬(wàn)張。

周伯文介紹到，為支持參賽隊(duì)伍更好的比賽，本次大賽還提供了約 3 萬(wàn)商品的小型商品知識(shí)庫(kù)，和 2 萬(wàn)張圖片的標(biāo)注數(shù)據(jù)。大賽開(kāi)始三周，到目前為止已有超過(guò) 400 人參加比賽。

曼寧對(duì)于這場(chǎng)比賽的成功舉辦表示興奮：「這場(chǎng)比賽非常火熱，人類在這樣的對(duì)話中扮演的角色也非常重要。顯然作為人類，對(duì)話不是所有——我們還會(huì)使用背景知識(shí)和其他感覺(jué)。我認(rèn)為這次我們將看到自然語(yǔ)言處理中很多 NLP 領(lǐng)域中奠定基礎(chǔ)的新思想，有關(guān) NLP 與對(duì)話發(fā)生環(huán)境、領(lǐng)域知識(shí)，以及理解和生成?！?p>

這場(chǎng)連接京東大廈和斯坦福校園的對(duì)話，給我們帶來(lái)了很多啟發(fā)。由于新冠疫情的影響，周伯文與曼寧無(wú)法進(jìn)行面對(duì)面的交談，不過(guò)兩人已經(jīng)開(kāi)始期待下一次的見(jiàn)面了。

不知下次見(jiàn)面時(shí)，人工智能技術(shù)將會(huì)出現(xiàn)哪些大發(fā)展？

本文為機(jī)器之心報(bào)道，轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)。

?------------------------------------------------

加入機(jī)器之心（全職記者 / 實(shí)習(xí)生）：hr@jiqizhixin.com

投稿或?qū)で髨?bào)道：content@jiqizhixin.com

原標(biāo)題：《周伯文對(duì)話斯坦福教授曼寧：人機(jī)對(duì)話智能新進(jìn)展需要新「圖靈測(cè)試」》

閱讀原文

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

我要舉報(bào)

#人機(jī)對(duì)話