中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

周伯文對(duì)話斯坦福教授曼寧:人機(jī)對(duì)話智能新進(jìn)展需要新“圖靈測(cè)試”

2020-06-29 15:46
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

原創(chuàng) Synced 機(jī)器之心

機(jī)器之心報(bào)道

機(jī)器之心編輯部

6 月 22 日,在 2020 智源大會(huì)上,有一場(chǎng)大佬對(duì)大佬的精彩會(huì)談。

過(guò)去一年里,人工智能進(jìn)展最大的方向在自然語(yǔ)言處理(NLP),BERT、GPT-2 等預(yù)訓(xùn)練模型引領(lǐng)了很多方向的新時(shí)代,又催生出了大量商業(yè)應(yīng)用機(jī)會(huì)。面對(duì)技術(shù)的進(jìn)步,AI 領(lǐng)域的頂級(jí)學(xué)者和從業(yè)高管是如何看待未來(lái)前景的?近日,2020 智源大會(huì)在線上召開(kāi),在為期四天的會(huì)議中,5 位圖靈獎(jiǎng)得主、上百位業(yè)內(nèi)專家在 19 個(gè)專題論壇云上共同暢想了人工智能的下一個(gè)十年。

在智源大會(huì)上,京東集團(tuán)技術(shù)委員會(huì)主席、京東智聯(lián)云總裁、京東人工智能研究院院長(zhǎng)、IEEE Fellow 周伯文與斯坦福大學(xué)教授、人工智能實(shí)驗(yàn)室負(fù)責(zé)人克里斯托弗 · 曼寧(Christopher Manning)展開(kāi)了一次精彩的交流。他們討論了自然語(yǔ)言處理領(lǐng)域近期的進(jìn)展,預(yù)訓(xùn)練模型興起之后的未來(lái)發(fā)展方向,甚至還為人工智能的標(biāo)桿評(píng)測(cè)基準(zhǔn)——圖靈測(cè)試找到了一個(gè)「替代方案」。

在交流過(guò)程中,兩人也提及了京東最近被人工智能頂會(huì) ACL-2020 接收的研究,以及曼寧剛剛發(fā)表的工作,有關(guān)預(yù)訓(xùn)練模型學(xué)習(xí)到的語(yǔ)言結(jié)構(gòu)。

在過(guò)去這一年中,我們見(jiàn)證了許多 NLP 領(lǐng)域的技術(shù)成果和場(chǎng)景落地。對(duì)此,人工智能著名學(xué)者克里斯托弗 · 曼寧和京東集團(tuán)技術(shù)「掌門人」周伯文是如何看待的?讓我們一探究竟。

語(yǔ)言理解 & 人機(jī)對(duì)話領(lǐng)域過(guò)去一年的進(jìn)展

周伯文與曼寧在對(duì)話伊始回顧了在 2019 年智源大會(huì)上尖峰對(duì)話中達(dá)成的共識(shí):任務(wù)導(dǎo)向的多輪對(duì)話是 NLP 下一個(gè)十年重點(diǎn)的研究和應(yīng)用方向。周伯文還創(chuàng)造了一個(gè)新詞「任務(wù)導(dǎo)向型對(duì)話智能」(Task-oriented Conversational Intelligence),一方面,任務(wù)導(dǎo)向型對(duì)話智能可以反向推動(dòng)許多基礎(chǔ)技術(shù)能力的進(jìn)步,另一方面,它的發(fā)展也將對(duì)經(jīng)濟(jì)方面產(chǎn)生巨大影響,帶來(lái)人機(jī)交互技術(shù)驅(qū)動(dòng)的萬(wàn)億級(jí)市場(chǎng)。

在語(yǔ)言理解 & 人機(jī)對(duì)話領(lǐng)域過(guò)去一年的進(jìn)展層面上,周伯文和曼寧不約而同提到了「最令人印象深刻的就是人們見(jiàn)證了超大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的出現(xiàn),它們可以生成有組織的語(yǔ)言文字表達(dá),」

曼寧表示:「其中的代表就是 GPT-2 和 GPT-3,也包含 BERT、RoBERTA 和 ALBERT、ERNIE 等等不少 BERT 變種。它們使得自然語(yǔ)言理解與生成有了非常大的發(fā)展。我們也看到傳統(tǒng) AI 領(lǐng)域有了很大轉(zhuǎn)變,很多任務(wù)目前都傾向于被大型模型來(lái)解決?!?/p>

人工智能發(fā)展的 40 多年來(lái),我們一直在努力試圖讓 AI 可以回答科學(xué)問(wèn)題。我們過(guò)去嘗試使用的思路是研究知識(shí)的表達(dá)方法,阿蘭圖靈實(shí)驗(yàn)室的 Aristo Project 試圖讓 AI 理解科學(xué)道理,進(jìn)而深度理解世界,這一思路在最初的十年推動(dòng)了知識(shí)的表達(dá)與推理。

在 2020 年,我們通過(guò)超大尺寸模型實(shí)現(xiàn)了巨大的進(jìn)步。基于 RoBERTa 預(yù)訓(xùn)練模型,我們可以實(shí)現(xiàn) 95% 的科學(xué)問(wèn)題回答準(zhǔn)確率,這看起來(lái)是目前解決知識(shí)問(wèn)題的最好方法了。

這些進(jìn)步為新一輪商業(yè)應(yīng)用打開(kāi)了道路。「未來(lái)的方向雖然還無(wú)法確定,但我們可以看到基于預(yù)訓(xùn)練語(yǔ)言模型,為搜索引擎公司等科技企業(yè)帶來(lái)了很多新商業(yè)機(jī)會(huì),」曼寧表示?!杆麄兛梢詫?shí)現(xiàn)近十年來(lái)最大的單個(gè)技術(shù)進(jìn)步,構(gòu)建更好的機(jī)器翻譯系統(tǒng),對(duì)話 AI,人工智能客服系統(tǒng)等等?,F(xiàn)在,我們正在經(jīng)歷 NLP 領(lǐng)域激動(dòng)人心的時(shí)刻。」

NLP 領(lǐng)域最近發(fā)生了從特定任務(wù)模型向多任務(wù),大規(guī)模預(yù)訓(xùn)練模型方向轉(zhuǎn)變的重要變化。一方面,工業(yè)界樂(lè)于看到 BERT 這樣模型在下游應(yīng)用上的前景。但對(duì)于學(xué)界研究者來(lái)說(shuō),這種發(fā)展大大提高了新研究的門檻。看看 GPT-2 到 GPT-3,它的參數(shù)從 15 億增加到了 1750 億。但如果仔細(xì)觀察的話,你會(huì)發(fā)現(xiàn)模型對(duì)知識(shí)的獲取和推理性能的提高,可沒(méi)有參數(shù)增加的數(shù)量那么多。

針對(duì)這一問(wèn)題,周伯文指出「在查看 GPT-2、GPT-3 相關(guān)論文后,有一件事情引起了我的注意,那就是 - 當(dāng)我們從零樣本學(xué)習(xí) (zero-shot) 到單樣本 (one-shot) 學(xué)習(xí)時(shí),我認(rèn)為 GPT-3 改進(jìn)了很多。這有效證明了,從小型模型轉(zhuǎn)換為大型模型時(shí),預(yù)訓(xùn)練等于更多的信息?!?/p>

與此同時(shí),周伯文發(fā)現(xiàn),從單樣本 (one-shot) 學(xué)習(xí)過(guò)渡到少樣本 (few-shot) 學(xué)習(xí)時(shí),GPT-3 或 GPT-2 的改進(jìn)非常非常有限。周伯文指出:「我認(rèn)為這從另一方面證明,這些更大規(guī)模的模型可能并沒(méi)有學(xué)習(xí)到足夠多的信息?!?/p>

由此觀之,知識(shí)的獲取和表征可能仍是 NLP 的正確方向。

曼寧認(rèn)為,目前的大規(guī)模預(yù)訓(xùn)練模型可能存在一些「根本性」的錯(cuò)誤——這些模型非常低效率。從現(xiàn)實(shí)世界人們的對(duì)話中學(xué)習(xí)知識(shí)的表征,總不是一個(gè)好方法??赡?5 年后人們往回看就會(huì)嘲笑現(xiàn)在的工作:「看看這些人吧,只想著把模型做得越來(lái)越大就妄想能夠?qū)崿F(xiàn)人工智能了?!?/p>

對(duì)于研究者來(lái)說(shuō),我們必須尋找更加有趣的,讓模型可以思考、能夠更高效提取知識(shí)的方法。某種程度上,人們應(yīng)該需要找到更好的知識(shí)編碼機(jī)制,這有關(guān)知識(shí)空間,語(yǔ)義連接的更好表達(dá)方式。這可能和傳統(tǒng) NLP 的知識(shí)圖譜和知識(shí)表征有關(guān)。所以讓模型記憶和推斷真實(shí)世界的情況,看起來(lái)從基礎(chǔ)上就不是一個(gè)正確的,高效的方法。

「人類不是通過(guò)這種方法學(xué)習(xí)知識(shí)的。人類存儲(chǔ)的知識(shí)很少,但可以理解大量知識(shí)?!孤鼘幷f(shuō)道。

GPT-3 通過(guò)高達(dá) 1750 億參數(shù)實(shí)現(xiàn)了其他模型無(wú)法匹敵的文本生成效果。

作為一個(gè)在該領(lǐng)域中務(wù)實(shí)的研究人員,周伯文非常關(guān)注最近預(yù)訓(xùn)練的大規(guī)模語(yǔ)言模型以及對(duì)語(yǔ)言任務(wù)進(jìn)行微調(diào)的功能。在一個(gè)月前放榜的自然語(yǔ)言處理頂會(huì) ACL 2020 上,周伯文等人有兩篇論文被接收。

「在論文《Orthogonal Relation Transforms with Graph Context Modeling for Knowledge Graph Embedding》中,我們得出的結(jié)論是通過(guò)預(yù)訓(xùn)練模型,我們可以生成非常自然的商品介紹,內(nèi)容來(lái)自預(yù)訓(xùn)練模型,還有圖片、知識(shí)圖譜和用戶的評(píng)價(jià),」周伯文表示。

另一個(gè)例子是在論文《Self-Attention Guided Copy Mechanism for Abstractive Summarization》中,自注意力機(jī)制(self-attention)可以幫助我們?cè)趯?duì)話任務(wù)和文本摘要任務(wù)上,生成了更多更自然的語(yǔ)句。

據(jù)了解,京東智聯(lián)云在跨模態(tài)內(nèi)容生成上已取得諸多成果,并正式應(yīng)用到京東的業(yè)務(wù)流程中。目前京東智聯(lián)云打造的智能寫作產(chǎn)品,是基于商品圖譜和語(yǔ)言模型構(gòu)建的營(yíng)銷內(nèi)容智能生成服務(wù),在 2020 年京東 618 期間,已覆蓋京東零售過(guò)半數(shù)的商品品類,創(chuàng)作出的導(dǎo)購(gòu)素材,曝光點(diǎn)擊率相較于人工撰寫的內(nèi)容高出 40%,讓用戶在大促高峰期間也享受到優(yōu)質(zhì)服務(wù)。

這樣一些接近實(shí)用化的方向已經(jīng)受到了 NLP 新范式的幫助。毫無(wú)疑問(wèn),使用預(yù)訓(xùn)練的模型現(xiàn)在可以生成很自然的文本以及對(duì)話。但目前的預(yù)訓(xùn)練模型還稱不上完美,曼寧指出,我們還沒(méi)法控制這些模型生成的內(nèi)容。

超越圖靈測(cè)試的 AI 新基準(zhǔn)

若想實(shí)現(xiàn)更好的人工智能,我們必須擁有完美的評(píng)測(cè)基準(zhǔn)(Benchmark),幾十年以來(lái)我們一直將圖靈測(cè)試作為「真正人工智能」的測(cè)試標(biāo)準(zhǔn)。但圖靈測(cè)試是以 AI 模仿人類,試圖「欺騙」測(cè)試者進(jìn)行無(wú)特定內(nèi)容對(duì)話的形式來(lái)進(jìn)行的。對(duì)于研究者來(lái)說(shuō),這個(gè)過(guò)程一直存在難以量化的問(wèn)題。

在 NLP 技術(shù)發(fā)展多年后的今天,「我們會(huì)不會(huì)出現(xiàn)可以代替圖靈測(cè)試的新基準(zhǔn)呢?」周伯文在對(duì)話中提出了這個(gè)問(wèn)題,「過(guò)去的幾十年中,圖靈測(cè)試一直是基準(zhǔn),但是在日常研究中,它讓我們的研究目標(biāo)變得明確,對(duì)結(jié)果推動(dòng)又沒(méi)有太多直接的幫助?!?/p>

「這個(gè)問(wèn)題很有趣,也很難回答,」曼寧表示?!肝彝膺@個(gè)看法——圖靈測(cè)試不是非常清楚的基準(zhǔn)。某種程度上我們需要找一個(gè)另外的方法,標(biāo)量真正的理解、真正的持續(xù)對(duì)話。但我一時(shí)沒(méi)法給出完美的答案。」

不過(guò)周伯文有一個(gè)「稍顯瘋狂」的主意,有關(guān)最近正火的直播帶貨:熱門主播幾個(gè)小時(shí)可以帶幾千萬(wàn)元的貨。這種互動(dòng)形式看起來(lái)非常吸引人,究其根本,它是一個(gè)實(shí)時(shí)的、富有交互性的方式。在這里播主和觀眾用彈幕和語(yǔ)音實(shí)時(shí)交流,這似乎為對(duì)話型 AI 提出了更多的要求。

原本的圖靈測(cè)試,不會(huì)預(yù)先指出被測(cè)試者的身份,通過(guò)評(píng)判相似性去界定智能化水平;那么,我們是不是可以直接公開(kāi)使用兩個(gè)對(duì)話型 AI 做直播帶貨,通過(guò)統(tǒng)計(jì)以每小時(shí)能賣出多少商品的可量化指標(biāo)來(lái)對(duì)比哪個(gè) AI 的對(duì)話更吸引人,從而評(píng)估對(duì)話型 AI 的智能化水平?

這樣的話,所有評(píng)價(jià)指標(biāo)都可以量化,形式也非常接近于真實(shí)世界。

「這是一個(gè)非常有趣的想法,可以帶來(lái)非常清楚的評(píng)價(jià)指標(biāo),」曼寧表示?!钢辈?duì)于我來(lái)說(shuō)是一個(gè)很新鮮的概念,某種程度上來(lái)說(shuō),這是一個(gè)非常直接的評(píng)價(jià)方式。我不清楚是否完美,但它很有創(chuàng)意:一個(gè)人類銷售想要成功,并不取決于對(duì)潛在消費(fèi)者傳遞信息的完美平衡,有時(shí)還需要提出超出實(shí)際一點(diǎn)點(diǎn)的主張,更加強(qiáng)烈地表達(dá)自己的觀點(diǎn)。」

周伯文表示,在未來(lái)幾個(gè)月里,京東會(huì)對(duì)這個(gè)方向進(jìn)行一些嘗試和研究。

學(xué)術(shù)界如何在預(yù)訓(xùn)練時(shí)代引領(lǐng)前瞻性研究

今天的人工智能研究正憑借算力的增長(zhǎng)而快速發(fā)展,隨著模型體量的增加,學(xué)界研究者面臨的挑戰(zhàn)越來(lái)越大。對(duì)于研究者們來(lái)說(shuō),即使希望方法足夠創(chuàng)新,也會(huì)在大會(huì)上宣講論文時(shí)受到這樣的挑戰(zhàn):「你使用的基準(zhǔn)是最新的嗎?」這意味著你不得不直面大量數(shù)據(jù)。

周伯文表示:「近來(lái),我常被問(wèn)到一個(gè)問(wèn)題,在如今的云計(jì)算 + AI 時(shí)代,研究人員和學(xué)者如何跟上?」

據(jù)了解,2019 年底,京東整合云計(jì)算、人工智能、物聯(lián)網(wǎng)業(yè)務(wù)資源,形成京東云與 AI 事業(yè)部,并于 3 月 5 日面向技術(shù)服務(wù)領(lǐng)域推出全新的「京東智聯(lián)云」品牌。在剛剛過(guò)去的京東 618,京東智聯(lián)云提供了全面、穩(wěn)定、安全、可信賴的技術(shù)保障,成為京東 618 的技術(shù)基石,并秉持著「成為最值得信賴的智能技術(shù)提供者」的愿景,對(duì)外輸出更多、更好、更融合、更場(chǎng)景化的技術(shù)與服務(wù)。

目前云服務(wù)在商業(yè)公司中的布局已日趨成熟。那么在斯坦福大學(xué),教授們是怎樣平衡增量創(chuàng)新與理論創(chuàng)新的?研究者們是如何使用算力的?

「近年來(lái)我們的工作方式有了很大變化。在 20 年前,大學(xué)里才有最大的超級(jí)計(jì)算機(jī)、最快的網(wǎng)絡(luò)。但在最近這些年里,情況有了翻天覆地的變化——現(xiàn)在算力都在商業(yè)公司那里了,」曼寧說(shuō)道。

如何解決算力不足的問(wèn)題,每所大學(xué)都有不少思路,最直接的方式就是購(gòu)買數(shù)量有限的,當(dāng)前最頂配的 GPU,讓很多博士生共用以滿足 80% 時(shí)間的需求?!肝蚁脒@是很多大學(xué)都在使用的方法,如果你的實(shí)驗(yàn)室里有 20 名博士生,這要比每人配置一臺(tái)機(jī)器節(jié)省三倍成本,」曼寧表示。「現(xiàn)在我們構(gòu)建起了小型集群,斯坦福 NLP 實(shí)驗(yàn)室有 15 名研究者,我們有大約 100 塊 GPU。你看,這不是一個(gè)很大的數(shù)字?!?/p>

另一個(gè)思路就是和京東智聯(lián)云這樣的科技公司合作,在一些需要更多計(jì)算的研究中,斯坦福也在購(gòu)買云端算力。

每年冬天,曼寧都會(huì)親自為斯坦福 NLP 大課 CS224N 授課。這門課可以吸引 500 名學(xué)生,他們的作業(yè)都需要使用 CPU、GPU 來(lái)訓(xùn)練模型,而所有學(xué)生在課程期間的算力需求是大學(xué)負(fù)擔(dān)不起的。因此,斯坦福接受業(yè)界的捐贈(zèng)。

斯坦福的自然語(yǔ)言處理課程 CS224n 與計(jì)算機(jī)視覺(jué)課程 CS231n 齊名,是 AI 領(lǐng)域最具影響力的公開(kāi)課程之一。

最后,研究方向也是個(gè)問(wèn)題?!缸屇P驮絹?lái)越大可能在最近五年可以實(shí)現(xiàn)很大的進(jìn)展,但在下個(gè)十年就不一定了,」曼寧說(shuō)道。「我們現(xiàn)在可以構(gòu)建出更大的模型,然后發(fā)出論文。但這個(gè)對(duì)于基礎(chǔ)方向的研究沒(méi)有什么幫助。未來(lái) 5-7 年里可能會(huì)出現(xiàn)一個(gè)窗口,最聰明的研究者可以用普通電腦和 GPU 構(gòu)建出 SOTA 模型,打敗大公司的巨大模型?!?/p>

「但未來(lái)也有可能不是這樣,看看其他行業(yè),如果你是個(gè)機(jī)械工程的 PhD,你肯定沒(méi)法上來(lái)就蓋世界最高的摩天大樓,如果你是個(gè)航空工程學(xué)生,你肯定不會(huì)試圖造一架比波音還好的飛機(jī)。你需要做的是尋找新的想法。」

研究學(xué)者需要更加注重于尋找具有開(kāi)創(chuàng)性的新想法,并提出原型。舉個(gè)例子:機(jī)器學(xué)習(xí)領(lǐng)域里的 Dropout,其實(shí)是在很小的數(shù)據(jù)集上首次實(shí)踐的。

構(gòu)建可信賴的 AI:可解釋性和真實(shí)世界的魯棒性

最近一段時(shí)間,周伯文曾在多個(gè)不同場(chǎng)合表達(dá)了對(duì)于可信賴的 AI(Trustworthy AI)的看法,并指出可信賴的 AI 將是智能經(jīng)濟(jì)未來(lái) 10 年的新原點(diǎn)。

目前有關(guān)可信賴的 AI 已經(jīng)達(dá)成 6 個(gè)共識(shí),包含公平、魯棒性(技術(shù)的可用性)、價(jià)值對(duì)齊(技術(shù)提供者、使用者和產(chǎn)品應(yīng)用方都認(rèn)為產(chǎn)品帶來(lái)價(jià)值)、可復(fù)制、可解釋以及負(fù)責(zé)任。構(gòu)建可信賴的 AI 一面是對(duì)技術(shù)的巨大挑戰(zhàn),一面是人文精神,無(wú)論是京東智能情感客服傳遞溫暖、亦或京東物流設(shè)施傳遞信賴,都是對(duì)人類的社會(huì)責(zé)任與價(jià)值體現(xiàn)。

曼寧認(rèn)為,人工智能學(xué)界目前在可解釋性方面已經(jīng)取得了一些進(jìn)展。一方面是像 transformer 這樣的預(yù)訓(xùn)練模型,注意力機(jī)制帶來(lái)的好處——這些模型具有相當(dāng)高的可解釋性。

「我的一些學(xué)生發(fā)表過(guò)論文試圖解讀 BERT 的運(yùn)作機(jī)制。現(xiàn)在,我們已能夠?qū)@些模型進(jìn)行大量解碼,并看到這些模型不僅是巨大的聯(lián)想學(xué)習(xí)機(jī)器,而且它們實(shí)際上是在學(xué)習(xí)人類語(yǔ)言的結(jié)構(gòu),其解句子的語(yǔ)法結(jié)構(gòu),了解哪些詞是指同一實(shí)體,」曼寧說(shuō)道。

因此,我們已經(jīng)能夠獲得模型內(nèi)部的可解釋性,這意味著模型可以對(duì)其整體行為做出某種決定的原因做出一些解釋。當(dāng)然,這里還有很多工作要做,斯坦福研究者們正進(jìn)行的工作希望就驅(qū)動(dòng)模型決策的特征進(jìn)行解釋。

曼寧教授在 6 月份還以第一作者的形式發(fā)表了論文《Emergent linguistic structure in artificial neural networks trained by self-supervision》,其中寫到預(yù)訓(xùn)練模型實(shí)際上可以學(xué)習(xí)語(yǔ)言結(jié)構(gòu),不需要任何監(jiān)督。這解釋了為什么大規(guī)模的模型是可行的。但是對(duì)于下一步如何更好的理解他們是怎么學(xué)習(xí)到的,這個(gè)目前還不太清楚,周伯文指出「這部分需要可信賴的 AI 來(lái)解決」。

這些發(fā)現(xiàn)非常令人興奮。之前我們總是認(rèn)為想讓 AI 在某些任務(wù)上工作良好,需要是大型有監(jiān)督模型。因此我們總是以大量資金、雇傭很多人進(jìn)行數(shù)據(jù)標(biāo)注開(kāi)始。這是過(guò)去 20 年來(lái)的工作范式,人們也是通過(guò)這種形式在某些任務(wù)上讓 NLP 模型達(dá)到接近人類水平的。

「如果下一代人工智能機(jī)器本質(zhì)上和十年前一樣,而考慮到訓(xùn)練的內(nèi)容大幅增加,我們實(shí)際上是倒退了,而不是前進(jìn)了,」曼寧說(shuō)道。

「從技術(shù)角度來(lái)看,我將專注于嘗試提高 NLP 的魯棒性以及可解釋性。在 NLP 領(lǐng)域中,如果了解 NLP 的結(jié)構(gòu),了解 NLP 的語(yǔ)義,將是人們構(gòu)建可信任 AI 向前邁進(jìn)的一大步,」周伯文表示?!溉绾晤A(yù)測(cè)下一個(gè)單詞的過(guò)程對(duì)于人們來(lái)說(shuō)還是一個(gè)黑箱。另一個(gè)方向是可擴(kuò)展性,當(dāng)我們從一個(gè)任務(wù)轉(zhuǎn)移到另一個(gè)任務(wù)時(shí),模型需要遷移得足夠好。無(wú)論如何,可信賴的 AI 非常重要。如果我們可以在這個(gè)領(lǐng)域取得更大的進(jìn)步,AI 市場(chǎng)和 AI 應(yīng)用將變得越來(lái)越大、越來(lái)越多,并且適應(yīng)性也將大大提高。因此,這將是我們長(zhǎng)期關(guān)注的重點(diǎn)?!?/p>

2020 智源 - 京東多模態(tài)對(duì)話挑戰(zhàn)大賽

在 2019 年,京東舉辦了 JDDC 對(duì)話大賽,去年的主題是 Knowledge-enhanced Task-Oriented Dialogue,今年在智源大會(huì)上舉辦的對(duì)話大賽則主要關(guān)注對(duì)話中的多模態(tài)交互,即研究如何更好的理解對(duì)話中的多模態(tài)信息,產(chǎn)生 Task-Oriented Conversational response。

本次競(jìng)賽的數(shù)據(jù)來(lái)自于脫敏后的京東真實(shí)客服對(duì)話日志,共包含約 200 萬(wàn)輪次的對(duì)話,其中用戶問(wèn)題涉及約圖片約 50 萬(wàn)張。

周伯文介紹到,為支持參賽隊(duì)伍更好的比賽,本次大賽還提供了約 3 萬(wàn)商品的小型商品知識(shí)庫(kù),和 2 萬(wàn)張圖片的標(biāo)注數(shù)據(jù)。大賽開(kāi)始三周,到目前為止已有超過(guò) 400 人參加比賽。

曼寧對(duì)于這場(chǎng)比賽的成功舉辦表示興奮:「這場(chǎng)比賽非常火熱,人類在這樣的對(duì)話中扮演的角色也非常重要。顯然作為人類,對(duì)話不是所有——我們還會(huì)使用背景知識(shí)和其他感覺(jué)。我認(rèn)為這次我們將看到自然語(yǔ)言處理中很多 NLP 領(lǐng)域中奠定基礎(chǔ)的新思想,有關(guān) NLP 與對(duì)話發(fā)生環(huán)境、領(lǐng)域知識(shí),以及理解和生成?!?p>

這場(chǎng)連接京東大廈和斯坦福校園的對(duì)話,給我們帶來(lái)了很多啟發(fā)。由于新冠疫情的影響,周伯文與曼寧無(wú)法進(jìn)行面對(duì)面的交談,不過(guò)兩人已經(jīng)開(kāi)始期待下一次的見(jiàn)面了。

不知下次見(jiàn)面時(shí),人工智能技術(shù)將會(huì)出現(xiàn)哪些大發(fā)展?

本文為機(jī)器之心報(bào)道,轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)。

?------------------------------------------------

加入機(jī)器之心(全職記者 / 實(shí)習(xí)生):hr@jiqizhixin.com

投稿或?qū)で髨?bào)道:content@jiqizhixin.com

原標(biāo)題:《周伯文對(duì)話斯坦福教授曼寧:人機(jī)對(duì)話智能新進(jìn)展需要新「圖靈測(cè)試」》

閱讀原文

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司