雷鋒網(wǎng) AI 科技評(píng)論按:今年 315 晚會(huì)曝光了智能騷擾電話機(jī)器人產(chǎn)業(yè)鏈,讓我們意識(shí)到那些令人不堪其擾的銷(xiāo)售來(lái)電背后,好多都是沒(méi)感情的 AI。對(duì)此深?lèi)和唇^的阿里人工智能實(shí)驗(yàn)室研究員聶再清決定“以其人之道還治其人之身”,近日發(fā)布一款名為“二哈”的防騷擾電話 AI 技術(shù),讓我們?cè)诮拥津}擾來(lái)電時(shí),可以選擇轉(zhuǎn)給 AI 代為應(yīng)答。
阿里巴巴人工智能實(shí)驗(yàn)室近日發(fā)布的一段錄音顯示,“二哈”已達(dá)到以假亂真的對(duì)話水平,錄音中的人類(lèi)銷(xiāo)售對(duì)此毫無(wú)察覺(jué),不知與之對(duì)話的竟是一名 AI。
在這段長(zhǎng)達(dá)1分多鐘的對(duì)話中,“二哈”對(duì)答如流,不但會(huì)主動(dòng)向女銷(xiāo)售咨詢(xún)“北京能不能貸款?”、“最多能貸多少錢(qián)?”,甚至還在對(duì)話中“調(diào)戲”對(duì)方:“你之前給我打過(guò)電話吧,聽(tīng)起來(lái)挺耳熟的?”
阿里 AI labs 北京研發(fā)中心負(fù)責(zé)人聶再清介紹,“二哈”應(yīng)用了他提出的“智能聊天”概念,需要理解用戶(hù)請(qǐng)求,用強(qiáng)大的知識(shí)圖譜生成知識(shí)點(diǎn),在對(duì)話中將知識(shí)點(diǎn)“輸出”給用戶(hù),同時(shí)用基于深度強(qiáng)化學(xué)習(xí)的對(duì)話策略引導(dǎo)對(duì)方的問(wèn)題,從而將聊天進(jìn)行下去。
“大家可能看視頻覺(jué)得這是一個(gè)特別逗的產(chǎn)品,但這里面其實(shí)應(yīng)用了非常多的前沿技術(shù)。我們現(xiàn)在已經(jīng)申請(qǐng)了幾十項(xiàng)人工智能領(lǐng)域的技術(shù)專(zhuān)利,今天大家就可以在支付寶小程序和天貓精靈的App上‘調(diào)戲’我們的這個(gè)小機(jī)器人了。”
相關(guān)技術(shù)積累
在聶再清一篇 2018 年 AAAI 錄用論文中,他提出一個(gè)聊天機(jī)器人人機(jī)協(xié)作框架 CoChat,該框架可以讓人類(lèi)工作者隨時(shí)干預(yù)機(jī)器人的學(xué)習(xí)過(guò)程,機(jī)器人能夠通過(guò)從標(biāo)注過(guò)的對(duì)話日志、人類(lèi)工作者的反饋以及用戶(hù)的反饋中學(xué)習(xí),由此使對(duì)話質(zhì)量獲得持續(xù)改進(jìn)。換句話說(shuō),CoChat 結(jié)合了監(jiān)督學(xué)習(xí)(標(biāo)注日志)以及有延遲獎(jiǎng)勵(lì) / 反饋的強(qiáng)化學(xué)習(xí)(人類(lèi)工作者/用戶(hù)反饋),可以持續(xù)不斷地自我完善。
CoChat 框架示意圖
此外,該論文還進(jìn)一步提出對(duì)話管理器模型 MemHRNN,可以讓機(jī)器人迅速對(duì)人類(lèi)提出的新問(wèn)題作出回應(yīng)(原來(lái)數(shù)據(jù)庫(kù)所沒(méi)有的)。
在具體操作上,首先將對(duì)話歷史、語(yǔ)言理解結(jié)果和 API 調(diào)用結(jié)果等外部信息組合起來(lái)作為輸入,然后輸出所有動(dòng)作的概率分布以用于動(dòng)作選擇。當(dāng)出現(xiàn)新動(dòng)作時(shí),該 HRNN 的架構(gòu)可以相應(yīng)地改變,而不會(huì)丟失在之前的學(xué)習(xí)過(guò)程中積累的知識(shí)。最重要的是,聶再清團(tuán)隊(duì)還在 MemHRNN 中進(jìn)一步引入了外部記憶來(lái)處理由即時(shí)引入新動(dòng)作所導(dǎo)致的單樣本學(xué)習(xí)難題,即這些新動(dòng)作出現(xiàn)的次數(shù)太少,讓 HRNN 難以學(xué)習(xí)與它們有關(guān)的有效策略。
論文鏈接:https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/view/16748
聶再清的“實(shí)用產(chǎn)品”夢(mèng)
聶再清此前在微軟亞洲研究院主要負(fù)責(zé)微軟自然語(yǔ)言理解、實(shí)體挖掘的研發(fā)工作。在對(duì)象級(jí)別搜索與大數(shù)據(jù)挖掘方面申請(qǐng)國(guó)際專(zhuān)利十余項(xiàng)。
在 2017 年年底,他選擇加盟阿里人工智能實(shí)驗(yàn)室,當(dāng)時(shí)被媒體稱(chēng)為“阿里達(dá)摩院成立后打響的人才強(qiáng)奪戰(zhàn)第一槍?!?,在業(yè)界的分量不言而喻。對(duì)于選擇加盟阿里的原因,他在接受采訪時(shí)表示,阿里可以讓他“把一些想法做成真正影響很多人生活的一個(gè)東西?!保搅税⒗锇桶腿斯ぶ悄軐?shí)驗(yàn)室的他主要專(zhuān)攻知識(shí)圖譜與自然語(yǔ)言理解兩個(gè)研究方向,為阿里巴巴提供包括意圖理解、實(shí)體抽取、對(duì)話管理以及知識(shí)圖譜在內(nèi)的技術(shù)支持。
去年接受媒體采訪時(shí),聶再清總結(jié)了當(dāng)時(shí) NLP 領(lǐng)域的階段性問(wèn)題,并提出相應(yīng)的 4 大對(duì)策,可以看作是他過(guò)去 1 年試圖攻克的事情:
其一,從公開(kāi)大數(shù)據(jù)中積累更多的可替換詞典和語(yǔ)義模板。以“請(qǐng)幫我打輛車(chē)”為例,“請(qǐng)幫我”有很多說(shuō)法,如“麻煩幫我”、“給我”等,“打車(chē)”可以叫“約車(chē)”等,這些同類(lèi)詞(或同義詞)叫做可替換詞典,它可以增強(qiáng)自然語(yǔ)言的通用性,能夠很好的解決語(yǔ)言的歧義性問(wèn)題。而語(yǔ)義模板側(cè)重這句話中語(yǔ)義的順序,不同順序問(wèn)答的積累,也可以解決一部分自然語(yǔ)言歧義性、多樣性的問(wèn)題;
其二,他希望建立一個(gè)知識(shí)圖譜的生態(tài)平臺(tái),讓大量的開(kāi)發(fā)人員在上面去建立知識(shí)圖譜,使用積累的知識(shí)圖譜,不斷擴(kuò)大知識(shí)圖譜在常識(shí)性和專(zhuān)業(yè)性方面的積累,即共建知識(shí)圖譜,產(chǎn)生1+1>2的效果;
其三,隨著語(yǔ)音交互進(jìn)入千家萬(wàn)戶(hù),通過(guò)強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)等不同的策略,讓機(jī)器在與人溝通中判斷用戶(hù)的喜好,并進(jìn)行不斷的自主學(xué)習(xí)和迭代,當(dāng)有大量用戶(hù)大量數(shù)據(jù)的時(shí)候,自然語(yǔ)言理解就會(huì)更準(zhǔn)確和個(gè)性化;
其四,把知識(shí)庫(kù)、知識(shí)圖譜運(yùn)用起來(lái),讓這些結(jié)構(gòu)化的數(shù)據(jù)促進(jìn)自然語(yǔ)言的理解。
因此,“二哈”如今看來(lái)令人驚嘆的對(duì)話水平,其實(shí)早有相應(yīng)積累。這既是聶再清加盟阿里后的階段性成果,也是他個(gè)人“實(shí)用產(chǎn)品”夢(mèng)的實(shí)現(xiàn),讓人不禁期待,他在未來(lái)又將為我們帶來(lái)哪些有意思的產(chǎn)品。
雷鋒網(wǎng) AI 科技評(píng)論 雷鋒網(wǎng)
(正文已結(jié)束)
推薦閱讀:中國(guó)財(cái)經(jīng)報(bào)道網(wǎng)
免責(zé)聲明及提醒:此文內(nèi)容為本網(wǎng)所轉(zhuǎn)載企業(yè)宣傳資訊,該相關(guān)信息僅為宣傳及傳遞更多信息之目的,不代表本網(wǎng)站觀點(diǎn),文章真實(shí)性請(qǐng)瀏覽者慎重核實(shí)!任何投資加盟均有風(fēng)險(xiǎn),提醒廣大民眾投資需謹(jǐn)慎!